نجح نموذج Gemini من Google في تحقيق إنجاز بارز بتفوقه على ChatGPT في تصنيف Chatbot Arena، مما يعزز المنافسة بين شركات التكنولوجيا الكبرى في مجال الذكاء الاصطناعي.
وفقاً لأحدث تصنيف نشرته منظمة Large Model Systems Organization (LMSYS)، تمكن نموذج Gemini-Exp-1121 من تحقيق المركز الأول برصيد 1365 نقطة Elo، متجاوزاً ChatGPT-4 الذي حصل على 1361 نقطة. هذا الإنجاز يعد الأول من نوعه منذ إطلاق منصة التقييم.
أطلقت Google نموذج Gemini-Exp-1121 في 21 أكتوبر 2024، مع تحسينات ملحوظة في قدرات البرمجة والتفكير المنطقي والرؤية الحاسوبية. وعززت Google نجاحها بتواجد نموذج آخر، Gemini-Exp-1114، في المركز الثالث.
رغم هذا التحول، حافظت OpenAI على حضور قوي في التصنيف، مع تواجد عدة نماذج في المراكز العشرة الأولى. أما Grok، النموذج المطور من قبل شركة xAI التابعة لإيلون ماسك، فقد احتل المركز السابع. وفي تطور لافت، غادرت شركة Mistral الفرنسية قائمة أفضل 20 نموذجاً رغم التحديثات الأخيرة على نموذجها Le Chat.
يعتمد تصنيف Chatbot Arena على نظام مبتكر للتقييم، حيث يقوم المستخدمون بالمقارنة المباشرة بين نموذجين مجهولي الهوية، واختيار الأفضل في الإجابة على الاستفسارات. يتم احتساب النتائج باستخدام نظام Elo للتصنيف، وهو نظام مشابه لما يستخدم في تصنيف لاعبي الشطرنج والرياضات الإلكترونية.
وفيما يلي قائمة أفضل 10 نماذج لشهر نوفمبر 2024 مع نقاط Elo الخاصة بهم:
-
Gemini-Exp-1121: 1365
-
ChatGPT-4o-latest: 1361
-
Gemini-Exp-1114: 1344
-
o1-preview: 1334
-
o1-mini: 1308
-
Gemini-1.5-Pro-002: 1301
-
Grok-2-08-13: 1289
-
Yi-Lightning: 1287
-
GPT-4o-2024-05-13: 1285
-
Claude 3.5 Sonnet: 1282