الذكاء الاصطناعي يعيد إحياء رياضيات منسية في عصر فائض المعرفة

نشر بتاريخ 03/27/2026
منصة الخبر

ما نُشر مؤخراً عن أداء نموذج GPT‑5.4 في اختبار FrontierMath لا يتعلق بقفزة رقمية في نسبة النجاح بقدر ما يكشف عن ملامح جديدة لدور الذكاء الاصطناعي في البحث العلمي، وخصوصاً في الرياضيات النظرية. هذا الاختبار الذي طورته جهة بحثية مستقلة متخصصة في قياس قدرات النماذج المتقدمة في الرياضيات يتألف من مئات المسائل الأصلية، أغلبها غير منشور مسبقاً، ومقسّم إلى أربع درجات صعوبة تبلغ ذروتها في المستوى الرابع المخصص لمسائل ذات طابع بحثي متقدم.



في هذا السياق، سجّل نموذج GPT‑5.4 Pro نسبة نجاح بلغت ٣٨٪ في مسائل المستوى الرابع، وهي مجموعة مكوّنة من نحو خمسين مسألة في مستوى عمل باحث محترف يمكن أن يستغرق حلّ الواحدة منها أسابيع من العمل المتواصل.  هذه النسبة تأتي بعد عام واحد فقط من مرحلة لم تتجاوز فيها النماذج المتقدمة السابقة حدود ٢٪ على هذا المستوى، قبل أن تُحرز نماذج لاحقة تقدماً تدريجياً وصولاً إلى نتائج أكثر اتساعاً، قبل أن يرفع الإصدار الأخير سقف الأداء إلى ما يقارب أربع المسائل من كل عشر.

القصة التي أثارت النقاش لم تنبع فقط من هذا التحسّن الكمي، بل من حالة نوعية داخل التجربة؛ إذ حلّ النموذج مسألة من الدرجة الرابعة لم يكن أي نموذج سابق قد نجح في حلها.  المسألة كانت مصمَّمة بعناية من قِبل رياضي متخصّص ليصعب على أنظمة الذكاء الاصطناعي اجتيازها، اعتماداً على مستوى عال من التركيب المنطقي والتقني في مجال من مجالات الرياضيات الحديثة.  أثناء توليد النموذج لمسار الحل، استحضر ورقة بحثية أولية منشورة عام ٢٠١١ على منصة مفتوحة مخصّصة للأبحاث، تتضمن فكرة أساسية مكّنت من اختزال جزء كبير من الجهد البرهاني الذي كان معدّاً أن يشكّل قلب التحدي.  المثير أن واضع المسألة نفسه لم يكن على علم بوجود هذه الورقة التي بقيت خارج دائرة الاطلاع رغم توافرها العلني منذ سنوات.

هذه الواقعة سلطت الاهتمام على جانب مختلف من قدرات النماذج اللغوية الكبيرة، فهي لم تُنتج نظرية رياضية جديدة، بل أعادت تفعيل معرفة بشرية قائمة ولكنها غير مفعّلة، من خلال قدرتها على تمشيط كمّ واسع من الأدبيات العلمية القديمة والحديثة وربطها بمسألة محددة في لحظة واحدة.  تقديرات لبعض الباحثين تشير إلى وجود ملايين الأوراق الرياضية المنشورة، مع زيادة سنوية بعشرات آلاف الأعمال، الأمر الذي يجعل من غير الممكن لأي باحث فرد الإلمام بجميع ما يمسّ تخصّصه الضيق.  في هذا الواقع، تبدو قدرة نموذج على استرجاع ورقة متخصّصة شبه منسية، ثم توظيف فكرتها في حل مسألة معاصرة، أقرب إلى وظيفة "رادار معرفي" يلتقط أنماطاً متباعدة في فضاء معرفي متضخم.

مع ذلك، توضح الجهات التي شاركت في تقييم النموذج أن ما جرى لا يعني أن الذكاء الاصطناعي صار قادراً على إنتاج نظريات رياضية أصلية مستقلة؛ فحتى في المسائل التي لا توجد لها حلول منشورة، يميل أداء النماذج حالياً إلى إنتاج ملاحظات توصف بأنها محدودة الأهمية من منظور البحث المتخصّص.  غير أن بلوغ نسبة ٣٨٪ في مجموعة مصمّمة لتفادي أي استفادة مباشرة من محتوى الإنترنت، ولتقليص احتمال التسريب من بيانات التدريب، يُعد من زاوية أخرى مؤشراً على تطور في كفاءة الاستدلال الرياضي ذاته، لا مجرد استرجاع أنماط سبق أن رآها النموذج.  هذا ما يدفع بعض المتابعين إلى التعامل مع FrontierMath بوصفه اختباراً على قدرة النماذج على العمل في فضاء أقرب إلى البحث العلمي منه إلى تمارين التعليم التقليدي.

تداعيات هذه التطورات لا تقف عند حدود الرياضيات. فالقدرة على تمشيط أرشيف بحثي متراكم، ورصد أعمال غير متداولة وربطها بمسائل مصنّفة على أنها "غير محلولة" في وعي مجتمع الباحثين، يمكن أن تمتد إلى مجالات أخرى تمتلك أرشيفاً ضخماً ومتشعباً، مثل الفيزياء النظرية وعلوم الحياة والاقتصاد.  بالنسبة للباحثين والصحافيين على السواء، يفتح هذا المسار أسئلة حول إعادة تعريف معنى "المسألة المفتوحة" في زمن يمكن فيه لأداة رقمية أن تعثر خلال ثوان على أعمال منشورة منذ سنوات لكنها لم تجد طريقها إلى القارئ المختص المناسب.