بعد أن انتصر جوجل DeepMind على البشر في كل شيء، من العب اذهب إلى ألعاب الطاولة الإستراتيجية,
تدعي الآن أنها على وشك التغلب على أفضل الطلاب في العالم في حل مسائل الرياضيات.

ومقرها لندن التعلم الآلي أعلنت الشركة في 25 تموز (يوليو) أن أنظمة الذكاء الاصطناعي (AI) الخاصة بها قامت بحل أربعة من المسائل الستة المقدمة للطلاب في الأولمبياد الدولي للرياضيات (IMO) لعام 2024 في باث بالمملكة المتحدة. قدم الذكاء الاصطناعي أدلة صارمة خطوة بخطوة تم تقييمها من قبل اثنين من كبار علماء الرياضيات وحقق درجة 28/42 - نقطة واحدة فقط خارج منطقة الميدالية الذهبية.

يقول جوزيف مايرز، عالم الرياضيات من كامبريدج بالمملكة المتحدة، الذي قام، بالتعاون مع تيم جاورز الحائز على ميدالية فيلدز، بمراجعة الحلول وساعد في اختيار المسائل الأصلية للمنظمة البحرية الدولية (IMO) لهذا العام: "من الواضح أنه تقدم كبير جدًا".

تتسابق شركة DeepMind وغيرها من الشركات لتزويد الآلات بالأدلة المهمة في نهاية المطاف حل أسئلة البحث في الرياضيات. وقالت الشركة إن المشكلات المقدمة في IMO، المنافسة الرائدة عالميًا لعلماء الرياضيات الشباب، أصبحت معيارًا للتقدم نحو هذا الهدف وتعتبر "تحديًا كبيرًا" للتعلم الآلي.

وقال بوشميت كوهلي، نائب رئيس الذكاء الاصطناعي في العلوم في DeepMind، في مؤتمر صحفي: “هذه هي المرة الأولى التي يحقق فيها نظام الذكاء الاصطناعي أداءً على مستوى الميدالية”. وقال كوهلي: "هذا معلم مهم في بناء محققي الأدلة المتقدمين".

امتداد

قبل بضعة أشهر فقط، في شهر يناير، تم إنشاء نظام DeepMind إنجازات مستوى الميدالية AlphaGeometry تم تحقيقه في حل نوع واحد من مشاكل المنظمة البحرية الدولية (IMO)، وهي تلك الموجودة في الهندسة الإقليدية. أول ذكاء اصطناعي يؤدي مستوى الميدالية الذهبية في الاختبار الشامل - بما في ذلك أسئلة في الجبر والتوافقيات ونظرية الأعداد، والتي تعتبر بشكل عام أكثر تحديًا من الهندسة - سيكون مؤهلاً للحصول على جائزة بقيمة 5 ملايين دولار، وهي جائزة أولمبياد الرياضيات للذكاء الاصطناعي (AIMO). (تحتوي الجائزة على معايير صارمة مثل الكشف عن كود المصدر والعمل بقدرة حاسوبية محدودة، مما يعني أن جهود DeepMind الحالية لن تكون مؤهلة).

وفي محاولتهم الأخيرة، استخدم الباحثون AlphaGeometry2 لحل المسألة الهندسية في أقل من 20 ثانية؛ ويقول تانغ لونغ، المتخصص في الكمبيوتر في DeepMind، إن الذكاء الاصطناعي هو نسخة محسنة وأسرع من نظام التسجيل الخاص بهم.

بالنسبة للأنواع الأخرى من الأسئلة، قام الفريق بتطوير نظام جديد تمامًا يسمى AlphaProof. قام AlphaProof بحل مسألتين في الجبر في المسابقة وواحدة في نظرية الأعداد، والتي استغرقت ثلاثة أيام. (للمشاركين في IMO الفعلي جلستان مدة كل منهما 4.5 ساعة.) ولم يتمكن من حل المسألتين في التوافقيات، وهو مجال آخر من مجالات الرياضيات.


Nahaufnahme einer Goldmedaille, gewonnen bei der 63. Internationalen Mathematik-Olympiade von einem rumänischen Teilnehmer.

حصل الباحثون على نتائج متباينة عند الإجابة على الأسئلة الرياضية باستخدام نماذج اللغة، وهو نوع الأنظمة التي تدعم برامج الدردشة الآلية مثل ChatGPT. في بعض الأحيان تعطي النماذج الإجابة الصحيحة ولكنها لا تستطيع تفسير أسبابها بشكل عقلاني، وفي بعض الأحيان ينطقون بالهراء.

في الأسبوع الماضي فقط، استخدم فريق من الباحثين من شركتي البرمجيات Numina وHuggingFace نموذجًا لغويًا للفوز بجائزة التقدم المتوسطة AMIO بناءً على إصدارات مبسطة من مشاكل IMO. لقد جعلت الشركات أنظمتها مفتوحة المصدر بالكامل وجعلتها متاحة للباحثين الآخرين للتنزيل. لكن الفائزين قالواطبيعة، أن النماذج اللغوية وحدها ربما لن تكون كافية لحل المشكلات الأكثر صعوبة.

الطبقة فقط

تجمع AlphaProof بين نموذج اللغة وتقنية التعلم المعزز التي تستخدم محرك “AlphaZero” الذي استخدمته الشركة بنجاح في الألعاب الهجومية مثل Go وبعض الألعاب. مشاكل رياضية محددة مستخدم. في التعلم المعزز، تتعلم الشبكة العصبية من خلال التجربة والخطأ. يعمل هذا بشكل جيد عندما يمكن تقييم إجاباته باستخدام معيار موضوعي. ولتحقيق هذه الغاية، تم تدريب AlphaProof على قراءة البراهين وكتابتها بلغة رسمية تسمى Lean، والتي تُستخدم في حزمة برامج "Proof Assistant" التي تحمل الاسم نفسه والتي تحظى بشعبية لدى علماء الرياضيات. للقيام بذلك، قام AlphaProof باختبار ما إذا كانت مخرجاته صحيحة عن طريق تشغيلها في حزمة Lean، مما ساعد في ملء بعض الخطوات في التعليمات البرمجية.

يتطلب تدريب نموذج اللغة كميات هائلة من البيانات، ومع ذلك لم يتوفر سوى القليل من الأدلة الرياضية في Lean. للتغلب على هذه المشكلة، قام الفريق بتطوير شبكة إضافية حاولت ترجمة سجل موجود يضم مليون مشكلة مكتوبة باللغة الطبيعية ولكن بدون حلول مكتوبة بواسطة الإنسان إلى Lean، كما يقول توماس هيوبرت، الباحث في التعلم الآلي في DeepMind والذي شارك في قيادة تطوير AlphaProof. "كان نهجنا هو: هل يمكننا أن نتعلم كيف نثبت حتى لو لم نتدرب في الأصل على البراهين المكتوبة بواسطة الإنسان؟" (اتخذت الشركة نهجًا مشابهًا للعبة Go، حيث تعلم الذكاء الاصطناعي الخاص بها ممارسة اللعبة من خلال اللعب ضد نفسه بدلًا من الطريقة التي يمارسها البشر).

مفاتيح سحرية

لم تكن العديد من ترجمات Lean منطقية، ولكنها كانت جيدة بما يكفي لإيصال AlphaProof إلى النقطة التي يمكنها عندها بدء دورات التعلم المعززة. وقال جاورز في المؤتمر الصحفي إن النتائج كانت أفضل بكثير من المتوقع. وقال جاورز، الذي يعمل في كوليج دو فرانس في باريس: "العديد من المشاكل في المنظمة البحرية الدولية لها خاصية المفتاح السحري. تبدو المشكلة صعبة في البداية حتى تجد المفتاح السحري الذي يفتحها".

في بعض الحالات، يبدو أن AlphaProof قادر على توفير تلك الخطوة الإضافية من الإبداع من خلال توفير خطوة واحدة صحيحة من حل ممكن كبير بلا حدود. وأضاف غاورز أن هناك حاجة إلى مزيد من التحليل لتحديد ما إذا كانت الإجابات أقل إثارة للدهشة مما تبدو عليه. وظهر خطاب مماثل بعد الخطاب المفاجئ "القطار 37" ، روبوت DeepMinds AlphaGo في منزله فوز 2016 الشهير على أفضل لاعب جو بشري في العالم صنع – نقطة تحول للذكاء الاصطناعي.

وقال مايرز في المؤتمر الصحفي إن ما إذا كان من الممكن تحسين التقنيات للعمل على مستوى بحثي في ​​الرياضيات أم لا. "هل يمكن التوسع في أنواع أخرى من الرياضيات التي قد لا يتم التدريب عليها في ملايين المسائل؟"

وقال ديفيد سيلفر، المتخصص في الكمبيوتر في DeepMind، والذي كان الباحث الرئيسي في تطوير AlphaGo في منتصف العقد الأول من القرن الحادي والعشرين: "لقد وصلنا إلى النقطة التي يمكنهم فيها إثبات ليس فقط مشاكل البحث المفتوحة، ولكن أيضًا المشكلات التي تمثل تحديًا كبيرًا لأفضل علماء الرياضيات الشباب في العالم".