هل تنتج نماذج الذكاء الاصطناعي أفكارًا أصلية أكثر من الباحثين؟

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

أظهرت دراسة جديدة أن نماذج الذكاء الاصطناعي يمكن أن تولد أفكارًا بحثية أصلية أكثر من 50 عالمًا. يقوم الخبراء بتقييم هذه الأساليب.

Eine neue Studie zeigt, dass KI-Modelle mehr originelle Forschungsideen generieren können als 50 Wissenschaftler. Experten bewerten diese Ansätze.
أظهرت دراسة جديدة أن نماذج الذكاء الاصطناعي يمكن أن تولد أفكارًا بحثية أصلية أكثر من 50 عالمًا. يقوم الخبراء بتقييم هذه الأساليب.

هل تنتج نماذج الذكاء الاصطناعي أفكارًا أصلية أكثر من الباحثين؟

طوّر نظام توليد الأفكار المعتمد على الذكاء الاصطناعي (AI) مناهج بحثية أكثر إبداعًا من 50 عالمًا يعملون بشكل مستقل في نسخة أولية حديثة على arXiv 1.

تم تقييم الأفكار التي أنشأها الإنسان والذكاء الاصطناعي من قبل مراجعين لم يعرفوا من أو ما الذي أنشأ كل فكرة. صنف المراجعون المفاهيم التي أنشأها الذكاء الاصطناعي على أنها أكثر إثارة مقارنة بالأفكار التي كتبها الإنسان، على الرغم من أن اقتراحات الذكاء الاصطناعي سجلت نتائج أقل قليلاً من حيث الجدوى.

ومع ذلك، يشير العلماء إلى أن الدراسة، التي لم تخضع لمراجعة النظراء بعد، لها قيود. لقد ركزت على مجال معين من البحث وطلبت من المشاركين من البشر توليد الأفكار بشكل عفوي، الأمر الذي من المحتمل أن يعيق قدرتهم على إنتاج أفضل المفاهيم.

الذكاء الاصطناعي في العلوم

هناك تطلعات متزايدة لاستكشاف كيفية استخدام نماذج اللغة الكبيرة (LLMs) لأتمتة مهام البحث مثل كتابة المقالات, إنشاء رمز و أبحاث الأدب يمكن استخدامها. ومع ذلك، كان من الصعب تقييم ما إذا كانت أدوات الذكاء الاصطناعي هذه قادرة على توليد مناهج بحثية جديدة على مستوى مماثل للبشر. وذلك لأن تقييم الأفكار ذاتية للغاية وتتطلب متخصصين قادرين على تقييمها بعناية، كما يقول تشينجلي سي، المؤلف المشارك للدراسة وعالم الكمبيوتر في جامعة ستانفورد في كاليفورنيا. يقول سي: "إن أفضل طريقة لوضع مثل هذه القدرات في سياقها هي إجراء مقارنة جنبًا إلى جنب".

يعد المشروع الذي يستمر لمدة عام واحدًا من أكبر الجهود المبذولة لتقييم ما إذا كانت النماذج اللغوية الكبيرة - التكنولوجيا التي تقف وراء أدوات مثل ChatGPT – يمكن أن تنتج مناهج بحثية مبتكرة، كما يوضح توم هوب، عالم الكمبيوتر في معهد ألين للذكاء الاصطناعي في القدس. ويقول: "يجب أن يكون هناك المزيد من العمل مثل هذا".

وقام الفريق بتوظيف أكثر من 100 باحث في مجال معالجة اللغات الطبيعية، وهو فرع من علوم الكمبيوتر يتعامل مع التواصل بين الذكاء الاصطناعي والبشر. تم تكليف تسعة وأربعين مشاركًا بتطوير وصياغة الأفكار في غضون عشرة أيام بناءً على واحد من المواضيع السبعة. وكحافز، حصل الباحثون على 300 دولار لكل فكرة، مع مكافأة قدرها 1000 دولار لأفضل خمس أفكار.

وفي الوقت نفسه، طور الباحثون مولدًا للأفكار باستخدام Claude 3.5، وهو ماجستير في القانون طورته شركة Anthropic في سان فرانسيسكو، كاليفورنيا. طلب الباحثون من أداة الذكاء الاصطناعي الخاصة بهم العثور على المقالات ذات الصلة بموضوعات البحث السبعة من خلال Semantic Scholar، وهو محرك بحث أدبي مدعوم بالذكاء الاصطناعي. بناءً على هذه المقالات، طلب الباحثون من وكيل الذكاء الاصطناعي الخاص بهم توليد 4000 فكرة حول كل موضوع بحث وتقييم الأفكار الأكثر إبداعًا.

المقيمون البشريون

بعد ذلك، قام الباحثون بتخصيص الأفكار التي تم إنشاؤها بواسطة الإنسان والذكاء الاصطناعي بشكل عشوائي إلى 79 مراجعًا، الذين قاموا بتقييم كل فكرة من حيث الجدة والإثارة والجدوى والفعالية المتوقعة. ولضمان بقاء مبدعي الأفكار غير معروفين للمراجعين، استخدم الباحثون ماجستيرًا آخر في القانون لتحرير كلا النوعين من النص بحيث يتم توحيد أسلوب الكتابة ونبرة الكتابة دون تغيير الأفكار نفسها.

في المتوسط، صنف المراجعون الأفكار التي تم إنشاؤها بواسطة الذكاء الاصطناعي على أنها أكثر إبداعًا وإثارة من تلك التي كتبها المشاركون البشريون. ومع ذلك، عندما نظروا عن كثب إلى 4000 فكرة أنتجتها LLM، وجد الباحثون حوالي 200 فكرة فقط كانت فريدة حقًا، مما يشير إلى أن الذكاء الاصطناعي أصبح أقل إبداعًا كلما زاد عدد الأفكار التي يولدها.

عندما قام سي باستطلاع آراء المشاركين، اعترف معظمهم بأن الأفكار التي قدموها كانت متوسطة فقط مقارنة بالأفكار التي تم إنتاجها في الماضي.

تشير النتائج إلى أن حاملي شهادة الماجستير في القانون قد يولدون بسهولة أفكارًا أصلية أكثر من الأدبيات الموجودة، كما يقول كونج لو، الباحث في مجال التعلم الآلي بجامعة كولومبيا البريطانية في فانكوفر بكندا. ومع ذلك، ما إذا كان بإمكانهم تجاوز الأفكار الإنسانية الأكثر ابتكارًا يظل سؤالًا مفتوحًا.

من القيود الأخرى للدراسة هو أن الأفكار المكتوبة التي تمت مقارنتها تم تحريرها بواسطة ماجستير في القانون، مما أدى إلى تغيير لغة التقديمات وطولها، كما يقول جيفين ويست، عالم الكمبيوتر في العلوم الاجتماعية بجامعة واشنطن في سياتل. ويضيف أن مثل هذه التغييرات ربما أثرت بشكل طفيف على كيفية إدراك المراجعين للحداثة. ويضيف ويست أن وضع الباحثين في مواجهة ماجستير في القانون يمكنه توليد آلاف الأفكار في غضون ساعات قليلة قد لا يكون مقارنة عادلة تمامًا. يقول: "عليك مقارنة التفاح بالتفاح".

يخطط سي وزملاؤه لمقارنة الأفكار الناتجة عن الذكاء الاصطناعي مع أوراق المؤتمرات الرائدة للحصول على فهم أفضل لكيفية مقارنة ماجستير إدارة الأعمال بالإبداع البشري. ويقول: "نحن نحاول تشجيع المجتمع على التفكير بشكل أعمق حول الشكل الذي يجب أن يبدو عليه المستقبل عندما يتمكن الذكاء الاصطناعي من القيام بدور أكثر نشاطًا في عملية البحث".

  1. Si، C.، Yang، D. & Hashimoto، T. Preprint at arXiv https://doi.org/10.48550/arXiv.2409.04109 (2024).

تحميل المراجع