الذكاء الاصطناعي يعجز عن حل مسائل الرياضيات الصعبة

تغطي هذه المسائل مجموعة واسعة من المواضيع في الرياضيات الحديثة (arXiv - 2024)
تغطي هذه المسائل مجموعة واسعة من المواضيع في الرياضيات الحديثة (arXiv - 2024)
TT

الذكاء الاصطناعي يعجز عن حل مسائل الرياضيات الصعبة

تغطي هذه المسائل مجموعة واسعة من المواضيع في الرياضيات الحديثة (arXiv - 2024)
تغطي هذه المسائل مجموعة واسعة من المواضيع في الرياضيات الحديثة (arXiv - 2024)

قام فريق دولي من الباحثين في مجال الذكاء الاصطناعي وعلماء الرياضيات التابعين لعدة مؤسسات في الولايات المتحدة والمملكة المتحدة بتطوير مقياس رياضي، يسمح للعلماء باختبار قدرات أنظمة الذكاء الاصطناعي على حل مشاكل رياضية صعبة للغاية.

وأظهرت نتائج دراستهم المنشورة على منصة «أركيف بريبرنت (arXiv preprint)» للأوراق البحثية أن أنظمة الذكاء الاصطناعي التي حققت درجات جيدة من قبل، وفق كثير من المعايير والمقاييس التقليدية، لم تتمكن من تسجيل درجات أعلى من 2 في المائة في تقديم حلول للمسائل الرياضية الصعبة، وفق مقياس الاختبارات الجديد.

ووفق بيان منشور، الثلاثاء، على منصة «ساينس إكس نتورك» فإنه على مدى السنوات القليلة الماضية، أصبحت برامج الذكاء الاصطناعي والتعلم العميق مثل «شات جي بي تي (ChatGPT)» أكثر تطوراً، وبالتالي تبدو في بعض الأحيان وكأنها تتمتع بمستوى عالٍ جداً من الذكاء يجعلها قادرة على حل كثير من المعضلات في كثير من المجالات المختلفة. إلا أنه وفقاً لنتائج الدراسة الأخيرة هناك مجال واحد لا يزالون يفشلون فيه، حل مشاكل الرياضيات الصعبة.

ومع استمرار عمل مطوري أنظمة الذكاء الاصطناعي من أجل تحسين مهارات الرياضيات في نماذجهم، فقد طوروا عدداً من المقاييس لتكون بمثابة وسيلة لاختبار تقدمهم، ومنها اثنان هما الأكثر شعبية؛ MATH وGSM8K.

وبمرور الوقت، تحسنت برامج ذكاء اصطناعي إلى الحد الذي أصبحت فيه قادرة على تسجيل درجات تصل إلى 90 في المائة في هذه اختبارات تلك المقاييس.

ولكن كما لاحظ أعضاء فريق الدراسة، فإن مستوى صعوبة مثل هذه المقاييس ليس مرتفعاً بما يكفي، لذا قرروا أن هناك حاجة إلى مقياس جديد لاختبارات قدرات الذكاء الاصطناعي في حل المسائل الرياضية الصعبة، وعليه أنشأوا مقياساً جديداً يفي بهذا الغرض، أطلقوا عليه اسم FrontierMath، وهو الذي يقدم مقياساً مستمراً للتقدم في التفكير الرياضي المعقد للذكاء الاصطناعي.

ومن ثم تواصل فريق البحث مع بعض من ألمع العقول في مجال الرياضيات، وطلبوا منهم تقديم بعض مسائل الرياضيات الصعبة حقاً، وبالفعل تلقوا المئات منها.

وكما يقول الباحثون، فإن «مثل هذه المسائل ليست فريدة من نوعها فحسب، بل إنها تتطلب أيضاً مستوى عميقاً من الفهم للرياضيات. وقد يستغرق حل بعضها عدة أيام». كما تغطي هذه المسائل مجموعة واسعة من المواضيع، من نظرية الأعداد إلى الهندسة الجبرية (أحد فروع علم الجبر). وللحصول على درجات جيدة في معيار FrontierMath، يجب أن يتمتع نظام الذكاء الاصطناعي بالإبداع والبصيرة، وما يصفه فريق البحث بـ«الخبرة العميقة في المجال».

ويوضح الباحثون: «نجحت نماذج الذكاء الاصطناعي في حل أقل من 2 في المائة من المسائل الرياضية الصعبة فقط، مما يكشف عن فجوة هائلة بين قدراتها، وبراعة أفراد المجتمع العلمي الرياضي من العلماء والباحثين».

وأضافوا: «رغم تقدم أنظمة الذكاء الاصطناعي في محاولة للوصول إلى القدرات الرياضية نفسها على مستوى الخبراء والمتخصصين، فإن منصة FrontierMath تقدم اختبارات صارمة تستطيع أن تقيس مدى هذا التقدم».


مقالات ذات صلة

«ثورة الذكاء الاصطناعي» تطغى على «قمة الويب» في لشبونة

تكنولوجيا خلال جلسة في «قمة الويب» 2024 في لشبونة عاصمة البرتغال 12 نوفمبر 2024 (إ.ب.أ)

«ثورة الذكاء الاصطناعي» تطغى على «قمة الويب» في لشبونة

يطغى الذكاء الاصطناعي والتحوّلات الناتجة عنه على المناقشات خلال «قمة الويب» التي تُعقَد في لشبونة هذا الأسبوع على خلفية إعادة انتخاب ترمب رئيساً لأميركا.

«الشرق الأوسط» (لشبونة)
تكنولوجيا «Google Vids» هي أداة بسيطة لإنشاء فيديوهات احترافية تدعم العمل الجماعي والذكاء الاصطناعي لإعداد المخططات وإضافة الصور تلقائياً (غوغل)

«غوغل» تكشف عن خدمة جديدة لإنتاج الفيديوهات للمؤسسات

تستهدف هذه الخدمة الشركات التي تتطلع إلى إنتاج محتوى مرئي احترافي بكفاءة وسرعة دون الحاجة للخبرة الفنية العميقة.

عبد العزيز الرشيد (الرياض)
تكنولوجيا تتيح «فينغيج» قوالب وأدوات تخصيص سهلة بينما تستخدم «نابكن إيه آي» الذكاء الاصطناعي لتحويل النصوص إلى تصميمات جذابة (فينغيج)

أدوات مميزة لتحويل أفكارك إلى تصميمات مرئية جذابة

تخيل أن بإمكانك تصميم إنفوغرافيك أو تقرير جذاب بسهولة!

عبد العزيز الرشيد (الرياض)
خاص يتطلب «واي فاي 7» بنية تحتية متقدمة ودعماً لمعدلات بيانات أعلى (أدوبي)

خاص كيف يدعم «واي فاي 7» التحول الرقمي وشبكات القطاعات الحيوية؟

يعزز «واي فاي 7» الاتصال عالي السرعة ويدعم التحول الرقمي في القطاعات الحيوية مع تحسين الأمان وكفاءة استهلاك الطاقة لتحقيق الاستدامة.

نسيم رمضان (دبي)
تكنولوجيا أنظمة الذكاء الاصطناعي تخلق انبعاثات هائلة تضر بالبيئة (رويترز)

دراسة: الذكاء الاصطناعي يخلق انبعاثات هائلة تضر بالبيئة

قالت دراسة علمية جديدة، إن أنظمة الذكاء الاصطناعي تخلق انبعاثات هائلة تضر بالبيئة بشكل كبير.

«الشرق الأوسط» (بكين)

وزير الثقافة السعودي يناقش مع نظيرته الفرنسية أوجه تعزيز التعاون

وزير الثقافة الفرنسية مرحبة بضيف بلادها الأمير بدر بن عبدالله في باريس الاربعاء (واس)
وزير الثقافة الفرنسية مرحبة بضيف بلادها الأمير بدر بن عبدالله في باريس الاربعاء (واس)
TT

وزير الثقافة السعودي يناقش مع نظيرته الفرنسية أوجه تعزيز التعاون

وزير الثقافة الفرنسية مرحبة بضيف بلادها الأمير بدر بن عبدالله في باريس الاربعاء (واس)
وزير الثقافة الفرنسية مرحبة بضيف بلادها الأمير بدر بن عبدالله في باريس الاربعاء (واس)

بحث الأمير بدر بن عبد الله بن فرحان وزير الثقافة السعودي، الأربعاء، مع نظيرته الفرنسية، رشيدة داتي، أوجه التعاون والتبادل الثقافي الدولي بين الرياض وباريس، في عددٍ من المجالات الثقافية، أبرزها «مجال المتاحف، والمكتبات، والمسرح والفنون الأدائية، وفنون الطهي، والتراث، والأفلام».

وقال الأمير بدر بن عبد الله عبر حسابه الشخصي على منصة «إكس»: «بين الرياض وباريس شراكة ثقافية عميقة»، مشيراً إلى بحثه مع رشيدة داتي سبل تعزيزها.

لقاء الأمير بدر بن عبد الله مع داتي جاء ضمن زيارته الرسمية لفرنسا؛ حيث ناقش معها تعزيز الشراكات بين الجهات الثقافية في كلا البلدين، الهادفة إلى تنمية وتطوير المواهب الثقافية، من خلال تنظيم برامج تدريبية نوعيّة، وتبادل الخبرات بين البلدين.

وزير الثقافة السعودي خلال مباحثاته مع نظيرته الفرنسية في باريس (واس)

كما استعرض الجانبان الشراكات القائمة بين السعودية وفرنسا في الجانب الثقافي، والفرص المستقبلية للتعاون والتبادل الثقافي، والخطوات العملية لتحقيقها.

حضر اللقاء من الجانب السعودي راكان الطوق مساعد وزير الثقافة.