الذكاء الاصطناعي يعجز عن حل مسائل الرياضيات الصعبة

تغطي هذه المسائل مجموعة واسعة من المواضيع في الرياضيات الحديثة (arXiv - 2024)
تغطي هذه المسائل مجموعة واسعة من المواضيع في الرياضيات الحديثة (arXiv - 2024)
TT

الذكاء الاصطناعي يعجز عن حل مسائل الرياضيات الصعبة

تغطي هذه المسائل مجموعة واسعة من المواضيع في الرياضيات الحديثة (arXiv - 2024)
تغطي هذه المسائل مجموعة واسعة من المواضيع في الرياضيات الحديثة (arXiv - 2024)

قام فريق دولي من الباحثين في مجال الذكاء الاصطناعي وعلماء الرياضيات التابعين لعدة مؤسسات في الولايات المتحدة والمملكة المتحدة بتطوير مقياس رياضي، يسمح للعلماء باختبار قدرات أنظمة الذكاء الاصطناعي على حل مشاكل رياضية صعبة للغاية.

وأظهرت نتائج دراستهم المنشورة على منصة «أركيف بريبرنت (arXiv preprint)» للأوراق البحثية أن أنظمة الذكاء الاصطناعي التي حققت درجات جيدة من قبل، وفق كثير من المعايير والمقاييس التقليدية، لم تتمكن من تسجيل درجات أعلى من 2 في المائة في تقديم حلول للمسائل الرياضية الصعبة، وفق مقياس الاختبارات الجديد.

ووفق بيان منشور، الثلاثاء، على منصة «ساينس إكس نتورك» فإنه على مدى السنوات القليلة الماضية، أصبحت برامج الذكاء الاصطناعي والتعلم العميق مثل «شات جي بي تي (ChatGPT)» أكثر تطوراً، وبالتالي تبدو في بعض الأحيان وكأنها تتمتع بمستوى عالٍ جداً من الذكاء يجعلها قادرة على حل كثير من المعضلات في كثير من المجالات المختلفة. إلا أنه وفقاً لنتائج الدراسة الأخيرة هناك مجال واحد لا يزالون يفشلون فيه، حل مشاكل الرياضيات الصعبة.

ومع استمرار عمل مطوري أنظمة الذكاء الاصطناعي من أجل تحسين مهارات الرياضيات في نماذجهم، فقد طوروا عدداً من المقاييس لتكون بمثابة وسيلة لاختبار تقدمهم، ومنها اثنان هما الأكثر شعبية؛ MATH وGSM8K.

وبمرور الوقت، تحسنت برامج ذكاء اصطناعي إلى الحد الذي أصبحت فيه قادرة على تسجيل درجات تصل إلى 90 في المائة في هذه اختبارات تلك المقاييس.

ولكن كما لاحظ أعضاء فريق الدراسة، فإن مستوى صعوبة مثل هذه المقاييس ليس مرتفعاً بما يكفي، لذا قرروا أن هناك حاجة إلى مقياس جديد لاختبارات قدرات الذكاء الاصطناعي في حل المسائل الرياضية الصعبة، وعليه أنشأوا مقياساً جديداً يفي بهذا الغرض، أطلقوا عليه اسم FrontierMath، وهو الذي يقدم مقياساً مستمراً للتقدم في التفكير الرياضي المعقد للذكاء الاصطناعي.

ومن ثم تواصل فريق البحث مع بعض من ألمع العقول في مجال الرياضيات، وطلبوا منهم تقديم بعض مسائل الرياضيات الصعبة حقاً، وبالفعل تلقوا المئات منها.

وكما يقول الباحثون، فإن «مثل هذه المسائل ليست فريدة من نوعها فحسب، بل إنها تتطلب أيضاً مستوى عميقاً من الفهم للرياضيات. وقد يستغرق حل بعضها عدة أيام». كما تغطي هذه المسائل مجموعة واسعة من المواضيع، من نظرية الأعداد إلى الهندسة الجبرية (أحد فروع علم الجبر). وللحصول على درجات جيدة في معيار FrontierMath، يجب أن يتمتع نظام الذكاء الاصطناعي بالإبداع والبصيرة، وما يصفه فريق البحث بـ«الخبرة العميقة في المجال».

ويوضح الباحثون: «نجحت نماذج الذكاء الاصطناعي في حل أقل من 2 في المائة من المسائل الرياضية الصعبة فقط، مما يكشف عن فجوة هائلة بين قدراتها، وبراعة أفراد المجتمع العلمي الرياضي من العلماء والباحثين».

وأضافوا: «رغم تقدم أنظمة الذكاء الاصطناعي في محاولة للوصول إلى القدرات الرياضية نفسها على مستوى الخبراء والمتخصصين، فإن منصة FrontierMath تقدم اختبارات صارمة تستطيع أن تقيس مدى هذا التقدم».


مقالات ذات صلة

كيف تكتشف التقييمات المزيفة للمنتجات على الإنترنت؟

يوميات الشرق ظهور أدوات الذكاء الاصطناعي التوليدية سمح بإنتاج تقييمات مزيفة للمنتجات والصفحات الموجودة على الإنترنت (رويترز)

كيف تكتشف التقييمات المزيفة للمنتجات على الإنترنت؟

تقول جماعات مراقبة وباحثون إن ظهور أدوات الذكاء الاصطناعي التوليدية سمح بإنتاج تقييمات مزيفة للمنتجات والصفحات الموجودة على الإنترنت ومنصات التواصل.

«الشرق الأوسط» (لندن)
خاص تتضمن الاتجاهات الرئيسة لعام 2025 الاستعداد الكمومي وممارسات الأمن السيبراني الخضراء والامتثال (شاترستوك)

خاص كيف يعيد الذكاء الاصطناعي والحوسبة الكمومية تشكيل الأمن السيبراني في 2025؟

«بالو ألتو نتوركس» تشرح لـ«الشرق الأوسط» تأثير المنصات الموحدة والذكاء الاصطناعي والحوسبة الكمومية على مستقبل الأمن السيبراني.

نسيم رمضان (لندن)
تكنولوجيا الذكاء الاصطناعي يمكنه اكتشاف سمات شخصيتك من مقطع صوتي لك (رويترز)

الذكاء الاصطناعي قد يكشف سمات شخصيتك من خلال صوتك

توصلت دراسة جديدة إلى أن الذكاء الاصطناعي يمكنه اكتشاف سمات شخصيتك من مقطع صوتي لك مدته 90 ثانية فقط.

«الشرق الأوسط» (لندن)
تكنولوجيا تسمح لك ميزة «Image Playground» بالدمج بين الذكاء الاصطناعي وسهولة الاستخدام (أبل)

كل ما تحتاج إلى معرفته عن ميزة «Image Playground» في «iOS 18.2»

تُمثل «Image Playground» قفزة نوعية في مجال الإبداع البصري؛ حيث تدمج بين الذكاء الاصطناعي وسهولة الاستخدام.

عبد العزيز الرشيد (الرياض)
تكنولوجيا الرئيس التنفيذي السابق لشركة «غوغل» إيريك شميت (رويترز)

الرئيس التنفيذي السابق لـ«غوغل» يحذّر من التطور السريع لأنظمة الذكاء الاصطناعي

حذَّر الرئيس التنفيذي السابق لشركة «غوغل» إيريك شميت من التطور السريع لأنظمة الذكاء الاصطناعي.

«الشرق الأوسط» (نيويورك)

مناطيد الهواء الساخن تُزيِّن سماء النيبال

لوحة ألوان زاهية (أ.ف.ب)
لوحة ألوان زاهية (أ.ف.ب)
TT

مناطيد الهواء الساخن تُزيِّن سماء النيبال

لوحة ألوان زاهية (أ.ف.ب)
لوحة ألوان زاهية (أ.ف.ب)

أطلقت بوخارا، هذا الأسبوع، أول مهرجان لمناطيد الهواء الساخن يُقام في النيبال، إذ تحوّلت سماء المدينة لوحةً من الألوان الزاهية ضمن مشهدٍ شكّلت قمم جبال هملايا المغطّاة بالثلوج خلفيته.

مشهد من أول مهرجان لمناطيد الهواء الساخن في النيبال (أ.ف.ب)

في هذا السياق، نقلت «وكالة الصحافة الفرنسية» عن أحد منظّمي الحدث، سابين ماهارجان، قوله: «رأينا أن علينا بدء تنظيم مهرجان مناطيد الهواء الساخن في النيبال»، الذي شاركت فيه أكثر من 10 دول.

وأكد ماهارجان أنّ «الرحلة هنا رائعة، مع إمكان الاستمتاع بمنظر الجبال والتلال والبحيرات».

المهرجان سيحفِّز القطاع السياحي (أ.ف.ب)

وأضاف: «مستخدمو المناطيد جميعاً قالوا لنا إنهم سعداء جداً، فهذا المهرجان سيحفِّز القطاع السياحي في بلدنا».

وشكّلت المناطيد مشهداً ساحراً في خلفيته جبل أنابورنا المُغطَّى بالثلوج.

شاركت في المهرجان أكثر من 10 دول (أ.ف.ب)

بدوره، قال مُسيِّر المنطاد ديريك هامكوك (67 عاماً): «المشهد مذهل، إذ ظهرت سلسلة جبال هملايا بشكل مدهش».

مشهد ساحر في خلفيته جبال مغطّاة بالثلوج (أ.ف.ب)

وكانت هيئة الطيران المدني النيبالية قد أصدرت تعليمات بشأن رحلات مناطيد الهواء الساخن، التي تستمرّ 9 أيام.

وتُعدّ السياحة مصدراً رئيسياً للدخل في هذه الدولة التي استقبلت أكثر من مليون زائر أجنبي عام 2024، ويتواصل الاستثمار في قطاعَي الفنادق والمطارات لتلبية حاجات المسافرين.