الذكاء الاصطناعي يعجز عن حل مسائل الرياضيات الصعبة

تغطي هذه المسائل مجموعة واسعة من المواضيع في الرياضيات الحديثة (arXiv - 2024)
تغطي هذه المسائل مجموعة واسعة من المواضيع في الرياضيات الحديثة (arXiv - 2024)
TT

الذكاء الاصطناعي يعجز عن حل مسائل الرياضيات الصعبة

تغطي هذه المسائل مجموعة واسعة من المواضيع في الرياضيات الحديثة (arXiv - 2024)
تغطي هذه المسائل مجموعة واسعة من المواضيع في الرياضيات الحديثة (arXiv - 2024)

قام فريق دولي من الباحثين في مجال الذكاء الاصطناعي وعلماء الرياضيات التابعين لعدة مؤسسات في الولايات المتحدة والمملكة المتحدة بتطوير مقياس رياضي، يسمح للعلماء باختبار قدرات أنظمة الذكاء الاصطناعي على حل مشاكل رياضية صعبة للغاية.

وأظهرت نتائج دراستهم المنشورة على منصة «أركيف بريبرنت (arXiv preprint)» للأوراق البحثية أن أنظمة الذكاء الاصطناعي التي حققت درجات جيدة من قبل، وفق كثير من المعايير والمقاييس التقليدية، لم تتمكن من تسجيل درجات أعلى من 2 في المائة في تقديم حلول للمسائل الرياضية الصعبة، وفق مقياس الاختبارات الجديد.

ووفق بيان منشور، الثلاثاء، على منصة «ساينس إكس نتورك» فإنه على مدى السنوات القليلة الماضية، أصبحت برامج الذكاء الاصطناعي والتعلم العميق مثل «شات جي بي تي (ChatGPT)» أكثر تطوراً، وبالتالي تبدو في بعض الأحيان وكأنها تتمتع بمستوى عالٍ جداً من الذكاء يجعلها قادرة على حل كثير من المعضلات في كثير من المجالات المختلفة. إلا أنه وفقاً لنتائج الدراسة الأخيرة هناك مجال واحد لا يزالون يفشلون فيه، حل مشاكل الرياضيات الصعبة.

ومع استمرار عمل مطوري أنظمة الذكاء الاصطناعي من أجل تحسين مهارات الرياضيات في نماذجهم، فقد طوروا عدداً من المقاييس لتكون بمثابة وسيلة لاختبار تقدمهم، ومنها اثنان هما الأكثر شعبية؛ MATH وGSM8K.

وبمرور الوقت، تحسنت برامج ذكاء اصطناعي إلى الحد الذي أصبحت فيه قادرة على تسجيل درجات تصل إلى 90 في المائة في هذه اختبارات تلك المقاييس.

ولكن كما لاحظ أعضاء فريق الدراسة، فإن مستوى صعوبة مثل هذه المقاييس ليس مرتفعاً بما يكفي، لذا قرروا أن هناك حاجة إلى مقياس جديد لاختبارات قدرات الذكاء الاصطناعي في حل المسائل الرياضية الصعبة، وعليه أنشأوا مقياساً جديداً يفي بهذا الغرض، أطلقوا عليه اسم FrontierMath، وهو الذي يقدم مقياساً مستمراً للتقدم في التفكير الرياضي المعقد للذكاء الاصطناعي.

ومن ثم تواصل فريق البحث مع بعض من ألمع العقول في مجال الرياضيات، وطلبوا منهم تقديم بعض مسائل الرياضيات الصعبة حقاً، وبالفعل تلقوا المئات منها.

وكما يقول الباحثون، فإن «مثل هذه المسائل ليست فريدة من نوعها فحسب، بل إنها تتطلب أيضاً مستوى عميقاً من الفهم للرياضيات. وقد يستغرق حل بعضها عدة أيام». كما تغطي هذه المسائل مجموعة واسعة من المواضيع، من نظرية الأعداد إلى الهندسة الجبرية (أحد فروع علم الجبر). وللحصول على درجات جيدة في معيار FrontierMath، يجب أن يتمتع نظام الذكاء الاصطناعي بالإبداع والبصيرة، وما يصفه فريق البحث بـ«الخبرة العميقة في المجال».

ويوضح الباحثون: «نجحت نماذج الذكاء الاصطناعي في حل أقل من 2 في المائة من المسائل الرياضية الصعبة فقط، مما يكشف عن فجوة هائلة بين قدراتها، وبراعة أفراد المجتمع العلمي الرياضي من العلماء والباحثين».

وأضافوا: «رغم تقدم أنظمة الذكاء الاصطناعي في محاولة للوصول إلى القدرات الرياضية نفسها على مستوى الخبراء والمتخصصين، فإن منصة FrontierMath تقدم اختبارات صارمة تستطيع أن تقيس مدى هذا التقدم».


مقالات ذات صلة

شركات الذكاء الاصطناعي التوليدي تلجأ إلى الكتب لتطوّر برامجها

تكنولوجيا شركات الذكاء الاصطناعي تتفق مع دور النشر بما يتيح لهذه الشركات استخدام الأعمال المنشورة لتدريب نماذجها القائمة على الذكاء الاصطناعي التوليدي (رويترز)

شركات الذكاء الاصطناعي التوليدي تلجأ إلى الكتب لتطوّر برامجها

مع ازدياد احتياجات الذكاء الاصطناعي التوليدي، بدأت أوساط قطاع النشر هي الأخرى في التفاوض مع المنصات التي توفر هذه التقنية سعياً إلى حماية حقوق المؤلفين.

«الشرق الأوسط» (باريس)
تكنولوجيا غالبية القُرَّاء يرون أن الذكاء الاصطناعي يكتب قصائد شعر أفضل من البشر (رويترز)

دراسة: الذكاء الاصطناعي يكتب قصائد أفضل من البشر

أكدت دراسة جديدة أن قصائد الشعر التي تكتب بواسطة أنظمة الذكاء الاصطناعي أفضل من تلك التي يكتبها البشر.

«الشرق الأوسط» (نيويورك)
صحتك استخدام الذكاء الاصطناعي للقيام بالكشف الأولي على المريض يمكن أن يؤدي للكشف عن كسور بالعظام قد يغفل عنها الإنسان (أ.ف.ب)

4 طرق لتحسين الرعاية الصحية بواسطة الذكاء الاصطناعي

يمكن للذكاء الاصطناعي المساعدة على تحقيق ثورة في الرعاية الصحية العالمية، خصوصاً مع وجود 4.5 مليار شخص لا يستطيعون الحصول على خدمات الرعاية الصحية.

«الشرق الأوسط» (لندن)
يوميات الشرق «الشورت» يحسّن كفاءة المشي في الهواء لدى كبار السنّ (نيتشر)

«شورت» ذكي لتحسين حركة المرضى وكبار السنّ

أعلن باحثون في «جامعة ميونيخ التقنية» عن تطوير «شورت» ذكي يساعد الأشخاص على المشي بسهولة مع تقليل ملحوظ في استهلاك الطاقة.

«الشرق الأوسط» (القاهرة )
تكنولوجيا تمكنك «دورا» من تصميم مواقع ثلاثية الأبعاد مذهلة بسهولة تامة باستخدام الذكاء الاصطناعي دون الحاجة لأي معرفة برمجية (دورا)

صمم موقعك ثلاثي الأبعاد بخطوات بسيطة ودون «كود»

تتيح «دورا» للمستخدمين إنشاء مواقع مخصصة باستخدام الذكاء الاصطناعي عبر إدخال وصف نصي بسيط.

عبد العزيز الرشيد (الرياض)

احذروا الإفراط في الوقوف خلال العمل

تحتاج بعض المهن إلى الوقوف فترات طويلة (معهد الصحة العامة الوبائية في تكساس)
تحتاج بعض المهن إلى الوقوف فترات طويلة (معهد الصحة العامة الوبائية في تكساس)
TT

احذروا الإفراط في الوقوف خلال العمل

تحتاج بعض المهن إلى الوقوف فترات طويلة (معهد الصحة العامة الوبائية في تكساس)
تحتاج بعض المهن إلى الوقوف فترات طويلة (معهد الصحة العامة الوبائية في تكساس)

توصّلت دراسة أجراها باحثون من جامعة توركو الفنلندية، إلى أنّ الوقوف لفترات طويلة في العمل له تأثير سلبي في قياسات ضغط الدم على مدى 24 ساعة.

وتكشف النتائج عن أنّ الوقوف لفترات طويلة يمكن أن يرفع ضغط الدم، إذ يعزّز الجسم مسارات الدورة الدموية إلى الأطراف السفلية عن طريق تضييق الأوعية الدموية وزيادة قوة ضخّ القلب. وعلى النقيض من ذلك، ارتبط قضاء مزيد من الوقت في وضعية الجلوس في العمل بتحسُّن ضغط الدم.

وتشير الدراسة، التي نُشرت في مجلة «ميديسين آند ساينس إن سبورتس آند إكسيرسيس»، إلى أنّ السلوكيات التي يغلب عليها النشاط في أثناء ساعات العمل قد تكون أكثر صلة بقياسات ضغط الدم على مدار 24 ساعة، مقارنةً بالنشاط البدني الترفيهي.

تقول الباحثة في الدراسة، الدكتورة جووا نورها، من جامعة «توركو» الفنلندية: «بدلاً من القياس الواحد، فإن قياس ضغط الدم على مدار 24 ساعة هو مؤشر أفضل لكيفية معرفة تأثير ضغط الدم في القلب والأوعية الدموية طوال اليوم والليل».

وتوضِّح في بيان منشور، الجمعة، على موقع الجامعة: «إذا كان ضغط الدم مرتفعاً قليلاً طوال اليوم ولم ينخفض ​​بشكل كافٍ حتى في الليل، فتبدأ الأوعية الدموية في التصلُّب؛ وعلى القلب أن يبذل جهداً أكبر للتعامل مع هذا الضغط المتزايد. وعلى مرّ السنوات، يمكن أن يؤدّي هذا إلى تطوّر الإصابة بأمراض القلب والأوعية الدموية».

وأظهرت دراسات سابقة أنّ ممارسة الرياضة في وقت الفراغ أكثر فائدة للجهاز القلبي الوعائي من النشاط البدني الناتج عن العمل، الذي ربما يكون ضاراً بالصحّة، مشدّدة على أنّ التمارين الرياضية المنتظمة مهمة للسيطرة على ضغط الدم.

وعلى وجه الخصوص، تعدّ التمارين الهوائية الأكثر قوة فعالةً في خفض ضغط الدم، ولكن وفق نتائج الدراسة الجديدة، فإنّ النشاط البدني اليومي يمكن أن يكون له أيضاً تأثير مفيد.

في الدراسة الفنلندية، تم قياس النشاط البدني لموظفي البلدية الذين يقتربون من سنّ التقاعد باستخدام أجهزة قياس التسارع التي يجري ارتداؤها على الفخذ خلال ساعات العمل، وأوقات الفراغ، وأيام الإجازة. بالإضافة إلى ذلك، استخدم المشاركون في البحث جهاز مراقبة ضغط الدم المحمول الذي يقيس ضغط الدم تلقائياً كل 30 دقيقة لمدّة 24 ساعة.

وتؤكد النتائج أنّ طبيعة النشاط البدني الذي نمارسه في العمل يمكن أن يكون ضاراً بالقلب والجهاز الدوري. وبشكل خاص، يمكن للوقوف لفترات طويلة أن يرفع ضغط الدم.

وتوصي نورها بأنه «يمكن أن يوفر الوقوف أحياناً تغييراً لطيفاً عن وضعية الجلوس المستمر على المكتب، ولكن الوقوف كثيراً يمكن أن يكون ضاراً. من الجيد أن تأخذ استراحة من الوقوف خلال العمل، إما بالمشي كل نصف ساعة أو الجلوس لبعض أجزاء من اليوم».

ويؤكد الباحثون أهمية النشاط البدني الترفيهي لكل من العاملين في المكاتب وفي أعمال البناء، وتشدّد نورها على أنه «جيد أن نتذكّر أنّ النشاط البدني في العمل ليس كافياً بذاته. وأنّ الانخراط في تمارين بدنية متنوّعة خلال وقت الفراغ يساعد على الحفاظ على اللياقة البدنية، مما يجعل الإجهاد المرتبط بالعمل أكثر قابلية للإدارة».