دراسة جديدة: نماذج الذكاء الاصطناعي اللغوية تفتقر لفهم حقيقي للعالم

أجراها باحثون بمعهد ماساتشوستس للتكنولوجيا

بحسب الدراسة أظهرت نماذج الذكاء الاصطناعي أنها لا تتعلم بالفعل الحقائق الكامنة عن العالم (أدوبي)
بحسب الدراسة أظهرت نماذج الذكاء الاصطناعي أنها لا تتعلم بالفعل الحقائق الكامنة عن العالم (أدوبي)
TT

دراسة جديدة: نماذج الذكاء الاصطناعي اللغوية تفتقر لفهم حقيقي للعالم

بحسب الدراسة أظهرت نماذج الذكاء الاصطناعي أنها لا تتعلم بالفعل الحقائق الكامنة عن العالم (أدوبي)
بحسب الدراسة أظهرت نماذج الذكاء الاصطناعي أنها لا تتعلم بالفعل الحقائق الكامنة عن العالم (أدوبي)

أظهرت نماذج اللغة الكبيرة (LLMs)، مثل النماذج التي يقوم عليها نموذج «GPT-4»، قدرات مذهلة في توليد النصوص، سواء أكان ذلك في كتابة الشعر، أو تأليف المقالات، حتى تقديم حلول برمجية. تُدرَّب هذه النماذج، المعتمدة على بنى معمارية متقدمة تُعرف باسم «المحوّلات» (Transformers)، على توقع تسلسل الكلمات، ما يمكّنها من الاستجابة للمطالبات بطرق تحاكي فهماً يشبه البشري. ومع ذلك، تشير أبحاث حديثة إلى أن هذه النماذج، على الرغم من قدراتها المثيرة للإعجاب، قد لا تتعلم بالفعل الحقائق الكامنة عن العالم.

خريطة لمدينة نيويورك الأميركية (أدوبي)

التنقل في مدينة نيويورك دون خريطة

في دراسة حديثة قادها آشِش رامباتشان، أستاذ مساعد في الاقتصاد وباحث في مختبر نظم المعلومات واتخاذ القرار بمعهد ماساتشوستس للتكنولوجيا (LIDS)، قام الباحثون باختبار مدى قدرة نموذج لغوي مبني على «المحوّلات» على التنقل في مدينة نيويورك. وبينما أظهر النموذج دقة عالية في تقديم توجيهات دقيقة خطوة فخطوة عبر شبكة شوارع المدينة، تراجع أداؤه بشكل كبير عندما تمت إضافة عراقيل مثل إغلاق بعض الشوارع والتحويلات.

وعندما حلّل الباحثون أنماط التنقل التي أنتجها النموذج، اكتشفوا أن «خرائط» مدينة نيويورك التي كوّنها النموذج كانت تحتوي على مسارات غير واقعية، مثل شوارع غير موجودة وروابط غير دقيقة بين تقاطعات متباعدة. هذا الاكتشاف أثار تساؤلات حول حدود هذه النماذج، خاصة في البيئات التي تتطلب دقة كبيرة.

التداعيات في العالم الحقيقي

تنطوي هذه القيود على تداعيات هامة. فعلى الرغم من أن نماذج الذكاء الاصطناعي تبدو قادرة على التعامل مع مهام معقدة، فإن أداءها قد يتراجع بشكل كبير عندما تتغير المتغيرات البيئية، ولو بشكل بسيط. على سبيل المثال، قد يتمكن النموذج من التنقل في خريطة ثابتة لمدينة نيويورك، لكنه يتعثر عند مواجهة تحديات غير متوقعة، مثل إغلاق الشوارع. ويحذر فريق البحث من أن استخدام هذه النماذج في تطبيقات حقيقية قد يؤدي إلى فشل غير متوقع إذا واجهت سيناريوهات خارجة عن بيانات التدريب.

لعبة «أوثيللو» هي لعبة ألواح استراتيجية يشارك فيها لاعبان يلعبان على لوح مقسم إلى 8 × 8 مربعات غير مختلفة اللون (أدوبي)

مقاييس لتقييم الفهم

لمزيد من التعمق في مدى قدرة نماذج الذكاء الاصطناعي على تكوين «نماذج للعالم»، أي تمثيلات داخلية للقواعد والهيكليات، طوّر الفريق مقياسين جديدين للتقييم، هما «تمييز التسلسل» و«ضغط التسلسل».

يقيس «تمييز التسلسل» قدرة النموذج على التمييز بين سيناريوهات مختلفة، مثل تمييز موضعين مختلفين على لوحة لعبة «أوثيللو». ويقيّم المقياس ما إذا كان النموذج يفهم أن مدخلات مختلفة تحمل دلالات مختلفة.

أما مقياس «ضغط التسلسل» فيقيّم قدرة النموذج على إدراك الحالات المتطابقة، مثل وضعين متطابقين على لوحة لعبة «أوثيللو»، ويفهم أن خطوات التحرك التالية من كل وضع يجب أن تكون متشابهة.

قام الفريق باختبار هذه المقاييس على فئة معينة من المسائل تشمل تسلسلاً محدداً من الحالات والقواعد، مثل التنقل في شبكة شوارع أو لعب «أوثيللو». من خلال هذه التقييمات، سعى الباحثون لفهم ما إذا كانت النماذج قد طوّرت بالفعل نماذج منطقية للعالم.

العشوائية قد تؤدي إلى فهم أعمق

كشف البحث عن نتيجة غير متوقعة، حيث أظهرت النماذج التي دربت على تسلسلات عشوائية قدرة أكبر على بناء نماذج داخلية دقيقة مقارنة بتلك التي دربت على بيانات منظمة. على سبيل المثال، في لعبة «أوثيللو»، كانت النماذج المدربة على حركات عشوائية قادرة على التعرف على جميع الحركات الممكنة، حتى الحركات غير المثلى التي لا يلجأ إليها اللاعبون المحترفون.

وأوضح كيون فافا، الباحث الرئيسي وأستاذ زائر في جامعة هارفارد، أنه «من الناحية النظرية، عندما يتم تدريب النموذج على حركات عشوائية، فإنه يرى مجموعة كاملة من الاحتمالات، بما في ذلك الخيارات غير المحتملة». ويبدو أن هذا التعرض الواسع «يساعد النموذج في تكوين نموذج أكثر دقة للعالم، وإن لم يلتزم بالأسلوب الأمثل».

ورغم هذه النتائج، لم يستطع أي من النماذج تكوين نموذج منطقي متكامل للعالم في مهمة التنقل. وعندما أضاف الباحثون تحويلات إلى خريطة نيويورك، فشلت جميع النماذج في التكيف. وأشار فافا إلى أن «التراجع في الأداء كان مفاجئاً؛ إغلاق واحد في المائة فقط من الشوارع تسبب في انخفاض الدقة بشكل حاد، من أداء شبه مثالي إلى 67 بالمائة فقط».

تراجع أداء نماذج الذكاء الاصطناعي بشكل كبير عندما تتغير المتغيرات البيئية ولو بشكل بسيط (أدوبي)

بناء نماذج للعالم موثوقة

تسلط نتائج هذه الدراسة الضوء على تحدٍ كبير، يتمثل في أنه عندما تبدو المحوّلات قادرة على أداء مهام معينة، فإنها قد تفتقر إلى الفهم الأساسي للقواعد. وشدّد رامباتشان على ضرورة الحذر، قائلاً: «غالباً ما يفترض الناس أنه بما أن هذه النماذج تحقق نتائج رائعة، فلا بد أنها طوّرت فهماً جوهرياً للعالم. لكن دراستنا تشير إلى أننا بحاجة إلى النظر في هذا الافتراض بعناية وعدم الاعتماد على الحدس فقط».

ويخطط الباحثون لتوسيع دراستهم لتشمل تحديات أكثر تعقيداً حيث قد تكون القواعد غير معروفة كلياً أو متغيرة. وباستخدام مقاييسهم التقييمية على هذه المجالات، يأملون في فهم حدود نماذج الذكاء الاصطناعي بشكل أفضل وتوجيه تطويرها في المستقبل.

تداعيات أوسع وأهداف مستقبلية

تتجاوز تداعيات هذا البحث فهم العالم الافتراضي، وتمس التطبيقات العملية. إذا كانت نماذج الذكاء الاصطناعي غير قادرة على تكوين نماذج داخلية دقيقة للعالم، فإن ذلك يثير تساؤلات حول استخدامها في مجالات تتطلب منطقاً دقيقاً، مثل القيادة الذاتية، والأبحاث العلمية، والتخطيط اللوجستي. ويقول الباحثون إن الحاجة ملحة لإعادة التفكير في كيفية تدريب هذه النماذج وتقييمها لتكون أكثر تكيفاً وموثوقية.

هذا البحث مدعوم من قبل عدة مؤسسات، بما في ذلك مبادرة علوم البيانات في جامعة هارفارد، ومؤسسة العلوم الوطنية، ومؤسسة ماك آرثر. سيتم عرض الدراسة في مؤتمر نظم معالجة المعلومات العصبية، حيث سيواصل الباحثون مناقشة تعقيدات نماذج الذكاء الاصطناعي واستكشاف مسارات جديدة لتطويرها.


مقالات ذات صلة

شركة «ميتا» تتبرع بمليون دولار لصندوق تنصيب ترمب

الولايات المتحدة​ شعار «ميتا» خلال مؤتمر في مومباي بالهند 20 سبتمبر 2023 (رويترز)

شركة «ميتا» تتبرع بمليون دولار لصندوق تنصيب ترمب

أبلغ متحدث باسم شركة «ميتا بلاتفورمز» وكالة «رويترز» للأنباء أن شركة «ميتا» تبرعت بمليون دولار لصندوق تنصيب الرئيس الأميركي المنتخب دونالد ترمب.

«الشرق الأوسط» (واشنطن)
الاقتصاد بوتين يزور معرضًا في «رحلة الذكاء الاصطناعي» بسابيربنك في موسكو 11 ديسمبر 2024 (رويترز)

روسيا تعتزم تحسين تصنيفها العالمي في الذكاء الاصطناعي بحلول 2030

قال ألكسندر فيدياخين، نائب الرئيس التنفيذي لأكبر بنك مقرض في روسيا، «سبيربنك»، إن البلاد قادرة على تحسين موقعها في تصنيفات الذكاء الاصطناعي العالمية بحلول 2030.

«الشرق الأوسط» (موسكو)
تكنولوجيا شعار «جيميناي» يظهر على شاشة هاتف جوال (رويترز)

«جيميناي 2.0»... «غوغل» بدأت إتاحة نموذجها الأحدث للذكاء الاصطناعي التوليدي

أعلنت «غوغل» اليوم (الأربعاء) بدء العمل بنموذجها الأكثر تطوراً إلى اليوم في مجال الذكاء الاصطناعي التوليدي «جيميناي 2.0» Gemini 2.0.

«الشرق الأوسط» (واشنطن)
يوميات الشرق يمكن لفرشاة الأسنان المبتكرة والذكية الاتصال بالإنترنت (معهد بليكينغ للتكنولوجيا)

فرشاة أسنان ذكية تنقل بيانات المستخدمين وتخزّنها

يمكن للفرشاة الجديدة أن تُحدِث فرقاً كبيراً في صحّة الفم، خصوصاً فيما يتعلّق بتحسين جودة الحياة لدى كبار السنّ.

«الشرق الأوسط» (القاهرة )
تكنولوجيا الشريحة الجديدة «ويلّوو» (أ.ف.ب)

«غوغل» تطور شريحة للحوسبة الكمومية بسرعة فائقة «لا يمكن تصورها»

طوَّرت شركة «غوغل» شريحة حاسوبية كمومية تتمتع بسرعة فائقة لا يمكن تصورها، حيث تستغرق خمس دقائق فقط لإكمال المهام التي قد تتطلب نحو 10 سبتيليونات سنة.

«الشرق الأوسط» (نيويورك)

«أبل» تطلق تحديثات على نظامها «أبل إنتلدجنس»... ماذا تتضمن؟

عملاء يمرون أمام شعار شركة «أبل» داخل متجرها في محطة غراند سنترال بنيويورك (رويترز)
عملاء يمرون أمام شعار شركة «أبل» داخل متجرها في محطة غراند سنترال بنيويورك (رويترز)
TT

«أبل» تطلق تحديثات على نظامها «أبل إنتلدجنس»... ماذا تتضمن؟

عملاء يمرون أمام شعار شركة «أبل» داخل متجرها في محطة غراند سنترال بنيويورك (رويترز)
عملاء يمرون أمام شعار شركة «أبل» داخل متجرها في محطة غراند سنترال بنيويورك (رويترز)

أطلقت شركة «أبل» الأربعاء تحديثات لنظام الذكاء الاصطناعي التوليدي الخاص بها، «أبل إنتلدجنس»، الذي يدمج وظائف من «تشات جي بي تي» في تطبيقاتها، بما في ذلك المساعد الصوتي «سيري»، في هواتف «آيفون».

وستُتاح لمستخدمي هواتف «أبل» الذكية وأجهزتها اللوحية الحديثة، أدوات جديدة لإنشاء رموز تعبيرية مشابهة لصورهم أو تحسين طريقة كتابتهم للرسائل مثلاً.

أما مَن يملكون هواتف «آيفون 16»، فسيتمكنون من توجيه كاميرا أجهزتهم نحو الأماكن المحيطة بهم، وطرح أسئلة على الهاتف مرتبطة بها.

وكانت «أبل» كشفت عن «أبل إنتلدجنس» في يونيو (حزيران)، وبدأت راهناً نشره بعد عامين من إطلاق شركة «أوبن إيه آي» برنامجها القائم على الذكاء الاصطناعي التوليدي، «تشات جي بي تي».

وفي تغيير ملحوظ لـ«أبل» الملتزمة جداً خصوصية البيانات، تعاونت الشركة الأميركية مع «أوبن إيه آي» لدمج «تشات جي بي تي» في وظائف معينة، وفي مساعدها «سيري».

وبات بإمكان مستخدمي الأجهزة الوصول إلى نموذج الذكاء الاصطناعي من دون مغادرة نظام «أبل».

وترغب المجموعة الأميركية في تدارك تأخرها عن جيرانها في «سيليكون فالي» بمجال الذكاء الاصطناعي التوليدي، وعن شركات أخرى مصنّعة للهواتف الذكية مثل «سامسونغ» و«غوغل» اللتين سبق لهما أن دمجا وظائف ذكاء اصطناعي مماثلة في هواتفهما الجوالة التي تعمل بنظام «أندرويد».

وتطرح «أبل» في مرحلة أولى تحديثاتها في 6 دول ناطقة باللغة الإنجليزية، بينها الولايات المتحدة وأستراليا وكندا والمملكة المتحدة.

وتعتزم الشركة إضافة التحديثات بـ11 لغة أخرى على مدار العام المقبل.