دراسة جديدة: نماذج الذكاء الاصطناعي اللغوية تفتقر لفهم حقيقي للعالم

أجراها باحثون بمعهد ماساتشوستس للتكنولوجيا

بحسب الدراسة أظهرت نماذج الذكاء الاصطناعي أنها لا تتعلم بالفعل الحقائق الكامنة عن العالم (أدوبي)
بحسب الدراسة أظهرت نماذج الذكاء الاصطناعي أنها لا تتعلم بالفعل الحقائق الكامنة عن العالم (أدوبي)
TT

دراسة جديدة: نماذج الذكاء الاصطناعي اللغوية تفتقر لفهم حقيقي للعالم

بحسب الدراسة أظهرت نماذج الذكاء الاصطناعي أنها لا تتعلم بالفعل الحقائق الكامنة عن العالم (أدوبي)
بحسب الدراسة أظهرت نماذج الذكاء الاصطناعي أنها لا تتعلم بالفعل الحقائق الكامنة عن العالم (أدوبي)

أظهرت نماذج اللغة الكبيرة (LLMs)، مثل النماذج التي يقوم عليها نموذج «GPT-4»، قدرات مذهلة في توليد النصوص، سواء أكان ذلك في كتابة الشعر، أو تأليف المقالات، حتى تقديم حلول برمجية. تُدرَّب هذه النماذج، المعتمدة على بنى معمارية متقدمة تُعرف باسم «المحوّلات» (Transformers)، على توقع تسلسل الكلمات، ما يمكّنها من الاستجابة للمطالبات بطرق تحاكي فهماً يشبه البشري. ومع ذلك، تشير أبحاث حديثة إلى أن هذه النماذج، على الرغم من قدراتها المثيرة للإعجاب، قد لا تتعلم بالفعل الحقائق الكامنة عن العالم.

خريطة لمدينة نيويورك الأميركية (أدوبي)

التنقل في مدينة نيويورك دون خريطة

في دراسة حديثة قادها آشِش رامباتشان، أستاذ مساعد في الاقتصاد وباحث في مختبر نظم المعلومات واتخاذ القرار بمعهد ماساتشوستس للتكنولوجيا (LIDS)، قام الباحثون باختبار مدى قدرة نموذج لغوي مبني على «المحوّلات» على التنقل في مدينة نيويورك. وبينما أظهر النموذج دقة عالية في تقديم توجيهات دقيقة خطوة فخطوة عبر شبكة شوارع المدينة، تراجع أداؤه بشكل كبير عندما تمت إضافة عراقيل مثل إغلاق بعض الشوارع والتحويلات.

وعندما حلّل الباحثون أنماط التنقل التي أنتجها النموذج، اكتشفوا أن «خرائط» مدينة نيويورك التي كوّنها النموذج كانت تحتوي على مسارات غير واقعية، مثل شوارع غير موجودة وروابط غير دقيقة بين تقاطعات متباعدة. هذا الاكتشاف أثار تساؤلات حول حدود هذه النماذج، خاصة في البيئات التي تتطلب دقة كبيرة.

التداعيات في العالم الحقيقي

تنطوي هذه القيود على تداعيات هامة. فعلى الرغم من أن نماذج الذكاء الاصطناعي تبدو قادرة على التعامل مع مهام معقدة، فإن أداءها قد يتراجع بشكل كبير عندما تتغير المتغيرات البيئية، ولو بشكل بسيط. على سبيل المثال، قد يتمكن النموذج من التنقل في خريطة ثابتة لمدينة نيويورك، لكنه يتعثر عند مواجهة تحديات غير متوقعة، مثل إغلاق الشوارع. ويحذر فريق البحث من أن استخدام هذه النماذج في تطبيقات حقيقية قد يؤدي إلى فشل غير متوقع إذا واجهت سيناريوهات خارجة عن بيانات التدريب.

لعبة «أوثيللو» هي لعبة ألواح استراتيجية يشارك فيها لاعبان يلعبان على لوح مقسم إلى 8 × 8 مربعات غير مختلفة اللون (أدوبي)

مقاييس لتقييم الفهم

لمزيد من التعمق في مدى قدرة نماذج الذكاء الاصطناعي على تكوين «نماذج للعالم»، أي تمثيلات داخلية للقواعد والهيكليات، طوّر الفريق مقياسين جديدين للتقييم، هما «تمييز التسلسل» و«ضغط التسلسل».

يقيس «تمييز التسلسل» قدرة النموذج على التمييز بين سيناريوهات مختلفة، مثل تمييز موضعين مختلفين على لوحة لعبة «أوثيللو». ويقيّم المقياس ما إذا كان النموذج يفهم أن مدخلات مختلفة تحمل دلالات مختلفة.

أما مقياس «ضغط التسلسل» فيقيّم قدرة النموذج على إدراك الحالات المتطابقة، مثل وضعين متطابقين على لوحة لعبة «أوثيللو»، ويفهم أن خطوات التحرك التالية من كل وضع يجب أن تكون متشابهة.

قام الفريق باختبار هذه المقاييس على فئة معينة من المسائل تشمل تسلسلاً محدداً من الحالات والقواعد، مثل التنقل في شبكة شوارع أو لعب «أوثيللو». من خلال هذه التقييمات، سعى الباحثون لفهم ما إذا كانت النماذج قد طوّرت بالفعل نماذج منطقية للعالم.

العشوائية قد تؤدي إلى فهم أعمق

كشف البحث عن نتيجة غير متوقعة، حيث أظهرت النماذج التي دربت على تسلسلات عشوائية قدرة أكبر على بناء نماذج داخلية دقيقة مقارنة بتلك التي دربت على بيانات منظمة. على سبيل المثال، في لعبة «أوثيللو»، كانت النماذج المدربة على حركات عشوائية قادرة على التعرف على جميع الحركات الممكنة، حتى الحركات غير المثلى التي لا يلجأ إليها اللاعبون المحترفون.

وأوضح كيون فافا، الباحث الرئيسي وأستاذ زائر في جامعة هارفارد، أنه «من الناحية النظرية، عندما يتم تدريب النموذج على حركات عشوائية، فإنه يرى مجموعة كاملة من الاحتمالات، بما في ذلك الخيارات غير المحتملة». ويبدو أن هذا التعرض الواسع «يساعد النموذج في تكوين نموذج أكثر دقة للعالم، وإن لم يلتزم بالأسلوب الأمثل».

ورغم هذه النتائج، لم يستطع أي من النماذج تكوين نموذج منطقي متكامل للعالم في مهمة التنقل. وعندما أضاف الباحثون تحويلات إلى خريطة نيويورك، فشلت جميع النماذج في التكيف. وأشار فافا إلى أن «التراجع في الأداء كان مفاجئاً؛ إغلاق واحد في المائة فقط من الشوارع تسبب في انخفاض الدقة بشكل حاد، من أداء شبه مثالي إلى 67 بالمائة فقط».

تراجع أداء نماذج الذكاء الاصطناعي بشكل كبير عندما تتغير المتغيرات البيئية ولو بشكل بسيط (أدوبي)

بناء نماذج للعالم موثوقة

تسلط نتائج هذه الدراسة الضوء على تحدٍ كبير، يتمثل في أنه عندما تبدو المحوّلات قادرة على أداء مهام معينة، فإنها قد تفتقر إلى الفهم الأساسي للقواعد. وشدّد رامباتشان على ضرورة الحذر، قائلاً: «غالباً ما يفترض الناس أنه بما أن هذه النماذج تحقق نتائج رائعة، فلا بد أنها طوّرت فهماً جوهرياً للعالم. لكن دراستنا تشير إلى أننا بحاجة إلى النظر في هذا الافتراض بعناية وعدم الاعتماد على الحدس فقط».

ويخطط الباحثون لتوسيع دراستهم لتشمل تحديات أكثر تعقيداً حيث قد تكون القواعد غير معروفة كلياً أو متغيرة. وباستخدام مقاييسهم التقييمية على هذه المجالات، يأملون في فهم حدود نماذج الذكاء الاصطناعي بشكل أفضل وتوجيه تطويرها في المستقبل.

تداعيات أوسع وأهداف مستقبلية

تتجاوز تداعيات هذا البحث فهم العالم الافتراضي، وتمس التطبيقات العملية. إذا كانت نماذج الذكاء الاصطناعي غير قادرة على تكوين نماذج داخلية دقيقة للعالم، فإن ذلك يثير تساؤلات حول استخدامها في مجالات تتطلب منطقاً دقيقاً، مثل القيادة الذاتية، والأبحاث العلمية، والتخطيط اللوجستي. ويقول الباحثون إن الحاجة ملحة لإعادة التفكير في كيفية تدريب هذه النماذج وتقييمها لتكون أكثر تكيفاً وموثوقية.

هذا البحث مدعوم من قبل عدة مؤسسات، بما في ذلك مبادرة علوم البيانات في جامعة هارفارد، ومؤسسة العلوم الوطنية، ومؤسسة ماك آرثر. سيتم عرض الدراسة في مؤتمر نظم معالجة المعلومات العصبية، حيث سيواصل الباحثون مناقشة تعقيدات نماذج الذكاء الاصطناعي واستكشاف مسارات جديدة لتطويرها.


مقالات ذات صلة

كيف ستؤثر الانتخابات الرئاسية الأميركية على مستقبل التكنولوجيا؟

تكنولوجيا ستحدد انتخابات 2024 كيفية تطوير التكنولوجيا وحماية خصوصية المستخدمين ومستوى التدخل الحكومي في ذلك القطاع (أدوبي)

كيف ستؤثر الانتخابات الرئاسية الأميركية على مستقبل التكنولوجيا؟

ستتأثر السياسات التكنولوجية بنتائج الانتخابات الأميركية بشكل كبير بسبب اختلاف رؤى كل مرشح حول تنظيم الذكاء الاصطناعي وخصوصية البيانات ومكافحة الاحتكار.

نسيم رمضان (لندن)
تكنولوجيا توفر «غاما» منصة ذكية لإنشاء العروض التقديمية بسرعة معتمدة على الذكاء الاصطناعي لتبسيط عملية التصميم (غاما)

كيف تسهّل منصة «غاما» العروض التقديمية عبر الذكاء الاصطناعي؟

يمكن الآن للمستخدمين تحويل أفكارهم إلى شرائح عرض احترافية وجاهزة في ثوانٍ، ودون عناء التنسيق اليدوي.

عبد العزيز الرشيد (الرياض)
يوميات الشرق شعار تطبيق «تيك توك» (رويترز)

عائلات فرنسية تقاضي «تيك توك» بعد انتحار مراهقَين

رفعت 7 عائلات فرنسية دعوى قضائية ضد تطبيق «تيك توك»، متهمة المنصة بتعريض أطفالها المراهقين لمحتوى ضار أدى إلى انتحار اثنين منهم.

«الشرق الأوسط» (باريس)
خاص تستثمر «ساس» أكثر من مليار دولار في بحث وتطوير قدرات الذكاء الاصطناعي مع التركيز على السعودية كسوق رئيسية لها في المنطقة (شاترستوك)

خاص «ساس»: دمج البيانات الحقيقية والاصطناعية سيقود التحول الرقمي في السعودية

في حديث لـ«الشرق الأوسط»، تؤكد شركة «ساس» التزامها بدعم أهداف رؤية 2030 عبر استثمارات في البحث والتطوير لتعزيز قدرات الذكاء الاصطناعي.

نسيم رمضان (دبي)
تكنولوجيا شعار شركة «ميتا» يظهر على شاشة هاتف جوال (أ.ف.ب)

عبر «ميتا»... باحثون صينيون يطوّرون نموذج ذكاء اصطناعي لأغراض عسكرية

كشف محللون و3 أوراق أكاديمية، أن مؤسسات بحثية مرتبطة بجيش التحرير الشعبي الصيني تستغل نموذج «لاما» في تطوير أداة ذكاء اصطناعي لاستخدامها في تطبيقات عسكرية.

«الشرق الأوسط» (بكين)

أفضل أجهزة «كروم بوك» لعام 2024

«إيسر كروم بوك بلس 514»
«إيسر كروم بوك بلس 514»
TT

أفضل أجهزة «كروم بوك» لعام 2024

«إيسر كروم بوك بلس 514»
«إيسر كروم بوك بلس 514»

إذا كنت تبحث عن جهاز رخيص وسهل الاستخدام للاتصال بالإنترنت، وإنجاز المهام العامة اليومية والمهام الإنتاجية، فقد يكون جهاز «كروم بوك» خياراً جيداً لك.

«كروم بوك» رخيصة وخفيفة

تميل أجهزة «كروم بوك» لأن تكون أرخص ثمناً وأخف وزناً بصفة عامة، وكثير منها مزود بشاشات تعمل باللمس. ومع ذلك، يجب أن تكون على علم بأنها تعمل بنظام التشغيل «كروم أو إس» بدلاً من «ويندوز»، لذلك قد يتطلب الأمر بعض التعديل، رغم أنها أجهزة مثالية إذا كنت تستخدم نظام «غوغل» البيئي بالفعل.

اختبر محررو مجلة «سي نت» جميع أجهزة «كروم بوك» المدرجة في هذه القائمة. ويتمتع كل عضو في الفريق بعقود من الخبرة في اختبار ومراجعة الحواسيب المحمولة. وأجروا اختبار الأداء في ظل ظروف مُحكمة في مختبرات «سي نت»، والاستخدام العملي المكثف للأجهزة. توفر جميع الطرز المدرجة في هذه القائمة أداء ومزايا ممتازة بالنسبة لسعرها.

أفضل خيار

* «إيسر كروم بوك بلس 514» Acer Chromebook Plus 514 - أفضل جهاز «كروم بوك» عموماً.

مع «إيسر كروم بوك بلس 514»، ستحصل على ما يلي:

- معالج «إنتل كور آي 3» من الجيل الثاني عشر أو معالج «إيه إم دي رايزن 3 7000» أو أفضل.

- ذاكرة 8 غيغابايت أو أكثر.

- سعة تخزين 128 غيغابايت أو أكثر.

- شاشة «إل سي دي آي بي إس» بدقة 1080 بيكسل أو أفضل.

- كاميرا ويب بدقة 1080 بيكسل مع تقليل الضوضاء الزمنية.

يوفر طراز «إيسر كروم بوك بلس 514» مقاس 14 بوصة أداء جيداً وعمراً أفضل للبطارية، إضافة إلى شاشة ساطعة بشكل ممتاز مع لمسة نهائية غير لامعة لتقليل الوهج. كما أنه يحتوي على مساحة تخزين أكبر مما قد تجده عادة بسعره. كان النموذج الذي قمنا بمراجعته يفتقر إلى إضاءة خلفية للوحة المفاتيح، وهو أمر مزعج بعض الشيء، لكن شركة «إيسر» تبيع طرزاً بها لوحة مفاتيح مضاءة من الخلف وليست أعلى سعراً بكثير. مع مزيج المزايا والأداء مقابل السعر، من السهل التوصية باستخدام «إيسر كروم بوك بلس 514» للمدرسة أو العمل أو المنزل.

«إيسر كروم بوك سبين 714»

خيارات أخرى

* «إيسر كروم بوك سبين 714» Acer Chromebook Spin 714 - أفضل جهاز «كروم بوك».

لا يبتعد جهاز «إيسر كروم بوك سبين 714» كثيراً عن سابقه من حيث ما يقدمه من: تصميم متين، وشاشة جميلة، وأداء قوي، وعمر طويل للبطارية. أما التغييرات الرئيسية، فهي معالج «إنتل كور آي 5» من الجيل الثالث عشر المحدث، ولكن شركة «إيسر» أزالت القلم المرفق لاستخدامه على شاشة العرض التي تعمل باللمس، ولا يزال يعمل مع أقلام «يو إس آي».

تتوفر خيارات أقل تكلفة، ولكن إذا كنت تريد جهاز «كروم بوك» يستمر لسنوات، فهذا هو الخيار المناسب. تابع أيضاً التخفيضات على هذا الجهاز: عادة ما يتم إدراجه بسعر نحو 700 دولار، ولكن يمكن العثور عليه غالباً للبيع بأقل من 600 دولار.

«لينوفو دويت كروم بوك»

* «لينوفو دويت كروم بوك» Lenovo Duet Chromebook - أفضل جهاز «كروم بوك» لوحي مزدوج الاستخدام.

يعد جهاز «لينوفو دويت كروم بوك»، المعروف أيضا باسم «كروم بوك دويت 3»، جهازاً لوحياً صغيراً رائعاً يعمل بنظام «كروم أو إس» بمقاس 11 بوصة، ويأتي مزوداً بلوحة مفاتيح ولوحة لمس قابلة للفصل. لا يعد حجمه الصغير وأداؤه مثاليين للاستخدام طوال الوقت.

يعد «كروم بوك دويت 3» اختياراً جيداً إذا كنت تبحث عن جهاز بأسعار معقولة لإنجاز بعض الأعمال أثناء التنقل، أو الرسم، أو تدوين الملاحظات في الفصل، أو مباشرة مهام بسيطة، مثل البريد الإلكتروني، وتصفح الويب، والألعاب، والقراءة، وبث الفيديو.

* مجلة «سي نت»، خدمات «تريبيون ميديا».