دراسة جديدة: نماذج الذكاء الاصطناعي اللغوية تفتقر لفهم حقيقي للعالم

أجراها باحثون بمعهد ماساتشوستس للتكنولوجيا

بحسب الدراسة أظهرت نماذج الذكاء الاصطناعي أنها لا تتعلم بالفعل الحقائق الكامنة عن العالم (أدوبي)
بحسب الدراسة أظهرت نماذج الذكاء الاصطناعي أنها لا تتعلم بالفعل الحقائق الكامنة عن العالم (أدوبي)
TT

دراسة جديدة: نماذج الذكاء الاصطناعي اللغوية تفتقر لفهم حقيقي للعالم

بحسب الدراسة أظهرت نماذج الذكاء الاصطناعي أنها لا تتعلم بالفعل الحقائق الكامنة عن العالم (أدوبي)
بحسب الدراسة أظهرت نماذج الذكاء الاصطناعي أنها لا تتعلم بالفعل الحقائق الكامنة عن العالم (أدوبي)

أظهرت نماذج اللغة الكبيرة (LLMs)، مثل النماذج التي يقوم عليها نموذج «GPT-4»، قدرات مذهلة في توليد النصوص، سواء أكان ذلك في كتابة الشعر، أو تأليف المقالات، حتى تقديم حلول برمجية. تُدرَّب هذه النماذج، المعتمدة على بنى معمارية متقدمة تُعرف باسم «المحوّلات» (Transformers)، على توقع تسلسل الكلمات، ما يمكّنها من الاستجابة للمطالبات بطرق تحاكي فهماً يشبه البشري. ومع ذلك، تشير أبحاث حديثة إلى أن هذه النماذج، على الرغم من قدراتها المثيرة للإعجاب، قد لا تتعلم بالفعل الحقائق الكامنة عن العالم.

خريطة لمدينة نيويورك الأميركية (أدوبي)

التنقل في مدينة نيويورك دون خريطة

في دراسة حديثة قادها آشِش رامباتشان، أستاذ مساعد في الاقتصاد وباحث في مختبر نظم المعلومات واتخاذ القرار بمعهد ماساتشوستس للتكنولوجيا (LIDS)، قام الباحثون باختبار مدى قدرة نموذج لغوي مبني على «المحوّلات» على التنقل في مدينة نيويورك. وبينما أظهر النموذج دقة عالية في تقديم توجيهات دقيقة خطوة فخطوة عبر شبكة شوارع المدينة، تراجع أداؤه بشكل كبير عندما تمت إضافة عراقيل مثل إغلاق بعض الشوارع والتحويلات.

وعندما حلّل الباحثون أنماط التنقل التي أنتجها النموذج، اكتشفوا أن «خرائط» مدينة نيويورك التي كوّنها النموذج كانت تحتوي على مسارات غير واقعية، مثل شوارع غير موجودة وروابط غير دقيقة بين تقاطعات متباعدة. هذا الاكتشاف أثار تساؤلات حول حدود هذه النماذج، خاصة في البيئات التي تتطلب دقة كبيرة.

التداعيات في العالم الحقيقي

تنطوي هذه القيود على تداعيات هامة. فعلى الرغم من أن نماذج الذكاء الاصطناعي تبدو قادرة على التعامل مع مهام معقدة، فإن أداءها قد يتراجع بشكل كبير عندما تتغير المتغيرات البيئية، ولو بشكل بسيط. على سبيل المثال، قد يتمكن النموذج من التنقل في خريطة ثابتة لمدينة نيويورك، لكنه يتعثر عند مواجهة تحديات غير متوقعة، مثل إغلاق الشوارع. ويحذر فريق البحث من أن استخدام هذه النماذج في تطبيقات حقيقية قد يؤدي إلى فشل غير متوقع إذا واجهت سيناريوهات خارجة عن بيانات التدريب.

لعبة «أوثيللو» هي لعبة ألواح استراتيجية يشارك فيها لاعبان يلعبان على لوح مقسم إلى 8 × 8 مربعات غير مختلفة اللون (أدوبي)

مقاييس لتقييم الفهم

لمزيد من التعمق في مدى قدرة نماذج الذكاء الاصطناعي على تكوين «نماذج للعالم»، أي تمثيلات داخلية للقواعد والهيكليات، طوّر الفريق مقياسين جديدين للتقييم، هما «تمييز التسلسل» و«ضغط التسلسل».

يقيس «تمييز التسلسل» قدرة النموذج على التمييز بين سيناريوهات مختلفة، مثل تمييز موضعين مختلفين على لوحة لعبة «أوثيللو». ويقيّم المقياس ما إذا كان النموذج يفهم أن مدخلات مختلفة تحمل دلالات مختلفة.

أما مقياس «ضغط التسلسل» فيقيّم قدرة النموذج على إدراك الحالات المتطابقة، مثل وضعين متطابقين على لوحة لعبة «أوثيللو»، ويفهم أن خطوات التحرك التالية من كل وضع يجب أن تكون متشابهة.

قام الفريق باختبار هذه المقاييس على فئة معينة من المسائل تشمل تسلسلاً محدداً من الحالات والقواعد، مثل التنقل في شبكة شوارع أو لعب «أوثيللو». من خلال هذه التقييمات، سعى الباحثون لفهم ما إذا كانت النماذج قد طوّرت بالفعل نماذج منطقية للعالم.

العشوائية قد تؤدي إلى فهم أعمق

كشف البحث عن نتيجة غير متوقعة، حيث أظهرت النماذج التي دربت على تسلسلات عشوائية قدرة أكبر على بناء نماذج داخلية دقيقة مقارنة بتلك التي دربت على بيانات منظمة. على سبيل المثال، في لعبة «أوثيللو»، كانت النماذج المدربة على حركات عشوائية قادرة على التعرف على جميع الحركات الممكنة، حتى الحركات غير المثلى التي لا يلجأ إليها اللاعبون المحترفون.

وأوضح كيون فافا، الباحث الرئيسي وأستاذ زائر في جامعة هارفارد، أنه «من الناحية النظرية، عندما يتم تدريب النموذج على حركات عشوائية، فإنه يرى مجموعة كاملة من الاحتمالات، بما في ذلك الخيارات غير المحتملة». ويبدو أن هذا التعرض الواسع «يساعد النموذج في تكوين نموذج أكثر دقة للعالم، وإن لم يلتزم بالأسلوب الأمثل».

ورغم هذه النتائج، لم يستطع أي من النماذج تكوين نموذج منطقي متكامل للعالم في مهمة التنقل. وعندما أضاف الباحثون تحويلات إلى خريطة نيويورك، فشلت جميع النماذج في التكيف. وأشار فافا إلى أن «التراجع في الأداء كان مفاجئاً؛ إغلاق واحد في المائة فقط من الشوارع تسبب في انخفاض الدقة بشكل حاد، من أداء شبه مثالي إلى 67 بالمائة فقط».

تراجع أداء نماذج الذكاء الاصطناعي بشكل كبير عندما تتغير المتغيرات البيئية ولو بشكل بسيط (أدوبي)

بناء نماذج للعالم موثوقة

تسلط نتائج هذه الدراسة الضوء على تحدٍ كبير، يتمثل في أنه عندما تبدو المحوّلات قادرة على أداء مهام معينة، فإنها قد تفتقر إلى الفهم الأساسي للقواعد. وشدّد رامباتشان على ضرورة الحذر، قائلاً: «غالباً ما يفترض الناس أنه بما أن هذه النماذج تحقق نتائج رائعة، فلا بد أنها طوّرت فهماً جوهرياً للعالم. لكن دراستنا تشير إلى أننا بحاجة إلى النظر في هذا الافتراض بعناية وعدم الاعتماد على الحدس فقط».

ويخطط الباحثون لتوسيع دراستهم لتشمل تحديات أكثر تعقيداً حيث قد تكون القواعد غير معروفة كلياً أو متغيرة. وباستخدام مقاييسهم التقييمية على هذه المجالات، يأملون في فهم حدود نماذج الذكاء الاصطناعي بشكل أفضل وتوجيه تطويرها في المستقبل.

تداعيات أوسع وأهداف مستقبلية

تتجاوز تداعيات هذا البحث فهم العالم الافتراضي، وتمس التطبيقات العملية. إذا كانت نماذج الذكاء الاصطناعي غير قادرة على تكوين نماذج داخلية دقيقة للعالم، فإن ذلك يثير تساؤلات حول استخدامها في مجالات تتطلب منطقاً دقيقاً، مثل القيادة الذاتية، والأبحاث العلمية، والتخطيط اللوجستي. ويقول الباحثون إن الحاجة ملحة لإعادة التفكير في كيفية تدريب هذه النماذج وتقييمها لتكون أكثر تكيفاً وموثوقية.

هذا البحث مدعوم من قبل عدة مؤسسات، بما في ذلك مبادرة علوم البيانات في جامعة هارفارد، ومؤسسة العلوم الوطنية، ومؤسسة ماك آرثر. سيتم عرض الدراسة في مؤتمر نظم معالجة المعلومات العصبية، حيث سيواصل الباحثون مناقشة تعقيدات نماذج الذكاء الاصطناعي واستكشاف مسارات جديدة لتطويرها.


مقالات ذات صلة

كيف تكتشف التقييمات المزيفة للمنتجات على الإنترنت؟

يوميات الشرق ظهور أدوات الذكاء الاصطناعي التوليدية سمح بإنتاج تقييمات مزيفة للمنتجات والصفحات الموجودة على الإنترنت (رويترز)

كيف تكتشف التقييمات المزيفة للمنتجات على الإنترنت؟

تقول جماعات مراقبة وباحثون إن ظهور أدوات الذكاء الاصطناعي التوليدية سمح بإنتاج تقييمات مزيفة للمنتجات والصفحات الموجودة على الإنترنت ومنصات التواصل.

«الشرق الأوسط» (لندن)
الولايات المتحدة​ مؤسس شركة «أمازون» جيف بيزوس (أ.ب)

بعد علاقة متوترة... جيف بيزوس يتناول العشاء برفقة ترمب في فلوريدا

شوهد مؤسس شركة «أمازون» جيف بيزوس وهو يتجول في مقر إقامة الرئيس المنتخب دونالد ترمب بولاية فلوريدا، في وقت متأخر من ليلة الأربعاء حيث تناول العشاء معه.

«الشرق الأوسط» (واشنطن)
تكنولوجيا تتميز سمكة «موبولا راي» بهيكلها العظمي الغضروفي وأجنحتها الضخمة ما يسمح لها بالانزلاق بسهولة في الماء (أدوبي)

سمكة تلهم باحثين لتطوير نموذج مرشّح مياه صناعي!

طريقة تغذية سمكة «موبولا راي» تدفع باحثي معهد ماساتشوستس للتكنولوجيا لتطوير أنظمة ترشيح فعالة.

نسيم رمضان (لندن)
أوروبا طائرة وزيرة الخارجية الألمانية أنالينا بيربوك تصل إلى بيروت 23 أكتوبر 2024 (رويترز)

طائرات أعضاء الحكومة الألمانية تتجهّز بنظام حماية ضد الهجمات الصاروخية

تقوم وحدة الاستعداد الجوي التابعة لوزارة الدفاع الألمانية بتجهيز طائرات الركاب المخصصة لتنقلات أعضاء الحكومة بنظام حماية ضد الهجمات الصاروخية.

«الشرق الأوسط» (برلين)
تكنولوجيا تعمل استراتيجيات مثل الأمن متعدد الطبقات واستخبارات التهديدات المتقدمة على تعزيز دفاعات الشركات السعودية (شاترستوك)

السعودية تسجل 44 % انخفاضاً في الهجمات الإلكترونية حتى نوفمبر مقارنة بـ2023

تواجه السعودية التحديات السيبرانية باستراتيجيات متقدمة مع معالجة حماية البيانات وأمن السحابة وفجوات مواهب الأمن السيبراني.

نسيم رمضان (لندن)

«تشات جي بي تي»: أحدث السمات... ونقاط القوة والضعف

«تشات جي بي تي»: أحدث السمات... ونقاط القوة والضعف
TT

«تشات جي بي تي»: أحدث السمات... ونقاط القوة والضعف

«تشات جي بي تي»: أحدث السمات... ونقاط القوة والضعف

«تشات جي بي تي (ChatGPT)» روبوت المحادثة الذي يعتمد على الذكاء الاصطناعي، طوَّرته شركة «أوبن إيه آي (OpenAI)» للعمل مساعداً وظيفياً في مجموعة من الأنشطة، بينها الإجابة عن الأسئلة، وتوليد محتويات إبداعية.

سمات رئيسة

ويستخدم النظام النموذج اللغوي الكبير «LLM»، وهو مُدرَّبٌ على مجموعة بيانات متنوعة، تُمكِّنه من المشارَكة بمحادثات معقدة، وتقديم المساعدة الفنية، وسرد القصص. وبفضل قدرته على تحديد السياق وتمييز الفروق الدقيقة، فإنه يتميَّز عن برامج الدردشة الأخرى، ويطرح استجابات تشبه الاستجابات البشرية، وفيما يلي عرض لأبرز سماته وخصائصه وإيجابياته وسلبياته.

يتيح «تشات جي بي تي» مجموعةً من السمات القوية تهدف إلى زيادة الكفاءة والإبداع عبر مجموعة متنوعة من الوظائف؛ إذ يمكنه إنشاء الصور وتحليلها، مما يجعله خياراً ممتازاً للمشروعات المرئية و«رؤى» البيانات، وفقاً لتقرير من موقع «إي ويك». ويتيح لك «تشات جي بي تي» إنشاء خطط واستراتيجيات مفصلة، وتبادل الأفكار، وتوليد حلول قابلة للتنفيذ.

ويمكنه كذلك كتابة التعليمات البرمجية للمهام الفنية، ما يوفر للمطورين الوقت، وإنشاء كتابة واضحة ومقنعة لكل مناسبة. كما أن باستطاعته تلخيص النصوص الطويلة إلى مجموعة أقصر من المعلومات يسهل استيعابها لدرجة أكبر.

الصور والفيديو

• إنشاء الصور: تتيح سمة الذكاء التوليدي لدى «تشات جي بي تي» إنشاء صور باستخدام مطالبات نصية، مثله مثل أدوات الفن الأخرى للذكاء الاصطناعي. ويمكن إنشاء صورة على الفور تقريباً، بالاعتماد على أحاديث عن صور متخيلة.

• تحليل الصور: لاختبار قدرة «تشات جي بي تي» على استخدام طبيعته متعددة الوسائط لتحليل الصور التي لم ينشئها، فإن قمت بتحميل صورة لسمكة تدخن السجائر بجسم دجاجة، وطلبت منه تفسيرها، سيجيب بأن الصورة «إبداع فكاهي سريالي... ربما كان المقصود منه أن يكون قطعةً من الفكاهة السخيفة أو التعليق الاجتماعي».

• تحويل النصوص إلى فيديو: تعتمد ميزة إنتاج الفيديو في «تشات جي بي تي» على تطبيق من متجر تطبيقات «تشات جي بي تي»، يرتبط بسلاسة بواجهة برمجة التطبيقات «api.adzedek.com». وما إن تقدم وصفاً موجزاً للفيديو المقصود، سيتولى التطبيق إنشاء نص مقترح وإرشادك عبر عملية إنشاء الفيديو.

• في البداية، سيوجِّهك إلى «InVideo» لمشاهدة الفيديو الذي جرى إنشاؤه، والذي يتضمَّن سرداً صوتياً عالي الجودة يشبه الإنسان، عبر صور مختارة بعناية ولقطات من الإنترنت. ويوفر هذا التكامل تجربةً ممتازةً ومبسطةً لإنشاء مقاطع فيديو مثيرة للاهتمام وذات جودة احترافية دون عناء.

• كتابة رموز البرمجة: يمكن لقدرة «تشات جي بي تي» على توليد أكواد (رموز) البرمجة أن تكون فاعلة، وفي بعض الأحيان، صعبة. في كثير من الأحيان، ينجح «تشات جي بي تي» في توليد رموز مفيدة يمكن تطبيقها مباشرة على مهام تتنوع بين البرامج النصية البسيطة إلى البرامج المعقدة. ومع ذلك، في بعض الحالات، قد تتطلب النتيجة الأولية مطالبات أو تنقيحات إضافية، لتتناسب مع الاحتياجات المحددة لتطبيقك أو مشروعك.

كتابة النصوص

• كتابة محتوى قصير وطويل: تعدّ مسألة كتابة المحتوى واحدةً من تخصصات «تشات جي بي تي». ويتضمَّن ذلك المحتويات الطويلة، مثل المقالات وفصول الكتب ودراسات الحالة، وكذلك المحتويات الأقصر، مثل فقرات التوصيف عبر وسائل التواصل الاجتماعي، والقوالب، وعناصر النشرة الإخبارية. أما وضوح المحتوى، فيعتمد على دقة مطالباتك.

وستحتاج إلى مراجعة ما أنجزه «تشات جي بي تي»، والتحقق من صحة الحقائق الواردة فيه؛ لتجنب التورط في سرقة أعمال آخرين، وكذلك تصحيح الأخطاء، وإضفاء طابع إنساني أقوى على المحتوى.

• كتابة توصيف للمنتجات: يمكن استغلال قدرات «تشات جي بي تي» في إنشاء أوصاف منتج ما، بهدف إطلاق حملة عبر وسائل التواصل الاجتماعي، أو إنشاء صفحة منتج على موقع للتجارة الإلكترونية. ويمكن اختبار قدرات «تشات جي بي تي» على إنشاء أوصاف المنتج، عبر تحميل صورة وهمية لعلامة تجارية لأطعمة ، والطلب منه إنشاء وصف يحتوي على معلومات حول الفوائد الصحية والنكهات.

• إعداد خطط السفر: يمكن اختبار «تشات جي بي تي» عبر مطالبته بالتخطيط لرحلة ما - مثلاً إلى جزيرة سيارغاو في الفلبين. وفي أحد السيناريوهات المطروحة، كان من المقرر العمل في الأسبوع الأول في أثناء وجودي في الجزيرة. وفي السيناريو الثاني، كان من المقرر الحصول على إجازة من العمل، مع مرونة كاملة فيما يتعلق بالأنشطة. وقد أنشأ «تشات جي بي تي» جداول مناسبة لكلا السيناريوهين. كما أظهر أن الأماكن التي اقترحها جميعها حقيقية وقائمة حتى اليوم، علاوة على أن جميع الأنشطة قابلة للتنفيذ، وتحظى بشعبية بالفعل بين زوار سيارغاو.

سيناريوهات محتملة... وتلخيصات مختصرة

• تحليل السياق المعقد: بإمكان «تشات جي بي تي» تحليل البيانات السياقية، وطرح اقتراحات، بناءً على سيناريوهات مختلفة، ما يجعله مفيداً لمهام مختلفة. ويجري إنشاء استجاباته بالاعتماد على مجموعة البيانات الضخمة التي يتم تدريبه عليها. وتتألف مجموعة البيانات هذه من مجموعة واسعة من موضوعات وأنماط اللغة البشرية.

بوجه عام، يستخدم «تشات جي بي تي» فهمه الأساسي، لتحديد الأنماط وتكرار سياق المحادثة؛ ما يسمح له بوضع افتراضات حول النية البشرية، وتقديم التوضيحات، والمشارَكة في المناقشات التفاعلية.

ومع ذلك، ليس للنظام وصول في الوقت الفعلي إلى الأحداث الجارية أو معلومات المستخدم الشخصية. وعليه، يتم إنشاء الاستجابات التي يولدها «تشات جي بي تي»، بالاعتماد على المعرفة العامة، بدلاً عن التغييرات التي تقع في الوقت الفعلي. وعليه، يبدو «تشات جي بي تي» مناسباً بشكل خاص للتعامل مع المعلومات الثابتة، والعصف الذهني الإبداعي، وحل المشكلات وشرح المفاهيم بعمق.

• تلخيص النصوص الطويلة: بجانب كتابة المقالات والتوصيفات، يمكن لـ«تشات جي بي تي» المساعدة في تلخيص المحتوى الطويل إلى فقرات أقصر وأسهل في القراءة. فعند الطلب منه تلخيص مقال فإنه يقدِّم بالفعل، في غضون ثوانٍ قليلة، موجزاً للمقال. وتسهم هذه الوظيفة في توفير الوقت، وهي مفيدة بشكل خاص في فهم المعلومات المعقدة أو الشاملة بسرعة.

بجانب ذلك، يساعد «تشات جي بي تي» القُرّاء على التركيز على النقاط المهمة، ما يجعله قيّماً للمحترفين والطلاب والمبدعين، الذين يحتاجون إلى استيعاب المعرفة بسرعة من مصادر متعددة. ويمكن تطبيقه على أوراق بحثية مختلفة، ومقالات تعليمية، وموارد إبداعية.

أدوات لأتمتة المهام

حالياً، يتيح «تشات جي بي تي» إصدارات مخصصة من «جي بي تي» أو مخصصة من المنصة لأنشطة أو تطبيقات محددة. وتحتفظ شركة «أوبن إيه آي» بقائمة متزايدة من صور «جي بي تي» المختلفة. وتتوفر بعض هذه الصور عبر تطبيق «تشات جي بي تي»، ويتم إنشاء البعض الآخر بواسطة المستخدمين لأغراض محددة. وتهدف هذه الأدوات من «جي بي تي» إلى المساعدة في الأنشطة الشائعة، مثل الجدولة، وتدوين الملاحظات، والعصف (الشحذ) الذهني، وتوليد الأفكار، وإنشاء المحتوى، بجانب تحليل الأعمال والبيانات، والبرمجة، والتطوير، والتدريس، والتوجيه، والفنون الإبداعية.

تساعد أدوات «جي بي تي» الإنتاجية على المهام اليومية، مثل الجدولة وإدارة المهام، بينما تساعد أدوات «جي بي تي» المرتبطة بإنشاء المحتوى، الكُتّاب والمسوقين والمبدعين في إنشاء المحتوى.

وتتولى أدوات «جي بي تي» لتحليل الأعمال والبيانات فحص وتقييم الإحصاءات، وجمع المعلومات حول اتجاهات الصناعة، وتقديم توصيات بشأن الخيارات التجارية. وتساعد أدوات «جي بي تي» المخصصة للبرمجة والتطوير المطورين على كتابة عينات التعليمات البرمجية واستكشاف المشكلات وإصلاحها وإنشاء الوثائق الفنية.

كما تيسر أدوات التعليم والتدريس من «جي بي تي» هذه المهمة في موضوعات مختلفة، منها الحساب والعلوم والتاريخ وتعلم اللغات. وتساعد أدوات «جي بي تي» المخصصة للفنون الإبداعية، الفنانين والمصممين والموسيقيين على متابعة الاهتمامات الفنية، مثل التصميم، ومفاهيم الفن، وتأليف الموسيقى والكلمات. ويمكن للمستخدمين تصميم أدوات «جي بي تي» خاصة بهم، عبر تحديد التعليمات وتجميل المستندات والبيانات المناسبة.

الإيجابيات والسلبيات والأسعار

وفيما يلي موجز لأهم إيجابيات وسلبيات هذه الأداة الشهيرة، لمساعدتك على تحديد ما إذا كانت التطبيق الأفضل لاحتياجاتك:

• الإيجابيات، وتشمل:

- يوفر الإصدار المجاني قائمةً موسعةً من تطبيقات «جي بي تي» الإضافية.

- يمكن لقدرات المحتوى التوليدي أن تعاون في تسريع المهام اليومية.

- يمكن تخصيص المحتوى التوليدي عبر إعدادات «تشات جي بي تي» للتخصيص.

• السلبيات، وتشمل:

- لا يمكن للإصدار المجاني الوصول إلى المعلومات على الإنترنت في الوقت الفعلي.

- قد يقع المحتوى التوليدي في خطأ الهلوسة من وقت لآخر.

- يفتقر إلى التعاطف العاطفي مع المواقف المعقدة.

• أسعار «جي بي تي». تُقدِّم الشركة المنتجة إصداراً مجانياً من «تشات جي بي تي» يتيح للمستخدمين الوصول إلى معظم تطبيقاته المتكاملة داخل المنصة. ويتمتع المستخدمون بإمكانية الوصول الكامل إلى «GPT- 4o mini»، بجانب إمكانية الوصول المحدود إلى «GPT- 4».

وتبلغ تكلفة الإصدار المدفوع من «تشات جي بي تي»، 20 دولاراً شهرياً، ويتضمَّن سمات جديدة، بجانب إتاحته الوصول إلى «OpenAI o1 - preview»، و«OpenAI o1 mini»، و«GPT- 4o»، و«GPT- 4»، علاوة على ما يصل إلى 5 رسائل لـ«GPT 4o»، والوصول إلى تحليل البيانات، وتجميل الملفات، وتصفح الويب، وإنشاء الصور، ووضع الصوت المتقدم.