جامعة «جونز هوبكنز»: نماذج الذكاء الاصطناعي تفشل في فهم التفاعلات البشرية

أظهرت الدراسة أن البشر يتفقون بدرجة عالية على تقييم مشاهد التفاعل الاجتماعي في حين فشل أكثر من 350 نموذجاً للذكاء الاصطناعي في محاكاتهم
أظهرت الدراسة أن البشر يتفقون بدرجة عالية على تقييم مشاهد التفاعل الاجتماعي في حين فشل أكثر من 350 نموذجاً للذكاء الاصطناعي في محاكاتهم
TT

جامعة «جونز هوبكنز»: نماذج الذكاء الاصطناعي تفشل في فهم التفاعلات البشرية

أظهرت الدراسة أن البشر يتفقون بدرجة عالية على تقييم مشاهد التفاعل الاجتماعي في حين فشل أكثر من 350 نموذجاً للذكاء الاصطناعي في محاكاتهم
أظهرت الدراسة أن البشر يتفقون بدرجة عالية على تقييم مشاهد التفاعل الاجتماعي في حين فشل أكثر من 350 نموذجاً للذكاء الاصطناعي في محاكاتهم

في سباق تطوير أنظمة ذكاء اصطناعي أكثر ذكاءً وتفاعلاً مع البشر، تكشف دراسة جديدة من جامعة «جونز هوبكنز» حقيقة مقلقة؛ أنه حتى أكثر تقنيات الذكاء الاصطناعي تقدماً لا تزال تعاني من فهم أحد أبسط الأمور التي يجيدها البشر بالفطرة، وهو تفسير التفاعلات الاجتماعية.

من السيارات ذاتية القيادة إلى الروبوتات المساعدة والمساعدين الافتراضيين، يعتمد مستقبل الذكاء الاصطناعي على قدرته على قراءة السلوك البشري في السياقات الحقيقية. لكن وفقاً لهذه الدراسة الرائدة، لا يزال الذكاء الاصطناعي غير قادر على «قراءة المشهد».

تقول ليلى إيشيك، الأستاذة المساعدة في علم الإدراك بجامعة جونز هوبكنز، والمؤلفة الرئيسية للدراسة: «إن هذه الأنظمة تعاني من قيود أساسية عندما يتعلق الأمر بفهم كيفية تفاعل البشر بعضهم مع بعض». وتضيف: «إذا كنت تصمم ذكاءً اصطناعياً لسيارة ذاتية القيادة، فأنت بحاجة إلى أن يتنبأ بحركة المشاة. كأن يعرف ما إذا كان أحدهم على وشك العبور، أو ما إذا كان شخصان يتحدثان فقط. في الوقت الحالي، الذكاء الاصطناعي لا يستطيع القيام بذلك بدقة كافية».

دراسة «جونز هوبكنز»: لا تزال نماذج الذكاء الاصطناعي رغم تطورها غير قادرة على فهم التفاعلات الاجتماعية كما يفعل البشر

تطبيق عملي

تم عرض الدراسة في مؤتمر التعلم التمثيلي الدولي (ICLR) حيث حاول الباحثون اختبار قدرة الذكاء الاصطناعي على فهم الديناميكيات الاجتماعية، مقارنة بالبشر. صمّم الفريق تجربة بسيطة، لكنها فعّالة، فطُلب من المشاركين البشريين مشاهدة مقاطع فيديو قصيرة، مدتها 3 ثوانٍ لأشخاص، إما يتفاعل بعضهم مع بعض، أو يؤدون أنشطة متجاورة، أو يعملون بشكل مستقل. بعد ذلك، طُلب منهم تقييم مدى التفاعل الاجتماعي في كل مقطع على مقياس من 1 إلى 5.

ثم طُبّق التقييم نفسه على أكثر من 350 نموذج ذكاء اصطناعي، بما في ذلك نماذج متقدمة لمعالجة الصور والفيديو واللغة. وكانت النتائج واضحة.

نتائج مقلقة

اتفق المشاركون من البشر إلى حدّ كبير في تقييماتهم، لكن نماذج الذكاء الاصطناعي بغضّ النظر عن مدى تطورها أو حجم بياناتها فشلت في الوصول إلى نفس الدقة. النماذج المعتمدة على الفيديو كانت الأسوأ أداءً، إذ لم تتمكن من التعرف على التفاعلات الاجتماعية في المشاهد الديناميكية. حتى النماذج المعتمدة على الصور الثابتة لم تستطع بدقة التنبؤ بما إذا كان الأشخاص يتواصلون أم لا.

أما النماذج اللغوية، التي أُعطيت أوصافاً مكتوبة للمشاهد، فقد أظهرت أداءً أفضل إلى حد ما، خصوصاً في محاولة التنبؤ بكيفية تفسير البشر للمشاهد. لكنها لم تتمكن من التقاط الصورة الكاملة لسياق المشهد المرئي المتغير. وترى كاثي غارسيا، الباحثة في مختبر إيشيك والمؤلفة المشاركة الأولى، التي عرضت النتائج في المؤتمر، أن هذا يعكس قصوراً بنيوياً في الطريقة التي تُبنى بها أنظمة الذكاء الاصطناعي.

تقول: «إن القدرة على التعرف على الوجوه أو الأجسام في الصور الثابتة كانت إنجازاً مهماً في مسار الذكاء الاصطناعي، لكنها ليست كافية. الحياة ليست صورة جامدة. الناس يتحركون، يتفاعلون، يتجاوب بعضهم مع بعض. وهذا المستوى من الفهم هو ما نحتاج من الذكاء الاصطناعي أن يصل إليه. ودراستنا تظهر أننا لم نصل بعد».

سبب القصور يعود إلى أن بنية الشبكات العصبية للذكاء الاصطناعي مستوحاة من مناطق الدماغ التي تعالج الصور الثابتة وليس التفاعلات الاجتماعية المعقدة (شاترستوك)

ما السبب؟

يعتقد الباحثون أن السبب يعود إلى الأساس الذي بُنيت عليه الشبكات العصبية للذكاء الاصطناعي، وهو جزء الدماغ المسؤول عن معالجة الصور الثابتة. أما التفاعلات الاجتماعية، فهي تتطلب فهماً أعمق للحركة والسياق والنية، وهي عمليات يعالجها جزء مختلف تماماً في دماغ الإنسان. توضح إيشيك أن هناك تفاصيل كثيرة، لكن الرسالة الكبرى هي أن أياً من نماذج الذكاء الاصطناعي التي اختبرناها لم تتمكن من مطابقة استجابات الدماغ البشري أو السلوك الإنساني لمشاهد متحركة، كما تفعل مع الصور الثابتة. هناك شيء أساسي في طريقة معالجة البشر للمشاهد الديناميكية، لا تزال هذه النماذج تفتقده.

تأثيرات بعيدة المدى

مع دخول الذكاء الاصطناعي إلى حياتنا اليومية، سواء في السيارات أو المستشفيات حتى الأماكن العامة، يصبح من الضروري أن يفهم سلوك البشر في السياق الاجتماعي بشكل دقيق. تردد بسيط من أحد المشاة، لغة جسد خفية، حتى تبادل نظرات، كلها إشارات يفسرها الإنسان دون تفكير، لكنها لا تزال لغزاً للذكاء الاصطناعي. هذه الدراسة لا تدعو إلى إيقاف استخدام الذكاء الاصطناعي في هذه السياقات، بل تؤكد على الحاجة إلى إعادة التفكير في كيفية تدريب وتصميم هذه الأنظمة، لتتشابه أكثر مع طريقة تفكير الدماغ البشري.

تختتم غارسيا قائلة إن هذه دعوة للاستيقاظ. وتضيف: «إذا أردنا أن نبني ذكاءً اصطناعياً يفهمنا فعلاً، فعلينا أن نعيد النظر في الطريقة التي نصمم بها هذه النماذج، من الأساس».

في نهاية المطاف، ربما يكون أحد أكبر تحديات الذكاء الاصطناعي ليس الفوز على البشر في الألعاب أو تأليف القصائد، بل أن يفهم نظرة أو إيماءة أو لحظة صامتة بين اثنين.

وعلى الأقل حتى الآن، يبقى البشر هم الأفضل في ذلك.


مقالات ذات صلة

أفضل مولدات الصور بالذكاء الاصطناعي لعام 2025

تكنولوجيا صورة مولدة بنظام دال-إي لسفرة تحت ظلال شجرة الكرز وتظهر فيها 4 مواقع لشرح عناصر الصورة بالتفصيل

أفضل مولدات الصور بالذكاء الاصطناعي لعام 2025

زادت شعبية مولدات الصور المعتمدة على الذكاء الاصطناعي، على نحو بالغ خلال الفترة الأخيرة، الأمر الذي غيَّر الطريقة التي نصنع بها الصور ونتفاعل معها عبر الإنترنت.

«الشرق الأوسط» (لندن)
علوم الغرسات المطبوعة تحقن مباشرة داخل الجسم دون جراحة (جامعة ولونغونغ الأسترالية)

غرسات مطبوعة تُصنَّع داخل الجسم لإيصال الأدوية بدقة

شهدت تقنيات الطباعة الحيوية ثلاثية الأبعاد تطوراً كبيراً في السنوات الأخيرة، ما أتاح تصنيع غرسات طبية وهياكل أنسجة مخصصة بدقة عالية.

«الشرق الأوسط» (القاهرة)
خاص التوأم الرقمي لم يعد مجرد محاكاة بل أصبح بيئة ذكية حية تتخذ قرارات مدعومة بالذكاء الاصطناعي (أدوبي)

خاص «التوأمة الرقمية» من «ساس»: ذكاء اصطناعي يحاكي ويتعلّم ويقرر

في «ساس إنوفيت 2025»، كشفت شركة «ساس» عن التوأم الرقمي كأداة ذكية حية تتعلم وتتنبأ وتُحاكي الواقع، مدعومة بالذكاء الاصطناعي والبيانات اللحظية.

نسيم رمضان (أورلاندو - الولايات المتحدة)
تكنولوجيا يمثل «Arc Search» جيلاً جديداً من المتصفحات الذكية يجمع بين الذكاء الاصطناعي وسهولة الاستخدام (أبل)

«آرك سيرش» متصفح ذكي يغير قواعد البحث على الإنترنت

يتيح ميزة المكالمة مع الذكاء الاصطناعي للإجابة الصوتية، مع حظر تلقائي للإعلانات، ودعم الترجمة، وسرعة في الوصول للمعلومة.

عبد العزيز الرشيد (الرياض)
تكنولوجيا «غوغل» تواجه تهديداً وجودياً مع تراجع البحث التقليدي وظهور أدوات ذكاء اصطناعي تقدم إجابات فورية ما قد يهدد نموذجها الإعلاني (أ.ف.ب)

تراجع البحث في «سفاري» يكشف عن تحول عالمي في سلوك المستخدمين

لأول مرة منذ 22 عاماً، مسؤول في شركة «أبل» يكشف عن تراجع عمليات البحث داخل متصفح «سفاري».

عبد العزيز الرشيد (الرياض)

«أبل» تستعين بالذكاء الاصطناعي لإطالة عمر بطارية آيفون

هواتف «آيفون» معروضة في متجر «أبل» بنيويورك (أ.ف.ب)
هواتف «آيفون» معروضة في متجر «أبل» بنيويورك (أ.ف.ب)
TT

«أبل» تستعين بالذكاء الاصطناعي لإطالة عمر بطارية آيفون

هواتف «آيفون» معروضة في متجر «أبل» بنيويورك (أ.ف.ب)
هواتف «آيفون» معروضة في متجر «أبل» بنيويورك (أ.ف.ب)

كشف تقرير صحافي أن شركة «أبل» تخطط لاستخدام تقنية الذكاء الاصطناعي لمعالجة مشكلة قصر عمر بطارية «آيفون»، التي تعتبر مصدر إزعاج متكرر للعملاء.

وقالت مصادر مطلعة لوكالة «بلومبرغ» للأنباء، إن الشركة تخطط لإضافة ميزة للتحكم بالبطارية مدعومة بالذكاء الاصطناعي لنظام تشغيل iOS 19، الذي من المقرر إصداره في سبتمبر (أيلول).

وأوضحت المصادر، التي طلبت عدم الكشف عن هويتها نظراً لعدم الإعلان عن الخدمة بعد، أن الذكاء الاصطناعي سيحلل كيفية استخدام الشخص لهاتفه ويجري تعديلات بناء على ذلك لخفض استهلاك الطاقة.

وسيتم وضع مؤشر للمستخدم على الشاشة يوضح المدة التقريبية التي سيعمل فيها الجهاز قبل حاجته للشحن، وفقاً للمصادر.

وأشارت المصادر أيضاً إلى أن المحرك الرئيسي وراء هذه الميزة الجديدة لإطالة عمر البطارية هو هاتف آيفون 17 النحيف القادم من الشركة.

وبفضل تصميمه النحيف، سيحتوي الهاتف الجديد على بطارية أصغر بكثير، وساعات عمل أقل من الطرز الأخرى.

ومن خلال تحسين عمر البطارية باستخدام الذكاء الاصطناعي، تهدف «أبل» إلى حل هذه المشكلة. ومع ذلك، ستكون الميزة الجديدة متاحة لجميع أجهزة آيفون التي تعمل بنظام iOS 19.

وتأتي هذه الخطوة باعتبارها جزءاً من استراتيجية «أبل إنتلجينس» التي تسعى إلى دمج الذكاء الاصطناعي في ميزاتها الأساسية.

وقد أضاف الإصدار الأول من «أبل إنتلجينس» الذي طُرح العام الماضي، أدوات لتحرير النصوص وتحسين الكتابة - في أي مكان يُمكن إدخال نص فيه - بالإضافة إلى ميزات لتلخيص الإشعارات، وإزالة العناصر غير المرغوب فيها من الصور، وغيرها من المميزات.