أحدث روبوت يتوقع تعبيرات الوجه البشري ويتفاعل معها في الوقت الفعلي

بما يصل إلى 840 مللي ثانية

يوهانغ هو أحد أعضاء فريق تطوير الروبوت «إيمو» (مختبر الآلات الإبداعية - هندسة كولومبيا)
يوهانغ هو أحد أعضاء فريق تطوير الروبوت «إيمو» (مختبر الآلات الإبداعية - هندسة كولومبيا)
TT

أحدث روبوت يتوقع تعبيرات الوجه البشري ويتفاعل معها في الوقت الفعلي

يوهانغ هو أحد أعضاء فريق تطوير الروبوت «إيمو» (مختبر الآلات الإبداعية - هندسة كولومبيا)
يوهانغ هو أحد أعضاء فريق تطوير الروبوت «إيمو» (مختبر الآلات الإبداعية - هندسة كولومبيا)

في حين أننا أصبحنا نتعامل مع الروبوتات القادرة على التواصل اللفظي المعقد، بفضل التقدم في التقنيات مثل «تشات جي بي تي» (ChatGPT)، فإن قدراتها في التواصل غير اللفظي، مثل تعبيرات الوجه، لم تواكب وتيرة التقدم هذا بنفس الدرجة. التحدي لا يتمثل في تصميم روبوتات تستطيع تقليد مجموعة واسعة من تعبيرات الوجه البشرية، ولكن في فهم السياق المناسب لاستخدامها.

لذلك، كرّس مختبر الآلات الإبداعية في جامعة كولومبيا للهندسة أكثر من نصف عقد من الزمن للتغلب على هذه العقبة. أحدث أبحاثهم يقدم «إيمو» (Emo)، وهو روبوت قادر على توقع تعبيرات الوجه البشري والتفاعل معها في الوقت الفعلي. ومن الملفت أن «إيمو» يمكنه التنبؤ بالابتسامة قبل حدوثها، بما يصل إلى 840 مللي ثانية، ما يسمح بالتعبير المتزامن عن المشاعر وتعزيز الإحساس بالتفاعل الحقيقي.

يرى البعض أن هذه الروبوتات قد تسد الفجوة بين الإنسان والآلة وتعزز الروابط المرتكزة على التعاطف والتفاهم (مختبر الآلات الإبداعية - هندسة كولومبيا)

مواجهة التحديات

واجه فريق البحث الأميركي تحديين رئيسيين، يتمثل الأول في هندسة روبوت بوجه متعدد الاستخدامات ومعبّر، والثاني تحديد التعبيرات المناسبة التي يجب توليدها في اللحظات المناسبة. وللتغلب على ذلك، شرعوا في تدريب «إيمو» على التنبؤ بتعبيرات الوجه البشري، وتكرارها بالتزامن مع الشخص، مع التركيز بشكل خاص على التوقيت لضمان ظهور التعبيرات أصيلة وصادقة.

ظهور هذه الروبوتات يشير إلى المستقبل حيث يمكن أن تصبح التفاعلات مع الروبوتات طبيعية ومريحة (مختبر الآلات الإبداعية - هندسة كولومبيا)

مميزات «إيمو»

يتميز «إيمو» برأس يشبه الإنسان مزود بـ26 مشغلاً، ما يمكّنه من عرض مجموعة واسعة من التعبيرات الدقيقة. ويسمح جلده الناعم المصنوع من السيليكون، الذي يكمله نظام ربط مغناطيسي، بالتخصيص وسهولة الصيانة. ولإثراء التفاعلات بشكل أكبر، تحتوي عيون «إيمو» على كاميرات عالية الدقة، ما يجعل التواصل البصري ممكناً، وهو جانب أساسي من التواصل غير اللفظي.

طوّر الفريق نموذجين متطورين للذكاء الاصطناعي لـ«Emo»، أحدهما للتنبؤ بتعبيرات الوجه البشري من خلال تحليل تغييرات الوجه الدقيقة، والآخر لترجمة هذه التنبؤات إلى أوامر حركية للتعبيرات المقابلة. وتضمنت عملية التعلم لدى «إيمو» مراقبة تعبيرات الوجه البشري من خلال لقطات فيديو، ما مكّنه من تمييز بداية الابتسامات أو التعبيرات الأخرى بناءً على حركات الوجه الدقيقة.

ويؤكد يوهانغ هو، المؤلف الرئيسي للدراسة والحاصل على درجة الدكتوراه في جامعة كولومبيا للهندسة، على التأثير الثوري للتنبؤ الدقيق بالتعبيرات البشرية على التفاعل بين الإنسان والروبوت. ويوضح أنه «عندما يقوم الروبوت بتعبيرات مشتركة مع الناس في الوقت الفعلي، فإنه لا يحسن جودة التفاعل فحسب، بل يساعد أيضاً في بناء الثقة بين البشر والروبوتات».

«إيمو» (Emo) وهو روبوت قادر على توقع وعكس تعبيرات الوجه البشري في الوقت الفعلي (مختبر الآلات الإبداعية - هندسة كولومبيا)

التوقعات المستقبلية

وبالنظر إلى المستقبل، يهدف الباحثون إلى استكمال قدرات التواصل غير اللفظي لدى «إيمو» (Emo) بقدرات التفاعل اللفظي، ودمج نماذج لغوية كبيرة مشابهة لـ«تشات جي بي تي». ومع تطور الروبوتات لتصبح أكثر شبهاً بالسلوك البشري، يعترف الباحثون بالآثار الأخلاقية لمثل هذه التطورات ويدعون إلى التطوير والاستخدام المسؤول، مع تسليط الضوء على الفوائد المحتملة لهذه الروبوتات في أدوار تتراوح بين المساعدين الشخصيين والأدوات التعليمية.


مقالات ذات صلة

كيف يُسرّع الذكاء الاصطناعي مسار الاكتشافات العلمية؟

علوم باحثون بجامعة نورث كارولينا يعتمدون على روبوت لتنفيذ مهام بالمختبر (جامعة نورث كارولينا)

كيف يُسرّع الذكاء الاصطناعي مسار الاكتشافات العلمية؟

قد تشهد مختبرات العلوم في مجالات الكيمياء والكيمياء الحيوية وعلوم المواد، تحولاً جذرياً؛ بفضل التقدم في التشغيل الآلي للروبوتات والذكاء الاصطناعي لأتمتة المهام المتكررة في المختبرات؛ حيث تُمكّن الأتمتة، الروبوتات من إجراء التجارب بدقة وتناسق عالٍ دون تعب؛ ما يسرع من وتيرة البحث بشكل كبير ويقلل من المخاطر المرتبطة بالتعامل مع المواد الخطرة.

محمد السيد علي (القاهرة)
تكنولوجيا إيلون ماسك أثناء مشاركته الافتراضية بـ«مبادرة مستقبل الاستثمار» في الرياض (رويترز)

إيلون ماسك: سيكون هناك 10 مليارات روبوت بهيئة بشرية بحلول 2040

قال الملياردير إيلون ماسك، خلال «مؤتمر مبادرة مستقبل الاستثمار» الذي انطلق الثلاثاء في الرياض، إنه بحلول عام 2040 سيكون هناك ما لا يقل عن عشرة مليارات روبوت.

«الشرق الأوسط» (الرياض)
يوميات الشرق البدلة الروبوتية «ووك أون» (المعهد الكوري للعلوم والتكنولوجيا المتقدمة)

روبوت متطور لمساعدة مرضى الشلل التام على المشي

طوّر فريق من الباحثين من المعهد الكوري للعلوم والتكنولوجيا المتقدمة (KAIST) روبوتاً قابلاً للارتداء؛ ليساعد الأشخاص المصابين بالشلل التام على المشي.

«الشرق الأوسط» (القاهرة )
تكنولوجيا السيدة اتهمت روبوت دردشة يعمل بالذكاء الاصطناعي بدفع ابنها إلى الانتحار (رويترز)

سيدة تتهم روبوت دردشة بدفع ابنها إلى الانتحار

اتهمت سيدة أميركية روبوت دردشة يعمل بالذكاء الاصطناعي بدفع ابنها إلى الانتحار بعد أن أصبح «مهووساً به».

«الشرق الأوسط» (نيويورك)
يوميات الشرق الروبوت يقطف الفراولة في 2.5 ثانية فقط (جامعة إسكس)

روبوت يحصد الفراولة ويغلّفها في 2.5 ثانية فقط

أعلنت جامعة بريطانية عن اختبار روبوت منخفض التكلفة قادر على قطف الفراولة وتغليفها في ثوانٍ، وذلك ضمن خطة طموحة لمعالجة نقص العمالة في قطاع الزراعة.

«الشرق الأوسط» (القاهرة )

هل وصل الذكاء الاصطناعي إلى حدوده القصوى؟

لوغو تطبيق «شات جي بي تي» (رويترز)
لوغو تطبيق «شات جي بي تي» (رويترز)
TT

هل وصل الذكاء الاصطناعي إلى حدوده القصوى؟

لوغو تطبيق «شات جي بي تي» (رويترز)
لوغو تطبيق «شات جي بي تي» (رويترز)

هل وصلت نماذج الذكاء الاصطناعي التوليدي إلى طريق مسدود؟ منذ إطلاق «تشات جي بي تي» قبل عامين، بعث التقدم الهائل في التكنولوجيا آمالاً في ظهور آلات ذات ذكاء قريب من الإنسان... لكن الشكوك في هذا المجال تتراكم.

وتعد الشركات الرائدة في القطاع بتحقيق مكاسب كبيرة وسريعة على صعيد الأداء، لدرجة أن «الذكاء الاصطناعي العام»، وفق تعبير رئيس «أوبن إيه آي» سام ألتمان، يُتوقع أن يظهر قريباً.

وتبني الشركات قناعتها هذه على مبادئ التوسع، إذ ترى أنه سيكون كافياً تغذية النماذج عبر زيادة كميات البيانات وقدرة الحوسبة الحاسوبية لكي تزداد قوتها، وقد نجحت هذه الاستراتيجية حتى الآن بشكل جيد لدرجة أن الكثيرين في القطاع يخشون أن يحصل الأمر بسرعة زائدة وتجد البشرية نفسها عاجزة عن مجاراة التطور.

وأنفقت مايكروسوفت (المستثمر الرئيسي في «أوبن إيه آي»)، و«غوغل»، و«أمازون»، و«ميتا» وغيرها من الشركات مليارات الدولارات وأطلقت أدوات تُنتج بسهولة نصوصاً وصوراً ومقاطع فيديو عالية الجودة، وباتت هذه التكنولوجيا الشغل الشاغل للملايين.

وتعمل «إكس إيه آي»، شركة الذكاء الاصطناعي التابعة لإيلون ماسك، على جمع 6 مليارات دولار، بحسب «سي إن بي سي»، لشراء مائة ألف شريحة من تصنيع «نفيديا»، المكونات الإلكترونية المتطورة المستخدمة في تشغيل النماذج الكبيرة.

وأنجزت «أوبن إيه آي» عملية جمع أموال كبيرة بقيمة 6.6 مليار دولار في أوائل أكتوبر (تشرين الأول)، قُدّرت قيمتها بـ157 مليار دولار.

وقال الخبير في القطاع غاري ماركوس «تعتمد التقييمات المرتفعة إلى حد كبير على فكرة أن النماذج اللغوية ستصبح من خلال التوسع المستمر، ذكاء اصطناعياً عاماً». وأضاف «كما قلت دائماً، إنه مجرد خيال».

- حدود

وذكرت الصحافة الأميركية مؤخراً أن النماذج الجديدة قيد التطوير تبدو وكأنها وصلت إلى حدودها القصوى، ولا سيما في «غوغل»، و«أنثروبيك» (كلود)، و«أوبن إيه آي».

وقال بن هورويتز، المؤسس المشارك لـ«a16z»، وهي شركة رأسمال استثماري مساهمة في «أوبن إيه آي» ومستثمرة في شركات منافسة بينها «ميسترال»: «إننا نزيد (قوة الحوسبة) بالمعدل نفسه، لكننا لا نحصل على تحسينات ذكية منها».

أما «أورايون»، أحدث إضافة لـ«أوبن إيه آي» والذي لم يتم الإعلان عنه بعد، فيتفوق على سابقيه لكن الزيادة في الجودة كانت أقل بكثير مقارنة بالقفزة بين «جي بي تي 3» و«جي بي تي 4»، آخر نموذجين رئيسيين للشركة، وفق مصادر أوردتها «ذي إنفورميشن».

ويعتقد خبراء كثر أجرت «وكالة الصحافة الفرنسية» مقابلات معهم أن قوانين الحجم وصلت إلى حدودها القصوى، وفي هذا الصدد، يؤكد سكوت ستيفنسون، رئيس «سبيلبوك»، وهي شركة متخصصة في الذكاء الاصطناعي القانوني التوليدي، أن «بعض المختبرات ركزت كثيراً على إضافة المزيد من النصوص، معتقدة أن الآلة ستصبح أكثر ذكاءً».

وبفضل التدريب القائم على كميات كبيرة من البيانات المجمعة عبر الإنترنت، باتت النماذج قادرة على التنبؤ، بطريقة مقنعة للغاية، بتسلسل الكلمات أو ترتيبات وحدات البكسل. لكن الشركات بدأت تفتقر إلى المواد الجديدة اللازمة لتشغيلها.

والأمر لا يتعلق فقط بالمعارف: فمن أجل التقدم، سيكون من الضروري قبل كل شيء أن تتمكن الآلات بطريقة أو بأخرى من فهم معنى جملها أو صورها.

- «تحسينات جذرية»

لكنّ المديرين في القطاع ينفون أي تباطؤ في الذكاء الاصطناعي. ويقول داريو أمودي، رئيس شركة «أنثروبيك»، في البودكاست الخاص بعالم الكمبيوتر ليكس فريدمان «إذا نظرنا إلى وتيرة تعاظم القدرات، يمكننا أن نعتقد أننا سنصل (إلى الذكاء الاصطناعي العام) بحلول عام 2026 أو 2027».

وكتب سام ألتمان الخميس على منصة «إكس»: «ليس هناك طريق مسدود». ومع ذلك، أخّرت «أوبن إيه آي» إصدار النظام الذي سيخلف «جي بي تي - 4».

وفي سبتمبر (أيلول)، غيّرت الشركة الناشئة الرائدة في سيليكون فالي استراتيجيتها من خلال تقديم o1، وهو نموذج من المفترض أن يجيب على أسئلة أكثر تعقيداً، خصوصاً في مسائل الرياضيات، وذلك بفضل تدريب يعتمد بشكل أقل على تراكم البيانات مرتكزاً بدرجة أكبر على تعزيز القدرة على التفكير.

وبحسب سكوت ستيفنسون، فإن «o1 يمضي وقتاً أطول في التفكير بدلاً من التفاعل»، ما يؤدي إلى «تحسينات جذرية».

ويشبّه ستيفنسون تطوّر التكنولوجيا باكتشاف النار: فبدلاً من إضافة الوقود في شكل بيانات وقدرة حاسوبية، حان الوقت لتطوير ما يعادل الفانوس أو المحرك البخاري. وسيتمكن البشر من تفويض المهام عبر الإنترنت لهذه الأدوات في الذكاء الاصطناعي.