في حين أننا أصبحنا نتعامل مع الروبوتات القادرة على التواصل اللفظي المعقد، بفضل التقدم في التقنيات مثل «تشات جي بي تي» (ChatGPT)، فإن قدراتها في التواصل غير اللفظي، مثل تعبيرات الوجه، لم تواكب وتيرة التقدم هذا بنفس الدرجة. التحدي لا يتمثل في تصميم روبوتات تستطيع تقليد مجموعة واسعة من تعبيرات الوجه البشرية، ولكن في فهم السياق المناسب لاستخدامها.
لذلك، كرّس مختبر الآلات الإبداعية في جامعة كولومبيا للهندسة أكثر من نصف عقد من الزمن للتغلب على هذه العقبة. أحدث أبحاثهم يقدم «إيمو» (Emo)، وهو روبوت قادر على توقع تعبيرات الوجه البشري والتفاعل معها في الوقت الفعلي. ومن الملفت أن «إيمو» يمكنه التنبؤ بالابتسامة قبل حدوثها، بما يصل إلى 840 مللي ثانية، ما يسمح بالتعبير المتزامن عن المشاعر وتعزيز الإحساس بالتفاعل الحقيقي.
مواجهة التحديات
واجه فريق البحث الأميركي تحديين رئيسيين، يتمثل الأول في هندسة روبوت بوجه متعدد الاستخدامات ومعبّر، والثاني تحديد التعبيرات المناسبة التي يجب توليدها في اللحظات المناسبة. وللتغلب على ذلك، شرعوا في تدريب «إيمو» على التنبؤ بتعبيرات الوجه البشري، وتكرارها بالتزامن مع الشخص، مع التركيز بشكل خاص على التوقيت لضمان ظهور التعبيرات أصيلة وصادقة.
مميزات «إيمو»
يتميز «إيمو» برأس يشبه الإنسان مزود بـ26 مشغلاً، ما يمكّنه من عرض مجموعة واسعة من التعبيرات الدقيقة. ويسمح جلده الناعم المصنوع من السيليكون، الذي يكمله نظام ربط مغناطيسي، بالتخصيص وسهولة الصيانة. ولإثراء التفاعلات بشكل أكبر، تحتوي عيون «إيمو» على كاميرات عالية الدقة، ما يجعل التواصل البصري ممكناً، وهو جانب أساسي من التواصل غير اللفظي.
طوّر الفريق نموذجين متطورين للذكاء الاصطناعي لـ«Emo»، أحدهما للتنبؤ بتعبيرات الوجه البشري من خلال تحليل تغييرات الوجه الدقيقة، والآخر لترجمة هذه التنبؤات إلى أوامر حركية للتعبيرات المقابلة. وتضمنت عملية التعلم لدى «إيمو» مراقبة تعبيرات الوجه البشري من خلال لقطات فيديو، ما مكّنه من تمييز بداية الابتسامات أو التعبيرات الأخرى بناءً على حركات الوجه الدقيقة.
ويؤكد يوهانغ هو، المؤلف الرئيسي للدراسة والحاصل على درجة الدكتوراه في جامعة كولومبيا للهندسة، على التأثير الثوري للتنبؤ الدقيق بالتعبيرات البشرية على التفاعل بين الإنسان والروبوت. ويوضح أنه «عندما يقوم الروبوت بتعبيرات مشتركة مع الناس في الوقت الفعلي، فإنه لا يحسن جودة التفاعل فحسب، بل يساعد أيضاً في بناء الثقة بين البشر والروبوتات».
التوقعات المستقبلية
وبالنظر إلى المستقبل، يهدف الباحثون إلى استكمال قدرات التواصل غير اللفظي لدى «إيمو» (Emo) بقدرات التفاعل اللفظي، ودمج نماذج لغوية كبيرة مشابهة لـ«تشات جي بي تي». ومع تطور الروبوتات لتصبح أكثر شبهاً بالسلوك البشري، يعترف الباحثون بالآثار الأخلاقية لمثل هذه التطورات ويدعون إلى التطوير والاستخدام المسؤول، مع تسليط الضوء على الفوائد المحتملة لهذه الروبوتات في أدوار تتراوح بين المساعدين الشخصيين والأدوات التعليمية.