أحدث روبوت يتوقع تعبيرات الوجه البشري ويتفاعل معها في الوقت الفعلي

بما يصل إلى 840 مللي ثانية

يوهانغ هو أحد أعضاء فريق تطوير الروبوت «إيمو» (مختبر الآلات الإبداعية - هندسة كولومبيا)
يوهانغ هو أحد أعضاء فريق تطوير الروبوت «إيمو» (مختبر الآلات الإبداعية - هندسة كولومبيا)
TT

أحدث روبوت يتوقع تعبيرات الوجه البشري ويتفاعل معها في الوقت الفعلي

يوهانغ هو أحد أعضاء فريق تطوير الروبوت «إيمو» (مختبر الآلات الإبداعية - هندسة كولومبيا)
يوهانغ هو أحد أعضاء فريق تطوير الروبوت «إيمو» (مختبر الآلات الإبداعية - هندسة كولومبيا)

في حين أننا أصبحنا نتعامل مع الروبوتات القادرة على التواصل اللفظي المعقد، بفضل التقدم في التقنيات مثل «تشات جي بي تي» (ChatGPT)، فإن قدراتها في التواصل غير اللفظي، مثل تعبيرات الوجه، لم تواكب وتيرة التقدم هذا بنفس الدرجة. التحدي لا يتمثل في تصميم روبوتات تستطيع تقليد مجموعة واسعة من تعبيرات الوجه البشرية، ولكن في فهم السياق المناسب لاستخدامها.

لذلك، كرّس مختبر الآلات الإبداعية في جامعة كولومبيا للهندسة أكثر من نصف عقد من الزمن للتغلب على هذه العقبة. أحدث أبحاثهم يقدم «إيمو» (Emo)، وهو روبوت قادر على توقع تعبيرات الوجه البشري والتفاعل معها في الوقت الفعلي. ومن الملفت أن «إيمو» يمكنه التنبؤ بالابتسامة قبل حدوثها، بما يصل إلى 840 مللي ثانية، ما يسمح بالتعبير المتزامن عن المشاعر وتعزيز الإحساس بالتفاعل الحقيقي.

يرى البعض أن هذه الروبوتات قد تسد الفجوة بين الإنسان والآلة وتعزز الروابط المرتكزة على التعاطف والتفاهم (مختبر الآلات الإبداعية - هندسة كولومبيا)

مواجهة التحديات

واجه فريق البحث الأميركي تحديين رئيسيين، يتمثل الأول في هندسة روبوت بوجه متعدد الاستخدامات ومعبّر، والثاني تحديد التعبيرات المناسبة التي يجب توليدها في اللحظات المناسبة. وللتغلب على ذلك، شرعوا في تدريب «إيمو» على التنبؤ بتعبيرات الوجه البشري، وتكرارها بالتزامن مع الشخص، مع التركيز بشكل خاص على التوقيت لضمان ظهور التعبيرات أصيلة وصادقة.

ظهور هذه الروبوتات يشير إلى المستقبل حيث يمكن أن تصبح التفاعلات مع الروبوتات طبيعية ومريحة (مختبر الآلات الإبداعية - هندسة كولومبيا)

مميزات «إيمو»

يتميز «إيمو» برأس يشبه الإنسان مزود بـ26 مشغلاً، ما يمكّنه من عرض مجموعة واسعة من التعبيرات الدقيقة. ويسمح جلده الناعم المصنوع من السيليكون، الذي يكمله نظام ربط مغناطيسي، بالتخصيص وسهولة الصيانة. ولإثراء التفاعلات بشكل أكبر، تحتوي عيون «إيمو» على كاميرات عالية الدقة، ما يجعل التواصل البصري ممكناً، وهو جانب أساسي من التواصل غير اللفظي.

طوّر الفريق نموذجين متطورين للذكاء الاصطناعي لـ«Emo»، أحدهما للتنبؤ بتعبيرات الوجه البشري من خلال تحليل تغييرات الوجه الدقيقة، والآخر لترجمة هذه التنبؤات إلى أوامر حركية للتعبيرات المقابلة. وتضمنت عملية التعلم لدى «إيمو» مراقبة تعبيرات الوجه البشري من خلال لقطات فيديو، ما مكّنه من تمييز بداية الابتسامات أو التعبيرات الأخرى بناءً على حركات الوجه الدقيقة.

ويؤكد يوهانغ هو، المؤلف الرئيسي للدراسة والحاصل على درجة الدكتوراه في جامعة كولومبيا للهندسة، على التأثير الثوري للتنبؤ الدقيق بالتعبيرات البشرية على التفاعل بين الإنسان والروبوت. ويوضح أنه «عندما يقوم الروبوت بتعبيرات مشتركة مع الناس في الوقت الفعلي، فإنه لا يحسن جودة التفاعل فحسب، بل يساعد أيضاً في بناء الثقة بين البشر والروبوتات».

«إيمو» (Emo) وهو روبوت قادر على توقع وعكس تعبيرات الوجه البشري في الوقت الفعلي (مختبر الآلات الإبداعية - هندسة كولومبيا)

التوقعات المستقبلية

وبالنظر إلى المستقبل، يهدف الباحثون إلى استكمال قدرات التواصل غير اللفظي لدى «إيمو» (Emo) بقدرات التفاعل اللفظي، ودمج نماذج لغوية كبيرة مشابهة لـ«تشات جي بي تي». ومع تطور الروبوتات لتصبح أكثر شبهاً بالسلوك البشري، يعترف الباحثون بالآثار الأخلاقية لمثل هذه التطورات ويدعون إلى التطوير والاستخدام المسؤول، مع تسليط الضوء على الفوائد المحتملة لهذه الروبوتات في أدوار تتراوح بين المساعدين الشخصيين والأدوات التعليمية.


مقالات ذات صلة

كيف يُسرّع الذكاء الاصطناعي مسار الاكتشافات العلمية؟

علوم باحثون بجامعة نورث كارولينا يعتمدون على روبوت لتنفيذ مهام بالمختبر (جامعة نورث كارولينا)

كيف يُسرّع الذكاء الاصطناعي مسار الاكتشافات العلمية؟

قد تشهد مختبرات العلوم في مجالات الكيمياء والكيمياء الحيوية وعلوم المواد، تحولاً جذرياً؛ بفضل التقدم في التشغيل الآلي للروبوتات والذكاء الاصطناعي لأتمتة المهام المتكررة في المختبرات؛ حيث تُمكّن الأتمتة، الروبوتات من إجراء التجارب بدقة وتناسق عالٍ دون تعب؛ ما يسرع من وتيرة البحث بشكل كبير ويقلل من المخاطر المرتبطة بالتعامل مع المواد الخطرة.

محمد السيد علي (القاهرة)
تكنولوجيا إيلون ماسك أثناء مشاركته الافتراضية بـ«مبادرة مستقبل الاستثمار» في الرياض (رويترز)

إيلون ماسك: سيكون هناك 10 مليارات روبوت بهيئة بشرية بحلول 2040

قال الملياردير إيلون ماسك، خلال «مؤتمر مبادرة مستقبل الاستثمار» الذي انطلق الثلاثاء في الرياض، إنه بحلول عام 2040 سيكون هناك ما لا يقل عن عشرة مليارات روبوت.

«الشرق الأوسط» (الرياض)
يوميات الشرق البدلة الروبوتية «ووك أون» (المعهد الكوري للعلوم والتكنولوجيا المتقدمة)

روبوت متطور لمساعدة مرضى الشلل التام على المشي

طوّر فريق من الباحثين من المعهد الكوري للعلوم والتكنولوجيا المتقدمة (KAIST) روبوتاً قابلاً للارتداء؛ ليساعد الأشخاص المصابين بالشلل التام على المشي.

«الشرق الأوسط» (القاهرة )
تكنولوجيا السيدة اتهمت روبوت دردشة يعمل بالذكاء الاصطناعي بدفع ابنها إلى الانتحار (رويترز)

سيدة تتهم روبوت دردشة بدفع ابنها إلى الانتحار

اتهمت سيدة أميركية روبوت دردشة يعمل بالذكاء الاصطناعي بدفع ابنها إلى الانتحار بعد أن أصبح «مهووساً به».

«الشرق الأوسط» (نيويورك)
يوميات الشرق الروبوت يقطف الفراولة في 2.5 ثانية فقط (جامعة إسكس)

روبوت يحصد الفراولة ويغلّفها في 2.5 ثانية فقط

أعلنت جامعة بريطانية عن اختبار روبوت منخفض التكلفة قادر على قطف الفراولة وتغليفها في ثوانٍ، وذلك ضمن خطة طموحة لمعالجة نقص العمالة في قطاع الزراعة.

«الشرق الأوسط» (القاهرة )

شركات الذكاء الاصطناعي التوليدي تلجأ إلى الكتب لتطوّر برامجها

شركات الذكاء الاصطناعي تتفق مع دور النشر بما يتيح لهذه الشركات استخدام الأعمال المنشورة لتدريب نماذجها القائمة على الذكاء الاصطناعي التوليدي (رويترز)
شركات الذكاء الاصطناعي تتفق مع دور النشر بما يتيح لهذه الشركات استخدام الأعمال المنشورة لتدريب نماذجها القائمة على الذكاء الاصطناعي التوليدي (رويترز)
TT

شركات الذكاء الاصطناعي التوليدي تلجأ إلى الكتب لتطوّر برامجها

شركات الذكاء الاصطناعي تتفق مع دور النشر بما يتيح لهذه الشركات استخدام الأعمال المنشورة لتدريب نماذجها القائمة على الذكاء الاصطناعي التوليدي (رويترز)
شركات الذكاء الاصطناعي تتفق مع دور النشر بما يتيح لهذه الشركات استخدام الأعمال المنشورة لتدريب نماذجها القائمة على الذكاء الاصطناعي التوليدي (رويترز)

مع ازدياد احتياجات الذكاء الاصطناعي التوليدي، بدأت أوساط قطاع النشر هي الأخرى في التفاوض مع المنصات التي توفر هذه التقنية سعياً إلى حماية حقوق المؤلفين، وإبرام عقود مع الجهات المعنية بتوفير هذه الخدمات لتحقيق المداخيل من محتواها.

واقترحت دار النشر «هاربر كولينز» الأميركية الكبرى أخيراً على بعض مؤلفيها، عقداً مع إحدى شركات الذكاء الاصطناعي تبقى هويتها طي الكتمان، يتيح لهذه الشركة استخدام أعمالهم المنشورة لتدريب نماذجها القائمة على الذكاء الاصطناعي التوليدي.

وفي رسالة اطلعت عليها «وكالة الصحافة الفرنسية»، عرضت شركة الذكاء الاصطناعي 2500 دولار لكل كتاب تختاره لتدريب نموذجها اللغوي «إل إل إم» لمدة 3 سنوات.

آراء متفاوتة

ولكي تكون برامج الذكاء الاصطناعي قادرة على إنتاج مختلف أنواع المحتوى بناء على طلب بسيط بلغة يومية، تنبغي تغذيتها بكمية مزدادة من البيانات.

وبعد التواصل مع دار النشر أكدت الأخيرة الموافقة على العملية. وأشارت إلى أنّ «(هاربر كولينز) أبرمت عقداً مع إحدى شركات التكنولوجيا المتخصصة بالذكاء الاصطناعي للسماح بالاستخدام المحدود لكتب معينة (...) بهدف تدريب نماذج الذكاء الاصطناعي وتحسين أدائها».

وتوضّح دار النشر أيضاً أنّ العقد «ينظّم بشكل واضح ما تنتجه النماذج مع احترامها حقوق النشر».

ولاقى هذا العرض آراء متفاوتة في قطاع النشر، إذ رفضه كتّاب مثل الأميركي دانييل كيبلسميث الذي قال في منشور عبر منصة «بلوسكاي» للتواصل الاجتماعي: «من المحتمل أن أقبل بذلك مقابل مليار دولار، مبلغ يتيح لي التوقف عن العمل، لأن هذا هو الهدف النهائي من هذه التكنولوجيا».

هامش تفاوض محدود

ومع أنّ «هاربر كولينز» هي إحدى كبرى دور النشر التي أبرمت عقوداً من هذا النوع، فإنّها ليست الأولى. فدار «ويلي» الأميركية الناشرة للكتب العلمية أتاحت لشركة تكنولوجية كبيرة «محتوى كتب أكاديمية ومهنية منشورة لاستخدام محدد في نماذج التدريب، مقابل 23 مليون دولار»، كما قالت في مارس (آذار) عند عرض نتائجها المالية.

ويسلط هذا النوع من الاتفاقيات الضوء على المشاكل المرتبطة بتطوير الذكاء الاصطناعي التوليدي، الذي يتم تدريبه على كميات هائلة من البيانات تُجمع من الإنترنت، وهو ما قد يؤدي إلى انتهاكات لحقوق الطبع والنشر.

وترى جادا بيستيلي، رئيسة قسم الأخلاقيات لدى «هاغينغ فايس»، وهي منصة فرنسية - أميركية متخصصة بالذكاء الاصطناعي، أنّ هذا الإعلان يشكل خطوة إلى الأمام، لأنّ محتوى الكتب يدرّ أموالاً. لكنها تأسف لأنّ هامش التفاوض محدود للمؤلفين.

وتقول: «ما سنراه هو آلية لاتفاقيات ثنائية بين شركات التكنولوجيا ودور النشر أو أصحاب حقوق الطبع والنشر، في حين ينبغي أن تكون المفاوضات أوسع لتشمل أصحاب العلاقة».

ويقول المدير القانوني لاتحاد النشر الفرنسي (SNE) جوليان شوراكي: «نبدأ من مكان بعيد جداً»، مضيفاً: «إنّه تقدم، فبمجرّد وجود اتفاق يعني أن حواراً ما انعقد وثمة رغبة في تحقيق توازن فيما يخص استخدام البيانات مصدراً، التي تخضع للحقوق والتي ستولد مبالغ».

مواد جديدة

وفي ظل هذه المسائل، بدأ الناشرون الصحافيون أيضاً في تنظيم هذا الموضوع. ففي نهاية 2023، أطلقت صحيفة «نيويورك تايمز» الأميركية اليومية ملاحقات ضد شركة «أوبن إيه آي» مبتكرة برنامج «تشات جي بي تي» وضد «مايكروسوفت» المستثمر الرئيسي فيها، بتهمة انتهاك حقوق النشر. وقد أبرمت وسائل إعلام أخرى اتفاقيات مع «أوبن إيه آي».

وربما لم يعد أمام شركات التكنولوجيا أي خيار لتحسين منتجاتها سوى باعتماد خيارات تُلزمها بدفع أموال، خصوصاً مع بدء نفاد المواد الجديدة لتشغيل النماذج.

وأشارت الصحافة الأميركية أخيراً إلى أنّ النماذج الجديدة قيد التطوير تبدو كأنها وصلت إلى حدودها القصوى، لا سيما برامج «غوغل» و«أنثروبيك» و«أوبن إيه آي».

ويقول جوليان شوراكي: «يمكن على شبكة الإنترنت، جمع المحتوى القانوني وغير القانوني، وكميات كبيرة من المحتوى المقرصن، مما يشكل مشكلة قانونية. هذا من دون أن ننسى مسألة نوعية البيانات».