أحدث روبوت يتوقع تعبيرات الوجه البشري ويتفاعل معها في الوقت الفعلي

بما يصل إلى 840 مللي ثانية

يوهانغ هو أحد أعضاء فريق تطوير الروبوت «إيمو» (مختبر الآلات الإبداعية - هندسة كولومبيا)
يوهانغ هو أحد أعضاء فريق تطوير الروبوت «إيمو» (مختبر الآلات الإبداعية - هندسة كولومبيا)
TT

أحدث روبوت يتوقع تعبيرات الوجه البشري ويتفاعل معها في الوقت الفعلي

يوهانغ هو أحد أعضاء فريق تطوير الروبوت «إيمو» (مختبر الآلات الإبداعية - هندسة كولومبيا)
يوهانغ هو أحد أعضاء فريق تطوير الروبوت «إيمو» (مختبر الآلات الإبداعية - هندسة كولومبيا)

في حين أننا أصبحنا نتعامل مع الروبوتات القادرة على التواصل اللفظي المعقد، بفضل التقدم في التقنيات مثل «تشات جي بي تي» (ChatGPT)، فإن قدراتها في التواصل غير اللفظي، مثل تعبيرات الوجه، لم تواكب وتيرة التقدم هذا بنفس الدرجة. التحدي لا يتمثل في تصميم روبوتات تستطيع تقليد مجموعة واسعة من تعبيرات الوجه البشرية، ولكن في فهم السياق المناسب لاستخدامها.

لذلك، كرّس مختبر الآلات الإبداعية في جامعة كولومبيا للهندسة أكثر من نصف عقد من الزمن للتغلب على هذه العقبة. أحدث أبحاثهم يقدم «إيمو» (Emo)، وهو روبوت قادر على توقع تعبيرات الوجه البشري والتفاعل معها في الوقت الفعلي. ومن الملفت أن «إيمو» يمكنه التنبؤ بالابتسامة قبل حدوثها، بما يصل إلى 840 مللي ثانية، ما يسمح بالتعبير المتزامن عن المشاعر وتعزيز الإحساس بالتفاعل الحقيقي.

يرى البعض أن هذه الروبوتات قد تسد الفجوة بين الإنسان والآلة وتعزز الروابط المرتكزة على التعاطف والتفاهم (مختبر الآلات الإبداعية - هندسة كولومبيا)

مواجهة التحديات

واجه فريق البحث الأميركي تحديين رئيسيين، يتمثل الأول في هندسة روبوت بوجه متعدد الاستخدامات ومعبّر، والثاني تحديد التعبيرات المناسبة التي يجب توليدها في اللحظات المناسبة. وللتغلب على ذلك، شرعوا في تدريب «إيمو» على التنبؤ بتعبيرات الوجه البشري، وتكرارها بالتزامن مع الشخص، مع التركيز بشكل خاص على التوقيت لضمان ظهور التعبيرات أصيلة وصادقة.

ظهور هذه الروبوتات يشير إلى المستقبل حيث يمكن أن تصبح التفاعلات مع الروبوتات طبيعية ومريحة (مختبر الآلات الإبداعية - هندسة كولومبيا)

مميزات «إيمو»

يتميز «إيمو» برأس يشبه الإنسان مزود بـ26 مشغلاً، ما يمكّنه من عرض مجموعة واسعة من التعبيرات الدقيقة. ويسمح جلده الناعم المصنوع من السيليكون، الذي يكمله نظام ربط مغناطيسي، بالتخصيص وسهولة الصيانة. ولإثراء التفاعلات بشكل أكبر، تحتوي عيون «إيمو» على كاميرات عالية الدقة، ما يجعل التواصل البصري ممكناً، وهو جانب أساسي من التواصل غير اللفظي.

طوّر الفريق نموذجين متطورين للذكاء الاصطناعي لـ«Emo»، أحدهما للتنبؤ بتعبيرات الوجه البشري من خلال تحليل تغييرات الوجه الدقيقة، والآخر لترجمة هذه التنبؤات إلى أوامر حركية للتعبيرات المقابلة. وتضمنت عملية التعلم لدى «إيمو» مراقبة تعبيرات الوجه البشري من خلال لقطات فيديو، ما مكّنه من تمييز بداية الابتسامات أو التعبيرات الأخرى بناءً على حركات الوجه الدقيقة.

ويؤكد يوهانغ هو، المؤلف الرئيسي للدراسة والحاصل على درجة الدكتوراه في جامعة كولومبيا للهندسة، على التأثير الثوري للتنبؤ الدقيق بالتعبيرات البشرية على التفاعل بين الإنسان والروبوت. ويوضح أنه «عندما يقوم الروبوت بتعبيرات مشتركة مع الناس في الوقت الفعلي، فإنه لا يحسن جودة التفاعل فحسب، بل يساعد أيضاً في بناء الثقة بين البشر والروبوتات».

«إيمو» (Emo) وهو روبوت قادر على توقع وعكس تعبيرات الوجه البشري في الوقت الفعلي (مختبر الآلات الإبداعية - هندسة كولومبيا)

التوقعات المستقبلية

وبالنظر إلى المستقبل، يهدف الباحثون إلى استكمال قدرات التواصل غير اللفظي لدى «إيمو» (Emo) بقدرات التفاعل اللفظي، ودمج نماذج لغوية كبيرة مشابهة لـ«تشات جي بي تي». ومع تطور الروبوتات لتصبح أكثر شبهاً بالسلوك البشري، يعترف الباحثون بالآثار الأخلاقية لمثل هذه التطورات ويدعون إلى التطوير والاستخدام المسؤول، مع تسليط الضوء على الفوائد المحتملة لهذه الروبوتات في أدوار تتراوح بين المساعدين الشخصيين والأدوات التعليمية.


مقالات ذات صلة

رقصة هندية تلهم الروبوتات تعلّم حركات اليد المعقدة

يوميات الشرق عرضٌ تجريبيٌّ في المختبر (جامعة ماريلاند)

رقصة هندية تلهم الروبوتات تعلّم حركات اليد المعقدة

استخلص باحثون في جامعة ماريلاند الأميركية بمقاطعة بالتيمور (UMBC) العناصر الأساسية لإيماءات اليد الدقيقة التي يستخدمها الراقصون في رقصة «بهاراتاناتيام» الهندية.

«الشرق الأوسط» (القاهرة)
تكنولوجيا منصة «إكس»

شريحة دماغية تُمكّن المرضى من تحريك أطراف روبوتية بمجرد التفكير

شريحة «نيورالينك» تُمكّن مرضى الشلل من تحريك أطراف روبوتية بالتفكير فقط، مع استمرار التجارب السريرية وتوسع مشاركة المرضى في التقنية.

«الشرق الأوسط» (واشنطن)
تكنولوجيا الأوتار الاصطناعية قد تصبح وحدات قابلة للتبديل لتسهيل تصميم روبوتات هجينة ذات استخدامات طبية واستكشافية (شاترستوك)

أوتار اصطناعية تضاعف قوة الروبوتات بثلاثين مرة

الأوتار الاصطناعية تربط العضلات المزروعة بالهياكل الروبوتية، مما يرفع الكفاءة ويفتح الباب لروبوتات بيولوجية أقوى وأكثر مرونة.

نسيم رمضان (لندن)
يوميات الشرق صورة نشرتها شركة «هيودول» للدمية الروبوت

«دمى روبوتية» للتخفيف من عزلة واكتئاب المسنين في كوريا الجنوبية

في محاولة للتخفيف من عزلة واكتئاب كبار السن في كوريا الجنوبية، ابتكرت إحدى شركات التكنولوجيا دمى روبوتية مدعومة بالذكاء الاصطناعي، تقوم بتقليد أفعال الأطفال.

«الشرق الأوسط» (سيول)
تكنولوجيا الحكومة الصينية شجعت الشركات المحلية على تطوير روبوتات شبيهة بالبشر (رويترز)

روبوتات بشرية تنظم المعابر الحدودية في مشروع تجريبي بالصين

قد تستعين السلطات الصينية بروبوتات شبيهة بالبشر لتوجيه المسافرين وتنظيم الحشود عند بعض المعابر الحدودية.

«الشرق الأوسط» (بكين)

دراسة: 20 % من فيديوهات «يوتيوب» مولّدة بالذكاء الاصطناعي

محتوى على «يوتيوب» تم إنشاؤه بواسطة الذكاء الاصطناعي يصوّر قطاً يتم القبض عليه بواسطة رجال الشرطة
محتوى على «يوتيوب» تم إنشاؤه بواسطة الذكاء الاصطناعي يصوّر قطاً يتم القبض عليه بواسطة رجال الشرطة
TT

دراسة: 20 % من فيديوهات «يوتيوب» مولّدة بالذكاء الاصطناعي

محتوى على «يوتيوب» تم إنشاؤه بواسطة الذكاء الاصطناعي يصوّر قطاً يتم القبض عليه بواسطة رجال الشرطة
محتوى على «يوتيوب» تم إنشاؤه بواسطة الذكاء الاصطناعي يصوّر قطاً يتم القبض عليه بواسطة رجال الشرطة

أظهرت دراسة أن أكثر من 20 في المائة من الفيديوهات التي يعرضها نظام يوتيوب للمستخدمين الجدد هي «محتوى رديء مُولّد بالذكاء الاصطناعي»، مُصمّم خصيصاً لزيادة المشاهدات.

وبحسب صحيفة «الغارديان» البريطانية، فقد أجرت شركة تحرير الفيديو «كابوينغ» استطلاعاً شمل 15 ألف قناة من أشهر قنوات يوتيوب في العالم - أفضل 100 قناة في كل دولة - ووجدت أن 278 قناة منها تحتوي فقط على محتوى رديء مُصمم بتقنية الذكاء الاصطناعي.

وقد حصدت هذه القنوات مجتمعةً أكثر من 63 مليار مشاهدة و221 مليون مشترك، مُدرّةً إيرادات تُقدّر بنحو 117 مليون دولار سنوياً، وفقاً للتقديرات.

كما أنشأ الباحثون حساباً جديداً على «يوتيوب»، ووجدوا أن 104 من أول 500 فيديو تم التوصية به في الصفحة الرئيسية لهذا الحساب كانت ذات محتوى رديء مولد بالذكاء الاصطناعي، تم تطويره بهدف الربح المادي.

وتُقدّم هذه النتائج لمحةً عن صناعةٍ سريعة النمو تُهيمن على منصات التواصل الاجتماعي الكبرى، من «إكس» إلى «ميتا» إلى «يوتيوب»، وتُرسّخ حقبةً جديدةً من المحتوى، وهو المحتوى التافه الذي يحفز على إدمان هذه المنصات.

وسبق أن كشف تحليل أجرته صحيفة «الغارديان» هذا العام أن ما يقرب من 10في المائة من قنوات «يوتيوب» الأسرع نمواً هي قنوات مُولّدة بواسطة الذكاء الاصطناعي، حيث حققت ملايين المشاهدات رغم جهود المنصة للحد من «المحتوى غير الأصلي».

وتُعدّ القنوات التي رصدتها شركة كابوينغ عالمية الانتشار وتحظى بمتابعة واسعة من ملايين المشتركين في مختلف أنحاء العالم.

وتعتبر قناة «بندر أبنا دوست»، هي القناة الأكثر مشاهدة في الدراسة، ومقرها الهند، ويبلغ عدد مشاهداتها حالياً 2.4 مليار مشاهدة. وتعرض القناة مغامرات قرد ريسوس وشخصية مفتولة العضلات مستوحاة من شخصية «هالك» الخارقة، يحاربان الشياطين ويسافران على متن مروحية مصنوعة من الطماطم. وقدّرت كابوينغ أن القناة قد تُدرّ أرباحاً تصل إلى 4.25 مليون دولار.

أما قناة «بوتى فرينشي»، ومقرها سنغافورة، والتي تروي مغامرات كلب بولدوغ فرنسي، فقد حصدت ملياري مشاهدة، ويبدو أنها تستهدف الأطفال. وتشير تقديرات كابوينغ إلى أن أرباحها تقارب 4 ملايين دولار سنوياً.

كما يبدو أن قناة «كوينتوس فاسينانتس»، ومقرها الولايات المتحدة، تستهدف الأطفال أيضاً بقصص كرتونية، ولديها 6.65 مليون مشترك.

في الوقت نفسه، تعرض قناة «ذا إيه آي وورلد»، ومقرها باكستان، مقاطع فيديو قصيرة مُولّدة بالذكاء الاصطناعي عن الفيضانات الكارثية التي ضربت باكستان، تحمل عناوين مثل «الفقراء»، و«العائلات الفقيرة»، و«مطبخ الفيضان». وقد حصدت القناة وحدها 1.3 مليار مشاهدة.

وتعليقاً على هذه الدراسة، صرح متحدث باسم «يوتيوب» قائلاً: «الذكاء الاصطناعي التوليدي أداة، وكأي أداة أخرى، يمكن استخدامه لإنتاج محتوى عالي الجودة وآخر منخفض الجودة. نركز جهودنا على ربط مستخدمينا بمحتوى عالي الجودة، بغض النظر عن طريقة إنتاجه. يجب أن يتوافق المحتوى المرفوع على (يوتيوب) مع إرشاداتنا، وإذا وجدنا أن المحتوى ينتهك أياً من سياساتنا، فسنحذفه».


الصين تصدر مسوّدة قواعد لتنظيم الذكاء الاصطناعي المحاكي للتفاعل البشري

امرأة في معرض حول الذكاء الاصطناعي وعالم الإنترنت بمقاطعة جيجيانغ الصينية (رويترز)
امرأة في معرض حول الذكاء الاصطناعي وعالم الإنترنت بمقاطعة جيجيانغ الصينية (رويترز)
TT

الصين تصدر مسوّدة قواعد لتنظيم الذكاء الاصطناعي المحاكي للتفاعل البشري

امرأة في معرض حول الذكاء الاصطناعي وعالم الإنترنت بمقاطعة جيجيانغ الصينية (رويترز)
امرأة في معرض حول الذكاء الاصطناعي وعالم الإنترنت بمقاطعة جيجيانغ الصينية (رويترز)

أصدرت هيئة الفضاء الإلكتروني الصينية، اليوم (السبت)، مسودة ​قواعد لتشديد الرقابة على خدمات الذكاء الاصطناعي المصممة لمحاكاة الشخصيات البشرية والتفاعل العاطفي مع المستخدمين.

وتؤكد هذه الخطوة ما تبذله بكين من جهود للسيطرة على الانتشار السريع لخدمات ‌الذكاء الاصطناعي ‌المقدمة للجمهور ‌من ⁠خلال ​تشديد معايير ‌السلامة والأخلاقيات.

وستطبق القواعد المقترحة على منتجات وخدمات الذكاء الاصطناعي المقدمة للمستهلكين في الصين، والتي تعرض سمات شخصيات بشرية وأنماط تفكير وأساليب تواصل تتم محاكاتها، وتتفاعل ⁠مع المستخدمين عاطفياً من خلال النصوص ‌أو الصور أو الصوت أو الفيديو، أو غيرها من الوسائل.

وتحدد المسودة نهجاً تنظيمياً يلزم مقدمي الخدمات بتحذير المستخدمين من الاستخدام المفرط، وبالتدخل عندما تظهر على المستخدمين ​علامات الإدمان.

وبموجب هذا المقترح، سيتحمل مقدمو الخدمات مسؤوليات ⁠السلامة طوال دورة حياة المنتج، ووضع أنظمة لمراجعة الخوارزميات وأمن البيانات وحماية المعلومات الشخصية.

وتحدد هذه الإجراءات الخطوط الحمراء للمحتوى والسلوك، وتنص على أنه يجب ألا ينشئ مقدمو الخدمات محتوى من شأنه تهديد الأمن القومي، أو نشر الشائعات، أو الترويج ‌للعنف أو الفحشاء.


ما الاختراق القادم في مجال الذكاء الاصطناعي الذي يتوقعه رئيس «أوبن إيه آي»؟

سام ألتمان رئيس شركة «أوبن إيه آي» (رويترز)
سام ألتمان رئيس شركة «أوبن إيه آي» (رويترز)
TT

ما الاختراق القادم في مجال الذكاء الاصطناعي الذي يتوقعه رئيس «أوبن إيه آي»؟

سام ألتمان رئيس شركة «أوبن إيه آي» (رويترز)
سام ألتمان رئيس شركة «أوبن إيه آي» (رويترز)

توقع سام ألتمان، رئيس شركة «أوبن إيه آي»، أن يكون الإنجاز الكبير التالي نحو تحقيق ذكاء اصطناعي فائق القدرة هو اكتساب هذه الأنظمة «ذاكرة لا نهائية، ومثالية».

وقد ركزت التطورات الأخيرة التي حققها مبتكر «تشات جي بي تي»، بالإضافة إلى منافسيه، على تحسين قدرات الذكاء الاصطناعي على الاستدلال، وفقاً لصحيفة «إندبندنت».

لكن في حديثه ضمن بودكاست، قال ألتمان إن التطور الذي يتطلع إليه بشدة هو قدرة الذكاء الاصطناعي على تذكر «كل تفاصيل حياتك»، وأن شركته تعمل على الوصول إلى هذه المرحلة بحلول عام 2026.

شرح ألتمان: «حتى لو كان لديك أفضل مساعد شخصي في العالم... فلن يستطيع تذكر كل كلمة نطقت بها في حياتك».

وأضاف: «لا يمكنه قراءة كل وثيقة كتبتها. ولا يمكنه الاطلاع على جميع أعمالك يومياً، وتذكر كل تفصيل صغير. ولا يمكنه أن يكون جزءاً من حياتك إلى هذا الحد. ولا يوجد إنسان يمتلك ذاكرة مثالية لا متناهية».

وأشار ألتمان إلى أنه «بالتأكيد، سيتمكن الذكاء الاصطناعي من فعل ذلك. نتحدث كثيراً عن هذا الأمر، لكن الذاكرة لا تزال في مراحلها الأولى جداً».

تأتي تصريحاته بعد أسابيع قليلة من إعلانه حالة طوارئ قصوى في شركته عقب إطلاق «غوغل» لأحدث طراز من برنامج «جيميناي».

وصفت «غوغل» برنامج «جيميناي 3» بأنه «عهد جديد من الذكاء» عند إطلاقها تطبيق الذكاء الاصطناعي المُحدّث في نوفمبر (تشرين الثاني)، حيث حقق النموذج نتائج قياسية في العديد من اختبارات الأداء المعيارية في هذا المجال.

قلّل ألتمان من خطورة التهديد الذي يمثله مشروع «جيميناي 3»، مدعياً ​​أن ردّ شركة «أوبن إيه آي» الحازم على المنافسة الجديدة ليس بالأمر غير المألوف.

وقال: «أعتقد أنه من الجيد توخي الحذر، والتحرك بسرعة عند ظهور أي تهديد تنافسي محتمل».

وتابع: «حدث الشيء نفسه لنا في الماضي، حدث ذلك في وقت سابق من هذا العام مع (ديب سيك)... لم يكن لـ(جيميناي 3) التأثير الذي كنا نخشى أن يحدث، ولكنه حدد بعض نقاط الضعف في منتجاتنا واستراتيجيتنا، ونحن نعمل على معالجتها بسرعة كبيرة».

يبلغ عدد مستخدمي «تشات جي بي تي» حالياً نحو 800 مليون، وفقاً لبيانات «أوبن إيه آي»، وهو ما يمثل نحو 71 في المائة من حصة سوق تطبيقات الذكاء الاصطناعي. ويقارن هذا الرقم بنسبة 87 في المائة في الفترة نفسها من العام الماضي.