أحدث روبوت يتوقع تعبيرات الوجه البشري ويتفاعل معها في الوقت الفعلي

بما يصل إلى 840 مللي ثانية

يوهانغ هو أحد أعضاء فريق تطوير الروبوت «إيمو» (مختبر الآلات الإبداعية - هندسة كولومبيا)
يوهانغ هو أحد أعضاء فريق تطوير الروبوت «إيمو» (مختبر الآلات الإبداعية - هندسة كولومبيا)
TT

أحدث روبوت يتوقع تعبيرات الوجه البشري ويتفاعل معها في الوقت الفعلي

يوهانغ هو أحد أعضاء فريق تطوير الروبوت «إيمو» (مختبر الآلات الإبداعية - هندسة كولومبيا)
يوهانغ هو أحد أعضاء فريق تطوير الروبوت «إيمو» (مختبر الآلات الإبداعية - هندسة كولومبيا)

في حين أننا أصبحنا نتعامل مع الروبوتات القادرة على التواصل اللفظي المعقد، بفضل التقدم في التقنيات مثل «تشات جي بي تي» (ChatGPT)، فإن قدراتها في التواصل غير اللفظي، مثل تعبيرات الوجه، لم تواكب وتيرة التقدم هذا بنفس الدرجة. التحدي لا يتمثل في تصميم روبوتات تستطيع تقليد مجموعة واسعة من تعبيرات الوجه البشرية، ولكن في فهم السياق المناسب لاستخدامها.

لذلك، كرّس مختبر الآلات الإبداعية في جامعة كولومبيا للهندسة أكثر من نصف عقد من الزمن للتغلب على هذه العقبة. أحدث أبحاثهم يقدم «إيمو» (Emo)، وهو روبوت قادر على توقع تعبيرات الوجه البشري والتفاعل معها في الوقت الفعلي. ومن الملفت أن «إيمو» يمكنه التنبؤ بالابتسامة قبل حدوثها، بما يصل إلى 840 مللي ثانية، ما يسمح بالتعبير المتزامن عن المشاعر وتعزيز الإحساس بالتفاعل الحقيقي.

يرى البعض أن هذه الروبوتات قد تسد الفجوة بين الإنسان والآلة وتعزز الروابط المرتكزة على التعاطف والتفاهم (مختبر الآلات الإبداعية - هندسة كولومبيا)

مواجهة التحديات

واجه فريق البحث الأميركي تحديين رئيسيين، يتمثل الأول في هندسة روبوت بوجه متعدد الاستخدامات ومعبّر، والثاني تحديد التعبيرات المناسبة التي يجب توليدها في اللحظات المناسبة. وللتغلب على ذلك، شرعوا في تدريب «إيمو» على التنبؤ بتعبيرات الوجه البشري، وتكرارها بالتزامن مع الشخص، مع التركيز بشكل خاص على التوقيت لضمان ظهور التعبيرات أصيلة وصادقة.

ظهور هذه الروبوتات يشير إلى المستقبل حيث يمكن أن تصبح التفاعلات مع الروبوتات طبيعية ومريحة (مختبر الآلات الإبداعية - هندسة كولومبيا)

مميزات «إيمو»

يتميز «إيمو» برأس يشبه الإنسان مزود بـ26 مشغلاً، ما يمكّنه من عرض مجموعة واسعة من التعبيرات الدقيقة. ويسمح جلده الناعم المصنوع من السيليكون، الذي يكمله نظام ربط مغناطيسي، بالتخصيص وسهولة الصيانة. ولإثراء التفاعلات بشكل أكبر، تحتوي عيون «إيمو» على كاميرات عالية الدقة، ما يجعل التواصل البصري ممكناً، وهو جانب أساسي من التواصل غير اللفظي.

طوّر الفريق نموذجين متطورين للذكاء الاصطناعي لـ«Emo»، أحدهما للتنبؤ بتعبيرات الوجه البشري من خلال تحليل تغييرات الوجه الدقيقة، والآخر لترجمة هذه التنبؤات إلى أوامر حركية للتعبيرات المقابلة. وتضمنت عملية التعلم لدى «إيمو» مراقبة تعبيرات الوجه البشري من خلال لقطات فيديو، ما مكّنه من تمييز بداية الابتسامات أو التعبيرات الأخرى بناءً على حركات الوجه الدقيقة.

ويؤكد يوهانغ هو، المؤلف الرئيسي للدراسة والحاصل على درجة الدكتوراه في جامعة كولومبيا للهندسة، على التأثير الثوري للتنبؤ الدقيق بالتعبيرات البشرية على التفاعل بين الإنسان والروبوت. ويوضح أنه «عندما يقوم الروبوت بتعبيرات مشتركة مع الناس في الوقت الفعلي، فإنه لا يحسن جودة التفاعل فحسب، بل يساعد أيضاً في بناء الثقة بين البشر والروبوتات».

«إيمو» (Emo) وهو روبوت قادر على توقع وعكس تعبيرات الوجه البشري في الوقت الفعلي (مختبر الآلات الإبداعية - هندسة كولومبيا)

التوقعات المستقبلية

وبالنظر إلى المستقبل، يهدف الباحثون إلى استكمال قدرات التواصل غير اللفظي لدى «إيمو» (Emo) بقدرات التفاعل اللفظي، ودمج نماذج لغوية كبيرة مشابهة لـ«تشات جي بي تي». ومع تطور الروبوتات لتصبح أكثر شبهاً بالسلوك البشري، يعترف الباحثون بالآثار الأخلاقية لمثل هذه التطورات ويدعون إلى التطوير والاستخدام المسؤول، مع تسليط الضوء على الفوائد المحتملة لهذه الروبوتات في أدوار تتراوح بين المساعدين الشخصيين والأدوات التعليمية.


مقالات ذات صلة

«أيقونة» الذكاء الاصطناعي «صوفيا» تأسر القلوب في زيمبابوي

يوميات الشرق «صوفيا» آسرةُ القلوب (أ.ب)

«أيقونة» الذكاء الاصطناعي «صوفيا» تأسر القلوب في زيمبابوي

اعتذرت عندما نبَّهها أحدهم إلى أنها تجنَّبت النظر إليه، وبدت «صوفيا» أيضاً صبورةً عندما تجمَّع حولها الكبار والصغار لالتقاط الصور، وأخذوا يمطرونها بالأسئلة.

«الشرق الأوسط» (هراري (زيمبابوي))
يوميات الشرق الباحثون استلهموا تصميم الروبوت الجديد من زعانف سمكة المانتا راي المرنة (جامعة ولاية نورث كارولينا)

أسرع روبوت مائي مستوحى من «شيطان البحر»

حقّق فريق بحثي أميركي إنجازاً جديداً في عالم الروبوتات اللينة، حيث صمموا أسرع روبوت سباحة لين حتى الآن.

«الشرق الأوسط» (القاهرة)
يوميات الشرق الفريق البحثي بجامعة كورنيل الأميركية يراقب نتائج أصغر روبوت متحرك في العالم (جامعة كورنيل)

روبوت أصغر من الشعرة للتصوير الطبي

نجح باحثون من جامعة كورنيل الأميركية في تطوير أصغر روبوت متحرك في العالم، يتمتع بقدرة استثنائية على التفاعل مع موجات الضوء المرئي، والتحرك بشكل مستقل.

«الشرق الأوسط» (القاهرة)
تكنولوجيا يبرز نجاح «أكوا بوت» الإمكانات التحويلية للجمع بين الأجهزة المتطورة والبرامج الذكية (أكوا بوت)

روبوت يسبح تحت الماء بشكل مستقل مستخدماً الذكاء الاصطناعي

الروبوت «أكوا بوت»، الذي طوّره باحثون في جامعة كولومبيا، قادر على تنفيذ مجموعة متنوعة من المهام تحت الماء بشكل مستقل.

نسيم رمضان (لندن)
علوم باحثون بجامعة نورث كارولينا يعتمدون على روبوت لتنفيذ مهام بالمختبر (جامعة نورث كارولينا)

كيف يُسرّع الذكاء الاصطناعي مسار الاكتشافات العلمية؟

قد تشهد مختبرات العلوم في مجالات الكيمياء والكيمياء الحيوية وعلوم المواد، تحولاً جذرياً؛ بفضل التقدم في التشغيل الآلي للروبوتات والذكاء الاصطناعي لأتمتة المهام المتكررة في المختبرات؛ حيث تُمكّن الأتمتة، الروبوتات من إجراء التجارب بدقة وتناسق عالٍ دون تعب؛ ما يسرع من وتيرة البحث بشكل كبير ويقلل من المخاطر المرتبطة بالتعامل مع المواد الخطرة.

محمد السيد علي (القاهرة)

«تشات جي بي تي»: أحدث السمات... ونقاط القوة والضعف

«تشات جي بي تي»: أحدث السمات... ونقاط القوة والضعف
TT

«تشات جي بي تي»: أحدث السمات... ونقاط القوة والضعف

«تشات جي بي تي»: أحدث السمات... ونقاط القوة والضعف

«تشات جي بي تي (ChatGPT)» روبوت المحادثة الذي يعتمد على الذكاء الاصطناعي، طوَّرته شركة «أوبن إيه آي (OpenAI)» للعمل مساعداً وظيفياً في مجموعة من الأنشطة، بينها الإجابة عن الأسئلة، وتوليد محتويات إبداعية.

سمات رئيسة

ويستخدم النظام النموذج اللغوي الكبير «LLM»، وهو مُدرَّبٌ على مجموعة بيانات متنوعة، تُمكِّنه من المشارَكة بمحادثات معقدة، وتقديم المساعدة الفنية، وسرد القصص. وبفضل قدرته على تحديد السياق وتمييز الفروق الدقيقة، فإنه يتميَّز عن برامج الدردشة الأخرى، ويطرح استجابات تشبه الاستجابات البشرية، وفيما يلي عرض لأبرز سماته وخصائصه وإيجابياته وسلبياته.

يتيح «تشات جي بي تي» مجموعةً من السمات القوية تهدف إلى زيادة الكفاءة والإبداع عبر مجموعة متنوعة من الوظائف؛ إذ يمكنه إنشاء الصور وتحليلها، مما يجعله خياراً ممتازاً للمشروعات المرئية و«رؤى» البيانات، وفقاً لتقرير من موقع «إي ويك». ويتيح لك «تشات جي بي تي» إنشاء خطط واستراتيجيات مفصلة، وتبادل الأفكار، وتوليد حلول قابلة للتنفيذ.

ويمكنه كذلك كتابة التعليمات البرمجية للمهام الفنية، ما يوفر للمطورين الوقت، وإنشاء كتابة واضحة ومقنعة لكل مناسبة. كما أن باستطاعته تلخيص النصوص الطويلة إلى مجموعة أقصر من المعلومات يسهل استيعابها لدرجة أكبر.

الصور والفيديو

• إنشاء الصور: تتيح سمة الذكاء التوليدي لدى «تشات جي بي تي» إنشاء صور باستخدام مطالبات نصية، مثله مثل أدوات الفن الأخرى للذكاء الاصطناعي. ويمكن إنشاء صورة على الفور تقريباً، بالاعتماد على أحاديث عن صور متخيلة.

• تحليل الصور: لاختبار قدرة «تشات جي بي تي» على استخدام طبيعته متعددة الوسائط لتحليل الصور التي لم ينشئها، فإن قمت بتحميل صورة لسمكة تدخن السجائر بجسم دجاجة، وطلبت منه تفسيرها، سيجيب بأن الصورة «إبداع فكاهي سريالي... ربما كان المقصود منه أن يكون قطعةً من الفكاهة السخيفة أو التعليق الاجتماعي».

• تحويل النصوص إلى فيديو: تعتمد ميزة إنتاج الفيديو في «تشات جي بي تي» على تطبيق من متجر تطبيقات «تشات جي بي تي»، يرتبط بسلاسة بواجهة برمجة التطبيقات «api.adzedek.com». وما إن تقدم وصفاً موجزاً للفيديو المقصود، سيتولى التطبيق إنشاء نص مقترح وإرشادك عبر عملية إنشاء الفيديو.

• في البداية، سيوجِّهك إلى «InVideo» لمشاهدة الفيديو الذي جرى إنشاؤه، والذي يتضمَّن سرداً صوتياً عالي الجودة يشبه الإنسان، عبر صور مختارة بعناية ولقطات من الإنترنت. ويوفر هذا التكامل تجربةً ممتازةً ومبسطةً لإنشاء مقاطع فيديو مثيرة للاهتمام وذات جودة احترافية دون عناء.

• كتابة رموز البرمجة: يمكن لقدرة «تشات جي بي تي» على توليد أكواد (رموز) البرمجة أن تكون فاعلة، وفي بعض الأحيان، صعبة. في كثير من الأحيان، ينجح «تشات جي بي تي» في توليد رموز مفيدة يمكن تطبيقها مباشرة على مهام تتنوع بين البرامج النصية البسيطة إلى البرامج المعقدة. ومع ذلك، في بعض الحالات، قد تتطلب النتيجة الأولية مطالبات أو تنقيحات إضافية، لتتناسب مع الاحتياجات المحددة لتطبيقك أو مشروعك.

كتابة النصوص

• كتابة محتوى قصير وطويل: تعدّ مسألة كتابة المحتوى واحدةً من تخصصات «تشات جي بي تي». ويتضمَّن ذلك المحتويات الطويلة، مثل المقالات وفصول الكتب ودراسات الحالة، وكذلك المحتويات الأقصر، مثل فقرات التوصيف عبر وسائل التواصل الاجتماعي، والقوالب، وعناصر النشرة الإخبارية. أما وضوح المحتوى، فيعتمد على دقة مطالباتك.

وستحتاج إلى مراجعة ما أنجزه «تشات جي بي تي»، والتحقق من صحة الحقائق الواردة فيه؛ لتجنب التورط في سرقة أعمال آخرين، وكذلك تصحيح الأخطاء، وإضفاء طابع إنساني أقوى على المحتوى.

• كتابة توصيف للمنتجات: يمكن استغلال قدرات «تشات جي بي تي» في إنشاء أوصاف منتج ما، بهدف إطلاق حملة عبر وسائل التواصل الاجتماعي، أو إنشاء صفحة منتج على موقع للتجارة الإلكترونية. ويمكن اختبار قدرات «تشات جي بي تي» على إنشاء أوصاف المنتج، عبر تحميل صورة وهمية لعلامة تجارية لأطعمة ، والطلب منه إنشاء وصف يحتوي على معلومات حول الفوائد الصحية والنكهات.

• إعداد خطط السفر: يمكن اختبار «تشات جي بي تي» عبر مطالبته بالتخطيط لرحلة ما - مثلاً إلى جزيرة سيارغاو في الفلبين. وفي أحد السيناريوهات المطروحة، كان من المقرر العمل في الأسبوع الأول في أثناء وجودي في الجزيرة. وفي السيناريو الثاني، كان من المقرر الحصول على إجازة من العمل، مع مرونة كاملة فيما يتعلق بالأنشطة. وقد أنشأ «تشات جي بي تي» جداول مناسبة لكلا السيناريوهين. كما أظهر أن الأماكن التي اقترحها جميعها حقيقية وقائمة حتى اليوم، علاوة على أن جميع الأنشطة قابلة للتنفيذ، وتحظى بشعبية بالفعل بين زوار سيارغاو.

سيناريوهات محتملة... وتلخيصات مختصرة

• تحليل السياق المعقد: بإمكان «تشات جي بي تي» تحليل البيانات السياقية، وطرح اقتراحات، بناءً على سيناريوهات مختلفة، ما يجعله مفيداً لمهام مختلفة. ويجري إنشاء استجاباته بالاعتماد على مجموعة البيانات الضخمة التي يتم تدريبه عليها. وتتألف مجموعة البيانات هذه من مجموعة واسعة من موضوعات وأنماط اللغة البشرية.

بوجه عام، يستخدم «تشات جي بي تي» فهمه الأساسي، لتحديد الأنماط وتكرار سياق المحادثة؛ ما يسمح له بوضع افتراضات حول النية البشرية، وتقديم التوضيحات، والمشارَكة في المناقشات التفاعلية.

ومع ذلك، ليس للنظام وصول في الوقت الفعلي إلى الأحداث الجارية أو معلومات المستخدم الشخصية. وعليه، يتم إنشاء الاستجابات التي يولدها «تشات جي بي تي»، بالاعتماد على المعرفة العامة، بدلاً عن التغييرات التي تقع في الوقت الفعلي. وعليه، يبدو «تشات جي بي تي» مناسباً بشكل خاص للتعامل مع المعلومات الثابتة، والعصف الذهني الإبداعي، وحل المشكلات وشرح المفاهيم بعمق.

• تلخيص النصوص الطويلة: بجانب كتابة المقالات والتوصيفات، يمكن لـ«تشات جي بي تي» المساعدة في تلخيص المحتوى الطويل إلى فقرات أقصر وأسهل في القراءة. فعند الطلب منه تلخيص مقال فإنه يقدِّم بالفعل، في غضون ثوانٍ قليلة، موجزاً للمقال. وتسهم هذه الوظيفة في توفير الوقت، وهي مفيدة بشكل خاص في فهم المعلومات المعقدة أو الشاملة بسرعة.

بجانب ذلك، يساعد «تشات جي بي تي» القُرّاء على التركيز على النقاط المهمة، ما يجعله قيّماً للمحترفين والطلاب والمبدعين، الذين يحتاجون إلى استيعاب المعرفة بسرعة من مصادر متعددة. ويمكن تطبيقه على أوراق بحثية مختلفة، ومقالات تعليمية، وموارد إبداعية.

أدوات لأتمتة المهام

حالياً، يتيح «تشات جي بي تي» إصدارات مخصصة من «جي بي تي» أو مخصصة من المنصة لأنشطة أو تطبيقات محددة. وتحتفظ شركة «أوبن إيه آي» بقائمة متزايدة من صور «جي بي تي» المختلفة. وتتوفر بعض هذه الصور عبر تطبيق «تشات جي بي تي»، ويتم إنشاء البعض الآخر بواسطة المستخدمين لأغراض محددة. وتهدف هذه الأدوات من «جي بي تي» إلى المساعدة في الأنشطة الشائعة، مثل الجدولة، وتدوين الملاحظات، والعصف (الشحذ) الذهني، وتوليد الأفكار، وإنشاء المحتوى، بجانب تحليل الأعمال والبيانات، والبرمجة، والتطوير، والتدريس، والتوجيه، والفنون الإبداعية.

تساعد أدوات «جي بي تي» الإنتاجية على المهام اليومية، مثل الجدولة وإدارة المهام، بينما تساعد أدوات «جي بي تي» المرتبطة بإنشاء المحتوى، الكُتّاب والمسوقين والمبدعين في إنشاء المحتوى.

وتتولى أدوات «جي بي تي» لتحليل الأعمال والبيانات فحص وتقييم الإحصاءات، وجمع المعلومات حول اتجاهات الصناعة، وتقديم توصيات بشأن الخيارات التجارية. وتساعد أدوات «جي بي تي» المخصصة للبرمجة والتطوير المطورين على كتابة عينات التعليمات البرمجية واستكشاف المشكلات وإصلاحها وإنشاء الوثائق الفنية.

كما تيسر أدوات التعليم والتدريس من «جي بي تي» هذه المهمة في موضوعات مختلفة، منها الحساب والعلوم والتاريخ وتعلم اللغات. وتساعد أدوات «جي بي تي» المخصصة للفنون الإبداعية، الفنانين والمصممين والموسيقيين على متابعة الاهتمامات الفنية، مثل التصميم، ومفاهيم الفن، وتأليف الموسيقى والكلمات. ويمكن للمستخدمين تصميم أدوات «جي بي تي» خاصة بهم، عبر تحديد التعليمات وتجميل المستندات والبيانات المناسبة.

الإيجابيات والسلبيات والأسعار

وفيما يلي موجز لأهم إيجابيات وسلبيات هذه الأداة الشهيرة، لمساعدتك على تحديد ما إذا كانت التطبيق الأفضل لاحتياجاتك:

• الإيجابيات، وتشمل:

- يوفر الإصدار المجاني قائمةً موسعةً من تطبيقات «جي بي تي» الإضافية.

- يمكن لقدرات المحتوى التوليدي أن تعاون في تسريع المهام اليومية.

- يمكن تخصيص المحتوى التوليدي عبر إعدادات «تشات جي بي تي» للتخصيص.

• السلبيات، وتشمل:

- لا يمكن للإصدار المجاني الوصول إلى المعلومات على الإنترنت في الوقت الفعلي.

- قد يقع المحتوى التوليدي في خطأ الهلوسة من وقت لآخر.

- يفتقر إلى التعاطف العاطفي مع المواقف المعقدة.

• أسعار «جي بي تي». تُقدِّم الشركة المنتجة إصداراً مجانياً من «تشات جي بي تي» يتيح للمستخدمين الوصول إلى معظم تطبيقاته المتكاملة داخل المنصة. ويتمتع المستخدمون بإمكانية الوصول الكامل إلى «GPT- 4o mini»، بجانب إمكانية الوصول المحدود إلى «GPT- 4».

وتبلغ تكلفة الإصدار المدفوع من «تشات جي بي تي»، 20 دولاراً شهرياً، ويتضمَّن سمات جديدة، بجانب إتاحته الوصول إلى «OpenAI o1 - preview»، و«OpenAI o1 mini»، و«GPT- 4o»، و«GPT- 4»، علاوة على ما يصل إلى 5 رسائل لـ«GPT 4o»، والوصول إلى تحليل البيانات، وتجميل الملفات، وتصفح الويب، وإنشاء الصور، ووضع الصوت المتقدم.