«مايكروسوفت» تطوّر أداة ذكاء اصطناعي تحوّل الصورة إلى «وجه ناطق»

من شركة «مايكروسوفت»

الأداة الجديدة يمكنها تحويل الصور إلى فيديو (مايكروسوفت)
الأداة الجديدة يمكنها تحويل الصور إلى فيديو (مايكروسوفت)
TT

«مايكروسوفت» تطوّر أداة ذكاء اصطناعي تحوّل الصورة إلى «وجه ناطق»

الأداة الجديدة يمكنها تحويل الصور إلى فيديو (مايكروسوفت)
الأداة الجديدة يمكنها تحويل الصور إلى فيديو (مايكروسوفت)

ابتكر باحثون من شركة «مايكروسوفت» أداة ذكاء اصطناعي قادرة على تحويل صورة وجه ومقطع صوتي إلى فيديو واقعي جداً لـ«وجه يتكلّم»، بحسب وثيقة نشرتها شركة التكنولوجيا الكبرى هذا الأسبوع.

وأشارت الشركة إلى أن «هدف الأداة لا يتمثل في إنشاء محتوى بقصد التضليل أو الخداع»، لافتة إلى أنّ «الأداة، وعلى غرار تقنيات إنشاء محتوى أخرى، قد تُستخدم لأهداف مسيئة، وانتحال صفة أيّ كان».

ويثير النمو السريع للذكاء الاصطناعي التوليدي، الذي يتيح بسهولة إنتاج مختلف أنواع المحتوى (نصوص، وصور، وأصوات...) بجودة عالية جداً، مخاوف كثيرة، خصوصاً فيما يتعلق بالاستغلال لأغراض الاحتيال، والتضليل، حسبما أفادت وكالة «الصحافة الفرنسية».

وأكّدت «مايكروسوفت» أن «بحثنا يركز على (...) الصور الرمزية الافتراضية (أفاتار)، بهدف الاستخدام الإيجابي»، مضيفة «نعارض أي سلوك يهدف إلى إنشاء محتوى مضلل، أو ضار».

ولا تعتزم شركة التكنولوجيا، وهي مستثمر رئيسي في «أوبن إيه آي» مبتكرة برنامج «تشات جي بي تي»، إتاحة الأداة الجديدة، أو تقديم معلومات تقنية «طالما أننا غير متأكدين من أنّ الأداة ستُستخدم بشكل مسؤول بحسب القوانين المعمول بها».

ويلتقط البرنامج المسمى «فاسا - 1» (VASA - 1) صورة وجه بسيطة، ويسجل مقطعًا صوتيًا، ويحولهما إلى شريط فيديو يظهر وجهًا يتحرك، ويتكلم بطريقة واقعية جداً.

وتعمل شركات أخرى على هذه التقنية، على غرار «رَنواي» Runway، إحدى الشركات المتخصصة في الذكاء الاصطناعي التوليدي للفيديو. وأنشأ باحثون من «غوغل» برنامج ذكاء اصطناعي مسمى «فلوغر» قادراً على إنشاء مقاطع فيديو واقعية لوجوه ناطقة.

وأشارت «مايكروسوفت» إلى أنّ فوائد ابتكار هذه الأداة «مثل تعزيز المساواة في مجال التعليم، ومساعدة مَن يعانون صعوبات في التواصل، وتوفير الدعم العلاجي لمَن يحتاجونه»، تبرر العمل عليها.


مقالات ذات صلة

«تلغرام»... هل هو بوابة لـ«الإنترنت المظلم» في جيبك؟

تكنولوجيا شعار تطبيق «تلغرام» (رويترز)

«تلغرام»... هل هو بوابة لـ«الإنترنت المظلم» في جيبك؟

أشعل اعتقال بافيل دوروف، مالك ومؤسس «تلغرام»، في فرنسا نقاشاً حول الإشراف على التطبيق ومشكلاته مع قوات إنفاذ القانون.

«الشرق الأوسط» (لندن)
الاقتصاد جناح شركة «تمارا» التي توفر خدمة «اشترِ الآن وادفع لاحقاً» في السعودية والخليج بمعرض «ليب24» بالرياض (إكس)

«الفنتك» تغزو الهواتف... من السداد السريع إلى استثمار الأموال

تطبيقات التكنولوجيا المالية أصبحت جزءاً لا يمكن الاستغناء عنه في حياة الجيل الجديد، وحددت «فنتك السعودية» 9 مجالات لهذه التطبيقات.

عبير حمدي (الرياض)
تكنولوجيا  «ميتا إيه آي» القادرة على الإجابة على أسئلة المستخدمين بلغة بسيطة باتت تضم 400 مليون مستخدم شهرياً (رويترز)

منصات الذكاء الاصطناعي التوليدي... تنافس ونمو متسارع

يستمر استخدام منصات الذكاء الاصطناعي التوليدي من جانب عامة الناس في النمو بوتيرة متسارعة، على ما تظهر أحدث الأرقام لجهات فاعلة رئيسية في القطاع.

«الشرق الأوسط» (نيويورك)
تكنولوجيا هذه الإضافات متاحة باللغة الإنجليزية فقط وعلى عدد محدود من الأجهزة (شاترستوك)

«غوغل» تقدم ملحقين جديدين لـ«جيميناي» مصممين لهواتف «بيكسل 9»

هذه الميزات حصرية حالياً لأجهزة «بيكسل» الأحدث.

نسيم رمضان (لندن)
تكنولوجيا يعد «GPT-4o mini» نموذج ذكاء اصطناعي صغيراً فعالاً من حيث تكلفة العملاء (شاترستوك)

200 مليون مستخدم نشط في «تشات جي بي تي» أسبوعياً

صرحت شركة «أوبن إيه آي (OpenAI)»،الناشئة للذكاء الاصطناعي، بأن روبوت الدردشة الخاص بها «تشات جي بي تي (ChatGPT)» لديه الآن أكثر من 200 مليون مستخدم نشط أسبوعيا.

نسيم رمضان (لندن)

تحويل الأفكار إلى كلام... بارقة أمل لمرضى التصلب الجانبي الضموري

كيسي هاريل رجل يبلغ من العمر 45 عاماً يعاني من التصلب الجانبي الضموري (UC Davis Health)
كيسي هاريل رجل يبلغ من العمر 45 عاماً يعاني من التصلب الجانبي الضموري (UC Davis Health)
TT

تحويل الأفكار إلى كلام... بارقة أمل لمرضى التصلب الجانبي الضموري

كيسي هاريل رجل يبلغ من العمر 45 عاماً يعاني من التصلب الجانبي الضموري (UC Davis Health)
كيسي هاريل رجل يبلغ من العمر 45 عاماً يعاني من التصلب الجانبي الضموري (UC Davis Health)

في خطوة تعد من أبرز التطورات في مجال التكنولوجيا العصبية، طور فريق من العلماء والباحثين في جامعة كاليفورنيا، ديفيس (UC Davis Health) واجهة دماغ - حاسوب (Brain - Computer Interface - BCI) جديدة تهدف إلى مساعدة المرضى الذين يعانون من الشلل أو الأمراض العصبية، مثل التصلب الجانبي الضموري (ALS)، على استعادة قدرتهم على التواصل باستخدام أدمغتهم مباشرةً. تعتمد هذه التقنية على تحويل الإشارات العصبية في الدماغ إلى نصوص منطوقة، مما يمكّن المرضى من «التحدث» بأفكارهم بدقة تصل إلى 97.5 في المائة.

ما هو التصلب الجانبي الضموري (ALS)؟

التصلب الجانبي الضموري، المعروف أيضاً باسم مرض «لو جيريج»، هو مرض عصبي يؤدي إلى تدهور الخلايا العصبية التي تتحكم في الحركة في الجسم. هذا التدهور يؤدي تدريجياً إلى فقدان القدرة على الحركة، بما في ذلك الوقوف، والمشي، واستخدام اليدين، وحتى فقدان القدرة على التحكم في العضلات المستخدمة في الكلام، مما يؤدي إلى فقدان القدرة على النطق المفهوم.

التقنية الجديدة وكيفية عملها

التقنية الجديدة التي طورتها جامعة كاليفورنيا تعتمد على زرع مستشعرات في الدماغ، قادرة على تسجيل الإشارات العصبية عند محاولة المريض التحدث. ثم يتم تحويل هذه الإشارات إلى نص يظهر على شاشة الكومبيوتر، ويمكن قراءة النص بصوت عالٍ باستخدام صوت مصطنع يُشبه صوت المريض قبل فقدان قدرته على الكلام.

في إحدى الحالات التي تم توثيقها، تم زرع أربع مصفوفات من الأقطاب الدقيقة في منطقة من الدماغ، وهي مسؤولة عن تنسيق حركات الكلام. هذه الأقطاب سجلت نشاط الدماغ من 256 قطباً قشرياً، مما سمح للنظام بترجمة الإشارات العصبية إلى كلمات يمكن فهمها ونطقها بواسطة الكومبيوتر.

نتائج الدراسة والتجارب السريرية

أُجريت التجارب السريرية لهذه التقنية على مريض يدعى «كيسي هاريل»، رجل يبلغ من العمر 45 عاماً يعاني من «ALS «. في غضون دقائق من تفعيل النظام، تمكّن كيسي من التواصل بأفكاره باستخدام الكلمات. أشارت النتائج إلى أن النظام حقق دقة تصل إلى 99.6 في المائة في الجلسة الأولى باستخدام مفردات تحتوي على 50 كلمة فقط. وعندما تم توسيع حجم المفردات إلى 125 ألف كلمة، استمرت الدقة عند 97.5 في المائة بعد ساعة إضافية من التدريب.

تأثير التكنولوجيا على جودة الحياة

أشارت التقارير إلى أن كيسي استخدم النظام لأكثر من 248 ساعة من المحادثات ذاتية الإيقاع، سواء كان ذلك شخصياً أو عبر دردشات الفيديو. تتيح هذه التكنولوجيا الجديدة للمرضى الذين فقدوا قدرتهم على الكلام بسبب الشلل أو الأمراض العصبية التواصل مرة أخرى مع أحبائهم وأصدقائهم ومقدمي الرعاية، مما يساهم في تحسين جودة حياتهم، وتقليل العزلة الاجتماعية التي قد يسببها فقدان القدرة على التواصل.

يعدّ تطوير واجهة الدماغ - الحاسوب لتحويل الأفكار إلى كلام خطوةً نوعية نحو تحسين جودة حياة الأشخاص الذين يعانون من أمراض عصبية معقدة مثل التصلب الجانبي الضموري. تقدم هذه التقنية أملاً جديداً في مجال الطب العصبي، وتعد بإحداث تغيير حقيقي في حياة المرضى وأسرهم. مع المزيد من البحث والتطوير، يمكن أن نشهد في المستقبل القريب تطبيقات أوسع لهذه التكنولوجيا المبتكرة في علاج حالات مرضية أخرى.