برنامج إلكتروني باستطاعته تزوير كلام المشاركين في مقاطع الفيديو

يوهم المشاهدين بعروض كاذبة

برنامج إلكتروني باستطاعته تزوير كلام المشاركين في مقاطع الفيديو
TT

برنامج إلكتروني باستطاعته تزوير كلام المشاركين في مقاطع الفيديو

برنامج إلكتروني باستطاعته تزوير كلام المشاركين في مقاطع الفيديو

كن متأنيا، وحاذر في تصديق ما تشاهده عيناك من عروض الفيديو، التي يمكن غشها بكل بساطة بعد أن عرض باحثون كيفية تحوير مقطع فيديو لشخص يتكلم في الزمن الفعلي، بعد إضفاء كلام لا يقوله الشخص إطلاقا، على لسانه!
وفي فيديو جديد أظهر الباحثون لكيفية قيامهم بتحرير، أو بالأحرى غش، مقاطع مرئية مصورة من «يوتيوب» بهدف تغيير حركات الفم. ووظفوا في العملية كاميرا إنترنتية بهدف رصد وتتبع تعابير وجه الشخص الظاهر في الفيديو ثم قاموا بوضع هذه التعابير على وجه شخص آخر يظهر في فيديو آخر يتحدث في الزمن الفعلي.
وطور الباحثون برنامجا يولد شكلا تجسيميا بالأبعاد الثلاثية لوجه المتحدث يمكن وضعه كلية على وجه الشخص المستهدف. ويمكن لهذه الوسيلة تحقيق أهدافها حتى وإن كان الشخص له شعر على الوجه أو كان وجهه مائلا إلى السمرة أو السواد، إلا أنها لا تقوم بمهمتها إن كان الشعر طويلا بحيث يغطي الفم.
وقال ماثياس نيسنر البروفسور في جامعة ستانفورد الأميركية الذي شارك في البحث الذي أجرته جامعة ارلانغن - نورمبرغ ومعهد ماكس بلانك في ألمانيا، إن على أفراد الجمهور أن يكونوا حذرين في تصديق أي أحاديث في العروض المرئية، نتيجة تطوير مثل هذه التقنية.
ونقلت عنه صحيفة «واشنطن بوست» أن «الجمهور يمكنه معرفة الرسالة الإلكترونية المزيفة مثلا. أما هذا (التحوير الفيديوي) فهو شيء مماثل إلا أن الفرق الوحيد هو أن على الجمهور أن يعرف أنه موجود». ويقترح الباحث على المشاهدين الذي يشكون في وجود فيديوهات مغشوشة، التدقيق في الاختلافات وعدم التوافق في ظروف الإضاءة لمقاطع الفيديو. ولا تظهر هذه الاختلافات بشكل جلي في المقاطع المصورة بإضاءة رديئة إلا أنه يمكن رؤيتها في المقاطع العالية الوضوح.
وتوقع الباحث أن تطور في المستقبل تطبيقات خاصة بالهواتف الجوالة يمكنها فرز الفيديوهات الحقيقية عن المزيفة. ويعكف العلماء حاليا على تسويق التقنية المطورة لاستخدامها في العروض التلفزيونية التي تعرض بلغات أخرى، وذلك بتغيير تعابير وجوه الممثلين بحيث تتلاءم مع الحديث الذين يتفوهون به بلغة أخرى بعد دبلجة العروض.



الذكاء الصناعي يقرأ الأفكار وينصّها

فك تشفير إعادة بناء الكلام باستخدام بيانات مسح الرنين المغناطيسي (جامعة تكساس)
فك تشفير إعادة بناء الكلام باستخدام بيانات مسح الرنين المغناطيسي (جامعة تكساس)
TT

الذكاء الصناعي يقرأ الأفكار وينصّها

فك تشفير إعادة بناء الكلام باستخدام بيانات مسح الرنين المغناطيسي (جامعة تكساس)
فك تشفير إعادة بناء الكلام باستخدام بيانات مسح الرنين المغناطيسي (جامعة تكساس)

طُوّر جهاز فك ترميز يعتمد على الذكاء الصناعي، قادر على ترجمة نشاط الدماغ إلى نص متدفق باستمرار، في اختراق يتيح قراءة أفكار المرء بطريقة غير جراحية، وذلك للمرة الأولى على الإطلاق، حسب صحيفة «الغارديان» البريطانية.
وبمقدور جهاز فك الترميز إعادة بناء الكلام بمستوى هائل من الدقة، أثناء استماع الأشخاص لقصة ما - أو حتى تخيلها في صمت - وذلك بالاعتماد فقط على مسح البيانات بالتصوير بالرنين المغناطيسي الوظيفي فقط.
وجدير بالذكر أن أنظمة فك ترميز اللغة السابقة استلزمت عمليات زراعة جراحية. ويثير هذا التطور الأخير إمكانية ابتكار سبل جديدة لاستعادة القدرة على الكلام لدى المرضى الذين يجابهون صعوبة بالغة في التواصل، جراء تعرضهم لسكتة دماغية أو مرض العصبون الحركي.
في هذا الصدد، قال الدكتور ألكسندر هوث، عالم الأعصاب الذي تولى قيادة العمل داخل جامعة تكساس في أوستن: «شعرنا بالصدمة نوعاً ما؛ لأنه أبلى بلاءً حسناً. عكفت على العمل على هذا الأمر طيلة 15 عاماً... لذلك كان الأمر صادماً ومثيراً عندما نجح أخيراً».
ويذكر أنه من المثير في هذا الإنجاز أنه يتغلب على قيود أساسية مرتبطة بالتصوير بالرنين المغناطيسي الوظيفي، وترتبط بحقيقة أنه بينما يمكن لهذه التكنولوجيا تعيين نشاط الدماغ إلى موقع معين بدقة عالية على نحو مذهل، يبقى هناك تأخير زمني كجزء أصيل من العملية، ما يجعل تتبع النشاط في الوقت الفعلي في حكم المستحيل.
ويقع هذا التأخير لأن فحوصات التصوير بالرنين المغناطيسي الوظيفي تقيس استجابة تدفق الدم لنشاط الدماغ، والتي تبلغ ذروتها وتعود إلى خط الأساس خلال قرابة 10 ثوانٍ، الأمر الذي يعني أنه حتى أقوى جهاز فحص لا يمكنه تقديم أداء أفضل من ذلك.
وتسبب هذا القيد الصعب في إعاقة القدرة على تفسير نشاط الدماغ استجابة للكلام الطبيعي؛ لأنه يقدم «مزيجاً من المعلومات» منتشراً عبر بضع ثوانٍ.
ورغم ذلك، نجحت نماذج اللغة الكبيرة - المقصود هنا نمط الذكاء الصناعي الذي يوجه «تشات جي بي تي» - في طرح سبل جديدة. وتتمتع هذه النماذج بالقدرة على تمثيل المعنى الدلالي للكلمات بالأرقام، الأمر الذي يسمح للعلماء بالنظر في أي من أنماط النشاط العصبي تتوافق مع سلاسل كلمات تحمل معنى معيناً، بدلاً من محاولة قراءة النشاط كلمة بكلمة.
وجاءت عملية التعلم مكثفة؛ إذ طُلب من ثلاثة متطوعين الاستلقاء داخل جهاز ماسح ضوئي لمدة 16 ساعة لكل منهم، والاستماع إلى مدونات صوتية. وجرى تدريب وحدة فك الترميز على مطابقة نشاط الدماغ للمعنى باستخدام نموذج لغة كبير أطلق عليه «جي بي تي - 1»، الذي يعتبر سلف «تشات جي بي تي».