قد لا يبدو غريباً على شخصية جو روغن، الكوميدي الذي تحوّل إلى مدوّن صوتي، الترويج لقهوة منشّطة للرغبة الجنسية لدى الرجال.
ولكن عندما انتشر مقطع فيديو على «تيك توك» أخيراً يظهر روغن وضيفه أندرو هوبرمان يشربان من هذه القهوة، دُهش بعض المشاهدين من أصحاب العينين الثاقبتين... ومنهم هوبرمان.
بعد مشاهدة الإعلان الذي ظهر فيه وهو يمدح القهوة المنشّطة للتستوستيرون مع أنّه لم يفعل ذلك، كتب هوبرمان على تويتر: «نعم، إنّه مزيّف».
فيديوهات مزيفة
كان هذا الإعلان واحداً من عددٍ كبير من الفيديوهات المزيّفة المنتشرة على التواصل الاجتماعي والمصنوعة بتقنية مدعومة بالذكاء الصناعي. يقول الخبراء إنّ صوت روغن بدا مفبركاً باستخدام أداة ذكاء صناعي مصممة لتقليد أصوات المشاهير، بينما تبيّن أنّ التعليقات التي صدرت عن هوبرمان كانت مسحوبة من مقابلة منفصلة.
تُعرف صناعة الفيديوهات المزيّفة ذات الطابع الواقعي غالباً باسم «ديب فيك deepfake» وكانت في الماضي القريب تتطلّب برنامجاً متطوّراً لوضع وجه أحدهم مكان وجه شخص آخر. أمّا اليوم، فتوجد أدوات كثيرة مشابهة لأغراض لاستهلاك اليومي، حتّى إنّها باتت متوفرة على شكل تطبيقات هاتفية مجّانية أو قليلة التكلفة.
تنتشر الفيديوهات المعدَّلة الجديدة – التي يصنعها غالباً معدّو النكات والمسوّقون التجاريون – على مواقع التواصل الاجتماعي كـ«تيك توك» و«تويتر». يطلق الباحثون على هذا النوع من المحتوى اسم «تشيب فيك» (المزيّف الرخيص) لأنّه يتألّف من أصوات المشاهير المستنسخة، وحركات الشفتين المعدّلة لتطابق الصوت، والحوار المكتوب بأسلوبٍ مقنع.
حثّت هذه الفيديوهات والتقنيات المنتشرة باحثي الذكاء الصناعي على التحذير من مخاطرها، وأثارت مخاوف حول جهوزية شركات التواصل الاجتماعي للتعامل مع التزييف الرقمي المتنامي.
بدورها، تحضّر الجهات الرقابية المختصة بالتضليل الإعلامي نفسها لموجة من المواد الرقمية المزيفة التي قد تخدع المشاهدين، أو تصعّب عليهم التمييز بين الحقيقي والمزيّف على شبكة الإنترنت.
وقد اعتبر بريت باريس، أستاذ مساعد في علوم المعلومات في جامعة روتجرز أسهم في ابتكار مصطلح «تشيب فيك»، أنّ «المختلف في الأمر اليوم أنّ الجميع بات قادراً على صناعتها. الأمر لم يعد محصوراً بالأشخاص الذين يملكون تقنيات ومهارات إلكترونية معقّدة. لقد باتت متوفرة في تطبيقات مجّانية».
تلاعب وتضليل
تنتشر كميات هائلة من المحتوى المتلاعب به منذ سنوات على منصات كـ«تيك توك»، صُنعت باستخدام حيلٍ بسيطة كالتوليف الدقيق أو استبدال مقاطع بأخرى. ففي أحد الفيديوهات على «تيك توك»، ظهرت نائبة الرئيس الأميركي كامالا هاريس وهي تقول إنّ جميع الأشخاص الذين أُدخلوا إلى المستشفى بعدوى «كوفيد-19» كانوا من متلقّي اللقاح، بينما الحقيقة هي أنّها قالت إنّهم لم يتلقّوا اللقاح.
رصدت شركة «غرافيكا» المتخصصة في دراسة المعلومات المضلّلة، مقاطع «ديب فيك» تظهر مذيعي أخبار وهميين وزّعتها حسابات موالية للحكومة الصينية تديرها روبوتات في أواخر العام الفائت، لتسجّل أوّل نموذج على استخدام التقنية في حملات مؤثرة داعمة للحكومات.
ولكنّ أدوات عدّة جديدة باتت توفّر تقنيات مشابهة لمستخدمي الإنترنت العاديين، وتمنح الكوميديين والمنتسبين الحزبيين فرصة صناعة مقاطعهم المزيفة المقنعة الخاصة.
انتشر الشهر الفائت مقطع فيديو يظهر الرئيس جو بايدن وهو يعلن مسودة قانون متعلّقة بالحرب بين روسيا وأوكرانيا. صمم هذا الفيديو الفريق المنتج لمدوّنة «هيومن إيفنتس ديلي» الصوتية التي يديرها جاك بوسوبييك، المؤثر اليميني المعروف بنشره لنظريات المؤامرة.
في مقطع مصوّر لشرح الفيديو، قال بوسوبييك إنّ فريقه صمم المحتوى باستخدام تقنية ذكاء صناعي. وكانت حساب «باتريوت أواسيس» المحافظ على «تويتر» قد أعاد نشر الفيديو المزيّف في تغريدة، مستخدماً عبارة «خبر عاجل» دون التنويه بأنّ المقطع مزيّف، وحصدت هذه التغريدة أكثر من 8 ملايين مشاهدة.
يستخدم كثير من هذه المقاطع المصوّرة التي تتضمّن أصواتاً مفبركة تقنية من تطوير شركة «إيلفن لابز» الأميركية الناشئة التي شارك في تأسيسها مهندسٌ سابق من «غوغل». وكانت الشركة قد أطلقت في نوفمبر (تشرين الثاني) أداة لاستنساخ الصوت يمكن تدريبها لتقليد الأصوات في غضون ثوانٍ.
جذبت «إيلفن لابز» الانتباه الشهر الفائت بعدما استخدم «فورتشان» (4chan) -موقع لنشر الرسائل والصور يشتهر بمحتواه العنصري والمؤامرتي- الأداة لمشاركة رسائل كراهية. فقد عمد أحد مستخدمي الموقع إلى ابتكار تسجيل صوتي لنصٍّ معادٍ للسامية استعمل فيه صوتاً آلياً يقلّد صوت الممثّلة إيما واتسون.
في هذا السياق، قالت الشركة على حسابها على «تويتر» إنّها تعتزم تقديم ضمانات جديدة، كحصر أداة استنساخ الصوت بالحسابات المدفوعة، بالإضافة إلى تأمين أداة رصد جديدة للذكاء الصناعي. ولكنّ مستخدمي «فورتشان» ادعوا أنّهم يستطيعون ابتكار أداتهم الخاصة للاستنساخ الصوتي باستخدام رمزٍ مفتوح المصدر، ونشر عروضٍ شبيهة بالمواد الصوتية التي تنتجها «إيلفن لابز».
استنساخ الأصوات
رجّح خبراء يدرسون تقنية «ديب فيك» أنّ الإعلان المزيّف الذي يظهر فيه روغن وهوبرمان صُنع باستخدام برنامج لاستنساخ الأصوات، ولكنّهم لم يتمكّنوا من تحديده. وتجدر الإشارة إلى أنّ التسجيل الصوتي العائد لروغن دُمج مع مقابلة حقيقية أجراها هوبرمان لمناقشة موضوع التستوستيرون.
ولكنّ النتائج في هذا المقطع لم تكن مثالية، حيث إن مقطع روغن كان مأخوذاً من مقابلة أجراها مع لاعب بلياردو محترف في ديسمبر (كانون الأول) ولا تمتّ إلى محتوى الفيديو المزيف بصلة. إضافة إلى ذلك، يُلحظ غياب التطابق بين حركات فم روغن والمقطع الصوتي، فضلاً عن أنّ الأصوات الصادرة عنه بدت غير طبيعية في بعض الأحيان. لم يتّضح ما إذا كان هذا الفيديو قد أقنع مستخدمي «تيك توك» أم لا، ولكنّه بالتأكيد جذب اهتماماً أكبر بكثير بعد وسمه بالتزييف.
تحظر سياسة منصّة «تيك توك» المواد الرقمية المزيفة التي «تضلّل المستخدمين بتشويه حقيقة الأحداث وتسبب ضرراً بارزاً لموضوع الفيديو، وأشخاص آخرين، والمجتمع». تخلّصت المنصّة من كثير من الفيديوهات التي بلّغت عنها صحيفة «نيويورك تايمز»، وعمد «تويتر» بدوره إلى إزالة بعض المقاطع.
في هذا السياق، تبدي الجهات الفيدرالية المشرفة على تنظيم القاعدة القانونية بطئاً في الاستجابة. فقد طلب قانونٌ فيدرالي واحدٌ في عام 2019 تقريراً عن استخدام تقنيات «ديب فيك» كأسلحة من قبل الأجانب، وطلب من الوكالات الحكومية إشعار الكونغرس إذا ما كانت هذه التقنيات قد استهدفت الانتخابات في الولايات المتحدة، وأطلق جائزة لتشجيع البحوث حول أدوات لرصد مواد «ديب فيك».
وقال رافيت دوتان، وهو باحث في مرحلة ما بعد الدكتوراه يدير مختبر «كولابوريتف آي.إي. ريسبونسبليتي لاب» في جامعة بيتسبرغ: «لا يمكننا انتظار سنتين لتمرير القوانين؛ لأنّ الضرر قد يصبح كبيراً جداً حتّى ذلك الوقت. لدينا انتخابات قادمة هنا في الولايات المتحدة، وهذا الأمر سيسبب مشكلة».
* خدمة «نيويورك تايمز»
فيديوهات مزيفة أسهل صنعاً وأقلّ تكلفةً
توظف نظم ذكاء صناعي جديدة
فيديوهات مزيفة أسهل صنعاً وأقلّ تكلفةً
لم تشترك بعد
انشئ حساباً خاصاً بك لتحصل على أخبار مخصصة لك ولتتمتع بخاصية حفظ المقالات وتتلقى نشراتنا البريدية المتنوعة