فيديوهات مزيفة أسهل صنعاً وأقلّ تكلفةً

قد لا يبدو غريباً على شخصية جو روغن، الكوميدي الذي تحوّل إلى مدوّن صوتي، الترويج لقهوة منشّطة للرغبة الجنسية لدى الرجال.
ولكن عندما انتشر مقطع فيديو على «تيك توك» أخيراً يظهر روغن وضيفه أندرو هوبرمان يشربان من هذه القهوة، دُهش بعض المشاهدين من أصحاب العينين الثاقبتين... ومنهم هوبرمان.
بعد مشاهدة الإعلان الذي ظهر فيه وهو يمدح القهوة المنشّطة للتستوستيرون مع أنّه لم يفعل ذلك، كتب هوبرمان على تويتر: «نعم، إنّه مزيّف».
فيديوهات مزيفة
كان هذا الإعلان واحداً من عددٍ كبير من الفيديوهات المزيّفة المنتشرة على التواصل الاجتماعي والمصنوعة بتقنية مدعومة بالذكاء الصناعي. يقول الخبراء إنّ صوت روغن بدا مفبركاً باستخدام أداة ذكاء صناعي مصممة لتقليد أصوات المشاهير، بينما تبيّن أنّ التعليقات التي صدرت عن هوبرمان كانت مسحوبة من مقابلة منفصلة.
تُعرف صناعة الفيديوهات المزيّفة ذات الطابع الواقعي غالباً باسم «ديب فيك deepfake» وكانت في الماضي القريب تتطلّب برنامجاً متطوّراً لوضع وجه أحدهم مكان وجه شخص آخر. أمّا اليوم، فتوجد أدوات كثيرة مشابهة لأغراض لاستهلاك اليومي، حتّى إنّها باتت متوفرة على شكل تطبيقات هاتفية مجّانية أو قليلة التكلفة.
تنتشر الفيديوهات المعدَّلة الجديدة – التي يصنعها غالباً معدّو النكات والمسوّقون التجاريون – على مواقع التواصل الاجتماعي كـ«تيك توك» و«تويتر». يطلق الباحثون على هذا النوع من المحتوى اسم «تشيب فيك» (المزيّف الرخيص) لأنّه يتألّف من أصوات المشاهير المستنسخة، وحركات الشفتين المعدّلة لتطابق الصوت، والحوار المكتوب بأسلوبٍ مقنع.
حثّت هذه الفيديوهات والتقنيات المنتشرة باحثي الذكاء الصناعي على التحذير من مخاطرها، وأثارت مخاوف حول جهوزية شركات التواصل الاجتماعي للتعامل مع التزييف الرقمي المتنامي.
بدورها، تحضّر الجهات الرقابية المختصة بالتضليل الإعلامي نفسها لموجة من المواد الرقمية المزيفة التي قد تخدع المشاهدين، أو تصعّب عليهم التمييز بين الحقيقي والمزيّف على شبكة الإنترنت.
وقد اعتبر بريت باريس، أستاذ مساعد في علوم المعلومات في جامعة روتجرز أسهم في ابتكار مصطلح «تشيب فيك»، أنّ «المختلف في الأمر اليوم أنّ الجميع بات قادراً على صناعتها. الأمر لم يعد محصوراً بالأشخاص الذين يملكون تقنيات ومهارات إلكترونية معقّدة. لقد باتت متوفرة في تطبيقات مجّانية».
تلاعب وتضليل
تنتشر كميات هائلة من المحتوى المتلاعب به منذ سنوات على منصات كـ«تيك توك»، صُنعت باستخدام حيلٍ بسيطة كالتوليف الدقيق أو استبدال مقاطع بأخرى. ففي أحد الفيديوهات على «تيك توك»، ظهرت نائبة الرئيس الأميركي كامالا هاريس وهي تقول إنّ جميع الأشخاص الذين أُدخلوا إلى المستشفى بعدوى «كوفيد-19» كانوا من متلقّي اللقاح، بينما الحقيقة هي أنّها قالت إنّهم لم يتلقّوا اللقاح.
رصدت شركة «غرافيكا» المتخصصة في دراسة المعلومات المضلّلة، مقاطع «ديب فيك» تظهر مذيعي أخبار وهميين وزّعتها حسابات موالية للحكومة الصينية تديرها روبوتات في أواخر العام الفائت، لتسجّل أوّل نموذج على استخدام التقنية في حملات مؤثرة داعمة للحكومات.
ولكنّ أدوات عدّة جديدة باتت توفّر تقنيات مشابهة لمستخدمي الإنترنت العاديين، وتمنح الكوميديين والمنتسبين الحزبيين فرصة صناعة مقاطعهم المزيفة المقنعة الخاصة.
انتشر الشهر الفائت مقطع فيديو يظهر الرئيس جو بايدن وهو يعلن مسودة قانون متعلّقة بالحرب بين روسيا وأوكرانيا. صمم هذا الفيديو الفريق المنتج لمدوّنة «هيومن إيفنتس ديلي» الصوتية التي يديرها جاك بوسوبييك، المؤثر اليميني المعروف بنشره لنظريات المؤامرة.
في مقطع مصوّر لشرح الفيديو، قال بوسوبييك إنّ فريقه صمم المحتوى باستخدام تقنية ذكاء صناعي. وكانت حساب «باتريوت أواسيس» المحافظ على «تويتر» قد أعاد نشر الفيديو المزيّف في تغريدة، مستخدماً عبارة «خبر عاجل» دون التنويه بأنّ المقطع مزيّف، وحصدت هذه التغريدة أكثر من 8 ملايين مشاهدة.
يستخدم كثير من هذه المقاطع المصوّرة التي تتضمّن أصواتاً مفبركة تقنية من تطوير شركة «إيلفن لابز» الأميركية الناشئة التي شارك في تأسيسها مهندسٌ سابق من «غوغل». وكانت الشركة قد أطلقت في نوفمبر (تشرين الثاني) أداة لاستنساخ الصوت يمكن تدريبها لتقليد الأصوات في غضون ثوانٍ.
جذبت «إيلفن لابز» الانتباه الشهر الفائت بعدما استخدم «فورتشان» (4chan) -موقع لنشر الرسائل والصور يشتهر بمحتواه العنصري والمؤامرتي- الأداة لمشاركة رسائل كراهية. فقد عمد أحد مستخدمي الموقع إلى ابتكار تسجيل صوتي لنصٍّ معادٍ للسامية استعمل فيه صوتاً آلياً يقلّد صوت الممثّلة إيما واتسون.
في هذا السياق، قالت الشركة على حسابها على «تويتر» إنّها تعتزم تقديم ضمانات جديدة، كحصر أداة استنساخ الصوت بالحسابات المدفوعة، بالإضافة إلى تأمين أداة رصد جديدة للذكاء الصناعي. ولكنّ مستخدمي «فورتشان» ادعوا أنّهم يستطيعون ابتكار أداتهم الخاصة للاستنساخ الصوتي باستخدام رمزٍ مفتوح المصدر، ونشر عروضٍ شبيهة بالمواد الصوتية التي تنتجها «إيلفن لابز».
استنساخ الأصوات
رجّح خبراء يدرسون تقنية «ديب فيك» أنّ الإعلان المزيّف الذي يظهر فيه روغن وهوبرمان صُنع باستخدام برنامج لاستنساخ الأصوات، ولكنّهم لم يتمكّنوا من تحديده. وتجدر الإشارة إلى أنّ التسجيل الصوتي العائد لروغن دُمج مع مقابلة حقيقية أجراها هوبرمان لمناقشة موضوع التستوستيرون.
ولكنّ النتائج في هذا المقطع لم تكن مثالية، حيث إن مقطع روغن كان مأخوذاً من مقابلة أجراها مع لاعب بلياردو محترف في ديسمبر (كانون الأول) ولا تمتّ إلى محتوى الفيديو المزيف بصلة. إضافة إلى ذلك، يُلحظ غياب التطابق بين حركات فم روغن والمقطع الصوتي، فضلاً عن أنّ الأصوات الصادرة عنه بدت غير طبيعية في بعض الأحيان. لم يتّضح ما إذا كان هذا الفيديو قد أقنع مستخدمي «تيك توك» أم لا، ولكنّه بالتأكيد جذب اهتماماً أكبر بكثير بعد وسمه بالتزييف.
تحظر سياسة منصّة «تيك توك» المواد الرقمية المزيفة التي «تضلّل المستخدمين بتشويه حقيقة الأحداث وتسبب ضرراً بارزاً لموضوع الفيديو، وأشخاص آخرين، والمجتمع». تخلّصت المنصّة من كثير من الفيديوهات التي بلّغت عنها صحيفة «نيويورك تايمز»، وعمد «تويتر» بدوره إلى إزالة بعض المقاطع.
في هذا السياق، تبدي الجهات الفيدرالية المشرفة على تنظيم القاعدة القانونية بطئاً في الاستجابة. فقد طلب قانونٌ فيدرالي واحدٌ في عام 2019 تقريراً عن استخدام تقنيات «ديب فيك» كأسلحة من قبل الأجانب، وطلب من الوكالات الحكومية إشعار الكونغرس إذا ما كانت هذه التقنيات قد استهدفت الانتخابات في الولايات المتحدة، وأطلق جائزة لتشجيع البحوث حول أدوات لرصد مواد «ديب فيك».
وقال رافيت دوتان، وهو باحث في مرحلة ما بعد الدكتوراه يدير مختبر «كولابوريتف آي.إي. ريسبونسبليتي لاب» في جامعة بيتسبرغ: «لا يمكننا انتظار سنتين لتمرير القوانين؛ لأنّ الضرر قد يصبح كبيراً جداً حتّى ذلك الوقت. لدينا انتخابات قادمة هنا في الولايات المتحدة، وهذا الأمر سيسبب مشكلة».
* خدمة «نيويورك تايمز»

آراء متفاوتة

ولكي تكون برامج الذكاء الاصطناعي قادرة على إنتاج مختلف أنواع المحتوى بناء على طلب بسيط بلغة يومية، تنبغي تغذيتها بكمية مزدادة من البيانات.

وبعد التواصل مع دار النشر أكدت الأخيرة الموافقة على العملية. وأشارت إلى أنّ «(هاربر كولينز) أبرمت عقداً مع إحدى شركات التكنولوجيا المتخصصة بالذكاء الاصطناعي للسماح بالاستخدام المحدود لكتب معينة (...) بهدف تدريب نماذج الذكاء الاصطناعي وتحسين أدائها».

وتوضّح دار النشر أيضاً أنّ العقد «ينظّم بشكل واضح ما تنتجه النماذج مع احترامها حقوق النشر».

ولاقى هذا العرض آراء متفاوتة في قطاع النشر، إذ رفضه كتّاب مثل الأميركي دانييل كيبلسميث الذي قال في منشور عبر منصة «بلوسكاي» للتواصل الاجتماعي: «من المحتمل أن أقبل بذلك مقابل مليار دولار، مبلغ يتيح لي التوقف عن العمل، لأن هذا هو الهدف النهائي من هذه التكنولوجيا».

هامش تفاوض محدود

ومع أنّ «هاربر كولينز» هي إحدى كبرى دور النشر التي أبرمت عقوداً من هذا النوع، فإنّها ليست الأولى. فدار «ويلي» الأميركية الناشرة للكتب العلمية أتاحت لشركة تكنولوجية كبيرة «محتوى كتب أكاديمية ومهنية منشورة لاستخدام محدد في نماذج التدريب، مقابل 23 مليون دولار»، كما قالت في مارس (آذار) عند عرض نتائجها المالية.

ويسلط هذا النوع من الاتفاقيات الضوء على المشاكل المرتبطة بتطوير الذكاء الاصطناعي التوليدي، الذي يتم تدريبه على كميات هائلة من البيانات تُجمع من الإنترنت، وهو ما قد يؤدي إلى انتهاكات لحقوق الطبع والنشر.

وترى جادا بيستيلي، رئيسة قسم الأخلاقيات لدى «هاغينغ فايس»، وهي منصة فرنسية - أميركية متخصصة بالذكاء الاصطناعي، أنّ هذا الإعلان يشكل خطوة إلى الأمام، لأنّ محتوى الكتب يدرّ أموالاً. لكنها تأسف لأنّ هامش التفاوض محدود للمؤلفين.

وتقول: «ما سنراه هو آلية لاتفاقيات ثنائية بين شركات التكنولوجيا ودور النشر أو أصحاب حقوق الطبع والنشر، في حين ينبغي أن تكون المفاوضات أوسع لتشمل أصحاب العلاقة».

ويقول المدير القانوني لاتحاد النشر الفرنسي (SNE) جوليان شوراكي: «نبدأ من مكان بعيد جداً»، مضيفاً: «إنّه تقدم، فبمجرّد وجود اتفاق يعني أن حواراً ما انعقد وثمة رغبة في تحقيق توازن فيما يخص استخدام البيانات مصدراً، التي تخضع للحقوق والتي ستولد مبالغ».

مواد جديدة

وفي ظل هذه المسائل، بدأ الناشرون الصحافيون أيضاً في تنظيم هذا الموضوع. ففي نهاية 2023، أطلقت صحيفة «نيويورك تايمز» الأميركية اليومية ملاحقات ضد شركة «أوبن إيه آي» مبتكرة برنامج «تشات جي بي تي» وضد «مايكروسوفت» المستثمر الرئيسي فيها، بتهمة انتهاك حقوق النشر. وقد أبرمت وسائل إعلام أخرى اتفاقيات مع «أوبن إيه آي».

وربما لم يعد أمام شركات التكنولوجيا أي خيار لتحسين منتجاتها سوى باعتماد خيارات تُلزمها بدفع أموال، خصوصاً مع بدء نفاد المواد الجديدة لتشغيل النماذج.

وأشارت الصحافة الأميركية أخيراً إلى أنّ النماذج الجديدة قيد التطوير تبدو كأنها وصلت إلى حدودها القصوى، لا سيما برامج «غوغل» و«أنثروبيك» و«أوبن إيه آي».

ويقول جوليان شوراكي: «يمكن على شبكة الإنترنت، جمع المحتوى القانوني وغير القانوني، وكميات كبيرة من المحتوى المقرصن، مما يشكل مشكلة قانونية. هذا من دون أن ننسى مسألة نوعية البيانات».

فيديوهات مزيفة أسهل صنعاً وأقلّ تكلفةً

توظف نظم ذكاء صناعي جديدة