تعرف على العلامات الخفية للفيديوهات المصنوعة بالذكاء الاصطناعي

تزايد خطر العروض المرئية الاصطناعية وتآكل الثقة الرقمية

وجه حقيقي إلى اليسار ومزيف إلى اليمين يشابه إيلون ماسك بعد التزييف
وجه حقيقي إلى اليسار ومزيف إلى اليمين يشابه إيلون ماسك بعد التزييف
TT

تعرف على العلامات الخفية للفيديوهات المصنوعة بالذكاء الاصطناعي

وجه حقيقي إلى اليسار ومزيف إلى اليمين يشابه إيلون ماسك بعد التزييف
وجه حقيقي إلى اليسار ومزيف إلى اليمين يشابه إيلون ماسك بعد التزييف

يشهد الفضاء الرقمي تحولاً جذرياً بفعل التقدم في نماذج الذكاء الاصطناعي التوليدي، لا سيما تقنية التزييف العميق «Deepfake»، وتُعد هذه التقنية التي تستخدم خوارزميات الذكاء الاصطناعي لتركيب الوجوه وتغيير التعبيرات والكلام والإيماءات في عروض الفيديو سلاحاً إلكترونياً متنامياً، مما يشكل تحدياً مباشراً لقدرة المستخدم على التمييز بين الواقع والمحتوى الاصطناعي.

ونذكر في هذا الموضوع نصائح وأدوات للمساعدة في التعرف على ما إذا كان فيديو ما مصنوعاً بتقنيات الذكاء الاصطناعي أم لا.

ويُنذر التطور السريع لتقنيات التزييف العميق وإمكانية الوصول إليها بمخاطر جسيمة، بما في ذلك الانتشار الواسع للمعلومات المضللة وسرقة الهوية والاستغلال. ولا يتضخم الخطر فقط بسبب الجودة المتزايدة للفيديو النهائي، ولكن بسبب سهولة استغلالها. وتستطيع أدوات اليوم توظيف أقل من 3 ثوانٍ من صوت شخص إلى إنشاء نسخة صوتية مزيفة تُستخدم في عمليات الاحتيال. وعليه، يجب أن يبدأ الكشف عنها بتدريب العين البشرية على اكتشاف صفات عروض الفيديو المولدة صناعياً قبل الاستعانة بالأدوات التقنية المتخصصة.

وجه حقيقي إلى اليسار ومزيف إلى اليمين يشابه الممثل توم كروز بعد التزييف

الكشف البشري عن التزييف العميق

أول خطوة في التعرف المباشر على الفيديوهات المزيفة هي معرفة أن عروض الفيديو المولدة بواسطة الذكاء الاصطناعي الحديث نادراً ما تبدو سيئة الصنع، بل غالباً ما تكون مثالية بشكل غير طبيعي.

• عدم التناسق. لذلك، لا يجب البحث عن الأخطاء الفادحة، بل عن التفاصيل الدقيقة والمستويات المتعارضة من التناسق التي يُخفق الذكاء الاصطناعي في دمجها بشكل متكامل. ويجب أن ينصب التركيز الأولي على منطقة العينين، حيث غالباً ما تظهر زجاجية أو آلية أو تشوبها ومضات غير طبيعية.

• عدم التزامن السمعي البصري. مع ذلك، تبقى العلامة الأكثر شيوعاً للكشف هي عدم التزامن السمعي البصري بين حركات الشفاه والصوت.

• ملامح بيولوجية. على الرغم من التقدم الكبير، لا تزال الخوارزميات تجد صعوبة في محاكاة التباين الطبيعي للملامح، وينبغي فحص جلد الشخص: هل يبدو ناعماً بشكل مفرط ويفتقر إلى الملمس المسامي الطبيعي؟ كما يُخفق الذكاء الاصطناعي غالباً في محاكاة التفاصيل الصغيرة والدائمة، مثل الشامات على الخد أو التجاعيد الدقيقة.

وهناك نقطة ضعف حيوية أخرى تكمن في غياب الوظائف البيولوجية المستمرة. يجب على المشاهد أن يلاحظ ما إذا كان هناك غياب واضح لحركة التنفس المنتظم في الصدر، مثلاً، أو رمش العينين بمعدل طبيعي.

• تحليل الحركة. تظل الأيدي والأصابع نقطة الفشل الكلاسيكية في الفيديوهات المصنوعة. ويجب فحص عدد الأصابع بدقة، فقد تظهر الأصابع مشوهة أو بأعداد غير صحيحة. بالإضافة إلى ذلك، يجب الانتباه إلى كيفية تحرك اليدين والمفاصل والأطراف: هل تبدو الحركة عائمة أو طافية أو مشوهة في شكلها؟ كما يجب تحليل الحركة العامة للشخص الذي يظهر في الفيديو. هل تظهر حركات الشخص موجية أو مهتزة وغير طبيعية أو هل يوجد تذبذب واهتزاز في الوجه أو تكتل وتشوه؟ بالإضافة إلى ذلك، يجب الأخذ بعين الاعتبار سلوك الشخص: هل يقوم بشيء غير معقول أو يتعارض مع سياق الموقف أو شخصيته المعروفة؟

• الصوت والإيقاع. عند تحليل المكون الصوتي يجب الانتباه إلى الإيقاع؛ هل يوجد نمط غير طبيعي في الكلام يفتقر إلى الترددات البشرية الطبيعية، مثل التوقفات العادية أو توقفات التنفس التي تميز الخطاب البشري؟ يجب التحقق مما إذا كان النطق مثالياً جداً لدرجة تفتقر إلى النبرة أو العمق العاطفي الطبيعي أو العمر المناسب للشخص الظاهر. كما يجب الانتباه لغياب ضوضاء البيئة في الخلفية التي ينبغي أن تكون موجودة بشكل طبيعي.

• الإضاءة والظلال. وغالباً ما يفشل الذكاء الاصطناعي في دمج العنصر المزيف مع الخلفية المحيطة، مما يخلق ما يُسمّى «التماس البصري». هل تبدو الأشياء في الخلفية ذائبة أو متكررة أو متشابهة بشكل غريب؟ الأهم من ذلك، يجب التحقق مما إذا كانت الإضاءة والظلال متطابقة مع مصدر الضوء المفترض في المشهد، فالتناقضات في الإضاءة والانعكاسات والظلال تُعدّ من الدلائل البصرية الأكثر إفشاء للتلاعب.

تساعد أدوات متخصصة في التعرف الفيديو المزيف

أدوات الذكاء الاصطناعي المضاد

وفي ظل التطور المتسارع لتقنيات التوليد، لم تعد الملاحظة البشرية كافية بمفردها لتوفير قرار قاطع، وأصبحت الحاجة ملحة إلى استخدام أدوات تقنية متقدمة تستخدم الذكاء الاصطناعي المضاد للكشف عن البصمة الخوارزمية المخفية التي لا يمكن للعين المجردة رؤيتها. وتُمثل هذه الأدوات الخطوة شبه الحاسمة، حيث تعمل بوصفها مستشعرات متخصصة قادرة على تحليل بيانات الصوت والصورة بسرعة فائقة لتقديم تقييم موضوعي للمصداقية.

جدير بالذكر أنه لا يمكن لأداة واحدة أن تكشف جميع أشكال التزييف بكفاءة عالية، مما يستدعي استخدام مجموعة من الأدوات المتخصصة. ويتمثل التحدي الأكبر في أن جميع طرق الكشف الآلي لديها معدلات فشل، وهذا يتطلب من المطورين والباحثين توقع طرق جديدة لإنشاء الوسائط الاصطناعية بشكل مستمر. ويجب إدراك أن سباق التسلح مستمر، وأن أدوات الكشف الحالية يجب التعامل مع نتائجها بحذر بصفتها مؤشرات وليست أحكاماً نهائية.

ونذكر فيما يلي أبرز الأدوات التقنية المتاحة، للمساعدة في كشف عروض الفيديو المصنوعة بتقنيات الذكاء الاصطناعي:

• كاشف التلاعب الصوتي: تُمثل أداة «ديب فيك ديتيكتر» McAfee Deepfake Detector من «مكافي» دفاعاً متخصصاً ضد الاحتيال الذي يعتمد على استنساخ الصوت عبر الذكاء الاصطناعي، فقد أصبح من السهل جداً على مجرمي الإنترنت استغلال الأصوات المقلدة. وتستخدم هذه الأداة نماذج الشبكات العصبية العميقة التي يتم تدريبها بخبرة للكشف عن الصوت الذي تم توليده أو التلاعب به بواسطة الذكاء الاصطناعي. ويمكن لهذه الأداة إرسال تنبيهات في غضون ثوانٍ مباشرة في متصفح المستخدم، مما يساعد على التمييز السريع بين الحقيقي والمزيف.

• تقنية كاشف البصمة البيولوجية: تُعد تقنية «فيك كاتشر» Intel FakeCatcher من «إنتل» الأولى عالمياً في توفير منصة كشف عن التزييف العميق في الوقت الفوري، وتتمتع بدقة عالية تصل إلى 96 في المائة. وتعتمد آلية عمل هذه الأداة على مبدأ مبتكر يُعرف باسم «البصمة البشرية». فبدلاً من البحث عن عيوب في الصورة المولّدة، تركز الأداة على تحليل وحدات الـ«بكسل» في الفيديو، للكشف عن علامات تدفق الدم الناتجة عن عمل القلب. وبما أن نماذج الذكاء الاصطناعي لا يمكنها محاكاة هذه الوظيفة الفسيولوجية الحية، فإن غياب تلك الإشارات البيولوجية يُعدّ دليلاً قاطعاً على التلاعب.

• الماسح العميق العام: توفر منصة «ديبووير سكانر» Deepware Scanner أداة مصممة لمسح واكتشاف عروض الفيديو والصوتيات المُتلاعب بها اصطناعياً. وتستخدم الأداة تقنية كشف عامة تستهدف التلاعب البصري والسمعي في الوسائط، وهي حل عملي لإجراء فحص سريع ومباشر عبر الإنترنت.

• منصة الأبحاث المفتوحة: تُمثل «ديب فيك أو ميتير» DeepFake o meter منصة تعمل على دمج أحدث طرق البحث مفتوحة المصدر للكشف عن الوسائط الاصطناعية، بما في ذلك الصور وعروض الفيديو والصوتيات. وتم تطوير هذه المنصة بدعم من جامعات ومؤسسات بحثية، وتهدف إلى توفير أداة مجانية للجمهور لتجربة وفهم التطورات الحديثة في اكتشاف الوسائط الاصطناعية. وتستخدم المنصة نماذج بحثية أولية، مثل LipFD لكشف التلاعب بحركة الشفاه في الفيديو، وRawNet2-Vocoder-v3 لكشف الصوت المزيف.


مقالات ذات صلة

أبحاث الروبوتات… «ضلَّت طريقها»

تكنولوجيا رودني بروكس

أبحاث الروبوتات… «ضلَّت طريقها»

شكوك في قدرة الروبوتات وفي سلامة استخدام الإنسان لها

تيم فيرنهولز (نيويورك)
تكنولوجيا سماعات أمامية وجانبية لتجسيم الصوتيات وسماعة متخصصة في الصوتيات الجهورية بتقنية 5.1

دليل شامل لإعداد نظام الصوت المحيطي المثالي في منزلك

أفضل طريقة للتمتع بتجربة السينما الغامرة في المنزل

تكنولوجيا سماعات أمامية وجانبية لتجسيم الصوتيات وسماعة متخصصة في الصوتيات الجهورية بتقنية 5.1

دليل شامل لإعداد نظام الصوت المحيطي المثالي في منزلك

أفضل طريقة للتمتع بتجربة السينما الغامرة في المنزل

الاقتصاد جانب من اتفاقية التعاون الاستراتيجي بين «موبايلي» والمنتدى الاقتصادي العالمي (الشرق الأوسط)

«موبايلي» تتعاون مع المنتدى الاقتصادي العالمي لتطوير الرقمنة بالسعودية

وقَّعت «موبايلي» اتفاقية تعاون استراتيجي مع المنتدى الاقتصادي العالمي، بهدف تطوير البنية التحتية الرقمية والمساهمة في تحقيق مستهدفات «رؤية 2030».

«الشرق الأوسط» (الرياض )
الخليج المهندس أحمد الصويان وأنطونيو غوتيريش يبحثان الموضوعات المشتركة وسُبل التعاون (هيئة الحكومة الرقمية)

غوتيريش يشيد بتقدم السعودية النوعي في الحكومة الرقمية

أشاد أنطونيو غوتيريش، أمين عام الأمم المتحدة، بما حققته السعودية من تقدم نوعي في مجال الحكومة الرقمية، عادّاً ما وصلت إليه نموذجاً دولياً رائداً.

«الشرق الأوسط» (الرياض)

دراسة: 20 % من فيديوهات «يوتيوب» مولّدة بالذكاء الاصطناعي

محتوى على «يوتيوب» تم إنشاؤه بواسطة الذكاء الاصطناعي يصوّر قطاً يتم القبض عليه بواسطة رجال الشرطة
محتوى على «يوتيوب» تم إنشاؤه بواسطة الذكاء الاصطناعي يصوّر قطاً يتم القبض عليه بواسطة رجال الشرطة
TT

دراسة: 20 % من فيديوهات «يوتيوب» مولّدة بالذكاء الاصطناعي

محتوى على «يوتيوب» تم إنشاؤه بواسطة الذكاء الاصطناعي يصوّر قطاً يتم القبض عليه بواسطة رجال الشرطة
محتوى على «يوتيوب» تم إنشاؤه بواسطة الذكاء الاصطناعي يصوّر قطاً يتم القبض عليه بواسطة رجال الشرطة

أظهرت دراسة أن أكثر من 20 في المائة من الفيديوهات التي يعرضها نظام يوتيوب للمستخدمين الجدد هي «محتوى رديء مُولّد بالذكاء الاصطناعي»، مُصمّم خصيصاً لزيادة المشاهدات.

وبحسب صحيفة «الغارديان» البريطانية، فقد أجرت شركة تحرير الفيديو «كابوينغ» استطلاعاً شمل 15 ألف قناة من أشهر قنوات يوتيوب في العالم - أفضل 100 قناة في كل دولة - ووجدت أن 278 قناة منها تحتوي فقط على محتوى رديء مُصمم بتقنية الذكاء الاصطناعي.

وقد حصدت هذه القنوات مجتمعةً أكثر من 63 مليار مشاهدة و221 مليون مشترك، مُدرّةً إيرادات تُقدّر بنحو 117 مليون دولار سنوياً، وفقاً للتقديرات.

كما أنشأ الباحثون حساباً جديداً على «يوتيوب»، ووجدوا أن 104 من أول 500 فيديو تم التوصية به في الصفحة الرئيسية لهذا الحساب كانت ذات محتوى رديء مولد بالذكاء الاصطناعي، تم تطويره بهدف الربح المادي.

وتُقدّم هذه النتائج لمحةً عن صناعةٍ سريعة النمو تُهيمن على منصات التواصل الاجتماعي الكبرى، من «إكس» إلى «ميتا» إلى «يوتيوب»، وتُرسّخ حقبةً جديدةً من المحتوى، وهو المحتوى التافه الذي يحفز على إدمان هذه المنصات.

وسبق أن كشف تحليل أجرته صحيفة «الغارديان» هذا العام أن ما يقرب من 10في المائة من قنوات «يوتيوب» الأسرع نمواً هي قنوات مُولّدة بواسطة الذكاء الاصطناعي، حيث حققت ملايين المشاهدات رغم جهود المنصة للحد من «المحتوى غير الأصلي».

وتُعدّ القنوات التي رصدتها شركة كابوينغ عالمية الانتشار وتحظى بمتابعة واسعة من ملايين المشتركين في مختلف أنحاء العالم.

وتعتبر قناة «بندر أبنا دوست»، هي القناة الأكثر مشاهدة في الدراسة، ومقرها الهند، ويبلغ عدد مشاهداتها حالياً 2.4 مليار مشاهدة. وتعرض القناة مغامرات قرد ريسوس وشخصية مفتولة العضلات مستوحاة من شخصية «هالك» الخارقة، يحاربان الشياطين ويسافران على متن مروحية مصنوعة من الطماطم. وقدّرت كابوينغ أن القناة قد تُدرّ أرباحاً تصل إلى 4.25 مليون دولار.

أما قناة «بوتى فرينشي»، ومقرها سنغافورة، والتي تروي مغامرات كلب بولدوغ فرنسي، فقد حصدت ملياري مشاهدة، ويبدو أنها تستهدف الأطفال. وتشير تقديرات كابوينغ إلى أن أرباحها تقارب 4 ملايين دولار سنوياً.

كما يبدو أن قناة «كوينتوس فاسينانتس»، ومقرها الولايات المتحدة، تستهدف الأطفال أيضاً بقصص كرتونية، ولديها 6.65 مليون مشترك.

في الوقت نفسه، تعرض قناة «ذا إيه آي وورلد»، ومقرها باكستان، مقاطع فيديو قصيرة مُولّدة بالذكاء الاصطناعي عن الفيضانات الكارثية التي ضربت باكستان، تحمل عناوين مثل «الفقراء»، و«العائلات الفقيرة»، و«مطبخ الفيضان». وقد حصدت القناة وحدها 1.3 مليار مشاهدة.

وتعليقاً على هذه الدراسة، صرح متحدث باسم «يوتيوب» قائلاً: «الذكاء الاصطناعي التوليدي أداة، وكأي أداة أخرى، يمكن استخدامه لإنتاج محتوى عالي الجودة وآخر منخفض الجودة. نركز جهودنا على ربط مستخدمينا بمحتوى عالي الجودة، بغض النظر عن طريقة إنتاجه. يجب أن يتوافق المحتوى المرفوع على (يوتيوب) مع إرشاداتنا، وإذا وجدنا أن المحتوى ينتهك أياً من سياساتنا، فسنحذفه».


الصين تصدر مسوّدة قواعد لتنظيم الذكاء الاصطناعي المحاكي للتفاعل البشري

امرأة في معرض حول الذكاء الاصطناعي وعالم الإنترنت بمقاطعة جيجيانغ الصينية (رويترز)
امرأة في معرض حول الذكاء الاصطناعي وعالم الإنترنت بمقاطعة جيجيانغ الصينية (رويترز)
TT

الصين تصدر مسوّدة قواعد لتنظيم الذكاء الاصطناعي المحاكي للتفاعل البشري

امرأة في معرض حول الذكاء الاصطناعي وعالم الإنترنت بمقاطعة جيجيانغ الصينية (رويترز)
امرأة في معرض حول الذكاء الاصطناعي وعالم الإنترنت بمقاطعة جيجيانغ الصينية (رويترز)

أصدرت هيئة الفضاء الإلكتروني الصينية، اليوم (السبت)، مسودة ​قواعد لتشديد الرقابة على خدمات الذكاء الاصطناعي المصممة لمحاكاة الشخصيات البشرية والتفاعل العاطفي مع المستخدمين.

وتؤكد هذه الخطوة ما تبذله بكين من جهود للسيطرة على الانتشار السريع لخدمات ‌الذكاء الاصطناعي ‌المقدمة للجمهور ‌من ⁠خلال ​تشديد معايير ‌السلامة والأخلاقيات.

وستطبق القواعد المقترحة على منتجات وخدمات الذكاء الاصطناعي المقدمة للمستهلكين في الصين، والتي تعرض سمات شخصيات بشرية وأنماط تفكير وأساليب تواصل تتم محاكاتها، وتتفاعل ⁠مع المستخدمين عاطفياً من خلال النصوص ‌أو الصور أو الصوت أو الفيديو، أو غيرها من الوسائل.

وتحدد المسودة نهجاً تنظيمياً يلزم مقدمي الخدمات بتحذير المستخدمين من الاستخدام المفرط، وبالتدخل عندما تظهر على المستخدمين ​علامات الإدمان.

وبموجب هذا المقترح، سيتحمل مقدمو الخدمات مسؤوليات ⁠السلامة طوال دورة حياة المنتج، ووضع أنظمة لمراجعة الخوارزميات وأمن البيانات وحماية المعلومات الشخصية.

وتحدد هذه الإجراءات الخطوط الحمراء للمحتوى والسلوك، وتنص على أنه يجب ألا ينشئ مقدمو الخدمات محتوى من شأنه تهديد الأمن القومي، أو نشر الشائعات، أو الترويج ‌للعنف أو الفحشاء.


ما الاختراق القادم في مجال الذكاء الاصطناعي الذي يتوقعه رئيس «أوبن إيه آي»؟

سام ألتمان رئيس شركة «أوبن إيه آي» (رويترز)
سام ألتمان رئيس شركة «أوبن إيه آي» (رويترز)
TT

ما الاختراق القادم في مجال الذكاء الاصطناعي الذي يتوقعه رئيس «أوبن إيه آي»؟

سام ألتمان رئيس شركة «أوبن إيه آي» (رويترز)
سام ألتمان رئيس شركة «أوبن إيه آي» (رويترز)

توقع سام ألتمان، رئيس شركة «أوبن إيه آي»، أن يكون الإنجاز الكبير التالي نحو تحقيق ذكاء اصطناعي فائق القدرة هو اكتساب هذه الأنظمة «ذاكرة لا نهائية، ومثالية».

وقد ركزت التطورات الأخيرة التي حققها مبتكر «تشات جي بي تي»، بالإضافة إلى منافسيه، على تحسين قدرات الذكاء الاصطناعي على الاستدلال، وفقاً لصحيفة «إندبندنت».

لكن في حديثه ضمن بودكاست، قال ألتمان إن التطور الذي يتطلع إليه بشدة هو قدرة الذكاء الاصطناعي على تذكر «كل تفاصيل حياتك»، وأن شركته تعمل على الوصول إلى هذه المرحلة بحلول عام 2026.

شرح ألتمان: «حتى لو كان لديك أفضل مساعد شخصي في العالم... فلن يستطيع تذكر كل كلمة نطقت بها في حياتك».

وأضاف: «لا يمكنه قراءة كل وثيقة كتبتها. ولا يمكنه الاطلاع على جميع أعمالك يومياً، وتذكر كل تفصيل صغير. ولا يمكنه أن يكون جزءاً من حياتك إلى هذا الحد. ولا يوجد إنسان يمتلك ذاكرة مثالية لا متناهية».

وأشار ألتمان إلى أنه «بالتأكيد، سيتمكن الذكاء الاصطناعي من فعل ذلك. نتحدث كثيراً عن هذا الأمر، لكن الذاكرة لا تزال في مراحلها الأولى جداً».

تأتي تصريحاته بعد أسابيع قليلة من إعلانه حالة طوارئ قصوى في شركته عقب إطلاق «غوغل» لأحدث طراز من برنامج «جيميناي».

وصفت «غوغل» برنامج «جيميناي 3» بأنه «عهد جديد من الذكاء» عند إطلاقها تطبيق الذكاء الاصطناعي المُحدّث في نوفمبر (تشرين الثاني)، حيث حقق النموذج نتائج قياسية في العديد من اختبارات الأداء المعيارية في هذا المجال.

قلّل ألتمان من خطورة التهديد الذي يمثله مشروع «جيميناي 3»، مدعياً ​​أن ردّ شركة «أوبن إيه آي» الحازم على المنافسة الجديدة ليس بالأمر غير المألوف.

وقال: «أعتقد أنه من الجيد توخي الحذر، والتحرك بسرعة عند ظهور أي تهديد تنافسي محتمل».

وتابع: «حدث الشيء نفسه لنا في الماضي، حدث ذلك في وقت سابق من هذا العام مع (ديب سيك)... لم يكن لـ(جيميناي 3) التأثير الذي كنا نخشى أن يحدث، ولكنه حدد بعض نقاط الضعف في منتجاتنا واستراتيجيتنا، ونحن نعمل على معالجتها بسرعة كبيرة».

يبلغ عدد مستخدمي «تشات جي بي تي» حالياً نحو 800 مليون، وفقاً لبيانات «أوبن إيه آي»، وهو ما يمثل نحو 71 في المائة من حصة سوق تطبيقات الذكاء الاصطناعي. ويقارن هذا الرقم بنسبة 87 في المائة في الفترة نفسها من العام الماضي.