وسائل جديدة للكشف عن التسجيلات الصوتية المزيفة بإتقان

عالما كومبيوتر يرصدان أنماط إنتاجها صناعياً أو بشرياً

وسائل جديدة للكشف عن التسجيلات الصوتية المزيفة بإتقان
TT

وسائل جديدة للكشف عن التسجيلات الصوتية المزيفة بإتقان

وسائل جديدة للكشف عن التسجيلات الصوتية المزيفة بإتقان

تخيّلوا السيناريو التالي: يرنّ الهاتف، فيجيب الموظف ويسمع صوت مديرته في العمل وهي تبلغه بقلقٍ شديد بأنّها نسيت أن تحوّل المال للمتعاقد الجديد قبل مغادرتها، وتريده أن يقوم بالتحويل، فتزوّده بالمعلومات اللازمة... لتبدأ الأزمة الحقيقية بعد إتمام العملية.
بعدها، يجلس الموظف في كرسيّه ويأخذ نفساً عميقاً ثمّ يرى مديرته تدخل من الباب لأنّ الصوت الذي سمعه على الهاتف لم يكن صوتها، حتّى أنّه لم يكن بشرياً، بل إنه تسجيل صوتي مزيّف باحترافية شديدة بواسطة تقنية «ديب فيك»، وهو عبارة عن نموذج صوتي صممته آلات ليبدو تماماً كصوت المديرة.

تزييف متقن
هذه ليست المرّة الأولى التي تحصل فيها اعتداءات باستخدام تسجيلات صوتية، حتّى أنّ المحادثات الصوتية المصنوعة بتقنية «ديب فيك» deepfake قد لا تكون بعيدة جداً عنّا.
وُلدت مواد «ديب فيك»، سواء التسجيلات الصوتية أو الفيديوهات، بفضل تطوّر تقنيات التعلّم الآلي المعقّدة، ولكنّها ولّدت معها مستوى جديداً من الشكّ بالوسائط الرقمية. ولرصد التزييف الاحترافي أو الـ«ديب فيك»، لجأ الباحثون إلى تحليل الآثار البصرية – كالأخطاء الدقيقة والتناقضات – الموجودة في الفيديوهات المصنوعة بتقنية التزييف».
أما التسجيلات الصوتية المزيّفة باحترافية (مقاطع «ديب فيك» الصوتية) فتشكل تهديداً أكبر لأنّ النّاس غالباً يتواصلون شفهياً دون تصوير – مثلاً، عبر الاتصالات الهاتفية والراديو والتسجيلات الصوتية. وهكذا، توسّع وسائل التواصل المحصورة بالصوت احتمالات استخدام المعتدين لمواد «ديب فيك».
ولرصد هذه المواد، عمدنا مع زملائنا الباحثين في جامعة فلوريدا، إلى تطوير تقنية تقيس الاختلافات الصوتية وسيلان الموائع بين نماذج صوتية عضوية لمتحدّثين بشر وأخرى صناعية فبركتها أجهزة كومبيوتر.

صوت طبيعي وصناعي
ينطق البشر من خلال دفع الهواء فوق مختلف تشكيلات المسالك الصوتية التي تضمّ الأحبال الصوتية واللسان والشفتين. وبتعديل ترتيب هذه التشكيلات، يغيّر الإنسان الخصائص الصوتية للمسالك الصوتية ما يتيح له ابتكار 200 صوت مختلف أو ما يُعرف بالصوت اللغوي. ولكنّ التركيب البنيوي البشري يحدّد السلوك الصوتي لهذه الأصوات اللغوية المختلفة؛ ما ينتج مجموعة صغيرة نسبياً من الأصوات الصحيحة لكلّ واحدٍ منها.
في المقابل، تُصمم المواد الصوتية المزيّفة باحترافية من خلال السماح للكومبيوتر بالاستماع إلى تسجيلات صوتية للمتكلّم الضحية. قد يحتاج الكومبيوتر إلى الاستماع لعشر أو عشرين ثانية من المقطع بحسب التقنية المستخدمة، ويُستخدم المقطع الصوتي لاستخراج معلومات أساسية عن الأنماط الفريدة في صوت الضحية.
يختار المعتدي جملة لتقنية «ديب فيك» ومن ثمّ يستخدم خوارزمية تحوّل النص إلى كلام لإنتاج نموذج صوتي يشبه صوت الضحية وهو يقول الجملة المختارة. تتمّ عملية صناعة نموذج التسجيل الصوتي المزيّف بهذه التقنية في ثوانٍ؛ ما يمنح المتعقّب المرونة الكافية لاستخدام صوت مزيّف في أي محادثة.

كشف التسجيلات المزيفة
إنّ الخطوة الأولى للتمييز بين كلام البشر والكلام المفبرك بتقنية «ديب فيك» هو فهم كيفية صناعة نموذج للمسالك الصوتية لدى الإنسان. لحسن الحظ، يملك العلماء تقنيات لتقدير ما قد يبدو عليه صوت أحدهم – أو أي مخلوق حي من ماضٍ ساحق، كالديناصور مثلاً – بناءً على قياسات تشريحية للمجرى الصوتي.
ولكننا قمنا بالعكس، فقد عمدنا إلى عكس الكثير من هذه التقنيات وتمكّنا من استخراج تقدير تقريبي للمسالك الصوتية للمتحدّث خلال مقطع كلامي له. ويتيح لنا هذا الأمر التدقيق بفاعلية بالتركيب البنيوي للمتحدّث الذي صنع النموذج الصوتي. ومن هنا، افترضنا أنّ النماذج الصوتية المزيفة باحترافية ستفشل أمام قيود الضوابط البنيوية التي يملكها البشر. بمعنى آخر، ساهم تحليل النماذج الصوتية المزيفة في محاكاة أشكال المسالك الصوتية غير الموجودة لدى الأشخاص الحقيقيين.
وجاءت نتائج اختبارنا ليس لتؤكّد نظريتنا فحسب، بل لتكشف أيضاً أمراً مثيراً للاهتمام. إذ وعند استخراج تقديرات المسالك الصوتية من التسجيلات الصوتية المزيفة، وجدنا أنّها كانت غالباً غير صحيحة. على سبيل المثال، وجدنا أنّ التسجيلات الصوتية المزيفة أنتجتها مسالك صوتية بنفس قطر وتركيبة انبوبة شفط المشروبات، في حين أنّ المسالك الصوتية البشرية تتميّز بالاتساع والمزيد من التنوّع في الشكل.
تثبت هذه الحقيقة أنّ التسجيلات المزيفة باحترافية، حتّى عندما تقنع المستمعين البشر، لا تتمتع بأي مصداقية؛ لأنها تظل متميزة عن الكلام البشري. ويمكننا، من خلال تقدير التركيب البنيوي المسؤول عن ابتكار أي حديث، أن نحدّد ما إذا كان التسجيل الصوتي بشرياً أو من صنع الكومبيوتر.

*باحثان في علوم الكومبيوتر بجامعة فلوريدا «فاست كومباني»
- خدمات «تريبيون ميديا»


مقالات ذات صلة

المدير التنفيذي لـ«سيسكو» السعودية: استثماراتنا بالمملكة مستمرة لدعم جهودها في التحول الرقمي

الاقتصاد المدير التنفيذي لشركة «سيسكو السعودية» سلمان فقيه (تصوير: تركي العقيلي) play-circle 01:37

المدير التنفيذي لـ«سيسكو» السعودية: استثماراتنا بالمملكة مستمرة لدعم جهودها في التحول الرقمي

في ظل ما يشهده قطاع التقنية السعودي من تطور، حقَّقت «سيسكو» أداءً قوياً ومتسقاً مع الفرص المتاحة وقرَّرت مواصلة استثماراتها لدعم جهود السعودية في التحول الرقمي.

زينب علي (الرياض)
عالم الاعمال «بلاك هات» تعود إلى الرياض بنسختها الثالثة

«بلاك هات» تعود إلى الرياض بنسختها الثالثة

تعود فعالية الأمن السيبراني الأبرز عالمياً «بلاك هات» في نسختها الثالثة إلى «مركز الرياض للمعارض والمؤتمرات» ببلدة ملهم شمال العاصمة السعودية الرياض.

تكنولوجيا «غوغل» تطلق النسخة الأولية من آندرويد 16 للمطورين مع ميزات جديدة لتعزيز الخصوصية ومشاركة البيانات الصحية (غوغل)

«غوغل» تطلق النسخة الأولية من آندرويد 16 للمطورين مع ميزات جديدة

أطلقت «غوغل» النسخة التجريبية الأولية من آندرويد 16 للمطورين، وهي خطوة تمهد الطريق للتحديثات الكبيرة المقبلة في هذا النظام.

عبد العزيز الرشيد (الرياض)
تكنولوجيا «أبل» تؤكد مشكلة اختفاء الملاحظات بسبب خلل بمزامنة (iCloud) وتوضح خطوات استعادتها مع توقع تحديث (iOS) قريب (أبل)

اختفاء الملاحظات في أجهزة آيفون... المشكلة والحلول

وفقاً لتقرير رسمي من «أبل»، فإن المشكلة تتعلق بإعدادات مزامنة الآيكلاود (iCloud).

عبد العزيز الرشيد (الرياض)
تكنولوجيا تمكنك «دورا» من تصميم مواقع ثلاثية الأبعاد مذهلة بسهولة تامة باستخدام الذكاء الاصطناعي دون الحاجة لأي معرفة برمجية (دورا)

صمم موقعك ثلاثي الأبعاد بخطوات بسيطة ودون «كود»

تتيح «دورا» للمستخدمين إنشاء مواقع مخصصة باستخدام الذكاء الاصطناعي عبر إدخال وصف نصي بسيط.

عبد العزيز الرشيد (الرياض)

تعرف على مزايا هاتف «إتش إم دي سكايلاين 5 جي» الجديد في المنطقة العربية

تصميم أنيق وقدرات تصويرية متقدمة
تصميم أنيق وقدرات تصويرية متقدمة
TT

تعرف على مزايا هاتف «إتش إم دي سكايلاين 5 جي» الجديد في المنطقة العربية

تصميم أنيق وقدرات تصويرية متقدمة
تصميم أنيق وقدرات تصويرية متقدمة

كانت الهواتف الجوالة في السابق تتميز بسهولة فتحها واستبدال بطاريتها أو داراتها الداخلية، ولكن هذا الأمر لم يعد شائعاً مع تقدمها. إلا أن هاتف «إتش إم دي سكايلاين 5 جي» HMD Skyline 5G الجديد يعيد تلك الميزة، مع تقديم قدرات تصويرية متقدمة في تصميم عصري، ودعم نمط التركيز على العمل أو النشاطات الشخصية. واختبرت «الشرق الأوسط» الهاتف، ونذكر ملخص التجربة.

برغي واحد لفتح الجهة الخلفية للهاتف

تصميم أنيق

الهاتف مصنوع من الألمنيوم المقوى، ويشابه تصميمه سلسلة هواتف «نوكيا لوميا» بجوانبه المستطيلة وشاشته المنحنية. ويقدم الهاتف أزراراً لتعديل درجة الصوت وتشغيله وقفله في الجهة اليمنى، مع تقديم زر خاص بالتقاط الصور في الجهة اليسرى. وفي الجهة السفلى، توجد السماعات المزدوجة القوية بجانب فتحة شريحة الاتصالات SIM ومنفذ الشحن السلكي «يو إس بي تايب - سي». أما بالنسبة للجهة الخلفية فتوجد فيها منطقة مستطيلة تحتوي على مصفوفة الكاميرات وضوء «فلاش».

ويوجد برغي واحد صغير في أسفل الجهة اليمنى يفتح الجهة الخلفية، ويسمح باستبدال البطارية أو الشاشة أو منفذ الشحن أو أي دارة داخلية أخرى، وبكل سهولة. الهاتف خفيف الوزن ومريح للاستخدام لفترات مطولة، ويسهل وضعه في الجيب على الرغم من القطر الكبير لشاشته.

قدرات تصويرية متقدمة

يقدم الهاتف مصفوفة كاميرات خلفية بدقة 108 و50 و13 ميغابكسل تدعم التثبيت البصري والتقريب، أو لالتقاط الصور بعدسة فائقة الاتساع. ويدعم الهاتف التصوير في ظروف الإضاءة المنخفضة بألوان واضحة مع القدرة على تكبير الصورة حتى 4 أضعاف دون فقدان أي تفاصيل، وذلك للحصول على لقطات مقربة واضحة. وتبلغ دقة الكاميرا الأمامية 50 ميغابكسل للحصول على صور ذاتية (سيلفي) بغاية الوضوح، مزودة بتقنية التركيز التلقائي وتتبع العين؛ لضمان التقاط أفضل الصور الشخصية.

الهاتف مناسب لصناع المحتوى بفضل قدراته التصويرية الفائقة وعمر بطاريته الطويل. ويستطيع صناع المحتوى ضبط مؤقت لالتقاط الصورة، مع دعم تقنية الإيماءات الشخصية المدمجة، ما يعني أنه يكفي النظر إلى الهاتف في أثناء رفع أصبعَي السبابة والوسطى ليد المستخدم أو رفع الإبهام، أو القيام بإشارة من إشارات أخرى يختارها المستخدم، ليفهم الهاتف أن المستخدم جاهز لالتقاط الصورة ويسجلها آلياً. كما تدعم الكاميرا الأمامية التصوير بالدقة الفائقة 4K وبالحركة البطيئة للحصول على مؤثرات بصرية مبهرة.

نمط التركيز الرقمي

ويدعم الهاتف نمط التركيز الرقمي Detox Mode الذي يقوم بإيقاف التنبيهات الواردة من تطبيقات أو جهات محددة، أو السماح بالحصول على التنبيهات من تطبيقات أو أشخاص محددين، ولمدة يختارها المستخدم خلال اليوم أو في أيام محددة. ويسمح هذا النمط للمستخدم بالتركيز على عمله أو نشاطاته الشخصية دون فقدان التركيز جراء طوفان التنبيهات اليومية الواردة من الرسائل النصية والشبكات الاجتماعية وتطبيقات الدردشة والتحديثات البرمجية والمكالمات، وغيرها.

ما يميز هذا النمط هو سهولة تفعيله وإيقافه، وكذلك وفرة الخيارات بين التطبيقات وجهات الاتصال والأيام والساعات المطلوبة للتركيز على عمل المستخدم وحياته الخاصة.

مواصفات تقنية

يستخدم الهاتف معالج «سناب دراغون 7 إس الجيل 2» ثماني النوى (4 نوى بسرعة 2 غيغاهرتز و4 نوى بسرعة 1، 95 غيغاهرتز)، وبدقة التصنيع 4 نانومتر. ويبلغ قطر شاشته 6.55 بوصة التي تعرض الصورة بتقنية POLED بدقة 2400x1080 بكسل وبكثافة 402 بكسل في البوصة، وبتردد 144 هرتز السلس والمريح للعينين، وهي تعرض الصورة بشدة سطوع تبلغ 1000 شمعة، وتدعم تقنية المجال العالي الديناميكي 10 High Dynamic Range HDR10 بألوان تنبض بالحياة، مع مقاومة الخدوش والصدمات بسبب استخدام زجاج «غوريلا غلاس 3».

ويقدم الهاتف 12 غيغابايت من الذاكرة للعمل، و256 غيغابايت من السعة التخزينية المدمجة، وتبلغ شحنة بطاريته 4600 ملي أمبير - ساعة التي تسمح للهاتف العمل لنحو يوم كامل من الاستخدام الطبيعي، أو يومين من الاستخدام المعتدل، مع القدرة على شحنها سلكياً بسرعة وبقدرة 33 واط، أو لا سلكياً بقدرة 15 واط من خلال تقنية Qi2، مع دعم الشحن اللاسلكي العكسي للأجهزة والملحقات المختلفة بقدرة 5 واط. هذا، وتدعم البطارية شحنها لأكثر من 800 مرة دون فقدان قدرتها.

يمكن استبدال البطارية والشاشة ومنفذ الشحن وغيرها من الدارات الداخلية بكل سهولة

ويدعم الهاتف شبكات «واي فاي» a وb وg وn وac و6e و«بلوتوث 5.2» اللاسلكية، إلى جانب دعم تقنية الاتصال عبر المجال القريب Near Field Communication NFC وتقديم مستشعر بصمة مدمج في زر التشغيل الجانبي. وتبلغ سماكة الهاتف 8.9 ملّيمتر، ويبلغ وزنه 209 غرامات، ويعمل بنظام التشغيل «آندرويد 14»، ويقاوم المياه والغبار وفقاً لمعيارIP54 ، ويدعم استخدام الشريحة الإلكترونية eSIM.

الهاتف متوافر في المنطقة العربية بألوان الأزرق أو الأسود أو الوردي بسعر 1799 ريالاً سعودياً (نحو 479 دولاراً أميركياً).