بيانات الصوت البيومترية... هل تهدد الخصوصية في زمن الخوارزميات؟

بيانات تكشف الصحة والحالة النفسية والخلفية الثقافية

تقنيات الذكاء الاصطناعي أصبحت قادرة على استخراج معلومات حساسة من الصوت دون علم المتحدث (أدوبي)
تقنيات الذكاء الاصطناعي أصبحت قادرة على استخراج معلومات حساسة من الصوت دون علم المتحدث (أدوبي)
TT

بيانات الصوت البيومترية... هل تهدد الخصوصية في زمن الخوارزميات؟

تقنيات الذكاء الاصطناعي أصبحت قادرة على استخراج معلومات حساسة من الصوت دون علم المتحدث (أدوبي)
تقنيات الذكاء الاصطناعي أصبحت قادرة على استخراج معلومات حساسة من الصوت دون علم المتحدث (أدوبي)

نحن نتحدث يومياً دون أن نفكر كثيراً في مقدار ما تكشفه أصواتنا عنّا. فإلى جانب الكلمات التي نختارها، يحمل الصوت إشارات دقيقة عن هويتنا قد تكشف معلومات صحية وخلفيات ثقافية وحالات عاطفية، ومستوى التعليم وربما حتى ميولاً فكرية. وحتى وقت قريب، كان هذا الإدراك يقتصر على الحدس البشري؛ إذ يمكننا غالباً أن نميّز تعب صديق أو سعادته أو توتره من نبرة صوته فقط. لكن اليوم، باتت الأنظمة الحاسوبية قادرة على فعل ذلك وأكثر بدقة متزايدة.

ويحذّر باحثون في تقنيات الكلام واللغة من أن هذه القدرات تمثل تحدياً حقيقياً للخصوصية. فالصوت لم يعد مجرد وسيلة لإعطاء الأوامر للمساعدات الرقمية أو أداة للحوار، بل أصبح وعاءً غنياً بالمعلومات الشخصية التي تستطيع الخوارزميات الحديثة استخراجها، غالباً دون علم المتحدث أو موافقته.

لماذا يُعد الصوت بيانات شخصية؟

عندما نتحدث، لا تنتقل الرسالة اللغوية وحدها. فإيقاع الكلام ودرجة الصوت والتوقفات بين الكلمات وأنماط التنفس والخصائص الصوتية الأخرى، جميعها تحمل طبقات متعددة من المعلومات الشخصية. ويشير خبراء تقنيات الكلام إلى أن هذه المعلومات مدمجة مباشرة في الإشارة الصوتية نفسها، أي أنها تُفصح تلقائياً عن صاحبها بمجرد التحدث، دون أي نية واعية للكشف عنها.

وتستطيع هذه الخصائص الصوتية أن تعكس مؤشرات تتعلق بالصحة الجسدية أو النفسية، مثل الإرهاق أو مشكلات في الجهاز التنفسي. كما يمكن أن تشير إلى خلفية المتحدث الثقافية أو الجغرافية من خلال اللهجة ونمط النطق. إضافة إلى ذلك، تحمل الأصوات دلائل عاطفية تُمكّن الأنظمة المتقدمة من استنتاج ما إذا كان الشخص متوتراً أو هادئاً أو متحمساً أو مضطرباً. ولهذا، يُصنَّف الصوت ضمن فئة البيانات البيومترية أي البيانات الشخصية العميقة، الفريدة غالباً، والتي يصعب تغييرها أو استبدالها.

وبسبب هذه الحساسية، تُعامل البيانات الصوتية في العديد من التشريعات الحديثة باعتبارها بيانات محمية. ففي الاتحاد الأوروبي، على سبيل المثال، يمكن أن يندرج الصوت ضمن البيانات البيومترية الخاضعة لقواعد صارمة بموجب اللائحة العامة لحماية البيانات (GDPR)، ما يستلزم توفير ضمانات إضافية والحصول على موافقة صريحة في كثير من الحالات.

تحليل الصوت يطرح مخاطر تتعلق بالخصوصية قد تمتد إلى التوظيف والتأمين والتسويق والمراقبة (شاترستوك)

مخاطر الإفراط في كشف المعلومات

تثير القدرة على استخراج سمات شخصية من الصوت مخاوف تتجاوز مسألة الراحة أو التخصيص. فمع تطور تقنيات تحليل الصوت وانتشارها، قد تمتد آثارها إلى مجالات حساسة في حياة الأفراد. فقد تُستخدم الاستنتاجات المستخلصة من أنماط الكلام يوماً ما للتأثير في قرارات التوظيف أو تقييمات التأمين إذا أسيء استخدامها. كما يمكن للمعلنين استغلال الإشارات العاطفية أو السلوكية المستخلصة من الصوت لتقديم رسائل تسويقية شديدة الاستهداف، وربما ذات طابع تلاعبي.

وتتفاقم المخاطر مع احتمالات سوء الاستخدام، مثل المراقبة غير المشروعة أو التحرش أو تتبع الأفراد دون علمهم. ورغم أن هذه السيناريوهات ليست شائعة على نطاق واسع بعد، يؤكد الباحثون أن سرعة تطور التكنولوجيا تستدعي دق ناقوس الخطر مبكراً، قبل أن تصبح هذه الممارسات أمراً واقعاً يصعب احتواؤه.

قياس ما يكشفه صوتك

أحد التحديات الأساسية في حماية خصوصية الصوت هو فهم مقدار المعلومات التي يحتويها تسجيل صوتي واحد. ولهذا يعمل الباحثون على تطوير أدوات وأساليب لقياس مدى قابلية ربط عيّنة صوتية بسمات تعريفية محددة. وتهدف هذه المقاييس إلى تحديد مدى سهولة نسب الصوت إلى شخص بعينه أو إلى فئة ضيقة من الأشخاص، اعتماداً فقط على الخصائص الصوتية.

وتُعد هذه الأدوات ضرورية لتصميم أنظمة تراعي الخصوصية منذ البداية. فإذا تمكن المطورون من تقدير مستوى المخاطر المرتبطة بتسجيل صوتي معين، يصبح بإمكانهم اتخاذ قرارات مدروسة بشأن كيفية تخزينه أو معالجته أو مشاركته. ويدعم هذا التوجه مفهوم «الخصوصية بحكم التصميم»؛ حيث تُؤخذ المخاطر المحتملة في الحسبان قبل طرح التكنولوجيا للاستخدام الواسع.

الصوت ليس وسيلة تواصل فقط بل يحمل أيضاً بيانات شخصية عميقة تكشف الصحة والحالة النفسية والخلفية الثقافية (شاترستوك)

كيف يمكن حماية خصوصية الصوت؟

لا يدعو الخبراء إلى التخلي عن تقنيات الصوت، بل إلى تقليل التعرض غير الضروري للمعلومات الشخصية. ومن بين أكثر الاستراتيجيات فعالية تقليص كمية البيانات الصوتية الخام التي يتم مشاركتها. فبدلاً من إرسال تسجيلات كاملة، يمكن للأنظمة استخراج الحد الأدنى من المعلومات اللازمة لأداء مهمة محددة كتحويل الكلام إلى نص، ثم التخلص من بقية البيانات.

كما تُعد المعالجة المحلية للصوت خطوة مهمة في هذا السياق. فعندما يُحلل الصوت مباشرة على الجهاز، بدلاً من إرساله إلى خوادم سحابية بعيدة، تقل فرص إساءة الاستخدام أو الاعتراض أو الاستغلال الثانوي للبيانات. ويمنح هذا النهج المستخدمين قدراً أكبر من التحكم فيما يغادر أجهزتهم ومتى.

وتلعب الضوابط الفيزيائية والبيئية دوراً مكملاً. فالتقنيات التي تُظهر بوضوح متى يكون التسجيل نشطاً، أو التي تحصر التقاط الصوت في نطاقات محددة، أو تتطلب تفعيلاً مقصوداً من المستخدم، تساعد في منع التسجيل العرضي أو الخفي. ومجتمعةً، تسهم هذه الإجراءات في جعل التفاعل الصوتي مقصوداً لا متطفلاً.

الثقة والشفافية وتجربة المستخدم

الخصوصية ليست مسألة تقنية فحسب، بل هي قضية نفسية أيضاً. فمجرد الشعور بالمراقبة قد يؤثر في سلوك الأفراد وطريقة تعبيرهم عن أنفسهم. ويحذّر الباحثون من أن الإحساس الدائم بالرصد سواء أكان حقيقياً أم متوهماً، يمكن أن يقوّض الشعور بالكرامة والاستقلالية.

ومن هنا تبرز أهمية الشفافية؛ إذ ينبغي إبلاغ المستخدمين بوضوح متى يتم تسجيل أصواتهم، وما نوع المعلومات التي قد تُستخلص، وكيف ستُستخدم هذه البيانات. فالأنظمة التي تقدم إشارات واضحة وتحكماً مفهوماً في إعدادات الخصوصية تكون أقدر على كسب ثقة المستخدمين من تلك التي تعمل بصمت في الخلفية.

مستقبل مسؤول لتقنيات الصوت

توفر التقنيات المعتمدة على الصوت فوائد لا يمكن إنكارها، بدءاً من أدوات الوصول لذوي الإعاقة، مروراً بالحوسبة دون استخدام اليدين، ووصولاً إلى تفاعل أكثر طبيعية بين الإنسان والآلة. غير أن تعاظم حضور هذه التقنيات في الحياة اليومية يفرض مسؤولية متزايدة لحماية البيانات الصوتية.

ويواصل الباحثون تطوير أساليب لقياس المعلومات الشخصية الكامنة في الصوت وتقليلها والتحكم بها. وفي الوقت ذاته، يتعين على المطورين وصنّاع السياسات والمصممين العمل معاً لضمان تطور أطر الخصوصية بالتوازي مع الابتكار. فالتحدي ليس في إسكات التكنولوجيا، بل في ضمان أن تكون أصواتنا حين نتحدث مصدر تمكين لنا، لا بوابة لانتهاك خصوصيتنا.


مقالات ذات صلة

كيف يمكن أن يؤثر الذكاء الاصطناعي على البطالة والتوظيف في 2026؟

تكنولوجيا يرى البعض أن الذكاء الاصطناعي يهدد ملايين الوظائف التقليدية (رويترز)

كيف يمكن أن يؤثر الذكاء الاصطناعي على البطالة والتوظيف في 2026؟

مع التسارع غير المسبوق في تطور تقنيات الذكاء الاصطناعي، تتزايد التساؤلات حول تأثير هذه الثورة التكنولوجية على سوق العمل العالمي.

«الشرق الأوسط» (لندن)
خاص خبراء: سيادة الذكاء الاصطناعي باتت محوراً استراتيجياً يُعاد عبرها تعريفه بوصفه بنية تحتية وطنية وصناعية لا أدوات تقنية منفصلة (شاترستوك)

خاص من التجارب إلى المصانع... كيف يتحول الذكاء الاصطناعي بنيةً تحتية وطنية؟

ينتقل الذكاء الاصطناعي في الخليج من مرحلة التجارب إلى أنظمة تشغيلية سيادية، تُبنى بوصفها بنيةً تحتية صناعية وطنية قادرة على التوسع والحوكمة وتحقيق قيمة اقتصادية

نسيم رمضان (لندن)
تكنولوجيا «ليغو» تسوِّق منهجاً لتعليم الأطفال الذكاء الاصطناعي بأنفسهم

«ليغو» تسوِّق منهجاً لتعليم الأطفال الذكاء الاصطناعي بأنفسهم

تهدف إلى نقل الصغار من المراحل الأولى لفهمه إلى مرحلة التجربة العملية.

«الشرق الأوسط» (واشنطن)
تكنولوجيا باتت منصة «غوغل» للذكاء الاصطناعي «جيميناي» Gemini AI تضم 650 مليون مستخدم شهرياً (رويترز)

«غوغل» و«أبل» تبرمان صفقة ذكاء اصطناعي لنماذج جيميناي

أعلنت شركة «ألفابت» أنها أبرمت ​صفقة مدتها عدة سنوات مع شركة «أبل» تقضي باعتماد الجيل التالي من هواتف آيفون على ‌نماذج جيميناي التابعة ‌لـ«غوغل».

«الشرق الأوسط» (كاليفورنيا)
تكنولوجيا شهد المعرض آلاف المنتجات الاستهلاكية توزعت في مختلف المعارض وقاعات الفنادق في لاس فيغاس بأكملها (أ.ب)

في معرض «المنتجات الاستهلاكية»… هل تجاوزت تقنيات الصحة مفهوماً أوسع للعافية؟

تبرز تقنيات الصحة بوصفها قطاعاً ناضجاً ينتقل من الأجهزة القابلة للارتداء إلى حلول وقائية منزلية شاملة، جامعة الذكاء الاصطناعي وسهولة الاستخدام لمراقبة العافية.

نسيم رمضان (لاس فيغاس)

«تيك توك» تحذف نحو 3.9 مليون محتوى مخالف في السعودية نهاية 2025

تعتمد «تيك توك» بشكل متزايد على التقنيات الآلية لرصد وحذف غالبية المحتوى المخالف قبل الإبلاغ عنه من المستخدمين (رويترز)
تعتمد «تيك توك» بشكل متزايد على التقنيات الآلية لرصد وحذف غالبية المحتوى المخالف قبل الإبلاغ عنه من المستخدمين (رويترز)
TT

«تيك توك» تحذف نحو 3.9 مليون محتوى مخالف في السعودية نهاية 2025

تعتمد «تيك توك» بشكل متزايد على التقنيات الآلية لرصد وحذف غالبية المحتوى المخالف قبل الإبلاغ عنه من المستخدمين (رويترز)
تعتمد «تيك توك» بشكل متزايد على التقنيات الآلية لرصد وحذف غالبية المحتوى المخالف قبل الإبلاغ عنه من المستخدمين (رويترز)

أظهر أحدث بيانات منصة «تيك توك» أن المملكة العربية السعودية كانت من بين أكثر الأسواق نشاطاً في تطبيق سياسات السلامة الرقمية خلال الربع الثالث من عام 2025، مع حذف ما يقرب من 3.9 مليون مقطع فيديو لمخالفتها إرشادات المجتمع؛ في مؤشر على تشديد الرقابة الاستباقية على المحتوى داخل المنصة.

ووفق تقرير إنفاذ إرشادات المجتمع الصادر عن «تيك توك» للفترة من يوليو (تموز) إلى سبتمبر (أيلول) 2025، بلغ معدل الحذف الاستباقي في السعودية 99.2 في المائة، فيما أُزيل نحو 96.7 في المائة من المحتوى المخالف خلال أقل من 24 ساعة، ما يعكس سرعة الاستجابة وفعالية أنظمة الإشراف المعتمدة داخل المملكة.

ويأتي ذلك ضمن إطار أوسع شهد حذف أكثر من 17.4 مليون مقطع فيديو مخالف في منطقة الشرق الأوسط وشمال أفريقيا خلال الربع ذاته، شمل مصر والإمارات والعراق ولبنان والمغرب، مع اعتماد متزايد على التقنيات الآلية في رصد المحتوى المخالف قبل الإبلاغ عنه من المستخدمين.

إشراف استباقي وتكنولوجيا آلية

على المستوى الإقليمي والعالمي، سجل الربع الثالث من 2025 أعلى مستويات الاعتماد على الأنظمة الآلية في تاريخ المنصة، حيث جرى حذف 91 في المائة من المحتوى المخالف باستخدام تقنيات الرصد التلقائي، إلى جانب حذف 99.3 في المائة من المحتوى قبل تلقي أي بلاغات من المستخدمين. كما أزيل 94.8 في المائة من المقاطع المخالفة خلال أقل من 24 ساعة.

وتشير هذه المؤشرات إلى انتقال متزايد في نموذج الإشراف من المعالجة اللاحقة إلى التدخل المبكر، بما يقلص احتمالات تعرض المستخدمين لمحتوى مخالف، ويتيح لفرق السلامة البشرية التركيز على مراجعة الحالات المعقدة وطلبات الاستئناف والتعامل مع الأحداث المتسارعة.

كثفت المنصة إجراءات حماية القُصّر لإزالة حسابات يُشتبه في عودتها لأشخاص دون 13 عاماً على المستوى العالمي (أ.ب)

حماية الفئات العمرية الأصغر

وفي سياق متصل، كثفت «تيك توك» إجراءاتها المرتبطة بحماية القُصّر، إذ حذفت عالمياً أكثر من 22 مليون حساب يُشتبه في عودتها لأشخاص دون سن 13 عاماً خلال الربع الثالث من 2025. ويعكس ذلك تركيز المنصة على ضبط التجارب الرقمية للفئات العمرية الأصغر، بما يشمل منطقة الشرق الأوسط وشمال أفريقيا.

وتندرج هذه الجهود ضمن مساعٍ أوسع لتعزيز بيئة رقمية أكثر أماناً، لا سيما في الأسواق ذات القاعدة الشبابية الواسعة، مثل السعودية، حيث يحظى المحتوى الرقمي بتفاعل مرتفع وانتشار واسع.

البث المباشر تحت الرقابة

وشهدت سياسات البث المباشر (LIVE) تشديداً إضافياً خلال الفترة نفسها، إذ علّقت المنصة عالمياً أكثر من 32.2 مليون بث مباشر مخالف، وحظرت 623 ألف مضيف بث مباشر، في إطار تعزيز أدوات الإشراف على هذا النمط من المحتوى عالي التفاعل.

وعلى مستوى المنطقة، أوقفت «تيك توك» بشكل استباقي أكثر من 2.48 مليون بث مباشر في عدد من الدول العربية، ما يعكس توسع تطبيق القرارات الآلية بالتوازي مع التوسع في استخدام خاصية البث المباشر.

الاستئناف واستعادة المحتوى في السعودية

وفيما يتعلق بآليات الشفافية، أظهر التقرير أن السعودية جاءت في المرتبة الثانية إقليمياً من حيث عدد مقاطع الفيديو التي أُعيدت بعد قبول طلبات الاستئناف، بواقع 195711 مقطعاً. وتوضح هذه الأرقام حجم التفاعل مع نظام الاعتراض، ودوره في تحقيق توازن بين الإنفاذ الصارم لسياسات المنصة وضمان حق المستخدمين في مراجعة القرارات.

تفرض «تيك توك» رقابة مشددة على البث المباشر مع تعليق ملايين البثوث المخالفة وحظر عدد كبير من المضيفين (شترستوك)

إنفاذ سياسات تحقيق الدخل

كما واصلت «تيك توك» نشر بيانات متعلقة بسلامة تحقيق الدخل، إذ اتخذت خلال الربع الثالث من 2025 إجراءات شملت التحذير أو إيقاف تحقيق الدخل لأكثر من 3.9 مليون بث مباشر و2.1 مليون صانع محتوى على مستوى العالم، بسبب مخالفات لإرشادات تحقيق الدخل.

وتهدف هذه السياسات إلى دعم المحتوى الآمن والأصيل وعالي الجودة، مع الحد من الممارسات التي قد تستغل البث المباشر لأغراض مخالفة.

الشفافية ركيزة أساسية

ويعكس تقرير الربع الثالث من 2025 اعتماد «تيك توك» المتواصل على نموذج إشراف هجين، يجمع بين التقنيات المتقدمة وخبرات فرق متخصصة في مجالي الثقة والسلامة، في إطار سعيها لتعزيز بيئة رقمية أكثر أماناً في الأسواق الإقليمية، وعلى رأسها السعودية.

وتؤكد المنصة أن نشر تقارير الشفافية بشكل دوري يشكل عنصراً أساسياً في بناء الثقة مع المستخدمين والجهات التنظيمية، في وقت يتزايد فيه الاهتمام العالمي بتنظيم المحتوى الرقمي وحوكمة المنصات الاجتماعية.


«غوغل» تطلق ميزة جديدة لتنظيم الاشتراكات البريدية في «جيميل»

«غوغل»: الميزة الجديدة داخل «جيميل» لا تستهدف محاربة الرسائل التسويقية (جيميل)
«غوغل»: الميزة الجديدة داخل «جيميل» لا تستهدف محاربة الرسائل التسويقية (جيميل)
TT

«غوغل» تطلق ميزة جديدة لتنظيم الاشتراكات البريدية في «جيميل»

«غوغل»: الميزة الجديدة داخل «جيميل» لا تستهدف محاربة الرسائل التسويقية (جيميل)
«غوغل»: الميزة الجديدة داخل «جيميل» لا تستهدف محاربة الرسائل التسويقية (جيميل)

مع توسّع الخدمات الرقمية وتزايد التسجيل في التطبيقات والمنصات، بدأ البريد الإلكتروني في مواجهة ظاهرة متنامية، تتمثل في تراكم الرسائل الإعلانية والعروض والاشتراكات الدورية. هذا التراكم لا يعرقل تجربة الاستخدام فحسب، بل يشتت الانتباه ويؤثر على قدرة المستخدم على الوصول إلى الرسائل المهمة. ورغم أن هذه الرسائل ليست «سباماً» بالمعنى التقني، فإنها تشكل عبئاً حقيقياً على المستخدم عندما تُخفي خلفها مراسلات شخصية أو مهنية أكثر أهمية.

في هذا السياق، أعلنت «غوغل» عن إطلاق ميزة جديدة داخل خدمة البريد الإلكتروني «جيميل» (Gmail) تحمل اسم إدارة الاشتراكات (Manage Subscriptions)، وذلك لمعالجة هذا النوع من الإزعاج بطريقة عملية ومنظمة.

اشتراكات مشروعة... وإزعاج متواصل

الإزعاج الذي يشتكي منه المستخدمون في بريدهم ليس بالضرورة ناتجاً عن رسائل احتيالية أو عشوائية، بل بسبب اشتراكات بريدية قانونية حصلت بموافقة المستخدم عند التسجيل في مواقع التجارة الإلكترونية أو المتاجر الرقمية أو التطبيقات أو الفعاليات. ومع الوقت، تتحول هذه الاشتراكات إلى ما يمكن تسميته بـ«الإزعاج المشروع» دون أن تمارس أي انتهاك. نتيجة ذلك، يتراجع حضور البريد الشخصي والمهني داخل صندوق الوارد، وتقل فاعلية البريد كأداة اتصال يومية.

ميزة تجمع اشتراكات البريد في صفحة واحدة وتتيح إلغاءها مباشرة لتنظيم الإيميل (جيميل)

«غوغل» تدخل على الخط

تقول «غوغل» إن الميزة الجديدة داخل «جيميل» لا تستهدف محاربة الرسائل التسويقية، بل تهدف إلى تنظيمها وإعادة السيطرة للمستخدم.

تعتمد الميزة على مبدأ بسيط وفعّال، وهو أن جمع كل القوائم البريدية النشطة في صفحة واحدة داخل «جيميل»، مع ترتيب الجهات الأكثر إرسالاً، وإتاحة خيار إلغاء الاشتراك مباشرة دون الانتقال إلى روابط خارجية أو تعبئة نماذج إضافية. هذا النموذج يعالج فجوة تقنية كانت موجودة منذ سنوات، حيث كان إلغاء الاشتراك سابقاً يتطلب فتح رابط خارجي قد يكون غير موثوق، أو المرور بخطوات مصممة لجعل الإلغاء أقل سهولة.

إلغاء الاشتراكات البريدية مباشرة من صفحة واحدة دون فتح روابط خارجية (جيميل)

فوائد تنظيمية وأمنية

تقول «غوغل» إن الميزة تهدف إلى تحسين تجربة البريد من خلال:

• تقليل الرسائل الترويجية المتكررة

• إبراز الرسائل المهمة ذات الأولوية

• رفع مستوى الأمان عبر تقليل التفاعل مع الروابط الخارجية

• تحسين الإنتاجية وتقليل وقت الفرز اليدوي

• تعزيز تنظيم البريد على المدى الطويل

هذه الخطوة لا تأتي مجرد تحسين بصري أو تقني، بل ضمن توجه أوسع لجعل البريد الإلكتروني أكثر قابلية للإدارة في ظل توسع الاشتراكات الرقمية.


فيديو: روبوت بملامح بشرية يستبق تعابير الوجه ويُتقن مزامنة الشفاه عبر لغات متعددة

فيديو: روبوت بملامح بشرية يستبق تعابير الوجه ويُتقن مزامنة الشفاه عبر لغات متعددة
TT

فيديو: روبوت بملامح بشرية يستبق تعابير الوجه ويُتقن مزامنة الشفاه عبر لغات متعددة

فيديو: روبوت بملامح بشرية يستبق تعابير الوجه ويُتقن مزامنة الشفاه عبر لغات متعددة

في خطوة جديدة على طريق تعزيز التفاعل بين الإنسان والآلة، طوّر باحثون نظاماً متقدماً يتيح للروبوتات ذات الملامح البشرية مزامنة حركات الشفاه مع الصوت المنطوق بدقة عالية، بما يقرّب تعابيرها من السلوك الإنساني الطبيعي أكثر من أي وقت مضى. ويعتمد النظام على نموذج عكسي مُحسَّن قادر على توليد أوامر الحركة بسرعة تفوق النماذج السابقة بخمس مرات؛ ما يسمح باستجابات آنية تحاكي التفاعل البشري المباشر.

ووفقاً لفريق بحثي من جامعة كولومبيا، جرى اختبار النظام على أكثر من 45 مشاركاً، وأظهرت النتائج تفوقه على خمسة مناهج معتمدة حالياً، محققاً أعلى درجات التطابق بين حركات فم الروبوت ونماذج مرجعية مثالية، وفقاً لموقع «إنترستنغ إنجنيرنغ».

تعميم لغوي يتجاوز بيانات التدريب

اللافت في هذا التطور أن النظام لا يقتصر على لغة بعينها؛ إذ أظهر قدرة لافتة على التعميم عبر لغات متعددة، من بينها الفرنسية والصينية والعربية، حتى وإن لم تكن ضمن بيانات التدريب الأصلية.

ويقول الباحثون إن الإطار الجديد «يمكّن من توليد حركات شفاه واقعية عبر 11 لغة غير إنجليزية ذات بُنى صوتية مختلفة»؛ ما يفتح المجال أمام استخدامات أوسع في التعليم، وخدمات الدعم الاجتماعي، ورعاية المسنين.

ورغم هذه الإمكانات، شدد الفريق على أهمية التعامل الحذر مع هذه التقنيات المتقدمة، تفادياً لأي استخدامات غير أخلاقية أو مضللة.

من التفاعل المتأخر إلى الاستجابة الاستباقية

ولا تزال معظم الروبوتات الحالية تعتمد على التفاعل المتأخر، حيث تقلّد تعابير الإنسان بعد حدوثها؛ ما يمنح التواصل طابعاً آلياً مصطنعاً في المقابل، تمثل التعابير الاستباقية القائمة على التنبؤ بردود الفعل العاطفية عنصراً محورياً في بناء تفاعل طبيعي، لا سيما فيما يتعلق بالابتسامات وتعبيرات الوجه التي تعزز الثقة والروابط الاجتماعية.

وتسعى الأبحاث الحديثة في مجال الروبوتات الاجتماعية إلى تجاوز نماذج الرسوم المتحركة المبرمجة مسبقاً، نحو تعابير ديناميكية عفوية قادرة على دعم الاندماج السلس للروبوتات في البيئات البشرية.

«إيمو»... وجه آلي بقدرات تعبيرية متقدمة

ضمن هذا السياق، كشف الفريق عن روبوت وجهي متطور أُطلق عليه اسم «إيمو»، صُمّم خصيصاً لتعزيز التفاعل الاجتماعي. ويعد «إيمو» تطويراً للمنصة السابقة «إيفا»، مع تحسينات عتادية بارزة، أبرزها تزويده بـ26 مشغّلاً (actuator) تسمح بإنتاج تعابير وجه غير متناظرة، مقارنة بعشرة فقط في النسخة السابقة.

ويعتمد الروبوت على نظام مغناطيسي مباشر لتشكيل جلد قابل للاستبدال، ما يتيح تحكماً أدق مقارنة بأنظمة الكابلات التقليدية. كما زُوّد بكاميرات RGB عالية الدقة مدمجة في العينين، تمنحه قدرة متقدمة على الإدراك البصري الآني واستشراف تعابير الطرف المقابل.

تعبيرات آنية بزمن قياسي

ولتحقيق التزامن الدقيق، طوّر الباحثون نموذجاً تنبؤياً دُرِّب على 970 مقطع فيديو، قادر على استشراف التعابير المستقبلية انطلاقاً من تغيرات وجهية أولية دقيقة. ويعمل النموذج بسرعة تصل إلى 650 إطاراً في الثانية، بينما ينفّذ النموذج العكسي أوامر المحركات بسرعة 8000 إطار في الثانية، ما يتيح توليد التعابير خلال 0.002 ثانية فقط.

وبما أن تعابير الوجه البشرية تستغرق عادةً نحو 0.8 ثانية، فإن هذا الفارق الزمني يمنح الروبوت هامشاً مريحاً للاستجابة المتزامنة. وأظهرت التحليلات أن النموذج نجح في التنبؤ الصحيح بتفعيل التعابير في أكثر من 72 في المائة من الحالات، مع دقة تنبؤية إيجابية تجاوزت 80 في المائة.

تحديات ثقافية وحدود قائمة

ورغم النتائج المشجعة، أقرّ الباحثون بوجود تحديات ثقافية، إذ تختلف أنماط التعبير والتواصل البصري من مجتمع إلى آخر. ومع ذلك، يرون أن الانتقال من محاكاة التعابير إلى استباقها يمثل خطوة جوهرية في التطور الاجتماعي للروبوتات، ويقربها أكثر من فهم السلوك الإنساني والتفاعل معه بواقعية أكبر.