«سونوس» تطلق ميزة «تحسين الكلام» المدعومة بالذكاء الاصطناعي لحل مشكلة عدم وضوح الحوارات

توفر مستويات تحكم مرنة تناسب مختلف الاحتياجات السمعية خصوصاً لضعاف السمع

شريط «آرك ألترا» الصوتي يدعم ميزة «تحسين الكلام» لضعاف السمع
شريط «آرك ألترا» الصوتي يدعم ميزة «تحسين الكلام» لضعاف السمع
TT

«سونوس» تطلق ميزة «تحسين الكلام» المدعومة بالذكاء الاصطناعي لحل مشكلة عدم وضوح الحوارات

شريط «آرك ألترا» الصوتي يدعم ميزة «تحسين الكلام» لضعاف السمع
شريط «آرك ألترا» الصوتي يدعم ميزة «تحسين الكلام» لضعاف السمع

واجهت شركات الصوتيات تحديات كبيرة في تقديم تجربة استماع مثالية للمحتوى المرئي، خاصة عندما يتعلق الأمر بوضوح حوارات الشخصيات في عروض الفيديو، مثل الأفلام، والمسلسلات، والبرامج الوثائقية، والنشرات الإخبارية، والمحتوى التعليمي.

وكثيراً ما يجد المشاهدون أنفسهم يركزون لتمييز الكلمات المنطوقة وسط المؤثرات الصوتية، والموسيقى التصويرية، ما يخفض من متعة التجربة ككل. هذه المشكلة التي تؤثر على شريحة واسعة من الجمهور دفعت تلك الشركات إلى البحث عن حلول مبتكرة تتجاوز التعديلات التقليدية للصوت، ومنها شركة «سونوس» Sonos التي طورت ميزة ثورية جديدة مدعومة بالذكاء الاصطناعي لتحسين وضوح الكلام. وتعد هذه الميزة بتقديم تجربة استماع مطورة بشكل جذري، حيث يصبح الحوار أكثر وضوحاً وتمييزاً من أي وقت مضى.

سماعة «إيرا 100 برو» بسلك واحد لنقل الصوتيات والطاقة الكهربائية

تحسين الكلام بالذكاء الاصطناعي

تقدم هذه الميزة الجديدة المسماة «تحسين الكلام» Speech Enhancement أربعة مستويات للتحكم في وضوح الحوار، ما يمنح المستخدمين مرونة غير مسبوقة لتكييف الصوت مع تفضيلاتهم، واحتياجاتهم السمعية. هذه المستويات تتدرج من «منخفض»، و«متوسط»، إلى «عالٍ»، و«الأقصى»، ما يتيح للمستخدمين ضبط الإعدادات بدقة لتحقيق التوازن المثالي بين وضوح الكلام وبقية عناصر الصوت.

ويكمن الابتكار الحقيقي في المستوى «الأقصى» الذي تم تصميمه خصيصاً لتلبية احتياجات الأفراد الذين يعانون من ضعف السمع. ولا يركز هذا المستوى فقط على تحسين وضوح الحوار بشكل عام، بل يعطي الأولوية القصوى لفصل الكلام عن الخلفية الصوتية، ما يجعله متميزاً، ومفهوماً بشكل استثنائي.

وتعتمد هذه الميزة المتقدمة على تقنيات التعلم الآلي المتطورة، حيث تقوم بتحليل وفصل الحوار عن المؤثرات الصوتية والموسيقى في الوقت الفعلي. هذا الأمر يعني أن النظام لا يقوم ببساطة برفع مستوى صوت الحوار، بل يفهم مكونات الصوت، ويقوم بمعالجة ذكية لتعزيز وضوح الكلام دون التأثير سلباً على جودة الصوت الإجمالية للمحتوى.

دعم متميز لضعاف السمع

ولضمان فعالية ودقة هذه الميزة، تعتمد التقنية على خوارزميات الذكاء الاصطناعي، إضافة إلى تضمين معلومات من منظمات متخصصة، مثل المعهد الوطني الملكي للصم Royal National Institute for Deaf People RNID الذي يُعتبر جهة رائدة في مجال دعم الأشخاص الذين يعانون من ضعف السمع، ما يضيف بُعداً إنسانياً وعملياً لعملية التطوير.

وفي إطار هذا التعاون، دمجت «سونوس» الملاحظات القيمة من 37 مشاركاً بقدرات سمعية مختلفة، والذين يمثلون طيفاً واسعاً من ذوي الاحتياجات السمعية برؤى حاسمة ساهمت في تصميم واختبار الميزة، مما يضمن أنها تلبي توقعات المستخدمين، وتوفر تحسناً ملموساً في وضوح الكلام لمختلف درجات السمع.

إن دمج الذكاء الاصطناعي بهذا الشكل ليس مجرد إضافة تقنية، بل هو خطوة نحو جعل الترفيه الصوتي والمرئي أكثر شمولاً وسهولة في الوصول إليه للجميع، بغض النظر عن قدراتهم السمعية.

هذه الميزة المبتكرة متاحة لمستخدمي سماعات الصوت «سونوس آرك ألترا» Sonos Arc Ultra كجزء من تحديث برمجي مجاني، مما يعني أن المستخدمين الحاليين سيتمكنون من الاستفادة منها دون الحاجة إلى شراء جهاز جديد. وتدل هذه الميزة أيضاً على الدور المتزايد للذكاء الاصطناعي في تحسين تجارب المستخدمين في حياتهم اليومية. ومع استمرار تطور تقنيات الذكاء الاصطناعي، يمكننا أن نتوقع المزيد من الابتكارات التي ستجعل التقنية أكثر ذكاء، وتلبية لاحتياجاتنا الفردية.

حوار مع ممثلي الشركة

تحدثت «الشرق الأوسط» مع فنسنت هولار، مدير التجزئة في أوروبا والشرق الأوسط وأفريقيا لشركة «سونوس»، وكريم زكي، الرئيس التنفيذي لشركة «جي آر ميديا سوليوشنز» GR Media Solutions، في مدينة الرياض خلال وجودهما في المعرض السعودي للإضاءة والصوت، حيث قالا إن تجربة الصوت لم تعد تقتصر على الاستماع إلى الموسيقى فحسب، بل امتدت لتشمل وضوح الحوار في الأفلام، والبرامج التلفزيونية، وهو ما لطالما شكل تحدياً للعديد من المستخدمين.

فنسنت هولار مدير التجزئة في أوروبا والشرق الأوسط وأفريقيا لشركة «سونوس«

وتحدثا عن تقنية «تحسين الكلام» المدعومة بالذكاء الاصطناعي بهدف الارتقاء بتجربة الترفيه الصوتي إلى مستويات غير مسبوقة، حيث تعالج هذه الميزة مشكلة عدم وضوح الحوار في المحتوى الصوتي والمرئي، خاصة للأشخاص الذين يعانون من ضعف السمع، لتصبح الأصوات أكثر وضوحاً وتمييزاً، حتى في وجود ضوضاء خلفية عالية، مما يخفض الحاجة إلى قراءة الترجمة، ويعزز تجربة المشاهدة للجميع.

وبالإضافة إلى تحسين الكلام، تم دمج تقنيات الذكاء الاصطناعي في ميزات أخرى مثل التحكم الصوتي.

وتأتي كل سماعة من «سونوس» مزودة بمساعد «أليكسا» المدمج، مما يسمح للمستخدمين التحكم بالأجهزة الصوتية، والمصابيح المنزلية الذكية باستخدام الأوامر الصوتية، وبالتالي إضافة مستوى إضافي من الراحة، والتفاعل الذكي مع النظام الصوتي المنزلي.

وأضافا أن سماعة «إيرا 100 برو» Era 100 Pro تتميز بسهولة التركيب، وإمكانية الوصول المباشر إلى المحتوى عبر الإنترنت، إلى جانب شريط «آرك ألترا» Arc Ultra الصوتي الذكي، وسماعات جهورية Subwoofer مُحدثة، مما يُعزز خيارات الصوت المنزلي بجودة استثنائية. وتستخدم هذه السماعات تقنية «الطاقة عبر كابل الشبكات بلاس» Power over Ethernet Plus من خلال نقل الطاقة الكهربائية والبيانات عبر كابل واحد، مما يعزز من موثوقية الاتصال، وجودة الإشارة، خاصة في البيئة التي تعاني من تداخل كبير.

وأشار المتحدثان إلى النمو المتسارع لقطاع الترفيه والضيافة في المملكة العربية السعودية، مشيرين إلى تحول ثقافي كبير في طريقة تفاعل الناس مع الموسيقى والأفلام، حيث شهدت المملكة تحولاً ملحوظاً في السنوات الأخيرة من سوق محدودة لأجهزة تشغيل الموسيقى إلى بيئة مزدهرة. وتوقعا أن تتضاعف مبيعات التقنيات الصوتية في المملكة خلال السنوات الخمس المقبلة، مؤكدين أن رؤية المملكة 2030 تشكل فرصة مثالية للمساهمة في مشاريع الترفيه والثقافة والتقنية.

كما تقدم سماعات «سونوس» برمجيات وتصميماً متميزاً لإحداث نقلة نوعية في تجربة الاستخدام، حيث يعتمد نظام «سونوس» بشكل كامل على البرمجيات، مما يجعله أكثر مرونة وموثوقية. وهذا النهج يُمكّن المستخدمين من التحكم في نظامهم الصوتي عبر منصة واحدة بغض النظر عن عدد الغرف، أو السماعات المتصلة. وتجمع هذه البرمجيات كل خدمات الموسيقى في مكان واحد من داخل تطبيق سلس يسمح للمستخدمين بالوصول إلى خدمات مثل «موسيقى أبل» و«سبوتيفاي» و«أنغامي» و«يوتيوب ميوزيك» و«ساوندكلاود»، وغيرها بكلمة مرور واحدة خاصة بالتطبيق. هذا الأمر يعني أن البحث عن أغنية معينة سيُظهر نتائج من جميع المنصات، مع توفير إمكانية تشغيل كل أغنية في غرفة مختلفة في المنزل بشكل مستقل، مما يلبي تطلعات الجيل الجديد الذي يبحث عن البساطة، والتواصل السلس.

كريم زكي الرئيس التنفيذي لشركة «جي آر ميديا سوليوشنز«

وتُقدم السماعات كذلك ميزة ضبط الصوت تلقائياً للغرفة باستخدام الميكروفون الموجود في الهاتف الذكي (من خلال استخدام التطبيق)، إضافة إلى إمكانية ضبط النظام الصوتي من خلال الميكروفونات المدمجة في السماعات نفسها ليناسب خصائص الغرفة المحددة في دقائق معدودة، مما يضمن أفضل جودة صوت ممكنة.

وبالنسبة للاستخدامات في غرف الاجتماعات والحفلات والمقاهي وقطاع الترفيه والأعمال، فتقدم الشركة «حلاً مبتكراً لمشكلة تأخر الصوت Latency التي قد تظهر في الأنظمة اللاسلكية ذات السماعات المتعددة. وبفضل تقنيتها اللاسلكية المتطورة، تضمن سماعات «سونوس» وصول الصوت إلى جميع السماعات في الوقت نفسه دون أي تأخير، مما يوفر تجربة صوتية متزامنة وسلسة، حتى في المساحات الكبيرة.

كما تطرق المتحدثان إلى استخدام تقنية جديدة في مكبرات الصوت لتقديم صوتيات جهورية Bass قوية وواسعة من مكبر صوت صغير. وتعتمد هذه التقنية التي تم استخدامها لأول مرة في شريط «آرك ألترا» الصوتي على مكونات مغناطيسية مطورة تسمح بإيجاد جودة صوت استثنائية، وعمق في الصوتيات الجهورية، مما يُسهم في تجربة استماع غامرة.


مقالات ذات صلة

بيانات الصوت البيومترية... هل تهدد الخصوصية في زمن الخوارزميات؟

تكنولوجيا تقنيات الذكاء الاصطناعي أصبحت قادرة على استخراج معلومات حساسة من الصوت دون علم المتحدث (أدوبي)

بيانات الصوت البيومترية... هل تهدد الخصوصية في زمن الخوارزميات؟

الصوت يحمل بيانات شخصية حساسة تكشف الصحة والمشاعر والهوية، ومع تطور تقنيات تحليل الكلام تزداد تحديات الخصوصية والحاجة لحمايتها بوعي وتشريعات.

نسيم رمضان (لندن)
الاقتصاد من داخل معرض «سيمكون تايوان» للرقائق في تايبيه (أرشيفية - رويترز)

تايوان تطرق أبواب واشنطن بـ«سلاح» الذكاء الاصطناعي

تهدف تايوان إلى أن تصبح شريكاً استراتيجياً للولايات المتحدة في مجال الذكاء الاصطناعي بعد إبرام اتفاقية لتخفيض الرسوم الجمركية وتعزيز استثماراتها في البلاد.

«الشرق الأوسط» (تايبيه)
تكنولوجيا تعتمد «تيك توك» بشكل متزايد على التقنيات الآلية لرصد وحذف غالبية المحتوى المخالف قبل الإبلاغ عنه من المستخدمين (رويترز)

«تيك توك» تحذف نحو 3.9 مليون محتوى مخالف في السعودية نهاية 2025

«تيك توك» تحذف أيضاً أكثر من 17.4 مليون مقطع فيديو مخالف في منطقة الشرق الأوسط وشمال أفريقيا.

نسيم رمضان (لندن)
خاص يشكّل التصوير الجزيئي ركيزة أساسية في التحول الصحي لدعم الاكتشاف المبكر والطب الدقيق والرعاية الوقائية (شاترستوك)

خاص التصوير الجُزيئي كـ«بنية تحتية»: كيف يدعم التحول الصحي في السعودية؟

يتوسع التصوير الجزيئي في السعودية لدعم التشخيص المبكر والطب الدقيق، فيما يظل التنسيق والبنية التحتية والكوادر التحدي الأبرز، لا توفر الأجهزة فقط.

نسيم رمضان (لندن)
الاقتصاد شعار شركة «تي إس إم سي» خلال معرض تايوان للابتكار التكنولوجي في مركز التجارة العالمي بتايبيه (أ.ب)

«تي إس إم سي» التايوانية تتجاوز التوقعات بأرباح قياسية نهاية 2025

أعلنت شركة تايوان لصناعة أشباه الموصلات المحدودة (تي إس إم سي)، الرائدة عالمياً في تصنيع رقائق الذكاء الاصطناعي والمورد الرئيسي لشركة «إنفيديا».

«الشرق الأوسط» (تايبيه )

دراسة جديدة تكشف حدود الذكاء الاصطناعي في إنجاز مشاريع العمل عن بُعد

الدراسة تقدم «مؤشر العمل عن بُعد» كأول مقياس واقعي لقدرة الذكاء الاصطناعي على إنجاز مشاريع عمل حقيقية متكاملة (شاترستوك)
الدراسة تقدم «مؤشر العمل عن بُعد» كأول مقياس واقعي لقدرة الذكاء الاصطناعي على إنجاز مشاريع عمل حقيقية متكاملة (شاترستوك)
TT

دراسة جديدة تكشف حدود الذكاء الاصطناعي في إنجاز مشاريع العمل عن بُعد

الدراسة تقدم «مؤشر العمل عن بُعد» كأول مقياس واقعي لقدرة الذكاء الاصطناعي على إنجاز مشاريع عمل حقيقية متكاملة (شاترستوك)
الدراسة تقدم «مؤشر العمل عن بُعد» كأول مقياس واقعي لقدرة الذكاء الاصطناعي على إنجاز مشاريع عمل حقيقية متكاملة (شاترستوك)

أعاد التطور السريع في تقنيات الذكاء الاصطناعي طرح أسئلة قديمة متجددة حول الأتمتة ومستقبل العمل. فمن تطوير البرمجيات إلى إنتاج المحتوى، باتت أنظمة الذكاء الاصطناعي تُظهر قدرات لافتة في الاختبارات البحثية والمعايير التقنية. لكن فجوة أساسية ما زالت قائمة تتعلق بقدرة هذه الأنظمة على تنفيذ أعمال حقيقية ذات قيمة اقتصادية، كما هي مطلوبة في سوق العمل الفعلي.

دراسة جديدة تسعى للإجابة عن هذا السؤال عبر إطار قياس مبتكر يُعرف باسم «مؤشر العمل عن بُعد» (Remote Labor Index – RLI)، وهو أول معيار تجريبي يقيس بشكل منهجي قدرة وكلاء الذكاء الاصطناعي على أتمتة مشاريع عمل متكاملة مأخوذة من أسواق العمل الحر الحقيقية. وتأتي النتائج مفاجئة، وأكثر واقعية مما توحي به كثير من السرديات المتداولة حول قرب الاستغناء عن الوظائف البشرية.

ما بعد المعايير الاصطناعية

تركز معظم اختبارات الذكاء الاصطناعي الحالية على مهام محددة أو معزولة ككتابة شيفرات قصيرة أو الإجابة عن أسئلة تقنية أو تصفح الإنترنت أو تنفيذ أوامر حاسوبية مبسطة. ورغم أهمية هذه المعايير، فإنها غالباً لا تعكس التعقيد والتكامل والغموض الذي يميز العمل المهني الحقيقي.

من هنا جاء تطوير «مؤشر العمل عن بُعد»، الذي لا يختبر مهارات منفصلة، بل يقيس قدرة أنظمة الذكاء الاصطناعي على إنجاز مشاريع كاملة من البداية إلى النهاية، تماماً كما تُسند إلى محترفين يعملون لحساب عملاء حقيقيين. وتشمل هذه المشاريع مجالات مثل التصميم والهندسة المعمارية وإنتاج الفيديو وتحليل البيانات وتطوير الألعاب وإعداد الوثائق وغيرها من أشكال العمل عن بُعد التي تشكل جوهر الاقتصاد الرقمي المعاصر. وبهذا، تنقل الدراسة النقاش من مستوى القدرات النظرية إلى مستوى الأداء الفعلي القابل للقياس في السوق.

نتائج المؤشر تظهر أن الذكاء الاصطناعي ما زال عاجزاً عن أتمتة معظم مشاريع العمل عن بُعد بمستوى مهني مقبول (غيتي)

قياس مؤشر العمل عن بُعد

تتكون قاعدة بيانات المؤشر من 240 مشروع عمل حر مكتمل، يحتوي كل مشروع على ثلاثة عناصر رئيسية هي وصف تفصيلي للمهمة والملفات المدخلة اللازمة لتنفيذها ومخرجات نهائية أنجزها محترفون بشريون باعتبارها مرجعاً قياسياً. ولم تكتفِ الدراسة بالمخرجات فقط، بل جمعت أيضاً بيانات عن الوقت والتكلفة اللازمين لتنفيذ كل مشروع. وقد استغرق إنجاز المشروع الواحد، في المتوسط، نحو 29 ساعة من العمل البشري، بينما تجاوزت بعض المشاريع حاجز 100 ساعة. وتراوحت تكاليف المشاريع بين أقل من 10 دولارات وأكثر من 10 آلاف دولار، بإجمالي قيمة تتجاوز 140 ألف دولار وأكثر من 6 آلاف ساعة عمل فعلي.

ويعكس هذا التنوع والتعقيد المتعمد طبيعة العمل الحقيقي، بعيداً عن المهام المبسطة أو المتخصصة.

تقييم أداء الذكاء الاصطناعي

اختبر الباحثون عدة نماذج متقدمة من وكلاء الذكاء الاصطناعي باستخدام عملية تقييم بشرية دقيقة حيث مُنحت الأنظمة نفس أوصاف المشاريع والملفات التي حصل عليها المحترفون، وطُلب منها إنتاج مخرجات كاملة. ثم قام مقيمون مدربون بمقارنة نتائج الذكاء الاصطناعي بالمخرجات البشرية المرجعية، مع التركيز على سؤال جوهري يتعلق بمدى قبول العميل الحقيقي لهذا العمل باعتباره مكافئاً أو أفضل من عمل محترف بشري.

المقياس الأساسي في الدراسة هو «معدل الأتمتة» أي النسبة المئوية للمشاريع التي نجح الذكاء الاصطناعي في إنجازها بمستوى احترافي مقبول. كما استخدمت الدراسة نظام تصنيف شبيهاً بنظام «إيلو» لإجراء مقارنات دقيقة بين النماذج المختلفة، حتى في الحالات التي لم تصل فيها أي منها إلى مستوى الأداء البشري.

الأتمتة ما زالت محدودة جداً

على الرغم من التطورات الكبيرة في قدرات التفكير والتعامل متعدد الوسائط، تكشف النتائج أن أنظمة الذكاء الاصطناعي الحالية ما تزال بعيدة عن أتمتة العمل عن بُعد بشكل واسع. فقد بلغ أعلى معدل أتمتة تحقق 2.5 في المائة فقط، أي أن أقل من ثلاثة مشاريع من كل مائة وصلت إلى مستوى مقبول مقارنة بالعمل البشري. وتتحدى هذه النتيجة الافتراض السائد بأن التحسن في المعايير التقنية يعني بالضرورة قدرة فورية على استبدال العمل البشري. فحتى النماذج المتقدمة القادرة على كتابة الشيفرات أو توليد الصور والنصوص، غالباً ما تفشل عندما يُطلب منها دمج مهارات متعددة، أو الالتزام بتفاصيل معقدة أو تسليم ملفات متكاملة بجودة احترافية.

مستقبل العمل القريب يتجه نحو دعم الإنتاجية البشرية بالذكاء الاصطناعي بدلاً من استبدال الوظائف بالكامل (شاترستوك)

تعثر الذكاء الاصطناعي... ونجاحه

يكشف التحليل النوعي لأسباب الفشل عن مشكلات متكررة، أبرزها أخطاء تقنية أساسية مثل ملفات تالفة أو غير قابلة للاستخدام أو صيغ غير صحيحة أو مخرجات ناقصة وغير متسقة. وفي حالات أخرى، كانت المشاريع مكتملة شكلياً لكنها لا ترقى إلى المستوى المهني المتوقع في سوق العمل الحر.

في المقابل، رصدت الدراسة مجالات محدودة أظهر فيها الذكاء الاصطناعي أداءً أفضل نسبياً، لا سيما في المهام التي تتركز على معالجة النصوص أو توليد الصور أو التعامل مع الصوت كبعض أعمال التحرير الصوتي والتصميم البصري البسيط وكتابة التقارير وتصور البيانات المعتمد على الشيفرة البرمجية. وتشير هذه النتائج إلى أن الذكاء الاصطناعي يلعب بالفعل دوراً داعماً في بعض أنواع العمل، وإن لم يصل بعد إلى مرحلة الأتمتة الكاملة.

قياس التقدم دون تهويل

رغم انخفاض معدلات الأتمتة المطلقة، يُظهر المؤشر تحسناً نسبياً واضحاً بين النماذج المختلفة. فتصنيفات «إيلو» وهي نظام رياضي لتقييم الأداء النسبي، تشير إلى أن الأنظمة الأحدث تتفوق بشكل منهجي على سابقاتها، ما يعني أن التقدم حقيقي وقابل للقياس، حتى وإن لم يترجم بعد إلى إنجاز مشاريع كاملة. وتكمن قيمة «مؤشر العمل عن بُعد» في كونه أداة طويلة الأمد لمتابعة التطور، بعيداً عن التوقعات المبالغ فيها أو الأحكام الثنائية.

تشير نتائج الدراسة إلى أن الاستغناء الواسع عن العاملين في وظائف العمل عن بُعد ليس وشيكاً في الوقت الراهن. وبدلاً من ذلك، يُرجّح أن يكون الأثر القريب للذكاء الاصطناعي متمثلاً في تعزيز الإنتاجية على مستوى المهام، لا استبدال الوظائف بالكامل.

وسيظل الحكم البشري والقدرة على الدمج وضبط الجودة عناصر مركزية في العمل المهني. ومع ذلك، تحذر الدراسة من أن الذكاء الاصطناعي يختلف عن تقنيات الأتمتة السابقة؛ إذ يسعى إلى محاكاة قدرات معرفية عامة. وإذا تمكنت الأنظمة المستقبلية من سد الفجوة التي يكشفها المؤشر دون التكيّف المصطنع معه، فقد تكون الآثار على سوق العمل أعمق بكثير.

خط أساس جديد للنقاش

لا تدّعي هذه الدراسة التنبؤ بالمستقبل، لكنها تقدم خط أساس علمي وعملي لفهم موقع الذكاء الاصطناعي اليوم. ومن خلال ربط التقييم بعمل حقيقي وتكلفة فعلية ومعايير مهنية واقعية، تضع إطاراً أكثر دقة لنقاشات الأتمتة والعمل. ومع استمرار تطور الذكاء الاصطناعي، ستصبح أدوات مثل «مؤشر العمل عن بُعد» ضرورية للفصل بين التقدم الحقيقي والضجيج الإعلامي، وضمان أن يُبنى النقاش حول مستقبل العمل على الأدلة لا الافتراضات.


بيانات الصوت البيومترية... هل تهدد الخصوصية في زمن الخوارزميات؟

تقنيات الذكاء الاصطناعي أصبحت قادرة على استخراج معلومات حساسة من الصوت دون علم المتحدث (أدوبي)
تقنيات الذكاء الاصطناعي أصبحت قادرة على استخراج معلومات حساسة من الصوت دون علم المتحدث (أدوبي)
TT

بيانات الصوت البيومترية... هل تهدد الخصوصية في زمن الخوارزميات؟

تقنيات الذكاء الاصطناعي أصبحت قادرة على استخراج معلومات حساسة من الصوت دون علم المتحدث (أدوبي)
تقنيات الذكاء الاصطناعي أصبحت قادرة على استخراج معلومات حساسة من الصوت دون علم المتحدث (أدوبي)

نحن نتحدث يومياً دون أن نفكر كثيراً في مقدار ما تكشفه أصواتنا عنّا. فإلى جانب الكلمات التي نختارها، يحمل الصوت إشارات دقيقة عن هويتنا قد تكشف معلومات صحية وخلفيات ثقافية وحالات عاطفية، ومستوى التعليم وربما حتى ميولاً فكرية. وحتى وقت قريب، كان هذا الإدراك يقتصر على الحدس البشري؛ إذ يمكننا غالباً أن نميّز تعب صديق أو سعادته أو توتره من نبرة صوته فقط. لكن اليوم، باتت الأنظمة الحاسوبية قادرة على فعل ذلك وأكثر بدقة متزايدة.

ويحذّر باحثون في تقنيات الكلام واللغة من أن هذه القدرات تمثل تحدياً حقيقياً للخصوصية. فالصوت لم يعد مجرد وسيلة لإعطاء الأوامر للمساعدات الرقمية أو أداة للحوار، بل أصبح وعاءً غنياً بالمعلومات الشخصية التي تستطيع الخوارزميات الحديثة استخراجها، غالباً دون علم المتحدث أو موافقته.

لماذا يُعد الصوت بيانات شخصية؟

عندما نتحدث، لا تنتقل الرسالة اللغوية وحدها. فإيقاع الكلام ودرجة الصوت والتوقفات بين الكلمات وأنماط التنفس والخصائص الصوتية الأخرى، جميعها تحمل طبقات متعددة من المعلومات الشخصية. ويشير خبراء تقنيات الكلام إلى أن هذه المعلومات مدمجة مباشرة في الإشارة الصوتية نفسها، أي أنها تُفصح تلقائياً عن صاحبها بمجرد التحدث، دون أي نية واعية للكشف عنها.

وتستطيع هذه الخصائص الصوتية أن تعكس مؤشرات تتعلق بالصحة الجسدية أو النفسية، مثل الإرهاق أو مشكلات في الجهاز التنفسي. كما يمكن أن تشير إلى خلفية المتحدث الثقافية أو الجغرافية من خلال اللهجة ونمط النطق. إضافة إلى ذلك، تحمل الأصوات دلائل عاطفية تُمكّن الأنظمة المتقدمة من استنتاج ما إذا كان الشخص متوتراً أو هادئاً أو متحمساً أو مضطرباً. ولهذا، يُصنَّف الصوت ضمن فئة البيانات البيومترية أي البيانات الشخصية العميقة، الفريدة غالباً، والتي يصعب تغييرها أو استبدالها.

وبسبب هذه الحساسية، تُعامل البيانات الصوتية في العديد من التشريعات الحديثة باعتبارها بيانات محمية. ففي الاتحاد الأوروبي، على سبيل المثال، يمكن أن يندرج الصوت ضمن البيانات البيومترية الخاضعة لقواعد صارمة بموجب اللائحة العامة لحماية البيانات (GDPR)، ما يستلزم توفير ضمانات إضافية والحصول على موافقة صريحة في كثير من الحالات.

تحليل الصوت يطرح مخاطر تتعلق بالخصوصية قد تمتد إلى التوظيف والتأمين والتسويق والمراقبة (شاترستوك)

مخاطر الإفراط في كشف المعلومات

تثير القدرة على استخراج سمات شخصية من الصوت مخاوف تتجاوز مسألة الراحة أو التخصيص. فمع تطور تقنيات تحليل الصوت وانتشارها، قد تمتد آثارها إلى مجالات حساسة في حياة الأفراد. فقد تُستخدم الاستنتاجات المستخلصة من أنماط الكلام يوماً ما للتأثير في قرارات التوظيف أو تقييمات التأمين إذا أسيء استخدامها. كما يمكن للمعلنين استغلال الإشارات العاطفية أو السلوكية المستخلصة من الصوت لتقديم رسائل تسويقية شديدة الاستهداف، وربما ذات طابع تلاعبي.

وتتفاقم المخاطر مع احتمالات سوء الاستخدام، مثل المراقبة غير المشروعة أو التحرش أو تتبع الأفراد دون علمهم. ورغم أن هذه السيناريوهات ليست شائعة على نطاق واسع بعد، يؤكد الباحثون أن سرعة تطور التكنولوجيا تستدعي دق ناقوس الخطر مبكراً، قبل أن تصبح هذه الممارسات أمراً واقعاً يصعب احتواؤه.

قياس ما يكشفه صوتك

أحد التحديات الأساسية في حماية خصوصية الصوت هو فهم مقدار المعلومات التي يحتويها تسجيل صوتي واحد. ولهذا يعمل الباحثون على تطوير أدوات وأساليب لقياس مدى قابلية ربط عيّنة صوتية بسمات تعريفية محددة. وتهدف هذه المقاييس إلى تحديد مدى سهولة نسب الصوت إلى شخص بعينه أو إلى فئة ضيقة من الأشخاص، اعتماداً فقط على الخصائص الصوتية.

وتُعد هذه الأدوات ضرورية لتصميم أنظمة تراعي الخصوصية منذ البداية. فإذا تمكن المطورون من تقدير مستوى المخاطر المرتبطة بتسجيل صوتي معين، يصبح بإمكانهم اتخاذ قرارات مدروسة بشأن كيفية تخزينه أو معالجته أو مشاركته. ويدعم هذا التوجه مفهوم «الخصوصية بحكم التصميم»؛ حيث تُؤخذ المخاطر المحتملة في الحسبان قبل طرح التكنولوجيا للاستخدام الواسع.

الصوت ليس وسيلة تواصل فقط بل يحمل أيضاً بيانات شخصية عميقة تكشف الصحة والحالة النفسية والخلفية الثقافية (شاترستوك)

كيف يمكن حماية خصوصية الصوت؟

لا يدعو الخبراء إلى التخلي عن تقنيات الصوت، بل إلى تقليل التعرض غير الضروري للمعلومات الشخصية. ومن بين أكثر الاستراتيجيات فعالية تقليص كمية البيانات الصوتية الخام التي يتم مشاركتها. فبدلاً من إرسال تسجيلات كاملة، يمكن للأنظمة استخراج الحد الأدنى من المعلومات اللازمة لأداء مهمة محددة كتحويل الكلام إلى نص، ثم التخلص من بقية البيانات.

كما تُعد المعالجة المحلية للصوت خطوة مهمة في هذا السياق. فعندما يُحلل الصوت مباشرة على الجهاز، بدلاً من إرساله إلى خوادم سحابية بعيدة، تقل فرص إساءة الاستخدام أو الاعتراض أو الاستغلال الثانوي للبيانات. ويمنح هذا النهج المستخدمين قدراً أكبر من التحكم فيما يغادر أجهزتهم ومتى.

وتلعب الضوابط الفيزيائية والبيئية دوراً مكملاً. فالتقنيات التي تُظهر بوضوح متى يكون التسجيل نشطاً، أو التي تحصر التقاط الصوت في نطاقات محددة، أو تتطلب تفعيلاً مقصوداً من المستخدم، تساعد في منع التسجيل العرضي أو الخفي. ومجتمعةً، تسهم هذه الإجراءات في جعل التفاعل الصوتي مقصوداً لا متطفلاً.

الثقة والشفافية وتجربة المستخدم

الخصوصية ليست مسألة تقنية فحسب، بل هي قضية نفسية أيضاً. فمجرد الشعور بالمراقبة قد يؤثر في سلوك الأفراد وطريقة تعبيرهم عن أنفسهم. ويحذّر الباحثون من أن الإحساس الدائم بالرصد سواء أكان حقيقياً أم متوهماً، يمكن أن يقوّض الشعور بالكرامة والاستقلالية.

ومن هنا تبرز أهمية الشفافية؛ إذ ينبغي إبلاغ المستخدمين بوضوح متى يتم تسجيل أصواتهم، وما نوع المعلومات التي قد تُستخلص، وكيف ستُستخدم هذه البيانات. فالأنظمة التي تقدم إشارات واضحة وتحكماً مفهوماً في إعدادات الخصوصية تكون أقدر على كسب ثقة المستخدمين من تلك التي تعمل بصمت في الخلفية.

مستقبل مسؤول لتقنيات الصوت

توفر التقنيات المعتمدة على الصوت فوائد لا يمكن إنكارها، بدءاً من أدوات الوصول لذوي الإعاقة، مروراً بالحوسبة دون استخدام اليدين، ووصولاً إلى تفاعل أكثر طبيعية بين الإنسان والآلة. غير أن تعاظم حضور هذه التقنيات في الحياة اليومية يفرض مسؤولية متزايدة لحماية البيانات الصوتية.

ويواصل الباحثون تطوير أساليب لقياس المعلومات الشخصية الكامنة في الصوت وتقليلها والتحكم بها. وفي الوقت ذاته، يتعين على المطورين وصنّاع السياسات والمصممين العمل معاً لضمان تطور أطر الخصوصية بالتوازي مع الابتكار. فالتحدي ليس في إسكات التكنولوجيا، بل في ضمان أن تكون أصواتنا حين نتحدث مصدر تمكين لنا، لا بوابة لانتهاك خصوصيتنا.


«تيك توك» تحذف نحو 3.9 مليون محتوى مخالف في السعودية نهاية 2025

تعتمد «تيك توك» بشكل متزايد على التقنيات الآلية لرصد وحذف غالبية المحتوى المخالف قبل الإبلاغ عنه من المستخدمين (رويترز)
تعتمد «تيك توك» بشكل متزايد على التقنيات الآلية لرصد وحذف غالبية المحتوى المخالف قبل الإبلاغ عنه من المستخدمين (رويترز)
TT

«تيك توك» تحذف نحو 3.9 مليون محتوى مخالف في السعودية نهاية 2025

تعتمد «تيك توك» بشكل متزايد على التقنيات الآلية لرصد وحذف غالبية المحتوى المخالف قبل الإبلاغ عنه من المستخدمين (رويترز)
تعتمد «تيك توك» بشكل متزايد على التقنيات الآلية لرصد وحذف غالبية المحتوى المخالف قبل الإبلاغ عنه من المستخدمين (رويترز)

أظهر أحدث بيانات منصة «تيك توك» أن المملكة العربية السعودية كانت من بين أكثر الأسواق نشاطاً في تطبيق سياسات السلامة الرقمية خلال الربع الثالث من عام 2025، مع حذف ما يقرب من 3.9 مليون مقطع فيديو لمخالفتها إرشادات المجتمع؛ في مؤشر على تشديد الرقابة الاستباقية على المحتوى داخل المنصة.

ووفق تقرير إنفاذ إرشادات المجتمع الصادر عن «تيك توك» للفترة من يوليو (تموز) إلى سبتمبر (أيلول) 2025، بلغ معدل الحذف الاستباقي في السعودية 99.2 في المائة، فيما أُزيل نحو 96.7 في المائة من المحتوى المخالف خلال أقل من 24 ساعة، ما يعكس سرعة الاستجابة وفعالية أنظمة الإشراف المعتمدة داخل المملكة.

ويأتي ذلك ضمن إطار أوسع شهد حذف أكثر من 17.4 مليون مقطع فيديو مخالف في منطقة الشرق الأوسط وشمال أفريقيا خلال الربع ذاته، شمل مصر والإمارات والعراق ولبنان والمغرب، مع اعتماد متزايد على التقنيات الآلية في رصد المحتوى المخالف قبل الإبلاغ عنه من المستخدمين.

إشراف استباقي وتكنولوجيا آلية

على المستوى الإقليمي والعالمي، سجل الربع الثالث من 2025 أعلى مستويات الاعتماد على الأنظمة الآلية في تاريخ المنصة، حيث جرى حذف 91 في المائة من المحتوى المخالف باستخدام تقنيات الرصد التلقائي، إلى جانب حذف 99.3 في المائة من المحتوى قبل تلقي أي بلاغات من المستخدمين. كما أزيل 94.8 في المائة من المقاطع المخالفة خلال أقل من 24 ساعة.

وتشير هذه المؤشرات إلى انتقال متزايد في نموذج الإشراف من المعالجة اللاحقة إلى التدخل المبكر، بما يقلص احتمالات تعرض المستخدمين لمحتوى مخالف، ويتيح لفرق السلامة البشرية التركيز على مراجعة الحالات المعقدة وطلبات الاستئناف والتعامل مع الأحداث المتسارعة.

كثفت المنصة إجراءات حماية القُصّر لإزالة حسابات يُشتبه في عودتها لأشخاص دون 13 عاماً على المستوى العالمي (أ.ب)

حماية الفئات العمرية الأصغر

وفي سياق متصل، كثفت «تيك توك» إجراءاتها المرتبطة بحماية القُصّر، إذ حذفت عالمياً أكثر من 22 مليون حساب يُشتبه في عودتها لأشخاص دون سن 13 عاماً خلال الربع الثالث من 2025. ويعكس ذلك تركيز المنصة على ضبط التجارب الرقمية للفئات العمرية الأصغر، بما يشمل منطقة الشرق الأوسط وشمال أفريقيا.

وتندرج هذه الجهود ضمن مساعٍ أوسع لتعزيز بيئة رقمية أكثر أماناً، لا سيما في الأسواق ذات القاعدة الشبابية الواسعة، مثل السعودية، حيث يحظى المحتوى الرقمي بتفاعل مرتفع وانتشار واسع.

البث المباشر تحت الرقابة

وشهدت سياسات البث المباشر (LIVE) تشديداً إضافياً خلال الفترة نفسها، إذ علّقت المنصة عالمياً أكثر من 32.2 مليون بث مباشر مخالف، وحظرت 623 ألف مضيف بث مباشر، في إطار تعزيز أدوات الإشراف على هذا النمط من المحتوى عالي التفاعل.

وعلى مستوى المنطقة، أوقفت «تيك توك» بشكل استباقي أكثر من 2.48 مليون بث مباشر في عدد من الدول العربية، ما يعكس توسع تطبيق القرارات الآلية بالتوازي مع التوسع في استخدام خاصية البث المباشر.

الاستئناف واستعادة المحتوى في السعودية

وفيما يتعلق بآليات الشفافية، أظهر التقرير أن السعودية جاءت في المرتبة الثانية إقليمياً من حيث عدد مقاطع الفيديو التي أُعيدت بعد قبول طلبات الاستئناف، بواقع 195711 مقطعاً. وتوضح هذه الأرقام حجم التفاعل مع نظام الاعتراض، ودوره في تحقيق توازن بين الإنفاذ الصارم لسياسات المنصة وضمان حق المستخدمين في مراجعة القرارات.

تفرض «تيك توك» رقابة مشددة على البث المباشر مع تعليق ملايين البثوث المخالفة وحظر عدد كبير من المضيفين (شترستوك)

إنفاذ سياسات تحقيق الدخل

كما واصلت «تيك توك» نشر بيانات متعلقة بسلامة تحقيق الدخل، إذ اتخذت خلال الربع الثالث من 2025 إجراءات شملت التحذير أو إيقاف تحقيق الدخل لأكثر من 3.9 مليون بث مباشر و2.1 مليون صانع محتوى على مستوى العالم، بسبب مخالفات لإرشادات تحقيق الدخل.

وتهدف هذه السياسات إلى دعم المحتوى الآمن والأصيل وعالي الجودة، مع الحد من الممارسات التي قد تستغل البث المباشر لأغراض مخالفة.

الشفافية ركيزة أساسية

ويعكس تقرير الربع الثالث من 2025 اعتماد «تيك توك» المتواصل على نموذج إشراف هجين، يجمع بين التقنيات المتقدمة وخبرات فرق متخصصة في مجالي الثقة والسلامة، في إطار سعيها لتعزيز بيئة رقمية أكثر أماناً في الأسواق الإقليمية، وعلى رأسها السعودية.

وتؤكد المنصة أن نشر تقارير الشفافية بشكل دوري يشكل عنصراً أساسياً في بناء الثقة مع المستخدمين والجهات التنظيمية، في وقت يتزايد فيه الاهتمام العالمي بتنظيم المحتوى الرقمي وحوكمة المنصات الاجتماعية.