تقنيات تحويل الأصوات إلى نصوص تزداد انتشاراً

ميزة «من الفم إلى الشاشة» تؤمن خدمات للطلاب والأطباء ورجال الأعمال

تقنيات تحويل الأصوات إلى نصوص تزداد انتشاراً
TT

تقنيات تحويل الأصوات إلى نصوص تزداد انتشاراً

تقنيات تحويل الأصوات إلى نصوص تزداد انتشاراً

يشتاق سام ليانغ لوالدته ويتمنّى لو أنّه يستطيع استعادة الأشياء التي كانت تقولها له عندما كان طالباً في المدرسة الثانوية. وعندما توفيت عام 2001 قال: «حقّاً أشتاق لها. لقد كانت لحظات ثمينة في حياتي».
هذا الأمر دفع بليانغ، الرئيس التنفيذي والشريك المؤسس في «أوتر»، إحدى شركات وادي السيليكون الناشئة، إلى وضع خطّة للتعامل مع هذه الأوضاع في المستقبل. وتقدّم شركته اليوم خدمة تساعد على تحويل الكلام إلى نص أوتوماتيكياً وبدقّة عالية. وقد بدأت هذه الخدمة باكتساب شعبية واسعة بين الصحافيين، والطلّاب، والمدوّنين الإلكترونيين، وموظفي الشركات.
تخزين الكلام
ساهم التحسّن الذي شهدته تقنية البرمجة الإلكترونية في تحويل تقنية نسخ الكلام إلى نص إلى حقيقة. فمن خلال تخزين كمّ هائل من الكلام البشري، أصبح بالإمكان تدريب برامج شبكات عصبية للتعرّف على اللغة المحكية بدقّة عالية تقارب 95 في المائة في أفضل الظروف. أضف إلى ذلك، يتيح تراجع تكلفة تخزين البيانات اليوم استخدام اللغة البشرية بطرق لم تخطر على بال أحد.
وشرح ليانغ، خرّيج الهندسة الكهربائية من جامعة ستانفورد وعضو الفريق الأساسي الذي صمم تطبيق «غوغل مابس»، أنّ «عمليات ضغط البيانات عزّزت إمكانية الاحتفاظ بالمحادثات الكلامية لشخص طوال حياته ودمجها في سعة 2 ترابايت، أي مدمجة بالقدر الكافي الذي يتيح وضعها على جهاز تخزين لا يتجاوز سعره 50 دولاراً».
خلال العقد الماضي، ساهم التقدّم السريع الذي شهدته تقنية التعرّف إلى الصوت في تطوير وانتشار أجهزة المساعدة الصوتية الافتراضية كـ«سيري» من آبل، و«أليكسا» من أمازون، و«غوغل فويس» و«كورتانا» من مايكروسوفت، وغيرها الكثير. هذا التقدّم نفسه يتوسّع اليوم ليشمل مجالات جديدة بدأت بالتأثير بشكل واضح على مجالات العمل.
ولكنّ هذه الأجهزة الصوتية المحمولة المصنوعة للاستهلاك تسببت في تصاعد مخاوف جديّة حول الخصوصية، فقد اعتبر مارك روتنبرغ، الرئيس والمدير التنفيذي في مركز معلومات الخصوصية الإلكترونية في واشنطن أنّ أجهزة الكومبيوتر تتمتّع بقدرة على تنظيم، واستغلال، وتقييم التواصل البشري أكبر بكثير من قدرة البشر. وقد عمد المركز عام 2015 إلى التقدّم بشكوى أمام هيئة التجارة الفيدرالية ضدّ سامسونغ، ادعى فيها أنّ تسجيل وتخزين المحادثات الذي تقوم به تلفزيوناتها الذكية يمثّل تهديداً جدياً للخصوصية. وأضاف روتنبرغ أنّ نسخ الكلام والمحادثات ينقل مخاوف الخصوصية إلى مجالات جديدة في المنزل والعمل على حدّ سواء.
من الصوت إلى النص
إنّ التطوّرات السريعة التي تحقّقت في سوق التحويل الآلي للصوت في السنة الأخيرة، تعكس احتمالات مذهلة وقريبة المدى على استخدامه في مجموعة جديدة وكبيرة من التطبيقات. فقد انطلقت مثلاً مع بداية الخريف حملة لتجهيز طلّاب جامعة كاليفورنيا - لوس أنجليس، الذين يحتاجون إلى مساعدة لتدوين الملاحظات (كأولئك الذين يعانون من مشاكل في السمع) بخدمة شركة «أوتر». وتمّ تصميم هذا النظام لاستبدال عملية تدوين الملاحظات الحالية التي يستخدمها الطلاب لتسجيل الملاحظات ونشرها لاحقاً.
وفي مايو (أيار)، عندما زارت ميشيل أوباما، السيّدة الأولى السابقة، حرم الجامعة على هامش احتفال بيوم التوقيع الوطني، تمّ تزويد الطلّاب الصمّ بنصّ آني لخطابها من إنتاج خدمة النسخ نفسها.
يقدّم «زوم»، نظام المؤتمرات المصوّرة، خيار نسخ الكلام إلى نص الذي تشغّله خدمة شركة «أوتر» لتزويد مستخدميه بنصٍّ آني لاجتماعات العمل، إلى جانب تسهيل تخزينها والبحث عنها عبر الإنترنت. تقدّم «أوتر» وغيرها من الشركات الكثير من الميّزات في خدماتها، وأهمّها إمكانية فصل وتسمية مختلف المتحدّثين في نسخة نصيّة واحدة.
وتعمد شركات أخرى كـ«ريف»، التي بدأت عام 2010 بتقديم نصوص مكتوبة من قبل موظفين للمحادثات بدولار للدقيقة، إلى تقديم خدمة نسخ آلية للمحادثات والخطابات بعشرة سنتات للدقيقة. في النتيجة، يبدو أنّ خدمة نسخ النصوص تتوسّع لتشمل مجالات جديدة، كعنونة محطّات اليوتيوب، وفيديوهات التدريب في الشركات، وشركات البحث السوقية التي تحتاج إلى نصوص من مجموعات التركيز.
يتيح نظام «ريف» لمستخدميه الاختيار بين ما إذا كانوا يريدون دقّة أعلى أو تحوّل سريع بتكلفة أقلّ، بحسب ما أفاد جايسن شيكولا، مؤسس الشركة ورئيسها التنفيذي، لافتاً إلى أنّ زبائنه يعتمدون أكثر فأكثر على النصوص التي تنتجها الآلات بدل نسخ أي خطاب أو محادثات من البداية. وقال شيكولا إنّه لم يعتقد يوماً أنّ خدمة النسخ الآلي للكلام ستؤدي يوماً إلى تقليص عدد القوى العاملة لديه، على الرغم من أنّ شركته تضمّ اليوم 40000 موظف ناسخ.
خدمات طبية
في المجال الطبي، تستخدم خدمة النسخ الآلي اليوم لتغيير الطريقة التي يسجّل بها الأطباء ملاحظاتهم. في السنوات الأخيرة، أصبحت أنظمة التسجيل الصحي الإلكترونية جزءاً من الزيارة الروتينية في أي عيادة، مما عرّض الأطباء للنقد بسبب تركيزهم على الشاشات والطباعة بدل الحفاظ على التواصل البصري مع المريض. ولكنّ شركات ناشئة كثيرة تقدّم اليوم خدمات نسخ تحفظ النصّ، وربّما الفيديو، من غرفة الفحص وتستخدم ناسخا بشريا أو كاتبا موجودا في مكان آخر، لتصحيح النصّ الآلي وإنتاج مجموعة «مرتّبة» من الملاحظات المسجّلة خلال زيارة المريض.
تعمل «روبين هيلث كير» واحدة من هذه الشركات في بيركلي - كاليفورنيا، على تسجيل زيارات العيادات بواسطة نظام نسخ آلي متصل بفريق عمل من «الكتبة» البشريين الذين يعملون في الولايات المتحدة، بحسب ما أفاد نواه أورهان، الرئيس التنفيذي للشركة. ومعظم هؤلاء الكتبة هم طلّاب السنوات الأولى في كليّة الطبّ، مهمتهم الإنصات لمحادثة الطبيب لإنتاج سجلّ كامل حول المريض خلال ساعتين من زيارته. يستخدم نظام «روبين هيلث كير» في جامعة كاليفورنيا - سان فرنسيسكو، وجامعة سان دييغو.
تعتمد شركة أخرى منافسة تعرف باسم «ديب سكرايب» في بيركلي أيضاً، مقاربة أكثر آلية لصناعة سجلّات صحية إلكترونية. إذ تستخدم الشركة محرّكات كلام كثيرة من تطوير شركات تقنية عملاقة كغوغل و«آي بي إم». لتسجيل المحادثات ووضع ملخّص للمعاينة، تتمّ مراجعته لاحقاً من قبل موظفين مختصّين.
افتقار إلى الدقة
من جهتهم، يؤكّد خبراء الكلام على أنّ أنظمة النسخ الآلية تزال بعيدة كلّ البعد عن المثالية رغم التقدّم الذي شهدته. صحيح أنّ النسخ الآلي قد يقدّم دقّة عالية تصل نسبتها إلى 95 في المائة، ولكن هذا الأمر لا يمكن تحقيقه إلّا في أفضل الظروف وأكثرها وضوحاً، لأنّ هذه الدقّة قد تنهار بسبب لكنة مختلفة، أو سوء في وضعية ميكروفون، أو أي ضجّة في الخلفية.
تراهن الآمال المستقبلية في هذا المجال على بروز تقنية خطابية أخرى تُعرف بالمعالجة الطبيعية للغة، والتي تهدف إلى التقاط معنى الكلمات والجمل لتساهم في تعزيز دقّة أجهزة الكومبيوتر حتّى تصبح موازية للقدرات البشرية. ولكن في الوقت الحالي، لا تزال معالجة اللغة الطبيعية تمثّل واحداً من أكبر التحديات والعوائق في عالم الذكاء الصناعي.

- خدمة «نيويورك تايمز».



«التزوير للجميع»... الذكاء الاصطناعي خدع الملايين منذ بدء حرب إيران

اجتاحت مقاطع الفيديو والصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي مواقع التواصل منذ اندلاع حرب إيران (رويترز)
اجتاحت مقاطع الفيديو والصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي مواقع التواصل منذ اندلاع حرب إيران (رويترز)
TT

«التزوير للجميع»... الذكاء الاصطناعي خدع الملايين منذ بدء حرب إيران

اجتاحت مقاطع الفيديو والصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي مواقع التواصل منذ اندلاع حرب إيران (رويترز)
اجتاحت مقاطع الفيديو والصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي مواقع التواصل منذ اندلاع حرب إيران (رويترز)

اجتاحت موجة من مقاطع الفيديو والصور المزيفة، التي تم إنشاؤها بواسطة الذكاء الاصطناعي، مواقع التواصل الاجتماعي خلال الأسابيع الأولى من الحرب في إيران.

وأضافت هذه المقاطع، التي تُظهر انفجارات ضخمة لم تحدث قط، وشوارع مدن مدمرة لم تتعرض للهجوم، وجنوداً مزيفين يحتجون على الحرب، بُعداً فوضوياً ومُربكاً للصراع على الإنترنت.

وبحسب صحيفة «نيويورك تايمز» الأميركية، فقد جرى رصد أكثر من 110 صور ومقاطع فيديو مزيفة خلال أسبوعين فقط.

وشوهدت هذه المنشورات ملايين المرات على الإنترنت عبر منصات مثل «إكس» و«تيك توك» و«فيسبوك»، ومرات لا تُحصى في تطبيقات المراسلة الخاصة الشائعة في المنطقة وحول العالم.

وقد حددت صحيفة «نيويورك تايمز» محتوى الذكاء الاصطناعي من خلال البحث عن علامات واضحة - مثل صور لمبانٍ غير موجودة، ونصوص مشوشة، وسلوكيات أو حركات غير متوقعة - بالإضافة إلى علامات مائية غير مرئية مُضمنة في الملفات. كما تم فحص المنشورات باستخدام أدوات متعددة لكشف الذكاء الاصطناعي ومقارنتها بتقارير من وكالات أنباء.

ويرى خبراء أن التطور السريع لأدوات الذكاء الاصطناعي جعل إنتاج مقاطع حرب واقعية المظهر أمراً سهلاً ورخيصاً، ما سمح لأي شخص تقريباً بصناعة محتوى قد يخدع المشاهدين.

وقال مارك أوين جونز، الأستاذ المشارك في تحليل الإعلام بجامعة نورثويسترن في قطر: «حتى مقارنة ببداية الحرب في أوكرانيا، فإن الأمور الآن مختلفة جداً... ربما نشهد الآن محتوى مرتبطاً بالذكاء الاصطناعي أكثر من أي وقت مضى».

ووفق تحليل لشركة «سيابرا»، المتخصصة في تحليل وسائل التواصل الاجتماعي، فإن غالبية مقاطع الفيديو المتداولة حملت روايات مؤيدة لإيران، غالباً بهدف إظهار تفوقها العسكري أو تضخيم حجم الدمار في المنطقة.

وأشار جونز إلى أن استخدام صور الذكاء الاصطناعي لمواقع في الخليج وهي تحترق أو تتعرَّض لأضرار يخدم رواية دعائية معينة، لأنه يمنح انطباعاً بأنَّ الحرب أكثر تدميراً وربما أكثر تكلفة للولايات المتحدة مما هي عليه في الواقع.

ومن بين أكثر المقاطع انتشاراً فيديو يُظهر هجوماً صاروخياً كثيفاً على تل أبيب، شاهده ملايين المستخدمين، قبل أن يؤكد الخبراء أنه مُولَّد بالذكاء الاصطناعي.

وفي المقابل، تبدو المقاطع الحقيقية للحرب أقل درامية بكثير، إذ تُظهر عادة صواريخ بعيدة في السماء أو أعمدة دخان بعد الانفجارات، ما يجعل المحتوى المزيف - الذي يشبه أفلام هوليوود - أكثر جذباً للمشاهدين على وسائل التواصل.

وفي إحدى الحالات، لعبت مقاطع مزيفة دوراً كبيراً في الجدل حول مصير حاملة الطائرات الأميركية «يو إس إس أبراهام لينكولن» بعد ادعاءات إيرانية بتعرضها لهجوم. وانتشرت صور ومقاطع مولّدة بالذكاء الاصطناعي تُظهر السفينة وهي تحترق، قبل أن تؤكد الولايات المتحدة لاحقاً أن الهجوم فشل وأن السفينة لم تتضرَّر.

بالإضافة إلى ذلك، قدَّمت مجموعة من مقاطع الفيديو المزيفة مشهداً للمدرسة الابتدائية للبنات في مدينة ميناب في جنوب إيران، التي دمرتها الولايات المتحدة على ما يبدو أثناء شن ضربات على قاعدة إيرانية مجاورة في 28 فبراير (شباط)، وفقاً لتحقيق أولي.

وتُظهر مقاطع الفيديو التي تم إنشاؤها بواسطة الذكاء الاصطناعي فتيات المدرسة يلعبن في الخارج قبل أن تُطلق طائرة مقاتلة أميركية صواريخ.

ويرى خبراء أن هذه الظاهرة تمثل تطوراً جديداً في الحروب الحديثة، حيث تتحول أدوات الذكاء الاصطناعي إلى سلاح إعلامي.

وقالت فاليري ويرتشافتر، الباحثة في السياسات الخارجية والذكاء الاصطناعي: «إنها جبهة طبيعية تحاول إيران استغلالها، ويبدو أن هذا أحد أسباب هذا الكم الهائل من المحتوى... إنه في الواقع أداة من أدوات الحرب».

ويقول الخبراء إن شركات التواصل الاجتماعي لا تبذل جهوداً تُذكر لمكافحة آفة مقاطع الفيديو التي يتم إنشاؤها بواسطة الذكاء الاصطناعي والتي تجتاح منصاتها.

ورغم إعلان منصة «إكس»، الأسبوع الماضي، أنها ستعلق حسابات المستخدمين لمدة 90 يوماً من تلقي أي عائدات من المنصة إذا نشرت محتوى مُنتجاً بواسطة الذكاء الاصطناعي حول «النزاعات المسلحة» دون تصنيفه على هذا النحو، في محاولة لمنع المستخدمين من التربح من هذه الأكاذيب، فإن كثيراً من الحسابات المرتبطة بإيران والتي رصدتها شركة «سيابرا»، بدت أكثر تركيزاً على نشر رسائلها من جني المال.


«إكس» تتقدم بمقترح قبل ساعات من استحقاق غرامة أوروبية كبيرة على المنصة

حساب إيلون ماسك على منصة «إكس» (رويترز)
حساب إيلون ماسك على منصة «إكس» (رويترز)
TT

«إكس» تتقدم بمقترح قبل ساعات من استحقاق غرامة أوروبية كبيرة على المنصة

حساب إيلون ماسك على منصة «إكس» (رويترز)
حساب إيلون ماسك على منصة «إكس» (رويترز)

بعد ساعات من انتهاء المهلة المحددة لسداد غرامة بالملايين فرضها الاتحاد الأوروبي، قدّمت منصة «إكس»، المملوكة للملياردير إيلون ماسك، إلى المفوضية الأوروبية تصوراً لتعديلات جوهرية على المنصة.

وأكد مسؤول إعلامي باسم الهيئة المنظمة، ومقرها بروكسل، الجمعة، أن المقترحات المقدمة من المنصة تركز بالأساس على تطوير آليات توثيق الحسابات عبر علامات التحقق (الشارات الزرقاء)، بهدف تعزيز الشفافية ومكافحة التضليل.

ولم يكشف المسؤول عن أي تفاصيل، لكنه أشار إلى أنها خطوة في الاتجاه الصحيح، وفق ما ذكرته «وكالة الأنباء الألمانية».

وقال المتحدث باسم الاتحاد الأوروبي: «لا يسعنا إلا أن نثمن أنه بعد حوار بناء مع الشركة، أخذت التزاماتها القانونية على محمل الجد وقدمت لنا مقترحات عملية».

يذكر أن المفوضية الأوروبية كانت قد فرضت على المنصة في ديسمبر (كانون الأول) الماضي، غرامة قدرها 120 مليون يورو (137.7 مليون دولار) استناداً إلى قانون الخدمات الرقمية، وذلك على خلفية ما وصفته بـ«الافتقار إلى الشفافية» في طريقة توثيق الحسابات باستخدام علامة بيضاء على خلفية زرقاء، والتي عدّتها مضللة.

وجاء إجراء الاتحاد الأوروبي ضد «إكس» عقب تحقيق استمر نحو عامين بموجب قانون الخدمات الرقمية للاتحاد الأوروبي، الذي يُلزم المنصات الإلكترونية ببذل مزيد من الجهود لمكافحة المحتوى غير القانوني والضار.

وفي يوليو (تموز) 2024، اتهمت المفوضية الأوروبية «إكس» بتضليل المستخدمين، مشيرة إلى أن علامة التوثيق الزرقاء لا تتوافق مع الممارسات المتبعة في هذا المجال، وأن أي شخص يستطيع الدفع للحصول على حالة «موثق».


إشادة دولية بالدور العالمي لـ«منظمة التعاون الرقمي» في سد الفجوات

أمين عام منظمة التعاون الرقمي ديمة اليحيى خلال مشاركتها في «قمة مونتغمري 2026» عبر الاتصال المرئي (واس)
أمين عام منظمة التعاون الرقمي ديمة اليحيى خلال مشاركتها في «قمة مونتغمري 2026» عبر الاتصال المرئي (واس)
TT

إشادة دولية بالدور العالمي لـ«منظمة التعاون الرقمي» في سد الفجوات

أمين عام منظمة التعاون الرقمي ديمة اليحيى خلال مشاركتها في «قمة مونتغمري 2026» عبر الاتصال المرئي (واس)
أمين عام منظمة التعاون الرقمي ديمة اليحيى خلال مشاركتها في «قمة مونتغمري 2026» عبر الاتصال المرئي (واس)

أشادت «قمة مونتغمري 2026» العالمية بجهود منظمة التعاون الرقمي، التي باتت منصة دولية ذات مصداقية تهدف إلى سدّ الفجوات الرقمية، وتوسيع المهارات الرقمية لخدمة الإنسان.

وتجمع القمة نخبة من رواد الأعمال والمستثمرين وصنّاع السياسات وقادة القطاع التقني من مختلف أنحاء العالم لمناقشة التوجهات الناشئة التي تسهم في تشكيل مستقبل الاقتصاد الرقمي العالمي.

وأكدت ديمة اليحيى، الأمين العام للمنظمة، خلال مشاركته في القمة عبر الاتصال المرئي، أن «التعاون الرقمي ليس شعارات بل إنجازات على أرض الواقع»، منوهة بأن «أفضل ما في الدبلوماسية التقنية لم يأتِ بعد، والمزيد من دول العالم تختار هذا المسار يوماً بعد يوم لتحقيق طموحات شعوبها باقتصاد رقمي مزدهر يشمل الجميع».

وأضافت اليحيى أن «المنظمة أصبحت تضم اليوم 16 دولة و800 مليون إنسان، ومجتمعاً متنامياً؛ بفضل رؤية الدول الأعضاء، والتزامها وتفاني الأمانة العامة، وثقة شركائها في القطاع الخاص والأوساط الأكاديمية والمجتمع المدني».

إلى ذلك، تُوِّجت الأمين العام للمنظمة، خلال حفل أقيم ضمن أعمال القمة، بـ«جائزة الدبلوماسية التقنية»، التي تُمنح لتكريم القادة العالميين الذين يسهمون في تعزيز التعاون الدولي بمجال التقنية والابتكار الرقمي، بوصفها أول شخصية عربية وسعودية تحصدها، وفقاً لـ«وكالة الأنباء السعودية».

من جهته، أفاد جيمس مونتغمري، مؤسس القمة، بأن اليحيى «أثبتت أن التعاون المتعدد الأطراف في القضايا الرقمية ليس ممكناً فحسب، بل هو ضرورة لا غنى عنها»، مشيراً إلى أنها «أرست نموذجاً جديداً لكيفية تعاون الدول في مجال السياسات التقنية».

بدوره، اعتبر مارتن راوخباور، مؤسس «شبكة الدبلوماسية التقنية»، أن المنظمة «باتت منصة عالمية ذات مصداقية تجمع الحكومات والقطاع الخاص لسدّ الفجوات الرقمية، وتوسيع المهارات الرقمية، وضمان أن يخدم التقدّم التقني الإنسان بدلاً من أن يتركه خلفه».

ولفت راوخباور إلى أن «التعاون التقني الدولي الفعّال ممكنٌ وملحّ في آن واحد، وهذا المزيج بين الرؤية والتنفيذ والحسّ الدبلوماسي هو تحديداً ما أُنشئت جائزة الدبلوماسية التقنية للاحتفاء به».

وحقّقت منظمة التعاون الرقمي، التي تتخذ من الرياض مقراً لها، تقدّماً كبيراً منذ تأسيسها في عام 2020، لتكون أول منظمة دولية متعددة الأطراف مكرّسة لتمكين اقتصادات رقمية شاملة ومستدامة وموثوقة من خلال التعاون الدولي.

وتضم المنظمة اليوم 16 دولة تمثل أكثر من 800 مليون نسمة وناتجاً محلياً إجمالياً يتجاوز 3.5 تريليون دولار، تعمل معاً لفتح آفاق جديدة في الاقتصاد الرقمي. وشهدت نمواً ملحوظاً وحضوراً دولياً متزايداً، حيث تضاعفت عضويتها 3 مرات منذ تأسيسها من 5 دول مؤسسة، ووسّعت فئة المراقبين والشركاء لديها لتتجاوز 60 مراقباً وشريكاً.

كما حصلت على اعتراف رسمي ضمن منظومة الأمم المتحدة، ما يُعزِّز دورها منصة عالمية لتعزيز التعاون الرقمي، علاوةً على مبادراتها وشراكاتها في هذا الصدد، وجمع الوزراء وصنّاع السياسات ورواد الأعمال والمنظمات الدولية لتعزيز الحوار والتعاون العالمي حول الاقتصاد الرقمي.