تصميم صوت كومبيوتري.. يروق للناس

نظم التفاعل الصوتي تدخل في السيارات واللعب والمستلزمات المنزلية

باحث في مختبر «واطسون» في شركة «آي بي إم»
باحث في مختبر «واطسون» في شركة «آي بي إم»
TT

تصميم صوت كومبيوتري.. يروق للناس

باحث في مختبر «واطسون» في شركة «آي بي إم»
باحث في مختبر «واطسون» في شركة «آي بي إم»

إذ كان من الممكن لأجهزة الكومبيوتر أن تتكلم، فلأي مدى سيكون الصوت قريبا من صوت البشر؟
حاول ستة من اللغويين والمهندسين والمسوقين بشركة «آي بي إم» عام 2009 الإجابة عن هذا السؤال عندما شرعوا في مهمة تحويل النص المكتوب إلى صوت، وكان ذلك خصيصا لنظام «واطسون» للذكاء الصناعي.
* تفاعل صوتي
وبعد ذلك بثمانية عشر شهرا، أنتجت الشركة صوتا متقنا، قد لا يتطابق كليا مع الصوت البشري، لكنه ليس مثل صوت الشخصية الخيالية «هال 9000» الذي سمعناه في فيلم «سبيس أوديسي 2001» (ملحمة الأوديسا الفضائية)، بيد أن الصوت عبّرَ عن الشخصية الصناعية لنظام «واطسون».
تمثل التحدي لإنتاج «شخصية» عبر الكومبيوتر في أنه الآن وفي ظل انتشار أجهزة الكومبيوتر المحمولة، وبعدما أصبحت أيادي الناس وعيونهم مشغولة دوما، فإن عددا من مصممي البرامج أصبحوا يتصارعون لإنتاج كومبيوتر يعتمد على التفاعل الصوتي.
بمقدور الماكينات أن تسمع وتفهم وتتحدث، فالأمر ليس مقتصرا على أجهزة الكومبيوتر أو الهواتف الذكية، حيث أضيف الصوت إلى كثير من الأجهزة التي نستخدمها يوميا مثل السيارات واللعب والمستلزمات المنزلية التي تعتمد على المعلومات مثل أدوات المطبخ، والروبوت المنزلي «جبو»، وتطبيق أمازون الصوتي «أليكسا» الذي يحاكي صوت مستخدمه.
ظهر علم تصميم جديد يهدف إلى تطوير برامج للمحادثة بالكومبيوتر بمقدورها فهم اللغات والأحاديث البشرية، وتستطيع الاستجابة للأوامر الصوتية للإنسان. غير أن إنتاج تلك الأنظمة، بواسطة باحثين في مجال يعرف بتصميم تفاعل الكومبيوتر البشري، لا يزال يعد مجرد فن أو علم غير مطبق.
ولا يزال من غير الممكن إنتاج صوت كومبيوتري لا يمكن تمييزه عن الصوت البشري، باستثناء ذلك الصوت المستخدم في العبارات المختصرة مثل النشرة الجوية أو تعليمات قيادة السيارة.
وقد اعترف أغلب مصممي البرامج أنهم ما زالوا يواجهون مشكلة تخطي ما يعرف بـ«وادي العجائب»، حيث تبدو الأصوات منفرة ومزعجة، رغم أنها تشبه إلى حد بعيد الأصوات البشرية. وتعود عبارة «وادي العجائب» إلى صانع أجهزة الروبوت الياباني «ماشيرو موري» التي استحدثها عام 1970، حيث لاحظ المبتكر الياباني اقتراب الرسوم من محاكاة النماذج الآدمية إلى حد بعيد، إلا أن هناك نقطة معينة تتشوه عندها تلك الصور ثم تتحسن، بحيث لا يمكن تمييزها عن المقاطع المصورة للبشر الحقيقيين.
* سمات بشرية
والشيء نفسه ينطبق على المقاطع الصوتية. وقال بريان لانغر، كبير خبراء الصوت بأحد معاهد التكنولوجيا في ولاية سان فرنسيسكو التي أنتجت برامج صوتية رقمية لمنتجات مثل دمية «باربي»، إن «كلمة مزعج هي الأنسب»، مضيفا: «عندما تجيد الماكينات إنتاج بعض هذه الأصوات، يعتقد الناس أنها سوف تنجح في إنتاج جميع الأصوات بالجودة نفسها».
وبغض النظر عن النطق الصحيح، يكمن التحدي الأكبر في إضافة السمات البشرية بشكل صحيح مثل علم الصرف والانفعال إلى الحديث. يؤكد اللغويون أهمية إضافة «علم العروض» للحديث بوضع «شدة» في المكان الصحيح واستخدام النغمة والعاطفة في الكلام المنطوق.
اليوم ورغم التقدم الذي تحقق فلا يزال من غير الممكن إضافة المشاعر الثرية بشكل كامل إلى الأحاديث البشرية من خلال الذكاء الصناعي. فبعد استخدام خوارزميات تعليم الكومبيوتر وبعد اللجوء إلى قاعدة ضخمة من بيانات المشاعر الإنسانية التي توظف في الحديث، أصبحت أول نتائج الأبحاث التجريبية جاهزة لخبراء الأحاديث الصوتية.

* خدمة «نيويورك تايمز»



«غوغل» تطلق النسخة الأولية من آندرويد 16 للمطورين مع ميزات جديدة

«غوغل» تطلق النسخة الأولية من آندرويد 16 للمطورين مع ميزات جديدة لتعزيز الخصوصية ومشاركة البيانات الصحية (غوغل)
«غوغل» تطلق النسخة الأولية من آندرويد 16 للمطورين مع ميزات جديدة لتعزيز الخصوصية ومشاركة البيانات الصحية (غوغل)
TT

«غوغل» تطلق النسخة الأولية من آندرويد 16 للمطورين مع ميزات جديدة

«غوغل» تطلق النسخة الأولية من آندرويد 16 للمطورين مع ميزات جديدة لتعزيز الخصوصية ومشاركة البيانات الصحية (غوغل)
«غوغل» تطلق النسخة الأولية من آندرويد 16 للمطورين مع ميزات جديدة لتعزيز الخصوصية ومشاركة البيانات الصحية (غوغل)

أطلقت «غوغل» النسخة التجريبية الأولية من آندرويد 16 للمطورين، وهي خطوة تمهد الطريق للتحديثات الكبيرة المقبلة في هذا النظام. هذه النسخة تأتي مع مميزات جديدة تماماً، وتهدف إلى تعزيز قدرات التطبيقات والأجهزة، مع تركيز خاص على الخصوصية وسلاسة الاستخدام.

ما الجديد في آندرويد 16؟

من أبرز المميزات التي تم الإعلان عنها، توسيع قدرات مكتبة الصور، وإضافة إمكانية مشاركة البيانات الطبية في التطبيقات. تأتي هذه التحسينات بوصفها جزءاً من جهود «غوغل» لتقديم تجربة استخدام أكثر ذكاءً وسلاسة، مع الحفاظ على خصوصية المستخدمين.

محدد الصور: «Photo Picker»

وأضافت «غوغل» ميزة جديدة تسمح للمطورين بدمج «محدد الصور» مباشرة داخل تطبيقاتهم. هذه الميزة تمكن المستخدمين من مشاركة الصور ومقاطع الفيديو بسهولة، دون منح التطبيقات حق الوصول الكامل إلى مكتبة الوسائط على أجهزتهم أو التخزين السحابي. هذا التغيير يجعل مشاركة الوسائط أكثر أماناً وراحة.

تستهدف «غوغل» من هذه النسخة تحسين التكامل بين التطبيقات قبل الإطلاق الرسمي في 2025 (غوغل)

صندوق الخصوصية: «Privacy Sandbox»

آندرويد 16 يدمج النسخة الأحدث من هذه التقنية، التي تعد بديلاً لـ«معرّف الإعلانات» (Advertising ID). هذا التحديث يدعم خصوصية المستخدمين، ويوفر أدوات جديدة للمطورين؛ لتحسين الإعلانات دون التأثير على أمان البيانات.

الاتصال الصحي: «Health Connect»

وأضافت «غوغل» واجهات برمجة التطبيقات الجديدة لدعم السجلات الصحية بتنسيق FHIR. هذه الميزة ستتيح للتطبيقات والأجهزة الطبية مشاركة السجلات والمعلومات الصحية بموافقة المستخدم. هذا الابتكار يعكس استراتيجية «غوغل» في الدخول إلى مجال الصحة الذكية، مستوحاة من مميزات مشابهة على أجهزة «أبل».

النسخة التجريبية العامة تبدأ في يناير 2025 والإصدار النهائي متوقع بعد أبريل بالتزامن مع مؤتمر I/O (غوغل)

لماذا التغيير في الجدول الزمني؟

أعلنت «غوغل»، الشهر الماضي، عن تغيير في جدول إصدار آندرويد، مما سيتيح للهواتف التي تعمل بنظام آندرويد، والتي ستصدر في 2025، الحصول على التحديثات الرئيسية بشكل أسرع. هذا التحرك يهدف إلى تقليل الفجوة الزمنية بين إطلاق التحديثات ووصولها إلى المستخدمين النهائيين، مما يجعل النظام أكثر تنافسية مع الأنظمة الأخرى.

متى يمكن للمستخدمين تجربة آندرويد 16؟

وفقاً للجدول الزمني المتوقع، سيتم إطلاق النسخة التجريبية الأولى العامة في يناير 2025، مع إصدار النسخة النهائية بعد أبريل (نيسان) من العام نفسه. غالباً ما يتزامن الإعلان الرسمي مع مؤتمر «غوغل» السنوي I/O، مما يعني أننا قد نرى المزيد من التفاصيل والميزات الجديدة في مايو (أيار) 2025.

آندرويد 16 يمثل خطوة مهمة نحو تقديم تجربة استخدام أكثر تخصيصاً، وخصوصية، وسلاسة. من خلال توسيع إمكانيات التطبيقات وتحسين الجدول الزمني للتحديثات، يبدو أن «غوغل» تسير بخطى ثابتة نحو تعزيز مكانة آندرويد بوصفه واحداً من أفضل أنظمة التشغيل في العالم.