تصميم صوت كومبيوتري.. يروق للناس

نظم التفاعل الصوتي تدخل في السيارات واللعب والمستلزمات المنزلية

باحث في مختبر «واطسون» في شركة «آي بي إم»
باحث في مختبر «واطسون» في شركة «آي بي إم»
TT

تصميم صوت كومبيوتري.. يروق للناس

باحث في مختبر «واطسون» في شركة «آي بي إم»
باحث في مختبر «واطسون» في شركة «آي بي إم»

إذ كان من الممكن لأجهزة الكومبيوتر أن تتكلم، فلأي مدى سيكون الصوت قريبا من صوت البشر؟
حاول ستة من اللغويين والمهندسين والمسوقين بشركة «آي بي إم» عام 2009 الإجابة عن هذا السؤال عندما شرعوا في مهمة تحويل النص المكتوب إلى صوت، وكان ذلك خصيصا لنظام «واطسون» للذكاء الصناعي.
* تفاعل صوتي
وبعد ذلك بثمانية عشر شهرا، أنتجت الشركة صوتا متقنا، قد لا يتطابق كليا مع الصوت البشري، لكنه ليس مثل صوت الشخصية الخيالية «هال 9000» الذي سمعناه في فيلم «سبيس أوديسي 2001» (ملحمة الأوديسا الفضائية)، بيد أن الصوت عبّرَ عن الشخصية الصناعية لنظام «واطسون».
تمثل التحدي لإنتاج «شخصية» عبر الكومبيوتر في أنه الآن وفي ظل انتشار أجهزة الكومبيوتر المحمولة، وبعدما أصبحت أيادي الناس وعيونهم مشغولة دوما، فإن عددا من مصممي البرامج أصبحوا يتصارعون لإنتاج كومبيوتر يعتمد على التفاعل الصوتي.
بمقدور الماكينات أن تسمع وتفهم وتتحدث، فالأمر ليس مقتصرا على أجهزة الكومبيوتر أو الهواتف الذكية، حيث أضيف الصوت إلى كثير من الأجهزة التي نستخدمها يوميا مثل السيارات واللعب والمستلزمات المنزلية التي تعتمد على المعلومات مثل أدوات المطبخ، والروبوت المنزلي «جبو»، وتطبيق أمازون الصوتي «أليكسا» الذي يحاكي صوت مستخدمه.
ظهر علم تصميم جديد يهدف إلى تطوير برامج للمحادثة بالكومبيوتر بمقدورها فهم اللغات والأحاديث البشرية، وتستطيع الاستجابة للأوامر الصوتية للإنسان. غير أن إنتاج تلك الأنظمة، بواسطة باحثين في مجال يعرف بتصميم تفاعل الكومبيوتر البشري، لا يزال يعد مجرد فن أو علم غير مطبق.
ولا يزال من غير الممكن إنتاج صوت كومبيوتري لا يمكن تمييزه عن الصوت البشري، باستثناء ذلك الصوت المستخدم في العبارات المختصرة مثل النشرة الجوية أو تعليمات قيادة السيارة.
وقد اعترف أغلب مصممي البرامج أنهم ما زالوا يواجهون مشكلة تخطي ما يعرف بـ«وادي العجائب»، حيث تبدو الأصوات منفرة ومزعجة، رغم أنها تشبه إلى حد بعيد الأصوات البشرية. وتعود عبارة «وادي العجائب» إلى صانع أجهزة الروبوت الياباني «ماشيرو موري» التي استحدثها عام 1970، حيث لاحظ المبتكر الياباني اقتراب الرسوم من محاكاة النماذج الآدمية إلى حد بعيد، إلا أن هناك نقطة معينة تتشوه عندها تلك الصور ثم تتحسن، بحيث لا يمكن تمييزها عن المقاطع المصورة للبشر الحقيقيين.
* سمات بشرية
والشيء نفسه ينطبق على المقاطع الصوتية. وقال بريان لانغر، كبير خبراء الصوت بأحد معاهد التكنولوجيا في ولاية سان فرنسيسكو التي أنتجت برامج صوتية رقمية لمنتجات مثل دمية «باربي»، إن «كلمة مزعج هي الأنسب»، مضيفا: «عندما تجيد الماكينات إنتاج بعض هذه الأصوات، يعتقد الناس أنها سوف تنجح في إنتاج جميع الأصوات بالجودة نفسها».
وبغض النظر عن النطق الصحيح، يكمن التحدي الأكبر في إضافة السمات البشرية بشكل صحيح مثل علم الصرف والانفعال إلى الحديث. يؤكد اللغويون أهمية إضافة «علم العروض» للحديث بوضع «شدة» في المكان الصحيح واستخدام النغمة والعاطفة في الكلام المنطوق.
اليوم ورغم التقدم الذي تحقق فلا يزال من غير الممكن إضافة المشاعر الثرية بشكل كامل إلى الأحاديث البشرية من خلال الذكاء الصناعي. فبعد استخدام خوارزميات تعليم الكومبيوتر وبعد اللجوء إلى قاعدة ضخمة من بيانات المشاعر الإنسانية التي توظف في الحديث، أصبحت أول نتائج الأبحاث التجريبية جاهزة لخبراء الأحاديث الصوتية.

* خدمة «نيويورك تايمز»



دراسة: الذكاء الاصطناعي يكتب قصائد أفضل من البشر

غالبية القُرَّاء يرون أن الذكاء الاصطناعي يكتب قصائد شعر أفضل من البشر (رويترز)
غالبية القُرَّاء يرون أن الذكاء الاصطناعي يكتب قصائد شعر أفضل من البشر (رويترز)
TT

دراسة: الذكاء الاصطناعي يكتب قصائد أفضل من البشر

غالبية القُرَّاء يرون أن الذكاء الاصطناعي يكتب قصائد شعر أفضل من البشر (رويترز)
غالبية القُرَّاء يرون أن الذكاء الاصطناعي يكتب قصائد شعر أفضل من البشر (رويترز)

أكدت دراسة جديدة أن غالبية القُرّاء يرون أن قصائد الشعر التي تكتب بواسطة أنظمة الذكاء الاصطناعي أفضل من تلك التي يكتبها البشر.

وبحسب صحيفة «الغارديان» البريطانية، فقد أُجريت الدراسة بواسطة باحثين من جامعة بيتسبرغ بولاية بنسلفانيا، وشملت عدداً من المشاركين الذين عُرضت عليهم قصائد كتبها 10 شعراء مشهورين باللغة الإنجليزية، إلى جانب قصائد تم إنشاؤها بواسطة برنامج «تشات جي بي تي 3.5» المدعوم بالذكاء الاصطناعي.

ومن بين الشعراء الذين عُرض شعرُهم على المشاركين جيفري تشوسر، وويليام شكسبير، وصامويل بتلر، واللورد بايرون، ووال ويتمان، وإميلي ديكنسون، وتي إس إليوت، وألين جينسبيرغ، وسيلفيا بلاث، ودوروثيا لاسكي.

ووجد الباحثون أن 75 في المائة من المشاركين كانوا أكثر ميلاً إلى الحكم على القصائد التي تم إنشاؤها بواسطة الذكاء الاصطناعي على أنها من تأليف البشر مقارنة بالقصائد التي كتبها البشر بالفعل.

وعلى النقيض من الأبحاث السابقة، وجدت الدراسة أيضاً أن المشاركين صَنَّفوا القصائد التي تم إنشاؤها بواسطة الذكاء الاصطناعي أعلى من حيث الجودة الإجمالية من القصائد التي كتبها البشر.

ويقترح المؤلفون أن القُرَّاء العاديين، غير الخبراء في مجال الشعر، يفضِّلون القصائد التي تم إنشاؤها بواسطة الذكاء الاصطناعي؛ لأنهم يجدونها أكثر وضوحاً وسهولة.

وأضافوا أن «التعقيد والغموض» في الشعر المكتوب بواسطة البشر، «من الأسباب الرئيسية للتقليل من جاذبية القصائد بالنسبة للقارئ العادي».

وقالت الشاعرة جويل تايلور، الحائزة جائزة «تي إس إليوت» للشعر، رداً على نتائج الدراسة: «بينما ليس لدي أدنى شك في أن الذكاء الاصطناعي يمكنه توليد الشعر بواسطة خوارزمياته. فإن الإنسانية هي جوهر القصيدة».

وأضافت: «القصيدة أكثر من مجرد خوارزمية. إنها معنى وعاطفة وأفكار ومنطق».

وتأتي هذه الدراسة بالتزامن مع أخرى أكدت أن روبوت الدردشة الذكي الشهير «تشات جي بي تي» يتفوق على الأطباء في تشخيص الأمراض.

وبحسب الدراسة، حقَّق روبوت الدردشة، متوسط ​​درجات بلغ 90 في المائة عند تشخيص المشكلات الطبية، في حين حصل الأطباء الذين شخَّصوا الحالات بمفردهم على متوسط ​​درجات بلغ 74 في المائة.