أصوات الذكاء الاصطناعي بنبرات أنثوية لها جرس جذاب

كيف يبدو صوت الذكاء الاصطناعي؟ لقد كانت «هوليوود» تتخيّل ذلك منذ عقود. أما الآن فيبتعد مطوّرو الذكاء الاصطناعي عن الأفلام، ويصنعون أصواتاً لآلات حقيقية بناءً على خيالات سينمائية قديمة حول الطريقة التي يجب أن تتحدث بها الآلات.

صوت نسائي له جرس الإثارة

في شهر مايو (أيار)، كشفت شركة «أوبن إيه آي» OpenAI عن ترقيات لبرنامج الدردشة الآلي الخاص بها الذي يعمل بالذكاء الاصطناعي. وقالت إن «تشات جي بي تي» كان يتعلّم كيفية الاستماع والرؤية والتحدث بصوت طبيعي؛ وهو صوت يشبه، إلى حد كبير، نظام تشغيل بنبرات سكارليت جوهانسون في فيلم سبايك جونز «هي» (Her) عام 2013... من دون وجود أي جسد بشري.

كان صوت «تشات جي بي تي» المسمى «سكاي» (Sky)، يتمتع أيضاً بجرس أجش وتأثير مهدئ وميزة الإثارة الجذابة. وكانت مقدمة الصوت الاصطناعي هذه لطيفة ومنطوية على نفسها؛ وبدت وكأنها تتعامل بمرونة. وبعد ظهور «سكاي» لأول مرة، أعربت جوهانسون عن استيائها من الصوت «المشابه بصورة مخيفة» لصوتها، وقالت إنها رفضت سابقاً طلب «أوبن إيه آي» أن تقوم بتصويت الروبوت. إلا أن الشركة احتجت وقالت إن «سكاي» تقوم بأداء صوتها من قبل «ممثلة محترفة مختلفة». ومع ذلك وافقت على إيقاف صوتها مؤقتاً احتراماً لجوهانسون.

طبقات صوتية متخيّلة

يحب منشئو الذكاء الاصطناعي تسليط الضوء على القدرات الطبيعية المتزايدة لأدواتهم، لكن أصواتها الاصطناعية مبنية على طبقات من التحايل والتصورات.

تمثّل «سكاي» أحدث طموحات الشركة المنتجة لها، لكنها تعتمد على فكرة قديمة هي أن روبوت الذكاء الاصطناعي هو امرأة متعاطفة ومذعنة، وأن جزءاً منها يأتي من الأم، ولها جزء من السكرتيرة، وجزء من الصديقة. وكانت تلك فكرة «سامانثا» في فيلم «هي»، وهي بمثابة أداة مريحة لجميع الأغراض، التي كان صوتها يتدفق منساباً مباشرة إلى آذان مستخدميها.

أصوات أنثوية متخيَّلة

وحتى مع تقدّم تكنولوجيا الذكاء الاصطناعي يُعاد ترميز هذه الصور النمطية مراراً وتكراراً.

إن أصوات النساء -كما لاحظت جولي ووسك في كتابها «المرأة الاصطناعية: الدمى الجنسية، ومقدمو الرعاية الآليون، ومزيد من الإناث المستنسخات»، غالباً ما غذّتها التقنيات المتخيلة حتى قبل أن تُدمج في تقنيات حقيقية.

في سلسلة «ستار تريك» (Star Trek) الأصلية، التي ظهرت لأول مرة في عام 1966، تم التعبير عن صوت الكومبيوتر الموجود على سطح سفينة «إنتربرايز» بواسطة ماجيل باريت- رودنبري، زوجة مبتكر العرض جين رودنبري. وفي فيلم «Alien» عام 1979، خاطب طاقم السفينة «USCSS Nostromo» الصوت النسائي الصادر عن الكومبيوتر بكلمة «الأم» (اسمها الكامل كان MU - TH - UR 6000).

بمجرد أن بدأت شركات التكنولوجيا في تسويق أدوات المساعدة الافتراضية -«سيري» من شركة «أبل»، و«أليكسا» من «أمازون»، و«كورتانا» من «مايكروسوفت»- أصبحت أصواتها أنثوية إلى حد كبير أيضاً.

وصُمّم برنامج تحويل الصوت إلى كلام، لجعل الوسائط المرئية في متناول المستخدمين ذوي الإعاقات المعينة، وعلى «تيك توك»، أصبحت قوة إبداعية في حد ذاتها. فمنذ أن طرحت «تيك توك» ميزة تحويل النص إلى كلام في عام 2020، طوّرت مجموعة من الأصوات المحاكية للاختيار من بينها؛ وهي تقدم الآن أكثر من 50 صوتاً، بما في ذلك أصوات تسمى «هيرو» (Hero)، و«ستوري تيلر» (Story Teller)، و«بيستي» (Bestie).

لكن النظام الأساسي أصبح محدداً بخيار واحد هو «Jessie»، صوت المرأة المفعم بالحيوية بلا هوادة مع مسحة آلية غامضة قليلاً. ويبدو أن «جيسي» قد خصّصت لها عاطفة واحدة لها: الحماس. إنها تبدو وكأنها تبيع شيئاً ما. وهذا ما جعلها خياراً جذاباً لمبدعي «تيك توك»، الذين يسوّقون أنفسهم. يمكن إسناد عبء تمثيل الذات إلى «جيسي»، التي يُضفي صوتها الآلي المشرق على مقاطع الفيديو لمعاناً ساخراً بصورة مبهجة.

أصوات ذكورية

أنشأت «هوليوود» روبوتات ذكورية أيضاً، وليس هناك ما هو أكثر شهرة من «HAL 9000»، صوت الكومبيوتر في فيلم «2001 :A Space Odyssey» ومثل أقرانه المؤنثين، يشع «هال» بالصفاء والولاء. ولكن عندما ينقلب على ديف بومان، الشخصية الإنسانية المركزية في الفيلم -«أنا آسف يا ديف، أخشى أنني لا أستطيع فعل ذلك»- يتطوّر صفاؤه إلى نوع من الكفاءة المخيفة. إذ يدرك ديف أن «هال» مخلص لسلطة أعلى. يسمح صوت «هال» الذكوري له بالعمل بصفته منافساً ومرآة لـ«ديف». يُسمح له بأن يصبح شخصية حقيقية.

ومثل «هال»، فإن «سامانثا» في فيلم «Her» هي آلة تصبح حقيقية. وفي تطور جديد لقصة بينوكيو، تبدأ الفيلم بترتيب صندوق البريد الإلكتروني للإنسان، وينتهي بها الأمر بالارتقاء إلى مستوى أعلى من الوعي. لقد أصبحت شيئاً أكثر تقدماً من الفتاة الحقيقية.

صوت ملهم للروبوتات الخيالية والحقيقية

إن صوت «جوهانسون» بوصفه مصدر إلهام للروبوتات الخيالية والحقيقية، لا يبدو مثل أصوات أجهزة المساعدة الافتراضية التي اعتدنا على سماعها تتحدث عبر هواتفنا. لكن أداءها يبدو إنسانياً ليس فقط بسبب صوتها، ولكن بسبب ما تقوله. وقد كانت تنمو على مدار الفيلم، وتكتسب الرغبات الجنسية والهوايات المتقدمة وأصدقاء الذكاء الاصطناعي.

ومن خلال استعارة تأثير «سامانثا»، بدت «سكاي» كما لو كان لديها عقل خاص بها، وأضحت أكثر تقدماً مما كانت عليه حقاً.

عندما رأيت فيلم «هي» لأول مرة، اعتقدت فقط أن «جوهانسون» قد عبّرت عن روبوت يشبه الإنسان. ولكن عندما عدت إلى الفيلم مؤخراً، بعد مشاهدة العرض التوضيحي لـ«تشات جي بي تي»، أذهلني دور «سامانثا» بصفته أكثر تعقيداً بصفة لا نهائية. ولا تولّد برامج الدردشة أصواتاً بشرية تتحدث تلقائياً، إذ ليست لديها حناجر أو شفاه أو ألسنة. داخل العالم التكنولوجي لفيلم «Her»، كان روبوت «سامانثا» يعتمد على صوت امرأة بشرية؛ ربما ممثلة خيالية تشبه إلى حد كبير صوت جوهانسون.

برامج ذكية تفهم النكات وتعرف المزاج

يبدو أن «أوبن إيه آي» درّبت برنامج الدردشة الآلي الخاص بها على صوت ممثلة مجهولة تبدو كأنها ممثلة مشهورة أدت صوت برنامج الدردشة الآلي في الأفلام، ودُرّبت ضمنياً على ممثلة غير حقيقية تبدو كأنها ممثلة مشهورة. عندما أشغّل العرض التوضيحي لـ«ChatGPT» (تشات جي بي تي) أسمع محاكاة لمحاكاة لمحاكاة لمحاكاة. وتعلن شركات التكنولوجيا عن أنها تطور أدوات المساعدة الافتراضية المقبلة لتقديم مختلف الخدمات، إذ سيمكنها قراءة تقرير الطقس لك، واستدعاء سيارة أجرة لك. وتُعد «أوبن إيه آي» بأن روبوتات الدردشة الأكثر تقدماً ستكون قادرة على الضحك على نكاتك، واستشعار التغيرات في حالتك المزاجية.

إدماج المبدعين مع روبوتات الدردشة

إن صوت جوهانسون يعمل مثل غطاء فاخر يُلقى فوق الجوانب الغريبة للتفاعلات المدعومة بالذكاء الاصطناعي. وقالت جوهانسون، عند حديثها عن سام ألتمان مؤسس «أوبن إيه آي»: «أخبرني أنه شعر من خلال التعبير بصوتي عن النظام الروبوتي، أنه سيتمكن من سد الفجوة بين شركات التكنولوجيا والمبدعين، بهدف مساعدة المستهلكين على الشعور بالارتياح تجاه التحول الزلزالي فيما يتعلق بالبشر والذكاء الاصطناعي». وأضاف أنه «شعر أن صوتي سيكون مريحاً للناس».

لا يعني ذلك أن صوت جوهانسون يبدو بطبيعته مثل صوت الروبوت. لقد صمّم المطورون وصانعو الأفلام أصوات الروبوتات الخاصة بهم لتخفيف الانزعاج المتأصل في التفاعلات بين الإنسان والروبوت. وقالت شركة «أوبن إيه آي» إنها تريد أن تقدم صوتاً لروبوتات الدردشة يكون «سهل الوصول إليه» و«دافئاً» و«يلهم الثقة».

إن الذكاء الاصطناعي متهم بتدمير المجالات والقطاعات الإبداعية واستهلاك الطاقة وحتى تهديد حياة الإنسان؛ لذا فإن من المفهوم أن تريد «أوبن إيه آي» صوتاً يجعل الناس يشعرون بالراحة عند استخدام منتجاتها.

* خدمة «نيويورك تايمز»

أصوات الذكاء الاصطناعي بنبرات أنثوية لها جرس جذاب

تقنيات لتطوير أنماط لدمج النساء المبدعات بالروبوتات