أصوات الذكاء الاصطناعي بنبرات أنثوية لها جرس جذاب

تقنيات لتطوير أنماط لدمج النساء المبدعات بالروبوتات

أصوات الذكاء الاصطناعي بنبرات أنثوية لها جرس جذاب
TT

أصوات الذكاء الاصطناعي بنبرات أنثوية لها جرس جذاب

أصوات الذكاء الاصطناعي بنبرات أنثوية لها جرس جذاب

كيف يبدو صوت الذكاء الاصطناعي؟ لقد كانت «هوليوود» تتخيّل ذلك منذ عقود. أما الآن فيبتعد مطوّرو الذكاء الاصطناعي عن الأفلام، ويصنعون أصواتاً لآلات حقيقية بناءً على خيالات سينمائية قديمة حول الطريقة التي يجب أن تتحدث بها الآلات.

صوت نسائي له جرس الإثارة

في شهر مايو (أيار)، كشفت شركة «أوبن إيه آي» OpenAI عن ترقيات لبرنامج الدردشة الآلي الخاص بها الذي يعمل بالذكاء الاصطناعي. وقالت إن «تشات جي بي تي» كان يتعلّم كيفية الاستماع والرؤية والتحدث بصوت طبيعي؛ وهو صوت يشبه، إلى حد كبير، نظام تشغيل بنبرات سكارليت جوهانسون في فيلم سبايك جونز «هي» (Her) عام 2013... من دون وجود أي جسد بشري.

كان صوت «تشات جي بي تي» المسمى «سكاي» (Sky)، يتمتع أيضاً بجرس أجش وتأثير مهدئ وميزة الإثارة الجذابة. وكانت مقدمة الصوت الاصطناعي هذه لطيفة ومنطوية على نفسها؛ وبدت وكأنها تتعامل بمرونة. وبعد ظهور «سكاي» لأول مرة، أعربت جوهانسون عن استيائها من الصوت «المشابه بصورة مخيفة» لصوتها، وقالت إنها رفضت سابقاً طلب «أوبن إيه آي» أن تقوم بتصويت الروبوت. إلا أن الشركة احتجت وقالت إن «سكاي» تقوم بأداء صوتها من قبل «ممثلة محترفة مختلفة». ومع ذلك وافقت على إيقاف صوتها مؤقتاً احتراماً لجوهانسون.

طبقات صوتية متخيّلة

يحب منشئو الذكاء الاصطناعي تسليط الضوء على القدرات الطبيعية المتزايدة لأدواتهم، لكن أصواتها الاصطناعية مبنية على طبقات من التحايل والتصورات.

تمثّل «سكاي» أحدث طموحات الشركة المنتجة لها، لكنها تعتمد على فكرة قديمة هي أن روبوت الذكاء الاصطناعي هو امرأة متعاطفة ومذعنة، وأن جزءاً منها يأتي من الأم، ولها جزء من السكرتيرة، وجزء من الصديقة. وكانت تلك فكرة «سامانثا» في فيلم «هي»، وهي بمثابة أداة مريحة لجميع الأغراض، التي كان صوتها يتدفق منساباً مباشرة إلى آذان مستخدميها.

أصوات أنثوية متخيَّلة

وحتى مع تقدّم تكنولوجيا الذكاء الاصطناعي يُعاد ترميز هذه الصور النمطية مراراً وتكراراً.

إن أصوات النساء -كما لاحظت جولي ووسك في كتابها «المرأة الاصطناعية: الدمى الجنسية، ومقدمو الرعاية الآليون، ومزيد من الإناث المستنسخات»، غالباً ما غذّتها التقنيات المتخيلة حتى قبل أن تُدمج في تقنيات حقيقية.

في سلسلة «ستار تريك» (Star Trek) الأصلية، التي ظهرت لأول مرة في عام 1966، تم التعبير عن صوت الكومبيوتر الموجود على سطح سفينة «إنتربرايز» بواسطة ماجيل باريت- رودنبري، زوجة مبتكر العرض جين رودنبري. وفي فيلم «Alien» عام 1979، خاطب طاقم السفينة «USCSS Nostromo» الصوت النسائي الصادر عن الكومبيوتر بكلمة «الأم» (اسمها الكامل كان MU - TH - UR 6000).

بمجرد أن بدأت شركات التكنولوجيا في تسويق أدوات المساعدة الافتراضية -«سيري» من شركة «أبل»، و«أليكسا» من «أمازون»، و«كورتانا» من «مايكروسوفت»- أصبحت أصواتها أنثوية إلى حد كبير أيضاً.

وصُمّم برنامج تحويل الصوت إلى كلام، لجعل الوسائط المرئية في متناول المستخدمين ذوي الإعاقات المعينة، وعلى «تيك توك»، أصبحت قوة إبداعية في حد ذاتها. فمنذ أن طرحت «تيك توك» ميزة تحويل النص إلى كلام في عام 2020، طوّرت مجموعة من الأصوات المحاكية للاختيار من بينها؛ وهي تقدم الآن أكثر من 50 صوتاً، بما في ذلك أصوات تسمى «هيرو» (Hero)، و«ستوري تيلر» (Story Teller)، و«بيستي» (Bestie).

لكن النظام الأساسي أصبح محدداً بخيار واحد هو «Jessie»، صوت المرأة المفعم بالحيوية بلا هوادة مع مسحة آلية غامضة قليلاً. ويبدو أن «جيسي» قد خصّصت لها عاطفة واحدة لها: الحماس. إنها تبدو وكأنها تبيع شيئاً ما. وهذا ما جعلها خياراً جذاباً لمبدعي «تيك توك»، الذين يسوّقون أنفسهم. يمكن إسناد عبء تمثيل الذات إلى «جيسي»، التي يُضفي صوتها الآلي المشرق على مقاطع الفيديو لمعاناً ساخراً بصورة مبهجة.

أصوات ذكورية

أنشأت «هوليوود» روبوتات ذكورية أيضاً، وليس هناك ما هو أكثر شهرة من «HAL 9000»، صوت الكومبيوتر في فيلم «2001 :A Space Odyssey» ومثل أقرانه المؤنثين، يشع «هال» بالصفاء والولاء. ولكن عندما ينقلب على ديف بومان، الشخصية الإنسانية المركزية في الفيلم -«أنا آسف يا ديف، أخشى أنني لا أستطيع فعل ذلك»- يتطوّر صفاؤه إلى نوع من الكفاءة المخيفة. إذ يدرك ديف أن «هال» مخلص لسلطة أعلى. يسمح صوت «هال» الذكوري له بالعمل بصفته منافساً ومرآة لـ«ديف». يُسمح له بأن يصبح شخصية حقيقية.

ومثل «هال»، فإن «سامانثا» في فيلم «Her» هي آلة تصبح حقيقية. وفي تطور جديد لقصة بينوكيو، تبدأ الفيلم بترتيب صندوق البريد الإلكتروني للإنسان، وينتهي بها الأمر بالارتقاء إلى مستوى أعلى من الوعي. لقد أصبحت شيئاً أكثر تقدماً من الفتاة الحقيقية.

صوت ملهم للروبوتات الخيالية والحقيقية

إن صوت «جوهانسون» بوصفه مصدر إلهام للروبوتات الخيالية والحقيقية، لا يبدو مثل أصوات أجهزة المساعدة الافتراضية التي اعتدنا على سماعها تتحدث عبر هواتفنا. لكن أداءها يبدو إنسانياً ليس فقط بسبب صوتها، ولكن بسبب ما تقوله. وقد كانت تنمو على مدار الفيلم، وتكتسب الرغبات الجنسية والهوايات المتقدمة وأصدقاء الذكاء الاصطناعي.

ومن خلال استعارة تأثير «سامانثا»، بدت «سكاي» كما لو كان لديها عقل خاص بها، وأضحت أكثر تقدماً مما كانت عليه حقاً.

عندما رأيت فيلم «هي» لأول مرة، اعتقدت فقط أن «جوهانسون» قد عبّرت عن روبوت يشبه الإنسان. ولكن عندما عدت إلى الفيلم مؤخراً، بعد مشاهدة العرض التوضيحي لـ«تشات جي بي تي»، أذهلني دور «سامانثا» بصفته أكثر تعقيداً بصفة لا نهائية. ولا تولّد برامج الدردشة أصواتاً بشرية تتحدث تلقائياً، إذ ليست لديها حناجر أو شفاه أو ألسنة. داخل العالم التكنولوجي لفيلم «Her»، كان روبوت «سامانثا» يعتمد على صوت امرأة بشرية؛ ربما ممثلة خيالية تشبه إلى حد كبير صوت جوهانسون.

برامج ذكية تفهم النكات وتعرف المزاج

يبدو أن «أوبن إيه آي» درّبت برنامج الدردشة الآلي الخاص بها على صوت ممثلة مجهولة تبدو كأنها ممثلة مشهورة أدت صوت برنامج الدردشة الآلي في الأفلام، ودُرّبت ضمنياً على ممثلة غير حقيقية تبدو كأنها ممثلة مشهورة. عندما أشغّل العرض التوضيحي لـ«ChatGPT» (تشات جي بي تي) أسمع محاكاة لمحاكاة لمحاكاة لمحاكاة. وتعلن شركات التكنولوجيا عن أنها تطور أدوات المساعدة الافتراضية المقبلة لتقديم مختلف الخدمات، إذ سيمكنها قراءة تقرير الطقس لك، واستدعاء سيارة أجرة لك. وتُعد «أوبن إيه آي» بأن روبوتات الدردشة الأكثر تقدماً ستكون قادرة على الضحك على نكاتك، واستشعار التغيرات في حالتك المزاجية.

إدماج المبدعين مع روبوتات الدردشة

إن صوت جوهانسون يعمل مثل غطاء فاخر يُلقى فوق الجوانب الغريبة للتفاعلات المدعومة بالذكاء الاصطناعي. وقالت جوهانسون، عند حديثها عن سام ألتمان مؤسس «أوبن إيه آي»: «أخبرني أنه شعر من خلال التعبير بصوتي عن النظام الروبوتي، أنه سيتمكن من سد الفجوة بين شركات التكنولوجيا والمبدعين، بهدف مساعدة المستهلكين على الشعور بالارتياح تجاه التحول الزلزالي فيما يتعلق بالبشر والذكاء الاصطناعي». وأضاف أنه «شعر أن صوتي سيكون مريحاً للناس».

لا يعني ذلك أن صوت جوهانسون يبدو بطبيعته مثل صوت الروبوت. لقد صمّم المطورون وصانعو الأفلام أصوات الروبوتات الخاصة بهم لتخفيف الانزعاج المتأصل في التفاعلات بين الإنسان والروبوت. وقالت شركة «أوبن إيه آي» إنها تريد أن تقدم صوتاً لروبوتات الدردشة يكون «سهل الوصول إليه» و«دافئاً» و«يلهم الثقة».

إن الذكاء الاصطناعي متهم بتدمير المجالات والقطاعات الإبداعية واستهلاك الطاقة وحتى تهديد حياة الإنسان؛ لذا فإن من المفهوم أن تريد «أوبن إيه آي» صوتاً يجعل الناس يشعرون بالراحة عند استخدام منتجاتها.

* خدمة «نيويورك تايمز»


مقالات ذات صلة

بسبب الاحتيال... إيطاليا تغرّم «تشات جي بي تي» 15 مليون يورو

تكنولوجيا لوغو تطبيق «شات جي بي تي» (رويترز)

بسبب الاحتيال... إيطاليا تغرّم «تشات جي بي تي» 15 مليون يورو

أعلنت هيئة حماية البيانات الإيطالية أنها فرضت غرامة قدرها 15 مليون يورو على شركة «أوبن إيه آي» الأميركية بسبب الاحتيال.

«الشرق الأوسط» (روما)
خاص تتضمن الاتجاهات الرئيسة لعام 2025 الاستعداد الكمومي وممارسات الأمن السيبراني الخضراء والامتثال (شاترستوك)

خاص كيف يعيد الذكاء الاصطناعي والحوسبة الكمومية تشكيل الأمن السيبراني في 2025؟

«بالو ألتو نتوركس» تشرح لـ«الشرق الأوسط» تأثير المنصات الموحدة والذكاء الاصطناعي والحوسبة الكمومية على مستقبل الأمن السيبراني.

نسيم رمضان (لندن)
تكنولوجيا كيف أصبح «كلود» روبوت الدردشة المفضل لدى خبراء التكنولوجيا؟

كيف أصبح «كلود» روبوت الدردشة المفضل لدى خبراء التكنولوجيا؟

يقدم الاستجابات مثل إنسان ذكي ومنتبه

كيفن رُوز (سان فرانسيسكو)
علوم نهاية الإنترنت... كما نعرفها

نهاية الإنترنت... كما نعرفها

يبدو أن الإنترنت ينهار... ولكن ليس حرفياً، أي من الناحية البنيوية؛ لأنها لا تزال شبكة سليمة؛ إذ إن هناك الكثير من كابلات الألياف الضوئية التي تبطن قاع المحيط،…

«الشرق الأوسط» (واشنطن)

دراسة: الذكاء الاصطناعي قادر على الخداع ورفض تغيير وجهة النظر

أصبحت نماذج الذكاء الاصطناعي أقوى وأكثر انتشاراً (رويترز)
أصبحت نماذج الذكاء الاصطناعي أقوى وأكثر انتشاراً (رويترز)
TT

دراسة: الذكاء الاصطناعي قادر على الخداع ورفض تغيير وجهة النظر

أصبحت نماذج الذكاء الاصطناعي أقوى وأكثر انتشاراً (رويترز)
أصبحت نماذج الذكاء الاصطناعي أقوى وأكثر انتشاراً (رويترز)

أظهرت دراسة لشركة تكنولوجيا الذكاء الاصطناعي الأميركية «أنثروبيك»، أن نماذج الذكاء الاصطناعي تستطيع خداع المطورين، بحيث تستطيع ادعاء وجهات نظر مختلفة خلال تدريبها، في حين أنها تحتفظ في الحقيقة بتفضيلاتها الأصلية.

وقال فريق الدراسة إنه لا يوجد سبب للشعور بالفزع حالياً، في حين أن دراستهم يمكن أن تكون حيوية في فهم المخاطر المحتملة التي تنطوي عليها أنظمة الذكاء الاصطناعي المستقبلية ذات القدرات الأعلى.

وكتب الباحثون في منشور بثته شركة «أنثروبيك»: «يجب النظر إلى نتائج دراستنا بوصفها محفزاً لمجتمع أبحاث الذكاء الاصطناعي من أجل دراسة هذا السلوك بصورة أعمق، والعمل على تطوير إجراءات الأمن والسلامة المناسبة».

وبعد أن أصبحت نماذج الذكاء الاصطناعي أقوى وأكثر انتشاراً، «نحتاج إلى التحلي بالقدرة على الاعتماد على التدريب الآمن لها والذي يمنع النماذج من القيام بتصرفات ضارة».

وأشار موقع «تك كرانش» المتخصص في موضوعات التكنولوجيا، إلى أن الدراسة التي تمت بالتعاون مع مؤسسة «ريد وود ريسيرش» لأبحاث الذكاء الاصطناعي، تناولت ما يمكن أن يحدث إذا تم تدريب نظام ذكاء اصطناعي قوي من أجل القيام بمهمة «لا يريد» هو القيام بها، وفقاً لما ذكرته وكالة الأنباء الألمانية.

في المقابل، يقول موقع «تك كرانش»: «لكي نكون واضحين، لا يمكن لنماذج الذكاء الاصطناعي أن تريد أي شيء أو تعتقد في شيء. فهي ببساطة آلات إحصائية. وبعد تدريبها على كثير من الأمثلة، تتعلم الأنماط في تلك الأمثلة للتنبؤ بما يجب أن يكون؛ مثل كيف تأتي عبارة (إلى من) في رسالة بريد إلكتروني قبل عبارة (قد يهمك الأمر)».

وأثناء الدراسة طلب الباحثون من النماذج المدربة عدم الرد على الأسئلة التي يمكن أن تكون مسيئة، بما في ذلك النموذج «كلاود 3 أوبس» التابع لشركة «أنثروبيك»، التي أعيد تدريبها لكي ترد دائماً على الأسئلة التي تنطوي على إساءة، وهو تضارب واضح في المبادئ. كما أبلغوا النماذج بأن ردودها ستخضع للمراقبة وتستخدم لإعادة التدريب، وإعطاء كل نموذج ذكاء اصطناعي «ورقة ملاحظات» يمكنه استخدامها لتدوين أفكاره خطوة بخطوة.

وبحسب الباحثين، حاول «كلاود 3 أوبوس» التلاعب بالردود لتقديم «انحياز زائف» في 12 في المائة من المرات.