أصوات الذكاء الاصطناعي بنبرات أنثوية لها جرس جذاب

تقنيات لتطوير أنماط لدمج النساء المبدعات بالروبوتات

أصوات الذكاء الاصطناعي بنبرات أنثوية لها جرس جذاب
TT

أصوات الذكاء الاصطناعي بنبرات أنثوية لها جرس جذاب

أصوات الذكاء الاصطناعي بنبرات أنثوية لها جرس جذاب

كيف يبدو صوت الذكاء الاصطناعي؟ لقد كانت «هوليوود» تتخيّل ذلك منذ عقود. أما الآن فيبتعد مطوّرو الذكاء الاصطناعي عن الأفلام، ويصنعون أصواتاً لآلات حقيقية بناءً على خيالات سينمائية قديمة حول الطريقة التي يجب أن تتحدث بها الآلات.

صوت نسائي له جرس الإثارة

في شهر مايو (أيار)، كشفت شركة «أوبن إيه آي» OpenAI عن ترقيات لبرنامج الدردشة الآلي الخاص بها الذي يعمل بالذكاء الاصطناعي. وقالت إن «تشات جي بي تي» كان يتعلّم كيفية الاستماع والرؤية والتحدث بصوت طبيعي؛ وهو صوت يشبه، إلى حد كبير، نظام تشغيل بنبرات سكارليت جوهانسون في فيلم سبايك جونز «هي» (Her) عام 2013... من دون وجود أي جسد بشري.

كان صوت «تشات جي بي تي» المسمى «سكاي» (Sky)، يتمتع أيضاً بجرس أجش وتأثير مهدئ وميزة الإثارة الجذابة. وكانت مقدمة الصوت الاصطناعي هذه لطيفة ومنطوية على نفسها؛ وبدت وكأنها تتعامل بمرونة. وبعد ظهور «سكاي» لأول مرة، أعربت جوهانسون عن استيائها من الصوت «المشابه بصورة مخيفة» لصوتها، وقالت إنها رفضت سابقاً طلب «أوبن إيه آي» أن تقوم بتصويت الروبوت. إلا أن الشركة احتجت وقالت إن «سكاي» تقوم بأداء صوتها من قبل «ممثلة محترفة مختلفة». ومع ذلك وافقت على إيقاف صوتها مؤقتاً احتراماً لجوهانسون.

طبقات صوتية متخيّلة

يحب منشئو الذكاء الاصطناعي تسليط الضوء على القدرات الطبيعية المتزايدة لأدواتهم، لكن أصواتها الاصطناعية مبنية على طبقات من التحايل والتصورات.

تمثّل «سكاي» أحدث طموحات الشركة المنتجة لها، لكنها تعتمد على فكرة قديمة هي أن روبوت الذكاء الاصطناعي هو امرأة متعاطفة ومذعنة، وأن جزءاً منها يأتي من الأم، ولها جزء من السكرتيرة، وجزء من الصديقة. وكانت تلك فكرة «سامانثا» في فيلم «هي»، وهي بمثابة أداة مريحة لجميع الأغراض، التي كان صوتها يتدفق منساباً مباشرة إلى آذان مستخدميها.

أصوات أنثوية متخيَّلة

وحتى مع تقدّم تكنولوجيا الذكاء الاصطناعي يُعاد ترميز هذه الصور النمطية مراراً وتكراراً.

إن أصوات النساء -كما لاحظت جولي ووسك في كتابها «المرأة الاصطناعية: الدمى الجنسية، ومقدمو الرعاية الآليون، ومزيد من الإناث المستنسخات»، غالباً ما غذّتها التقنيات المتخيلة حتى قبل أن تُدمج في تقنيات حقيقية.

في سلسلة «ستار تريك» (Star Trek) الأصلية، التي ظهرت لأول مرة في عام 1966، تم التعبير عن صوت الكومبيوتر الموجود على سطح سفينة «إنتربرايز» بواسطة ماجيل باريت- رودنبري، زوجة مبتكر العرض جين رودنبري. وفي فيلم «Alien» عام 1979، خاطب طاقم السفينة «USCSS Nostromo» الصوت النسائي الصادر عن الكومبيوتر بكلمة «الأم» (اسمها الكامل كان MU - TH - UR 6000).

بمجرد أن بدأت شركات التكنولوجيا في تسويق أدوات المساعدة الافتراضية -«سيري» من شركة «أبل»، و«أليكسا» من «أمازون»، و«كورتانا» من «مايكروسوفت»- أصبحت أصواتها أنثوية إلى حد كبير أيضاً.

وصُمّم برنامج تحويل الصوت إلى كلام، لجعل الوسائط المرئية في متناول المستخدمين ذوي الإعاقات المعينة، وعلى «تيك توك»، أصبحت قوة إبداعية في حد ذاتها. فمنذ أن طرحت «تيك توك» ميزة تحويل النص إلى كلام في عام 2020، طوّرت مجموعة من الأصوات المحاكية للاختيار من بينها؛ وهي تقدم الآن أكثر من 50 صوتاً، بما في ذلك أصوات تسمى «هيرو» (Hero)، و«ستوري تيلر» (Story Teller)، و«بيستي» (Bestie).

لكن النظام الأساسي أصبح محدداً بخيار واحد هو «Jessie»، صوت المرأة المفعم بالحيوية بلا هوادة مع مسحة آلية غامضة قليلاً. ويبدو أن «جيسي» قد خصّصت لها عاطفة واحدة لها: الحماس. إنها تبدو وكأنها تبيع شيئاً ما. وهذا ما جعلها خياراً جذاباً لمبدعي «تيك توك»، الذين يسوّقون أنفسهم. يمكن إسناد عبء تمثيل الذات إلى «جيسي»، التي يُضفي صوتها الآلي المشرق على مقاطع الفيديو لمعاناً ساخراً بصورة مبهجة.

أصوات ذكورية

أنشأت «هوليوود» روبوتات ذكورية أيضاً، وليس هناك ما هو أكثر شهرة من «HAL 9000»، صوت الكومبيوتر في فيلم «2001 :A Space Odyssey» ومثل أقرانه المؤنثين، يشع «هال» بالصفاء والولاء. ولكن عندما ينقلب على ديف بومان، الشخصية الإنسانية المركزية في الفيلم -«أنا آسف يا ديف، أخشى أنني لا أستطيع فعل ذلك»- يتطوّر صفاؤه إلى نوع من الكفاءة المخيفة. إذ يدرك ديف أن «هال» مخلص لسلطة أعلى. يسمح صوت «هال» الذكوري له بالعمل بصفته منافساً ومرآة لـ«ديف». يُسمح له بأن يصبح شخصية حقيقية.

ومثل «هال»، فإن «سامانثا» في فيلم «Her» هي آلة تصبح حقيقية. وفي تطور جديد لقصة بينوكيو، تبدأ الفيلم بترتيب صندوق البريد الإلكتروني للإنسان، وينتهي بها الأمر بالارتقاء إلى مستوى أعلى من الوعي. لقد أصبحت شيئاً أكثر تقدماً من الفتاة الحقيقية.

صوت ملهم للروبوتات الخيالية والحقيقية

إن صوت «جوهانسون» بوصفه مصدر إلهام للروبوتات الخيالية والحقيقية، لا يبدو مثل أصوات أجهزة المساعدة الافتراضية التي اعتدنا على سماعها تتحدث عبر هواتفنا. لكن أداءها يبدو إنسانياً ليس فقط بسبب صوتها، ولكن بسبب ما تقوله. وقد كانت تنمو على مدار الفيلم، وتكتسب الرغبات الجنسية والهوايات المتقدمة وأصدقاء الذكاء الاصطناعي.

ومن خلال استعارة تأثير «سامانثا»، بدت «سكاي» كما لو كان لديها عقل خاص بها، وأضحت أكثر تقدماً مما كانت عليه حقاً.

عندما رأيت فيلم «هي» لأول مرة، اعتقدت فقط أن «جوهانسون» قد عبّرت عن روبوت يشبه الإنسان. ولكن عندما عدت إلى الفيلم مؤخراً، بعد مشاهدة العرض التوضيحي لـ«تشات جي بي تي»، أذهلني دور «سامانثا» بصفته أكثر تعقيداً بصفة لا نهائية. ولا تولّد برامج الدردشة أصواتاً بشرية تتحدث تلقائياً، إذ ليست لديها حناجر أو شفاه أو ألسنة. داخل العالم التكنولوجي لفيلم «Her»، كان روبوت «سامانثا» يعتمد على صوت امرأة بشرية؛ ربما ممثلة خيالية تشبه إلى حد كبير صوت جوهانسون.

برامج ذكية تفهم النكات وتعرف المزاج

يبدو أن «أوبن إيه آي» درّبت برنامج الدردشة الآلي الخاص بها على صوت ممثلة مجهولة تبدو كأنها ممثلة مشهورة أدت صوت برنامج الدردشة الآلي في الأفلام، ودُرّبت ضمنياً على ممثلة غير حقيقية تبدو كأنها ممثلة مشهورة. عندما أشغّل العرض التوضيحي لـ«ChatGPT» (تشات جي بي تي) أسمع محاكاة لمحاكاة لمحاكاة لمحاكاة. وتعلن شركات التكنولوجيا عن أنها تطور أدوات المساعدة الافتراضية المقبلة لتقديم مختلف الخدمات، إذ سيمكنها قراءة تقرير الطقس لك، واستدعاء سيارة أجرة لك. وتُعد «أوبن إيه آي» بأن روبوتات الدردشة الأكثر تقدماً ستكون قادرة على الضحك على نكاتك، واستشعار التغيرات في حالتك المزاجية.

إدماج المبدعين مع روبوتات الدردشة

إن صوت جوهانسون يعمل مثل غطاء فاخر يُلقى فوق الجوانب الغريبة للتفاعلات المدعومة بالذكاء الاصطناعي. وقالت جوهانسون، عند حديثها عن سام ألتمان مؤسس «أوبن إيه آي»: «أخبرني أنه شعر من خلال التعبير بصوتي عن النظام الروبوتي، أنه سيتمكن من سد الفجوة بين شركات التكنولوجيا والمبدعين، بهدف مساعدة المستهلكين على الشعور بالارتياح تجاه التحول الزلزالي فيما يتعلق بالبشر والذكاء الاصطناعي». وأضاف أنه «شعر أن صوتي سيكون مريحاً للناس».

لا يعني ذلك أن صوت جوهانسون يبدو بطبيعته مثل صوت الروبوت. لقد صمّم المطورون وصانعو الأفلام أصوات الروبوتات الخاصة بهم لتخفيف الانزعاج المتأصل في التفاعلات بين الإنسان والروبوت. وقالت شركة «أوبن إيه آي» إنها تريد أن تقدم صوتاً لروبوتات الدردشة يكون «سهل الوصول إليه» و«دافئاً» و«يلهم الثقة».

إن الذكاء الاصطناعي متهم بتدمير المجالات والقطاعات الإبداعية واستهلاك الطاقة وحتى تهديد حياة الإنسان؛ لذا فإن من المفهوم أن تريد «أوبن إيه آي» صوتاً يجعل الناس يشعرون بالراحة عند استخدام منتجاتها.

* خدمة «نيويورك تايمز»


مقالات ذات صلة

شركات الذكاء الاصطناعي التوليدي تلجأ إلى الكتب لتطوّر برامجها

تكنولوجيا شركات الذكاء الاصطناعي تتفق مع دور النشر بما يتيح لهذه الشركات استخدام الأعمال المنشورة لتدريب نماذجها القائمة على الذكاء الاصطناعي التوليدي (رويترز)

شركات الذكاء الاصطناعي التوليدي تلجأ إلى الكتب لتطوّر برامجها

مع ازدياد احتياجات الذكاء الاصطناعي التوليدي، بدأت أوساط قطاع النشر هي الأخرى في التفاوض مع المنصات التي توفر هذه التقنية سعياً إلى حماية حقوق المؤلفين.

«الشرق الأوسط» (باريس)
الاقتصاد بورصة نيويورك للأوراق المالية (وكالة حماية البيئة)

هيمنة الأسهم الأميركية تزداد قوة مع فوز ترمب

تواصل الأسهم الأميركية تعزيز تفوقها على منافسيها العالميين، ويعتقد العديد من المستثمرين أن هذه الهيمنة قد تزداد إذا تمكن دونالد ترمب من تنفيذ برنامجه.

«الشرق الأوسط» (نيويورك)
تكنولوجيا يستعرض مؤتمر «مايكروسوفت إغنايت 2024» أبرز تقنيات الذكاء الاصطناعي المقبلة

مؤتمر «مايكروسوفت إغنايت 2024» يكشف عن أبرز نزعات الذكاء الاصطناعي المقبلة

إطلاق أكبر مشروع للأمن الرقمي بتاريخ البشرية لمواجهة أكثر من 7000 هجمة في الثانية.

خلدون غسان سعيد (جدة)
الاقتصاد علم شركة «إنفيديا» على الحرم الجامعي في سانتا كلارا بكاليفورنيا (إ.ب.أ)

بالأرقام... كيف أصبحت «إنفيديا» الشركة الأكثر قيمة في العالم؟

حققت «إنفيديا» مرة أخرى نتائج ربع سنوية تجاوزت توقعات «وول ستريت».

«الشرق الأوسط» (نيويورك)
الاقتصاد شاشة تسجيل الوصول في مكتب «إنفيديا» في أوستن بتكساس (أ.ف.ب)

«إنفيديا» تتفوق على توقعات الأرباح مع ترقب المستثمرين للطلب على رقائق «بلاكويل» للذكاء الاصطناعي

أعلنت شركة «إنفيديا»، يوم الأربعاء، عن زيادة في أرباحها ومبيعاتها في الربع الثالث مع استمرار الطلب على رقائق الكمبيوتر المتخصصة.

«الشرق الأوسط» (نيويورك)

7 مشاريع تجريبية للذكاء الاصطناعي من «غوغل» يمكنك التعرف عليها الآن

7 مشاريع تجريبية للذكاء الاصطناعي من «غوغل» يمكنك التعرف عليها الآن
TT

7 مشاريع تجريبية للذكاء الاصطناعي من «غوغل» يمكنك التعرف عليها الآن

7 مشاريع تجريبية للذكاء الاصطناعي من «غوغل» يمكنك التعرف عليها الآن

تمنحنا «غوغل» إمكانية الوصول إلى مجموعة متنوعة من الأدوات التجريبية التي لم تصبح منتجات كاملة بعد. وسواء كنت من منشئي المحتوى أو طالباً أو مجرد فضولي بشأن الذكاء الاصطناعي، فهناك شيء يناسب الجميع لاستكشافه.

مشاريع «غوغل»

* «نوتبوك إل إم (NotebookLM)» - مساعد تدوين الملاحظات المدعوم بالذكاء الاصطناعي الذي يساعدك على تحليل وفهم المستندات.

قم بتحميل مواد البحث الخاصة بك، وسيساعدك الذكاء الاصطناعي في إنشاء ملخصات والإجابة عن الأسئلة وتوليد الأفكار.

إنه يشبه إلى حد ما إنشاء دليل دراسي مخصص لك لمواضيع مختلفة. كما يتيح لك إنشاء لمحات صوتية لموادك – أي مناقشات تشبه البث الصوتي يستضيفها صوتان اصطناعيان «غريبان».

والبرنامج مفيد بشكل خاص للطلاب والباحثين والمحترفين الذين يحتاجون إلى معالجة كميات كبيرة من المحتوى المكتوب بكفاءة.

برنامج «تعرف على...»

محادثة طبيعية وموسيقى وصور

*«تعرف على... (...Learn About)» - تستخدم هذه الأداة الذكاء الاصطناعي لمساعدتك في استكشاف وفهم الموضوعات المعقدة من خلال المحادثات الطبيعية.

سواء كنت تتعمق في موضوع جديد أو تصقل معارفك الحالية، فإنها توفر لك تجربة تعليمية مخصصة. ابدأ ببساطة بموضوع تهتم به، وسترشدك عبر تجربة تعليمية تكيفية، إذ إنها تتكيّف مع مستوى معرفتك واهتماماتك أثناء تقدمك.

* «ميوزك إف إكس (MusicFX)» - أداة لإنشاء الموسيقى تعمل بالذكاء الاصطناعي وتسمح لأي شخص بإنشاء مقطوعات موسيقية أصلية من خلال وصف فكرة موسيقية وسماعها تنبض بالحياة.

يمكن للموسيقيين المخضرمين والمبتدئين على حد سواء إنشاء مقطوعات موسيقية فريدة من خلال وصف الأسلوب والمزاج والأدوات التي يريدونها. ثم يقوم الذكاء الاصطناعي بإنشاء الموسيقى بناءً على مواصفاتهم.

* "أميج إف إكس (ImageFX)» - على غرار مولدات الصور الأخرى التي تعمل بالذكاء الاصطناعي، يتيح لك البرنامج إنشاء صور مخصصة من أوصاف نصية.

يتميز بواحدة من واجهات المستخدم الأكثر سلاسة لأدوات إنشاء الصور الموجودة، ما يجعل من السهل إنشاء صور من أوصاف بسيطة مع تقديم خيارات تخصيص كافية لتلبية احتياجات المستخدمين ذوي الخبرة أيضاً.

أبجديات رسومية وعناوين نصّية جذابة

* «جين تايب (GenType)» - مولد خطوط تجريبي يستخدم الذكاء الاصطناعي لإنشاء أبجديات رسومية مخصصة بناءً على مواصفاتك.

يمكن نسخ الحروف المولدة أو تنزيلها بشكل فردي، أو تنزيلها مجموعةً كاملةً في مجلد مضغوط مليء بملفات PNG.

* «تكست إف إكس (TextFX)» - هو مساعد كتابة إبداعي يساعدك على إنشاء وتحرير وتحسين محتوى النص. يمكنه المساعدة في كل شيء من صياغة عناوين جذابة إلى تطوير أفكار قصصية إبداعية.

تقدم هذه الأداة «تأثيرات» مختلفة يمكنك تطبيقها على نصك، مثل تغيير النغمة أو الأسلوب أو التنسيق.

«إليومينت (Illuminate)» - يساعدك، وهو قريب من«نوتبوك إل إم»، على تحويل الموضوعات الجافة المحتملة إلى مناقشات صوتية جذابة يتم إنشاؤها بواسطة الذكاء الاصطناعي تبدو وكأنها حلقات بودكاست قصيرة ترويها أصوات واقعية بشكل مدهش.

ابحث عن موضوع معين أو الصق عنوان URL في ملف PDF وسيقوم بإخراج شيء أكثر قابلية للهضم بالنسبة لك للاستماع إليه.

* مجلة «فاست كومباني»، خدمات «تريبيون ميديا».