نظم ذكاء صناعي تعيد صياغة الصوت الحقيقي للممثل فال كيلمر

وظفت مزايا الكلام والتعبير والنبرة لاستبدال حنجرته المتضررة بسبب السرطان

الممثل فال كيلمر
الممثل فال كيلمر
TT

نظم ذكاء صناعي تعيد صياغة الصوت الحقيقي للممثل فال كيلمر

الممثل فال كيلمر
الممثل فال كيلمر

استخدمت شركة «سونانتيك» البريطانيّة النّاشئة أفلامًا قديمة للممثّل فال كيلمر بهدف إعادة تكوين صوته. وفي مقطعٍ نُشر على يوتيوب الشهر الماضي ، أعلن صوتٌ يسهلُ التعرّف إليه على أنّه الممثّل فال كيلمر: «صوتي كما أعرفه أُخذ منّي، والنّاس من حولي يواجهون صعوبةً في فهمي عندما أتكلّم».
وكان الممثّل الهوليوودي قد فقد صوته بعد عمليّة جراحيّة أجراها لاستئصال سرطان الحنجرة عام 2015، أدّت إلى تعثر مهنته وتغيير طريقة تواصله مع النّاس إلى الأبد. ولكنّ الأمور تغيّرت في نهاية العام الماضي، عندما ساعدت شركة «سونانتيك» الناشئة المتخصصة بتطوير البرامج الإلكترونيّة التي تستنسخ الأصوات للممثلين والاستوديوهات، كيلمر على التكلّم من جديد.
أصوات «حقيقية»
تبدو أكثر الأصوات التي تنتجها نظم الذكاء الصناعي مثل مساعد سيري من آبل وأليكسا من أمازون، بالاعتماد على أشخاص حقيقيّين، مزيّفة. ولكنّ موجة من الشركات الناشئة توظّف اليوم الذكاء الصناعي لتقديم خدمات استنساخ الصوت لأجهزة المساعدة الصوتية وألعاب الفيديو واستوديوهات الأفلام.
ازدادت حقيقيّة الأصوات المنتجة تقنيًا في عهد تقنية «ديب فيك» (التزييف العميق) التي تستخدم الذكاء الصناعي للتلاعب بمحتوىً ما وجعله يبدو حقيقيًا بشكلٍ خادع. يتّسم هذا الوسيط التقني بجودة عالية تصعّب أحيانًا التفريق بين الأصوات البشرية ومثيلاتها المصطنعة.
وبعد خمس سنوات على جراحة كيلمر، تواصل ممثله القانوني مع شركة «سونانتيك» لإعادة تكوين صوته الضائع رقميًا. وقالت زينة قرشي، الرئيس التنفيذي والشريكة المؤسسة لـ«سونانتيك»: «وهذا ما فعلناه. أراد فريق فال منحه صوته من جديد ليتمكّن من الاستمرار بحياته المهنية».
بدأ المشروع في ديسمبر (كانون الأوّل) 2020 بعدما أنهى كيلمر وثائقي عنوانه «فال» حول حياته المهنية في هوليوود ومعركته مع السرطان. ولم يأتِ الوثائقي على ذكر تقنية الذكاء الصناعي التي طوّرتها «سونانتيك»، ولكنّها نشرت مقطعًا مصوّرًا عنه على يوتيوب حاز على أكثر من 18 ألف مشاهدة.
جاء مشروع كيلمر بعد شهرٍ واحدٍ من كشف صانع الوثائقيّات مورغان نيفيل عن استخدامه لبرنامجٍ لم يسمّه لاستنساخ صوت الطاهي الشهير الراحل أنتوني بوردين في فيلمه التجاري «رود رانر». وواجه نيفيل هجومًا من أوتافيا بوردين، أرملة الممثّل الراحل، التي اعترضت على عدم استشارتها قبل إعادة تكوين صوت زوجها بواسطة الذكاء الصناعي.
ترفض «سونانتيك»، التي تأسست قبل ثلاث سنوات، الكشف عن ممثلين آخرين تعمل معهم، وتركّز أكثر على علامات الألعاب الإلكترونيّة التجارية كـ«إكس بوكس غيم ستوديوز» و«أوبسيديان إنترتاينمنت» و«ريميدي غيمز»، وغالبًا ما ترخّص خدمات صوتيّة صناعية للاستوديوهات تتيح لها توليف وإخراج الأصوات الصناعية بما يشبه عمل المخرجين مع الممثلين البشر. وقال جون فلين، رئيس قسم التقنية في الشركة: «نرى هذه التقنية كأدة فوتوشوب للصوت، يمكنكم من خلالها العمل والتأثير في بعض المجالات الصغيرة».
ونقل دالفين براون المتخصص بالتطويرات التقنية في واشنطن في تقرير له، عن الشركة قولها إنّ مهندسيها سحبوا نماذج من مقاطع قديمة و«صفّوها» لإلغاء الضجيج في خلفيتها. لقد ابتكروا أيضًا سيناريو بناءً على المادّة، وربطوا الصوت والنصّ مع بعضهما بـ«قطع صغيرة» وشغّلوا البيانات بواسطة خوارزميّات «محرّك الصوت» التي تعلّمت الكلام من خلال الإنصات إلى التسجيلات، بحسب فلين.
وأوضحت الشركة في بيانٍ أنّ «محرّك الصوت يستمدّ المعنى من الكلمات المكتوبة ويمكن استخدام هذه الدلالات» لتوضيح حالةٍ من الغضب الشديد والمعاناة العاطفية. واستعرضت «سونانتيك» في أبريل (نيسان) الماضي كيف يمكن للخدمة الصوتية إقناع المستمع بأنّ شخصين يخوضان جدلًا محمومًا. في ذلك العرض، يدخل الصوتان في محادثة عاديّة تتصاعد بسرعة لتتحوّل إلى صراخ. تشرح الشركة في تصريح صحافي أنّ هذا السيناريو، إن حصل في الحياة الحقيقية، يحفظ «حبال الممثلين الصوتية» ويتيح لهم «الحصول على دخلٍ غيابيّ».
«صناعة» الصوت
وتضيف الشركة أنّها صنعت 40 نسخة من صوت كيلمر واختارت الأعلى جودةً منها لأنّها تلتقط أسلوب الممثّل في التعبير. وكانت النتيجة، بحسب «سونانتيك»، برنامجًا كومبيوتريًا يحوّل النص إلى خطاب ويستطيع تقليد مستويات لفظ مقاطع الكلمات والعواطف لدى كيلمر.
يستطيع البرنامج الإلكتروني قراءة سطور النصّ بصوتٍ عالٍ، ملتقطًا مزايا كيلمر السابقة في الكلام والتعبير والنبرة. وتقول الشركة إنّ كيلمر الذي أحبّه النّاس في دور الرجل الجليدي في فيلم «توب غان» يستطيع استخدام التقنيّة متى أراد. وأوضحت قرشي أنّ «هذا النموذج يعود له حصرًا. يستطيع استخدامه في حياته الخاصّة أو المهنيّة إذا أراد».
وكما في حالة كيلمر، يمكن استخدام هذه التقنية من قبل الأشخاص الذين يعانون من صعوبة في الكلام أو الممثلين الذين يحتاجون لإراحة أحبالهم الصوتية بعد جولات صراخٍ طويلة في الاستوديو.
مخاوف قانونية
في المقابل، تشعل التقنية مخاوف قانونيّة وأخلاقيّة واقتصاديّة خصوصًا في صفوف ممثلّي الصوت الذين باتوا يخشون على مصدر دخلهم. وقد استُخدمت تقنية «ديب فيك» لصناعة فيديوهات لسياسيّين مثل دونالد ترامب وباراك أوباما، مسلّطةً الضوء على مخاطر التقنية المصمّمة لتصوير أشخاصٍ وكأنّهم يقولون أشياء لم يقولوها يومًا.
اعتبر جاي بريتون، ممثّلا صوتيا يؤدّي دور شخصيّات في «غو!غو!كوري كارسون» وغيرها من ألعاب الفيديو التي تنتجها نتفليكس: «عندما أكون ممثلًا، أستطيع أن أقرّر ما إذا كنتُ سأدعم المحتوى أم لا. إنّ نسخ صوت ممثلٍ وهو يقول أشياء قد لا يدعمها ،هو أمرٌ مدمّر».
تشير شركة «سونانتيك» إلى أنّ منتجها ليس مصمّمًا ليحلّ محلّ الممثلين، وتروّج له كحلّ «يقلّص أوقات الإنتاج من شهر إلى دقائق». وتعدُ أيضًا «بأداء مقنع وحقيقيّ في ألعاب الفيديو والأفلام بأصواتٍ بارعة في التعبير من إنتاج الذكاء الصناعي»، ما سيؤسّس لمنتج يقلّل ساعات العمل المدفوعة التي يمضيها الممثلون في الاستوديوهات.
تجدر الإشارة إلى أنّ الولايات المتّحدة لا تملك قوانين تمنع الشركات من فبركة أصواتٍ صناعيّة. ولكنّ يوجد في المقابل إطار عملٍ قانونيّ وُضع لصدّ أولئك الذي يسعون لكسب المال بالاعتماد على التشبّه بأحد المشاهير. ففي حادث سرقة صوت وقعت في التسعينات، قاضى المغنّي توني وايت دوريتو لاي الذي استخدم صوتًا يشبه صوته في إعلان، وحصل على تعويض بقيمة 2.6 مليون دولار.
وأشار بيتر رايموند، محامٍ متخصص بالملكية الفكرية في شركة «ريد سميث» في نيويورك، إلى أنّه «إذا استمرّت الشركات في إنتاج أصواتٍ لأشخاصٍ معروفين دون إذن، يمكن لهذا العمل أن يُصنّف كتعدٍ على الخصوصيّة، وقد يعرّضها لملاحقات قانونيّة. أمّا في حال استخدمت التقنية في مجال الفكاهة والسخرية أو الروتين الفنّي، عندها لن تعتبر تعديًا إلّا في حال تحقيق مكاسب تجاريّة». وحصل برنامج «سونانتيك» على تقدير كيلمر وإشادته وقال في تصريح إنّ «هذه الشركة الناشئة أعادت له صوته بشكلٍ احترافيّ وبطريقة لم يتخيّلها من قبل».


مقالات ذات صلة

رئيس «أبل» للمطورين الشباب في المنطقة: احتضنوا العملية... وابحثوا عن المتعة في الرحلة

تكنولوجيا تيم كوك في صورة جماعية مع طالبات أكاديمية «أبل» في العاصمة السعودية الرياض (الشرق الأوسط)

رئيس «أبل» للمطورين الشباب في المنطقة: احتضنوا العملية... وابحثوا عن المتعة في الرحلة

نصح تيم كوك، الرئيس التنفيذي لشركة «أبل»، مطوري التطبيقات في المنطقة باحتضان العملية بدلاً من التركيز على النتائج.

مساعد الزياني (دبي)
تكنولوجيا خوارزمية «تيك توك» تُحدث ثورة في تجربة المستخدم مقدمة محتوى مخصصاً بدقة عالية بفضل الذكاء الاصطناعي (أ.ف.ب)

خوارزمية «تيك توك» سر نجاح التطبيق وتحدياته المستقبلية

بينما تواجه «تيك توك» (TikTok) معركة قانونية مع الحكومة الأميركية، يظل العنصر الأبرز الذي ساهم في نجاح التطبيق عالمياً هو خوارزميته العبقرية. هذه الخوارزمية…

عبد العزيز الرشيد (الرياض)
خاص تم تحسين هذه النماذج لمحاكاة سيناريوهات المناخ مثل توقع مسارات الأعاصير مما يسهم في تعزيز الاستعداد للكوارث (شاترستوك)

خاص «آي بي إم» و«ناسا» تسخّران نماذج الذكاء الاصطناعي لمواجهة التحديات المناخية

«الشرق الأوسط» تزور مختبرات أبحاث «IBM» في زيوريخ وتطلع على أحدث نماذج الذكاء الاصطناعي لفهم ديناميكيات المناخ والتنبؤ به.

نسيم رمضان (زيوريخ)
خاص يمثل تحول الترميز الطبي في السعودية خطوة حاسمة نحو تحسين كفاءة النظام الصحي ودقته (شاترستوك)

خاص ما دور «الترميز الطبي» في تحقيق «رؤية 2030» لنظام صحي مستدام؟

من معالجة اللغة الطبيعية إلى التطبيب عن بُعد، يشكل «الترميز الطبي» عامل تغيير مهماً نحو قطاع طبي متطور ومستدام في السعودية.

نسيم رمضان (لندن)
خاص من خلال الاستثمارات الاستراتيجية والشراكات وتطوير البنية التحتية ترسم السعودية مساراً نحو أن تصبح قائداً عالمياً في التكنولوجيا (شاترستوك)

خاص كيف يحقق «الاستقلال في الذكاء الاصطناعي» رؤية السعودية للمستقبل؟

يُعد «استقلال الذكاء الاصطناعي» ركيزة أساسية في استراتيجية المملكة مستفيدة من قوتها الاقتصادية والمبادرات المستقبلية لتوطين إنتاج رقائق الذكاء الاصطناعي.

نسيم رمضان (لندن)

«جيميناي 2.0»... «غوغل» بدأت إتاحة نموذجها الأحدث للذكاء الاصطناعي التوليدي

شعار «جيميناي» يظهر على شاشة هاتف جوال (رويترز)
شعار «جيميناي» يظهر على شاشة هاتف جوال (رويترز)
TT

«جيميناي 2.0»... «غوغل» بدأت إتاحة نموذجها الأحدث للذكاء الاصطناعي التوليدي

شعار «جيميناي» يظهر على شاشة هاتف جوال (رويترز)
شعار «جيميناي» يظهر على شاشة هاتف جوال (رويترز)

أعلنت شركة «غوغل» اليوم (الأربعاء) بدء العمل بنموذجها الأكثر تطوراً إلى اليوم في مجال الذكاء الاصطناعي التوليدي «جيميناي 2.0» Gemini 2.0 الذي تسعى من خلاله إلى منافسة شركات التكنولوجيا العملاقة الأخرى في قطاع يشهد نمواً سريعاً، وفقاً لـ«وكالة الصحافة الفرنسية».

وتوقّع رئيس مجموعة «ألفابت» التي تضم «غوغل» سوندار بيشاي أن تفتح هذه النسخة الحديثة من البرنامج «عصراً جديداً» في مجال الذكاء الاصطناعي التوليدي القادر على أن يسهّل مباشرة الحياة اليومية للمستخدمين.

وأوضحت «غوغل» أن الصيغة الجديدة من «جيميناي» غير متاحة راهناً إلا لقلّة، أبرزهم المطوّرون، على أن تُوفَّر على نطاق أوسع في مطلع سنة 2025. وتعتزم الشركة دمج الأداة بعد ذلك في مختلف منتجاتها، وفي مقدّمها محركها الشهير للبحث، وبأكثر من لغة.

وشرح سوندار بيشاي ضمن مقال مدَوَّنة أعلن فيه عن «جيميناي 2.0» أن هذه الأداة توفّر «القدرة على جعل المعلومات أكثر فائدة، مشيراً إلى أن في وِسعها فهم سياق ما وتوقّع ما سيلي استباقياً واتخاذ القرارات المناسبة للمستخدم».

وتتنافس «غوغل» و«أوبن إيه آي» (التي ابتكرت تشات جي بي تي) و«ميتا» و«أمازون» على التوصل بسرعة فائقة إلى نماذج جديدة للذكاء الاصطناعي التوليدي، رغم ضخامة ما تتطلبه من أكلاف، والتساؤلات في شأن منفعتها الفعلية للمجتمع في الوقت الراهن.

وبات ما تسعى إليه «غوغل» التوجه الجديد السائد في سيليكون فالي، ويتمثل في جعل برنامج الذكاء الاصطناعي بمثابة «خادم رقمي» للمستخدم وسكرتير مطّلع على كل ما يعنيه، ويمكن استخدامه في أي وقت، ويستطيع تنفيذ مهام عدة نيابة عن المستخدم.

ويؤكد المروجون لهذه الأدوات أن استخدامها يشكّل مرحلة كبرى جديدة في إتاحة الذكاء الاصطناعي للعامّة، بعدما حقق «تشات جي بي تي» تحوّلاً جذرياً في هذا المجال عام 2022.

وأشارت «غوغل» إلى أن ملايين المطوّرين يستخدمون أصلاً النسخ السابقة من «جيميناي».

وتُستخدَم في تدريب نموذج «جيميناي 2.0» وتشغيله شريحة تنتجها «غوغل» داخلياً، سُمّيت بـ«تريليوم». وتقوم نماذج الذكاء الاصطناعي التوليدي بشكل أساسي على معدات تصنعها شركة «نفيديا» الأميركية العملاقة المتخصصة في رقائق وحدات معالجة الرسومات (GPUs).