نظم ذكاء صناعي تعيد صياغة الصوت الحقيقي للممثل فال كيلمر

وظفت مزايا الكلام والتعبير والنبرة لاستبدال حنجرته المتضررة بسبب السرطان

الممثل فال كيلمر
الممثل فال كيلمر
TT

نظم ذكاء صناعي تعيد صياغة الصوت الحقيقي للممثل فال كيلمر

الممثل فال كيلمر
الممثل فال كيلمر

استخدمت شركة «سونانتيك» البريطانيّة النّاشئة أفلامًا قديمة للممثّل فال كيلمر بهدف إعادة تكوين صوته. وفي مقطعٍ نُشر على يوتيوب الشهر الماضي ، أعلن صوتٌ يسهلُ التعرّف إليه على أنّه الممثّل فال كيلمر: «صوتي كما أعرفه أُخذ منّي، والنّاس من حولي يواجهون صعوبةً في فهمي عندما أتكلّم».
وكان الممثّل الهوليوودي قد فقد صوته بعد عمليّة جراحيّة أجراها لاستئصال سرطان الحنجرة عام 2015، أدّت إلى تعثر مهنته وتغيير طريقة تواصله مع النّاس إلى الأبد. ولكنّ الأمور تغيّرت في نهاية العام الماضي، عندما ساعدت شركة «سونانتيك» الناشئة المتخصصة بتطوير البرامج الإلكترونيّة التي تستنسخ الأصوات للممثلين والاستوديوهات، كيلمر على التكلّم من جديد.
أصوات «حقيقية»
تبدو أكثر الأصوات التي تنتجها نظم الذكاء الصناعي مثل مساعد سيري من آبل وأليكسا من أمازون، بالاعتماد على أشخاص حقيقيّين، مزيّفة. ولكنّ موجة من الشركات الناشئة توظّف اليوم الذكاء الصناعي لتقديم خدمات استنساخ الصوت لأجهزة المساعدة الصوتية وألعاب الفيديو واستوديوهات الأفلام.
ازدادت حقيقيّة الأصوات المنتجة تقنيًا في عهد تقنية «ديب فيك» (التزييف العميق) التي تستخدم الذكاء الصناعي للتلاعب بمحتوىً ما وجعله يبدو حقيقيًا بشكلٍ خادع. يتّسم هذا الوسيط التقني بجودة عالية تصعّب أحيانًا التفريق بين الأصوات البشرية ومثيلاتها المصطنعة.
وبعد خمس سنوات على جراحة كيلمر، تواصل ممثله القانوني مع شركة «سونانتيك» لإعادة تكوين صوته الضائع رقميًا. وقالت زينة قرشي، الرئيس التنفيذي والشريكة المؤسسة لـ«سونانتيك»: «وهذا ما فعلناه. أراد فريق فال منحه صوته من جديد ليتمكّن من الاستمرار بحياته المهنية».
بدأ المشروع في ديسمبر (كانون الأوّل) 2020 بعدما أنهى كيلمر وثائقي عنوانه «فال» حول حياته المهنية في هوليوود ومعركته مع السرطان. ولم يأتِ الوثائقي على ذكر تقنية الذكاء الصناعي التي طوّرتها «سونانتيك»، ولكنّها نشرت مقطعًا مصوّرًا عنه على يوتيوب حاز على أكثر من 18 ألف مشاهدة.
جاء مشروع كيلمر بعد شهرٍ واحدٍ من كشف صانع الوثائقيّات مورغان نيفيل عن استخدامه لبرنامجٍ لم يسمّه لاستنساخ صوت الطاهي الشهير الراحل أنتوني بوردين في فيلمه التجاري «رود رانر». وواجه نيفيل هجومًا من أوتافيا بوردين، أرملة الممثّل الراحل، التي اعترضت على عدم استشارتها قبل إعادة تكوين صوت زوجها بواسطة الذكاء الصناعي.
ترفض «سونانتيك»، التي تأسست قبل ثلاث سنوات، الكشف عن ممثلين آخرين تعمل معهم، وتركّز أكثر على علامات الألعاب الإلكترونيّة التجارية كـ«إكس بوكس غيم ستوديوز» و«أوبسيديان إنترتاينمنت» و«ريميدي غيمز»، وغالبًا ما ترخّص خدمات صوتيّة صناعية للاستوديوهات تتيح لها توليف وإخراج الأصوات الصناعية بما يشبه عمل المخرجين مع الممثلين البشر. وقال جون فلين، رئيس قسم التقنية في الشركة: «نرى هذه التقنية كأدة فوتوشوب للصوت، يمكنكم من خلالها العمل والتأثير في بعض المجالات الصغيرة».
ونقل دالفين براون المتخصص بالتطويرات التقنية في واشنطن في تقرير له، عن الشركة قولها إنّ مهندسيها سحبوا نماذج من مقاطع قديمة و«صفّوها» لإلغاء الضجيج في خلفيتها. لقد ابتكروا أيضًا سيناريو بناءً على المادّة، وربطوا الصوت والنصّ مع بعضهما بـ«قطع صغيرة» وشغّلوا البيانات بواسطة خوارزميّات «محرّك الصوت» التي تعلّمت الكلام من خلال الإنصات إلى التسجيلات، بحسب فلين.
وأوضحت الشركة في بيانٍ أنّ «محرّك الصوت يستمدّ المعنى من الكلمات المكتوبة ويمكن استخدام هذه الدلالات» لتوضيح حالةٍ من الغضب الشديد والمعاناة العاطفية. واستعرضت «سونانتيك» في أبريل (نيسان) الماضي كيف يمكن للخدمة الصوتية إقناع المستمع بأنّ شخصين يخوضان جدلًا محمومًا. في ذلك العرض، يدخل الصوتان في محادثة عاديّة تتصاعد بسرعة لتتحوّل إلى صراخ. تشرح الشركة في تصريح صحافي أنّ هذا السيناريو، إن حصل في الحياة الحقيقية، يحفظ «حبال الممثلين الصوتية» ويتيح لهم «الحصول على دخلٍ غيابيّ».
«صناعة» الصوت
وتضيف الشركة أنّها صنعت 40 نسخة من صوت كيلمر واختارت الأعلى جودةً منها لأنّها تلتقط أسلوب الممثّل في التعبير. وكانت النتيجة، بحسب «سونانتيك»، برنامجًا كومبيوتريًا يحوّل النص إلى خطاب ويستطيع تقليد مستويات لفظ مقاطع الكلمات والعواطف لدى كيلمر.
يستطيع البرنامج الإلكتروني قراءة سطور النصّ بصوتٍ عالٍ، ملتقطًا مزايا كيلمر السابقة في الكلام والتعبير والنبرة. وتقول الشركة إنّ كيلمر الذي أحبّه النّاس في دور الرجل الجليدي في فيلم «توب غان» يستطيع استخدام التقنيّة متى أراد. وأوضحت قرشي أنّ «هذا النموذج يعود له حصرًا. يستطيع استخدامه في حياته الخاصّة أو المهنيّة إذا أراد».
وكما في حالة كيلمر، يمكن استخدام هذه التقنية من قبل الأشخاص الذين يعانون من صعوبة في الكلام أو الممثلين الذين يحتاجون لإراحة أحبالهم الصوتية بعد جولات صراخٍ طويلة في الاستوديو.
مخاوف قانونية
في المقابل، تشعل التقنية مخاوف قانونيّة وأخلاقيّة واقتصاديّة خصوصًا في صفوف ممثلّي الصوت الذين باتوا يخشون على مصدر دخلهم. وقد استُخدمت تقنية «ديب فيك» لصناعة فيديوهات لسياسيّين مثل دونالد ترامب وباراك أوباما، مسلّطةً الضوء على مخاطر التقنية المصمّمة لتصوير أشخاصٍ وكأنّهم يقولون أشياء لم يقولوها يومًا.
اعتبر جاي بريتون، ممثّلا صوتيا يؤدّي دور شخصيّات في «غو!غو!كوري كارسون» وغيرها من ألعاب الفيديو التي تنتجها نتفليكس: «عندما أكون ممثلًا، أستطيع أن أقرّر ما إذا كنتُ سأدعم المحتوى أم لا. إنّ نسخ صوت ممثلٍ وهو يقول أشياء قد لا يدعمها ،هو أمرٌ مدمّر».
تشير شركة «سونانتيك» إلى أنّ منتجها ليس مصمّمًا ليحلّ محلّ الممثلين، وتروّج له كحلّ «يقلّص أوقات الإنتاج من شهر إلى دقائق». وتعدُ أيضًا «بأداء مقنع وحقيقيّ في ألعاب الفيديو والأفلام بأصواتٍ بارعة في التعبير من إنتاج الذكاء الصناعي»، ما سيؤسّس لمنتج يقلّل ساعات العمل المدفوعة التي يمضيها الممثلون في الاستوديوهات.
تجدر الإشارة إلى أنّ الولايات المتّحدة لا تملك قوانين تمنع الشركات من فبركة أصواتٍ صناعيّة. ولكنّ يوجد في المقابل إطار عملٍ قانونيّ وُضع لصدّ أولئك الذي يسعون لكسب المال بالاعتماد على التشبّه بأحد المشاهير. ففي حادث سرقة صوت وقعت في التسعينات، قاضى المغنّي توني وايت دوريتو لاي الذي استخدم صوتًا يشبه صوته في إعلان، وحصل على تعويض بقيمة 2.6 مليون دولار.
وأشار بيتر رايموند، محامٍ متخصص بالملكية الفكرية في شركة «ريد سميث» في نيويورك، إلى أنّه «إذا استمرّت الشركات في إنتاج أصواتٍ لأشخاصٍ معروفين دون إذن، يمكن لهذا العمل أن يُصنّف كتعدٍ على الخصوصيّة، وقد يعرّضها لملاحقات قانونيّة. أمّا في حال استخدمت التقنية في مجال الفكاهة والسخرية أو الروتين الفنّي، عندها لن تعتبر تعديًا إلّا في حال تحقيق مكاسب تجاريّة». وحصل برنامج «سونانتيك» على تقدير كيلمر وإشادته وقال في تصريح إنّ «هذه الشركة الناشئة أعادت له صوته بشكلٍ احترافيّ وبطريقة لم يتخيّلها من قبل».


مقالات ذات صلة

«بلاك هات» تعود إلى الرياض بنسختها الثالثة

عالم الاعمال «بلاك هات» تعود إلى الرياض بنسختها الثالثة

«بلاك هات» تعود إلى الرياض بنسختها الثالثة

تعود فعالية الأمن السيبراني الأبرز عالمياً «بلاك هات» في نسختها الثالثة إلى «مركز الرياض للمعارض والمؤتمرات» ببلدة ملهم شمال العاصمة السعودية الرياض.

تكنولوجيا «غوغل» تطلق النسخة الأولية من آندرويد 16 للمطورين مع ميزات جديدة لتعزيز الخصوصية ومشاركة البيانات الصحية (غوغل)

«غوغل» تطلق النسخة الأولية من آندرويد 16 للمطورين مع ميزات جديدة

أطلقت «غوغل» النسخة التجريبية الأولية من آندرويد 16 للمطورين، وهي خطوة تمهد الطريق للتحديثات الكبيرة المقبلة في هذا النظام.

عبد العزيز الرشيد (الرياض)
تكنولوجيا «أبل» تؤكد مشكلة اختفاء الملاحظات بسبب خلل بمزامنة (iCloud) وتوضح خطوات استعادتها مع توقع تحديث (iOS) قريب (أبل)

اختفاء الملاحظات في أجهزة آيفون... المشكلة والحلول

وفقاً لتقرير رسمي من «أبل»، فإن المشكلة تتعلق بإعدادات مزامنة الآيكلاود (iCloud).

عبد العزيز الرشيد (الرياض)
تكنولوجيا تمكنك «دورا» من تصميم مواقع ثلاثية الأبعاد مذهلة بسهولة تامة باستخدام الذكاء الاصطناعي دون الحاجة لأي معرفة برمجية (دورا)

صمم موقعك ثلاثي الأبعاد بخطوات بسيطة ودون «كود»

تتيح «دورا» للمستخدمين إنشاء مواقع مخصصة باستخدام الذكاء الاصطناعي عبر إدخال وصف نصي بسيط.

عبد العزيز الرشيد (الرياض)
خاص يحول الذكاء الاصطناعي الطابعات من مجرد خدمة بسيطة إلى أداة أكثر ذكاءً واستجابة لحاجات المستخدمين (أدوبي)

خاص كيف يجعل الذكاء الاصطناعي الطابعات أكثر ذكاءً؟

تلتقي «الشرق الأوسط» الرئيسة العامة ومديرة قسم الطباعة المنزلية في شركة «إتش بي» (HP) لفهم تأثير الذكاء الاصطناعي على عمل الطابعات ومستقبلها.

نسيم رمضان (بالو ألتو - كاليفورنيا)

هل وصل الذكاء الاصطناعي إلى حدوده القصوى؟

لوغو تطبيق «شات جي بي تي» (رويترز)
لوغو تطبيق «شات جي بي تي» (رويترز)
TT

هل وصل الذكاء الاصطناعي إلى حدوده القصوى؟

لوغو تطبيق «شات جي بي تي» (رويترز)
لوغو تطبيق «شات جي بي تي» (رويترز)

هل وصلت نماذج الذكاء الاصطناعي التوليدي إلى طريق مسدود؟ منذ إطلاق «تشات جي بي تي» قبل عامين، بعث التقدم الهائل في التكنولوجيا آمالاً في ظهور آلات ذات ذكاء قريب من الإنسان... لكن الشكوك في هذا المجال تتراكم.

وتعد الشركات الرائدة في القطاع بتحقيق مكاسب كبيرة وسريعة على صعيد الأداء، لدرجة أن «الذكاء الاصطناعي العام»، وفق تعبير رئيس «أوبن إيه آي» سام ألتمان، يُتوقع أن يظهر قريباً.

وتبني الشركات قناعتها هذه على مبادئ التوسع، إذ ترى أنه سيكون كافياً تغذية النماذج عبر زيادة كميات البيانات وقدرة الحوسبة الحاسوبية لكي تزداد قوتها، وقد نجحت هذه الاستراتيجية حتى الآن بشكل جيد لدرجة أن الكثيرين في القطاع يخشون أن يحصل الأمر بسرعة زائدة وتجد البشرية نفسها عاجزة عن مجاراة التطور.

وأنفقت مايكروسوفت (المستثمر الرئيسي في «أوبن إيه آي»)، و«غوغل»، و«أمازون»، و«ميتا» وغيرها من الشركات مليارات الدولارات وأطلقت أدوات تُنتج بسهولة نصوصاً وصوراً ومقاطع فيديو عالية الجودة، وباتت هذه التكنولوجيا الشغل الشاغل للملايين.

وتعمل «إكس إيه آي»، شركة الذكاء الاصطناعي التابعة لإيلون ماسك، على جمع 6 مليارات دولار، بحسب «سي إن بي سي»، لشراء مائة ألف شريحة من تصنيع «نفيديا»، المكونات الإلكترونية المتطورة المستخدمة في تشغيل النماذج الكبيرة.

وأنجزت «أوبن إيه آي» عملية جمع أموال كبيرة بقيمة 6.6 مليار دولار في أوائل أكتوبر (تشرين الأول)، قُدّرت قيمتها بـ157 مليار دولار.

وقال الخبير في القطاع غاري ماركوس «تعتمد التقييمات المرتفعة إلى حد كبير على فكرة أن النماذج اللغوية ستصبح من خلال التوسع المستمر، ذكاء اصطناعياً عاماً». وأضاف «كما قلت دائماً، إنه مجرد خيال».

- حدود

وذكرت الصحافة الأميركية مؤخراً أن النماذج الجديدة قيد التطوير تبدو وكأنها وصلت إلى حدودها القصوى، ولا سيما في «غوغل»، و«أنثروبيك» (كلود)، و«أوبن إيه آي».

وقال بن هورويتز، المؤسس المشارك لـ«a16z»، وهي شركة رأسمال استثماري مساهمة في «أوبن إيه آي» ومستثمرة في شركات منافسة بينها «ميسترال»: «إننا نزيد (قوة الحوسبة) بالمعدل نفسه، لكننا لا نحصل على تحسينات ذكية منها».

أما «أورايون»، أحدث إضافة لـ«أوبن إيه آي» والذي لم يتم الإعلان عنه بعد، فيتفوق على سابقيه لكن الزيادة في الجودة كانت أقل بكثير مقارنة بالقفزة بين «جي بي تي 3» و«جي بي تي 4»، آخر نموذجين رئيسيين للشركة، وفق مصادر أوردتها «ذي إنفورميشن».

ويعتقد خبراء كثر أجرت «وكالة الصحافة الفرنسية» مقابلات معهم أن قوانين الحجم وصلت إلى حدودها القصوى، وفي هذا الصدد، يؤكد سكوت ستيفنسون، رئيس «سبيلبوك»، وهي شركة متخصصة في الذكاء الاصطناعي القانوني التوليدي، أن «بعض المختبرات ركزت كثيراً على إضافة المزيد من النصوص، معتقدة أن الآلة ستصبح أكثر ذكاءً».

وبفضل التدريب القائم على كميات كبيرة من البيانات المجمعة عبر الإنترنت، باتت النماذج قادرة على التنبؤ، بطريقة مقنعة للغاية، بتسلسل الكلمات أو ترتيبات وحدات البكسل. لكن الشركات بدأت تفتقر إلى المواد الجديدة اللازمة لتشغيلها.

والأمر لا يتعلق فقط بالمعارف: فمن أجل التقدم، سيكون من الضروري قبل كل شيء أن تتمكن الآلات بطريقة أو بأخرى من فهم معنى جملها أو صورها.

- «تحسينات جذرية»

لكنّ المديرين في القطاع ينفون أي تباطؤ في الذكاء الاصطناعي. ويقول داريو أمودي، رئيس شركة «أنثروبيك»، في البودكاست الخاص بعالم الكمبيوتر ليكس فريدمان «إذا نظرنا إلى وتيرة تعاظم القدرات، يمكننا أن نعتقد أننا سنصل (إلى الذكاء الاصطناعي العام) بحلول عام 2026 أو 2027».

وكتب سام ألتمان الخميس على منصة «إكس»: «ليس هناك طريق مسدود». ومع ذلك، أخّرت «أوبن إيه آي» إصدار النظام الذي سيخلف «جي بي تي - 4».

وفي سبتمبر (أيلول)، غيّرت الشركة الناشئة الرائدة في سيليكون فالي استراتيجيتها من خلال تقديم o1، وهو نموذج من المفترض أن يجيب على أسئلة أكثر تعقيداً، خصوصاً في مسائل الرياضيات، وذلك بفضل تدريب يعتمد بشكل أقل على تراكم البيانات مرتكزاً بدرجة أكبر على تعزيز القدرة على التفكير.

وبحسب سكوت ستيفنسون، فإن «o1 يمضي وقتاً أطول في التفكير بدلاً من التفاعل»، ما يؤدي إلى «تحسينات جذرية».

ويشبّه ستيفنسون تطوّر التكنولوجيا باكتشاف النار: فبدلاً من إضافة الوقود في شكل بيانات وقدرة حاسوبية، حان الوقت لتطوير ما يعادل الفانوس أو المحرك البخاري. وسيتمكن البشر من تفويض المهام عبر الإنترنت لهذه الأدوات في الذكاء الاصطناعي.