بـ15 ثانية فقط... أداة جديدة لتوليد الصوت عبر الذكاء الاصطناعي

«فويس إنجين» قادرة على إعادة إنتاج صوت شخص من خلال عينة صوتية قصيرة

شعار برنامج المحادثة الشهير «شات جي بي تي» (أرشيفية - رويترز)
شعار برنامج المحادثة الشهير «شات جي بي تي» (أرشيفية - رويترز)
TT

بـ15 ثانية فقط... أداة جديدة لتوليد الصوت عبر الذكاء الاصطناعي

شعار برنامج المحادثة الشهير «شات جي بي تي» (أرشيفية - رويترز)
شعار برنامج المحادثة الشهير «شات جي بي تي» (أرشيفية - رويترز)

عرضت شركة «أوبن إيه آي»، مبتكرة برنامج المحادثة الشهير «تشات جي بي تي» القائم على الذكاء الاصطناعي التوليدي، أداة لاستنساخ الصوت سيكون استخدامها محدوداً لتفادي تسجيل حوادث احتيال أو جرائم.

والأداة التي سُمّيت «فويس إنجين» قادرة على إعادة إنتاج صوت شخص من خلال عينة صوتية مدتها 15 ثانية، على ما ذكر بيان لـ«أوبن إيه آي» تطرّق إلى نتائج اختبار أجري على نطاق صغير.

وأضاف البيان: «ندرك أن القدرة على توليد أصوات تشبه أصوات البشر خطوة تنطوي على مخاطر كبيرة، خصوصاً في عام الانتخابات هذا».

وتابع: «نعمل مع شركاء أميركيين ودوليين من حكومات ووسائل إعلام ومجالات الترفيه والتعليم والمجتمع المدني وقطاعات أخرى، ونأخذ ملاحظاتهم في الاعتبار خلال عملية ابتكار الأداة».

وفي هذا العام الذي يُرتقب أن يشهد انتخابات في دول كثيرة، يخشى الباحثون في مجال التضليل الإعلامي من إساءة استخدام تطبيقات الذكاء الاصطناعي التوليدية، وخصوصاً أدوات استنساخ الصوت التي تُعدّ رخيصة وسهلة الاستخدام ويصعب تتبعها.

وأكدت «أوبن ايه آي» أنها اعتمدت «نهجاً حذراً» قبل نشر الأداة الجديدة على نطاق أوسع «بسبب احتمال إساءة استخدام الأصوات الاصطناعية».

ويأتي عرض الأداة بعدما قام مستشار يعمل في الحملة الرئاسية لمنافس ديمقراطي لجو بايدن، بابتكار برنامج آلي انتحل شخصية الرئيس الأميركي المرشح لولاية جديدة.

ودعا الصوت المشابه لصوت جو بايدن الناخبين إلى الامتناع عن التصويت في الانتخابات التمهيدية في نيو هامبشر.

وحظرت الولايات المتحدة مذّاك الدعوات التي تستخدم فيها الأصوات المستنسخة المولّدة بواسطة الذكاء الاصطناعي، من أجل مكافحة عمليات الاحتيال السياسية أو التجارية.

وأوضحت «أوبن إيه آي» أنّ الشركاء الذين يختبرون «فويس إنجين» وافقوا على قواعد تفرض مثلاً موافقة صريحة من أي شخص قبل استخدام صوته، وضرورة الإشارة بوضوح إلى المستمعين أن الأصوات ابتُكرت بواسطة الذكاء الاصطناعي.

وتابعت الشركة: «اعتمدنا مجموعة من الإجراءات الأمنية، بينها العلامة المائية حتى نتمكن من تتبع أصل كل صوت تبتكره الأداة الجديدة، بالإضافة إلى مراقبة استباقية لاستخدامها».

 

 


مقالات ذات صلة

الناخبون الأميركيون يخشون الأخبار المضللة الصادرة عن السياسيين أنفسهم

الولايات المتحدة​ القلق من تأثير المعلومات المضللة على نتائج الانتخابات الرئاسية الأميركية يسيطر على أغلب الناخبين (إ.ب.أ)

الناخبون الأميركيون يخشون الأخبار المضللة الصادرة عن السياسيين أنفسهم

قبل شهر من الانتخابات الرئاسية الأميركية، تواجه البلاد سيلاً من المعلومات الزائفة، وأكثر ما يخشاه الناخبون التضليل الإعلامي الصادر عن السياسيين أنفسهم.

«الشرق الأوسط» (واشنطن)
تكنولوجيا شعار شركة الذكاء الاصطناعي الأميركية «أوبن إيه آي» (رويترز)

«أوبن إيه آي» تطلق واجهة جديدة باسم «كانفاس» لمنصة «شات جي بي تي»

أطلقت شركة الذكاء الاصطناعي الأميركية «أوبن إيه آي» طريقة جديدة للتفاعل مع منصة محادثة الذكاء الاصطناعي «شات جي بي تي» بواجهة مستخدم تسمى «كانفاس»

«الشرق الأوسط» (واشنطن )
تكنولوجيا شعار شركة «ميتا» (أ.ف.ب)

«ميتا» تكشف عن أداة ذكاء اصطناعي تنتج مقاطع صوت وصورة

أعلنت شركة «ميتا» المالكة لـ«فيسبوك»، الجمعة، أنها أنشأت نموذج ذكاء اصطناعي جديداً أطلقت عليه اسم «موفي جين» يمكنه إنشاء مقاطع مصورة مصحوبة بالصوت لتبدو واقعية.

«الشرق الأوسط» (نيويورك)
تكنولوجيا تطرح «أوبن أيه آي» برنامج «كانفاس» كمساعد رقمي يفهم سياق مشروعك بالكامل (شاترستوك)

تعرف على «كانفاس»... الواجهة التعاونية الجديدة لـ«تشات جي بي تي»

يوفر «كانفاس» أدوات لصقل القواعد النحوية، وتعزيز الوضوح، وضمان الاتساق.

نسيم رمضان (لندن)
علوم نظّم يومك لتحقيق كفاءة الدماغ

نظّم يومك لتحقيق كفاءة الدماغ

مدى نجاح اليوم ليس بعدد الساعات؛ بل بجودة الإنتاج العقلي من حلول وأفكار.

«الشرق الأوسط» (واشنطن)

​«جيمناي لايف» من «غوغل» متاح مجاناً لمستخدمي «آندرويد» بالإنجليزية

تقدم الميزة عشرة خيارات صوتية مختلفة حصرياً للمستخدمين الذين يدفعون اشتراكاً في الخدمة (شاترستوك)
تقدم الميزة عشرة خيارات صوتية مختلفة حصرياً للمستخدمين الذين يدفعون اشتراكاً في الخدمة (شاترستوك)
TT

​«جيمناي لايف» من «غوغل» متاح مجاناً لمستخدمي «آندرويد» بالإنجليزية

تقدم الميزة عشرة خيارات صوتية مختلفة حصرياً للمستخدمين الذين يدفعون اشتراكاً في الخدمة (شاترستوك)
تقدم الميزة عشرة خيارات صوتية مختلفة حصرياً للمستخدمين الذين يدفعون اشتراكاً في الخدمة (شاترستوك)

جعلت «غوغل» مساعدها «جيمناي لايف» (Gemini Live) متاحاً لجميع مستخدمي «آندرويد» الناطقين باللغة الإنجليزية مجاناً. تتبع هذه الخطوة مرحلة أولية، حيث كانت الميزة حصرية لمشتركي «جيمناي أدفانسد» (Gemini Advanced) بتكلفة 20 دولاراً شهرياً. ويمثل الطرح تحولاً محورياً في كيفية تفاعل المستخدمين مع تقنية الذكاء الاصطناعي على الأجهزة المحمولة، مما يوفر تجربة أكثر سهولة.

ميزات وقدرات «Gemini Live»

يمثل «Gemini Live» الذي تم الكشف عنه لأول مرة إلى جانب سلسلة «Google Pixel 9» قفزة إلى الأمام في الاتصال بمساعدة الذكاء الاصطناعي. يسمح Gemini Live للمستخدمين بإجراء محادثات متعددة الأدوار، ومقاطعة وإعادة النظر في الموضوعات، مع التخطيط في النهاية لدمج كاميرا الجوال للسياق البصري - على الرغم من أن تاريخ إطلاق هذه الميزة لا يزال غير محدد. ويمكن للمستخدمين الاستمتاع بخدمة Gemini Live من خلال النقر ببساطة على أيقونة الموجة في أسفل يسار تطبيق «جيمناي» المحدث، واتباع التعليمات التي تظهر على الشاشة لإعداد مباشر.

كيفية الوصول إلى خدمة Gemini Live

لتجربة خدمة Gemini Live يحتاج مستخدمو «آندرويد» إلى التأكد من تحديث تطبيق «جيمناي» الخاص بهم. يتم تنشيط الميزة من خلال النقر على زر «Live» في أسفل شاشة التطبيق، والذي يوجه المستخدم بعد ذلك خلال وظائفه. في الوقت الحالي تتوفر الميزة باللغة الإنجليزية.

يمثل طرح «Gemini Live» لمستخدمي «آندرويد» خطوة حاسمة في وصول الذكاء الاصطناعي إلى الجمهور بشكل أوسع (شاترستوك)

تداعيات المشهد التنافسي

هذا التطور جدير بالملاحظة لأنه يتناقض مع العروض التنافسية مثل وضع Voice Mode الخاص بـChatGPT (تشات جي بي تي) الذي يتوفر حالياً فقط للمستخدمين مقابل اشتراك شهري. من خلال جعل خدمة Gemini Live مجانية تضع «غوغل» نفسها بقوة ضد المنافسين، مما قد يؤدي إلى توسيع قاعدة مستخدميها، وتعزيز مشاركة المستخدمين مع تقنيات الذكاء الاصطناعي الخاصة بها.

ومع ذلك، سيجد مستخدمو «أبل» أنفسهم ينتظرون لفترة أطول قليلاً للحصول على تجربة مماثلة. ستتوفر ميزة Apple Intelligence التي من المقرر أن تعزز «سيري» بين ميزات أخرى، مع نظام التشغيل iOS 18.1 في وقت لاحق من هذا الشهر، ولكن فقط للمستخدمين الذين لديهم أجهزة أحدث مثل iPhone 15 Pro المزود بشريحة A17. ويسلط هذا الطرح الضوء على السباق الجاري بين عمالقة التكنولوجيا لدمج ميزات الذكاء الاصطناعي المتقدمة في الأجهزة الاستهلاكية.

مستقبل مساعدي الذكاء الاصطناعي

مع استمرار تطور تقنية الذكاء الاصطناعي، من المرجح أن يؤدي دمج السياق البصري والمدخلات الحسية الأخرى إلى تعزيز استجابة وفائدة مساعدي الذكاء الاصطناعي بشكل كبير. يشير التزام «غوغل» بتوسيع قدرات Gemini Live جنباً إلى جنب مع قرارها الاستراتيجي بتقديم الخدمة مجاناً إلى مستقبل يدمج مساعدي الذكاء الاصطناعي بشكل أعمق في تفاعلاتنا الرقمية اليومية.​