أداة جديدة بنظم الذكاء الاصطناعي لتسهيل سير الاجتماعات

ترغب شركات برمجيات التصميم في تقديم وعود كبيرة بشأن الإمكانات الإبداعية لأدوات الذكاء الاصطناعي الخاصة بها. وبفضل ميزات الذكاء الاصطناعي الجديدة، تقدم شركة «فيغما Figma» واحداً من أكثر الوعود إغراءً على الإطلاق: أداة ستجعل اجتماعاتك أفضل.

سبورة أعمال بالذكاء الاصطناعي

وقد أعلنت شركة برمجيات التصميم التعاوني هذه، أمس (الأربعاء)، «فيغ جام FigJam»، أول منتج أصلي لها يعمل بتقنية الذكاء الاصطناعي. تعمل السبورة الرقمية المدعومة بالذكاء الاصطناعي على تقنية من شركة «أوبن إيه آي OpenAI»، المالكة لروبوت الدردشة «جي بي تي». ويمكن استخدامها لعمل كل شيء بدءاً من جداول أعمال الاجتماعات إلى المخططات التنظيمية إلى مخططات الأعمال المرحلية، بناءً على طلبات بسيطة.

ويقول هانتر شوارتز إن واجهة الذكاء الاصطناعي تظهر كأيقونة تبدو كتأثير لامع، وتفتح أداة يكتبها المستخدمون بأسلوب ChatGPT أو كخيارات للفرز والتلخيص.

ويضيف أنه عرض مقيد (أي محدود) نسبياً للذكاء الاصطناعي مقارنةً ببرامج التصميم الأخرى، ولكنه يحل المشكلات التي واجهتها «فيغما» في تجربة المستخدم على السبورة الرقمية الخاصة بها.

تشغيل الاجتماعات من بُعد

وتعد الأداة الجديدة تطويراً للأدوات المماثلة لتنظيم الاجتماعات التي تطرحها الشركة عادةً. وعلى الرغم من أن «FigJam» يوفر مساحة رقمية لتشغيل اجتماعات من بُعد، أكثر جاذبية مما يمكن أن يفعله «زووم» أو«سلاك» بمفرديهما، إلا أن إعدادها قد يستغرق وقتاً طويلاً، ولم يعرف بعض المستخدمين من أين يبدأون.

وتجدر الإشارة إلى أن ثلثي مستخدمي «فيغما» النشطين يومياً هم من غير المصممين، لذا كانت مهمة جعل الأداة الذكية الجديدة سهلة الفهم عبر مجموعة من أنواع المستخدمين، أمراً بالغ الأهمية. وتقول جيني وين، مديرة التصميم في «فيغما»: «عندما تبدأ بملف فارغ، قد تشعر بالخوف حقاً لمعرفة كيفية ملئه».

مخططات وجلسات شحذ ذهني

ويمكن لـلأداة الجديدة إنشاء التقاويم أو المخططات تلقائياً أو حتى اقتراح عناصر جدول الأعمال المحتملة بناءً على طلبات المستخدمين. كما أنها تحل مشكلة واجهها المستخدمون بعد جلسات الشحذ الذهني الموسعة أو المزدحمة بشكل خاص.

وتقول الشركة إن نسبة فرق المنتجات التي تَستخدم برامجها تبلغ نحو سبعة مطورين مقابل مصمم واحد. وفيما تقوم «أدوبي Adobe» و«كانفا Canva» بالترويج لأدوات الذكاء الاصطناعي التي تولِّد صوراً أكثر واقعية أو تكرر التصميمات الحالية، فإن «فيغما جام» تهدف إلى أن تكون مساعداً للمديرين المتوسطين وغيرهم لتوفير الوقت والتخلص من العمل المزدحم.

* «فاست كومباني»، خدمات «تريبيون ميديا».

الذكاء الاصطناعي يحول فيديوهاتك إلى لغات لا تتحدثها ويطابق حركة شفتيك ونبرة صوتك

تخيل أنك تستطيع التحدث بـ14 لغة بطلاقة بدءاً من الآن، وتشارك أفكارك مع مئات الملايين حول العالم؟

بعدما أزعجت فيديوهات التزييف العميق DeepFake المستخدمين حول العالم؛ نظراً لما قد تسببه من أضرار ومشاكل لهم جراء أمور لم يقوموا بها أو يقولوها ولكنها موجودة على شكل فيديو مزيف من إنتاج الذكاء الاصطناعي بامتياز، نضج إدراك هذه التقنية وبدأ توظيفها بأمور إيجابية، منها دبلجة صوت المستخدم إلى لغات أخرى وتعديل حركة الشفتين في الفيديو لمحاكاة ذلك ومطابقة نبرة صوته، وبكل دقة.

خدمة دبلجة الصوت

ونذكر خدمة «هاي جين فيديو ترانسليت» HeyGen Video Translate المميزة التي قد تكون نواة ثورة رقمية في قطاع إنتاج الفيديوهات للوصول إلى مئات الملايين من الجماهير حول العالم بسهولة بالغة.

تستطيع هذه الخدمة دبلجة الصوت بين اللغات المعتمدة، وتغيير حركة الشفتين لتحاكي اللغة المستهدفة وبصوت المستخدم نفسه باللغة الجديدة، لتتطابق تماماً مع الكلام بكل لغة. ويمكن من خلال هذه الأداة التحدث بلغات لم يتحدث بها المستخدم من قبل بحياته، وهي مناسبة لتسريع إنتاج المحتوى؛ ذلك أنها تسمح بالقيام بذلك ببضع نقرات من خلال متصفح الإنترنت دون الحاجة لتعلم لغات أخرى، أو لتعلم أسس إنتاج وتحرير الفيديوهات وإضافة مسار صوتي مدبلج إلى الفيديو الأساسي وتدقيق مواضع الحديث وحركة الشفتين.

تحافظ هذه التقنية على صوت ونبرة صوت المستخدم وتطابق حركة شفاهه بشكل صحيح عبر اللغات المختلفة

آلية العمل

وتستخدم الخدمة تقنيات الذكاء الاصطناعي للتعرف على الكلمات من داخل الفيديو، وتقوم بترجمة تلك الكلمات إلى اللغة المستهدفة، ومن ثم محاكاة تعابير الوجه والمشاعر على الفيديو بدقة عالية، ودمج الصوت مع الفيديو في نتيجة مبهرة وعالية الجودة. كما يمكن إيجاد ترجمة لما يتم سماعه في الفيديو.

الأمر اللافت للنظر بشكل إيجابي هو أن الفيديو المدبلج النهائي قد يكون مختلفاً في مدته مقارنة بالفيديو الأساسي، حيث إن بعض اللغات تحتاج إلى كلمات أقل أو أكثر مقارنة باللغات الأخرى للتعبير عن المعلومة نفسها. وتستطيع الخدمة محاكاة ذلك وتعديل مدة الفيديو وحركة وجه وشفتي المستخدم حسب الحاجة دون التقيد بالمدة الأصلية للفيديو الرئيسي.

وتدعم الخدمة حالياً التعرف على الفيديوهات باللغات التالية: العربية والإنجليزية والإسبانية والفرنسية والصينية (الماندارين) والألمانية والإيطالية والبرتغالية والهولندية والهندية واليابانية والتركية والدنماركية والبولندية والروسية والعبرية والفنلندية والكورية. ويمكن تحويل الفيديو الأساسي إلى اللغات التالية: العربية والإنجليزية (باللهجة الأميركية) والإسبانية والفرنسية والهندية والإيطالية والألمانية والبولندية والبرتغالية والصينية واليابانية والهولندية والتركية والكورية.

ويُنصح أن يكون الفيديو الرئيسي خالياً من أصوات الخلفية حتى تكون النتيجة أكثر دقة، وأن يكون هناك شخص واحد في الفيديو، وأن تتراوح دقة الفيديو الرئيسي بين 360x360 و4096x4096 بكسل، وأن تتراوح مدة الفيديو بين 30 ثانية و5 دقائق، وتدعم الخدمة تحميل الملفات بامتدادات MP4 وQuicktime وWebm بحجم يصل إلى 500 ميغابايت للفيديو الواحد. وبإمكان المستخدم دبلجة فيديو واحد مجاناً، مع ضرورة الاشتراك بالخدمة لدبلجة المزيد من الفيديوهات (تتراوح قيمة الاشتراك الشهري بين 24 و120 دولاراً، حسب الباقة المطلوبة، إلى جانب تقديم اشتراك سنوي مخفض).

فيديو لأحد المؤثرين التقنيين بلغته الإنجليزية الأم، وبعد تحويل صوته إلى الإسبانية والفرنسية

فوائد كبيرة لقطاعات عديدة

وإن كنت تتساءل من قد يستفيد من هذه الخدمة، فيمكن القول إن الكثير من الفئات ستستفيد منها، مثل منتجي المحتوى الذين يريدون إيصال المعلومة إلى أكبر شريحة ممكنة من المستخدمين حول العالم، وشركات إنتاج المحتوى التثقيفي والتعليمي والترفيهي، وإرسال فيديوهات بين فرق العمل التي تعمل عبر عدة بلدان لتجاوز حواجز اللغة وبناء العلاقات الإيجابية بين الموظفين، وشركات السياحة والسفر التي تريد الترويج لعروضها لمزيد من المستخدمين حول العالم، بالإضافة إلى منتجي الدورات التدريبية عبر الإنترنت. ونذكر كذلك صناع الفيديوهات القصيرة ومنتجي إعلانات المنتجات التي تباع عالمياً، وأيضاً نذكر السياسيين وسفراء الدول الذين يريدون التخاطب مع الثقافات واللغات المختلفة بلغاتها الأم وبصوت المتحدث نفسه لمزيد من المصداقية.

ويمكن استخدام الخدمة من موقعها www.HeyGen.com، ونذكر خدمات مشابهة، مثل TacoTranslate وVidby وRask وLangotalk.

عبر الذكاء الاصطناعي... نموذج للترجمة من «غوغل» ينطق بصوت المستخدم

تفتح تكنولوجيا الذكاء الاصطناعي الباب أمام جيل جديد من تطبيقات الترجمة، في حين تنفذ خدمات الإنترنت والتكنولوجيا الأمريكية «غوغل» كسر حواجز اللغة من خلال نموذج جديد للذكاء الاصطناعي يستطيع التحدث باللغة الأجنبية بصوت المستخدم.

وكشفت «غوغل» عن نموذج «أوديو - بالم إيه.آي» للترجمة، يستطيع التعرف ومعالجة وإنتاج العبارات، سواء مكتوبة أو مسموعة، لكن الخاصية الأبرز هي أنه يستطيع استخدام صوت المستخدم عند نطق العبارات المترجمة إلى اللغة الأجنبية، حسب ما ذكرت وكالة الأنباء الألمانية.

وعرض خبراء «غوغل» نتائج المشروع في فيديو يحتوي على حوار بين مجموعة أشخاص يتحدثون بلغات مختلفة، حيث تتم ترجمة أحاديثهم إلى اللغة الإنجليزية بأصواتهم نفسها بسلاسة.

يأتي ذلك في الوقت الذي تراجعت فيه شعبية خدمة «ترجمة غوغل» أمام أدوات الترجمة المنافسة مثل «ديب إل» من حيث جودة الترجمة، لكن المطورين يقولون إن النموذج الجديد الذي تطوره «غوغل»، «يتفوق بشدة على الأنظمة الحالية للترجمة المسموعة».

ولا يحتاج المستخدم إلى استغراق وقت طويل لإعداد وتدريب مترجم الذكاء الاصطناعي لكي يتحدث بصوته، وإنما يحتاج إلى «توجيه مسموع مختصر» حتى يبدأ استخدام الخدمة.

ويجمع تطبيق الترجمة الجديد «أوديو - بالم» بين نموذج لغة الذكاء الاصطناعي المعروف باسم «بال» مع مولد الأصوات بالذكاء الاصطناعي «أوديو - إل.إم»، كما يستخدم النموذج «بالم» تطبيق محادثة «الذكاء الاصطناعي بارد» الذي طورته «غوغل».

وفي حين أن خدمة الترجمة الجديدة، تتيح للأشخاص الموجودين في أي تجمع تبادل الأحاديث بغض النظر عن اختلاف لغاتهم دون عناء، لكنهم سيضطرون إلى التوقف برهة بعد كل جملة حتى تتم ترجمة العبارة للباقين. كما أنه لا يوجد أي مؤشر حتى الآن على ما إذا كان يمكن استخدام تقنية «أوديو بالم» في خدمة «ترجمة غوغل» المتاحة حالياً.