أفضل أدوات الذكاء الاصطناعي لصناعة الفيديوهات المتقدمة

توجِد العناوين والنصوص والفيديوهات والتسجيلات الصوتية ببضع كلمات

تستطيع صُنع فيديوهات مبهرة باستخدام أدوات الذكاء الاصطناعي وبكل سهولة
تستطيع صُنع فيديوهات مبهرة باستخدام أدوات الذكاء الاصطناعي وبكل سهولة
TT

أفضل أدوات الذكاء الاصطناعي لصناعة الفيديوهات المتقدمة

تستطيع صُنع فيديوهات مبهرة باستخدام أدوات الذكاء الاصطناعي وبكل سهولة
تستطيع صُنع فيديوهات مبهرة باستخدام أدوات الذكاء الاصطناعي وبكل سهولة

أصبح بمقدور الجميع إنتاج فيديوهات متنوعة وبجودة عالية، حتى لو لم يكن لديهم أي معرفة مسبقة في مجال كتابة السيناريو وتسجيل الفيديو وإضافة الصوتيات إليها وتحريرها ونشرها في قنوات الشبكات الاجتماعية، ودون الحاجة لاقتناء كاميرات وعدسات وميكروفونات متقدمة والبرامج اللازمة لدمجها وتحريرها؛ وذلك بفضل تطور أدوات الذكاء الاصطناعي في هذه المجالات وسهولة استخدامها.

وتطرح هذه الأدوات أسئلة كثيرة في بال المستخدمين، من بينها هل سنشهد قريباً إطلاق أفلام واقعية أو كارتونية أو فيديوهات موسيقية بجودة عالية جداً باستخدام أدوات الذكاء الاصطناعي فقط؟ هل سيصبح الجميع كُتّاباً ومحرري ومخرجي فيديو بفضل هذه الأدوات، وكيف سيستفيد منها كبار الكتاب والمحررين والمخرجين لتطوير أعمالهم ونقلها إلى مستويات أفضل وبسرعات أعلى؟ ونذكر في هذا الموضوع مجموعة من تلك الأدوات وكيفية استخدامها.

يمكن الاختيار من بين أساليب رسم مختلفة حسب الرغبة

أدوات إنتاج فيديو متقدمة

• «كانفا دوت كوم» (Canva.com): الأداة الأولى التي نذكرها هنا، وهي تسمح بكتابة وصف الفيديو المطلوب لتقوم بإنتاج الفيديو من تلقاء نفسها. ويمكن تعديل الفيديو بعد ذلك وإضافة المؤثرات المطلوبة إليه بكل سهولة وإزالة الخلفيات بضغطة زر واحدة. وتستطيع هذه الأداة تقديم أوجه مصنوعة بالذكاء الاصطناعي واستخدامها لقراءة النص أمام المستخدمين من بين 40 لغة مختلفة إن كنت لا ترغب بالظهور في الفيديو. كما يمكن رفع ملف صوتي يحتوي على التسجيل المرغوب واستخدامه في الفيديو.

وتسمح الأداة كذلك بإضافة النصوص بأشكال وألوان مختلفة وتحريكها بكل سهولة، وتقدم مجموعة من الصور والمؤثرات المجانية وأخرى مدفوعة، يمكن استخدامها بشكل مباشر داخل الأداة نفسها أو حفظها على كومبيوتر المستخدم واستخدامها في أداة أخرى، كما سنفصل أدناه.

• «لوما لابز دوت إيه آي» (LumaLabs.ai): تسمح بإيجاد الفيديوهات السينمائية المبهرة والواقعية بمجرد كتابة الوصف المرغوب لدرجة يصعب فيها تمييز المشهد الحقيقي عن ذلك المصنوع من خلال الأداة. ويمكن استخدامها 30 مرة يومياً، مع توفير خيار الاشتراك المدفوع للحصول على مزايا إضافية.

أداة متكاملة

• «إنفيديو دوت آي أو» (Invideo.io): هذه أداة متكاملة تقدم 500 قالب (Template) مسبق الإعداد، يمكن استخدامها أو تخصيصها حسب الرغبة، مع سهولة إزالة الخلفيات من الصور الموجودة بحوزة المستخدم، التي سيتم إضافتها إلى الفيديو المرغوب، أو من خلال صور موجودة في الإنترنت وإضافة الموسيقى والنصوص إليها. وتسمح الأداة كذلك بإيجاد نص مناسب للفيديو بمجرد كتابة بضع كلمات رئيسية ووصف للفيديو المرغوب، مع القدرة على تحويل مقال مكتوب إلى فيديو مختصر في دقائق قليلة. وتقدم الأداة مكتبة ضخمة (أكثر من 8 ملايين مقطع) من الفيديوهات مسبقة الإعداد التي يمكن استخدامها في الفيديو. كما يمكن إضافة المؤثرات البصرية إلى الفيديو النهائي بكل سهولة، التي تشمل إضافة حركات النقل بين مشهد وآخر (Transition)، وتعديل أبعاد الفيديو وإضافة الملصقات، وغيرها.

وتسمح الأداة كذلك بإضافة ملف صوتي إلى الفيديو وتحريره بكل سهولة (تدعم اللغة العربية)، مع سهولة إضافة الزملاء والأصدقاء إلى قائمة محرري الفيديو في حال الحاجة للعمل جماعياً على فيديو محدد. ويمكن كتابة سؤال ما والحصول على الإجابة على شكل فيديو يمكن مشاركته مع الجميع، مثل «كيف يمكنني المحافظة على بطارية الهاتف الجوال؟»، لتقدم الأداة فيديو توضيحياً يحتوي على نصائح بالصوت والصورة، مع القدرة على تعديل محتوى الفيديو واختيار صوت المتحدث أو استخدام صوتك من خلال تسجيل مرجعي لك مسبق. ويوجد اشتراك مجاني بالخدمة مع تقديم خيارات مدفوعة للحصول على المزيد من المزايا ودعم استخدام الهاتف الجوال.

• «بيكسارت» (Picsart): أداة تقدم القدرة على صنع الفيديوهات بمجرد كتابة نص وصفي للفكرة المطلوبة والحصول على نتائج مبهرة في أقل من 5 دقائق. ويمكن اختيار أسلوب الرسومات المطلوبة من بين الواقعية والفنية والكارتونية، وغيرها. ويوجد اشتراك مجاني بالخدمة مع تقديم خيارات مدفوعة للحصول على المزيد من المزايا.

• «ليوناردو دوت إيه آي» (Leonardo.ai): أداة مجانية تسمح لك بإنتاج الصورة المرغوبة حسب وصف نصي وعوامل رسم متعددة. الأمر الملفت بهذه الأداة أنها تسمح بتحميل صورة مرجعية يمكن استخدامها لإيجاد الصورة المرغوبة بهدف تسهيل عملية إيجاد الصورة بالشكل الصحيح. وتسمح الأداة بتحرير الصورة باستخدام الذكاء الاصطناعي الذي سيفهم سياق الصورة ويقوم بتحرير العديد من العناصر المرغوبة، مثل تحرير صورة لقطط توجد فيها كلمة «قطة»، ومن ثم طلب تغيير محتوى الصورة من قطط إلى طيور، ليتم استبدال القطط بالطيور مع تعديل كلمة «قطة» إلى «طائر» بشكل آلي ودون أي تدخل من المستخدم في ذلك.

• مجموعة متنوعة من الأدوات التي تحول النصوص أو الصور إلى فيديوهات مبهرة، مثل «هوتشوت دوت كو» (Hotshot.co) و«كلينغ إيه آي دوت آي أو» (KlingAI.io) و«رانواي إم إل دوت كوم» (RunwayML.com).

استخدام عدة أدوات

ويمكنك استخدام عدة أدوات للتحكم بشكل أكبر في الفيديو الذي ترغب في صنعه، مثل استخدام موقع «تايتل - جينيريتر دوت كوم» (Title-Generator.com) وكتابة المجال الذي تريد إيجاد نص مرتبط به، ليقدم لك مئات الأفكار والعناوين للفيديو المرغوب. ويمكنك بعد ذلك الذهاب إلى أداتي «تشات جي بي تي» (ChatGPT) أو «غوغل جيميناي» (Google Gemini) وطلب إيجاد نص للفيديو المطلوب مدته 5 دقائق، مثلاً، ومن ثم نسخ النص وتعديله حسب الحاجة.

فيديوهات واقعية يصعب تمييزها عن الحقيقة بمجرد كتابة وصف الفيديو المرغوب

الخطوة التالية هي الذهاب إلى موقع «ستيف دوت إيه آي» (Steve.ai)، الذي يطلب منك مشاركة النص ليقوم بإنتاج الفيديو بشكل آلي. وهناك أدوات أخرى مشابهة هي «آب دوت فيسلا دوت يو إس» (App.visla.us) و«سيلابي دوت آي أو» (Syllaby.io) وأداة «لوما لابز دوت إيه آي» المذكورة أعلاه. وتسمح أداة «أدوريلابز دوت كوم» (AdoriLabs.com) بتحويل النص الكامل الموجودة لديك إلى فيديو في ثوانٍ قليلة.

ونذكر كذلك أداتي «سيمبليفايد دوت كوم» (Simplified.com) و«كوبيكوبتر دوت إيه آي» (Copycopter.ai) اللتين تسمحان بإيجاد فيديو بمجرد كتابة فكرة الموضوع.

ويمكن الذهاب إلى موقع «سينثيسيز دوت آي أو» (Synthesys.io) واختيار شكل شخصية متحدثة مناسبة (Talking Avatar)، ومن ثم مشاركة النص مع الأداة، ليتم إيجاد شخصية تقوم بقراءة المحتوى للمستخدمين. ويمكن إضافة هذه الشخصية إلى فيديوهات المستخدم وإضافة المؤثرات البصرية إلى الفيديو النهائي بكل سهولة.

وإن أردت المزيد من التحكم بالفيديو، فيمكنك إنتاج النص، ومن ثم الذهاب إلى موقع «كانفا» أو «ليوناردو دوت إيه آي» المذكورين أعلاه أو أي موقع آخر وإيجاد صورة معبرة، مثل صورة لشخصية من الفاكهة (يمكن استخدام «كانفا» لإضافة صورة لتفاحة كارتونية، ومن ثم إضافة عينين وفم وأيدٍ وأرجل)، ثم حفظها على كومبيوتر المستخدم. وننتقل الآن إلى خطوة «تحريك» هذه الشخصية من خلال أداة «سكيتش دوت ميتا ديمو لاب» (Sketch.MetaDemoLab.com) التي تطلب منك اختيار الصورة، ومن ثم تحديد أماكن مفاصلها التي ستتحرك، ومن ثم اختيار الحركة المطلوبة من بين مجموعة متنوعة. ويمكن حفظ الفيديو النهائي على كومبيوتر المستخدم.

وننتقل الآن إلى إيجاد التسجيل الصوتي من خلال أداة «إيليفين لابز دوت آي أو» (ElevenLabs.io)، ومن ثم الضغط على زر «Go to app» أسفل الشاشة، ولصق النص الصوتي المرغوب واختيار الصوت المناسب (تدعم الأداة نطق الكلمات باللغة العربية بشكل قياسي)، ومن ثم حفظه على كومبيوتر المستخدم. وبعدما تم جمع الملفات المطلوبة، يمكن العودة إلى أداة «كانفا» وإضافة الفيديو المتحرك للشخصية والملف الصوتي، ومن ثم إضافة الموسيقى والخلفيات من خلال أداة «كانفا» أو من أي ملف خاص بالمستخدم، وتعديل مدة الفيديو وإضافة المؤثرات المختلفة، ومن ثم حفظه على شكل فيديو بأبعاد مختلفة حسب الشبكة الاجتماعية المرغوبة ورفعه إليها.

أيضاً تستطيع إيجاد رسومات ثلاثية الأبعاد ومجسمة تتحرك باستخدام أداة «ميشي دوت إيه آي» (Meshy.ai) سهلة الاستخدام، التي تطلب منك إدخال وصف الرسومات المطلوبة، وإيجاد التصميم المطلوب، واختيار أماكن مفاصل الشخصية التي يمكن تحريكها، ومن ثم استخدامها في برامج الرسومات المتخصصة أو داخل الفيديوهات المرغوبة.

وتوجد الكثير من أدوات الذكاء الاصطناعي الأخرى التي ستساعدك في إيجاد الفيديوهات وغيرها من الوظائف الأخرى، ويمكن البحث عنها باستخدام موقع «إنفايد إيه آي دوت كوم» (InvadeAI.com)، يدعم اللغة العربية، ومعرفة أي منها مجاني وأي منها مدفوع، مع القدرة على اختيار فئة الخدمة.


مقالات ذات صلة

روبوتات تفكر وتتحرك: ما الذي يميّز «Rho-Alpha» من «مايكروسوفت»؟

تكنولوجيا نموذج «Rho-Alpha» يدمج الرؤية واللغة والفعل في إطار تعلم واحد ما يمكّن الروبوتات من التفاعل مع العالم المادي بمرونة أعلى (مايكروسوفت)

روبوتات تفكر وتتحرك: ما الذي يميّز «Rho-Alpha» من «مايكروسوفت»؟

تستعرض أبحاث «مايكروسوفت» نموذجاً جديداً يمكّن الروبوتات من فهم العالم والتكيّف معه عبر دمج الرؤية واللغة والفعل في ذكاء متجسّد واحد.

نسيم رمضان (لندن)
الاقتصاد كلمة «الذكاء الاصطناعي» ولوحة مفاتيح وأيدٍ روبوتية في هذه الصورة التوضيحية (رويترز)

كوريا الجنوبية تطلق أول إطار عالمي شامل لتنظيم الذكاء الاصطناعي

أعلنت كوريا الجنوبية، يوم الخميس، ما وصفتها بـ«أول مجموعة شاملة في العالم من القوانين لتنظيم الذكاء الاصطناعي»؛ بهدف تعزيز الثقة والأمان في هذا القطاع.

«الشرق الأوسط» (سيول)
تكنولوجيا الجهاز المرتقب قد يعمل بلا شاشة معتمداً على الحوار الصوتي باعتباره نموذجاً جديداً للحوسبة اليومية (شاترستوك)

تقارير: هل سيعتمد أول جهاز استهلاكي من «أوبن إيه آي» على الصوت؟

«أوبن إيه آي» تستكشف جهازاً صوتياً غامضاً بلا شاشة، قد يعيد تعريف التفاعل مع الذكاء الاصطناعي ويفتح سباقاً جديداً على مستقبل الحوسبة اليومية.

نسيم رمضان (لندن)
الاقتصاد شرائح ذكية من شركة «إنفيديا» (رويترز)

الكونغرس يصوِّت للحصول على حق الإشراف على صادرات الرقائق

حدد مشرّع جمهوري بارز موعداً للتصويت في اللجنة، يوم الأربعاء، على مشروع قانون يمنح الكونغرس سلطة الإشراف على صادرات رقائق الذكاء الاصطناعي، على الرغم من معارضة…

«الشرق الأوسط» (واشنطن)
الاقتصاد رئيس «إنفيديا» يتحدث في إحدى جلسات المنتدى الاقتصادي العالمي في دافوس (أ.ف.ب)

من دافوس... مؤسس «إنفيديا» يتوقع استثمارات تريليونية لبناء «البنية التحتية للبشرية»

أكد الرئيس التنفيذي لشركة «إنفيديا» العملاقة، جنسن هوانغ، أن العالم لا يزال في بداية الطريق نحو بناء البنية التحتية اللازمة للذكاء الاصطناعي.

«الشرق الأوسط» (دافوس (سويسرا))

روبوتات تفكر وتتحرك: ما الذي يميّز «Rho-Alpha» من «مايكروسوفت»؟

نموذج «Rho-Alpha» يدمج الرؤية واللغة والفعل في إطار تعلم واحد ما يمكّن الروبوتات من التفاعل مع العالم المادي بمرونة أعلى (مايكروسوفت)
نموذج «Rho-Alpha» يدمج الرؤية واللغة والفعل في إطار تعلم واحد ما يمكّن الروبوتات من التفاعل مع العالم المادي بمرونة أعلى (مايكروسوفت)
TT

روبوتات تفكر وتتحرك: ما الذي يميّز «Rho-Alpha» من «مايكروسوفت»؟

نموذج «Rho-Alpha» يدمج الرؤية واللغة والفعل في إطار تعلم واحد ما يمكّن الروبوتات من التفاعل مع العالم المادي بمرونة أعلى (مايكروسوفت)
نموذج «Rho-Alpha» يدمج الرؤية واللغة والفعل في إطار تعلم واحد ما يمكّن الروبوتات من التفاعل مع العالم المادي بمرونة أعلى (مايكروسوفت)

يشهد الذكاء الاصطناعي تقدماً سريعاً في فهم اللغة والصور، إلا أن تحويل هذا الذكاء إلى أفعال ملموسة في العالم الحقيقي لا يزال أحد أكثر التحديات تعقيداً في مجال الحوسبة. وفي هذا السياق، تخطو أبحاث «مايكروسوفت» خطوة مهمة نحو سد هذه الفجوة، من خلال الكشف عن أعمال جديدة تهدف إلى تمكين الروبوتات من الإدراك والتفكير والتنفيذ بفاعلية أكبر داخل البيئات المادية الديناميكية.

وفي صميم هذا التوجه يأتي نموذج جديد يُعرف باسم «Rho-Alpha»، وهو نموذج يجمع بين الرؤية واللغة والفعل، ويهدف إلى مساعدة الروبوتات على تجاوز السلوكيات المبرمجة مسبقاً، والعمل بدرجة أعلى من الاستقلالية. ويعكس هذا النموذج طموح «مايكروسوفت» الأوسع في تطوير أنظمة ذكاء اصطناعي لا تكتفي بفهم المعلومات الرقمية، بل قادرة أيضاً على التفاعل مع العالم الفيزيائي بطرق أكثر مرونة وواقعية.

دمج الإدراك والفعل

على عكس الأنظمة الروبوتية التقليدية التي تعتمد على سلاسل هندسية منفصلة حيث تُعالج الرؤية والتخطيط والتحكم كوحدات مستقلة، يدمج نموذج «Rho-Alpha» هذه القدرات ضمن إطار تعلم واحد. ويتم تدريب النموذج على تحليل المدخلات البصرية، وفهم التعليمات باللغة الطبيعية، وتوليد أفعال جسدية مناسبة، ما يسمح للروبوتات بالاستجابة بسلاسة أكبر للمهام المعقدة.

ويعالج هذا النهج أحد التحديات المزمنة في عالم الروبوتات، المعروف بمشكلة «الميل الأخير». فعلى الرغم من قدرة نماذج الذكاء الاصطناعي على التعرف على الأشياء أو تنفيذ أوامر محددة، فإنها غالباً ما تفشل عند حدوث تغييرات غير متوقعة في البيئة. فاختلاف بسيط في الإضاءة أو موقع الأجسام أو سلوك البشر قد يؤدي إلى تعطل الأنظمة التقليدية. وتسعى أبحاث «مايكروسوفت» إلى جعل الروبوتات أكثر قدرة على التكيف من خلال ربط قراراتها بالسياق الواقعي بدلاً من القواعد الجامدة.

تعلم يتجاوز المختبر

يستند نموذج «Rho-Alpha» إلى التطورات الحديثة في النماذج التأسيسية، مستفيداً من مفاهيم النماذج اللغوية الضخمة والأنظمة متعددة الوسائط، مع تكييفها لمتطلبات التفاعل المادي. وبدلاً من تعلم المهام بشكل منفصل، يستطيع النموذج التعميم عبر سيناريوهات مختلفة، ما يمكّن الروبوتات من التعامل مع أشياء أو تعليمات لم تُصادفها صراحة أثناء التدريب. وتُعد هذه القدرة أساسية لنشر الروبوتات خارج المختبرات والبيئات الخاضعة للتحكم. وتصف أبحاث «مايكروسوفت» هذا العمل بأنه جزء من رؤية أوسع لما يُعرف بـ«الذكاء الاصطناعي المتجسد»، حيث يتشكل الذكاء ليس فقط من البيانات، بل من التفاعل المباشر مع العالم المادي. وفي هذا الإطار، تصبح الرؤية والفعل عنصرين متلازمين، ما يسمح للآلات بالتعلم من التجربة بأسلوب أقرب إلى السلوك البشري.

آفاق التطبيق العملي

تتعدد التطبيقات المحتملة لهذه التقنيات عبر قطاعات مختلفة. ففي البيئات الصناعية، يمكن للروبوتات الأكثر مرونة دعم مهام التصنيع والخدمات اللوجيستية التي تتطلب إعادة تهيئة مستمرة. أما في مجالات الرعاية الصحية والخدمات، فقد تساعد هذه الأنظمة في تنفيذ أنشطة يومية تتطلب تفاعلاً مباشراً مع البشر وبيئات غير متوقعة. ورغم أن «مايكروسوفت» لم تعلن عن منتجات تجارية قائمة على «Rho-Alpha»، فإن هذا البحث يسلط الضوء على قدرات أساسية قد تُمهّد لتطبيقات مستقبلية.

تؤكد «مايكروسوفت» أن التقدم في مجال الذكاء الاصطناعي للعالم المادي لا يقتصر على الأداء التقني فحسب، بل يشمل أيضاً اعتبارات السلامة والموثوقية ومواءمة الأنظمة مع النيات البشرية. فالروبوتات ذاتية التشغيل يجب أن تكون قادرة على فهم التعليمات بدقة، والتعامل مع الحالات الاستثنائية، خصوصاً في البيئات المشتركة مع البشر. لذلك، لا تركز الأبحاث على تعزيز القدرات فقط، بل أيضاً على المتانة والتصميم المسؤول.

يعتمد النموذج على مفهوم الذكاء الاصطناعي المتجسّد حيث يتعلم الروبوت من التجربة المباشرة والتفاعل مع البيئة كما يفعل البشر (مايكروسوفت)

من الذكاء إلى الفعل

يعكس إطلاق نموذج «Rho-Alpha» تحولاً أوسع في صناعة التكنولوجيا. فمع تزايد قدرات الذكاء الاصطناعي في السياقات الرقمية، يتجه الاهتمام تدريجياً نحو كيفية تجسيد هذه القدرات في آلات تعمل في العالم الحقيقي. ويطرح هذا التحول أسئلة جديدة حول جمع البيانات والمحاكاة وطرق التقييم، نظراً لأن البيئات المادية أقل قابلية للتنبؤ مقارنة بالبيئات الافتراضية.

وتشير أبحاث «مايكروسوفت» إلى أن المرحلة المقبلة من تطور الذكاء الاصطناعي لن تُقاس فقط بذكاء النماذج، بل بقدرتها على تحويل هذا الذكاء إلى أفعال ملموسة. ومن خلال توحيد الرؤية واللغة والتحكم ضمن إطار واحد، يمثل نموذج «Rho-Alpha» محطة بحثية مهمة في مسار جعل الذكاء الاصطناعي أكثر حضوراً وفاعلية خارج نطاق الشاشات والخوادم.

ومع تلاشي الحدود بين الذكاء الرقمي والأنظمة المادية، قد تُسهم مثل هذه التطورات في إعادة تشكيل طريقة تعاون الروبوتات مع البشر عبر مختلف القطاعات، في تحول تدريجي من آلات مبرمجة إلى شركاء أكثر وعياً بالسياق وقدرة على التكيف مع العالم الحقيقي.


تقارير: هل سيعتمد أول جهاز استهلاكي من «أوبن إيه آي» على الصوت؟

الجهاز المرتقب قد يعمل بلا شاشة معتمداً على الحوار الصوتي باعتباره نموذجاً جديداً للحوسبة اليومية (شاترستوك)
الجهاز المرتقب قد يعمل بلا شاشة معتمداً على الحوار الصوتي باعتباره نموذجاً جديداً للحوسبة اليومية (شاترستوك)
TT

تقارير: هل سيعتمد أول جهاز استهلاكي من «أوبن إيه آي» على الصوت؟

الجهاز المرتقب قد يعمل بلا شاشة معتمداً على الحوار الصوتي باعتباره نموذجاً جديداً للحوسبة اليومية (شاترستوك)
الجهاز المرتقب قد يعمل بلا شاشة معتمداً على الحوار الصوتي باعتباره نموذجاً جديداً للحوسبة اليومية (شاترستوك)

قد تكون شركة «أوبن إيه آي» بصدد الاستعداد لدخول سوق الأجهزة الاستهلاكية للمرة الأولى، وفقاً لتقرير يشير إلى أن الشركة تعمل على تطوير جهاز جديد مدعوم بالذكاء الاصطناعي، مع تركيز واضح على التفاعل الصوتي. ورغم محدودية التفاصيل المتاحة حتى الآن، يوصف المشروع بأنه خروج عن النماذج التقليدية المعتمدة على الشاشات والهواتف الذكية، لصالح نموذج حوسبة قائم على الصوت.

ويُقال إن الجهاز، الذي لا يزال غير رسمي ويُوصف بأنه «غامض»، يتم تطويره بالتعاون مع جوني آيف، الرئيس السابق للتصميم في شركة «أبل». ويُنظر إلى هذه الشراكة، التي جرى الإعلان عنها سابقاً، على أنها محاولة لإعادة التفكير في كيفية تفاعل المستخدمين مع الذكاء الاصطناعي خارج إطار التطبيقات والأجهزة التقليدية.

الصوت أولاً

بدلاً من أن يشبه هاتفاً ذكياً أو جهازاً لوحياً، يُعتقد أن المنتج يعتمد على الصوت بوصفه واجهة التفاعل الأساسية، وقد يأتي على شكل جهاز قابل للارتداء أو أداة محمولة باليد، وذلك وفقاً لتقرير نشره موقع «ITHome» نقلاً عن صحيفة «إيكونوميك ديلي نيوز» التايوانية، في حين لم تؤكد «أوبن إيه آي» بعد الشكل النهائي للجهاز، كما لم تعلن عن موعد لإطلاقه.

ويبدو أن الطموح الأساسي وراء هذا المشروع يتمثل في ابتكار جهاز يتيح للمستخدمين التفاعل مع الذكاء الاصطناعي بطريقة أكثر طبيعية، من خلال الحوار والمحادثة، بدلاً من الاعتماد على الشاشات أو لوحات المفاتيح أو الواجهات اللمسية. ويتماشى هذا التوجه مع سعي «أوبن إيه آي» الأوسع لجعل أنظمة الذكاء الاصطناعي أكثر بساطة واندماجاً في الحياة اليومية.

ويمثل هذا الجهاز المحتمل أول خطوة كبيرة لـ«أوبن إيه آي» خارج نطاق البرمجيات والخدمات السحابية. فحتى الآن، ركزت الشركة على تطوير نماذج لغوية ضخمة، وإتاحتها عبر منصات مثل «تشات جي بي تي» وواجهات برمجية يستخدمها المطورون والشركات. أما الانتقال إلى مجال الأجهزة، فسيعني توسيعاً ملحوظاً لدورها داخل منظومة الذكاء الاصطناعي.

وقد شهدت الأجهزة المعتمدة على التفاعل الصوتي اهتماماً متزايداً في قطاع التكنولوجيا، مدفوعاً بالتقدم في تقنيات التعرف على الصوت، ومعالجة اللغة الطبيعية، والاستدلال الفوري. ورغم الانتشار الواسع للمساعدات الصوتية، فإن معظمها لا يزال مرتبطاً بالهواتف الذكية أو السماعات الذكية. وقد يتيح جهاز مخصص للذكاء الاصطناعي تجربة أكثر استمرارية وتخصيصاً، لكنه في الوقت نفسه يثير تساؤلات تتعلق بالخصوصية والدقة وثقة المستخدمين.

المشروع يُعد رهاناً طويل الأمد على «الحوسبة المحيطة» حيث تصبح التقنية غير مرئية لكنها حاضرة دائماً (شاترستوك)

رهان طويل الأمد

كما أسهمت مشاركة جوني آيف في تسليط مزيد من الضوء على المشروع؛ نظراً لتاريخه في تصميم منتجات استهلاكية مؤثرة وواسعة الانتشار. ويُذكر أن شركته للتصميم تعمل مع «أوبن إيه آي» على تصورات لأجهزة جديدة تهدف إلى تجاوز الفئات التقليدية، مع تأكيد الطرفين أن العمل لا يزال في مرحلة استكشافية.

وبحسب التقرير، وصف مسؤولو «أوبن إيه آي» هذا الجهاز داخلياً بأنه مبادرة طويلة الأمد، وليس منتجاً وشيك الإطلاق. ويشير ذلك إلى أن الشركة لا تزال تختبر كيفية عمل الأجهزة المصممة أساساً للذكاء الاصطناعي، ومدى جاهزية المستهلكين لتبني نموذج جديد من التفاعل.

وفي حال تحقق هذا المشروع، فقد يضع «أوبن إيه آي» ضمن اتجاه أوسع نحو ما يُعرف بالحوسبة المحيطة، حيث تعمل التكنولوجيا في الخلفية وتستجيب للمستخدم عبر الصوت والسياق. ومع ذلك، يبقى نجاح مثل هذا الجهاز على نطاق واسع أمراً غير محسوم، خاصة في سوق مزدحمة بالأجهزة الذكية التي لم تحقق جميعها توقعات المستخدمين.

وفي الوقت الراهن، تعكس مساعي «أوبن إيه آي» في مجال الأجهزة اتجاهاً أوسع في صناعة الذكاء الاصطناعي. فمع ازدياد قدرات النماذج الذكية، قد لا تكون المنافسة المستقبلية محصورة في مستوى الذكاء فحسب، بل في الأجهزة والواجهات التي يختبر المستخدمون من خلالها هذه التقنيات.


«أدوبي» تتيح تحويل ملفات «PDF» إلى عروض تقديمية وبودكاست صوتي

التحول نحو المستندات متعددة الوسائط يعكس تغير توقعات المستخدمين في بيئات العمل والتعليم (شاترستوك)
التحول نحو المستندات متعددة الوسائط يعكس تغير توقعات المستخدمين في بيئات العمل والتعليم (شاترستوك)
TT

«أدوبي» تتيح تحويل ملفات «PDF» إلى عروض تقديمية وبودكاست صوتي

التحول نحو المستندات متعددة الوسائط يعكس تغير توقعات المستخدمين في بيئات العمل والتعليم (شاترستوك)
التحول نحو المستندات متعددة الوسائط يعكس تغير توقعات المستخدمين في بيئات العمل والتعليم (شاترستوك)

لطالما ارتبطت ملفات «PDF» على مدى عقود بالمحتوى الثابت، أي مستندات تُقرأ أو تُؤرشف أو تُعدّل بشكل محدود. لكن «أدوبي» تسعى اليوم إلى تغيير هذا التصور، بعد أن أضافت ميزات جديدة مدعومة بالذكاء الاصطناعي التوليدي إلى برنامج «أكروبات» (Acrobat) يتيح ذلك للمستخدمين تحويل ملفات «PDF» إلى عروض تقديمية وبودكاست صوتي، في خطوة تعكس تحولاً أوسع في طريقة استهلاك المستندات وإعادة استخدامها. يأتي هذا التوجه استجابة لتغير أنماط العمل حيث يُتوقع من المعلومات أن تتكيف مع سياقات متعددة من الاجتماعات إلى التنقل اليومي دون الحاجة إلى إعادة تنسيق يدوية.

من مستند إلى عرض تقديمي

من أبرز الإضافات الجديدة إمكانية إنشاء عروض تقديمية مباشرة من ملفات «PDF». فباستخدام قدرات الذكاء الاصطناعي في «Acrobat» يمكن للمستخدمين تحويل المستندات الطويلة أو المعقدة إلى مخططات عروض منظمة، تستخرج الأفكار الرئيسية وتعيد ترتيبها في صيغة مناسبة للعرض.

ولا تقتصر هذه العملية على تحويل الصفحات إلى شرائح، بل تعتمد على تحليل بنية المحتوى وتحديد الموضوعات والأقسام الأساسية، ثم إعادة تقديمها بتسلسل أكثر اختصاراً ووضوحاً. ويعكس هذا النهج توجهاً متزايداً لاستخدام الذكاء الاصطناعي كأداة للتلخيص والتركيب، وليس مجرد أداة تحويل شكلي.

إنشاء بودكاست صوتي من ملفات «PDF» يعكس تزايد أهمية الصوت كوسيلة لاستهلاك المعرفة والمحتوى (أدوبي)

تحويل ملفات «PDF» إلى بودكاست

إلى جانب العروض التقديمية، أضافت «أدوبي» ميزة إنشاء بودكاست صوتي مدعومة بالذكاء الاصطناعي، تتيح تحويل النصوص المكتوبة إلى محتوى مسموع بأسلوب أقرب إلى الحوار، بدل القراءة الآلية الرتيبة.

ووفقاً لتوثيق «أدوبي»، تهدف هذه الميزة إلى مساعدة المستخدمين على استيعاب المحتوى في الأوقات التي يصعب فيها القراءة، مثل أثناء التنقل أو أداء مهام أخرى. سيقوم النظام بتلخيص المحتوى وسرده صوتياً، ما يسمح بفهم الأفكار الأساسية دون الحاجة إلى تصفح الصفحات.

ويأتي ذلك في ظل تنامي الاعتماد على الصوت كوسيلة لاستهلاك المحتوى، ولا سيما المواد الطويلة أو التقنية، حيث لا تحل هذه الميزة محل القراءة، بل تقدم بديلاً مكملاً لها.

المستندات متعددة الوسائط تصبح القاعدة

تندرج تحديثات «Acrobat» الجديدة ضمن تحول أوسع في صناعة البرمجيات نحو المحتوى متعدد الوسائط. إذ بات يُتوقع من أدوات الإنتاجية أن تنتقل بسلاسة بين النص والصوت والمرئيات. ولم تعد قيمة المستند تُقاس بشكل عرضه فقط، بل بقدرته على التكيف مع احتياجات مختلفة.

وتشير تقارير تقنية إلى أن «أكروبات» بات جزءاً من هذا التوجه، لكن من زاوية مختلفة، إذ يعمل على مستوى المستندات نفسها، ولا سيما ملفات «PDF» التي غالباً ما تحتوي على محتوى رسمي أو نهائي، مثل التقارير والعقود والأبحاث.

هذه الميزات قد تعزز الإنتاجية وإمكانية الوصول خاصة لذوي الإعاقات البصرية أو صعوبات القراءة (أدوبي)

تأثيرات على بيئة العمل

قد يكون لهذه الميزات أثر ملموس على طبيعة العمل المعرفي. فغالباً ما يقضي الموظفون ساعات في تحويل التقارير المكتوبة إلى عروض تقديمية أو ملخصات للاجتماعات. ومن شأن أتمتة جزء من هذه العملية أن تقلل من الجهد والوقت، خصوصاً في المؤسسات الكبيرة.

كما تحمل هذه الخطوة بعداً مهماً في مجال سهولة الوصول. إذ يمكن للنسخ الصوتية أن تدعم المستخدمين من ذوي الإعاقات البصرية أو صعوبات القراءة، بينما تساعد الملخصات في استيعاب المحتوى الكثيف بسرعة أكبر. وإدماج هذه القدرات مباشرة داخل «Acrobat» يجعلها متاحة في المكان الذي توجد فيه المستندات أصلاً.

ليست مجرد مسألة سرعة

ورغم أن تحسين الإنتاجية يعد فائدة واضحة، فإن هذه التحديثات تشير أيضاً إلى تحول أعمق في طريقة إعداد المستندات. فمع إدراك أن ملف «PDF» قد يتحول لاحقاً إلى عرض تقديمي أو مادة صوتية، قد يميل الكُتّاب إلى تنظيم المحتوى منذ البداية بأسلوب أوضح، مع عناوين أقوى وبنية أكثر إحكاماً.

في المقابل، تثير المخرجات التي ينشئها الذكاء الاصطناعي تساؤلات حول الدقة والسياق. فالملخصات والسرد الصوتي يعتمدان على تفسير النظام للمحتوى، ما يجعل المراجعة البشرية ضرورية، خاصة عند التعامل مع وثائق حساسة أو دقيقة.

إعادة التفكير في ملف «PDF»

على مدى السنوات الماضية، وسّعت «أدوبي» دور «Acrobat» ليشمل ميزات مثل التلخيص الذكي والبحث القائم على الذكاء الاصطناعي. وتأتي إمكانية إنشاء عروض تقديمية وبودكاست امتداداً لهذا المسار، في إشارة إلى أن الشركة لم تعد ترى «PDF» صيغة جامدة، بل حاوية مرنة للمعرفة.

ومع تعمق استخدام الذكاء الاصطناعي التوليدي في أدوات الإنتاجية، توضح هذه الخطوة فكرة أن قيمة المستند لم تعد تكمن في محتواه فقط، بل في مدى سهولة إعادة تشكيل هذا المحتوى ومشاركته وفهمه بطرق متعددة.