«غوغل» تُحيي الكلاسيكيات السينمائية بالذكاء الاصطناعي على أكبر شاشة عرض في لاس فيغاس

فيلم أُنتج عام 1939... يعود بتجربة ترفيهية غامرة

عرضُ الفيلم في قاعة «Sphere» في لاس فيغاس يتطلّب أكثر من ترميم رقمي بل إعادة بناء المشاهد والشخصيات بتقنيات متطورة (الشرق الأوسط)
عرضُ الفيلم في قاعة «Sphere» في لاس فيغاس يتطلّب أكثر من ترميم رقمي بل إعادة بناء المشاهد والشخصيات بتقنيات متطورة (الشرق الأوسط)
TT

«غوغل» تُحيي الكلاسيكيات السينمائية بالذكاء الاصطناعي على أكبر شاشة عرض في لاس فيغاس

عرضُ الفيلم في قاعة «Sphere» في لاس فيغاس يتطلّب أكثر من ترميم رقمي بل إعادة بناء المشاهد والشخصيات بتقنيات متطورة (الشرق الأوسط)
عرضُ الفيلم في قاعة «Sphere» في لاس فيغاس يتطلّب أكثر من ترميم رقمي بل إعادة بناء المشاهد والشخصيات بتقنيات متطورة (الشرق الأوسط)

لم تكن الأمسية التي نظّمتها «غوغل كلاود» عشية انطلاق مؤتمرها السنوي العالمي «كلاود نكست» في لاس فيغاس مجرد فعالية تقنية تقليدية جمعت فيها نخبة مختارة من الإعلاميين والضيوف، بل كانت بمثابة لحظة فارقة تشي ببزوغ عصر جديد في صناعة الترفيه يُعيد تعريف تجربة مشاهدة الأفلام كما نعرفها.

في صميم هذا المشهد تقف شراكة طموحة تجمع بين «غوغل كلاود» و«ديب مايند» و«سْفير إنترتاينمنت» (Sphere Entertainment)، في أول مشروع من نوعه لإعادة إحياء وتوسيع فيلم كلاسيكي صدر عام 1939 باستخدام أدوات الذكاء الاصطناعي المتقدمة. الهدف هو تقديم نسخة متجددة من الفيلم الأسطوري «ذا وِزرد أوف أوز» ( The Wizard of Oz)، بتقنيات معاصرة، تُعرض على شاشة قاعة «سْفير» (Sphere) العملاقة في لاس فيغاس، التي تُعد واحدة من كبرى شاشات العرض في العالم بمساحة تبلغ 160.000 قدم مربع.

إحياء لكلاسيكية خالدة

عُرض فيلم «ذا وِزرد أوف أوز» (The Wizard of Oz) لأول مرة عام 1939، ويُعد من أكثر الأعمال السينمائية تأثيراً وريادة من الناحية التقنية. فقد كان من أوائل الأفلام التي استخدمت تقنية «تكني كالور» (Technicolor)، وأسهم في إعادة صياغة اللغة البصرية لسرد القصص، ليترسّخ مع مرور الزمن كإرث ثقافي خالد. واليوم، بعد ما يقارب 9 عقود، يعود هذا الفيلم إلى واجهة الابتكار من جديد، لكن هذه المرة من خلال الذكاء الاصطناعي التوليدي.

الفيلم الأصلي الصادر عام 1939 يُعتبر من روّاد الابتكار السينمائي ويعود اليوم لواجهة التقنية عبر الذكاء الاصطناعي التوليدي (الشرق الأوسط)

ولادة بصرية جديدة

ولأن عرض الفيلم في قاعة «Sphere» الغامرة يتطلب تجربة بصرية غير مسبوقة، لم يكن من الممكن الاكتفاء بنسخة رقمية تقليدية. فالمادة الأصلية المصوّرة على شريط 35 ملم ستبدو ضئيلة وضعيفة الجودة أمام الشاشة العملاقة، ما لم تُعد معالجتها وإنتاجها بالكامل. وقد واجه الفريق تحديات تقنية جوهرية تمثّلت في تحسين الدقة البصرية وتوسيع البيئة المحيطة بالمشاهد وتوليد أداء تمثيلي متكامل لشخصيات لم تُلتقط في الإطار الأصلي. ولمواجهة هذه التحديات، لجأت «غوغل» إلى حزمة من أقوى نماذجها التوليدية، فاستُخدم النموذج «Veo 2» لتوليد الفيديو بدقة فائقة، و«Imagen 3» لإعادة بناء التفاصيل الصورية، فيما تولّى نموذج «جيمناي» (Gemini) تنسيق المهام الذكية وضمان ترابط المشاهد وأصالة الأداء.

شراكة ثلاثية بين «غوغل كلاود» و«ديب مايند» و«سفير إنترتاينمنت» تهدف إلى إعادة إحياء فيلم كلاسيكي باستخدام الذكاء الاصطناعي (الشرق الأوسط)

دقة فائقة وتوليد أداء مبهر

من أبرز الإنجازات التقنية في هذا المشروع كان الاعتماد على تقنية الدقة الفائقة (Super Resolution). فعبر تدريب نموذج «Veo» باستخدام مصادر مرجعية عالية الجودة، نجح الفريق في رفع دقة الفيلم إلى مستوى «16K»، ما أتاح إظهار تفاصيل دقيقة للغاية مثل نسيج الجلد وتعابير الوجه، بطريقة تتجاوز بكثير إمكانات التصوير المتاحة في ثلاثينات القرن الماضي. غير أن المسألة لم تقتصر على «تكبير الصورة»، بل كانت بمثابة عملية فنية لإعادة البناء، تحافظ على الجوهر والرؤية الإبداعية الأصلية للمخرج.

أمّا تقنية الرسم الخارجي (Outpainting) — أي توسيع المشهد إلى ما يتجاوز حدود الكادر الأصلي — فقد مثّلت تحدياً إبداعياً آخر، حيث طُلب من النماذج التوليدية إنشاء بيئات وأداءات لم يتم تصويرها أصلاً. مثال على ذلك، في أحد المشاهد التي تتحدث فيها «دوروثي» (وهي الشخصية الرئيسية في الفيلم) مع عمّتها «إيم» والسيدة «غولتس»، لم يظهر «العم هنري» في الإطار، لكن الذكاء الاصطناعي كان عليه أن «يتخيّل» ماذا كان يفعل خارج المشهد، ويجسده بشكل واقعي ومتماسك. هذه المهمة أُطلق عليها اسم « توليد الأداء» (Performance Generation)، لأن النموذج لم يُنتج صورة ثابتة فقط، بل أعاد تجسيد شخصية حيّة بتفاصيلها وسلوكياتها الفريدة.

توماس كوريان الرئيس التنفيذي لـ«غوغل كلاود» (الشرق الأوسط)

القوة الصامتة وراء الإنجاز

وراء هذا الإنجاز الإبداعي غير المسبوق، يبرز عنصر أساسي لا يقل أهمية عن النماذج الذكية نفسها، وهو البنية التحتية المتقدمة من «غوغل كلاود». فقد تطلّب تنفيذ المشروع معالجة ما يزيد عى 1.2 بيتابايت من البيانات، وهو حجم هائل يستحيل التعامل معه عبر أنظمة تقليدية، مما استدعى اللجوء إلى قدرات حوسبية فائقة. ولتحقيق ذلك، تم الاعتماد على أحدث «وحدات المعالجة التخصصية» (TPUs) من «غوغل»، إلى جانب منصة «Google Kubernetes Engine - GKE» التي أتاحت تنسيق موارد الحوسبة بسلاسة، بالإضافة إلى حلول تخزين ضخمة مصممة خصيصاً للتعامل مع أعباء العمل المرتبطة بتوليد الفيديو والرسوم.

يقول توماس كوريان، الرئيس التنفيذي لـ«غوغل كلاود» إنه لا يمكن إنجاز هذا النوع من المشاريع على الحواسيب العادية بل نحتاج إلى بنية تحتية صناعية لإنجاز سحر بهذا المستوى».

جيمس دولان الرئيس التنفيذي لـ«Sphere» (الشرق الأوسط)

إعادة تعريف لعملية الإبداع

ما كان لافتاً إلى حد الدهشة هو ذلك الانسجام العميق بين الفن والتكنولوجيا. وصف جيمس دولان، الرئيس التنفيذي لـ«Sphere» التجربة قائلاً: «كان الأمر أشبه بأن الذكاء الاصطناعي يستحق مقعداً ثالثاً على طاولة العمل». فقد نشأ حوار حي ومتواصل بين الفنانين والمهندسين والنماذج الذكية في عملية إبداعية فريدة من نوعها. وأكد دولان أن الذكاء الاصطناعي لم يأتِ ليحلّ محل صنّاع الفيلم، بل جاء ليعزّز رؤيتهم ويمنحهم أدوات غير مسبوقة لتحقيق ما كان في السابق أقرب إلى المستحيل.

وسيط جديد بالكامل

بيئة «سفير» (Sphere) لا تُعد مجرد شاشة عرض عملاقة، بل تمثل منصة سرد قصصي متكاملة الأبعاد. فهي تدمج بين الصورة فائقة الدقة، والصوت المحيطي الغامر، والمؤثرات البيئية مثل الرياح والاهتزازات والضوء، لتحوّل المشاهدة من تجربة بصرية تقليدية إلى تجربة حسية شاملة تنغمس فيها الحواس جميعاً.

هذا النموذج لا يقدم تطوراً في طريقة العرض فحسب، بل يُعتبر ولادة لوسيط فني جديد، يقع عند تقاطع السينما، وألعاب الفيديو، والفن التركيبي، ويفتح آفاقاً واسعة لإعادة تصور مستقبل الترفيه، خاصة في زمنٍ بات فيه الجمهور يبحث عن تجارب أكثر تفاعلية واندماجاً تتجاوز حدود الشاشة إلى عالم الشعور والمشاركة.

يعيد المشروع تشكيل العلاقة بين الفن والتكنولوجيا ويمنح الخيال مساحات جديدة لم يكن من الممكن تصورها سابقاً (الشرق الأوسط)

التأثير على صناعة الإعلام والترفيه

ماذا يعني أن نشاهد «The Wizard of Oz» لا كفيلم تقليدي، بل كعالم يمكننا أن نعيش تفاصيله وننغمس في أجوائه؟ إن ذلك يُمثّل تحولاً جذرياً في تجربة المشاهدة، ويفتح الباب أمام مستقبل تُعاد فيه أرشيفات السينما الكلاسيكية إلى الحياة باستخدام الذكاء الاصطناعي، ليس فقط من خلال الترميم، بل عبر التفاعل والتخصيص وإعادة التخيل.

هذا النموذج يتيح إمكانات غير محدودة، خصوصاً للدول والمناطق التي تسعى إلى تطوير اقتصادات إبداعية رقمية، كما هي الحال في منطقة الشرق الأوسط. فالتقنيات المستخدمة في هذا المشروع يمكن توظيفها في إحياء التراث الثقافي، وتعزيز التجارب السياحية، ودعم التعليم الغامر، إلى جانب إنتاج محتوى محلي أصيل بمساعدة الذكاء الاصطناعي. إنها فرصة لإعادة تقديم قصصنا وهوياتنا بأساليب مبتكرة، تضع الفن والتقنية في خدمة الذاكرة والخيال.

تمثل هذه التجربة ميلاد وسيط فني جديد يمزج بين السينما وألعاب الفيديو والفن التركيبي (الشرق الأوسط)

ما القادم؟

رغم هذا الإنجاز غير المسبوق، يقر كل من توماس كوريان وجيمس دولان بأن هذه ليست نهاية الرحلة، بل بدايتها فقط. يرى كوريان أن ما نشهده اليوم يمثل انطلاقة لصناعة جديدة بالكامل، مؤكداً أن دور «غوغل كلاود» لا يقتصر على الابتكار التقني، بل يمتد ليشمل مسؤولية أخلاقية في ضمان استخدام الذكاء الاصطناعي بشكل أصيل ومسؤول يخدم الإبداع دون المساس بجوهره.

وفي الـ28 من أغسطس (آب) المقبل، لن يكون عرض فيلم «The Wizard of Oz at Sphere» مجرد حدث سينمائي آخر، بل لحظة مفصلية في تاريخ الذكاء الاصطناعي كسردي وفني ونقلة نوعية تعيد تعريف الطريقة التي نعيش بها القصص.

عندما غادرت «الشرق الأوسط» قاعة «Sphere» في تلك الليلة وقد كانت الوسيلة الإعلامية الوحيدة في الشرق الأوسط وشمال أفريقيا التي دُعيت للحدث، أدركت أنها لم تشهد عرضاً ترفيهياً فقط، بل خاضت تجربة تمثل ملامح مستقبل الترفيه. لم يكن ذلك مستقبلاً افتراضياً أو بعيد المنال، بل كان واقعاً جديداً ينبض بالبيانات، والابتكار، والأصالة. واقعٌ يُعيد تشكيل علاقتنا مع الفن، ويمنح الخيال أبعاداً لم تكن ممكنة من قبل.


مقالات ذات صلة

تقارير: هل سيعتمد أول جهاز استهلاكي من «أوبن إيه آي» على الصوت؟

تكنولوجيا الجهاز المرتقب قد يعمل بلا شاشة معتمداً على الحوار الصوتي باعتباره نموذجاً جديداً للحوسبة اليومية (شاترستوك)

تقارير: هل سيعتمد أول جهاز استهلاكي من «أوبن إيه آي» على الصوت؟

«أوبن إيه آي» تستكشف جهازاً صوتياً غامضاً بلا شاشة، قد يعيد تعريف التفاعل مع الذكاء الاصطناعي ويفتح سباقاً جديداً على مستقبل الحوسبة اليومية.

نسيم رمضان (لندن)
تكنولوجيا التحول نحو المستندات متعددة الوسائط يعكس تغير توقعات المستخدمين في بيئات العمل والتعليم (شاترستوك)

«أدوبي» تتيح تحويل ملفات «PDF» إلى عروض تقديمية وبودكاست صوتي

«أدوبي» توسّع دور «PDF» بإضافة ذكاء اصطناعي يحوّل المستندات إلى عروض تقديمية وبودكاست، ما يعكس تحولاً نحو محتوى مرن متعدد الوسائط في العمل.

نسيم رمضان (لندن)
تكنولوجيا الباحثون: قمنا بتطوير قبضة روبوتية نامية تشبه النباتات المتسلقة قادرة على الالتفاف حول الجسم وتعليقه بلطف وبشكل آمن (MIT)

روبوت مستوحى من النباتات يرفع الأجسام الثقيلة والهشة بذكاء

ابتكار روبوتي مستوحى من النباتات يستخدم أنابيب مرنة «نامية» للالتفاف حول الأجسام، ما يسمح برفع الأحمال الثقيلة والهشة بأمان في بيئات متنوعة.

نسيم رمضان (لندن)
علوم مشاريع أحلام معمارية لعام 2026

مشاريع أحلام معمارية لعام 2026

نادراً ما يُتاح للمهندسين المعماريين اختيار المشاريع التي يعملون عليها؛ وذلك لاعتماد مجال الهندسة المعمارية على كبار المطورين العقاريين المتمتعين بميزانيات…

نيت بيرغ (واشنطن)
تكنولوجيا مجموعة الشحن السريع الشاملة لجميع الاستخدامات

مجموعة الشحن السريع تسهل الاستخدام والتنقل بكابل مدمج قابل للسحب

وداعاً لفوضى الأسلاك: أدوات لتأمين العمل المتواصل للجوالات الذكية والأجهزة اللوحية والكمبيوترات وأجهزة الألعاب المحمولة

خلدون غسان سعيد (جدة)

روبوتات تفكر وتتحرك: ما الذي يميّز «Rho-Alpha» من «مايكروسوفت»؟

نموذج «Rho-Alpha» يدمج الرؤية واللغة والفعل في إطار تعلم واحد ما يمكّن الروبوتات من التفاعل مع العالم المادي بمرونة أعلى (مايكروسوفت)
نموذج «Rho-Alpha» يدمج الرؤية واللغة والفعل في إطار تعلم واحد ما يمكّن الروبوتات من التفاعل مع العالم المادي بمرونة أعلى (مايكروسوفت)
TT

روبوتات تفكر وتتحرك: ما الذي يميّز «Rho-Alpha» من «مايكروسوفت»؟

نموذج «Rho-Alpha» يدمج الرؤية واللغة والفعل في إطار تعلم واحد ما يمكّن الروبوتات من التفاعل مع العالم المادي بمرونة أعلى (مايكروسوفت)
نموذج «Rho-Alpha» يدمج الرؤية واللغة والفعل في إطار تعلم واحد ما يمكّن الروبوتات من التفاعل مع العالم المادي بمرونة أعلى (مايكروسوفت)

يشهد الذكاء الاصطناعي تقدماً سريعاً في فهم اللغة والصور، إلا أن تحويل هذا الذكاء إلى أفعال ملموسة في العالم الحقيقي لا يزال أحد أكثر التحديات تعقيداً في مجال الحوسبة. وفي هذا السياق، تخطو أبحاث «مايكروسوفت» خطوة مهمة نحو سد هذه الفجوة، من خلال الكشف عن أعمال جديدة تهدف إلى تمكين الروبوتات من الإدراك والتفكير والتنفيذ بفاعلية أكبر داخل البيئات المادية الديناميكية.

وفي صميم هذا التوجه يأتي نموذج جديد يُعرف باسم «Rho-Alpha»، وهو نموذج يجمع بين الرؤية واللغة والفعل، ويهدف إلى مساعدة الروبوتات على تجاوز السلوكيات المبرمجة مسبقاً، والعمل بدرجة أعلى من الاستقلالية. ويعكس هذا النموذج طموح «مايكروسوفت» الأوسع في تطوير أنظمة ذكاء اصطناعي لا تكتفي بفهم المعلومات الرقمية، بل قادرة أيضاً على التفاعل مع العالم الفيزيائي بطرق أكثر مرونة وواقعية.

دمج الإدراك والفعل

على عكس الأنظمة الروبوتية التقليدية التي تعتمد على سلاسل هندسية منفصلة حيث تُعالج الرؤية والتخطيط والتحكم كوحدات مستقلة، يدمج نموذج «Rho-Alpha» هذه القدرات ضمن إطار تعلم واحد. ويتم تدريب النموذج على تحليل المدخلات البصرية، وفهم التعليمات باللغة الطبيعية، وتوليد أفعال جسدية مناسبة، ما يسمح للروبوتات بالاستجابة بسلاسة أكبر للمهام المعقدة.

ويعالج هذا النهج أحد التحديات المزمنة في عالم الروبوتات، المعروف بمشكلة «الميل الأخير». فعلى الرغم من قدرة نماذج الذكاء الاصطناعي على التعرف على الأشياء أو تنفيذ أوامر محددة، فإنها غالباً ما تفشل عند حدوث تغييرات غير متوقعة في البيئة. فاختلاف بسيط في الإضاءة أو موقع الأجسام أو سلوك البشر قد يؤدي إلى تعطل الأنظمة التقليدية. وتسعى أبحاث «مايكروسوفت» إلى جعل الروبوتات أكثر قدرة على التكيف من خلال ربط قراراتها بالسياق الواقعي بدلاً من القواعد الجامدة.

تعلم يتجاوز المختبر

يستند نموذج «Rho-Alpha» إلى التطورات الحديثة في النماذج التأسيسية، مستفيداً من مفاهيم النماذج اللغوية الضخمة والأنظمة متعددة الوسائط، مع تكييفها لمتطلبات التفاعل المادي. وبدلاً من تعلم المهام بشكل منفصل، يستطيع النموذج التعميم عبر سيناريوهات مختلفة، ما يمكّن الروبوتات من التعامل مع أشياء أو تعليمات لم تُصادفها صراحة أثناء التدريب. وتُعد هذه القدرة أساسية لنشر الروبوتات خارج المختبرات والبيئات الخاضعة للتحكم. وتصف أبحاث «مايكروسوفت» هذا العمل بأنه جزء من رؤية أوسع لما يُعرف بـ«الذكاء الاصطناعي المتجسد»، حيث يتشكل الذكاء ليس فقط من البيانات، بل من التفاعل المباشر مع العالم المادي. وفي هذا الإطار، تصبح الرؤية والفعل عنصرين متلازمين، ما يسمح للآلات بالتعلم من التجربة بأسلوب أقرب إلى السلوك البشري.

آفاق التطبيق العملي

تتعدد التطبيقات المحتملة لهذه التقنيات عبر قطاعات مختلفة. ففي البيئات الصناعية، يمكن للروبوتات الأكثر مرونة دعم مهام التصنيع والخدمات اللوجيستية التي تتطلب إعادة تهيئة مستمرة. أما في مجالات الرعاية الصحية والخدمات، فقد تساعد هذه الأنظمة في تنفيذ أنشطة يومية تتطلب تفاعلاً مباشراً مع البشر وبيئات غير متوقعة. ورغم أن «مايكروسوفت» لم تعلن عن منتجات تجارية قائمة على «Rho-Alpha»، فإن هذا البحث يسلط الضوء على قدرات أساسية قد تُمهّد لتطبيقات مستقبلية.

تؤكد «مايكروسوفت» أن التقدم في مجال الذكاء الاصطناعي للعالم المادي لا يقتصر على الأداء التقني فحسب، بل يشمل أيضاً اعتبارات السلامة والموثوقية ومواءمة الأنظمة مع النيات البشرية. فالروبوتات ذاتية التشغيل يجب أن تكون قادرة على فهم التعليمات بدقة، والتعامل مع الحالات الاستثنائية، خصوصاً في البيئات المشتركة مع البشر. لذلك، لا تركز الأبحاث على تعزيز القدرات فقط، بل أيضاً على المتانة والتصميم المسؤول.

يعتمد النموذج على مفهوم الذكاء الاصطناعي المتجسّد حيث يتعلم الروبوت من التجربة المباشرة والتفاعل مع البيئة كما يفعل البشر (مايكروسوفت)

من الذكاء إلى الفعل

يعكس إطلاق نموذج «Rho-Alpha» تحولاً أوسع في صناعة التكنولوجيا. فمع تزايد قدرات الذكاء الاصطناعي في السياقات الرقمية، يتجه الاهتمام تدريجياً نحو كيفية تجسيد هذه القدرات في آلات تعمل في العالم الحقيقي. ويطرح هذا التحول أسئلة جديدة حول جمع البيانات والمحاكاة وطرق التقييم، نظراً لأن البيئات المادية أقل قابلية للتنبؤ مقارنة بالبيئات الافتراضية.

وتشير أبحاث «مايكروسوفت» إلى أن المرحلة المقبلة من تطور الذكاء الاصطناعي لن تُقاس فقط بذكاء النماذج، بل بقدرتها على تحويل هذا الذكاء إلى أفعال ملموسة. ومن خلال توحيد الرؤية واللغة والتحكم ضمن إطار واحد، يمثل نموذج «Rho-Alpha» محطة بحثية مهمة في مسار جعل الذكاء الاصطناعي أكثر حضوراً وفاعلية خارج نطاق الشاشات والخوادم.

ومع تلاشي الحدود بين الذكاء الرقمي والأنظمة المادية، قد تُسهم مثل هذه التطورات في إعادة تشكيل طريقة تعاون الروبوتات مع البشر عبر مختلف القطاعات، في تحول تدريجي من آلات مبرمجة إلى شركاء أكثر وعياً بالسياق وقدرة على التكيف مع العالم الحقيقي.


تقارير: هل سيعتمد أول جهاز استهلاكي من «أوبن إيه آي» على الصوت؟

الجهاز المرتقب قد يعمل بلا شاشة معتمداً على الحوار الصوتي باعتباره نموذجاً جديداً للحوسبة اليومية (شاترستوك)
الجهاز المرتقب قد يعمل بلا شاشة معتمداً على الحوار الصوتي باعتباره نموذجاً جديداً للحوسبة اليومية (شاترستوك)
TT

تقارير: هل سيعتمد أول جهاز استهلاكي من «أوبن إيه آي» على الصوت؟

الجهاز المرتقب قد يعمل بلا شاشة معتمداً على الحوار الصوتي باعتباره نموذجاً جديداً للحوسبة اليومية (شاترستوك)
الجهاز المرتقب قد يعمل بلا شاشة معتمداً على الحوار الصوتي باعتباره نموذجاً جديداً للحوسبة اليومية (شاترستوك)

قد تكون شركة «أوبن إيه آي» بصدد الاستعداد لدخول سوق الأجهزة الاستهلاكية للمرة الأولى، وفقاً لتقرير يشير إلى أن الشركة تعمل على تطوير جهاز جديد مدعوم بالذكاء الاصطناعي، مع تركيز واضح على التفاعل الصوتي. ورغم محدودية التفاصيل المتاحة حتى الآن، يوصف المشروع بأنه خروج عن النماذج التقليدية المعتمدة على الشاشات والهواتف الذكية، لصالح نموذج حوسبة قائم على الصوت.

ويُقال إن الجهاز، الذي لا يزال غير رسمي ويُوصف بأنه «غامض»، يتم تطويره بالتعاون مع جوني آيف، الرئيس السابق للتصميم في شركة «أبل». ويُنظر إلى هذه الشراكة، التي جرى الإعلان عنها سابقاً، على أنها محاولة لإعادة التفكير في كيفية تفاعل المستخدمين مع الذكاء الاصطناعي خارج إطار التطبيقات والأجهزة التقليدية.

الصوت أولاً

بدلاً من أن يشبه هاتفاً ذكياً أو جهازاً لوحياً، يُعتقد أن المنتج يعتمد على الصوت بوصفه واجهة التفاعل الأساسية، وقد يأتي على شكل جهاز قابل للارتداء أو أداة محمولة باليد، وذلك وفقاً لتقرير نشره موقع «ITHome» نقلاً عن صحيفة «إيكونوميك ديلي نيوز» التايوانية، في حين لم تؤكد «أوبن إيه آي» بعد الشكل النهائي للجهاز، كما لم تعلن عن موعد لإطلاقه.

ويبدو أن الطموح الأساسي وراء هذا المشروع يتمثل في ابتكار جهاز يتيح للمستخدمين التفاعل مع الذكاء الاصطناعي بطريقة أكثر طبيعية، من خلال الحوار والمحادثة، بدلاً من الاعتماد على الشاشات أو لوحات المفاتيح أو الواجهات اللمسية. ويتماشى هذا التوجه مع سعي «أوبن إيه آي» الأوسع لجعل أنظمة الذكاء الاصطناعي أكثر بساطة واندماجاً في الحياة اليومية.

ويمثل هذا الجهاز المحتمل أول خطوة كبيرة لـ«أوبن إيه آي» خارج نطاق البرمجيات والخدمات السحابية. فحتى الآن، ركزت الشركة على تطوير نماذج لغوية ضخمة، وإتاحتها عبر منصات مثل «تشات جي بي تي» وواجهات برمجية يستخدمها المطورون والشركات. أما الانتقال إلى مجال الأجهزة، فسيعني توسيعاً ملحوظاً لدورها داخل منظومة الذكاء الاصطناعي.

وقد شهدت الأجهزة المعتمدة على التفاعل الصوتي اهتماماً متزايداً في قطاع التكنولوجيا، مدفوعاً بالتقدم في تقنيات التعرف على الصوت، ومعالجة اللغة الطبيعية، والاستدلال الفوري. ورغم الانتشار الواسع للمساعدات الصوتية، فإن معظمها لا يزال مرتبطاً بالهواتف الذكية أو السماعات الذكية. وقد يتيح جهاز مخصص للذكاء الاصطناعي تجربة أكثر استمرارية وتخصيصاً، لكنه في الوقت نفسه يثير تساؤلات تتعلق بالخصوصية والدقة وثقة المستخدمين.

المشروع يُعد رهاناً طويل الأمد على «الحوسبة المحيطة» حيث تصبح التقنية غير مرئية لكنها حاضرة دائماً (شاترستوك)

رهان طويل الأمد

كما أسهمت مشاركة جوني آيف في تسليط مزيد من الضوء على المشروع؛ نظراً لتاريخه في تصميم منتجات استهلاكية مؤثرة وواسعة الانتشار. ويُذكر أن شركته للتصميم تعمل مع «أوبن إيه آي» على تصورات لأجهزة جديدة تهدف إلى تجاوز الفئات التقليدية، مع تأكيد الطرفين أن العمل لا يزال في مرحلة استكشافية.

وبحسب التقرير، وصف مسؤولو «أوبن إيه آي» هذا الجهاز داخلياً بأنه مبادرة طويلة الأمد، وليس منتجاً وشيك الإطلاق. ويشير ذلك إلى أن الشركة لا تزال تختبر كيفية عمل الأجهزة المصممة أساساً للذكاء الاصطناعي، ومدى جاهزية المستهلكين لتبني نموذج جديد من التفاعل.

وفي حال تحقق هذا المشروع، فقد يضع «أوبن إيه آي» ضمن اتجاه أوسع نحو ما يُعرف بالحوسبة المحيطة، حيث تعمل التكنولوجيا في الخلفية وتستجيب للمستخدم عبر الصوت والسياق. ومع ذلك، يبقى نجاح مثل هذا الجهاز على نطاق واسع أمراً غير محسوم، خاصة في سوق مزدحمة بالأجهزة الذكية التي لم تحقق جميعها توقعات المستخدمين.

وفي الوقت الراهن، تعكس مساعي «أوبن إيه آي» في مجال الأجهزة اتجاهاً أوسع في صناعة الذكاء الاصطناعي. فمع ازدياد قدرات النماذج الذكية، قد لا تكون المنافسة المستقبلية محصورة في مستوى الذكاء فحسب، بل في الأجهزة والواجهات التي يختبر المستخدمون من خلالها هذه التقنيات.


«أدوبي» تتيح تحويل ملفات «PDF» إلى عروض تقديمية وبودكاست صوتي

التحول نحو المستندات متعددة الوسائط يعكس تغير توقعات المستخدمين في بيئات العمل والتعليم (شاترستوك)
التحول نحو المستندات متعددة الوسائط يعكس تغير توقعات المستخدمين في بيئات العمل والتعليم (شاترستوك)
TT

«أدوبي» تتيح تحويل ملفات «PDF» إلى عروض تقديمية وبودكاست صوتي

التحول نحو المستندات متعددة الوسائط يعكس تغير توقعات المستخدمين في بيئات العمل والتعليم (شاترستوك)
التحول نحو المستندات متعددة الوسائط يعكس تغير توقعات المستخدمين في بيئات العمل والتعليم (شاترستوك)

لطالما ارتبطت ملفات «PDF» على مدى عقود بالمحتوى الثابت، أي مستندات تُقرأ أو تُؤرشف أو تُعدّل بشكل محدود. لكن «أدوبي» تسعى اليوم إلى تغيير هذا التصور، بعد أن أضافت ميزات جديدة مدعومة بالذكاء الاصطناعي التوليدي إلى برنامج «أكروبات» (Acrobat) يتيح ذلك للمستخدمين تحويل ملفات «PDF» إلى عروض تقديمية وبودكاست صوتي، في خطوة تعكس تحولاً أوسع في طريقة استهلاك المستندات وإعادة استخدامها. يأتي هذا التوجه استجابة لتغير أنماط العمل حيث يُتوقع من المعلومات أن تتكيف مع سياقات متعددة من الاجتماعات إلى التنقل اليومي دون الحاجة إلى إعادة تنسيق يدوية.

من مستند إلى عرض تقديمي

من أبرز الإضافات الجديدة إمكانية إنشاء عروض تقديمية مباشرة من ملفات «PDF». فباستخدام قدرات الذكاء الاصطناعي في «Acrobat» يمكن للمستخدمين تحويل المستندات الطويلة أو المعقدة إلى مخططات عروض منظمة، تستخرج الأفكار الرئيسية وتعيد ترتيبها في صيغة مناسبة للعرض.

ولا تقتصر هذه العملية على تحويل الصفحات إلى شرائح، بل تعتمد على تحليل بنية المحتوى وتحديد الموضوعات والأقسام الأساسية، ثم إعادة تقديمها بتسلسل أكثر اختصاراً ووضوحاً. ويعكس هذا النهج توجهاً متزايداً لاستخدام الذكاء الاصطناعي كأداة للتلخيص والتركيب، وليس مجرد أداة تحويل شكلي.

إنشاء بودكاست صوتي من ملفات «PDF» يعكس تزايد أهمية الصوت كوسيلة لاستهلاك المعرفة والمحتوى (أدوبي)

تحويل ملفات «PDF» إلى بودكاست

إلى جانب العروض التقديمية، أضافت «أدوبي» ميزة إنشاء بودكاست صوتي مدعومة بالذكاء الاصطناعي، تتيح تحويل النصوص المكتوبة إلى محتوى مسموع بأسلوب أقرب إلى الحوار، بدل القراءة الآلية الرتيبة.

ووفقاً لتوثيق «أدوبي»، تهدف هذه الميزة إلى مساعدة المستخدمين على استيعاب المحتوى في الأوقات التي يصعب فيها القراءة، مثل أثناء التنقل أو أداء مهام أخرى. سيقوم النظام بتلخيص المحتوى وسرده صوتياً، ما يسمح بفهم الأفكار الأساسية دون الحاجة إلى تصفح الصفحات.

ويأتي ذلك في ظل تنامي الاعتماد على الصوت كوسيلة لاستهلاك المحتوى، ولا سيما المواد الطويلة أو التقنية، حيث لا تحل هذه الميزة محل القراءة، بل تقدم بديلاً مكملاً لها.

المستندات متعددة الوسائط تصبح القاعدة

تندرج تحديثات «Acrobat» الجديدة ضمن تحول أوسع في صناعة البرمجيات نحو المحتوى متعدد الوسائط. إذ بات يُتوقع من أدوات الإنتاجية أن تنتقل بسلاسة بين النص والصوت والمرئيات. ولم تعد قيمة المستند تُقاس بشكل عرضه فقط، بل بقدرته على التكيف مع احتياجات مختلفة.

وتشير تقارير تقنية إلى أن «أكروبات» بات جزءاً من هذا التوجه، لكن من زاوية مختلفة، إذ يعمل على مستوى المستندات نفسها، ولا سيما ملفات «PDF» التي غالباً ما تحتوي على محتوى رسمي أو نهائي، مثل التقارير والعقود والأبحاث.

هذه الميزات قد تعزز الإنتاجية وإمكانية الوصول خاصة لذوي الإعاقات البصرية أو صعوبات القراءة (أدوبي)

تأثيرات على بيئة العمل

قد يكون لهذه الميزات أثر ملموس على طبيعة العمل المعرفي. فغالباً ما يقضي الموظفون ساعات في تحويل التقارير المكتوبة إلى عروض تقديمية أو ملخصات للاجتماعات. ومن شأن أتمتة جزء من هذه العملية أن تقلل من الجهد والوقت، خصوصاً في المؤسسات الكبيرة.

كما تحمل هذه الخطوة بعداً مهماً في مجال سهولة الوصول. إذ يمكن للنسخ الصوتية أن تدعم المستخدمين من ذوي الإعاقات البصرية أو صعوبات القراءة، بينما تساعد الملخصات في استيعاب المحتوى الكثيف بسرعة أكبر. وإدماج هذه القدرات مباشرة داخل «Acrobat» يجعلها متاحة في المكان الذي توجد فيه المستندات أصلاً.

ليست مجرد مسألة سرعة

ورغم أن تحسين الإنتاجية يعد فائدة واضحة، فإن هذه التحديثات تشير أيضاً إلى تحول أعمق في طريقة إعداد المستندات. فمع إدراك أن ملف «PDF» قد يتحول لاحقاً إلى عرض تقديمي أو مادة صوتية، قد يميل الكُتّاب إلى تنظيم المحتوى منذ البداية بأسلوب أوضح، مع عناوين أقوى وبنية أكثر إحكاماً.

في المقابل، تثير المخرجات التي ينشئها الذكاء الاصطناعي تساؤلات حول الدقة والسياق. فالملخصات والسرد الصوتي يعتمدان على تفسير النظام للمحتوى، ما يجعل المراجعة البشرية ضرورية، خاصة عند التعامل مع وثائق حساسة أو دقيقة.

إعادة التفكير في ملف «PDF»

على مدى السنوات الماضية، وسّعت «أدوبي» دور «Acrobat» ليشمل ميزات مثل التلخيص الذكي والبحث القائم على الذكاء الاصطناعي. وتأتي إمكانية إنشاء عروض تقديمية وبودكاست امتداداً لهذا المسار، في إشارة إلى أن الشركة لم تعد ترى «PDF» صيغة جامدة، بل حاوية مرنة للمعرفة.

ومع تعمق استخدام الذكاء الاصطناعي التوليدي في أدوات الإنتاجية، توضح هذه الخطوة فكرة أن قيمة المستند لم تعد تكمن في محتواه فقط، بل في مدى سهولة إعادة تشكيل هذا المحتوى ومشاركته وفهمه بطرق متعددة.