كيف تستخدم صور الهاتف للبحث على الإنترنت؟

تطبيقات مطورة للتعرف على أوصافها وأصولها

كيف تستخدم صور الهاتف للبحث على الإنترنت؟
TT

كيف تستخدم صور الهاتف للبحث على الإنترنت؟

كيف تستخدم صور الهاتف للبحث على الإنترنت؟

الصورة تساوي ألف كلمة، لكنك لا تحتاج إلى كتابة أي منها من أجل البحث على الإنترنت هذه الأيام، إذ تستطيع البرامج الموجودة على هاتفك، بمساعدة الذكاء الاصطناعي، تحليل الأشياء بشكل مباشر من خلال عدسة الكاميرا الخاصة بك، أو تلك الموجودة في صورة أو مقطع مصور بشكل ذاتي بحيث تجمع قائمة من نتائج البحث فوراً.

ولا يحتاج المرء إلى أحدث أنواع الهواتف، أو إلى أي من تطبيقات الطرف الثالث، حيث يمكن لأدوات حالية خاصة بنظامي التشغيل «أندرويد» و«آي أو إس» أداء الوظيفة من خلال النقر على الشاشة أو تحريكها.

«غوغل» للبحث في الصور

تيسر خاصية «وضع دائرة حول أي منطقة على الشاشة» «سيركل تو سيرش» Circle to Search من «غوغل»، التي تم تدشينها في بداية العام الحالي للأجهزة التي تعمل بنظام «أندرويد»، إطلاق استفسار، بحيث يصبح بسهولة تحريك إصبعك حول شيء محدد على الشاشة دون أي تبديل بين التطبيقات. هذه الخاصية متاحة على عشرات الهواتف، التي تعمل بنظام «أندرويد»، بما في ذلك الكثير من أجهزة «سامسونغ غالاكسي».

لاستخدام خاصية «سيركل تو سيرش»، تأكد من تشغيلها. في حالة نظام التشغيل «أندرويد 15»، قم بفتح الإعدادات، واختيار «عرض»، «لمس»، ثم اختيار نمط التنقل لتظهر ضوابط «سيركل تو سيرش». وتتباين الخطوات بحسب الجهاز والبرامج المستخدمة، لكن يمكن لصندوق البحث الموجود في الإعدادات المساعدة في العثور على هذه الخاصية، إذا كانت متاحة لك.

الآن عندما ترى شيئاً تريد التحقق منه بشكل أكبر، استدعِ خاصية «سيركل تو سيرش» من خلال الضغط على زر الصفحة الرئيسية الدائري الموجود أسفل الشاشة، أو بالضغط على مشغل التنقل، وهو خط أفقي أسفل الشاشة خاص بالتنقل باستخدام «جيستشر» (التنقل بالإيماءات).

عند تفعيل الخاصية، تخفت إضاءة الشاشة، وتظهر قائمة بأدوات البحث. حرّك إصبعك حول العنصر الذي يهمك وموجود على الشاشة، وسوف تظهر نتائج من محرك البحث «غوغل» أسفل الصورة. يمكنك إضافة كلمات دلالية لتضييق نطاق البحث، ويمكن تضمين ملاحظات من الذكاء الاصطناعي.

بحث «غوغل» في هواتف «آيفون»

لم تصدر شركة «غوغل» بعد نسخة من «سيركل تو سيرش» خاصة بهاتف الـ«آيفون»، لكن هناك وسيلة تحايل تتفادى رسم دائرة، وتحلل لقطة حديثة من الشاشة للشيء الذي تريد الاستفسار عنه. لاستخدام هذه الطريقة، ستحتاج إلى تطبيق «غوغل» خاص بنظام التشغيل «آي أو إس»، وبضع دقائق مع تطبيق «شورتكاتس» المجاني من شركة «آبل» لتنفيذ مهام التشغيل الذاتي.

افتح تطبيق «شورتكاتس» Shortcuts app وانقر زر «+» (علامة الموجب) الموجود في أعلى يمين الشاشة، ثم اذهب إلى صندوق «سيرش أكشنز» (أفعال البحث)، وابحث عن عبارة «عمل لقطة شاشة»، واضغط عليها. ابحث بعد ذلك عن عبارة «استقص عن الصورة باستخدام العدسة»، ثم قم بإضافتها، ثم انقر على زر «تم».

يمكنك الطلب من مساعد الذكاء الاصطناعي الشخصي «سيري» تشغيل الطريق المختصر باسمه وهو «استقصِ عن الصورة باستخدام العدسة». مع ذلك لطلبات البحث الصامتة، يمكنك تفعيله بلمس الصورة الموجودة في مستعرض الصور بالكاميرا، أو أي صورة موجودة على الشاشة مرة واحدة.

لتخصيص «الطريق المختصر» لـ«زر التشغيل»، المتاح فقط على هاتف «آيفون 15 برو» أو «آيفون 15 برو ماكس» أو الطرز اللاحقة، اذهب إلى الإعدادات، واختر «زر التشغيل»، ثم اختر بعد ذلك «الطريق المختصر»، وعبارة «استقصِ عن الصورة باستخدام العدسة».

في حالة الطرز الأقدم من هواتف «آيفون»، اذهب إلى الإعدادات، واختر «قابلية الدخول»، ثم المس زر «تاتش أند باك» (اللمس والعودة). وفي قائمة «باك تاب»، اختر «دابل تاب» (النقرة المزدوجة) أو «تريبل تاب» (النقرة الثلاثية)، ثم اختر بعد ذلك الطريق المختصر «استقصِ عن الصورة باستخدام العدسة». انقر على الجانب الخلفي من هاتفك مرتين أو ثلاث مرات لتشغيل الطريق المختصر والحصول على نتائج بحثك.

«عدسة غوغل»

توفر تكنولوجيا «غوغل لينس» Google Lens للتعرف على الصور نتائج بحث مرئية منذ عام 2017. ويمكنها تحديد أنواع وأسماء الكثير من النباتات والحيوانات والمعالم والأعمال الفنية وغيرها من الأشياء، إلى جانب أشياء أخرى مثل الملابس التي ربما تريد شراءها. كذلك يمكنها ترجمة الإشارات، والمساعدة في الفروض المنزلية لمادة الرياضيات، إضافة إلى أمور أخرى.

البرنامج متاح في تطبيق «غوغل لينس» القائم بذاته الخاص بنظام التشغيل «أندرويد»، إلى جانب تطبيق «غوغل»، و«غوغل فوتوز» ومتصفح «كروم» (لكل من نظامي التشغيل «أندرويد» و«آي أو إس»). وفي تطبيق «لينس» الخاص بنظام التشغيل «أندرويد»، يمكنك النقر على «ابحث باستخدام الكاميرا الخاصة بك»، وقم بتوجيه هاتفك نحو الشيء الذي تريد البحث عنه. وفي تطبيقات أخرى من «غوغل»، يمكنك النقر على أيقونة العدسة المربعة على الشاشة لبدء البحث. وتظهر النتائج، التي ترتبط كثيراً بجهود التسويق، أسفل الصورة.

على الجانب الآخر سوف توفر خاصية الذكاء المرئي المدعوم بالذكاء الاصطناعي المرتقب من شركة «آبل» لهواتف «آيفون 16»، باستخدام أزرار التحكم في الكاميرا، بحث مرئي فوري قبل نهاية العام الحالي. وحتى ذلك الحين، وفي حالة هواتف الـ«آيفون» الأقدم، هناك أداة «فيجوال لوك أب» Visual Look Up (البحث المرئي)، التي ظهرت عام 2021. فهي تعمل مع تطبيق «فوتوز» من «آبل»، ومتصفح «سفاري»، ومراجعات الصور «كويك لوك»، وغيرها من أجل التعرف على الأشياء.

لاستخدامه قم بفتح صورة، أو إيقاف مقطع صور. إذا كان «فيجوال لوك أب» متاحاً، سوف يظهر زر المعلومات أسفل الشاشة ورقة شجر، أو أثر لكف حيوان، أو رموز خريطة، أو أيقونة أخرى يمكنك النقر عليها للحصول على المزيد من المعلومات من مساعد الذكاء الاصطناعي «سيري» عن الشيء الموجود في الصورة. وكما هو الحال في كل أدوات البحث، يمكنك الاطلاع على سياسات الخصوصية لكل من «غوغل» و«آبل»، إذا كانت لديك أي مخاوف.

يمكن أن تتنوع وتتباين دقة نتائج البحث المرئي، لكن بالنسبة إلى المرات التي لا يكون لديك فيها الكلمات أو الوقت لوصف ما تراه، ربما تستطيع تلك الأداة توجيهك نحو الاتجاه الصحيح.

* خدمة «نيويورك تايمز»


مقالات ذات صلة

روبوتات تفكر وتتحرك: ما الذي يميّز «Rho-Alpha» من «مايكروسوفت»؟

تكنولوجيا نموذج «Rho-Alpha» يدمج الرؤية واللغة والفعل في إطار تعلم واحد ما يمكّن الروبوتات من التفاعل مع العالم المادي بمرونة أعلى (مايكروسوفت)

روبوتات تفكر وتتحرك: ما الذي يميّز «Rho-Alpha» من «مايكروسوفت»؟

تستعرض أبحاث «مايكروسوفت» نموذجاً جديداً يمكّن الروبوتات من فهم العالم والتكيّف معه عبر دمج الرؤية واللغة والفعل في ذكاء متجسّد واحد.

نسيم رمضان (لندن)
الاقتصاد كلمة «الذكاء الاصطناعي» ولوحة مفاتيح وأيدٍ روبوتية في هذه الصورة التوضيحية (رويترز)

كوريا الجنوبية تطلق أول إطار عالمي شامل لتنظيم الذكاء الاصطناعي

أعلنت كوريا الجنوبية، يوم الخميس، ما وصفتها بـ«أول مجموعة شاملة في العالم من القوانين لتنظيم الذكاء الاصطناعي»؛ بهدف تعزيز الثقة والأمان في هذا القطاع.

«الشرق الأوسط» (سيول)
تكنولوجيا الجهاز المرتقب قد يعمل بلا شاشة معتمداً على الحوار الصوتي باعتباره نموذجاً جديداً للحوسبة اليومية (شاترستوك)

تقارير: هل سيعتمد أول جهاز استهلاكي من «أوبن إيه آي» على الصوت؟

«أوبن إيه آي» تستكشف جهازاً صوتياً غامضاً بلا شاشة، قد يعيد تعريف التفاعل مع الذكاء الاصطناعي ويفتح سباقاً جديداً على مستقبل الحوسبة اليومية.

نسيم رمضان (لندن)
الاقتصاد شرائح ذكية من شركة «إنفيديا» (رويترز)

الكونغرس يصوِّت للحصول على حق الإشراف على صادرات الرقائق

حدد مشرّع جمهوري بارز موعداً للتصويت في اللجنة، يوم الأربعاء، على مشروع قانون يمنح الكونغرس سلطة الإشراف على صادرات رقائق الذكاء الاصطناعي، على الرغم من معارضة…

«الشرق الأوسط» (واشنطن)
الاقتصاد رئيس «إنفيديا» يتحدث في إحدى جلسات المنتدى الاقتصادي العالمي في دافوس (أ.ف.ب)

من دافوس... مؤسس «إنفيديا» يتوقع استثمارات تريليونية لبناء «البنية التحتية للبشرية»

أكد الرئيس التنفيذي لشركة «إنفيديا» العملاقة، جنسن هوانغ، أن العالم لا يزال في بداية الطريق نحو بناء البنية التحتية اللازمة للذكاء الاصطناعي.

«الشرق الأوسط» (دافوس (سويسرا))

روبوتات تفكر وتتحرك: ما الذي يميّز «Rho-Alpha» من «مايكروسوفت»؟

نموذج «Rho-Alpha» يدمج الرؤية واللغة والفعل في إطار تعلم واحد ما يمكّن الروبوتات من التفاعل مع العالم المادي بمرونة أعلى (مايكروسوفت)
نموذج «Rho-Alpha» يدمج الرؤية واللغة والفعل في إطار تعلم واحد ما يمكّن الروبوتات من التفاعل مع العالم المادي بمرونة أعلى (مايكروسوفت)
TT

روبوتات تفكر وتتحرك: ما الذي يميّز «Rho-Alpha» من «مايكروسوفت»؟

نموذج «Rho-Alpha» يدمج الرؤية واللغة والفعل في إطار تعلم واحد ما يمكّن الروبوتات من التفاعل مع العالم المادي بمرونة أعلى (مايكروسوفت)
نموذج «Rho-Alpha» يدمج الرؤية واللغة والفعل في إطار تعلم واحد ما يمكّن الروبوتات من التفاعل مع العالم المادي بمرونة أعلى (مايكروسوفت)

يشهد الذكاء الاصطناعي تقدماً سريعاً في فهم اللغة والصور، إلا أن تحويل هذا الذكاء إلى أفعال ملموسة في العالم الحقيقي لا يزال أحد أكثر التحديات تعقيداً في مجال الحوسبة. وفي هذا السياق، تخطو أبحاث «مايكروسوفت» خطوة مهمة نحو سد هذه الفجوة، من خلال الكشف عن أعمال جديدة تهدف إلى تمكين الروبوتات من الإدراك والتفكير والتنفيذ بفاعلية أكبر داخل البيئات المادية الديناميكية.

وفي صميم هذا التوجه يأتي نموذج جديد يُعرف باسم «Rho-Alpha»، وهو نموذج يجمع بين الرؤية واللغة والفعل، ويهدف إلى مساعدة الروبوتات على تجاوز السلوكيات المبرمجة مسبقاً، والعمل بدرجة أعلى من الاستقلالية. ويعكس هذا النموذج طموح «مايكروسوفت» الأوسع في تطوير أنظمة ذكاء اصطناعي لا تكتفي بفهم المعلومات الرقمية، بل قادرة أيضاً على التفاعل مع العالم الفيزيائي بطرق أكثر مرونة وواقعية.

دمج الإدراك والفعل

على عكس الأنظمة الروبوتية التقليدية التي تعتمد على سلاسل هندسية منفصلة حيث تُعالج الرؤية والتخطيط والتحكم كوحدات مستقلة، يدمج نموذج «Rho-Alpha» هذه القدرات ضمن إطار تعلم واحد. ويتم تدريب النموذج على تحليل المدخلات البصرية، وفهم التعليمات باللغة الطبيعية، وتوليد أفعال جسدية مناسبة، ما يسمح للروبوتات بالاستجابة بسلاسة أكبر للمهام المعقدة.

ويعالج هذا النهج أحد التحديات المزمنة في عالم الروبوتات، المعروف بمشكلة «الميل الأخير». فعلى الرغم من قدرة نماذج الذكاء الاصطناعي على التعرف على الأشياء أو تنفيذ أوامر محددة، فإنها غالباً ما تفشل عند حدوث تغييرات غير متوقعة في البيئة. فاختلاف بسيط في الإضاءة أو موقع الأجسام أو سلوك البشر قد يؤدي إلى تعطل الأنظمة التقليدية. وتسعى أبحاث «مايكروسوفت» إلى جعل الروبوتات أكثر قدرة على التكيف من خلال ربط قراراتها بالسياق الواقعي بدلاً من القواعد الجامدة.

تعلم يتجاوز المختبر

يستند نموذج «Rho-Alpha» إلى التطورات الحديثة في النماذج التأسيسية، مستفيداً من مفاهيم النماذج اللغوية الضخمة والأنظمة متعددة الوسائط، مع تكييفها لمتطلبات التفاعل المادي. وبدلاً من تعلم المهام بشكل منفصل، يستطيع النموذج التعميم عبر سيناريوهات مختلفة، ما يمكّن الروبوتات من التعامل مع أشياء أو تعليمات لم تُصادفها صراحة أثناء التدريب. وتُعد هذه القدرة أساسية لنشر الروبوتات خارج المختبرات والبيئات الخاضعة للتحكم. وتصف أبحاث «مايكروسوفت» هذا العمل بأنه جزء من رؤية أوسع لما يُعرف بـ«الذكاء الاصطناعي المتجسد»، حيث يتشكل الذكاء ليس فقط من البيانات، بل من التفاعل المباشر مع العالم المادي. وفي هذا الإطار، تصبح الرؤية والفعل عنصرين متلازمين، ما يسمح للآلات بالتعلم من التجربة بأسلوب أقرب إلى السلوك البشري.

آفاق التطبيق العملي

تتعدد التطبيقات المحتملة لهذه التقنيات عبر قطاعات مختلفة. ففي البيئات الصناعية، يمكن للروبوتات الأكثر مرونة دعم مهام التصنيع والخدمات اللوجيستية التي تتطلب إعادة تهيئة مستمرة. أما في مجالات الرعاية الصحية والخدمات، فقد تساعد هذه الأنظمة في تنفيذ أنشطة يومية تتطلب تفاعلاً مباشراً مع البشر وبيئات غير متوقعة. ورغم أن «مايكروسوفت» لم تعلن عن منتجات تجارية قائمة على «Rho-Alpha»، فإن هذا البحث يسلط الضوء على قدرات أساسية قد تُمهّد لتطبيقات مستقبلية.

تؤكد «مايكروسوفت» أن التقدم في مجال الذكاء الاصطناعي للعالم المادي لا يقتصر على الأداء التقني فحسب، بل يشمل أيضاً اعتبارات السلامة والموثوقية ومواءمة الأنظمة مع النيات البشرية. فالروبوتات ذاتية التشغيل يجب أن تكون قادرة على فهم التعليمات بدقة، والتعامل مع الحالات الاستثنائية، خصوصاً في البيئات المشتركة مع البشر. لذلك، لا تركز الأبحاث على تعزيز القدرات فقط، بل أيضاً على المتانة والتصميم المسؤول.

يعتمد النموذج على مفهوم الذكاء الاصطناعي المتجسّد حيث يتعلم الروبوت من التجربة المباشرة والتفاعل مع البيئة كما يفعل البشر (مايكروسوفت)

من الذكاء إلى الفعل

يعكس إطلاق نموذج «Rho-Alpha» تحولاً أوسع في صناعة التكنولوجيا. فمع تزايد قدرات الذكاء الاصطناعي في السياقات الرقمية، يتجه الاهتمام تدريجياً نحو كيفية تجسيد هذه القدرات في آلات تعمل في العالم الحقيقي. ويطرح هذا التحول أسئلة جديدة حول جمع البيانات والمحاكاة وطرق التقييم، نظراً لأن البيئات المادية أقل قابلية للتنبؤ مقارنة بالبيئات الافتراضية.

وتشير أبحاث «مايكروسوفت» إلى أن المرحلة المقبلة من تطور الذكاء الاصطناعي لن تُقاس فقط بذكاء النماذج، بل بقدرتها على تحويل هذا الذكاء إلى أفعال ملموسة. ومن خلال توحيد الرؤية واللغة والتحكم ضمن إطار واحد، يمثل نموذج «Rho-Alpha» محطة بحثية مهمة في مسار جعل الذكاء الاصطناعي أكثر حضوراً وفاعلية خارج نطاق الشاشات والخوادم.

ومع تلاشي الحدود بين الذكاء الرقمي والأنظمة المادية، قد تُسهم مثل هذه التطورات في إعادة تشكيل طريقة تعاون الروبوتات مع البشر عبر مختلف القطاعات، في تحول تدريجي من آلات مبرمجة إلى شركاء أكثر وعياً بالسياق وقدرة على التكيف مع العالم الحقيقي.


تقارير: هل سيعتمد أول جهاز استهلاكي من «أوبن إيه آي» على الصوت؟

الجهاز المرتقب قد يعمل بلا شاشة معتمداً على الحوار الصوتي باعتباره نموذجاً جديداً للحوسبة اليومية (شاترستوك)
الجهاز المرتقب قد يعمل بلا شاشة معتمداً على الحوار الصوتي باعتباره نموذجاً جديداً للحوسبة اليومية (شاترستوك)
TT

تقارير: هل سيعتمد أول جهاز استهلاكي من «أوبن إيه آي» على الصوت؟

الجهاز المرتقب قد يعمل بلا شاشة معتمداً على الحوار الصوتي باعتباره نموذجاً جديداً للحوسبة اليومية (شاترستوك)
الجهاز المرتقب قد يعمل بلا شاشة معتمداً على الحوار الصوتي باعتباره نموذجاً جديداً للحوسبة اليومية (شاترستوك)

قد تكون شركة «أوبن إيه آي» بصدد الاستعداد لدخول سوق الأجهزة الاستهلاكية للمرة الأولى، وفقاً لتقرير يشير إلى أن الشركة تعمل على تطوير جهاز جديد مدعوم بالذكاء الاصطناعي، مع تركيز واضح على التفاعل الصوتي. ورغم محدودية التفاصيل المتاحة حتى الآن، يوصف المشروع بأنه خروج عن النماذج التقليدية المعتمدة على الشاشات والهواتف الذكية، لصالح نموذج حوسبة قائم على الصوت.

ويُقال إن الجهاز، الذي لا يزال غير رسمي ويُوصف بأنه «غامض»، يتم تطويره بالتعاون مع جوني آيف، الرئيس السابق للتصميم في شركة «أبل». ويُنظر إلى هذه الشراكة، التي جرى الإعلان عنها سابقاً، على أنها محاولة لإعادة التفكير في كيفية تفاعل المستخدمين مع الذكاء الاصطناعي خارج إطار التطبيقات والأجهزة التقليدية.

الصوت أولاً

بدلاً من أن يشبه هاتفاً ذكياً أو جهازاً لوحياً، يُعتقد أن المنتج يعتمد على الصوت بوصفه واجهة التفاعل الأساسية، وقد يأتي على شكل جهاز قابل للارتداء أو أداة محمولة باليد، وذلك وفقاً لتقرير نشره موقع «ITHome» نقلاً عن صحيفة «إيكونوميك ديلي نيوز» التايوانية، في حين لم تؤكد «أوبن إيه آي» بعد الشكل النهائي للجهاز، كما لم تعلن عن موعد لإطلاقه.

ويبدو أن الطموح الأساسي وراء هذا المشروع يتمثل في ابتكار جهاز يتيح للمستخدمين التفاعل مع الذكاء الاصطناعي بطريقة أكثر طبيعية، من خلال الحوار والمحادثة، بدلاً من الاعتماد على الشاشات أو لوحات المفاتيح أو الواجهات اللمسية. ويتماشى هذا التوجه مع سعي «أوبن إيه آي» الأوسع لجعل أنظمة الذكاء الاصطناعي أكثر بساطة واندماجاً في الحياة اليومية.

ويمثل هذا الجهاز المحتمل أول خطوة كبيرة لـ«أوبن إيه آي» خارج نطاق البرمجيات والخدمات السحابية. فحتى الآن، ركزت الشركة على تطوير نماذج لغوية ضخمة، وإتاحتها عبر منصات مثل «تشات جي بي تي» وواجهات برمجية يستخدمها المطورون والشركات. أما الانتقال إلى مجال الأجهزة، فسيعني توسيعاً ملحوظاً لدورها داخل منظومة الذكاء الاصطناعي.

وقد شهدت الأجهزة المعتمدة على التفاعل الصوتي اهتماماً متزايداً في قطاع التكنولوجيا، مدفوعاً بالتقدم في تقنيات التعرف على الصوت، ومعالجة اللغة الطبيعية، والاستدلال الفوري. ورغم الانتشار الواسع للمساعدات الصوتية، فإن معظمها لا يزال مرتبطاً بالهواتف الذكية أو السماعات الذكية. وقد يتيح جهاز مخصص للذكاء الاصطناعي تجربة أكثر استمرارية وتخصيصاً، لكنه في الوقت نفسه يثير تساؤلات تتعلق بالخصوصية والدقة وثقة المستخدمين.

المشروع يُعد رهاناً طويل الأمد على «الحوسبة المحيطة» حيث تصبح التقنية غير مرئية لكنها حاضرة دائماً (شاترستوك)

رهان طويل الأمد

كما أسهمت مشاركة جوني آيف في تسليط مزيد من الضوء على المشروع؛ نظراً لتاريخه في تصميم منتجات استهلاكية مؤثرة وواسعة الانتشار. ويُذكر أن شركته للتصميم تعمل مع «أوبن إيه آي» على تصورات لأجهزة جديدة تهدف إلى تجاوز الفئات التقليدية، مع تأكيد الطرفين أن العمل لا يزال في مرحلة استكشافية.

وبحسب التقرير، وصف مسؤولو «أوبن إيه آي» هذا الجهاز داخلياً بأنه مبادرة طويلة الأمد، وليس منتجاً وشيك الإطلاق. ويشير ذلك إلى أن الشركة لا تزال تختبر كيفية عمل الأجهزة المصممة أساساً للذكاء الاصطناعي، ومدى جاهزية المستهلكين لتبني نموذج جديد من التفاعل.

وفي حال تحقق هذا المشروع، فقد يضع «أوبن إيه آي» ضمن اتجاه أوسع نحو ما يُعرف بالحوسبة المحيطة، حيث تعمل التكنولوجيا في الخلفية وتستجيب للمستخدم عبر الصوت والسياق. ومع ذلك، يبقى نجاح مثل هذا الجهاز على نطاق واسع أمراً غير محسوم، خاصة في سوق مزدحمة بالأجهزة الذكية التي لم تحقق جميعها توقعات المستخدمين.

وفي الوقت الراهن، تعكس مساعي «أوبن إيه آي» في مجال الأجهزة اتجاهاً أوسع في صناعة الذكاء الاصطناعي. فمع ازدياد قدرات النماذج الذكية، قد لا تكون المنافسة المستقبلية محصورة في مستوى الذكاء فحسب، بل في الأجهزة والواجهات التي يختبر المستخدمون من خلالها هذه التقنيات.


«أدوبي» تتيح تحويل ملفات «PDF» إلى عروض تقديمية وبودكاست صوتي

التحول نحو المستندات متعددة الوسائط يعكس تغير توقعات المستخدمين في بيئات العمل والتعليم (شاترستوك)
التحول نحو المستندات متعددة الوسائط يعكس تغير توقعات المستخدمين في بيئات العمل والتعليم (شاترستوك)
TT

«أدوبي» تتيح تحويل ملفات «PDF» إلى عروض تقديمية وبودكاست صوتي

التحول نحو المستندات متعددة الوسائط يعكس تغير توقعات المستخدمين في بيئات العمل والتعليم (شاترستوك)
التحول نحو المستندات متعددة الوسائط يعكس تغير توقعات المستخدمين في بيئات العمل والتعليم (شاترستوك)

لطالما ارتبطت ملفات «PDF» على مدى عقود بالمحتوى الثابت، أي مستندات تُقرأ أو تُؤرشف أو تُعدّل بشكل محدود. لكن «أدوبي» تسعى اليوم إلى تغيير هذا التصور، بعد أن أضافت ميزات جديدة مدعومة بالذكاء الاصطناعي التوليدي إلى برنامج «أكروبات» (Acrobat) يتيح ذلك للمستخدمين تحويل ملفات «PDF» إلى عروض تقديمية وبودكاست صوتي، في خطوة تعكس تحولاً أوسع في طريقة استهلاك المستندات وإعادة استخدامها. يأتي هذا التوجه استجابة لتغير أنماط العمل حيث يُتوقع من المعلومات أن تتكيف مع سياقات متعددة من الاجتماعات إلى التنقل اليومي دون الحاجة إلى إعادة تنسيق يدوية.

من مستند إلى عرض تقديمي

من أبرز الإضافات الجديدة إمكانية إنشاء عروض تقديمية مباشرة من ملفات «PDF». فباستخدام قدرات الذكاء الاصطناعي في «Acrobat» يمكن للمستخدمين تحويل المستندات الطويلة أو المعقدة إلى مخططات عروض منظمة، تستخرج الأفكار الرئيسية وتعيد ترتيبها في صيغة مناسبة للعرض.

ولا تقتصر هذه العملية على تحويل الصفحات إلى شرائح، بل تعتمد على تحليل بنية المحتوى وتحديد الموضوعات والأقسام الأساسية، ثم إعادة تقديمها بتسلسل أكثر اختصاراً ووضوحاً. ويعكس هذا النهج توجهاً متزايداً لاستخدام الذكاء الاصطناعي كأداة للتلخيص والتركيب، وليس مجرد أداة تحويل شكلي.

إنشاء بودكاست صوتي من ملفات «PDF» يعكس تزايد أهمية الصوت كوسيلة لاستهلاك المعرفة والمحتوى (أدوبي)

تحويل ملفات «PDF» إلى بودكاست

إلى جانب العروض التقديمية، أضافت «أدوبي» ميزة إنشاء بودكاست صوتي مدعومة بالذكاء الاصطناعي، تتيح تحويل النصوص المكتوبة إلى محتوى مسموع بأسلوب أقرب إلى الحوار، بدل القراءة الآلية الرتيبة.

ووفقاً لتوثيق «أدوبي»، تهدف هذه الميزة إلى مساعدة المستخدمين على استيعاب المحتوى في الأوقات التي يصعب فيها القراءة، مثل أثناء التنقل أو أداء مهام أخرى. سيقوم النظام بتلخيص المحتوى وسرده صوتياً، ما يسمح بفهم الأفكار الأساسية دون الحاجة إلى تصفح الصفحات.

ويأتي ذلك في ظل تنامي الاعتماد على الصوت كوسيلة لاستهلاك المحتوى، ولا سيما المواد الطويلة أو التقنية، حيث لا تحل هذه الميزة محل القراءة، بل تقدم بديلاً مكملاً لها.

المستندات متعددة الوسائط تصبح القاعدة

تندرج تحديثات «Acrobat» الجديدة ضمن تحول أوسع في صناعة البرمجيات نحو المحتوى متعدد الوسائط. إذ بات يُتوقع من أدوات الإنتاجية أن تنتقل بسلاسة بين النص والصوت والمرئيات. ولم تعد قيمة المستند تُقاس بشكل عرضه فقط، بل بقدرته على التكيف مع احتياجات مختلفة.

وتشير تقارير تقنية إلى أن «أكروبات» بات جزءاً من هذا التوجه، لكن من زاوية مختلفة، إذ يعمل على مستوى المستندات نفسها، ولا سيما ملفات «PDF» التي غالباً ما تحتوي على محتوى رسمي أو نهائي، مثل التقارير والعقود والأبحاث.

هذه الميزات قد تعزز الإنتاجية وإمكانية الوصول خاصة لذوي الإعاقات البصرية أو صعوبات القراءة (أدوبي)

تأثيرات على بيئة العمل

قد يكون لهذه الميزات أثر ملموس على طبيعة العمل المعرفي. فغالباً ما يقضي الموظفون ساعات في تحويل التقارير المكتوبة إلى عروض تقديمية أو ملخصات للاجتماعات. ومن شأن أتمتة جزء من هذه العملية أن تقلل من الجهد والوقت، خصوصاً في المؤسسات الكبيرة.

كما تحمل هذه الخطوة بعداً مهماً في مجال سهولة الوصول. إذ يمكن للنسخ الصوتية أن تدعم المستخدمين من ذوي الإعاقات البصرية أو صعوبات القراءة، بينما تساعد الملخصات في استيعاب المحتوى الكثيف بسرعة أكبر. وإدماج هذه القدرات مباشرة داخل «Acrobat» يجعلها متاحة في المكان الذي توجد فيه المستندات أصلاً.

ليست مجرد مسألة سرعة

ورغم أن تحسين الإنتاجية يعد فائدة واضحة، فإن هذه التحديثات تشير أيضاً إلى تحول أعمق في طريقة إعداد المستندات. فمع إدراك أن ملف «PDF» قد يتحول لاحقاً إلى عرض تقديمي أو مادة صوتية، قد يميل الكُتّاب إلى تنظيم المحتوى منذ البداية بأسلوب أوضح، مع عناوين أقوى وبنية أكثر إحكاماً.

في المقابل، تثير المخرجات التي ينشئها الذكاء الاصطناعي تساؤلات حول الدقة والسياق. فالملخصات والسرد الصوتي يعتمدان على تفسير النظام للمحتوى، ما يجعل المراجعة البشرية ضرورية، خاصة عند التعامل مع وثائق حساسة أو دقيقة.

إعادة التفكير في ملف «PDF»

على مدى السنوات الماضية، وسّعت «أدوبي» دور «Acrobat» ليشمل ميزات مثل التلخيص الذكي والبحث القائم على الذكاء الاصطناعي. وتأتي إمكانية إنشاء عروض تقديمية وبودكاست امتداداً لهذا المسار، في إشارة إلى أن الشركة لم تعد ترى «PDF» صيغة جامدة، بل حاوية مرنة للمعرفة.

ومع تعمق استخدام الذكاء الاصطناعي التوليدي في أدوات الإنتاجية، توضح هذه الخطوة فكرة أن قيمة المستند لم تعد تكمن في محتواه فقط، بل في مدى سهولة إعادة تشكيل هذا المحتوى ومشاركته وفهمه بطرق متعددة.