الرياض مقراً إقليمياً لـ«لوما»... استراتيجية نحو «ذكاء العالم» لا مجرد توليد المحتوى

الرئيس التنفيذي للشركة: «نبني نماذج تفهم العالم ولا تصنع الصور فقط»

انخفاض تكلفة الإنتاج عبر الذكاء التوليدي يفتح الباب أمام تخصيص إعلامي واسع النطاق من «فيلم لكل فئة» إلى «إعلان لكل فرد» (شاترستوك)
انخفاض تكلفة الإنتاج عبر الذكاء التوليدي يفتح الباب أمام تخصيص إعلامي واسع النطاق من «فيلم لكل فئة» إلى «إعلان لكل فرد» (شاترستوك)
TT

الرياض مقراً إقليمياً لـ«لوما»... استراتيجية نحو «ذكاء العالم» لا مجرد توليد المحتوى

انخفاض تكلفة الإنتاج عبر الذكاء التوليدي يفتح الباب أمام تخصيص إعلامي واسع النطاق من «فيلم لكل فئة» إلى «إعلان لكل فرد» (شاترستوك)
انخفاض تكلفة الإنتاج عبر الذكاء التوليدي يفتح الباب أمام تخصيص إعلامي واسع النطاق من «فيلم لكل فئة» إلى «إعلان لكل فرد» (شاترستوك)

لسنوات، جرى تقديم الذكاء الاصطناعي التوليدي، بوصفه أداة إبداعية، على أنه وسيلة أسرع للكتابة وأكثر إبداعاً للتصميم وأكثر متعةَ للتجربة. لكن وفقاً لأميت جاين، الرئيس التنفيذي والمؤسس المشارك لشركة «لوما إيه آي»، فإن هذا التصور أصبح بالفعل متجاوزاً. ما يتشكل اليوم ليس مجرد تحسين في إنتاج المحتوى، بل فئة جديدة من الذكاء متعدد الوسائط تهدف إلى نمذجة العالم نفسه.

يقول جاين في حديث خاص لـ«الشرق الأوسط» على هامش «منتدى الإعلام السعودي»، في الرياض، إن «معظم العمل في الواقع متعدد الوسائط. و(لوما) إحدى شركتين فقط في العالم (الأخرى هي غوغل) تستهدفان هذا النوع من التعددية».

على عكس أنظمة الذكاء الاصطناعي التقليدية التي تنطلق من اللغة أولاً ثم تُمدَّد لاحقاً إلى الصور أو الفيديو، تقوم «لوما للذكاء الاصطناعي» بتدريب ما يصفه جاين بأنه «عمود فقري موحد» يشمل الصوت والفيديو واللغة والصورة في آنٍ واحد. ويوضح أنه «بدلاً من بناء نموذج لغوي ضخم ثم تعليمه التعامل مع الصور، نحن ندرب بنية واحدة على الصوت والفيديو واللغة والصورة معاً. ندمج منطق اللغة مع معلومات العالم المستمدة من الفيديو والصوت والصور».

الطموح الكامن وراء هذه البنية يتجاوز الفيديو التوليدي ويتعلق ببناء ما يسميه جاين مراراً «ذكاء العالم»، أي أنظمة لا تنتج «بكسلات» فحسب، بل تستدل على العالم المادي.

أميت جاين الرئيس التنفيذي والشريك المؤسس لشركة «لوما» للذكاء الاصطناعي (الشركة)

من الجودة السينمائية إلى الدقة التشغيلية

شهدت نماذج الفيديو التوليدي تقدماً سريعاً خلال العامين الماضيين. ويشير جاين إلى أن نموذج «راي 3» (Ray 3) من «لوما» شكّل نقطة تحول. ويلفت جاين إلى أن (Ray 3) كان أول نموذج فيديو استدلالي في العالم. فبدلاً من توليد أول مخرج محتمل، يقوم النموذج بتقييم بدائل داخلياً قبل إنتاج النتيجة النهائية.

لكن جاين يؤكد أن الجودة البصرية لم تكن سوى المرحلة الأولى، ويقول إنه أمضى عام 2025 بالكامل في بناء هذه البنية التحتية والوصول بالنماذج إلى مرحلة تبدو فيها النتائج جيدة بصرياً وأن عام 2026 هو عام الدقة.

هذا الفرق بين المظهر السينمائي والموثوقية التشغيلية يحدد المرحلة التالية للشركة. ووفقاً لجاين، تنتقل هذه الأنظمة الآن من الترفيه إلى الاستخدامات الصناعية وأنه «سيتم استخدامها في النمذجة والتطبيقات الصناعية». ولتوضيح ذلك يضرب مثالاً بالعمارة قائلاً: «في العمارة لن تسأل فقط: كيف يبدو هذا المنزل في النهار؟ بل ستبني المنازل داخل هذه النماذج. وستُستخدم لتوليد بيانات للروبوتات، ولتطبيقات الرؤية الحاسوبية الصناعية». المغزى من حديث جاين واضحاً وهو أن الفيديو التوليدي يتحول من أداة إبداعية إلى قدرة نظامية.

تجاوُز معادلة الجودة والسرعة والتكلفة

يصف جاين نموذج «Ray 3.14» بأنه أزال المقايضة التقليدية بين الجودة والسرعة والتكلفة، لكنه لا يدّعي الكمال. يعترف بأنه «لا تزال هناك قيود كثيرة». مدة الفيديو لا تزال محدودة بنحو 10 ثوانٍ، مع العمل على تمديدها إلى 15 و20 ثانية. كما أن استمرارية الذكاء لا تزال تحدياً. وينوه صراحةً إلى أن «نماذج الفيديو والصورة هي الأضعف من حيث الذكاء حالياً، على سبيل المثال، عندما تكتب طلباً ثم تحصل على صورة، ينسى النموذج ما كنت تتحدث عنه».

استراتيجية شركة «لوما للذكاء الاصطناعي» هي الانتقال من التوليد الأحادي إلى أنظمة بصرية قائمة على الحوار. ويتصور جاين نوعاً من الاستدلال البصري التفاعلي: «فأنت لا تقول فقط: اصنع لي فيديو عن الحرب العالمية الأولى. بل تريد أن تسأل: ماذا لو لم يُغتل فرانز فرديناند؟ أظهِرْ لي نسخة بديلة من التاريخ». بالنسبة إليه، المستقبل يكمن في «وكلاء ذكاء اصطناعي بصريين تفاعليين» يفهمون السياق، ويتذكرون المحادثات السابقة، ويشاركون المستخدم في بناء السرد. ويرى أن «العصر القادم هو عصر الوكلاء الإبداعيين وأنظمة قادرة على إنجاز العمل من البداية إلى النهاية، وتكون شريكك الإبداعي».

الجيل المقبل من الأنظمة لن يكون مجرد أدوات بل «وكلاء إبداعيين» يعملون شركاء قادرين على تنفيذ العمل من البداية إلى النهاية (شاترستوك)

واقع الحوسبة وراء الذكاء متعدد الوسائط

يتطلب بناء هذا المستوى من الذكاء موارد حوسبية هائلة. يذكر جاين الحاجة إلى نحو 30 ألف وحدة معالجة رسومية لتدريب هذه النماذج. وتكلفة التشغيل تقارب 97 ألف دولار في الساعة. ويصف أثر الطاقة بأرقام ملموسة كمئات الميغاواط من القدرة الحوسبية وبنية تحتية تعادل مدينة متوسطة الحجم.

لكن، من وجهة نظره، هذا الاستثمار ضروري وأنه «عندما تفعل ذلك، تحصل على نموذج واحد يمتلك ذكاء العالم، ومنطق البشر، والقدرة على توليد أي نوع من المعلومات التي يريدها البشر».

كما يؤثر الوصول إلى حوسبة سيادية واسعة النطاق في تموضع «لوما» الجغرافي. فقد أعلنت الشركة مؤخراً افتتاح مكتب في الرياض، ليكون مقرها الإقليمي لمنطقة الشرق الأوسط وشمال أفريقيا، دعماً للشراكات المحلية وتطوير نماذج ذكاء اصطناعي عربية عبر مبادرة «هيوماين كرييت HUMAIN Create» في السعودية.

يرى جاين أن القرار استراتيجي والمنطقة سوق واحدة بلغة واحدة. وبالمقارنة مع أوروبا المجزَّأة تنظيمياً ولغوياً، يرى أن الشرق الأوسط يوفر تماسكاً وفرص توسُّع أكبر. ويضيف أن السعودية أكبر سوق في المنطقة، وأسرع اقتصاد نمواً، ولديها التزام ضخم بالذكاء الاصطناعي. ويشير إلى مبادرات البيانات السيادية ومشاريع الحوسبة الكبرى بوصفها دليلاً على طموح طويل الأمد.

التعاون مع «هيوماين» يتيح لـ«لوما» الوصول إلى حوسبة سيادية واسعة النطاق تدعم تدريب نماذج متعددة الوسائط على مستوى صناعي (شاترستوك)

تمثيل الثقافات وخطر المحو الرقمي

يلفت جاين خلال حديثه مع «الشرق الأوسط» إلى مسألة تمثيل الثقافات، حيث «تم تجاوز نقطة التحول بالنسبة إلى النصوص في يونيو (حزيران) 2024، وأن أكثر من 50 في المائة من النصوص المنشورة على الإنترنت اليوم تُنتجها نماذج لغوية». ويتوقع أن يحدث الأمر ذاته بسرعة أكبر في الوسائط البصرية بسبب ارتفاع تكلفة الإنتاج التقليدي. ويضيف أنه «إذا اتَّبَعَتَ المال، فالإعلام التوليدي سيتبنى أسرع من النص».

لكنَّ تدريب النماذج على بيانات الإنترنت العالمية قد يعزز الثقافات المهيمنة ويهمش الأخرى. ويُحذِّر من أن «ثقافات مثل الشرق الأوسط، حيث البيانات أقل بكثير مقارنةً بالولايات المتحدة أو الهند، قد تُمحى من الإنترنت إذا لم ندرِّب النماذج لتمثل هذه الثقافات».

ومن خلال «HUMAIN Create» تخطط «لوما» لتطوير نماذج باللغة العربية وببيانات إقليمية تعكس السياق المحلي. كما سيعمل مكتب الرياض على توظيف مهندسي ذكاء اصطناعي ومبدعين لدعم الانتشار الإقليمي. وبرأي جاين، «هذا الجهد مهم للغاية، وإلا فإن هذه الثقافات ستنقرض رقمياً».

المواهب لا الخوف هي العائق

غالباً ما يتركز النقاش العام حول فقدان الوظائف الإبداعية بسبب الذكاء الاصطناعي. لكن جاين يرى المشكلة معاكسة وأن «أكبر قيد هو عدد الأشخاص الذين يعرفون كيفية استخدام هذه الأنظمة، ولا نستطيع إيجاد فنانين بالسرعة الكافية». فالطلب على المبدعين المتخصصين في الذكاء الاصطناعي التوليدي في ازدياد.

تشغّل «لوما» استوديو «دريم لاب Dream Lab» في مدينة لوس أنجليس، ويضم ما يسميه جين «مبدعين ميدانيين» يجمعون بين مهارات السرد وإتقان الأدوات التوليدية. كما تعمل الشركة مع شركاء عالميين لتدريب مئات الفنانين شهرياً. يرى جاين أن «الفنانين الذين يتجاهلون الذكاء الاصطناعي يفعلون ذلك على مسؤوليتهم».

نقص المواهب القادرة على استخدام أدوات التوليد يمثل العائق الأكبر أمام التوسع المؤسسي وليس الخوف من فقدان الوظائف (شاترستوك)

من الندرة إلى التخصيص الفائق

ربما يكمن الأثر الأكبر للفيديو التوليدي في معادلة الحجم. تكلفة الإنتاج التقليدي تتراوح بين آلاف وعشرات آلاف الدولارات للدقيقة الواحدة. يقول جاين إن «الذكاء الاصطناعي التوليدي يكلّف 10 دولارات للدقيقة، أو 100 دولار للدقيقة والتكلفة لا تُقارن». هذا الفارق يفتح نماذج توزيع جديدة. بدلاً من إنتاج عشرة أفلام كبرى، يمكن إنتاج مئات المشاريع المتخصصة. وبدلاً من إعلان واحد لكل شريحة، يمكن إنشاء إعلان لكل فرد. ويرى جاين أن «الحلم الأبدي للإعلان كان إعلاناً لكل شخص، والذكاء الاصطناعي التوليدي يجعل ذلك ممكناً اقتصادياً لأول مرة».

عتبة الروبوتات

في النهاية، يرى جاين أن الذكاء متعدد الوسائط لا يتعلق بالإعلام فقط، بل بالروبوتات، وأنه «إذا لم نساعد على بناء روبوتات عامة خلال العامين المقبلين، فقد فشلنا».

ويرى أن معظم شركات الروبوتات الحالية تعتمد بشكل مفرط على النماذج اللغوية، بينما البشر يعملون من خلال نماذج ذهنية للعالم. وبحلول نهاية 2026، يتوقع وجود أنظمة قادرة على إنتاج بيانات غير محدودة لتدريب الروبوتات، أما بحلول 2027 فيتوقع جاين نشر أنظمة قادرة على تنفيذ مهام فعلية.

الخيط الناظم في رؤية جاين هو التوسع في الحوسبة والتمثيل الثقافي والإنتاج والذكاء المتجسد. الفيديو التوليدي لا يتطور فقط نحو الثقة المؤسسية، بل يُعاد تعريفه بوصفه بنية تحتية للصناعة والتعليم والإعلان، وربما الروبوتات. ويبقى السؤال: هل ستتمكن المجتمعات والمؤسسات من التوسع معه؟


مقالات ذات صلة

دراسة تختبر قدرة الذكاء الاصطناعي على تقليد البشر في المحادثة

تكنولوجيا بعض نماذج اللغة الحديثة بدت بشرية بدرجة جعلت المشاركين يختارونها أحياناً على أنها الطرف الإنسان

دراسة تختبر قدرة الذكاء الاصطناعي على تقليد البشر في المحادثة

تظهر دراسة جديدة أن بعض نماذج الذكاء الاصطناعي باتت قادرة على محاكاة المحادثة البشرية وإرباك المشاركين في اختبار «تورينغ».

نسيم رمضان (لندن)
تكنولوجيا «AI Overviews» ميزة الملخصات المدعومة بالذكاء الاصطناعي تشجع على زيارة عدد أكبر من المواقع الإلكترونية (غوغل)

حيلة بسيطة لإخفاء ملخصات الذكاء الاصطناعي من بحث «غوغل»

حيلة غير رسمية قد تقلل ظهور ملخصات الذكاء الاصطناعي في «غوغل»، لكنها لا تعطّل الميزة نهائياً.

نسيم رمضان (لندن)
عالم الاعمال جانب من عمليات «موبايلي» في موسم الحج (الشرق الأوسط)

توجهات في السعودية لرفع كفاءة شبكات الاتصالات في موسم الحج عبر حلول الذكاء الاصطناعي

تُظهر السعودية في كل موسم حج اتساع قدراتها التقنية وكفاءة بنيتها التحتية الرقمية، عبر إدارة واحد من أكبر التجمعات البشرية في العالم ضمن نطاق جغرافي محدود.

«الشرق الأوسط» (مكة المكرمة)
تكنولوجيا أهمية التقنية تبرز في عمليات البحث والإنقاذ وتفتيش المنشآت الصناعية والمناطق التي يصعب على البشر دخولها (شاترستوك)

تقنية تساعد الطائرات المسيّرة على تفادي العوائق في البيئات الخطرة

التقنية الجديدة تسمح للطائرات المسيّرة باختيار مسارات أسرع وأكثر أماناً لتفادي العوائق داخل البيئات الخطرة والمعقدة.

نسيم رمضان (لندن)
تكنولوجيا يقدم الكومبيوتر تصميماً متيناً ومنافذ متعددة تلبي جميع الاحتياجات

«أيسر بريديتور هيليوس»... توازن بين القوة الفائقة والذكاء الاصطناعي التوليدي

مجهز بأدوات ذكاء اصطناعي مبتكرة وقدرات حوسبة تضاهي الكمبيوترات المكتبية

خلدون غسان سعيد (جدة)

دراسة تختبر قدرة الذكاء الاصطناعي على تقليد البشر في المحادثة

بعض نماذج اللغة الحديثة بدت بشرية بدرجة جعلت المشاركين يختارونها أحياناً على أنها الطرف الإنسان
بعض نماذج اللغة الحديثة بدت بشرية بدرجة جعلت المشاركين يختارونها أحياناً على أنها الطرف الإنسان
TT

دراسة تختبر قدرة الذكاء الاصطناعي على تقليد البشر في المحادثة

بعض نماذج اللغة الحديثة بدت بشرية بدرجة جعلت المشاركين يختارونها أحياناً على أنها الطرف الإنسان
بعض نماذج اللغة الحديثة بدت بشرية بدرجة جعلت المشاركين يختارونها أحياناً على أنها الطرف الإنسان

لم يعد اختبار آلان تورينغ عام 1950 سؤالاً نظرياً من تاريخ علوم الحاسوب. تعيد دراسة جديدة منشورة في دورية «Proceedings of the National Academy of Sciences» اختبار الفكرة في سياق نماذج اللغة الكبيرة، وخلُصت إلى أن بعض هذه النماذج يمكن أن تبدو بشرية إلى درجة تجعل المشاركين يختارونها أحياناً على أنها الإنسان الحقيقي في المحادثة.

الفكرة الأصلية للاختبار تعود إلى آلان تورينغ: هل تستطيع آلة أن تقلد المحادثة البشرية بطريقة تجعل الشخص الذي يحاورها غير قادر على التمييز بينها وبين إنسان؟ الجديد هنا أن الباحثين لم يكتفوا بسؤال عام عن قدرة الذكاء الاصطناعي على الإجابة، بل اختبروا قدرته على الظهور على أنه بشر في محادثات قصيرة ومباشرة.

محادثة ثلاثية

اعتمدت الدراسة على نسخة ثلاثية من اختبار «تورينغ»، حيث كان المشارك يتحدث في كل تجربة وفي الوقت نفسه مع طرفين عبر واجهة نصية. أحدهما إنسان والآخر نموذج ذكاء اصطناعي. وبعد خمس دقائق من المحادثة، كان عليه أن يقرر أي الطرفين هو الإنسان. وفي تجربة تكرار منفصلة، امتدت بعض المحادثات إلى 15 دقيقة.

شارك في التجارب ما يقارب 500 شخص من مجموعتين مستقلتين. طلاب من جامعة كاليفورنيا في سان دييغو ومشاركون عبر منصة «بروليفيك» (Prolific) المخصصة للأبحاث المدفوعة. هذا التصميم كان مهماً لأنه حاول اختبار النتيجة عبر أكثر من عينة، لا داخل مجموعة واحدة فقط.

نماذج أكثر إقناعاً

اختبر الباحثون أربعة أنظمة منها «GPT - 4.5» و«LLaMa - 3.1 - 405B» على أنها نماذج حديثة، إلى جانب «GPT - 4o» و«ELIZA» كونها خطوط مقارنة أقدم. وكانت النتيجة الأبرز أن «GPT - 4.5» اختير على أنه الإنسان في 73 في المائة من الحالات عندما أُعطي تعليمات لتبني شخصية بشرية معينة. أما «LLaMa - 3.1 - 405B» فاختير على أنه الإنسان في 56 في المائة من الحالات، وهي نسبة عَدّها الباحثون غير قابلة للتمييز إحصائياً عن البشر الذين قورن بهم النموذج.

في المقابل، كانت نتائج الأنظمة الأقدم أضعف بكثير. فقد اختير «ELIZA» على أنه الإنسان في نحو 23 في المائة من الحالات، بينما بلغت النسبة لـ«GPT - 4» نحو 21 في المائة. وهذا يعني أن النجاح لم يكن عاماً لكل الأنظمة، بل ارتبط بنماذج محددة وبطريقة إعدادها للمحادثة.

نجاح النماذج ارتبط بتوجيهها لتبني شخصية بشرية لا بمجرد قدرتها العامة على الإجابة عن الأسئلة (أ.ف.ب)

قوة الشخصية المصطنعة

النقطة الحاسمة في الدراسة أن النماذج لم تنجح فقط لأنها تعرف معلومات كثيرة. النجاح جاء عندما طُلب منها تبني «شخصية» بشرية محددة، بأسلوب في الحديث ونبرة وتفاصيل اجتماعية تجعلها أقل مثالية وأكثر شبهاً بالبشر.

عندما أُزيلت هذه التعليمات التفصيلية، تراجعت قدرة النماذج على الظهور كبشر بوضوح. فقد انخفضت نسبة اختيار «GPT - 4.5» إلى 36 في المائة، و«LLaMa - 3.1» إلى 38 في المائة. وهذا يشير إلى أن القدرة موجودة، لكنها تحتاج غالباً إلى توجيه واضح حول كيفية التصرف كبشر، لا مجرد القدرة العامة على الإجابة.

بكلمات أخرى، ما جعل النموذج مقنعاً لم يكن التفوق في المنطق أو الرياضيات، بل محاكاة السلوك الاجتماعي على أنه نبرة طبيعية وقدر من الدعابة وإجابات غير كاملة أحياناً وتردد أو بساطة تشبه ما يحدث في محادثة بشرية عادية.

ماذا يقيس الاختبار؟

تطرح الدراسة سؤالاً مهماً حول معنى اختبار «تورينغ» اليوم. فقد كان يُنظر إليه تاريخياً كونه اختباراً لقدرة الآلة على مضاهاة الذكاء البشري. لكن مع نماذج تستطيع الإجابة بسرعة عن عدد كبير من الأسئلة، يصبح الاختبار أقرب إلى قياس «الشبه البشري» في المحادثة، لا الذكاء بالمعنى العميق أو الفهم الحقيقي.

هذا الفرق مهم لأن نجاح النموذج في إقناع شخص بأنه إنسان لا يعني بالضرورة أنه يفهم العالم كما يفهمه الإنسان، أو يمتلك وعياً أو نية. لكنه يعني أن قدرته على تقليد أنماط التفاعل البشري أصبحت قوية بما يكفي لإرباك المستخدمين في محادثة قصيرة.

الدراسة تفتح أسئلة مهمة حول الثقة والشفافية خصوصاً عندما لا يعرف المستخدم إن كان يتحدث مع إنسان أم نظام آلي

مخاطر الثقة والخداع

أهمية النتيجة لا تقف عند حدود المختبر. فإذا كان المستخدم العادي لا يستطيع دائماً التمييز بين الإنسان والنموذج، فإن ذلك يفتح أسئلة مباشرة حول الثقة على الإنترنت. فقد تُستخدم هذه القدرة في خدمة مفيدة، مثل دعم العملاء أو التعليم أو المساعدة الشخصية. لكنها قد تُستخدم أيضاً في الاحتيال، أو التلاعب، أو حملات الإقناع السياسي والتجاري، خصوصاً إذا لم يكن الطرف الآخر يعرف أنه يتحدث مع نظام آلي.

يشير الباحثون إلى أن نماذج اللغة الكبيرة يمكن دفعها بسهولة نسبية إلى الظهور على أنها بشر عندما تُعطى التعليمات المناسبة. وهذا يجعل الشفافية أكثر أهمية، خصوصاً في المنصات التي يتفاعل فيها المستخدمون مع حسابات لا يعرفون هويتها الحقيقية.

ما الذي لا تقوله الدراسة؟

لا تقول الدراسة إن الذكاء الاصطناعي أصبح مثل الإنسان، ولا أنها تثبت وجود وعي أو فهم داخلي لدى النماذج، بل إن بعض النماذج الحديثة، في ظروف اختبار محددة، استطاعت تقليد المحادثة البشرية بما يكفي لأن يخطئ المشاركون في تحديد الطرف البشري. لذلك، القيمة الحقيقية للبحث ليست في إعلان انتصار الآلة على الإنسان، بل في توضيح أن الحدود بين المحادثة البشرية والمحادثة الاصطناعية أصبحت أقل وضوحاً. وهذا يجعل الحاجة أكبر إلى قواعد إفصاح أوضح، وأدوات تحقق أفضل، ووعي عام بأن الطرف المقابل في المحادثة الرقمية قد لا يكون دائماً إنساناً.


حيلة بسيطة لإخفاء ملخصات الذكاء الاصطناعي من بحث «غوغل»

«AI Overviews» ميزة الملخصات المدعومة بالذكاء الاصطناعي تشجع على زيارة عدد أكبر من المواقع الإلكترونية (غوغل)
«AI Overviews» ميزة الملخصات المدعومة بالذكاء الاصطناعي تشجع على زيارة عدد أكبر من المواقع الإلكترونية (غوغل)
TT

حيلة بسيطة لإخفاء ملخصات الذكاء الاصطناعي من بحث «غوغل»

«AI Overviews» ميزة الملخصات المدعومة بالذكاء الاصطناعي تشجع على زيارة عدد أكبر من المواقع الإلكترونية (غوغل)
«AI Overviews» ميزة الملخصات المدعومة بالذكاء الاصطناعي تشجع على زيارة عدد أكبر من المواقع الإلكترونية (غوغل)

لم تعد صفحة البحث في «غوغل» تشبه تماماً ما اعتاده المستخدمون لسنوات طويلة. فبدلاً من عرض روابط تقليدية فقط، بدأت الشركة تدفع بميزة «AI Overviews» إلى واجهة النتائج، حيث تظهر ملخصات مولدة بالذكاء الاصطناعي في أعلى الصفحة في بعض عمليات البحث.

تقدم «غوغل» هذه الميزة بوصفها طريقة أسرع للحصول على خلاصة أولية عن الموضوع، مع روابط تساعد المستخدم على التوسع في القراءة. وتقول الشركة إن «AI Overviews» توفر لمحة عن المعلومات الأساسية حول سؤال أو موضوع معين، مع روابط لاستكشاف المزيد على الويب.

لكن هذه التجربة لا تناسب جميع المستخدمين. فهناك من يفضّل الوصول مباشرة إلى الروابط الأصلية، وقراءة المصادر بنفسه، بدلاً من البدء بملخص آلي قد يختصر السياق أو يضع إجابة جاهزة قبل النتائج التقليدية.

حيلة «-ai»

حسب تقرير نشرته مواقع تقنية، يمكن لبعض المستخدمين تقليل ظهور ملخصات الذكاء الاصطناعي في نتائج البحث عبر إضافة معامل بحث بسيط إلى نهاية الاستعلام، وهو: «-ai».

الفكرة تقوم على استخدام إحدى أدوات البحث القديمة في «غوغل»، المعروفة باسم معاملات البحث أو «Search Operators» التي تسمح بتضييق نطاق النتائج أو استبعاد كلمات معينة.

مثلاً، بدلاً من البحث عن: «iPhone 18 release date» يمكن كتابة: «iPhone 18 release date -ai».

هنا يتعامل محرك البحث مع «-ai» بوصفه أمراً لاستبعاد النتائج المرتبطة بكلمة «ai». ووفق التقرير، قد يؤدي ذلك في بعض الحالات إلى ظهور صفحة أقرب إلى نتائج البحث التقليدية، من دون ملخص الذكاء الاصطناعي في الأعلى.

إضافة «-ai» إلى كلمات البحث قد تقلل ظهور ملخصات الذكاء الاصطناعي في بعض الحالات (غوغل)

ليست إعداداً دائماً

الأهم أن هذه الطريقة ليست إعداداً رسمياً لإيقاف «AI Overviews» بالكامل، وليست حلاً دائماً داخل حساب المستخدم. هي مجرد تعديل يدوي تجب إضافته في كل عملية بحث يريد فيها المستخدم تجنب ظهور الملخصات الآلية.

كما أنها ليست مضمونة في كل الحالات. فنتائج البحث تتغير حسب البلد واللغة ونوع السؤال وسياسات «غوغل» في عرض ميزات الذكاء الاصطناعي. لذلك من الأدق وصفها بأنها حيلة مؤقتة أو طريقة التفاف بسيطة، لا خيار رسمياً لإلغاء الميزة.

هذا التفصيل مهم، لأن بعض المستخدمين قد يظنون أن إضافة «-ai» تعني تعطيل الذكاء الاصطناعي داخل البحث كلياً. عملياً، هي فقط طريقة لاستبعاد كلمة معينة من الاستعلام، وقد يكون أثرها الجانبي أن ملخصات الذكاء الاصطناعي لا تظهر في بعض النتائج.

لماذا يريد البعض إخفاءها؟

الاعتراض على ملخصات الذكاء الاصطناعي لا يعني بالضرورة رفض التقنية نفسها. بالنسبة إلى كثير من المستخدمين، المشكلة في ترتيب التجربة. فالبحث التقليدي كان يمنحهم قائمة مصادر، ويختارون منها ما يريدون قراءته. أما الملخصات الآلية فتضع تفسيراً جاهزاً قبل الروابط، ما قد يدفع المستخدم إلى الاكتفاء بالخلاصة بدلاً من زيارة المواقع.

هذا يثير أسئلة أوسع حول طريقة الوصول إلى المعرفة على الإنترنت. هل يريد المستخدم إجابة سريعة، أم يريد مصادر متعددة؟ وهل يجب أن يكون الذكاء الاصطناعي في مقدمة البحث دائماً، أم خياراً يمكن تشغيله عند الحاجة؟

تقول «غوغل» إن «AI Overviews» صُمّمت لمساعدة المستخدمين على فهم جوهر الموضوعات المعقدة بسرعة، وإنها توفر نقطة انطلاق لاستكشاف الروابط الأخرى. كما تشير في وثائقها إلى أن الميزة تظهر في الاستعلامات التي ترى أنها تضيف قيمة تتجاوز ما تقدمه نتائج البحث العادية.

يظهر شعار «غوغل» خلال مؤتمر المطورين السنوي «غوغل آي/أو» في «أمهيثياتر» الواقع على الشاطئ في ماونتن فيو بكاليفورنيا (أ.ف.ب)

عودة إلى البحث القديم

الحيلة تعكس رغبة بعض المستخدمين في استعادة تجربة بحث أبسط. ليس بالضرورة لأنهم يرفضون الذكاء الاصطناعي، وإنما لأنهم يريدون التحكم في لحظة ظهوره. ففي بعض الأسئلة قد يكون الملخص السريع مفيداً. وفي حالات أخرى، خصوصاً عند البحث عن أخبار ومراجعات ومعلومات حساسة أو مصادر أصلية، قد يفضّل المستخدم رؤية الروابط مباشرة.

معاملات البحث ليست جديدة في «غوغل»، وقد استخدمت لسنوات لتحديد عبارات معينة بعلامات الاقتباس، أو استبعاد كلمات بعلامة الطرح، أو البحث داخل موقع محدد. الجديد هنا أن هذه الأدوات القديمة أصبحت تُستخدم لمقاومة طبقة جديدة من البحث تعتمد على الذكاء الاصطناعي.

سؤال أكبر حول التحكم

ظهور هذه الحيلة يسلط الضوء على نقطة أوسع في علاقة المستخدمين بمحركات البحث. مع إدخال الذكاء الاصطناعي في الواجهة الأساسية، يصبح السؤال أقل ارتباطاً بقدرة التقنية وأكثر ارتباطاً بحق المستخدم في اختيار شكل التجربة.

فإذا كانت «غوغل» ترى أن الملخصات الآلية تجعل البحث أسرع وأسهل، فإن بعض المستخدمين يرون أن السرعة لا تكفي دائماً. أحياناً يحتاجون إلى السياق والمصدر والمقارنة بين وجهات نظر مختلفة. لذلك قد تستمر الحاجة إلى أدوات تمنح المستخدم قدرة أكبر على تحديد ما يريد رؤيته سواء إجابة مولدة بالذكاء الاصطناعي، أم نتائج ويب تقليدية، أم مزيجاً بين الاثنين.

Your Premium trial has endedYour Premium trial has endedYour Premium trial has ended


تقنية تساعد الطائرات المسيّرة على تفادي العوائق في البيئات الخطرة

أهمية التقنية تبرز في عمليات البحث والإنقاذ وتفتيش المنشآت الصناعية والمناطق التي يصعب على البشر دخولها (شاترستوك)
أهمية التقنية تبرز في عمليات البحث والإنقاذ وتفتيش المنشآت الصناعية والمناطق التي يصعب على البشر دخولها (شاترستوك)
TT

تقنية تساعد الطائرات المسيّرة على تفادي العوائق في البيئات الخطرة

أهمية التقنية تبرز في عمليات البحث والإنقاذ وتفتيش المنشآت الصناعية والمناطق التي يصعب على البشر دخولها (شاترستوك)
أهمية التقنية تبرز في عمليات البحث والإنقاذ وتفتيش المنشآت الصناعية والمناطق التي يصعب على البشر دخولها (شاترستوك)

قد تكون الطائرات المسيّرة مفيدةً في اللحظات الأولى بعد الزلازل أو الكوارث، خصوصاً عندما تحتاج فرق الإنقاذ إلى خريطة سريعة لمبنى منهار أو منطقة يصعب دخولها. لكن تشغيل روبوت طائر داخل بيئة غير معروفة ليس مهمة بسيطة. عليه أن يصل إلى هدفه بسرعة، ويتجنَّب العوائق المفاجئة، ويحافظ في الوقت نفسه على مسار سلس لا يستهلك طاقةً أو يعرِّضه للاصطدام.

مسار في أجزاء من الثانية

طوَّر باحثون من معهد ماساتشوستس للتكنولوجيا وجامعة بنسلفانيا نظاماً جديداً لتخطيط مسار الروبوتات يحمل اسم «مايتي (MIGHTY)». الفكرة الأساسية هي تمكين الطائرة المسيّرة من تعديل مسارها خلال أجزاء قليلة من الثانية عند ظهور عوائق، من دون أن تفقد اتجاهها نحو الهدف أو تضطر إلى حركات حادة وغير مستقرة.

النظام مُصمَّم ليعمل في الزمن الفعلي باستخدام الحاسوب والحساسات الموجودة على الروبوت نفسه. وهذا مهم لأنَّ الروبوت قد يعمل في بيئة بعيدة عن محطة تحكم أو شبكة اتصال مستقرة، كما في عمليات البحث والإنقاذ أو التفتيش الصناعي داخل منشآت معقدة.

التقنية الجديدة تساعد الطائرات المسيّرة على تعديل مسارها بسرعة عند ظهور عوائق مفاجئة (الجامعة)

صعوبة تخطيط المسار

تخطيط المسار هو البرنامج الذي يقرِّر كيف ينتقل الروبوت من نقطة إلى أخرى بأمان. تبدو المهمة بسيطةً على الورق، لكنها تصبح شديدة التعقيد عندما تتحرَّك الطائرة داخل مكان مليء بالعوائق أو عندما تظهر عقبات لم تكن موجودة في الخريطة الأولية. كثير من الأنظمة الحالية تواجه مفاضلةً واضحةً. بعض الحلول التجارية تستطيع توليد مسارات سلسة وسريعة، لكنها مكلفة وقد تعتمد على برمجيات مغلقة. أما البدائل مفتوحة المصدر، فقد تكون أقل أداءً أو أصعب في الاستخدام. لذلك حاول الباحثون بناء نظام مفتوح المصدر يقدِّم جودةً قريبةً من الأنظمة المتقدمة، مع قدرة على العمل مباشرة على الروبوت.

يقول كوتا كوندو، طالب الدراسات العليا في هندسة الطيران والفضاء في «MIT» والمؤلف الرئيسي للبحث، إن النظام يحقِّق أداءً مماثلاً أو أفضل باستخدام أدوات مفتوحة المصدر فقط، ما يتيح للباحثين والطلاب والشركات استخدامه بحرية. ويرى أنَّ إزالة حاجز التكلفة يمكن أن توسِّع دائرة الجهات القادرة على تطوير أنظمة تخطيط حركة عالية الأداء.

المشكلة في الوقت الثابت

تعتمد بعض أنظمة التخطيط على خطوة أولية تحدِّد الزمن المتوقِّع للوصول من نقطة البداية إلى الهدف. بعد ذلك، تبحث عن أفضل مسار ضمن هذا الزمن الثابت. هذه الطريقة تسهل الحساب، لكنها قد تخلق مشكلة عملية: إذا احتاجت الطائرة إلى الالتفاف حول عائق كبير، فقد تُجبر على زيادة سرعتها بشدة كي تصل في الوقت المحدد.

هذا السلوك قد يجعل تجنب العقبات أصعب، خصوصاً في البيئات التي تظهر فيها عوائق غير متوقعة. فالروبوت لا يحتاج فقط إلى مسار قصير، بل إلى مسار قابل للتنفيذ فعلياً، يأخذ في الاعتبار السرعة والتسارع وزمن الوصول.

الاختبارات أظهرت قدرة الطائرات المسيّرة على تفادي العوائق بسرعة عالية باستخدام برمجيات مفتوحة المصدر (شاترستوك)

طريقة رياضية مختلفة

يعالج «مايتي» هذه المشكلة عبر استخدام تقنية رياضية تُسمى «Hermite spline». بدلاً من حساب المسار أولاً ثم محاولة ملاءمته مع زمن ثابت، يعمل النظام على تحسين المسار والزمن معاً في خطوة واحدة. الهدف هو الوصول إلى مسار سلس وقابل للتحكم، مع تقليل زمن الرحلة من دون التضحية بالأمان. لكن تحسين المسار والزمن معاً يجعل المسألة الحسابية أكبر وأكثر صعوبة. لحل ذلك، لا يبدأ النظام من الصفر في كل مرة. بدلاً من ذلك، ينشئ تخميناً أولياً لمسار مناسب، ثم يحسنه تدريجياً عبر عملية تكرارية، مستفيداً من خريطة للمشهد تبنيها حساسات الليدار على الطائرة. هذا يسمح له بالاستجابة للعوائق الجديدة بسرعة، مع الحفاظ على مسار أكثر سلاسة.

نتائج أسرع من الطرق الحالية

في الاختبارات المحاكاة، احتاج «مايتي» إلى نحو 90 في المائة فقط من وقت الحوسبة الذي تتطلبه طرق متقدِّمة أخرى، بينما وصل إلى الهدف بأمان وبسرعة أعلى بنحو 15 في المائة. وفي الاختبارات على روبوتات حقيقية، وصلت الطائرة إلى سرعة 6.7 متر في الثانية مع تجنب جميع العوائق التي ظهرت في مسارها. هذه الأرقام مهمة لأنَّها توضِّح أنَّ النظام لا يكتفي بتحسين نظري في المختبر. فالتخطيط السريع لا يكون مفيداً إذا أنتج مسارات غير واقعية، والمسار الآمن لا يكفي إذا كان بطيئاً جداً في بيئة طارئة. القيمة هنا في الجمع بين السرعة والسلامة وقابلية التنفيذ على أجهزة الروبوت نفسه.

تطبيقات خارج المختبر

رغم أنَّ المثال الأبرز يتعلق بالطائرات المسيّرة في عمليات البحث والإنقاذ، فإنَّ الاستخدامات المحتملة أوسع. يمكن للنظام أن يساعد على توصيل الطرود داخل المدن، حيث تحتاج الطائرات إلى تفادي المباني والأسلاك والأشخاص والعوائق المتحركة. كما يمكن استخدامه في تفتيش المنشآت الصناعية المعقدة، مثل توربينات الرياح أو الهياكل التي يصعب وصول الإنسان إليها.

في هذه الحالات، لا يكفي أن يعرف الروبوت وجهته. عليه أن يتعامل مع بيئة قد تتغيَّر باستمرار، وأن يعدِّل مساره بسرعة من دون الاعتماد على حاسوب خارجي أو برنامج مكلف. لذلك تبدو ميزة المصدر المفتوح مهمة، لأنَّها قد تسمح بتبني النظام في مختبرات وشركات ومؤسسات لا تملك ميزانيات كبيرة للبرمجيات التجارية.

دافع إنساني وراء البحث

يرتبط العمل أيضاً بدافع شخصي لدى الباحث كوندو. فقد كان طفلاً عندما وقع حادث محطة فوكوشيما دايتشي النووية بعد زلزال شرق اليابان الكبير. تابع حينها الأخبار عن العمال الذين اضطروا إلى دخول مناطق خطرة لتقييم الوضع واحتواء الأضرار. ويقول إنَّ تلك التجربة جعلته مهتماً بتطوير روبوتات مستقلة تستطيع دخول البيئات الديناميكية والخطرة ثم العودة بالمعلومات، بينما يبقى البشر بعيدين عن الخطر.

هذا البعد يوضِّح سبب التركيز على الروبوتات القادرة على العمل في ظروف غير مثالية. فالتطبيقات الأكثر حساسية، مثل الكوارث أو البيئات الصناعية الخطرة، لا تسمح غالباً بالاعتماد على إعدادات مخبرية منظمة أو اتصالات مستقرة أو تدخل بشري مستمر.

نحو روبوتات متعددة

لا يزال النظام في مرحلة بحثية، رغم النتائج الواعدة. ويخطِّط الباحثون لتحسين «مايتي» بحيث يمكن استخدامه للتحكم في روبوتات عدة في الوقت نفسه، مع إجراء مزيد من تجارب الطيران في بيئات أصعب. كما يأمل الفريق في تطوير النظام المفتوح المصدر بناءً على ملاحظات المستخدمين. ويرى دافيدي سكاراموتسا، مدير مجموعة الروبوتات والإدراك في جامعة زيوريخ، والذي لم يشارك في البحث، أنَّ النظام يقدِّم مساهمةً مهمةً في الملاحة الرشيقة للروبوتات، لأنَّه يعيد النظر في طريقة تمثيل المسار نفسه. وبحسب رأيه، فإنَّ تحسين شكل المسار، والتوقيت، والسرعة، والتسارع، معاً تمنح الروبوتات حريةً أكبر في حساب حركات سريعة وقابلة للتنفيذ داخل البيئات المزدحمة.