«سورا» من «أوبن إيه آي» لإنشاء فيديوهات من أوامر نصية

تبلغ مدة الفيديو دقيقة بدقة 1080 بكسلاً

يمكن لنموذج «سورا» توليد مشاهد تشبه الأفلام بدقة قدرها 1080 بكسلاً (أوبن إيه آي)
يمكن لنموذج «سورا» توليد مشاهد تشبه الأفلام بدقة قدرها 1080 بكسلاً (أوبن إيه آي)
TT

«سورا» من «أوبن إيه آي» لإنشاء فيديوهات من أوامر نصية

يمكن لنموذج «سورا» توليد مشاهد تشبه الأفلام بدقة قدرها 1080 بكسلاً (أوبن إيه آي)
يمكن لنموذج «سورا» توليد مشاهد تشبه الأفلام بدقة قدرها 1080 بكسلاً (أوبن إيه آي)

تمثل تقنية «سورا (Sora)» الجديدة من «أوبن إيه آي» قفزة غير عادية في عالم الذكاء الاصطناعي، لا سيما في مجال تحويل النص إلى فيديو. تم تصميم هذه التقنية المبتكرة لدخول عصر جديد من إنشاء محتوى الفيديو، مما يتيح إنشاء مقاطع فيديو واقعية للغاية ومبتكرة تصل مدتها إلى دقيقة واحدة عبر تعليمات نصّية بسيطة. وبفضل هذه القدرة، يُعد «سورا» مثالاً رائعاً على إمكانات الذكاء الاصطناعي في إحداث نقلة مهمة في إنشاء الوسائط الرقمية. على سبيل المثال تم إعطاء «سورا» التعليمات التالية:

«امرأة أنيقة تسير في أحد شوارع طوكيو المليئة بالنيون المتوهج الدافئ ولافتات المدينة المتحركة. ترتدي سترة جلدية سوداء، وفستاناً أحمر طويلاً، وحذاءً أسود، وتحمل محفظة سوداء. إنها ترتدي النظارات الشمسية وتضع أحمر الشفاه. إنها تمشي بثقة وبشكل عرضيّ. الشارع رطب وعاكس، مما يخلق تأثير مرآة للأضواء الملونة. يتجول الكثير من المشاة». وهكذا كانت النتيجة (من موقع «أوبن إيه آي»):

القدرات المبتكرة والتحديات

يستطيع «سورا» إنشاء مشاهد معقدة تتميز بشخصيات متعددة، وأنواع معينة من الحركة، وسيناريوهات مفصلة، ​​كل ذلك مع فهم الفروق الدقيقة المضمَّنة في مطالبة المستخدم. كما أن إحدى الميزات البارزة هي قدرة «سورا» على إنشاء فيديو كامل دفعة واحدة، وبالتالي التخلص من التناقضات، مثل التغييرات في المظهر عندما تتحرك الأهداف خارج نطاق الرؤية.

إلا أن النموذج لا يخلو من نقاط الضعف. على سبيل المثال، قد يُصوَّر شخص ما وهو يأخذ قضمة من تفاحة، ولكن قد لا تظهر علامة العضّ على التفاحة بعد ذلك. أيضاً قد يواجه «سورا» صعوبة في التعامل مع التفاصيل المكانية والاتجاهات، مثل عدم التمييز بين اليسار واليمين، أو صعوبة وصف أحداث المشاهد التي تتكشف بمرور الوقت مثل الالتزام بمسار معين للكاميرا.

مثال آخر للنتيجة التي تولّدها تقنية «سورا» كان هذا الفيديو (من موقع «أوبن إيه آي») حيث طُلب منه تحديداً ما يلي:

«تواجه الكاميرا المباني الملونة مباشرةً في بورانو بإيطاليا. يبدو كلب دلماسي رائع من خلال نافذة في مبنى في الطابق الأرضي. كثير من الناس يسيرون ويركبون الدراجات على طول شوارع القناة أمام المباني».

تقنيات البحث والتطوير

يستخدم «سورا» على غرار نماذج «جي بي تي GPT» أنواع بنيات التعلم العميق المستخدمة لمعالجة البيانات التسلسلية، مما يسمح له بالتعامل مع كميات كبيرة من البيانات بفاعلية. يمثّل النموذج مقاطع الفيديو والصور على أنها مجموعات من تصحيحات البيانات، مشابهة للرموز المميزة في «جي بي تي» مما يسمح له بالتدريب على مجموعة متنوعة من البيانات المرئية. تتمكن تقنية «سورا» من خلال هذا التوحيد في تمثيل البيانات من التعامل مع المدة والدقة ومواصفات أخرى بطريقة أكثر كفاءة من أي وقت مضى. كما يستند «سورا» على الأبحاث الخاصة بنماذج «DALL - E» و«جي بي تي»، فهو يستخدم تقنية «الاسترداد« من «DALL - E 3» لإنشاء تسميات توضيحية وصفية للغاية لبيانات التدريب المرئية. يؤدي هذا إلى إنشاء مقاطع فيديو تتبع تعليمات المستخدم النصية بدقة أكبر. كما يمكن للنموذج تحريك الصور الثابتة أو توسيع مقاطع الفيديو الموجودة مع اهتمام ملحوظ بالتفاصيل، مما يُظهر تنوعه وإمكاناته في تطبيقات العالم الحقيقي.

اعتبارات السلامة والأخلاق

وإدراكاً لأهمية السلامة والأخلاقيات، التزمت «أوبن إيه آي» الكثير من الخطوات المهمة قبل إمكانية دمج «سورا» في منتجاتها. وعبّرت الشركة في تغريدة لها على موقع «إكس» عن أنه من خلال التعاون مع أعضاء «الفريق الأحمر»، وهو فريق داخل الشركة متخصص في مجالات مثل المعلومات الخاطئة والمحتوى الذي يحض على الكراهية والتحيز، يجري تطوير أدوات للكشف عن المحتوى المضلل، بما في ذلك أداة تصنيف قادرة على تحديد مقاطع الفيديو التي أنشأها «سورا».

المشاركة والآفاق المستقبلية

تخطط «أوبن إيه آي» للتعامل مع صناع السياسات والمعلمين والفنانين على مستوى العالم لفهم المخاوف وتحديد حالات الاستخدام الإيجابية لـ«سورا»، على الرغم من الأبحاث والاختبارات المكثفة، فإن النطاق الكامل للاستخدامات المفيدة والضارة المحتملة لا يزال غير معروف. وتؤمن «أوبن إيه آي» بأهمية التعلم من الاستخدام الواقعي بوصفه عنصراً حاسماً في إنشاء أنظمة ذكاء اصطناعي أكثر أماناً مع مرور الوقت.

يمثل «سورا» تقدماً كبيراً في قدرة الذكاء الاصطناعي على فهم ومحاكاة العالم الحقيقي، مما يمثل خطوة حاسمة نحو تحقيق الذكاء العام الاصطناعي (AGI). لا يُظهر تطويره إمكانية إنشاء محتوى فيديو جذاب فحسب، بل يسلط الضوء أيضاً على التحديات والمسؤوليات المستمرة في مجال أبحاث وتطبيقات الذكاء الاصطناعي.


مقالات ذات صلة

وحدات «إنفيديا» للرسومات المدمجة في الكومبيوترات المحمولة تطلق عنان الإبداع والذكاء الاصطناعي

تكنولوجيا حوّل المهام الروتينية التقليدية إلى عمليات ذكية وسريعة لتسريع الإبداع

وحدات «إنفيديا» للرسومات المدمجة في الكومبيوترات المحمولة تطلق عنان الإبداع والذكاء الاصطناعي

تهدف وحدات «إنفيديا» لتوفير تجربة إنتاجية ذكية للأعمال الإبداعية بأداء مضاعف وموثوقية أعلى في تطبيقات التصميم والمونتاج.

خلدون غسان سعيد (جدة)
تكنولوجيا يعتمد النظام على دمج الإدراك الذاتي مع الرؤية الخارجية لمساعدة الروبوت على فهم العوائق قبل ملامستها (KAIST)

نظام يتيح للروبوتات رباعية الأرجل تفادي العوائق قبل الاصطدام

النظام يدمج الرؤية والإحساس الذاتي لتمكين الروبوتات رباعية الأرجل من تفادي العوائق مبكراً والتحرك بكفاءة أكبر.

نسيم رمضان (لندن)
خاص يركز «إيزينغ» على معالجة اثنتين من أصعب العقبات الهندسية التي تعوق الاستخدام العملي للأنظمة الكمية (غيتي)

خاص «إنفيديا» تطرح نموذج «إيزينغ» لتقريب الحوسبة الكمية من الاستخدام العملي

تطرح «إنفيديا» نموذج «إيزينغ» المفتوح لتحسين معايرة المعالجات الكمية وتصحيح الأخطاء، في محاولة لتقريب الحوسبة الكمية من الاستخدام العملي.

نسيم رمضان (لندن)
خاص يشير استعداد المستخدمين للدفع مقابل أداء أفضل إلى فرصة إيرادية قد تضيف للمشغلين ما يصل إلى شهرين إضافيين من متوسط العائد السنوي لكل مستخدم (شاترستوك)

خاص «إريكسون» لـ«الشرق الأوسط»: جودة الشبكة المضمونة تحسم 53 % من قرار الاشتراك

تظهر دراسة «إريكسون» أن المستهلك السعودي بات يمنح الأداء المضمون وزناً أكبر في اختيار الشبكة مع فرص نمو مدفوعة بالجيل الخامس والذكاء الاصطناعي.

نسيم رمضان (لندن)

وحدات «إنفيديا» للرسومات المدمجة في الكومبيوترات المحمولة تطلق عنان الإبداع والذكاء الاصطناعي

حوّل المهام الروتينية التقليدية إلى عمليات ذكية وسريعة لتسريع الإبداع
حوّل المهام الروتينية التقليدية إلى عمليات ذكية وسريعة لتسريع الإبداع
TT

وحدات «إنفيديا» للرسومات المدمجة في الكومبيوترات المحمولة تطلق عنان الإبداع والذكاء الاصطناعي

حوّل المهام الروتينية التقليدية إلى عمليات ذكية وسريعة لتسريع الإبداع
حوّل المهام الروتينية التقليدية إلى عمليات ذكية وسريعة لتسريع الإبداع

في عالم يزداد فيه الاعتماد على التقنيات الرقمية، يبحث المبدعون ومحررو عروض الفيديو والصور عن أدوات تمنحهم التفوق والسرعة. وتُعدّ الكومبيوترات المحمولة المزودة بوحدات رسومات متخصصة الخيار الأمثل لهم، حيث توفر تجربة سلسة ومتقدمة مدعومة بأعلى أداء للذكاء الاصطناعي. هذه الأجهزة مصممة لتتيح لهم العمل بذكاء أكبر وبجهد أقل، مع توفير أداء يضمن إنشاء المحتوى بسلاسة تامة ودون قيود أو تأخير في سير العمل.

ولدى الحديث عن تحسين سير العمل الإبداعي، فإن وحدات الرسومات من سلسلة «إنفيديا جيفورس آر تي إكس 50» (NVIDIA GeForce RTX 50) تُعد من أفضل ابتكارات الذكاء الاصطناعي؛ فمن خلال تقنيات الذكاء الاصطناعي التي تعمل بها، ومن خلال منصة وتعاريف «إنفيديا استوديو» (NVIDIA Studio) وأدوات تسريع سير العمل، تتحول المهام الروتينية التقليدية إلى عمليات ذكية وسريعة.

أداء مضاعف وموثوقية أعلى في تطبيقات التصميم والمونتاج في الكومبيوترات التي تدعم وحدات الرسومات المدمجة

دعم ممتد لتسريع البرامج الاحترافية

تعتمد جميع البرامج الإبداعية المعروفة اليوم على تسريع وحدات الرسومات، مما يعني إنجاز المشاريع في زمن قياسي وتعزيز قدرة المبدعين. ويوجد حالياً أكثر من 100 برنامج إبداعي يدعم تسريع العمل عبر وحدة الرسومات، مثل «أدوبي لايتروم» و«فوتوشب» و«إلاستريتر» و«بريمير إليمنتس» و«بريمير برو» و«آفتر إفكتس» و«سابستانس 3 دي بينتر» و«أنريل إنجين» و«يونيتي» و«أوتوديسك مايا» و«بليندر» و«كابكات» و«كوريل درو» و«دافينشي ريزولف» و«أو بي إس ستوديو» و«ووندرشير فيلمورا»، وغيرها.

ومن أبرز مزايا هذه الوحدات أداء الذكاء الاصطناعي التوليدي لعروض الفيديو الذي أصبح أسرع بنحو الضعفين مقارنة بالأجيال السابقة. هذا الأمر يضمن للمبدعين عدم إضاعة الوقت في الانتظار، والتركيز بدلاً من ذلك على الإبداع الخالص.

تقنية «آر تي إكس ريمكس» لتطوير رسومات وإضاءة الألعاب الكلاسيكية

وفي مجال تحرير الفيديو، توفر هذه الكومبيوترات المحمولة قدرة هائلة على التعامل مع العروض عالية الجودة بسلاسة تامة لنحو مرتين ونصف المرة، مقارنةً بالأجيال السابقة. ويمكن للمحررين تطبيق مؤثرات الذكاء الاصطناعي بسرعة فائقة وتصدير المحتوى «Render» في وقت قصير جداً، وإنتاج محتوى مبتكَر بمساعدة الذكاء الاصطناعي. وفي مجال التصوير الفوتوغرافي، يمكن معالجة ملفات الصور من امتداد «RAW» الضخمة، وتطبيق التعديلات الذكية والفلترة الفورية للصور.

وبالنسبة لمصممي الرسومات ثلاثية الأبعاد والرسوم المتحركة، فإن تصدير المحتوى الخاص بالمشاهد المعقدة لم يعد عائقاً؛ إذ يمكن معاينة الإضاءة في الوقت الفعلي وبناء النماذج والأنسجة (Textures) المختلفة للعناصر بسرعة مذهلة تصل لغاية 5 أضعاف ونصف المرة مقارنة بالأجيال السابقة. ويتحقق ذلك مع استقرار مثالي بفضل تعاريف «استوديو» المخصصة التي تضمن الأداء المرتفع والموثوقية الكبيرة في عمل البرامج المختلفة دون أي توقف أو تقطع. كما تساهم تقنيات مثل «إنفيديا إيس» (NVIDIA Ace)، في بناء شخصيات رقمية حقيقية ومرئيات واقعية للغاية باستخدام تقنيات الذكاء الاصطناعي.

رفع مستويات الإنتاجية والترفيه

تُعد الإنتاجية اليومية جزءاً لا يتجزأ من التجربة، حيث يبرز «تشات آر تي إكس» (Chat RTX)، كأداة ثورية تمنح المستخدم إجابات مخصصة من ملفاته الخاصة لأي سؤال يخطر بباله. ويمكن للمستخدم، مثلاً، البحث بسهولة في ملاحظاته وصوره وملفاته باستخدام النصوص أو الأوامر الصوتية عبر روبوت دردشة خاص وسري. هذا النوع من المساعدة الرقمية يجعل الكومبيوتر المحمول مساعداً شخصياً يتولى عنه العمل الشاق.

وبالإضافة إلى العمل، تقدم هذه الأجهزة تجربة ترفيهية متطورة؛ إذ ترفع تقنية «آر تي إكس فيديو» (RTX Video) مستوى عروض الفيديو على الإنترنت إلى الدقة الفائقة «4K». كما تتيح تقنية «برودكاست» (Broadcast) تحويل غرفة المستخدم إلى استوديو احترافي للبث والاجتماعات، موفرة جودة بصرية بالدقة الفائقة «4K» وصوتية عالية تصل لغاية ضعفَي الأجيال السابقة، مع تجربة خالية من التقطع لتعزيز الحضور الرقمي.

وللمبدعين الذين يحبون الألعاب القديمة، توفر تقنية «آر تي إكس ريمكس» (RTX Remix) إمكانية إعادة تطوير رسومات وإضاءة تلك الألعاب، حتى لو لم تكن تدعم الإضاءة المتقدمة أو الرسومات فائقة الدقة، حيث تتيح الأداة التقاط أصول اللعبة وترقية موادها بالذكاء الاصطناعي، مع إضافة تتبع الأشعة الضوئية من مصدرها (Ray Tracing)، وتقنية «دي إل إس إس» Deep Learning Super Sampling DLSS لزيادة عدد الرسومات في الثانية (Frames per Second FPS)، دون فقدان مستويات الأداء، وذلك باستخدام تقنيات الذكاء الاصطناعي مما يضمن الحصول على أعلى معدل رسومات في الثانية وأفضل جودة بصرية ممكنة دون أي عناء. كما يمكن إضافة المؤثرات البصرية المختلفة إلى الألعاب بكل سهولة.

تعتمد هذه الكومبيوترات المحمولة على تقنية «ماكس-كيو» (Max-Q) الحصرية التي تضمن توازناً مثالياً بين الأداء واستهلاك الطاقة. وبفضلها، يمكن العمل على جهاز قوي وهادئ في الوقت نفسه مع عمر بطارية أطول. هذا التصميم يناسب تماما من يبحث عن الأداء المرتفع في هيكل محمول وسهل التنقل.

اختيار كومبيوتر محمول مدعوم بوحدات الرسومات المتقدمة هو خطوة نحو ضمان سلاسة عمل القطاع الإبداعي بفضل القوة التي يوفرها الذكاء الاصطناعي والتكامل مع منصة «استوديو»، ليصبح كل ما يقوم المستخدم به أكثر ذكاء وأسرع وأكثر متعة، ولتحويل الأفكار إلى واقع بأقل مجهود وأعلى جودة.


شركة صينية تطوّر مرحاض سيارة يُشغَّل بالأوامر الصوتية

سيارات في صالة عرض في بكين 16 أبريل 2026 (أ.ف.ب)
سيارات في صالة عرض في بكين 16 أبريل 2026 (أ.ف.ب)
TT

شركة صينية تطوّر مرحاض سيارة يُشغَّل بالأوامر الصوتية

سيارات في صالة عرض في بكين 16 أبريل 2026 (أ.ف.ب)
سيارات في صالة عرض في بكين 16 أبريل 2026 (أ.ف.ب)

سجّلت شركة صينية لصناعة السيارات براءة اختراع لمرحاض مخفي أسفل مقعد سيارة منزلق، ويمكن تشغيله باستخدام أوامر صوتية، وفق قاعدة بيانات حكومية، ووفق ما نقلته «وكالة الصحافة الفرنسية».

وأظهرت السجلات العامة أن شركة السيارات الكهربائية «سيريس» (Seres) نالت، في وقت سابق من هذا الشهر، الموافقة على براءة اختراع مرحاضها المتنقّل.

ويُمكن استخدام المرحاض يدوياً عبر إرجاع المقعد إلى الخلف، أو من خلال الأمر الصوتي «تشغيل المرحاض».

وقال مهندسو الشركة في ملف طلب براءة الاختراع إن هذا النظام يهدف إلى «تلبية احتياجات المستخدمين خلال الرحلات الطويلة، أو أثناء التخييم، أو عند المكوث داخل السيارة».

ويعمل نظام مروحة مع أنبوب عادم على تصريف الروائح إلى خارج السيارة، في حين تُجمع الفضلات في خزان يتطلّب التفريغ الدوري. كما يضمّ المرحاض عنصراً حرارياً دوّاراً يعمل على تبخير البول، وتجفيف الفضلات الأخرى.

وخلال السنوات الأخيرة، كشفت شركات السيارات الكهربائية في الصين عن طرازات مزوّدة بإكسسوارات لا تحصى، في مسعى إلى جذب المستهلكين في سوق شديدة التنافس.

وأصبحت ميزات مثل أنظمة الكاراوكي والثلاجات الصغيرة شائعة، فيما تقول شركة «نيو» (Nio) إن مقاعد بعض طرازاتها مزوّدة بخاصية «التدليك بالحجارة الساخنة».

وفي العام الماضي، أعلنت شركة «بي واي دي» (BYD)، الرائدة في القطاع، عن نظام ذكي لطائرات مسيّرة مدمجة في المركبات، بينما أفادت شركة «إكس بينغ» (XPeng) بأن عمليات تسليم سيارتها المعروفة باسم «حاملة الطائرات البرية»، وهي مركبة تحتوي على طائرة ذات ست مراوح، يُتوقّع أن تبدأ هذا العام.

ولا يزال من غير الواضح ما إذا كانت فكرة «سيريس» ستدخل مرحلة الإنتاج.

ولم ترد الشركة، التي تعاونت مع عملاق الاتصالات «هواوي» لتطوير خط سياراتها الفاخرة «آيتو»، على طلب «وكالة الصحافة الفرنسية» للتعليق.


نظام يتيح للروبوتات رباعية الأرجل تفادي العوائق قبل الاصطدام

يعتمد النظام على دمج الإدراك الذاتي مع الرؤية الخارجية لمساعدة الروبوت على فهم العوائق قبل ملامستها (KAIST)
يعتمد النظام على دمج الإدراك الذاتي مع الرؤية الخارجية لمساعدة الروبوت على فهم العوائق قبل ملامستها (KAIST)
TT

نظام يتيح للروبوتات رباعية الأرجل تفادي العوائق قبل الاصطدام

يعتمد النظام على دمج الإدراك الذاتي مع الرؤية الخارجية لمساعدة الروبوت على فهم العوائق قبل ملامستها (KAIST)
يعتمد النظام على دمج الإدراك الذاتي مع الرؤية الخارجية لمساعدة الروبوت على فهم العوائق قبل ملامستها (KAIST)

طوّر باحثون من المعهد الكوري المتقدم للعلوم والتكنولوجيا (KAIST) نظاماً جديداً للتحكم في الروبوتات رباعية الأرجل، حيث يهدف إلى جعل حركتها أقل اعتماداً على رد الفعل بعد الاصطدام بالعوائق، وأكثر قدرة على «رؤية» البيئة واتخاذ القرار أثناء الحركة. ويأتي هذا العمل تحت اسم «DreamWaQ++».

الفكرة ليس مجرد جعل الروبوت يمشي على تضاريس صعبة، بل تمكينه من الجمع بين نوعين من الإدراك في الوقت نفسه؛ الأول هو الإدراك الذاتي المرتبط بما يشعر به الروبوت من خلال مفاصله وحركته واتزانه، والثاني هو الإدراك الخارجي عبر الكاميرات و(LiDAR) «لايدار»، بحيث لا ينتظر الروبوت أن تلمس رجلاه العقبة كي يفهم ما أمامه، بل يحاول قراءتها مسبقاً، وتعديل طريقته في المشي وفقاً لذلك.

هذا تحديداً هو ما تعتبره الدراسة تجاوزاً لمحدودية كثير من الأنظمة السابقة، التي كانت تعتمد على الإحساس الداخلي فقط، أو تحتاج في المقابل إلى خرائط دقيقة ومعقدة للبيئة كي تستفيد من الرؤية الخارجية.

أظهرت الاختبارات تحسناً في معدلات النجاح مقارنة ببعض النماذج البصرية المرجعية في التعامل مع السلالم والعوائق غير المنتظمة (KAIST)

نحو حركة استباقية

أوضح فريق «KAIST» أن النسخة السابقة من النظام «DreamWaQ» كانت تتيح ما يشبه «المشي الأعمى»، أي القدرة على تقدير طبيعة الأرض من دون رؤية مباشرة، وهو ما يُفيد مثلاً في البيئات التي يصعب فيها الاعتماد على المعلومات البصرية، مثل الظلام أو الدخان. لكن هذا النهج كانت له حدود؛ حيث إن الروبوت كان يحتاج غالباً إلى ملامسة العائق أولاً قبل أن يعدّل حركته. أما «DreamWaQ++» فيحاول الانتقال من هذا النمط التفاعلي إلى نمط أكثر استباقية؛ حيث يتعرف الروبوت إلى العوائق قبل الوصول إليها، ويختار أسلوب الحركة المناسب في الزمن الحقيقي.

الدراسة تصف هذا الانتقال بوصفه دمجاً بين الإدراكين الداخلي والخارجي، عبر إطار تعلم تعزيزي متعدد الوسائط.

واستهدف الباحثون معالجة مشكلة معروفة في الروبوتات رباعية الأرجل؛ حيث تكون واعدة جداً للعمل في البيئات المزدحمة والمعقدة، لكنها تبقى حساسة لعدم اليقين في العالم الحقيقي، ما يجعل التحكم في حركتها تحدياً كبيراً. لذلك يقترح العمل الجديد طريقة تجعل الروبوت أكثر قدرة على اجتياز الأراضي الوعرة، والمنحدرات الحادة، والسلالم العالية، مع الحفاظ على درجة من الصمود حتى في الحالات الخارجة عن التوزيعات التي تدرب عليها.

بين الرؤية والإحساس

الأهمية هنا ليست أكاديمية فقط، فواحدة من المشكلات العملية في الروبوتات المتحركة هي أن الرؤية وحدها لا تكفي دائماً، والإحساس الذاتي وحده لا يكفي أيضاً. إذا اعتمد الروبوت على «الإحساس الداخلي» فقط، فقد يضطر إلى اختبار الأرض برجله أولاً، ما يبطئ الحركة، ويزيد خطر التعثر أو الاصطدام. وإذا اعتمد على الرؤية الخارجية وحدها، فقد يحتاج إلى نمذجة شديدة الدقة للبيئة، وهو أمر صعب في المواقع غير المنتظمة أو المتغيرة باستمرار. يحاول «DreamWaQ++» سد هذه الفجوة عبر المزج بين الحالتين، بحيث يتحرك الروبوت بناءً على ما «يراه» وما «يشعر به» معاً.

ومن المؤشرات اللافتة التي ظهرت في المادة المصاحبة للمشروع، أن النظام حقق في اختبارات المحاكاة على 1000 روبوت، معدلات نجاح أعلى بنحو 20 إلى 40 في المائة، مقارنة ببعض النماذج البصرية المرجعية عبر تكوينات مختلفة من السلالم. كما أشارت الصفحة التعريفية للمشروع إلى أن النظام يتعامل مع السلالم غير المتماثلة عبر تكييف حركة رفع الرجل وفق شكل العائق، وهي نقطة مهمة لأن كثيراً من البيئات الحقيقية لا تأتي في صورة سلالم أو حواف مثالية وثابتة.

يعكس هذا التطور اتجاهاً أوسع نحو جعل الروبوتات أكثر قدرة على الحركة الذكية في بيئات واقعية وغير مضمونة (KAIST)

تحسن في الأداء

هذا النوع من التقدم يعكس اتجاهاً أوسع في عالم الروبوتات يتعلق بالانتقال من الحركة المستقرة في بيئات مضبوطة إلى الحركة الذكية في بيئات غير مضمونة. فمن الناحية النظرية، يمكن أن يفتح ذلك المجال أمام استخدامات أكثر واقعية في مواقع الكوارث، والمناطق الصناعية، والبيئات المزدحمة أو غير المنتظمة؛ حيث لا تكون الأرضية مهيأة سلفاً، ولا يمكن افتراض أن الروبوت سيعمل دائماً في ظروف مثالية. ويرى الفريق إمكان توسيع هذه التقنية إلى منصات أخرى، مثل الروبوتات ذات العجلات والأرجل أو حتى الروبوتات الشبيهة بالبشر.

مع ذلك، لا يعني هذا أن الروبوت بات «يفكر» كما يفعل الإنسان بالمعنى الحرفي. ما يقدمه البحث هو تحسن في الإدراك الحركي، واتخاذ القرار أثناء التنقل وليس وعياً تاماً أو فهماً شاملاً للبيئة. لكنه يظل تقدماً مهماً؛ لأن الحركة في العالم الواقعي هي واحدة من أصعب المشكلات في الروبوتات: الأرض قد تكون غير مستقرة، والعقبات قد تكون غير منتظمة، والاستجابة يجب أن تكون سريعة بما يكفي لتجنب السقوط أو التوقف. وفي هذا السياق، فإن تمكين الروبوت من تعديل خطاه قبل الاصطدام، لا بعده، يُمثل فرقاً جوهرياً في فلسفة الحركة نفسها.