كيف سينتقل الذكاء الاصطناعي التوليدي إلى عالم الروبوتات؟

دمج «جي بي تي» يسهل على الآلات التحادث وفهم الصور

الباحث بيتر تشين يتفاعل مع الروبوت عبر جهاز اللابتوب
الباحث بيتر تشين يتفاعل مع الروبوت عبر جهاز اللابتوب
TT

كيف سينتقل الذكاء الاصطناعي التوليدي إلى عالم الروبوتات؟

الباحث بيتر تشين يتفاعل مع الروبوت عبر جهاز اللابتوب
الباحث بيتر تشين يتفاعل مع الروبوت عبر جهاز اللابتوب

بينما تقوم شركات مثل «أوبن إيه آي» OpenAI و «ميد جورني» Midjourney ببناء برامج الدردشة ومولدات الصور وغيرها من أدوات الذكاء الاصطناعي التي تعمل في العالم الرقمي، تستخدم الآن شركة ناشئة أسسها ثلاثة باحثين سابقين في «أوبن إيه آي» أساليب تطوير التكنولوجيا التي طورت برامج الدردشة بهدف بناء تكنولوجيا الذكاء الاصطناعي التي يمكنها التنقل في العالم المادي.

روبوت بنظام «روبوتك باتويل سيستيم» يعرف كيفية تصنيف المنتجات

دمج الذكاء التوليدي بالروبوتات

تعمل شركة «كوفارينت» Covariant، وهي شركة روبوتات مقرها في إميريفيل، كاليفورنيا، على ابتكار طرق للروبوتات لالتقاط المنتجات وفرزها أثناء نقلها عبر المستودعات ومراكز التوزيع. ويتمثل الهدف في مساعدة الروبوتات على فهم ما يجري حولها وتحديد ما يجب عليهم فعله بعد ذلك. كما تمنح هذه التقنية الروبوتات فهماً واسعاً للغة الإنجليزية، مما يسمح للأشخاص بالدردشة معها كما لو كانوا يتحدثون مع «جي بي تي» ChatGPT.

آلات تتحادث وتفهم الصور

التكنولوجيا، التي لا تزال قيد التطوير، ليست مثالية. ولكنها علامة واضحة على أن أنظمة الذكاء الاصطناعي التي تدير برامج الدردشة عبر الإنترنت ومولدات الصور ستعمل أيضاً على تشغيل الآلات في المستودعات، وعلى الطرق، وفي المنازل.

ومثل روبوتات الدردشة ومولدات الصور، تتعلم تكنولوجيا الروبوتات مهاراتها من خلال تحليل كميات هائلة من البيانات الرقمية. وهذا يعني أن المهندسين يمكنهم تحسين التكنولوجيا من خلال تزويدها بالمزيد والمزيد من البيانات.

روبوتات تجارية

لا تقوم شركة «كوفارينت» المدعومة بتمويل قدره 222 مليون دولار، ببناء الروبوتات بل تبني البرنامج الذي يشغل الروبوتات.

وتهدف الشركة إلى نشر تقنيتها الجديدة لنظام «روبوتك باتويل سيستم» مع روبوتات المستودعات، مما يوفر خريطة طريق للآخرين للقيام بالشيء نفسه في مصانع التصنيع وربما حتى على الطرق التي بها سيارات ذاتية القيادة.

الروبوت يعرف كيفية التقاط الموز حتى لو لم يرَ موزة من قبل

شبكات عصبية ذكية

تُسمى أنظمة الذكاء الاصطناعي التي تقود برامج الدردشة ومولدات الصور بالشبكات العصبية، نسبة إلى شبكة الخلايا العصبية في الدماغ. ومن خلال تحديد الأنماط في كميات هائلة من البيانات، يمكن لهذه الأنظمة أن تتعلم كيفية التعرف على الكلمات والأصوات والصور، أو حتى توليدها بنفسها. هذه هي الطريقة التي قامت بها «أوبن إيه غي» ببناء ChatGPT، مما يمنحها القدرة على الإجابة على الأسئلة بشكل فوري وكتابة أوراق بحثية وإنشاء برامج كومبيوتر.

وقد تعلمت البرامج هذه المهارات من النصوص المنتقاة عبر الإنترنت. إلا أن العديد من الشركات يقوم الآن ببناء أنظمة يمكنها التعلم من أنواع مختلفة من البيانات في الوقت نفسه. فمن خلال تحليل مجموعة من الصور والتعليقات التوضيحية التي تصف تلك الصور، على سبيل المثال، يمكن للنظام فهم العلاقات بين الاثنين. ولذا يمكن أن يتعلم البرنامج أن كلمة «موز» تصف فاكهة صفراء منحنية.

الباحث بيتر تشين يتفاعل مع الروبوت عبر جهاز اللابتوب

توظيف مولد الصور «سورا»

استخدمت شركة «أوبن إيه آي» هذا النظام لبناء مولد الفيديو الجديد «سورا» Sora. إذ ومن خلال تحليل الآلاف من مقاطع الفيديو ذات التعليقات التوضيحية، تعلم النظام إنشاء مقاطع فيديو عند إعطائه وصفاً قصيراً لمشهد ما، مثل «عالم مصنوع من الورق بشكل رائع للشعاب المرجانية، مملوء بالأسماك الملونة والمخلوقات البحرية».

استخدمت شركة «كوفارينت»، التي أسسها بيتر أبيل، الأستاذ في جامعة كاليفورنيا، بيركلي، وثلاثة من طلابه السابقين، بيتر تشين، وروكي دوان، وتيانهاو تشانغ، تقنيات مماثلة في بناء نظام يقود روبوتات المستودعات. وتساعد الشركة في تشغيل روبوتات الفرز في المستودعات في جميع أنحاء العالم.

وقد أمضت الشركة سنوات في جمع البيانات - من الكاميرات وأجهزة الاستشعار الأخرى - التي توضح كيفية عمل هذه الروبوتات. وقال تشين: «إنها تستوعب جميع أنواع البيانات التي تهم الروبوتات، التي يمكن أن تساعدهم على فهم العالم المادي والتفاعل معه».

روبوتات بفهم أوسع للمحيط

ومن خلال الجمع بين تلك البيانات والكميات الهائلة من النصوص المستخدمة لتدريب روبوتات الدردشة مثل ChatGPT، قامت الشركة ببناء تقنية الذكاء الاصطناعي التي تمنح الروبوتات الخاصة بها فهماً أوسع بكثير للعالم من حولها. وبعد تحديد الأنماط في هذا المزيج من الصور والبيانات الحسية والنصوص، تمنح التكنولوجيا الروبوت القدرة على التعامل مع المواقف غير المتوقعة في العالم المادي.

يعرف الروبوت كيفية التقاط الموز، حتى لو لم ير موزة من قبل. ويمكنه أيضاً الاستجابة للغة الإنجليزية البسيطة، تماماً مثل برنامج الدردشة الآلي. إذا أخبرته أن «يلتقط موزة»، فهو يعرف ماذا يعني ذلك. إذا طلبت منه «التقاط فاكهة صفراء»، فإنه يفهم ذلك أيضاً. ويمكنه أيضاً إنشاء مقاطع فيديو تتنبأ بما قد يحدث أثناء محاولته التقاط موزة.

وقال أبيل: «إذا كان بإمكانه (الروبوت) التنبؤ بالإطارات التالية في مقطع الفيديو، فيمكنه تحديد الاستراتيجية الصحيحة التي يجب اتباعها».

أخطاء وأخطار الروبوتات «التوليدية»

إلا أن التكنولوجيا، التي تسمى RFM، نسبة إلى تعبير «النموذج التأسيسي لعلم الروبوتات» robotics foundational model، ترتكب أخطاء، مثلما تفعل برامج الدردشة.

وعلى الرغم من أن الروبوت غالباً ما يفهم ما يطلبه الناس منه، فإن هناك دائماً احتمال ألا يفعل ذلك، فهو يسقط الأشياء من وقت لآخر. وقال غاري ماركوس، رجل أعمال في مجال الذكاء الاصطناعي وأستاذ فخري في علم النفس والعلوم العصبية في جامعة نيويورك، إن التكنولوجيا يمكن أن تكون مفيدة في المستودعات وغيرها من المواقف التي تكون فيها الأخطاء مقبولة. لكنه قال إن نشرها في المصانع وغيرها من المواقف التي يحتمل أن تكون خطرة سيكون أكثر صعوبة وأكثر خطورة. وأضاف: «إن الأمر يتعلق بتكلفة الخطأ، إذا كان لديك روبوت يزن 150 رطلاً (الرطل 453 غراماً) ويمكنه القيام بشيء ضار، فقد تكون التكلفة مرتفعة».

اختلاف روبوتات الحاضر والمستقبل

وبينما تقوم الشركات بتدريب هذا النوع من الأنظمة على مجموعات كبيرة ومتنوعة من البيانات، يعتقد الباحثون أنها ستتحسن بسرعة. وهذا يختلف تماماً عن الطريقة التي عملت بها الروبوتات في الماضي. ففي العادة، يقوم المهندسون ببرمجة الروبوتات لأداء الحركة الدقيقة نفسها مراراً وتكراراً، مثل التقاط صندوق بحجم معين أو تثبيت أداة في مكان معين على المصد الخلفي للسيارة. لكن الروبوتات لا تستطيع التعامل مع المواقف غير المتوقعة أو العشوائية.

لكن ومن خلال التعلم من البيانات الرقمية - مئات الآلاف من الأمثلة لما يحدث في العالم المادي - يمكن للروبوتات أن تبدأ في التعامل مع ما هو غير متوقع. وعندما تقترن هذه الأمثلة باللغة، يمكن للروبوتات أيضاً الاستجابة للاقتراحات النصية والصوتية، كما يفعل برنامج الدردشة. وهذا يعني أنه مثل برامج الدردشة ومولدات الصور، ستصبح الروبوتات أكثر ذكاءً. وقال تشين: «ما هو موجود في البيانات الرقمية يمكن أن ينتقل إلى العالم الحقيقي».

* خدمة «نيويورك تايمز»


مقالات ذات صلة

كيف يُسرّع الذكاء الاصطناعي مسار الاكتشافات العلمية؟

علوم باحثون بجامعة نورث كارولينا يعتمدون على روبوت لتنفيذ مهام بالمختبر (جامعة نورث كارولينا)

كيف يُسرّع الذكاء الاصطناعي مسار الاكتشافات العلمية؟

قد تشهد مختبرات العلوم في مجالات الكيمياء والكيمياء الحيوية وعلوم المواد، تحولاً جذرياً؛ بفضل التقدم في التشغيل الآلي للروبوتات والذكاء الاصطناعي لأتمتة المهام المتكررة في المختبرات؛ حيث تُمكّن الأتمتة، الروبوتات من إجراء التجارب بدقة وتناسق عالٍ دون تعب؛ ما يسرع من وتيرة البحث بشكل كبير ويقلل من المخاطر المرتبطة بالتعامل مع المواد الخطرة.

محمد السيد علي (القاهرة)
تكنولوجيا إيلون ماسك أثناء مشاركته الافتراضية بـ«مبادرة مستقبل الاستثمار» في الرياض (رويترز)

إيلون ماسك: سيكون هناك 10 مليارات روبوت بهيئة بشرية بحلول 2040

قال الملياردير إيلون ماسك، خلال «مؤتمر مبادرة مستقبل الاستثمار» الذي انطلق الثلاثاء في الرياض، إنه بحلول عام 2040 سيكون هناك ما لا يقل عن عشرة مليارات روبوت.

«الشرق الأوسط» (الرياض)
يوميات الشرق البدلة الروبوتية «ووك أون» (المعهد الكوري للعلوم والتكنولوجيا المتقدمة)

روبوت متطور لمساعدة مرضى الشلل التام على المشي

طوّر فريق من الباحثين من المعهد الكوري للعلوم والتكنولوجيا المتقدمة (KAIST) روبوتاً قابلاً للارتداء؛ ليساعد الأشخاص المصابين بالشلل التام على المشي.

«الشرق الأوسط» (القاهرة )
تكنولوجيا السيدة اتهمت روبوت دردشة يعمل بالذكاء الاصطناعي بدفع ابنها إلى الانتحار (رويترز)

سيدة تتهم روبوت دردشة بدفع ابنها إلى الانتحار

اتهمت سيدة أميركية روبوت دردشة يعمل بالذكاء الاصطناعي بدفع ابنها إلى الانتحار بعد أن أصبح «مهووساً به».

«الشرق الأوسط» (نيويورك)
يوميات الشرق الروبوت يقطف الفراولة في 2.5 ثانية فقط (جامعة إسكس)

روبوت يحصد الفراولة ويغلّفها في 2.5 ثانية فقط

أعلنت جامعة بريطانية عن اختبار روبوت منخفض التكلفة قادر على قطف الفراولة وتغليفها في ثوانٍ، وذلك ضمن خطة طموحة لمعالجة نقص العمالة في قطاع الزراعة.

«الشرق الأوسط» (القاهرة )

«جي بي تي» أم «غوغل»: أيهما أكثر فائدة للإبداع؟

«جي بي تي» أم «غوغل»: أيهما أكثر فائدة للإبداع؟
TT

«جي بي تي» أم «غوغل»: أيهما أكثر فائدة للإبداع؟

«جي بي تي» أم «غوغل»: أيهما أكثر فائدة للإبداع؟

ربما تتذكر وقتاً كنت فيه بحاجة إلى إجابة سريعة، لوصفة طبق للطعام، أو مشروع لتحسين بيتك.

من محرك «غوغل» إلى «جي بي تي»

قبل بضع سنوات، كانت غريزة معظم الناس الأولى هي البحث عن المعلومات على محرك «غوغل» للبحث، ومع ذلك، اليوم، مما كتب غاي يون تشونغ (*)، أصبح كثير من الناس أكثر ميلاً إلى استخدام «تشات جي بي تي (ChatGPT)»، أداة الذكاء الاصطناعي والمحادثة من شركة «أوبن إيه آي»، التي تغير الطريقة التي يبحث بها الناس عن المعلومات.

بدلاً من مجرد توفير قوائم بمواقع الويب، يُقدِّم «تشات جي بي تي» إجابات محادثة أكثر مباشرة.

مسألة الإبداع

ولكن هل يمكن لـ«تشات جي بي تي» أن يفعل أكثر من مجرد الإجابة عن الأسئلة المباشرة؟ هل يمكنه بالفعل مساعدة الناس على أن يكونوا أكثر إبداعاً؟

إني أدرس التقنيات الجديدة وتفاعل المستهلكين مع وسائل التواصل الاجتماعي، وقد شرعت أنا وزميلي بيونغ لي في استكشاف هذا السؤال: هل يمكن لـ«تشات جي بي تي» مساعدة الناس حقاً على حل المشكلات بشكل إبداعي، وهل يؤدي هذا بشكل أفضل من محركات البحث التقليدية مثل «غوغل»؟

عبر سلسلة من التجارب في دراسة نُشرت في مجلة «نتشر-السلوك البشري (Nature Human Behaviour)»، وجدنا أن «تشات جي بي تي» يعزز الإبداع، خصوصاً في المهام العملية اليومية.

وإليك ما تعلمناه عن كيفية تغيير هذه التقنية للطريقة التي يحلُّ بها الناس المشكلات، ويتبادلون بها الأفكار ويفكرون بشكل إبداعي.

«جي بي تي» مبدع

«تشات جي بي تي» والمهام الإبداعية. تخيل أنك تبحث عن فكرة هدية إبداعية لابنة أخت في سِنِّ المراهقة. في السابق، ربما كنت تبحث على «غوغل» عن «هدايا إبداعية للمراهقين»، ثم تتصفح المقالات حتى تجد شيئاً يناسبك.

الآن، إذا سألت «تشات جي بي تي»، فإنه يولِّد استجابةً مباشرةً بناءً على تحليله للأنماط عبر الويب. قد يقترح مشروعاً مخصصاً أو تجربةً فريدةً من نوعها، وصياغة الفكرة في الوقت الفعلي.

لاستكشاف ما إذا كان «تشات جي بي تي» يتفوق على «غوغل» في مهام التفكير الإبداعي، أجرينا 5 تجارب، تعامل فيها المشاركون مع مهام إبداعية مختلفة.

توليد الأفكار

على سبيل المثال، قمنا بتعيين المشاركين بشكل عشوائي، إما لاستخدام «تشات جي بي تي» للمساعدة، أو استخدام بحث «غوغل»، أو توليد الأفكار بأنفسهم.

بمجرد جمع الأفكار، قام الحكام الخارجيون، الذين لا يدركون الشروط المخصصة للمشاركين، بتقييم كل فكرة من حيث الإبداع. قمنا بوضع متوسط ل​​درجات الحكام؛ بهدف توفير تصنيف إبداعي عام.

كانت إحدى المهام تتضمَّن تبادل الأفكار حول طرق إعادة استخدام العناصر اليومية، مثل تحويل مضرب تنس قديم وخراطيم الحديقة إلى شيء جديد. وطُلبت مهمة أخرى من المشاركين تصميم طاولة طعام مبتكرة. وكان الهدف هو اختبار ما إذا كان «تشات جي بي تي» يمكن أن يساعد الناس على التوصل إلى حلول أكثر إبداعاً، مقارنة باستخدام محرك بحث على الويب أو مجرد خيالهم.

نتائج لصالح الذكاء التوليدي

وكانت النتائج واضحة: صنف الحكام الأفكار التي تم إنشاؤها بمساعدة «تشات جي بي تي» على أنها أكثر إبداعاً من تلك التي تم إنشاؤها باستخدام عمليات البحث على «غوغل» أو دون أي مساعدة. ومن المثير للاهتمام أن الأفكار التي تم إنشاؤها باستخدام «تشات جي بي تي» - حتى دون أي تعديل بشري - سجَّلت درجات أعلى في الإبداع من تلك التي تم إنشاؤها باستخدام «غوغل».

وكانت إحدى النتائج البارزة هي قدرة «تشات جي بي تي» على توليد أفكار إبداعية تدريجياً: تلك التي تعمل على تحسين أو البناء على ما هو موجود بالفعل. وفي حين أن الأفكار الجذرية حقاً قد لا تزال تشكل تحدياً للذكاء الاصطناعي، فقد تفوَّق «تشات جي بي تي» في اقتراح نهج عملي ومبتكر. على سبيل المثال، في تجربة تصميم الألعاب، توصَّل المشاركون الذين يستخدمون «تشات جي بي تي» إلى تصميمات خيالية، مثل تحويل مروحة متبقية وكيس ورقي إلى مروحة تعمل بطاقة الرياح.

حدود الإبداع في الذكاء الاصطناعي

تكمن قوة «تشات جي بي تي» في قدرته على الجمع بين المفاهيم غير ذات الصلة في استجابة متماسكة.

وعلى عكس «غوغل»، الذي يتطلب من المستخدمين غربلة الروابط وتجميع المعلومات معاً. يقدم «تشات جي بي تي» إجابةً متكاملةً تساعد المستخدمين على التعبير عن الأفكار وصقلها بتنسيق مصقول. وهذا يجعل «تشات جي بي تي» واعداً بوصفه أداةً إبداعيةً، خصوصاً للمهام التي تربط بين الأفكار المتباينة أو تولد مفاهيم جديدة.

من المهم ملاحظة، مع ذلك، أن «تشات جي بي تي» لا يولِّد أفكاراً جديدة حقاً. إنه يتعرَّف على الأنماط اللغوية ويجمعها من بيانات التدريب الخاصة به، وبالتالي يولِّد مخرجات بتسلسلات أكثر احتمالية بناءً على تدريبه. إذا كنت تبحث عن طريقة لتحسين فكرة موجودة أو تكييفها بطريقة جديدة، فيمكن أن يكون «تشات جي بي تي» مورداً مفيداً. ومع ذلك، بالنسبة لشيء مبتكر، لا يزال الإبداع والخيال البشري ضروريَّين.

بالإضافة إلى ذلك، في حين يمكن لـ«تشات جي بي تي» توليد اقتراحات إبداعية، فإنها ليست عملية دائماً أو قابلة للتطوير دون مدخلات الخبراء. تتطلب خطوات مثل الفحص، وفحص الجدوى، والتحقق من الحقائق، والتحقق من السوق خبرة بشرية. ونظراً لأن استجابات «تشات جي بي تي» قد تعكس تحيزات في بيانات التدريب الخاصة بها، فيجب على الأشخاص توخي الحذر في السياقات الحساسة مثل تلك التي تنطوي على العرق أو الجنس.

كما اختبرنا ما إذا كان «تشات جي بي تي» يمكن أن يساعد في المهام التي غالباً ما يُنظر إليها على أنها تتطلب التعاطف، مثل إعادة استخدام العناصر العزيزة على أحد الأحباء. ومن المدهش أن «تشات جي بي تي» عزَّز الإبداع حتى في هذه السيناريوهات، حيث أدى إلى توليد أفكار وجدها المستخدمون ذات صلة، ومدروسة.

وتتحدى هذه النتيجة الاعتقاد بأن الذكاء الاصطناعي لا يمكنه المساعدة على المهام التي تحركها العواطف.

مستقبل الذكاء الاصطناعي والإبداع

مع ازدياد إمكانية الوصول إلى «تشات جي بي تي» وأدوات الذكاء الاصطناعي المماثلة، فإنها تفتح إمكانات جديدة للمهام الإبداعية. سواء في مكان العمل أو في المنزل، يمكن للذكاء الاصطناعي المساعدة في الشحذ الذهني وحل المشكلات وتعزيز المشروعات الإبداعية.

ومع ذلك، يشير بحثنا أيضاً إلى الحاجة إلى الحذر: في حين يمكن لـ«تشات جي بي تي» تعزيز الإبداع البشري، فإنه لا يحلُّ محلَّ القدرة البشرية الفريدة على التفكير الجذري حقاً خارج الإطار المألوف.

يمثل هذا التحول من البحث على «غوغل» إلى سؤال «تشات جي بي تي»، أكثرَ من مجرد طريقة جديدة للوصول إلى المعلومات. إنه يمثل تحولاً في كيفية تعاون الناس مع التكنولوجيا للتفكير والإبداع والابتكار.

* أستاذ مساعد في إدارة الأعمال بجامعة رايس الأميركية - مجلة «فاست كومباني» - خدمات «تريبيون ميديا».

اقرأ أيضاً