مزايا مذهلة لسماعات «إيكو شو» الجديدة

المساعد الصوتي الجديد يزود بشاشة للعروض لإجراء مكالمات الفيديو

مزايا مذهلة لسماعات «إيكو شو» الجديدة
TT

مزايا مذهلة لسماعات «إيكو شو» الجديدة

مزايا مذهلة لسماعات «إيكو شو» الجديدة

تتميز «إيكو شو» الجديدة من «أمازون» بشاشة صلبة تتيح للمستخدمين إجراء اتصالات فيديو مع آخرين يملكون الجهاز ذاته، أو مع هاتف «آيفون» أو جهاز يعتمد على «آندرويد» مزود بتطبيق «أليكسا».
من خلال سماعة «أمازون إيكو» المتوفرة حالياً، يمكنك الحديث إلى «أليكسا»، المساعد الافتراضي، وإصدار أوامر لها بتشغيل الأغاني وطلب شراء حفاضات، بل وتشغيل جهاز تكييف الهواء.
* شاشة وسماعة
إلا أن «أمازون» ترغب الآن في تمكينك من تحقيق أكثر من مجرد الحديث إلى «أليكسا»، فهي تود أن تتيح لك الفرصة أيضاً للاتصال بأصدقائك وأقاربك من خلال سماعات «إيكو» ـ بل وزودت واحدا من الأجهزة بشاشة بحيث يمكنك رؤيتهم أثناء الحديث إليهم.
كانت «أمازون» قد طرحت بداية هذا الشهر أحدث نموذج في أسرة منتجات «إيكو» الضخمة وهو «إيكو شو Echo Show».
يتميز الجهاز الجديد بشاشة تعمل باللمس يبلغ حجمها سبع بوصات، علاوة على كاميرا فيديو تمكن المستخدمين من إجراء مكالمات فيديو أو صوتية مع بعضهم البعض عبر وصلة «واي فاي». وفي خطوة من الممكن أن تترك تداعيات أوسع نطاقاً، أعلنت «أمازون» أيضاً أنها بصدد إصدار تحديث مجاني لبرمجيات الجهاز «السوفت وير» من شأنه تمكين أجهزة «إيكو» الموجودة بالفعل من إجراء اتصالات هاتفية.
ومن شأن هذه التغييرات إقحام «أمازون» في عالم أدوات الاتصالات عبر الإنترنت الذي يتسم بتكدس وتنوع شديد، مثل «سكايب» من «مايكروسوفت» و«فيس تايم» من «آبل» و«هانغ أوت» من «غوغل»، الأمر الذي يسلط الضوء على الطموحات التي تعلقها الشركة على «إيكو».
الملاحظ أن وظائف الاتصال الجديدة تحول السماعة إلى شيء أشبه بالهاتف الأرضي التقليدي، الذي تخلى عنه كثيرون بالفعل لصالح الهواتف الذكية. وبدلاً من سحب الهاتف خارج جيبك، أصبح بمقدورك اليوم أن تطلب من «إيكو» ببساطة إجراء اتصال بشخص معين.
* منزل إلكتروني
وترمي التغييرات الأخيرة إلى جعل «إيكو» و«أليكسا» من العناصر الأساسية داخل المنازل وأي نظام بمقدوره معاونتك على التسوق عبر الإنترنت والتحكم في درجة حرارة المنزل، والآن، إجراء اتصالات بآخرين. ومن شأن هذه التغييرات دفع «أمازون» من جديد نحو المقدمة لرسم ملامح الطريق نحو مستقبل استخدامات السماعات أمام الشركات الأخرى.
في هذا الصدد، أعرب فيرنر غورتز، محلل لدى مؤسسة «غارتنر» البحثية المعنية بالتكنولوجيا، عن اعتقاده بأن: «أمازون الآن تتمتع بميزة هائلة من حيث السبق».
من جهتها، أعلنت «أمازون» عزمها إطلاق «إيكو شو» في أواخر يونيو (حزيران)، بأسعار تبدأ من نحو 230 دولاراً للجهاز الواحد، أو لاثنين بسعر 360 دولاراً.
يذكر أن «إيكو» بدا جهازاً غريباً على السوق عندما طرحته «أمازون» في أواخر عام 2014، في وقت بدا أن الهواتف الذكية والأجهزة المزودة بشاشات تعلم باللمس تزيح باقي الأجهزة من طريقها. إلا أنه منذ ذلك الحين، ظل «إيكو» متربعاً على رأس قائمة أفضل الأجهزة التي تحقق مبيعات عبر موقع «أمازون»، وإن كانت الشركة ترفض الإفصاح عن حجم مبيعات الجهاز.
على الجانب الآخر، سارعت الجهات المنافسة هي الأخرى نحو محاولة ابتكار أجهزة منزلية ذكية يمكن التحكم بها صوتياً. على سبيل المثال، أطلقت «غوغل» جهاز «هوم» العام الماضي. وأعلنت «هارمان إنترناشيونال» المتخصصة بمجال الأجهزة السمعية والمملوكة لـ«سامسونغ»، الاثنين، إصدارها أول سماعة ذكية من إنتاجها «إنفوك»، والمعتمدة على المساعد الذكي «كورتانا» من إنتاج «مايكروسوفت».
ومع هذا، جابهت الكثير من الشركات المنافسة صعوبة في اللحاق بركب «أمازون».
جدير بالذكر أنه من المتوقع أن تهيمن «أمازون» على 70 في المائة من سوق الأجهزة المعتمدة في عملها على الصوت داخل الولايات المتحدة هذا العام، تبعاً لدراسة نشرتها «إي ماركيتر»، الاثنين. وتشير تقديرات إلى أن «غوغل هوم» يستحوذ بالفعل على ما يقرب من 24 في المائة من السوق، بينما تتشارك عناصر أخرى أصغر في النسبة المتبقية.
وتبعاً لـ«إي ماركيتر»، فإن أكثر من 35 مليون أميركي سيستخدمون جهازا مساعدا يجري تحفيزه بالصوت مرة واحدة في الشهر على الأقل هذا العام، ما يفوق ضعف العدد المناظر العام الماضي.
ويشكل كل ما سبق تحولاً واضحاً بالنسبة لـ«أمازون» عما كان عليه الحال منذ سنوات قليلة مضت. آنذاك، كانت الشركة تعاني حالة تخبط داخل سوق الأجهزة، في الوقت الذي تضررت بشدة جراء إخفاق الهاتف الذكي الذي طرحته ولم ينجح قط في الصمود في وجه كل من «آيفون» من إنتاج «آبل» ومجموعة الأجهزة التي ابتكرتها «سامسونغ». ومع ذلك، جاءت انطلاقة «أمازون» الحقيقية عندما نجحت في التوصل إلى سبيل لحشد تقنيات متنوعة مثل التعرف على الصوت والذكاء الصناعي في جهاز منزلي واحد بمقدور المرء توجيه أوامر إليه دون الحاجة إلى النظر في شاشة. من جهته، قال ديف ليمب، نائب رئيس شؤون الأجهزة لدى «أمازون»، إن منتجات «إيكو» تعد جزءاً من فئة من الأجهزة تعرف باسم «الذكاء المحيطي»، أجهزة يمكن التحكم فيها داخل محيط جمعي، مثل داخل منزل أو سيارة، عبر الصوت بصورة أساسية.
* تفاعل صوتي
وفي بيان موجز للتعريف بالمنتج، أوضح ليمب أنه: «لست مضطراً للذهاب والتفاعل مع الشاشة، وإنما بإمكانك القيام بذلك من خلال الصوت. إن هذا الأمر يختلف كثيراً عن الحوسبة التقليدية التي ألفناها على امتداد العقود الثلاثة الأخيرة».
ومع ذلك، تبقى ثمة قيود واضحة أمام الأجهزة المعتمدة بصورة كاملة على التفاعل باستخدام الصوت، والتي تهدف «إيكو شو» التعامل معها.
وتزيد شاشة الجهاز من القدرة على بث فيديوهات وإظهار كلمات الأغاني أثناء تشغيلها وعرض أحداث مؤرخة مع رسائل نصية جرى إملاؤها على الجهاز صوتياً موجهة إلى المستخدمين الآخرين لـ«إيكو». والواضح أن عرض أوقات عرض الأفلام وقوائم أخرى على الشاشة، مثلما يفعل «إيكو»، أفضل بالنسبة للمستخدمين عن قراءة «أليكسا» لها.
وفي هذا الصدد، قالت كارولينا ميلانيسي، المحللة لدى مؤسسة «كرييتيف استراتيجي»: «أعتقد أن (إيكو) مناسب للغاية لاستخدامه في المطبخ».
إلا أن المشكلة القائمة حالياً أن الأشخاص الوحيدين الذين يمكن لأحد مستخدمي «إيكو» الاتصال بهم، أولئك الذين يملكون أيضاً أجهزة «إيكو»، أو أي شخص لديه تطبيق «أليكسا» على «آيفون» أو جهاز «آندرويد». من ناحيته، قال ليمب إنه ليست هناك قيود فنية أمام «أمازون» تمنعها من ربط رقم هاتف بجهاز «إيكو» بحيث يمكن لآخرين الاتصال بالجهاز عبر هواتفهم، لكنه رفض توضيح ما إذا كانت «غوغل» تنوي بالفعل الإقدام على هذه الخطوة. ونظراً لأن «إيكو» لا يمكن استخدامه سوى كهاتف مزود بسماعة، فإنه من غير المحتمل أن يقدم المرء على استخدامه في إجراء مكالمات خاصة حال وجود آخرين بجواره.
من ناحيتها، تبقى ميلانيسي متشككة حيال ما إذا كان باستطاعة «إيكو» حل محل الهواتف الذكية في إجراء اتصالات صوتية. وأضافت: «إننا معتادون لاستخدام هواتفنا. وعليه، من الصعب إيجاد سبب لاستخدام (أليكسا) بدلاً عنها. إنهم بحاجة لطرح شيء أكثر تحديداً وإثارة للاهتمام واختلافاً عن الأجهزة الأخرى التي نتعامل معها الآن».

* خدمة «نيويورك تايمز»



تحذير لمستخدمي «ChatGPT»: دعوات مزيفة عبر «أوبن إيه آي»

يستغل المحتالون ميزات الدعوات الرسمية في «OpenAI» لإرسال رسائل احتيالية تبدو موثوقة تقنياً (شاترستوك)
يستغل المحتالون ميزات الدعوات الرسمية في «OpenAI» لإرسال رسائل احتيالية تبدو موثوقة تقنياً (شاترستوك)
TT

تحذير لمستخدمي «ChatGPT»: دعوات مزيفة عبر «أوبن إيه آي»

يستغل المحتالون ميزات الدعوات الرسمية في «OpenAI» لإرسال رسائل احتيالية تبدو موثوقة تقنياً (شاترستوك)
يستغل المحتالون ميزات الدعوات الرسمية في «OpenAI» لإرسال رسائل احتيالية تبدو موثوقة تقنياً (شاترستوك)

حذّر خبراء أمن سيبرانيون مستخدمي «شات جي بي تي» (ChatGPT) ومنصات «أوبن إيه آي» الأخرى من أسلوب احتيالي جديد يستغل آلية إرسال الدعوات داخل المنصة، ما يجعل رسائل احتيالية تبدو وكأنها صادرة رسمياً من «أوبن إيه آي».

وبحسب رصد حديث أجرته شركة «كاسبرسكي»، فقد اكتشف باحثوها أن مهاجمين باتوا يسيئون استخدام ميزات إنشاء «المؤسسات» ودعوة أعضاء الفريق في منصة «OpenAI» لإرسال رسائل احتيالية من عناوين بريد إلكتروني حقيقية تعود إلى الشركة نفسها. هذا الأمر يمنح الرسائل مصداقية تقنية عالية، ويزيد من فرص تجاوزها لفلاتر البريد المزعج وكسب ثقة المتلقين.

ولا يعتمد هذا الأسلوب على اختراق أنظمة «أوبن إيه آي»، بل على التلاعب بخصائص مشروعة صُممت في الأصل لتسهيل التعاون والعمل الجماعي، ثم تحويلها إلى أداة للهندسة الاجتماعية.

مثال على رسالة بريد إلكتروني احتيالية (كاسبرسكي)

كيف تعمل الحيلة؟

تبدأ العملية بإنشاء حساب عادي على منصة «أوبن إيه آي». وخلال التسجيل، يُطلب من المستخدم إنشاء «مؤسسة» وتحديد اسم لها. هذا الحقل مخصص عادة لاسم شركة أو فريق، لكنه يسمح بإدخال رموز ونصوص متنوعة.

يستغل المحتالون هذه المرونة لإدراج عبارات مضللة مباشرة في اسم المؤسسة، مثل رسائل تحذيرية أو عروض زائفة، وأحياناً أرقام هواتف أو روابط مشبوهة. وبعد إنشاء المؤسسة، تقترح المنصة خطوة «دعوة فريقك»، حيث يُدخل المهاجمون عناوين البريد الإلكتروني للضحايا المستهدفين.

عند إرسال الدعوات، تصل الرسائل من عناوين رسمية تابعة لـ«أوبن إيه آي»، وتظهر للمتلقي على أنها إشعار حقيقي لإضافته إلى مشروع أو فريق عمل. ويحتوي البريد الإلكتروني على القالب المعتاد لدعوات التعاون، لكن النص الاحتيالي الذي أدرجه المهاجم يظهر بشكل بارز داخل الرسالة. ويراهن المحتالون على أن كثيراً من المستخدمين سيركزون على العنوان الموثوق والرسالة المظللة، دون الانتباه إلى عدم منطقية المحتوى أو سبب تلقيهم دعوة لمؤسسة غير معروفة.

أنماط الرسائل الاحتيالية

رصدت «كاسبرسكي» عدة أنواع من الرسائل التي جرى تمريرها بهذه الطريقة. بعضها يروج لخدمات أو عروض احتيالية، بينما يتخذ الآخر طابعاً أكثر خطورة. أحد الأساليب الشائعة هو إرسال إشعارات كاذبة تفيد بتجديد اشتراك مرتفع التكلفة. وتطلب الرسالة من الضحية الاتصال برقم هاتف مرفق «لإلغاء العملية». هذا النوع من الهجمات يُعرف بـ«التصيد الصوتي» (Vishing)، حيث يحاول المحتالون أثناء المكالمة إقناع الضحية بالكشف عن بيانات شخصية أو مالية، أو تنفيذ خطوات تؤدي إلى اختراق إضافي. وفي جميع الحالات، يبقى الهدف دفع المتلقي إلى التصرف بسرعة، سواء عبر الضغط على رابط أو إجراء مكالمة قبل التحقق من صحة الرسالة.

تعتمد الحيلة على إدراج نصوص مضللة داخل اسم «المؤسسة» ثم إرسال دعوات تصل من عناوين بريد رسمية (غيتي)

لماذا تبدو الرسائل مقنعة؟

تكمن خطورة هذا الأسلوب في أن الرسائل ليست مزورة بالطريقة التقليدية. فهي تُرسل عبر قنوات رسمية وتخرج من بنية بريدية حقيقية تابعة للمنصة. لذلك، يختفي كثير من الإشارات التحذيرية المعتادة، مثل عناوين المرسل المشبوهة. ورغم أن محتوى الرسالة غالباً ما يكون غير منسجم مع قالب «دعوة للتعاون»، فإن هذا التناقض قد لا يكون واضحاً للجميع، خصوصاً لمن لا يتوقعون أن تُستغل منصة موثوقة بهذا الشكل. ويرى خبراء أمنيون أن هذه الحالة تسلط الضوء على مشكلة أوسع. حتى الخدمات ذات السمعة الجيدة يمكن أن تتحول إلى أدوات في يد المحتالين إذا أسيء استخدام ميزاتها.

ما الذي ينبغي فعله؟

بالنسبة لمستخدمي «تشات جي بي تي» ومنصات «أوبن إيه آي» عموماً، تشكل هذه الحملة تذكيراً بأهمية الحذر، حتى عند تلقي رسائل تبدو رسمية. وينصح الخبراء بالتعامل مع أي دعوة غير متوقعة بشكّ، خصوصاً إذا تضمنت لغة استعجال أو مطالب مالية أو أرقام هواتف. كما يُفضل تجنب الضغط على الروابط المضمنة أو الاتصال بالأرقام المذكورة في رسائل مشبوهة. وإذا كانت هناك حاجة فعلية للتواصل مع الدعم، فمن الأفضل زيارة الموقع الرسمي للخدمة والبحث عن بيانات الاتصال هناك.

كما أن الإبلاغ عن الرسائل المشبوهة للمنصة يساعد في الحدّ من انتشارها، في حين يظل تفعيل المصادقة الثنائية خطوة مهمة لتعزيز الأمان، حتى إن لم يعتمد هذا النوع من الاحتيال على اختراق الحسابات مباشرة. ورغم أن هذه الحملة تستهدف الأفراد، فإنها تطرح أيضاً تساؤلات أوسع أمام الشركات التي تدير منصات تعاونية. فالأدوات المصممة لتسهيل الانضمام والعمل الجماعي قد تتحول إلى نقاط ضعف إذا لم تُقيّد أو تُراقب بشكل كافٍ.


ماذا يعني أن تصبح «سيري» شبيهة بـ«ChatGPT»؟

تعمل «أبل» على إعادة تصميم «سيري» لتتحول من منفذة أوامر إلى مساعد حواري سياقي شبيه بـ«ChatGPT» (شاترستوك)
تعمل «أبل» على إعادة تصميم «سيري» لتتحول من منفذة أوامر إلى مساعد حواري سياقي شبيه بـ«ChatGPT» (شاترستوك)
TT

ماذا يعني أن تصبح «سيري» شبيهة بـ«ChatGPT»؟

تعمل «أبل» على إعادة تصميم «سيري» لتتحول من منفذة أوامر إلى مساعد حواري سياقي شبيه بـ«ChatGPT» (شاترستوك)
تعمل «أبل» على إعادة تصميم «سيري» لتتحول من منفذة أوامر إلى مساعد حواري سياقي شبيه بـ«ChatGPT» (شاترستوك)

تستعد «سيري»، المساعد الصوتي من شركة «أبل»، لأكبر تحول في تاريخها منذ إطلاقها قبل أكثر من عقد. فحسب تقارير متطابقة من وسائل إعلام تقنية، تعمل «أبل» على إعادة تصميم «سيري» لتتحول من أداة تعتمد على الأوامر الصوتية البسيطة إلى مساعد حواري متقدم، قادر على إجراء محادثات سياقية طويلة، على غرار «شات جي بي تي» (ChatGPT) وغيره من روبوتات الدردشة التوليدية.

لطالما واجهت «سيري» انتقادات بسبب محدودية فهمها للغة الطبيعية مقارنة بمنافسين مثل مساعد «غوغل» ونماذج الذكاء الاصطناعي التوليدي الحديثة. ففي الوقت الذي أصبحت فيه روبوتات الدردشة قادرة على تلخيص المعلومات وشرح المفاهيم المعقدة، والتفاعل مع المستخدمين بسلاسة، بقيت «سيري» مرتبطة بمهام أساسية، مثل ضبط المنبهات أو فتح التطبيقات، مع تحسينات تدريجية لم تغيّر جوهر التجربة.

اليوم، يبدو أن «أبل» تعترف بأن هذا النهج لم يعد كافياً.

من الأوامر إلى الحوار

تُشير التقارير إلى أن «أبل» تعمل على تحويل «سيري» إلى مساعد حواري متكامل، يستطيع متابعة السياق والرد عبر الصوت أو النص، والتعامل مع الأسئلة المركبة بطريقة أكثر طبيعية. ويُمثل هذا التحول قطيعة مع التصميم التقليدي لـ«سيري»، الذي بُني أساساً على تنفيذ أوامر محددة بدلاً من إجراء حوار مفتوح.

ووفق ما نُشر، تعتمد «أبل» في هذه المرحلة على دمج تقنيات ذكاء اصطناعي توليدي متقدمة، من بينها نماذج مثل «جيميناي» من «غوغل» ضمن إطارها الخاص المعروف باسم «ذكاء أبل» (Apple Intelligence). ولا يعني ذلك التخلي عن تطويرها الداخلي، بل الاستفادة من أفضل النماذج المتاحة لتعزيز قدرات «سيري» اللغوية والحوارية. الهدف هو جعل التفاعل مع «سيري» أقرب إلى محادثة حقيقية، بدلاً من سلسلة أوامر منفصلة، وهو ما أصبح معياراً جديداً في عالم المساعدات الذكية.

«سيري» ستستفيد من «غوغل جيميناي» لتعزيز الحوار والسياق ضمن توجه «أبل» لمواكبة الذكاء الاصطناعي التفاعلي (شاترستوك)

استجابة متأخرة

يأتي هذا التحول فيما تتسارع المنافسة على الذكاء الاصطناعي الحواري، فقد اعتاد المستخدمون خلال العامين الماضيين أدوات قادرة على إنتاج نصوص وشرح أفكار والمساعدة في التخطيط واتخاذ القرار. وفي المقابل، بدا أن «أبل» تتحرك بوتيرة أبطأ، مع تركيز واضح على الخصوصية والاستقرار بدل السبق التقني.

ورغم أن الشركة بدأت سابقاً دمج «ChatGPT» خياراً مساعداً ضمن بعض ميزات «ذكاء أبل»، فإن هذه الخطوة أبرزت الفجوة بين «سيري» التقليدية وتجربة الدردشة التوليدية الحديثة. ومع تزايد الاعتماد اليومي على هذه الأدوات، بات من الصعب على «أبل» تجاهل التحول الجاري في طريقة تفاعل المستخدمين مع التقنية.

الخصوصية في التصميم

على عكس بعض المنافسين، لا يبدو أن «أبل» تسعى إلى تحويل «سيري» إلى مجرد واجهة لخدمة سحابية خارجية، فالتقارير تشير إلى أن جزءاً كبيراً من المعالجة سيجري على الجهاز نفسه أو عبر خوادم خاضعة لسيطرة «أبل»، بما ينسجم مع سياستها التقليدية في تقليل جمع البيانات وحماية خصوصية المستخدم. هذا التوازن بين القدرات المتقدمة والخصوصية قد يكون العامل الفارق في تجربة «سيري» الجديدة، لكنه في الوقت نفسه يفرض قيوداً تقنية قد تؤثر في سرعة التطوير مقارنة بمنافسين يعتمدون بشكل أوسع على الحوسبة السحابية.

«سيري» الجديدة تستهدف التكامل العميق مع النظام لفهم ما على الشاشة وربط التطبيقات وتنفيذ مهام متعددة بطلب واحد (شاترستوك)

أكثر من دردشة

ولا يقتصر طموح «أبل» على جعل «سيري» أكثر بلاغة فحسب، بل على جعلها أكثر فاعلية، فالتقارير تُشير إلى أن النسخة الجديدة ستكون قادرة على فهم ما يجري على شاشة الجهاز، وربط المعلومات بين التطبيقات، وتنفيذ مهام متعددة بناءً على طلب واحد بلغة طبيعية. بهذا المعنى، لا تسعى «أبل» إلى تقديم «روبوت دردشة» فقط، بل إلى مساعد ذكي قادر على التحرك داخل النظام، وإدارة المهام اليومية، والتفاعل مع محتوى المستخدم وسياقه. وهذا يعكس توجهاً أوسع في صناعة التقنية نحو ما يُعرف بـ«الذكاء القابل للتنفيذ»؛ حيث لا يكتفي النظام بالإجابة بل يتخذ إجراءً.

ماذا يعني ذلك للمستخدمين؟

من المتوقع أن تكشف «أبل» عن ملامح هذا التحول خلال مؤتمرها السنوي للمطورين في شهر يونيو (حزيران) المقبل، على أن تُطرح التجربة الجديدة ضمن الإصدارات المقبلة من أنظمة «iOS» و«macOS» و«iPadOS». وإذا نجحت الشركة في تنفيذ رؤيتها، فقد تصبح «سيري» جزءاً أكثر مركزية في الحياة الرقمية اليومية لمستخدمي أجهزة «أبل».

لكن التحدي لا يزال قائماً، فالمستخدمون الذين اعتادوا مرونة وسرعة أدوات مثل «ChatGPT» ستكون لديهم توقعات عالية. وسيُقاس نجاح «سيري» الجديدة بمدى قدرتها على الجمع بين الحوار العميق، والتنفيذ العملي، والخصوصية من دون التضحية بتجربة الاستخدام.


روبوتات تفكر وتتحرك: ما الذي يميّز «Rho-Alpha» من «مايكروسوفت»؟

نموذج «Rho-Alpha» يدمج الرؤية واللغة والفعل في إطار تعلم واحد ما يمكّن الروبوتات من التفاعل مع العالم المادي بمرونة أعلى (مايكروسوفت)
نموذج «Rho-Alpha» يدمج الرؤية واللغة والفعل في إطار تعلم واحد ما يمكّن الروبوتات من التفاعل مع العالم المادي بمرونة أعلى (مايكروسوفت)
TT

روبوتات تفكر وتتحرك: ما الذي يميّز «Rho-Alpha» من «مايكروسوفت»؟

نموذج «Rho-Alpha» يدمج الرؤية واللغة والفعل في إطار تعلم واحد ما يمكّن الروبوتات من التفاعل مع العالم المادي بمرونة أعلى (مايكروسوفت)
نموذج «Rho-Alpha» يدمج الرؤية واللغة والفعل في إطار تعلم واحد ما يمكّن الروبوتات من التفاعل مع العالم المادي بمرونة أعلى (مايكروسوفت)

يشهد الذكاء الاصطناعي تقدماً سريعاً في فهم اللغة والصور، إلا أن تحويل هذا الذكاء إلى أفعال ملموسة في العالم الحقيقي لا يزال أحد أكثر التحديات تعقيداً في مجال الحوسبة. وفي هذا السياق، تخطو أبحاث «مايكروسوفت» خطوة مهمة نحو سد هذه الفجوة، من خلال الكشف عن أعمال جديدة تهدف إلى تمكين الروبوتات من الإدراك والتفكير والتنفيذ بفاعلية أكبر داخل البيئات المادية الديناميكية.

وفي صميم هذا التوجه يأتي نموذج جديد يُعرف باسم «Rho-Alpha»، وهو نموذج يجمع بين الرؤية واللغة والفعل، ويهدف إلى مساعدة الروبوتات على تجاوز السلوكيات المبرمجة مسبقاً، والعمل بدرجة أعلى من الاستقلالية. ويعكس هذا النموذج طموح «مايكروسوفت» الأوسع في تطوير أنظمة ذكاء اصطناعي لا تكتفي بفهم المعلومات الرقمية، بل قادرة أيضاً على التفاعل مع العالم الفيزيائي بطرق أكثر مرونة وواقعية.

دمج الإدراك والفعل

على عكس الأنظمة الروبوتية التقليدية التي تعتمد على سلاسل هندسية منفصلة حيث تُعالج الرؤية والتخطيط والتحكم كوحدات مستقلة، يدمج نموذج «Rho-Alpha» هذه القدرات ضمن إطار تعلم واحد. ويتم تدريب النموذج على تحليل المدخلات البصرية، وفهم التعليمات باللغة الطبيعية، وتوليد أفعال جسدية مناسبة، ما يسمح للروبوتات بالاستجابة بسلاسة أكبر للمهام المعقدة.

ويعالج هذا النهج أحد التحديات المزمنة في عالم الروبوتات، المعروف بمشكلة «الميل الأخير». فعلى الرغم من قدرة نماذج الذكاء الاصطناعي على التعرف على الأشياء أو تنفيذ أوامر محددة، فإنها غالباً ما تفشل عند حدوث تغييرات غير متوقعة في البيئة. فاختلاف بسيط في الإضاءة أو موقع الأجسام أو سلوك البشر قد يؤدي إلى تعطل الأنظمة التقليدية. وتسعى أبحاث «مايكروسوفت» إلى جعل الروبوتات أكثر قدرة على التكيف من خلال ربط قراراتها بالسياق الواقعي بدلاً من القواعد الجامدة.

تعلم يتجاوز المختبر

يستند نموذج «Rho-Alpha» إلى التطورات الحديثة في النماذج التأسيسية، مستفيداً من مفاهيم النماذج اللغوية الضخمة والأنظمة متعددة الوسائط، مع تكييفها لمتطلبات التفاعل المادي. وبدلاً من تعلم المهام بشكل منفصل، يستطيع النموذج التعميم عبر سيناريوهات مختلفة، ما يمكّن الروبوتات من التعامل مع أشياء أو تعليمات لم تُصادفها صراحة أثناء التدريب. وتُعد هذه القدرة أساسية لنشر الروبوتات خارج المختبرات والبيئات الخاضعة للتحكم. وتصف أبحاث «مايكروسوفت» هذا العمل بأنه جزء من رؤية أوسع لما يُعرف بـ«الذكاء الاصطناعي المتجسد»، حيث يتشكل الذكاء ليس فقط من البيانات، بل من التفاعل المباشر مع العالم المادي. وفي هذا الإطار، تصبح الرؤية والفعل عنصرين متلازمين، ما يسمح للآلات بالتعلم من التجربة بأسلوب أقرب إلى السلوك البشري.

آفاق التطبيق العملي

تتعدد التطبيقات المحتملة لهذه التقنيات عبر قطاعات مختلفة. ففي البيئات الصناعية، يمكن للروبوتات الأكثر مرونة دعم مهام التصنيع والخدمات اللوجيستية التي تتطلب إعادة تهيئة مستمرة. أما في مجالات الرعاية الصحية والخدمات، فقد تساعد هذه الأنظمة في تنفيذ أنشطة يومية تتطلب تفاعلاً مباشراً مع البشر وبيئات غير متوقعة. ورغم أن «مايكروسوفت» لم تعلن عن منتجات تجارية قائمة على «Rho-Alpha»، فإن هذا البحث يسلط الضوء على قدرات أساسية قد تُمهّد لتطبيقات مستقبلية.

تؤكد «مايكروسوفت» أن التقدم في مجال الذكاء الاصطناعي للعالم المادي لا يقتصر على الأداء التقني فحسب، بل يشمل أيضاً اعتبارات السلامة والموثوقية ومواءمة الأنظمة مع النيات البشرية. فالروبوتات ذاتية التشغيل يجب أن تكون قادرة على فهم التعليمات بدقة، والتعامل مع الحالات الاستثنائية، خصوصاً في البيئات المشتركة مع البشر. لذلك، لا تركز الأبحاث على تعزيز القدرات فقط، بل أيضاً على المتانة والتصميم المسؤول.

يعتمد النموذج على مفهوم الذكاء الاصطناعي المتجسّد حيث يتعلم الروبوت من التجربة المباشرة والتفاعل مع البيئة كما يفعل البشر (مايكروسوفت)

من الذكاء إلى الفعل

يعكس إطلاق نموذج «Rho-Alpha» تحولاً أوسع في صناعة التكنولوجيا. فمع تزايد قدرات الذكاء الاصطناعي في السياقات الرقمية، يتجه الاهتمام تدريجياً نحو كيفية تجسيد هذه القدرات في آلات تعمل في العالم الحقيقي. ويطرح هذا التحول أسئلة جديدة حول جمع البيانات والمحاكاة وطرق التقييم، نظراً لأن البيئات المادية أقل قابلية للتنبؤ مقارنة بالبيئات الافتراضية.

وتشير أبحاث «مايكروسوفت» إلى أن المرحلة المقبلة من تطور الذكاء الاصطناعي لن تُقاس فقط بذكاء النماذج، بل بقدرتها على تحويل هذا الذكاء إلى أفعال ملموسة. ومن خلال توحيد الرؤية واللغة والتحكم ضمن إطار واحد، يمثل نموذج «Rho-Alpha» محطة بحثية مهمة في مسار جعل الذكاء الاصطناعي أكثر حضوراً وفاعلية خارج نطاق الشاشات والخوادم.

ومع تلاشي الحدود بين الذكاء الرقمي والأنظمة المادية، قد تُسهم مثل هذه التطورات في إعادة تشكيل طريقة تعاون الروبوتات مع البشر عبر مختلف القطاعات، في تحول تدريجي من آلات مبرمجة إلى شركاء أكثر وعياً بالسياق وقدرة على التكيف مع العالم الحقيقي.