اختبار حقيقي أمام تطبيقات المساعد الصوتي الافتراضي

مقارنة لأداء أفضل أنواعها المتوافرة

المساعد الصوتي «إيكو» بصوت «أليكسا»
المساعد الصوتي «إيكو» بصوت «أليكسا»
TT

اختبار حقيقي أمام تطبيقات المساعد الصوتي الافتراضي

المساعد الصوتي «إيكو» بصوت «أليكسا»
المساعد الصوتي «إيكو» بصوت «أليكسا»

عندما سألت نظام المساعد الصوتي «أليكسا» في وقت سابق من هذا الأسبوع عن الأندية المشاركة في بطولة «سوبر بول» الأخيرة، أجابت: «الفائز بالبطولة رقم 49 للسوبر بول نادي نيو إنغلاند باتريوتس». وهنا لم أتمالك نفسي، وصحت فيها: «أنت تتحدثين عن العام الماضي. حتى أنا بإمكاني تقديم مستوى أداء أفضل من ذلك!».
في واقع الأمر، كنت في تلك اللحظة بمفردي داخل غرفة المعيشة. أما حديثي فكان موجهًا إلى صديقتي الافتراضية المتمثلة في برنامج «أمازون» اللاسلكي المعروف باسم «إيكو» (Echo)، الذي أطلقته الشركة في يونيو (حزيران) الماضي. يحمل الصوت المتحدث اسم «أليكسا» (Alexa)، وقد أثارت موجة اهتمام واسعة النطاق داخل وادي السليكون، وأصبحت واحدة من أحدث الأعضاء المنضمين لنادي أدوات المساعدة الافتراضية.

مساعد صوتي

يذكر أن جميع الشركات الخمس العملاقة بمجال التقنيات الحديثة - «آبل» و«مايكروسوفت» و«أمازون» و«فيسبوك» و«غوغل»، التي أصبحت الآن جزءًا من «ألفابيت» - تطرح الآن بالأسواق تطبيقات المساعدة الافتراضية، وبإمكانها الاضطلاع بالمهام الرتيبة استجابة لأوامر شفهية توجه إليها أو نقرات على أزرار بعينها. ويعتبر «سيري» (Siri)، من إنتاج «آبل»، أشهر هذه التطبيقات، وقد طرح بالأسواق منذ عام 2011. ومع ذلك، فإن «مايكروسوفت» طرحت بالأسواق الآن «كورتانا» (Cortana)، بينما تجري «فيسبوك» اختبارات على آخر يدعى «إم» (M). أما «غوغل» فقد أعادت بناء المساعد الصوتي الخاص بها لتحوله إلى تطبيقات بحث.
وبينما تقيم هذه الشركات حجم التقدم الذي أحرزته على هذا الصعيد من خلال تقارير العائدات ربع السنوية، فقد قمت من جانبي بصياغة اختبارات لتطبيقات المساعدة الصوتية بهدف تقييم قدراتها على إنجاز 16 مهمة تنتمي لأكثر المجالات التي يستمتع بها غالبية المستهلكين: الموسيقى والإنتاجية والسفر وتناول الطعام والترفيه واهتمامات أخرى مثل الرياضة.
وفي نهاية الاختبارات، لم تحصل أي من تطبيقات المساعدة الصوتية على تقدير لافت يستحق الشعور بالفخر إزاءه. وفي ما يلي درجات التقييم التي حصل عليها كل جهاز من إجمالي 4 نقاط:
- «غوغل» (غوغل) - 3.1
- «سيري» (آبل) - 2.9
- «كورتانا» (مايكروسوفت) - 2.3
- «أليكسا» (أمازون) - 1.7

أداء متميز

وجاء أداء «آبل» الأفضل من حيث مهام الإنتاجية، مثل مواعيد الروزنامة ورسائل البريد الإلكتروني. أما «غوغل» فكانت الأفضل في السفر والمهام المرتبطة بالتنقل اليومي باستخدام وسائل المواصلات، بينما برعت «أليكسا» في الموسيقى. وأخيرًا، جاء أداء «كورتانا» متوسطًا بمختلف المجالات. وبالنسبة لـ«فيسبوك» فظل خارج منظومة التقييم بسبب رفض الشركة إتاحة «إم»، رغم أنني تمكنت من التعامل معه على مدار ساعتين من خلال حساب لأحد الأصدقاء.
من جانبها، أعلنت «آبل» أن «سيري» أصبح «أسرع وأذكى»، بجانب قدرته على الحديث بعدد لغات أكثر من أي مساعد صوتي آخر. في المقابل، قالت «مايكروسوفت» إن «كورتانا» تمثل «مجرد البداية فحسب». كما أبدت «غوغل» رغبتها في تطوير الهواتف الذكية على نحو يمكنها من الاضطلاع بمزيد من المهام الصعبة، وبحيث يتمكن المستخدمون من الاضطلاع بمجموعة متنوعة من المهام عبر مجرد الحديث إلى «غوغل». أما «أمازون» فلم تستجب لطلب تقدمنا به إليها للحصول على تعليق.
على صعيد الإنتاجية، كان «سيري»، الذي يمكن استدعاؤه عبر ضغط زر على شاشة «آي فون» أو بمجرد قول «مرحبا سيري»، صاحب القدرة الأفضل على وضع جدول للقاء بصديق في هاواي، واستعراض المواعيد المسجلة بجدول أعمالي للغد، وإرسال رسالة عبر البريد الإلكتروني وقراءة إحدى الرسائل التي وردت عبر البريد الإلكتروني بصوت مرتفع. أما التطبيقات الأخرى فنجحت في إنجاز فقط بعض هذه المهام، بينما عجزت «أليكسا» عن كتابة رسالة بريد إلكتروني وتسجيل حدث وضمه إلى روزنامة المواعيد.
أيضا، قدم «سيري» أداء جيدًا في المهام المرتبطة بالموسيقى، لكن «أليكسا» تفوقت عليه. استطاع كلا التطبيقين تشغيل أغنية «هاي»، أحدث حلقات «راديولاب»، بجانب عزف مقاطع موسيقية. علاوة على ذلك، استطاعت «أليكسا»، التي يمكن استدعاؤها بمجرد نطق اسمها، تشغيل محطة موسيقية بعينها عبر «باندورا»، بينما فشل «سيري» في تشغيل تطبيق «باندورا».

من ناحية أخرى، حاز موقع «غوغل»، الذي يعمل على تحويل جهاز المساعدة الصوتية إلى تطبيق متوافر عبر هواتف «غوغل»، التقييم الأعلى في إنجاز المهام المرتبطة بالسفر والتنقل عبر وسائل المواصلات. وجاءت استجابته ممتازة لسؤال: «ما حالة المرور في 221 ماين ستريت؟»، حيث أوضح لي المدة الزمنية التي سأستغرقها في الانتقال بالسيارة إلى هناك.
وعندما وجهت إليه الطلب التالي: «خذني إلى صالة (دوغباتش بولدرز) للألعاب الرياضية»، أظهر أمامي خريطة تصاحبها توجيهات صوتية. وعندما قلت: «اعثر لي على تذاكر طائرة إلى نيويورك الأسبوع المقبل»، جاءت استجابته مذهلة، حيث عرض علي رحلات جوية من سان فرانسيسكو إلى نيويورك الأسبوع المقابل تبدأ أسعارها من 435 دولارا، وبلغت مدة الرحلة الأقصر خمس ساعات و10 دقائق.
في ما يخص السفر والتنقل عبر وسائل المواصلات، عرضت «كورتانا» إجابات عن أسئلة بخصوص المرور والاتجاهات، لكنها عجزت عن الإجابة عن أسئلة تخص رحلات الطيران. أما «سيري» فجاء أداؤه ضعيفًا للغاية في هذه الفئة، حيث عجز عن تقديم تقييم لحركة المرور. ولدى سؤاله عن رحلات الطيران إلى نيويورك، سرد مجموعة غير مفيدة من موقع شبكة الإنترنت المعنية بالسفر لنيويورك. وبدلا من إظهار خريطة توضح مكان صالة ألعاب رياضية، عرض عنوان حانة!
أما «أليكسا» فتمكنت من تقديم تقييمات لحركة المرور عن موقع واحد ثابت مسجل لديها، مثل مكتبك.

تفاوت الاستجابة

بالنسبة للمهام المرتبطة بالطعام، جاء أداء «غوغل» و«آبل» متكافئًا، حيث تمكن كلاهما من إيجاد قائمة بالمطاعم الهندية القريبة، لكن المساعد الصوتي «غوغل» كان الوحيد القادر على طلب خدمة توصيل الطعام للمنازل، لكن ذلك تم فقط من خلال طلب مطعم بعينه لديه خدمة تسجيل الطلبات عبر واحدة من التطبيقات التي يتعامل معها «غوغل». أما «سيري» فكان الوحيد القادر على حجز مائدة داخل أحد المطاعم.
في ما يتعلق بالاهتمامات الخاصة، سألت كل مساعد صوتي سؤالين واضحين: ما الأندية الفائزة بمباريات كرة القدم الأميركية أخيرا، ومن خاض «سوبر بول»؟ قام كل من «غوغل» و«كورتانا» و«سيري» بتجميل نتائج المباريات الصادرة، عن الدوري الوطني لكرة القدم الأميركية، لكن «غوغل» و«كورتانا» فقط استطاعا الإشارة إلى اسمي الفريقين، بينما عجز «سيري» عن ذكر المباراة الكبرى التي أقيمت 7 فبراير (شباط) على استاد ليفي في سانتا كلارا بكاليفورنيا. في المقابل، بدت خدمة «أليكسا» على غير دراية بهذه الرياضة، وعجزت عن إجابة السؤالين.
وينقلني ذلك إلى المساعد الصوتي «إم» الخاص بـ«فيسبوك»، حيث رفضت الشركة طلبي الاطلاع على التطبيق، ولم تتح ذلك حتى الآن سوى لعدد محدود للغاية من الخبراء المعنيين باختبار التطبيق الجديد. وعليه، لجأت لاستخدام حساب أحد الأصدقاء عبر «فيسبوك ميسنجر» لمقابلة «إم». تبعًا لما أعلنته الشركة، فإن «إم» يخضع في جزء منه لسيطرة نظام الذكاء الصناعي، بينما يخضع جزء آخر لسيطرة بشرية. ويمكنك التواصل مع «إم» عبر بعث رسائل إليه من خلال خدمة «فيسبوك ميسنجر»، تمامًا مثلما تبعث برسالة لصديق.
خلال الفترة المحدودة التي قضيتها مع «إم»، طلبت منه القيام بمهام عادية، مثل الاتصال بشركة المياه للاستفسار منها عن فاتورة الاستخدام، والتعرف على منتجات اللحوم المعروضة بمتجر «هول فودز» المحلي، والبحث عن الوقت الذي تصبح فيه تكلفة السفر لهونغ كونغ في أرخص مستوى.
وغاب «إم» للحظات قلائل قبل الإجابة عن كل سؤال، الأمر الذي جعلني أتشكك أن شخصًا ما هو الذي تولى الإجابة. وعندما طلبت من «إم» حجز موعد لي لجلسة تصوير مع استوديو يمتلكه صديق لي. في غضون دقائق، رن جرس الهاتف في الاستوديو، والتقط صديقي السماعة، وهنا قال «إم» الذي يحمل صوت امرأة شابة: «مرحبا، إنني أتصل نيابة عن رئيسي بالعمل، فهو يرغب في معرفة ما إذا كان بإمكانكم عقد جلسة تصوير له غدًا في الثانية ظهرًا».
ورد صديقي: «عذرًا لم أعرف اسمك بعد؟»، فجاءه الرد: «اسمي الأول (إم)، أما اسمي الأخير فهو (ميسنجر)». وسأل صديقي: «هل هذا اسم يوناني؟»، وهنا انطلق «إم» في الضحك.
ويشير ذلك إلى أن «إم» ربما يكون أفضل في قدراته عن جميع التطبيقات السابقة، لكن هذا يعود لوجود عناصر بشرية وراء تتولى إدارة المهام التي يعجز عنها الذكاء الصناعي. وفي بيان لها أعلنت «فيسبوك»: «(إم) لا يزال في مرحلة مبكرة للغاية، ولسنا مهتمين حاليًا بطرحه على عدد كبير من الأشخاص».

* خدمة «نيويورك تايمز»



3 نماذج ذكاء اصطناعي جديدة من «مايكروسوفت» للصوت والصورة والنص

أطلقت «مايكروسوفت» 3 نماذج «MAI» جديدة تشمل تحويل الصوت إلى نص وتوليد الصوت وإنشاء الصور (مايكروسوفت)
أطلقت «مايكروسوفت» 3 نماذج «MAI» جديدة تشمل تحويل الصوت إلى نص وتوليد الصوت وإنشاء الصور (مايكروسوفت)
TT

3 نماذج ذكاء اصطناعي جديدة من «مايكروسوفت» للصوت والصورة والنص

أطلقت «مايكروسوفت» 3 نماذج «MAI» جديدة تشمل تحويل الصوت إلى نص وتوليد الصوت وإنشاء الصور (مايكروسوفت)
أطلقت «مايكروسوفت» 3 نماذج «MAI» جديدة تشمل تحويل الصوت إلى نص وتوليد الصوت وإنشاء الصور (مايكروسوفت)

أطلقت «مايكروسوفت» 3 نماذج جديدة من الذكاء الاصطناعي ضمن منصة «فاوندري (Foundry)» في خطوة تعكس توجهاً واضحاً نحو بناء منظومة متكاملة تدعم التطبيقات متعددة الوسائط، بدلاً من الاعتماد على نماذج منفصلة لكل استخدام. وبحسب ما ورد في مدونة رسمية للشركة، تشمل النماذج الجديدة «MAI-Transcribe-1» لتحويل الصوت إلى نص، و«MAI-Voice-1» لتوليد الصوت، و«MAI-Image-2» لإنشاء الصور، وهي متاحة حالياً للمطورين عبر «Foundry» وبيئة «MAI Playground».

من نماذج منفصلة إلى منظومة متكاملة

تعكس هذه الخطوة تحولاً في طريقة بناء تطبيقات الذكاء الاصطناعي. فبدلاً من الاعتماد على نموذج واحد شامل، تتجه «مايكروسوفت» نحو تطوير مجموعة من النماذج المتخصصة، كل منها يعالج نوعاً مختلفاً من بيانات الصوت والصورة والنص.

هذا النهج ينسجم مع الاتجاه الأوسع في الصناعة نحو ما يُعَرف بـ«الذكاء الاصطناعي متعدد الوسائط»، حيث يمكن للأنظمة التعامل مع أنواع مختلفة من المدخلات والمخرجات ضمن تجربة واحدة متكاملة.

أحد أبرز النماذج الجديدة هو «MAI-Transcribe-1»، المصمم لتحويل الكلام إلى نَصٍّ بدقة عالية، حتى في البيئات غير المثالية مثل الضوضاء أو تسجيلات الاجتماعات.

تشير «مايكروسوفت» إلى أنَّ النموذج يدعم 25 لغة من أكثر اللغات استخداماً، ويحقِّق أداءً متقدماً وفق معايير قياس معتمدة، مع سرعة معالجة أعلى مقارنة بأنظمة سابقة. كما تمَّ تصميمه للعمل في ظروف واقعية، مثل مراكز الاتصال أو الاجتماعات، حيث تتداخل الأصوات وتختلف جودة التسجيل. هذا التركيز على «البيئة الواقعية» يعكس تحولاً في تصميم النماذج، من الأداء في المختبرات إلى الأداء في الاستخدام الفعلي.

تركز النماذج على الأداء في البيئات الواقعية وسرعة المعالجة وليس فقط نتائج المختبر (مايكروسوفت)

الصوت الاصطناعي

يركز نموذج «MAI-Voice-1» على توليد الصوت، مع محاولة جعل النتائج أكثر واقعية من حيث النبرة والتعبير. ووفقاً للمدونة، يمكن للنموذج إنتاج صوت طبيعي يحافظ على هوية المتحدث حتى في المحتوى الطويل. كما يتيح إنشاء أصوات مخصصة باستخدام عينة قصيرة من التسجيل الصوتي. ويتميَّز كذلك بسرعة عالية، حيث يمكنه توليد دقيقة من الصوت خلال ثانية واحدة تقريباً، ما يفتح المجال أمام استخدامه في تطبيقات مثل المساعدات الصوتية، أو المحتوى الصوتي التفاعلي.

توليد الصور

أما النموذج الثالث الذي يدعى «MAI-Image-2» فيركز على إنشاء الصور مع تحسينات في السرعة والأداء. تشير «مايكروسوفت» إلى أنَّ النموذج يوفِّر سرعة توليد أعلى تصل إلى ضعفين مقارنة بالإصدارات السابقة، مع الحفاظ على جودة مناسبة للاستخدامات الإبداعية مثل التصميم والإعلانات. كما تمَّ تصميمه ليلبي احتياجات المُصمِّمين وصناع المحتوى، من خلال تحسين عناصر مثل الإضاءM، ودقة التفاصيل، والنصوص داخل الصور.

صور أنشأتها «WPP» باستخدام «MAI-Image-2» (مايكروسوفت)

السرعة والتكلفة... عاملان حاسمان

إلى جانب الأداء، تركز «مايكروسوفت» على جانب التكلفة الذي لا يقل أهمية. تشير الشركة إلى أنَّ النماذج الجديدة تقدِّم ما تصفه بـ«أفضل توازن بين السعر والأداء»، مع كفاءة أعلى في استخدام الموارد، بما في ذلك تقليل استهلاك وحدات المعالجة الرسومية (GPU). هذا الجانب يعكس واقعاً متزايد الأهمية في سوق الذكاء الاصطناعي، حيث لم يعد التحدي في بناء النماذج فقط، بل في تشغيلها على نطاق واسع بتكلفة مقبولة.

لا يمكن فصل هذا الإعلان عن استراتيجية «مايكروسوفت» الأوسع في مجال الذكاء الاصطناعي. فإطلاق نماذج داخلية يُعزِّز استقلالية الشركة، ويقلل اعتمادها على شركاء خارجيِّين، في ظلِّ منافسة متزايدة مع شركات مثل «غوغل»، و«أمازون». كما أنَّ دمج هذه النماذج داخل منتجات مثل «كوبايلوت (Copilot)»، و«تيمز (Teams)»، و«بينغ (Bing)» يشير إلى توجه نحو تحويل الذكاء الاصطناعي من ميزة إضافية إلى بنية أساسية داخل المنتجات الرقمية.

تسعى «مايكروسوفت» إلى تحقيق توازن بين الكفاءة والتكلفة في تشغيل نماذج الذكاء الاصطناعي (مايكروسوفت)

من النماذج إلى التطبيقات

رغم أنَّ الإعلان يركز على النماذج نفسها، فإنَّ القيمة الحقيقية تظهر في كيفية استخدامها. تَوفُّر هذه الأدوات للمطورين يعني إمكانية بناء تطبيقات تجمع بين الصوت والنص والصورة ضمن تجربة واحدة.

هذا قد يفتح المجال أمام تطبيقات جديدة، مثل أنظمة تحويل الاجتماعات إلى نصوص قابلة للبحث، ومساعدات صوتية أكثر واقعية، وأدوات تصميم مدعومة بالذكاء الاصطناعي.

في المجمل، يشير إطلاق هذه النماذج إلى مرحلة جديدة في تطور الذكاء الاصطناعي، حيث لم يعد التركيز على نموذج واحد قوي، بل على منظومة متكاملة من النماذج المتخصصة. وبينما لا تزال المنافسة في هذا المجال في مراحل متسارعة، فإنَّ ما يتضح هو أن الاتجاه العام يتجه نحو بناء بنى تحتية للذكاء الاصطناعي، وليس مجرد أدوات منفصلة.


القمر مختبراً... كيف يشكّل «أرتميس» بروفة «ناسا» لرحلات المريخ؟

رواد الفضاء الأربعة في مهمة «أرتميس ‌2» (ناسا)
رواد الفضاء الأربعة في مهمة «أرتميس ‌2» (ناسا)
TT

القمر مختبراً... كيف يشكّل «أرتميس» بروفة «ناسا» لرحلات المريخ؟

رواد الفضاء الأربعة في مهمة «أرتميس ‌2» (ناسا)
رواد الفضاء الأربعة في مهمة «أرتميس ‌2» (ناسا)

تُقدم مهمة «أرتميس ‌2» (Artemis II) من «ناسا» بوصفها أول رحلة مأهولة ضمن برنامج العودة إلى القمر منذ عقود. لكن في الواقع، يمكن فهم ذلك بشكل أدق كمرحلة تمهيدية «أو بروفة» لهدف أبعد وأكثر تعقيداً وهو إرسال البشر إلى المريخ.

فعلى عكس مهام «أبولو» في ستينات القرن الماضي وسبعيناته، التي ركزت على الهبوط قصير المدى والإنجاز الرمزي، صُمم برنامج «أرتميس» حول فكرة الوجود المستدام. وهذا الفرق جوهري في قيمته الاستراتيجية. فالقمر هنا ليس الوجهة النهائية، بل ساحة اختبار تُجرَّب فيها التقنيات والقدرات البشرية ونماذج التشغيل في بيئة فضائية حقيقية، قبل الانتقال إلى رحلات متعددة السنوات نحو المريخ.

رائد الفضاء فيكتور غلوفر يجري فحوص تسرّب على بدلته الفضائية داخل غرفة تجهيز الطاقم (ناسا)

اختبار التقنيات خارج مدار الأرض

يتمثل أحد الأدوار الأساسية لـ«أرتميس» في اختبار التقنيات التي ستكون حاسمة لاستكشاف الفضاء العميق. فبعثات المريخ ستتطلب أنظمة قادرة على العمل بشكل مستقل لفترات طويلة، مع دعم محدود من الأرض.

على سطح القمر، تخطط «ناسا» لاختبار أنظمة دعم الحياة القادرة على إعادة تدوير الهواء والماء بكفاءة لفترات ممتدة. ويجب أن تعمل هذه الأنظمة بشكل موثوق في بيئات يصعب فيها الإمداد، حيث لا مجال للأخطاء. كما ستُختبر أنظمة توليد الطاقة التي تعتمد إلى حد كبير على الطاقة الشمسية في ظروف قاسية، تشمل ليالي قمرية قد تمتد لأسبوعين.

ومن المجالات الأساسية أيضاً، استخدام الموارد المحلية (ISRU)؛ إذ يُعتقد أن القطب الجنوبي للقمر يحتوي على جليد مائي يمكن تحويله أكسجيناً للتنفس وهيدروجيناً كوقود. وإذا ثبتت جدوى ذلك، فقد يقلل الحاجة إلى نقل كميات كبيرة من الموارد من الأرض، وهو أمر يصبح ضرورياً في بعثات المريخ.

كما ستُختبر أنظمة الحركة على السطح، والمساكن، والعمليات الميدانية، بما في ذلك المركبات الجوالة المضغوطة، والوحدات السكنية القابلة للتوسعة، والأنظمة الروبوتية المساندة للرواد.

صورة أيقونية لأثر قدم بسطح القمر خلال السير على القمر في مهمة «أبوبو 11» 20 يوليو 1969 (ناسا)

قدرة الإنسان على التحمل

يطرح إرسال البشر خارج مدار الأرض المنخفض تحديات لم تُختبر بشكل كافٍ منذ حقبة «أبولو». ويوفر «أرتميس» فرصة لدراسة أداء الرواد خلال مهام أطول في بيئات فضائية أكثر قسوة.

ويُعدّ التعرض للإشعاع أحد أبرز هذه التحديات. فعلى عكس رواد محطة الفضاء الدولية، الذين يستفيدون من حماية جزئية يوفرها المجال المغناطيسي للأرض، سيتعرض رواد القمر ومن ثم المريخ لمستويات أعلى من الإشعاع الكوني. وفهم كيفية الحد من هذه المخاطر سيكون أمراً حاسماً.

كما أن العوامل النفسية والبدنية لا تقل أهمية؛ إذ يمكن للعزلة الطويلة وضيق المساحات وتأخر الاتصالات أن تؤثر على أداء الطاقم. ورغم أن القمر يبعد بضعة أيام فقط عن الأرض، فإنه يوفّر بيئة أكثر واقعية من المدار الأرضي لدراسة هذه التأثيرات. ومن المتوقع أن توفر مهام «أرتميس» خاصة تلك التي تتضمن إقامة أطول على سطح القمر، بيانات مهمة لتطوير معايير اختيار الرواد وتدريبهم والتخطيط لبعثات المريخ.

لقطة مقرّبة لوجه رائد الفضاء توماس سترافورد قائد مهمة «أبوبو 10» (ناسا)

بناء لوجيستيات الفضاء وإدارتها

تمثل اللوجيستيات مجالاً آخر يعمل فيه «أرتميس» كمنصة اختبار. فالوجود المستدام على القمر يتطلب تطوير سلاسل إمداد تمتد إلى ما وراء الأرض، تشمل نقل المعدات والوقود والمواد الاستهلاكية عبر مهام متعددة.

ويلعب «Lunar Gateway» دوراً محورياً في هذه المنظومة؛ إذ يُخطط أن يكون محطة مدارية حول القمر تُستخدم نقطةَ انطلاقٍ للبعثات إلى السطح والعودة منه، إضافة إلى كونه منصةً للتعاون الدولي.

ويعكس هذا النهج القائم على توزيع مكونات المهمة عبر منصات متعددة التعقيد المتوقع في بعثات المريخ، حيث يجب تنسيق العمل بين مركبات فضائية، وأنظمة سطحية، وبنية تحتية مدارية.

كما تشمل هذه المنظومة أنظمة الاتصال. فرغم أن القمر يتيح اتصالاً شبه فوري مع الأرض، فإن بعثات المريخ ستشهد تأخراً قد يصل إلى 20 دقيقة في كل اتجاه. لذلك؛ يُعدّ تطوير أنظمة أكثر استقلالية وقدرة على اتخاذ القرار، أمراً ضرورياً، ويشكّل «أرتميس» خطوة وسيطة نحو ذلك.

نموذج تشغيلي جديد

يعكس «أرتميس» أيضاً تحولاً في طريقة تنظيم المهام الفضائية. فبعكس «أبولو» التي كانت تقودها الحكومات بالكامل، يعتمد «أرتميس» بشكل كبير على الشراكات مع القطاع الخاص والجهات الدولية.

فمشاركة الشركات الخاصة مثل تطوير أنظمة الهبوط البشري تُدخل ديناميكيات جديدة تتعلق بالتكلفة والابتكار وتقاسم المخاطر. كما أن التعاون الدولي يوسّع نطاق البرنامج من الناحيتين التقنية والسياسية.

ومن المرجح أن يكون هذا النموذج ضرورياً لبعثات المريخ، التي تتطلب موارد وخبرات تتجاوز قدرات جهة واحدة. وبذلك يُعدّ «أرتميس» ليس فقط منصة اختبار تقنية، بل أيضاً تجربة في الحوكمة والتعاون.

صاروخ «ناسا» العملاق «أرتميس إس إل إس» في مركز كيندي الفضائي (ناسا)

القمر نقطةَ انطلاق

لم يكن اختيار القمر ميدانَ اختبار أمراً عشوائياً. فبفضل قربه من الأرض؛ يمكن تنفيذ مهام متكررة وتدريجية، مع الحفاظ على مستوى مقبول من المخاطر.

ففي حال حدوث خلل، تظل إمكانية التدخل أو الإمداد قائمة، على عكس بعثات المريخ، حيث تصبح هذه الخيارات شبه مستحيلة. وهذا يجعل القمر بيئة مناسبة لاختبار الأنظمة في ظروف واقعية دون تحمل المخاطر الكاملة للرحلات بين الكواكب.

ومع ذلك، لا يمكن تجاهل الفروقات بين القمر والمريخ، فالمريخ يمتلك غلافاً جوياً وجاذبية مختلفة وظروفاً بيئية أكثر تعقيداً. ورغم أن «أرتميس» لا يحاكي هذه العوامل بالكامل، فإنه يسهِم في تقليل درجة عدم اليقين في عناصر أساسية.

أبعد من مجرد عودة

قد يُقلل وصف «أرتميس» بأنه مجرد عودة إلى القمر من فهم غايته الحقيقية. فالبرنامج يمثل انتقالاً من الاستكشاف المؤقت إلى الوجود المستدام، ومن المهام المنفصلة إلى الأنظمة المتكاملة.

وبهذا المعنى، لا يتعلق «أرتميس» بإعادة زيارة وجهة معروفة، بل بالتحضير لوجهة غير مسبوقة. فالتقنيات ونماذج التشغيل والعوامل البشرية التي يجري اختبارها على القمر تشكّل جميعها عناصر أساسية لمهمة أكبر. ويبقى نجاح هذا النهج في تمهيد الطريق إلى المريخ سؤالاً مفتوحاً، في ظل التحديات التقنية والتمويلية وتأخيرات الجدول الزمني.

لكن ما يبدو واضحاً هو المنطق الاستراتيجي وراءه: القمر يوفر بيئة يمكن من خلالها اختبار أسس استكشاف الفضاء العميق. ومن خلال ذلك، يضع «أرتميس» نفسه ليس بوصفه نهاية، بل بوصفه خطوة أساسية نحو الوجهة التالية.


«Gemma 4» من «غوغل»: ذكاء اصطناعي مفتوح يعمل على الأجهزة الشخصية

أطلقت «غوغل» نموذج «Gemma 4» بترخيص مفتوح يتيح الاستخدام والتعديل والنشر دون قيود كبيرة (رويترز)
أطلقت «غوغل» نموذج «Gemma 4» بترخيص مفتوح يتيح الاستخدام والتعديل والنشر دون قيود كبيرة (رويترز)
TT

«Gemma 4» من «غوغل»: ذكاء اصطناعي مفتوح يعمل على الأجهزة الشخصية

أطلقت «غوغل» نموذج «Gemma 4» بترخيص مفتوح يتيح الاستخدام والتعديل والنشر دون قيود كبيرة (رويترز)
أطلقت «غوغل» نموذج «Gemma 4» بترخيص مفتوح يتيح الاستخدام والتعديل والنشر دون قيود كبيرة (رويترز)

توسّع شركة «غوغل» توجهها نحو الذكاء الاصطناعي المفتوح مع إطلاق «غاما4» (Gemma 4)، وهو جيل جديد من النماذج المصممة للعمل، ليس فقط في مراكز البيانات، بل أيضاً محلياً على الأجهزة الشخصية. يعكس هذا التوجه تحوّلاً أوسع في الصناعة نحو جعل الذكاء الاصطناعي المتقدم أكثر إتاحة، مع منح المطورين تحكماً أكبر في كيفية تشغيل هذه الأنظمة ومكانها.

يبني «Gemma 4» على عائلة نماذج «Gemma» التي طرحتها «غوغل» سابقاً كبديل خفيف لنماذجها الأكثر قوة ولكن المغلقة ضمن منظومة «جيميناي» ( Gemini). وعلى عكس النماذج التي تعتمد على السحابة، تم تصميم «غاما» ليكون خياراً أكثر مرونة، يتيح للمطورين تشغيل تطبيقات الذكاء الاصطناعي على أجهزتهم الخاصة.

تفعيل الميزة اختياري ويمنح المستخدم تحكماً كاملاً في البيانات التي يتم استخدامها (أ.ف.ب)

انفتاح وذكاء محلي

في هذا الإصدار الجديد، توسّع «غوغل» هذا النهج بشكل واضح، حيث أصبح «Gemma 4» متاحاً بترخيص «Apache 2.0»، ما يتيح للمطورين استخدام النماذج وتعديلها ونشرها بحرية دون قيود صارمة. وتُعد هذه الدرجة من الانفتاح مهمة في سوق لا تزال فيه العديد من النماذج «المفتوحة» تفرض قيوداً على الاستخدام أو الوصول.

إحدى أبرز ميزات «Gemma 4» هي قدرته على العمل محلياً عبر مجموعة واسعة من الأجهزة. فقد صُممت النماذج لتتدرج من الخوادم القوية إلى الحواسيب المحمولة والهواتف الذكية وحتى الأجهزة الصغيرة مثل «رازبيري باي» (Raspberry Pi). ويتيح هذا النهج المعروف بالاعتماد على التشغيل المحلي بناء تطبيقات لا تحتاج إلى اتصال دائم بالسحابة، ما يقلل من زمن الاستجابة والتكاليف التشغيلية، ويعزز خصوصية البيانات.

كما تعكس التحسينات التقنية في «Gemma 4» طموحاً أوسع، إذ تصفه «غوغل» بأنه الأكثر قدرة ضمن نماذجها المفتوحة حتى الآن، مع تحسينات في قدرات الاستدلال ودعم سير عمل أكثر تعقيداً. وتشمل هذه القدرات حل المشكلات متعددة الخطوات، إضافة إلى ما يُعرف بالقدرات «الوكيلة» (Agentic)، حيث يمكن للنظام تنفيذ مهام، واستدعاء وظائف، والتفاعل مع البيانات بشكل أكثر استقلالية.

ومن الجوانب المهمة أيضاً دعم تعدد الوسائط، حيث يمكن لـ«Gemma 4» التعامل ليس فقط مع النصوص، بل أيضاً مع أنواع أخرى من البيانات مثل الصور أو الصوت، بحسب النسخة المستخدمة. ويتماشى ذلك مع اتجاه أوسع في الصناعة نحو تطوير أنظمة قادرة على فهم ودمج أنواع مختلفة من المدخلات.

وتتوفر النماذج بأحجام متعددة، ما يمنح المطورين مرونة في الاختيار بين نسخ خفيفة مناسبة للأجهزة المحمولة، وأخرى أكبر للأعمال الأكثر تعقيداً. وتُعد هذه المرونة جزءاً أساسياً من استراتيجية «غوغل» لتوسيع استخدام الذكاء الاصطناعي في بيئات ذات موارد محدودة.

يعكس الإطلاق توجهاً نحو ذكاء اصطناعي أكثر انفتاحاً وتوزيعاً مع استمرار تحديات الأداء والحوكمة (أ.ف.ب)

صعود الذكاء المحلي

يسلّط هذا الإطلاق الضوء على الأهمية المتزايدة لـ«الذكاء الاصطناعي المحلي» (Local AI). فتشغيل النماذج مباشرة على الأجهزة وما يُعرف أيضاً بـ«Edge AI» يُنظر إليه بشكل متزايد كحل لمعالجة قضايا مثل سيادة البيانات والخصوصية والتكلفة. ومن خلال إبقاء البيانات على الجهاز، يمكن للمؤسسات تقليل اعتمادها على البنية التحتية السحابية والتحكم بشكل أكبر في المعلومات الحساسة.

ويكتسب هذا التوجه أهمية، خاصة في قطاعات مثل الرعاية الصحية والبرمجيات المؤسسية والخدمات الحكومية، حيث قد تقيّد المتطلبات التنظيمية استخدام الذكاء الاصطناعي القائم على السحابة. ويوفر التشغيل المحلي بديلاً يسمح بإدماج قدرات متقدمة مع الالتزام بمعايير الخصوصية.

في المقابل، يعكس الانفتاح المتزايد في النماذج أيضاً اشتداد المنافسة في سوق الذكاء الاصطناعي. فشركات مثل «ميتا» إلى جانب مجتمعات المصادر المفتوحة، تعمل على تطوير نماذج متقدمة، ما يدفع الشركات الكبرى إلى تبني استراتيجيات أكثر انفتاحاً. ومن خلال «Gemma 4» تسعى «غوغل» إلى ترسيخ موقعها ضمن هذا المشهد المتغير.

مع ذلك، يبقى مفهوم «الانفتاح» في الذكاء الاصطناعي محل نقاش. فحتى مع تراخيص مرنة مثل «Apache 2.0» لا تكون جميع جوانب تطوير النماذج مثل بيانات التدريب مكشوفة بالكامل. ويستمر الجدل حول ما إذا كانت هذه النماذج تمثل انفتاحاً حقيقياً، خصوصاً مع تزايد قوتها وتأثيرها.

كما تواجه النماذج المحلية تحديات عملية، إذ يتطلب تشغيل الذكاء الاصطناعي المتقدم على الأجهزة تحسينات دقيقة لتحقيق توازن بين الأداء وحدود العتاد، خاصة في الهواتف والأجهزة الصغيرة. ويزداد التعقيد عند محاولة ضمان أداء متسق عبر بيئات مختلفة.

تفعيل الميزة اختياري ويمنح المستخدم تحكماً كاملاً في البيانات التي يتم استخدامها (أ.ف.ب)

تحول نحو اللامركزية

رغم هذه التحديات، يشير إطلاق «Gemma 4» إلى اتجاه واضح، وهو انتقال الذكاء الاصطناعي من الاعتماد الكامل على السحابة إلى نماذج أكثر توزيعاً ومرونة. فلم يعد المطورون مضطرين للوصول إلى الذكاء الاصطناعي عبر واجهات برمجة التطبيقات فقط، بل بات بإمكانهم دمجه مباشرة داخل التطبيقات والأجهزة.

ويحمل هذا التحول تداعيات أوسع على كيفية تطوير الذكاء الاصطناعي والتحكم فيه وتحقيق العوائد منه. فالنماذج المفتوحة والمحلية قد تقلل الاعتماد على المنصات الكبرى، وتمنح الشركات الصغيرة والمطورين المستقلين مساحة أكبر للابتكار.

في الوقت نفسه، يثير هذا الانفتاح أسئلة جديدة حول الحوكمة والسلامة والمسؤولية. فكلما أصبحت أدوات الذكاء الاصطناعي أكثر قوة وانتشاراً، ازدادت الحاجة إلى ضمان استخدامها بشكل مسؤول.