اختبار حقيقي أمام تطبيقات المساعد الصوتي الافتراضي

مقارنة لأداء أفضل أنواعها المتوافرة

المساعد الصوتي «إيكو» بصوت «أليكسا»
المساعد الصوتي «إيكو» بصوت «أليكسا»
TT

اختبار حقيقي أمام تطبيقات المساعد الصوتي الافتراضي

المساعد الصوتي «إيكو» بصوت «أليكسا»
المساعد الصوتي «إيكو» بصوت «أليكسا»

عندما سألت نظام المساعد الصوتي «أليكسا» في وقت سابق من هذا الأسبوع عن الأندية المشاركة في بطولة «سوبر بول» الأخيرة، أجابت: «الفائز بالبطولة رقم 49 للسوبر بول نادي نيو إنغلاند باتريوتس». وهنا لم أتمالك نفسي، وصحت فيها: «أنت تتحدثين عن العام الماضي. حتى أنا بإمكاني تقديم مستوى أداء أفضل من ذلك!».
في واقع الأمر، كنت في تلك اللحظة بمفردي داخل غرفة المعيشة. أما حديثي فكان موجهًا إلى صديقتي الافتراضية المتمثلة في برنامج «أمازون» اللاسلكي المعروف باسم «إيكو» (Echo)، الذي أطلقته الشركة في يونيو (حزيران) الماضي. يحمل الصوت المتحدث اسم «أليكسا» (Alexa)، وقد أثارت موجة اهتمام واسعة النطاق داخل وادي السليكون، وأصبحت واحدة من أحدث الأعضاء المنضمين لنادي أدوات المساعدة الافتراضية.

مساعد صوتي

يذكر أن جميع الشركات الخمس العملاقة بمجال التقنيات الحديثة - «آبل» و«مايكروسوفت» و«أمازون» و«فيسبوك» و«غوغل»، التي أصبحت الآن جزءًا من «ألفابيت» - تطرح الآن بالأسواق تطبيقات المساعدة الافتراضية، وبإمكانها الاضطلاع بالمهام الرتيبة استجابة لأوامر شفهية توجه إليها أو نقرات على أزرار بعينها. ويعتبر «سيري» (Siri)، من إنتاج «آبل»، أشهر هذه التطبيقات، وقد طرح بالأسواق منذ عام 2011. ومع ذلك، فإن «مايكروسوفت» طرحت بالأسواق الآن «كورتانا» (Cortana)، بينما تجري «فيسبوك» اختبارات على آخر يدعى «إم» (M). أما «غوغل» فقد أعادت بناء المساعد الصوتي الخاص بها لتحوله إلى تطبيقات بحث.
وبينما تقيم هذه الشركات حجم التقدم الذي أحرزته على هذا الصعيد من خلال تقارير العائدات ربع السنوية، فقد قمت من جانبي بصياغة اختبارات لتطبيقات المساعدة الصوتية بهدف تقييم قدراتها على إنجاز 16 مهمة تنتمي لأكثر المجالات التي يستمتع بها غالبية المستهلكين: الموسيقى والإنتاجية والسفر وتناول الطعام والترفيه واهتمامات أخرى مثل الرياضة.
وفي نهاية الاختبارات، لم تحصل أي من تطبيقات المساعدة الصوتية على تقدير لافت يستحق الشعور بالفخر إزاءه. وفي ما يلي درجات التقييم التي حصل عليها كل جهاز من إجمالي 4 نقاط:
- «غوغل» (غوغل) - 3.1
- «سيري» (آبل) - 2.9
- «كورتانا» (مايكروسوفت) - 2.3
- «أليكسا» (أمازون) - 1.7

أداء متميز

وجاء أداء «آبل» الأفضل من حيث مهام الإنتاجية، مثل مواعيد الروزنامة ورسائل البريد الإلكتروني. أما «غوغل» فكانت الأفضل في السفر والمهام المرتبطة بالتنقل اليومي باستخدام وسائل المواصلات، بينما برعت «أليكسا» في الموسيقى. وأخيرًا، جاء أداء «كورتانا» متوسطًا بمختلف المجالات. وبالنسبة لـ«فيسبوك» فظل خارج منظومة التقييم بسبب رفض الشركة إتاحة «إم»، رغم أنني تمكنت من التعامل معه على مدار ساعتين من خلال حساب لأحد الأصدقاء.
من جانبها، أعلنت «آبل» أن «سيري» أصبح «أسرع وأذكى»، بجانب قدرته على الحديث بعدد لغات أكثر من أي مساعد صوتي آخر. في المقابل، قالت «مايكروسوفت» إن «كورتانا» تمثل «مجرد البداية فحسب». كما أبدت «غوغل» رغبتها في تطوير الهواتف الذكية على نحو يمكنها من الاضطلاع بمزيد من المهام الصعبة، وبحيث يتمكن المستخدمون من الاضطلاع بمجموعة متنوعة من المهام عبر مجرد الحديث إلى «غوغل». أما «أمازون» فلم تستجب لطلب تقدمنا به إليها للحصول على تعليق.
على صعيد الإنتاجية، كان «سيري»، الذي يمكن استدعاؤه عبر ضغط زر على شاشة «آي فون» أو بمجرد قول «مرحبا سيري»، صاحب القدرة الأفضل على وضع جدول للقاء بصديق في هاواي، واستعراض المواعيد المسجلة بجدول أعمالي للغد، وإرسال رسالة عبر البريد الإلكتروني وقراءة إحدى الرسائل التي وردت عبر البريد الإلكتروني بصوت مرتفع. أما التطبيقات الأخرى فنجحت في إنجاز فقط بعض هذه المهام، بينما عجزت «أليكسا» عن كتابة رسالة بريد إلكتروني وتسجيل حدث وضمه إلى روزنامة المواعيد.
أيضا، قدم «سيري» أداء جيدًا في المهام المرتبطة بالموسيقى، لكن «أليكسا» تفوقت عليه. استطاع كلا التطبيقين تشغيل أغنية «هاي»، أحدث حلقات «راديولاب»، بجانب عزف مقاطع موسيقية. علاوة على ذلك، استطاعت «أليكسا»، التي يمكن استدعاؤها بمجرد نطق اسمها، تشغيل محطة موسيقية بعينها عبر «باندورا»، بينما فشل «سيري» في تشغيل تطبيق «باندورا».

من ناحية أخرى، حاز موقع «غوغل»، الذي يعمل على تحويل جهاز المساعدة الصوتية إلى تطبيق متوافر عبر هواتف «غوغل»، التقييم الأعلى في إنجاز المهام المرتبطة بالسفر والتنقل عبر وسائل المواصلات. وجاءت استجابته ممتازة لسؤال: «ما حالة المرور في 221 ماين ستريت؟»، حيث أوضح لي المدة الزمنية التي سأستغرقها في الانتقال بالسيارة إلى هناك.
وعندما وجهت إليه الطلب التالي: «خذني إلى صالة (دوغباتش بولدرز) للألعاب الرياضية»، أظهر أمامي خريطة تصاحبها توجيهات صوتية. وعندما قلت: «اعثر لي على تذاكر طائرة إلى نيويورك الأسبوع المقبل»، جاءت استجابته مذهلة، حيث عرض علي رحلات جوية من سان فرانسيسكو إلى نيويورك الأسبوع المقابل تبدأ أسعارها من 435 دولارا، وبلغت مدة الرحلة الأقصر خمس ساعات و10 دقائق.
في ما يخص السفر والتنقل عبر وسائل المواصلات، عرضت «كورتانا» إجابات عن أسئلة بخصوص المرور والاتجاهات، لكنها عجزت عن الإجابة عن أسئلة تخص رحلات الطيران. أما «سيري» فجاء أداؤه ضعيفًا للغاية في هذه الفئة، حيث عجز عن تقديم تقييم لحركة المرور. ولدى سؤاله عن رحلات الطيران إلى نيويورك، سرد مجموعة غير مفيدة من موقع شبكة الإنترنت المعنية بالسفر لنيويورك. وبدلا من إظهار خريطة توضح مكان صالة ألعاب رياضية، عرض عنوان حانة!
أما «أليكسا» فتمكنت من تقديم تقييمات لحركة المرور عن موقع واحد ثابت مسجل لديها، مثل مكتبك.

تفاوت الاستجابة

بالنسبة للمهام المرتبطة بالطعام، جاء أداء «غوغل» و«آبل» متكافئًا، حيث تمكن كلاهما من إيجاد قائمة بالمطاعم الهندية القريبة، لكن المساعد الصوتي «غوغل» كان الوحيد القادر على طلب خدمة توصيل الطعام للمنازل، لكن ذلك تم فقط من خلال طلب مطعم بعينه لديه خدمة تسجيل الطلبات عبر واحدة من التطبيقات التي يتعامل معها «غوغل». أما «سيري» فكان الوحيد القادر على حجز مائدة داخل أحد المطاعم.
في ما يتعلق بالاهتمامات الخاصة، سألت كل مساعد صوتي سؤالين واضحين: ما الأندية الفائزة بمباريات كرة القدم الأميركية أخيرا، ومن خاض «سوبر بول»؟ قام كل من «غوغل» و«كورتانا» و«سيري» بتجميل نتائج المباريات الصادرة، عن الدوري الوطني لكرة القدم الأميركية، لكن «غوغل» و«كورتانا» فقط استطاعا الإشارة إلى اسمي الفريقين، بينما عجز «سيري» عن ذكر المباراة الكبرى التي أقيمت 7 فبراير (شباط) على استاد ليفي في سانتا كلارا بكاليفورنيا. في المقابل، بدت خدمة «أليكسا» على غير دراية بهذه الرياضة، وعجزت عن إجابة السؤالين.
وينقلني ذلك إلى المساعد الصوتي «إم» الخاص بـ«فيسبوك»، حيث رفضت الشركة طلبي الاطلاع على التطبيق، ولم تتح ذلك حتى الآن سوى لعدد محدود للغاية من الخبراء المعنيين باختبار التطبيق الجديد. وعليه، لجأت لاستخدام حساب أحد الأصدقاء عبر «فيسبوك ميسنجر» لمقابلة «إم». تبعًا لما أعلنته الشركة، فإن «إم» يخضع في جزء منه لسيطرة نظام الذكاء الصناعي، بينما يخضع جزء آخر لسيطرة بشرية. ويمكنك التواصل مع «إم» عبر بعث رسائل إليه من خلال خدمة «فيسبوك ميسنجر»، تمامًا مثلما تبعث برسالة لصديق.
خلال الفترة المحدودة التي قضيتها مع «إم»، طلبت منه القيام بمهام عادية، مثل الاتصال بشركة المياه للاستفسار منها عن فاتورة الاستخدام، والتعرف على منتجات اللحوم المعروضة بمتجر «هول فودز» المحلي، والبحث عن الوقت الذي تصبح فيه تكلفة السفر لهونغ كونغ في أرخص مستوى.
وغاب «إم» للحظات قلائل قبل الإجابة عن كل سؤال، الأمر الذي جعلني أتشكك أن شخصًا ما هو الذي تولى الإجابة. وعندما طلبت من «إم» حجز موعد لي لجلسة تصوير مع استوديو يمتلكه صديق لي. في غضون دقائق، رن جرس الهاتف في الاستوديو، والتقط صديقي السماعة، وهنا قال «إم» الذي يحمل صوت امرأة شابة: «مرحبا، إنني أتصل نيابة عن رئيسي بالعمل، فهو يرغب في معرفة ما إذا كان بإمكانكم عقد جلسة تصوير له غدًا في الثانية ظهرًا».
ورد صديقي: «عذرًا لم أعرف اسمك بعد؟»، فجاءه الرد: «اسمي الأول (إم)، أما اسمي الأخير فهو (ميسنجر)». وسأل صديقي: «هل هذا اسم يوناني؟»، وهنا انطلق «إم» في الضحك.
ويشير ذلك إلى أن «إم» ربما يكون أفضل في قدراته عن جميع التطبيقات السابقة، لكن هذا يعود لوجود عناصر بشرية وراء تتولى إدارة المهام التي يعجز عنها الذكاء الصناعي. وفي بيان لها أعلنت «فيسبوك»: «(إم) لا يزال في مرحلة مبكرة للغاية، ولسنا مهتمين حاليًا بطرحه على عدد كبير من الأشخاص».

* خدمة «نيويورك تايمز»



«سامسونغ» تضيف تَوافق «AirDrop» إلى «Quick Share» لمشاركة الملفات

التحديث يعكس توجهاً أوسع في السوق نحو تقليل الاحتكاك بين الأنظمة البيئية المختلفة (أ.ب)
التحديث يعكس توجهاً أوسع في السوق نحو تقليل الاحتكاك بين الأنظمة البيئية المختلفة (أ.ب)
TT

«سامسونغ» تضيف تَوافق «AirDrop» إلى «Quick Share» لمشاركة الملفات

التحديث يعكس توجهاً أوسع في السوق نحو تقليل الاحتكاك بين الأنظمة البيئية المختلفة (أ.ب)
التحديث يعكس توجهاً أوسع في السوق نحو تقليل الاحتكاك بين الأنظمة البيئية المختلفة (أ.ب)

أضافت «سامسونغ» دعماً لتبادل الملفات مع أجهزة «أبل» عبر «كويك شير» (Quick Share) في خطوة تقلّص أحد أكثر الحواجز ثباتاً بين نظامي «أندرويد» و«iOS»، إذ يمكن نقل الملفات سريعاً بين هاتفين ينتميان إلى نظامين مختلفين. وتقول «سامسونغ» إن الميزة بدأت مع سلسلة «غلاكسي إس 26» (Galaxy S26) على أن يبدأ طرحها من كوريا ثم تتوسع إلى أسواق أخرى تشمل أوروبا وأميركا الشمالية وأميركا اللاتينية وجنوب شرقي آسيا واليابان وهونغ كونغ وتايوان.

الخطوة ليست معزولة، بل تأتي ضمن مسار بدأته «غوغل» أواخر 2025 عندما أعلنت أن «Quick Share» أصبح قادراً على العمل مع «إير دروب» (AirDrop) بدايةً مع هواتف «بيكسل 10» (Pixel 10)، ثم توسعت لاحقاً التغطيات والإشارات إلى دعم أوسع لبعض الأجهزة الأخرى. ما يعنيه ذلك عملياً هو أن فكرة مشاركة الملفات السريعة لم تعد حكراً على النظام المغلق داخل «أبل»، بل بدأت تتحول إلى مساحة أكثر انفتاحاً، ولو بشكل تدريجي ومحسوب.

نجاح الميزة يعتمد على الحفاظ على بساطة النقل المباشر بين الأجهزة من دون خطوات معقدة (رويترز)

مشاركة أكثر سلاسة

من الناحية التقنية، تحاول هذه المقاربة الحفاظ على بساطة تجربة «AirDrop» نفسها حيث يختار المستخدم الملف، ويظهر الجهاز القريب المتاح للاستقبال، ثم تتم عملية النقل عبر اتصال مباشر بين الجهازين.

«غوغل» شددت عند إعلانها الأول على أن النقل يتم «peer-to-peer» من دون المرور عبر خادم، وأن القبول يظل بيد المستخدم، بينما أوضحت «سامسونغ» أن ميزة «المشاركة مع أجهزة أبل» ستكون مفعّلة افتراضياً في الأجهزة المدعومة. هذا مهم، لأن نجاح الميزة لا يعتمد فقط على وجودها، بل على أن تبقى قريبة من السهولة التي جعلت «AirDrop» أصلاً شائعاً بين مستخدمي أبل.

لكن الأهمية الحقيقية هنا تتجاوز مجرد نقل صورة أو ملف بسرعة. لسنوات، كان التشارك بين «أندرويد» و«آيفون» يتم غالباً عبر حلول أقل سلاسة: تطبيقات طرف ثالث أو روابط سحابية أو إرسال الملف عبر تطبيقات المراسلة، مع ما قد يعنيه ذلك من ضغط الجودة أو زيادة الخطوات. لذلك، فإن إدخال هذا النوع من التوافق داخل أداة مدمجة في النظام يغيّر شيئاً جوهرياً في تجربة الاستخدام اليومية، خصوصاً في البيئات المختلطة حيث يستخدم الأصدقاء أو العائلة أو فرق العمل أجهزة من شركات مختلفة.

تقلل هذه الخطوة إحدى أبرز العقبات بين «أندرويد» و«آيفون» في تبادل الملفات السريع (أ.ف.ب)

توافق قيد الاختبار

ومع ذلك، لا يبدو أن القصة وصلت بعد إلى مرحلة الاستقرار الكامل. «سامسونغ» أعلنت رسمياً أن الدعم يبدأ مع «Galaxy S26»، مع وعد بالتوسع لاحقاً إلى أجهزة أخرى، لكن تقارير لاحقة من مواقع متخصصة مثل «SamMobile» أشارت إلى أن تحديثات «Quick Share» وصلت بالفعل إلى بعض هواتف «غلاكسي» الأقدم، بما فيها سلاسل (S22) و(S23) و(S24) و(S25) وبعض هواتف «زد فولد» (Z Fold) غير أن الميزة لم تعمل بصورة متسقة لدى جميع المستخدمين، ما يرجّح أن التوسع لا يزال يعتمد جزئياً على تحديثات فرعية أو تفعيل تدريجي من جهة الخوادم.

هذا التدرج ليس مفاجئاً. فحتى تجربة «غوغل» نفسها مع «Quick Share» المتوافق مع «AirDrop» لم تمر من دون ملاحظات. ظهرت تقارير عن مشكلات لدى بعض مستخدمي «بيكسل» (Pixel) مرتبطة باتصال «واي-فاي» (Wi-Fi) أثناء استخدام الميزة، ما يشير إلى أن كسر الحاجز بين النظامين ممكن، لكنه لا يزال يحتاج إلى ضبط تقني مستمر حتى يصبح تجربة يومية مستقرة حقاً. وبذلك، فإن ما نراه الآن ليس نهاية المشكلة، بل بداية مرحلة جديدة من اختبار التوافق عبر منصتين لم تُصمَّما أصلاً للعمل بهذه الدرجة من الانفتاح بينهما.

مع ذلك، تبقى دلالة الخطوة كبيرة. فهي تعكس تحولاً أوسع في سوق الهواتف الذكية إذ لم يعد التنافس يدور فقط حول إبقاء المستخدم داخل النظام البيئي المغلق، بل أيضاً حول تقليل الاحتكاك عندما يضطر للتعامل مع أجهزة خارج ذلك النظام. وفي هذا السياق، تبدو «سامسونغ» وكأنها تراهن على أن سهولة التبادل مع أجهزة «أبل» لم تعد ميزة هامشية، بل جزءاً من التجربة الأساسية التي يتوقعها المستخدم.


15 دقيقة لتعديل تعليقاتك على «إنستغرام»… ولكن بشروط

أتاحت «إنستاغرام» للمستخدمين تعديل تعليقاتهم بعد النشر خلال مهلة زمنية محددة تبلغ 15 دقيقة (رويترز)
أتاحت «إنستاغرام» للمستخدمين تعديل تعليقاتهم بعد النشر خلال مهلة زمنية محددة تبلغ 15 دقيقة (رويترز)
TT

15 دقيقة لتعديل تعليقاتك على «إنستغرام»… ولكن بشروط

أتاحت «إنستاغرام» للمستخدمين تعديل تعليقاتهم بعد النشر خلال مهلة زمنية محددة تبلغ 15 دقيقة (رويترز)
أتاحت «إنستاغرام» للمستخدمين تعديل تعليقاتهم بعد النشر خلال مهلة زمنية محددة تبلغ 15 دقيقة (رويترز)

أتاحت «إنستغرام» للمستخدمين أخيراً تعديل تعليقاتهم بعد نشرها، في تحديث صغير من حيث الشكل، لكنه يعالج واحدة من أكثر المشكلات اليومية تكراراً على المنصة وهي الاضطرار إلى حذف التعليق بالكامل ثم إعادة كتابته فقط لتصحيح خطأ لغوي أو تعديل صياغة بسيطة.

وبحسب تقارير تقنية نُشرت هذا الأسبوع، يستطيع المستخدم الآن تعديل تعليقه خلال 15 دقيقة من نشره، مع ظهور إشارة «Edited» على التعليق بعد تغييره.

الميزة الجديدة لا تعني فتح باب التعديل بلا قيود، بل تأتي ضمن إطار زمني محدد. فالتقارير تشير إلى أن المستخدم يمكنه إجراء عدة تعديلات خلال نافذة الخمس عشرة دقيقة، لكن بعد انقضاء هذه المدة يبقى الخيار التقليدي هو الحذف وإعادة النشر. وهذا يعكس محاولة من «إنستغرام» لتحقيق توازن بين المرونة في تصحيح الأخطاء، والحفاظ على قدر من الشفافية داخل المحادثات العامة.

تصحيح دون حذف

من الناحية العملية، تبدو الإضافة بسيطة، لكنها تمس جانباً أساسياً من تجربة الاستخدام. فالتعليقات على «إنستغرام» ليست مجرد مساحة جانبية، بل أصبحت جزءاً من التفاعل العام بين صناع المحتوى والجمهور، وبين المستخدمين أنفسهم. ومع كثافة التعليق السريع من الهواتف، تصبح الأخطاء الإملائية أو الصياغات غير الدقيقة أمراً شائعاً. لهذا، فإن تمكين المستخدم من تعديل التعليق بدلاً من حذفه قد يقلل الإرباك داخل سلاسل النقاش، ويحافظ في الوقت نفسه على تسلسل التفاعل والردود المرتبطة به. هذا هو السبب الذي جعل بعض التقارير تصف الميزة بأنها «صغيرة لكنها مطلوبة منذ فترة طويلة».

وتشير التغطيات المنشورة إلى أن «إنستغرام» كانت قد اختبرت الميزة منذ مارس (آذار)، قبل أن تبدأ طرحها الآن للمستخدمين. كما أفاد تقرير «ذا فيرج» بأن الإتاحة الحالية ظهرت على تطبيق «iOS»، فيما تناولت تقارير أخرى الإطلاق بوصفه طرحاً بدأ في 10 أبريل (نيسان) 2026. وهذا يوحي بأن الانتشار قد يكون تدريجياً بحسب المنصة أو المنطقة، وهو نمط معتاد في تحديثات «ميتا» ومنتجاتها.

تحديث يعالج مشكلة يومية شائعة كانت تدفع المستخدمين إلى حذف التعليق وإعادة كتابته بالكامل (أ.ف.ب)

مرونة بضوابط

ما يلفت في هذه الخطوة ليس فقط الوظيفة نفسها، بل توقيتها أيضاً. فمنصات التواصل الاجتماعي باتت تتعامل بحذر مع أدوات التحرير في المساحات العامة، لأن السماح بتعديل المحتوى بعد النشر قد يثير أسئلة تتعلق بالسياق والمساءلة. ولهذا يبدو أن «إنستغرام» اختارت حلاً وسطاً من خلال نافذة قصيرة للتصحيح، مع وسم واضح يفيد بأن التعليق عُدّل، من دون تحويل التعليقات إلى نصوص قابلة لإعادة الصياغة على مدى طويل. هذا النوع من التصميم يعكس فهماً متزايداً لحاجة المستخدم إلى المرونة، لكن من دون إضعاف الثقة في المحادثات العامة.

كما أن هذه الخطوة تندرج ضمن اتجاه أوسع لدى المنصات الكبرى نحو تقليل «الاحتكاك» في الاستخدام اليومي. فبدلاً من التركيز فقط على أدوات كبرى أو تغييرات جذرية، أصبح تحسين التجربة يعتمد أيضاً على معالجة تفاصيل صغيرة لكنها متكررة. وفي حالة «إنستغرام»، فإن التعليق المعدّل خلال دقائق قد يبدو تفصيلاً محدوداً، لكنه يمس ملايين التفاعلات اليومية على التطبيق، ويقلل الحاجة إلى حلول محرجة مثل حذف تعليق حاز ردوداً أو إعادة نشره بعد تصحيح كلمة واحدة.

يأتي الإعلان عن تعديل التعليقات بالتزامن مع تحديثات أخرى لدى «ميتا» تتعلق بقيود إضافية على بعض محتويات حسابات المراهقين، ما يضع الخطوة ضمن سلسلة تعديلات أوسع على تجربة الاستخدام والإشراف داخل «إنستغرام». لكن في حد ذاته، يظل تعديل التعليقات ميزة عملية أكثر من كونه تحولاً كبيراً في المنصة. الجديد هنا ليس إعادة تعريف «إنستغرام»، بل جعل أحد أكثر أجزائه استخداماً أقل صرامة وأكثر واقعية.

لا تبدو هذه الميزة ثورية، لكنها تعكس منطقاً مهماً في تطور المنصات: أحياناً لا يكون التحسين في إضافة أدوات أكبر، بل في إزالة خطوة مزعجة كان المستخدم مضطراً إلى تكرارها يومياً. ومع إتاحة تعديل التعليقات، تحاول «إنستغرام» أن تجعل النقاشات العامة أكثر سلاسة، من دون أن تتخلى بالكامل عن وضوح ما تغيّر ومتى تغيّر.


«ميتا» تطلق نموذج «ميوز سبارك» للذكاء الاصطناعي المتقدم

يستطيع نموذج «ميوز سبارك» الجديد تحليل الصور وعرض البيانات الصحية المرتبطة بالوجبات (ميتا)
يستطيع نموذج «ميوز سبارك» الجديد تحليل الصور وعرض البيانات الصحية المرتبطة بالوجبات (ميتا)
TT

«ميتا» تطلق نموذج «ميوز سبارك» للذكاء الاصطناعي المتقدم

يستطيع نموذج «ميوز سبارك» الجديد تحليل الصور وعرض البيانات الصحية المرتبطة بالوجبات (ميتا)
يستطيع نموذج «ميوز سبارك» الجديد تحليل الصور وعرض البيانات الصحية المرتبطة بالوجبات (ميتا)

كشفت شركة «ميتا» (Meta)، أمس الخميس، عن إطلاق نموذج «ميوز سبارك» (Muse Spark) كأول إصدار في سلسلة جديدة من النماذج اللغوية الكبيرة التي طورتها مختبرات «ميتا للذكاء الاصطناعي الفائق» (Meta Superintelligence Labs) بهدف تحقيق مفهوم الذكاء الاصطناعي الفائق والشخصي المتمثل في تطوير مساعد رقمي قادر على دعم الأفراد في مختلف السياقات مع مراعاة احتياجاتهم وأولوياتهم الأساسية.

وعلى الرغم من صغر حجمه وسرعة أدائه، يتمتع هذا النموذج الأولي بقدرات متقدمة في التحليل المنطقي للأسئلة المعقدة في مجالات العلوم والرياضيات والصحة. ويؤسس هذا النموذج لقاعدة متينة بينما يجري تطوير الإصدارات اللاحقة. ويدعم نموذج «ميوز سبارك» حالياً مساعد «ميتا إيه آي» (Meta AI) عبر التطبيق والموقع الإلكتروني (meta.ai) وتم تصميمه لدعم الاستدلالات المعقدة والمهام متعددة الوسائط.

وأعادت مختبرات «ميتا للذكاء الاصطناعي الفائق» خلال الأشهر التسعة الماضية بناء البنية التحتية للذكاء الاصطناعي بصورة شاملة؛ إذ يُعدّ نموذج «ميوز سبارك» الإصدار الأول ضمن فئة «ميوز» الجديدة التي تعكس نهجاً علمياً منظماً لتوسيع نطاق النماذج، مع استناد كل نسخة إلى تقييم أداء سابقتها والبناء عليها قبل الانتقال إلى مستويات أكثر تقدماً.

تحديثات جديدة

ويشهد تطبيق وموقع (meta.ai)، أمس، تحديثاً شاملاً يتضمن تصميماً جديداً كلياً. وسواء تطلب الأمر الحصول على إجابة سريعة أو معالجة مسائل معقدة تستدعي تفكيراً منطقياً معمقاً، أصبح «ميتا إيه آي» قادراً على تلبية هذه الاحتياجات بكفاءة عالية. كما يتيح هذا النظام التنقل بين أوضاع متعددة وفقاً لطبيعة المهمة، فضلاً عن قدرته على تشغيل عدة وكلاء فرعيين بشكل متوازٍ لمعالجة الاستفسارات.

وعلى سبيل المثال، عند التخطيط لرحلة عائلية إلى مدينة ما، سيتولى أحد الوكلاء إعداد خطة الرحلة، بينما يقوم آخر بالمقارنة بين عدة وجهات أخرى، في حين يبحث وكيل ثالث عن فعاليات ملائمة للأطفال، ويتم ذلك على نحو متزامن بما يضمن نتائج أكثر سرعة ودقة.

يستطيع النموذج اقتراح ملحقات مناسبة لغرفة المستخدم بكل سهولة (ميتا)

قدرات متقدمة في الفهم والإدراك

وتم تزويد نموذج «ميوز سبارك» بقدرات إدراكية متعددة الوسائط، مما يُمكّن «ميتا إيه آي» من إدراك وفهم ما يراه المستخدم وليس الاكتفاء بتحليل ما يكتبه. وعلى سبيل المثال، يكفي التقاط صورة لأرفف الوجبات الخفيفة في مطار ما حتى يحدد «ميتا إيه آي» الخيارات الغنية بالبروتين وترتيبها دون الحاجة إلى فحص البيانات التفصيلية للملصقات، كما يتيح مسح المنتجات ضوئياً لإجراء مقارنات بينها وبين البدائل المتاحة.

ويعكس ذلك تحولاً نوعياً من ذكاء اصطناعي يعتمد على وصف المستخدم إلى نظام قادر على مشاركة المستخدم في إدراك العالم. ومع دمج «ميتا إيه آي» المدعوم بنموذج «ميوز سبارك» في النظارات الذكية، ستزداد قدرته على فهم البيئة المحيطة بصورة أكثر دقة وشمولاً.

وتُعدّ القدرات الإدراكية متعددة الوسائط من الركائز بالغة الأهمية في المجال الصحي. ومع إطلاق «ميوز سبارك»، أصبح «ميتا إيه آي» أكثر كفاءة في دعم الاستفسارات الصحية من خلال تقديم إجابات معمقة وشاملة، بما في ذلك التعامل مع الأسئلة التي تتضمن صوراً ورسومات بيانية. ونظراً لتنامي اعتماد الأفراد على تقنيات الذكاء الاصطناعي في المسائل الصحية، تم التعاون مع فريق من الأطباء لتطوير إمكانات متقدمة تتيح تقديم معلومات دقيقة وموثوقة حول أبرز التساؤلات والمخاوف الصحية الشائعة.

ويتميز «ميتا إيه آي» أيضاً بقدرات متقدمة في مجال البرمجة البصرية؛ حيث يساعد المستخدمين في إنشاء مواقع إلكترونية مخصصة أو ألعاب مصغرة اعتماداً على أوامر نصية بسيطة. ومن خلال «ميتا إيه آي»، يمكن للمستخدمين طلب تصميم لوحة تحكم لتنظيم حدث كبير أو تطوير لعبة إلكترونية كلاسيكية تستهدف تحقيق أعلى النتائج، أو حتى ابتكار جهاز محاكاة طيران بخصائص خيالية. كما تتيح المنصة مشاركة هذه التجارب بسهولة وسلاسة مع الأصدقاء.

تجربة مخصصة

وأصبح «ميتا إيه آي» قادراً على دعم المستخدمين في استكشاف خيارات الأزياء المناسبة، وتنسيق المساحات الداخلية واختيار الهدايا الملائمة للآخرين. ويعتمد وضع التسوق على استلهام اتجاهات تنسيق الأزياء والسرديات المرتبطة بالعلامات التجارية كما تتداولها التطبيقات، حيث يقدم مقترحات وأفكاراً مستمدة من صناع المحتوى والمجتمعات التي يتابعها المستخدمون.

وعند البحث عن وجهة سياحية ما أو موضوع رائج، يقدم «ميتا إيه آي» سياقاً ثرياً ومباشراً ضمن المحادثة بما يعزز تجربة الاستكشاف واتخاذ القرار؛ حيث يساعد المستخدمين في الاطلاع على مواقع محددة ومتابعة منشورات عامة يشاركها السكان المحليون المطلعون على المنطقة، وكذلك الاستفسار عما يحظى باهتمام الناس في الوقت الراهن للحصول على رؤية شاملة مستمدة من محتوى المجتمعات وتفاعلاتها. ويعمل هذا السياق بتكامل مع شبكة المستخدم الاجتماعية ويوصله بالمعلومة في اللحظة التي يحتاجها.

نظرة مستقبلية

وسيحصل مستخدمو تطبيق وموقع «ميتا إيه آي» على تجربة محسنة تشمل «الوضع الفوري» و«وضع التفكير» في جميع البيئات المتاحة. وبدأ طرح هذه المزايا الجديدة في الولايات المتحدة عبر كلتا المنصتين، على أن يتم خلال الأسابيع المقبلة توسيع نطاقها لتشمل مزيداً من الدول والمنصات التي يدعمها «ميتا إيه آي»، بما في ذلك «فيسبوك» و«إنستغرام» و«ماسنجر» و«واتساب»، فضلاً عن النظارات الذكية؛ حيث تتعزز القدرات الإدراكية متعددة الوسائط بشكل أكبر. كما سيتم توفير الوصول إلى التقنيات الأساسية عبر واجهة برمجة التطبيقات «Application Programming Interface API» ضمن معاينة خاصة لعدد من الشركاء، مع خطط الشركة لإتاحة نماذج مفتوحة المصدر في المستقبل.

ومع توسيع نطاق هذه المزايا، سيصبح بإمكان المستخدمين الحصول على نتائج أكثر ثراء، حيث سيتم دمج مقاطع «ريل» Reel والصور والمنشورات مباشرة ضمن الإجابات مع الإشارة إلى صناع المحتوى. وبالتوازي مع تطور النماذج، سيستمر العمل على تعزيز أطر الحماية المرتبطة بالسلامة والخصوصية، بدءاً من إطار إدارة المخاطر المعزز إلى باقي التدابير الوقائية.