اختبار حقيقي أمام تطبيقات المساعد الصوتي الافتراضي

مقارنة لأداء أفضل أنواعها المتوافرة

المساعد الصوتي «إيكو» بصوت «أليكسا»
المساعد الصوتي «إيكو» بصوت «أليكسا»
TT

اختبار حقيقي أمام تطبيقات المساعد الصوتي الافتراضي

المساعد الصوتي «إيكو» بصوت «أليكسا»
المساعد الصوتي «إيكو» بصوت «أليكسا»

عندما سألت نظام المساعد الصوتي «أليكسا» في وقت سابق من هذا الأسبوع عن الأندية المشاركة في بطولة «سوبر بول» الأخيرة، أجابت: «الفائز بالبطولة رقم 49 للسوبر بول نادي نيو إنغلاند باتريوتس». وهنا لم أتمالك نفسي، وصحت فيها: «أنت تتحدثين عن العام الماضي. حتى أنا بإمكاني تقديم مستوى أداء أفضل من ذلك!».
في واقع الأمر، كنت في تلك اللحظة بمفردي داخل غرفة المعيشة. أما حديثي فكان موجهًا إلى صديقتي الافتراضية المتمثلة في برنامج «أمازون» اللاسلكي المعروف باسم «إيكو» (Echo)، الذي أطلقته الشركة في يونيو (حزيران) الماضي. يحمل الصوت المتحدث اسم «أليكسا» (Alexa)، وقد أثارت موجة اهتمام واسعة النطاق داخل وادي السليكون، وأصبحت واحدة من أحدث الأعضاء المنضمين لنادي أدوات المساعدة الافتراضية.

مساعد صوتي

يذكر أن جميع الشركات الخمس العملاقة بمجال التقنيات الحديثة - «آبل» و«مايكروسوفت» و«أمازون» و«فيسبوك» و«غوغل»، التي أصبحت الآن جزءًا من «ألفابيت» - تطرح الآن بالأسواق تطبيقات المساعدة الافتراضية، وبإمكانها الاضطلاع بالمهام الرتيبة استجابة لأوامر شفهية توجه إليها أو نقرات على أزرار بعينها. ويعتبر «سيري» (Siri)، من إنتاج «آبل»، أشهر هذه التطبيقات، وقد طرح بالأسواق منذ عام 2011. ومع ذلك، فإن «مايكروسوفت» طرحت بالأسواق الآن «كورتانا» (Cortana)، بينما تجري «فيسبوك» اختبارات على آخر يدعى «إم» (M). أما «غوغل» فقد أعادت بناء المساعد الصوتي الخاص بها لتحوله إلى تطبيقات بحث.
وبينما تقيم هذه الشركات حجم التقدم الذي أحرزته على هذا الصعيد من خلال تقارير العائدات ربع السنوية، فقد قمت من جانبي بصياغة اختبارات لتطبيقات المساعدة الصوتية بهدف تقييم قدراتها على إنجاز 16 مهمة تنتمي لأكثر المجالات التي يستمتع بها غالبية المستهلكين: الموسيقى والإنتاجية والسفر وتناول الطعام والترفيه واهتمامات أخرى مثل الرياضة.
وفي نهاية الاختبارات، لم تحصل أي من تطبيقات المساعدة الصوتية على تقدير لافت يستحق الشعور بالفخر إزاءه. وفي ما يلي درجات التقييم التي حصل عليها كل جهاز من إجمالي 4 نقاط:
- «غوغل» (غوغل) - 3.1
- «سيري» (آبل) - 2.9
- «كورتانا» (مايكروسوفت) - 2.3
- «أليكسا» (أمازون) - 1.7

أداء متميز

وجاء أداء «آبل» الأفضل من حيث مهام الإنتاجية، مثل مواعيد الروزنامة ورسائل البريد الإلكتروني. أما «غوغل» فكانت الأفضل في السفر والمهام المرتبطة بالتنقل اليومي باستخدام وسائل المواصلات، بينما برعت «أليكسا» في الموسيقى. وأخيرًا، جاء أداء «كورتانا» متوسطًا بمختلف المجالات. وبالنسبة لـ«فيسبوك» فظل خارج منظومة التقييم بسبب رفض الشركة إتاحة «إم»، رغم أنني تمكنت من التعامل معه على مدار ساعتين من خلال حساب لأحد الأصدقاء.
من جانبها، أعلنت «آبل» أن «سيري» أصبح «أسرع وأذكى»، بجانب قدرته على الحديث بعدد لغات أكثر من أي مساعد صوتي آخر. في المقابل، قالت «مايكروسوفت» إن «كورتانا» تمثل «مجرد البداية فحسب». كما أبدت «غوغل» رغبتها في تطوير الهواتف الذكية على نحو يمكنها من الاضطلاع بمزيد من المهام الصعبة، وبحيث يتمكن المستخدمون من الاضطلاع بمجموعة متنوعة من المهام عبر مجرد الحديث إلى «غوغل». أما «أمازون» فلم تستجب لطلب تقدمنا به إليها للحصول على تعليق.
على صعيد الإنتاجية، كان «سيري»، الذي يمكن استدعاؤه عبر ضغط زر على شاشة «آي فون» أو بمجرد قول «مرحبا سيري»، صاحب القدرة الأفضل على وضع جدول للقاء بصديق في هاواي، واستعراض المواعيد المسجلة بجدول أعمالي للغد، وإرسال رسالة عبر البريد الإلكتروني وقراءة إحدى الرسائل التي وردت عبر البريد الإلكتروني بصوت مرتفع. أما التطبيقات الأخرى فنجحت في إنجاز فقط بعض هذه المهام، بينما عجزت «أليكسا» عن كتابة رسالة بريد إلكتروني وتسجيل حدث وضمه إلى روزنامة المواعيد.
أيضا، قدم «سيري» أداء جيدًا في المهام المرتبطة بالموسيقى، لكن «أليكسا» تفوقت عليه. استطاع كلا التطبيقين تشغيل أغنية «هاي»، أحدث حلقات «راديولاب»، بجانب عزف مقاطع موسيقية. علاوة على ذلك، استطاعت «أليكسا»، التي يمكن استدعاؤها بمجرد نطق اسمها، تشغيل محطة موسيقية بعينها عبر «باندورا»، بينما فشل «سيري» في تشغيل تطبيق «باندورا».

من ناحية أخرى، حاز موقع «غوغل»، الذي يعمل على تحويل جهاز المساعدة الصوتية إلى تطبيق متوافر عبر هواتف «غوغل»، التقييم الأعلى في إنجاز المهام المرتبطة بالسفر والتنقل عبر وسائل المواصلات. وجاءت استجابته ممتازة لسؤال: «ما حالة المرور في 221 ماين ستريت؟»، حيث أوضح لي المدة الزمنية التي سأستغرقها في الانتقال بالسيارة إلى هناك.
وعندما وجهت إليه الطلب التالي: «خذني إلى صالة (دوغباتش بولدرز) للألعاب الرياضية»، أظهر أمامي خريطة تصاحبها توجيهات صوتية. وعندما قلت: «اعثر لي على تذاكر طائرة إلى نيويورك الأسبوع المقبل»، جاءت استجابته مذهلة، حيث عرض علي رحلات جوية من سان فرانسيسكو إلى نيويورك الأسبوع المقابل تبدأ أسعارها من 435 دولارا، وبلغت مدة الرحلة الأقصر خمس ساعات و10 دقائق.
في ما يخص السفر والتنقل عبر وسائل المواصلات، عرضت «كورتانا» إجابات عن أسئلة بخصوص المرور والاتجاهات، لكنها عجزت عن الإجابة عن أسئلة تخص رحلات الطيران. أما «سيري» فجاء أداؤه ضعيفًا للغاية في هذه الفئة، حيث عجز عن تقديم تقييم لحركة المرور. ولدى سؤاله عن رحلات الطيران إلى نيويورك، سرد مجموعة غير مفيدة من موقع شبكة الإنترنت المعنية بالسفر لنيويورك. وبدلا من إظهار خريطة توضح مكان صالة ألعاب رياضية، عرض عنوان حانة!
أما «أليكسا» فتمكنت من تقديم تقييمات لحركة المرور عن موقع واحد ثابت مسجل لديها، مثل مكتبك.

تفاوت الاستجابة

بالنسبة للمهام المرتبطة بالطعام، جاء أداء «غوغل» و«آبل» متكافئًا، حيث تمكن كلاهما من إيجاد قائمة بالمطاعم الهندية القريبة، لكن المساعد الصوتي «غوغل» كان الوحيد القادر على طلب خدمة توصيل الطعام للمنازل، لكن ذلك تم فقط من خلال طلب مطعم بعينه لديه خدمة تسجيل الطلبات عبر واحدة من التطبيقات التي يتعامل معها «غوغل». أما «سيري» فكان الوحيد القادر على حجز مائدة داخل أحد المطاعم.
في ما يتعلق بالاهتمامات الخاصة، سألت كل مساعد صوتي سؤالين واضحين: ما الأندية الفائزة بمباريات كرة القدم الأميركية أخيرا، ومن خاض «سوبر بول»؟ قام كل من «غوغل» و«كورتانا» و«سيري» بتجميل نتائج المباريات الصادرة، عن الدوري الوطني لكرة القدم الأميركية، لكن «غوغل» و«كورتانا» فقط استطاعا الإشارة إلى اسمي الفريقين، بينما عجز «سيري» عن ذكر المباراة الكبرى التي أقيمت 7 فبراير (شباط) على استاد ليفي في سانتا كلارا بكاليفورنيا. في المقابل، بدت خدمة «أليكسا» على غير دراية بهذه الرياضة، وعجزت عن إجابة السؤالين.
وينقلني ذلك إلى المساعد الصوتي «إم» الخاص بـ«فيسبوك»، حيث رفضت الشركة طلبي الاطلاع على التطبيق، ولم تتح ذلك حتى الآن سوى لعدد محدود للغاية من الخبراء المعنيين باختبار التطبيق الجديد. وعليه، لجأت لاستخدام حساب أحد الأصدقاء عبر «فيسبوك ميسنجر» لمقابلة «إم». تبعًا لما أعلنته الشركة، فإن «إم» يخضع في جزء منه لسيطرة نظام الذكاء الصناعي، بينما يخضع جزء آخر لسيطرة بشرية. ويمكنك التواصل مع «إم» عبر بعث رسائل إليه من خلال خدمة «فيسبوك ميسنجر»، تمامًا مثلما تبعث برسالة لصديق.
خلال الفترة المحدودة التي قضيتها مع «إم»، طلبت منه القيام بمهام عادية، مثل الاتصال بشركة المياه للاستفسار منها عن فاتورة الاستخدام، والتعرف على منتجات اللحوم المعروضة بمتجر «هول فودز» المحلي، والبحث عن الوقت الذي تصبح فيه تكلفة السفر لهونغ كونغ في أرخص مستوى.
وغاب «إم» للحظات قلائل قبل الإجابة عن كل سؤال، الأمر الذي جعلني أتشكك أن شخصًا ما هو الذي تولى الإجابة. وعندما طلبت من «إم» حجز موعد لي لجلسة تصوير مع استوديو يمتلكه صديق لي. في غضون دقائق، رن جرس الهاتف في الاستوديو، والتقط صديقي السماعة، وهنا قال «إم» الذي يحمل صوت امرأة شابة: «مرحبا، إنني أتصل نيابة عن رئيسي بالعمل، فهو يرغب في معرفة ما إذا كان بإمكانكم عقد جلسة تصوير له غدًا في الثانية ظهرًا».
ورد صديقي: «عذرًا لم أعرف اسمك بعد؟»، فجاءه الرد: «اسمي الأول (إم)، أما اسمي الأخير فهو (ميسنجر)». وسأل صديقي: «هل هذا اسم يوناني؟»، وهنا انطلق «إم» في الضحك.
ويشير ذلك إلى أن «إم» ربما يكون أفضل في قدراته عن جميع التطبيقات السابقة، لكن هذا يعود لوجود عناصر بشرية وراء تتولى إدارة المهام التي يعجز عنها الذكاء الصناعي. وفي بيان لها أعلنت «فيسبوك»: «(إم) لا يزال في مرحلة مبكرة للغاية، ولسنا مهتمين حاليًا بطرحه على عدد كبير من الأشخاص».

* خدمة «نيويورك تايمز»



تعرّف على تقنيات الذكاء الاصطناعي المقبلة في عام 2025

ثورة تقنيات الذكاء الاصطناعي الجديدة... تأثيرات عميقة مقبلة على حياتنا اليومية
ثورة تقنيات الذكاء الاصطناعي الجديدة... تأثيرات عميقة مقبلة على حياتنا اليومية
TT

تعرّف على تقنيات الذكاء الاصطناعي المقبلة في عام 2025

ثورة تقنيات الذكاء الاصطناعي الجديدة... تأثيرات عميقة مقبلة على حياتنا اليومية
ثورة تقنيات الذكاء الاصطناعي الجديدة... تأثيرات عميقة مقبلة على حياتنا اليومية

يستمر تطور تقنيات الذكاء الاصطناعي، خصوصاً مع تطور قدرات الحوسبة والتخزين وسرعة نقل البيانات وتطوير خوارزميات جديدة مفيدة للمستخدمين في شتى جوانب الحياة.

سيزداد تبني تقنيات الذكاء الاصطناعي مباشرة على الأجهزة المختلفة دون الحاجة إلى الاتصال بالإنترنت

وسنسلط الضوء في هذا المقال على أبرز تقنيات الذكاء الاصطناعي الجديدة التي سنشهدها خلال عام 2025، مثل تطور تقنيات الرؤية الذكية وظهور الأنظمة المركبة للذكاء الاصطناعي، وانتشار الذكاء الاصطناعي الطرفي، وتطور مساعدات الذكاء الاصطناعي. كما سنتعرّف على أحدث المزايا المقبلة لـ«ذكاء أبل» وكيف ستُسهم في تعزيز تجربة المستخدم. دعونا نستكشف هذا العالم المثير من الذكاء الاصطناعي، ونكتشف كيف سيغيّر هذا التطور من شكل حياتنا في المستقبل.

تستطيع تقنيات الذكاء الاصطناعي الجديدة التعرّف على العناصر الموجودة في الصور والفيديوهات بدقة فائقة

اقتراب «ذكاء» المستقبل

التقنية الأولى التي يُتوقع أن تتقدم بشكل كبير هي التعرف على العناصر الموجودة في الصور والفيديوهات بدقة فائقة وتصنيفها بشكل صحيح والتعرف على النصوص فيها «AI Vision»، وذلك بسبب زيادة إنتاج المستخدمين للصور والفيديوهات وتحليل الذكاء الاصطناعي لها من خلال منصات مشاركة هذه الملفات وفهمه للمشاهد المعقدة فيها. ومن المتوقع أن تساعد هذه التقنية في إنتاج صور وفيديوهات توليدية بشكل أكثر إبهاراً، بالإضافة إلى دعم الشركات لها من خلال كاميرات الهواتف الجوالة (مثل «عدسة غوغل» Google Lens للتعرف على العناصر المحيطة بالمستخدم) ومراقبة الأصناف الموجودة في المتاجر والسيارات ذاتية القيادة، وغيرها. ولكن هذا الأمر قد يشكّل خطراً على خصوصية المستخدمين واحتمال مراقبتهم دون علمهم ما لم يتم اتخاذ التدابير اللازمة لمنع ذلك.

ومن المتوقع أن يتم استخدام نظم ذكاء اصطناعي مركبة «Composite AI» من أكثر من مصدر تستطيع إتمام مهام أكثر تعقيداً مما يستطيع نظام واحد القيام به. وتستطيع هذه التقنيات إيجاد روابط عميقة بين البيانات المعقدة بسهولة وتقديم فيديوهات تحتوي على الأشخاص أنفسهم عبر الكثير من المشاهد وتعديل الإضاءة حسب البيئة وتغيير لغة المحادثات على الفور، وغيرها. وليس من البعيد تطوير خدمات تقدم مجموعات كبيرة من تقنيات الذكاء الاصطناعي ليختار المستخدم ما يحتاج إليه منها لتلبية طلبه وتحقيق هدفه، وكأنها «متجر» للذكاء الاصطناعي يقدم للمستخدم الخدمة حسب الحاجة والرغبة.

وبسبب انتشار المعالجات التي تدعم تقنيات الذكاء الاصطناعي في الكمبيوترات والهواتف الجوالة والكثير من الأجهزة الأخرى، فمن المتوقع أن نشهد إطلاق مزيد من التقنيات التي تدعم الذكاء الاصطناعي مباشرة من على الجهاز عوضاً عن الحاجة إلى الاتصال بالإنترنت للقيام بذلك عبر «Edge AI».

مثال على ذلك: استخدام معالجات متقدمة في كاميرات المراقبة للتعرف على الكثير من الحالات غير الطبيعية، مثل الحوادث أو السرقات، أو في الأجهزة الطبية لتسريع عملية التشخيص أو التحليل، وغيرها. هذا الأمر من شأنه زيادة مستويات الخصوصية بسبب عدم مشاركة البيانات الحساسة مع الأجهزة الخادمة عبر الإنترنت، والعمل بكفاءة عالية دون وجود أي اتصال بالإنترنت.

كما سينتشر «عملاء الذكاء الاصطناعي» AI Agents بشكل متسارع، حيث سنشهد ظهور «برامج» تفهم طلب المستخدم وتقوم بتقسيمه إلى وظائف صغيرة، وتعمل على إتمامها بشكل آلي يحاكي التصرف البشري، وقد تساعد الأطباء في إجراء سلاسل فحوصات على المرضى وتعديل الفحص التالي وفقاً لنتائج الفحص السابق، وهكذا. وقد نشهد دخول هذه التقنية إلى مجال التعليم أيضاً.

تحديثات عديدة مقبلة لـ«ذكاء أبل» على الهواتف الجوالة والكومبيوترات الشخصية

مزايا «ذكاء أبل» المقبلة

أطلقت «أبل» مزايا «ذكاء أبل» Apple Intelligence للذكاء الاصطناعي، وقدمت مجموعة من التحديثات عبر نظامي التشغيل «آي أو إس» و«ماك أو إس»، ولكن لا تزال هناك مزايا ستطلقها خلال العام الجاري، نذكر مجموعة منها:

* الميزة الأولى هي «فيلم الذكريات» Memory Movie على الكومبيوترات التي تعمل بنظام «ماك أو إس»، والتي تقوم بصنع فيلم قصير مكون من الصور وعروض الفيديو الموجودة في تطبيق الصور وفقاً لوصف المستخدم، مثل قيام الميزة بإيجاد فيديو يحتوي على أهم لحظات الإجازة في البحر مع العائلة، أو فيديو للمنزل الجديد الذي انتقل المستخدم إليه، مع القدرة على اختيار مدة الفيلم والموسيقى ومشاركته مع الأهل والأصدقاء عبر الشبكات الاجتماعية. وعلى الرغم من أن هذه الميزة موجودة على هواتف «آيفون» المحدثة، فإنها ستصبح متوافرة على كمبيوترات «ماك» قريباً.

* وبالحديث عن نظام التشغيل «ماك أو إس»، فمن المتوقع أن يحصل الإصدار 15.3 (سيتم إطلاقه في أواخر يناير «كانون الثاني») على ميزة «الرموز التعبيرية التوليدية» Genmoji التي تسمح بصنع «رموز تعبيرية» Emoji مخصصة وفقاً لرغبة المستخدم، بواسطة الذكاء الاصطناعي وكتابة الوصف النصي المرغوب للحصول على رمز تعبيري يمكن مشاركته مع الآخرين بكل سهولة. ويمكن استخدام هذه الأداة لإيجاد شخصيات تشابه الأصدقاء باستخدام صورهم وكتابة وصف للرمز التعبيري الجديد المطلوب.

* وسيحصل مساعد «سيري» على تحسينات مزايا ذكاء اصطناعي ممتدة، تشمل إمكانية البحث عن الملفات وفهم ما يظهر على شاشة المستخدم والتكامل مع الكثير من التطبيقات الأخرى. وسيتمكن «سيري» من تتبع مكان كل شيء على جهاز المستخدم، مثل: الرسائل النصية، والبريد الإلكتروني، والملفات، والصور؛ للمساعدة في العثور على أي شيء يتم البحث عنه. كما سيتمكن المساعد من فهم ما يظهر على الشاشة وتنفيذ الأوامر بناء على ذلك، مثل معاينة ملف ما وقول «سيري، أرسل هذه الملف إلى مديري في العمل عبر رسالة بريد إلكتروني»، لتتم العملية بكل سلاسة. كما سيتمكن «سيري» من تنفيذ المهام المعقدة التي تتطلب استخدام أكثر من تطبيق لتنفيذها، مثل تحرير صورة ومشاركتها مع صديق محدد، من خلال أمر واحد.

اصنع فيديوهات مبهرة من صورك وفيديوهاتك آليا باستخدام "فيلم الذكريات" على الهواتف الجوالة والكومبيوترات الشخصية cut out

تجدر الإشارة إلى أن ميزة «ذكاء أبل» تدعم حالياً اللغة الإنجليزية فقط، ولكن من المتوقع أن تدعم الشركة اللغات التالية خلال عام 2025: الصينية والفرنسية والألمانية والإيطالية واليابانية والكورية والبرتغالية والإسبانية والفيتنامية.