تقنية التعرف على الصوت: «أندرويد» مقابل «سيري»

نظام الأوامر الصوتية في أجهزة أندرويد و نظام «سيري» للأوامر الصوتية في أجهزة «أبل»
نظام الأوامر الصوتية في أجهزة أندرويد و نظام «سيري» للأوامر الصوتية في أجهزة «أبل»
TT

تقنية التعرف على الصوت: «أندرويد» مقابل «سيري»

نظام الأوامر الصوتية في أجهزة أندرويد و نظام «سيري» للأوامر الصوتية في أجهزة «أبل»
نظام الأوامر الصوتية في أجهزة أندرويد و نظام «سيري» للأوامر الصوتية في أجهزة «أبل»

هل أوامر الصوت الخاصة بـ«أندرويد» لا تزال غير ملائمة مقارنة بنظام «سيري». لكي أتأكد من الإجابة على هذا السؤال، انغمست أسبوعين في دراسة سمة التعرف على الصوت. حملت «آي فون»، وهاتفا يعمل بنظام التشغيل «أندرويد» الخاص بـ«غوغل» معي في كل مكان. كنت أستخدم الهاتفين معا. أردت أن أعرف الفروق بينهما ومواطن القوة والضعف.
حينما يتحدث الناس عن التعرف على الصوت، فإنهم يعنون، وغالبا ما يخلطون بين ثلاث وظائف مختلفة. هناك الإملاء، الذي يحول من خلاله الهاتف الكلام إلى نص؛ ثم الأوامر بحيث يمكنك تشغيل الهاتف عن طريق الكلام؛ ثم إجراء عمليات بحث عن معلومات عن الإنترنت.
ثمة أوجه اختلاف كبيرة بين نجاحات الوظائف الثلاث. على سبيل المثال، لا تزال ميزة التعرف على الكلام «الإملاء» على سبيل المثال ضعيفة نسبيا في كلا النظامين. كما أن هاتفي «أندرويد» و«سيري»، وهي تقنية التعرف على الصوت في «آي فون»، يقعان في الكثير من أخطاء ترجمة الصوت إلى نص. حينما تسمع أناسا يعبرون عن ضجرهم من ترجمة الكلام إلى نص على الهواتف الجوالة، قائلين: «لقد يئسنا منها»، فهم عادة ما يشيرون إلى سمة الإملاء.
هذا أمر يمكن التغاضي عنه، لكن انظر. إنك تطلب من هاتفك أن يفهم النبرات المختلفة على مسافات متباينة من ميكروفونك، في غرف تتباين فيها درجة الصوت في الخلفية. من العجيب أن هذه السمة تعمل بالأساس.
* مقارنة النظم
* إن أحدث نسخة من «أندرويد» لا تتطلب اتصالا بالإنترنت للقيام بعملية الإملاء الأساسية. وفي «أندرويد»، تظهر الكلمات على الشاشة عندما تنطقها؛ أما «سيري»، فلا يقوم بترجمة الكلام إلى نص إلى أن تتوقف عن الكلام.
على الجانب الآخر، يفهم «سيري» عناصر التحكم في التنسيق مثل «حرف كبير» (capital) و«كتابة كل الأحرف كبيرة» (all caps) و«عدم ترك مسافة» (no space)، إضافة إلى كل أنواع الترقيم - «النقطتان المتراكبتان» و«الشرطة» و«العلامة النجمية» و«علامات الكلام المحذوف في الجملة» وما إلى ذلك.
لا يفهم «أندرويد» سوى الرموز الأساسية، مثل «نقطة انتهاء الجملة» و«الفاصلة» و«علامة التعجب».
وتعتبر الفئة الثانية، وهي أوامر التحكم في الهاتف، أكثر نجاحا بدرجة كبيرة بالنسبة لعدد ضخم من الناس. وتتمثل في توجيهك عبارات مثل: «اتصل بأمي»، «أرسل رسالة نصية إلى زميلي»، «أيقظني الساعة 7:30»، «شغل بعض أغاني بيلي جويل»، «ذكرني بإطعام القطة عندما أعود للمنزل»، وغير ذلك.
إن التحكم في هاتفك من دون لمسه مهم لسلامتك بالطبع. إذا تحتم عليك التفاعل مع هاتفك أثناء القيادة، فبالتأكيد يبدو حديثك إليه أكثر أمانا من تطلعك له.
لكن لا تنس عامل الملاءمة. من الأسرع أن تقول «افتح أنغري بيردز» عن أن تقلب في شاشات مليئة بالأيقونات. ويعتبر توجيهك عبارة «اضبط منبهي على الساعة الثامنة صباحا» أسرع بقيمة 375 ضغطة بإصبعك عن استخدام تطبيق المنبه.
هنا، أصبح «سيري» يتمتع بميزة. على سبيل المثال، إذا سمعت أثناء القيادة صوت الرسالة المقبلة، يمكنك أن تقول: «اقرأ رسائلي الجديدة»، وسيقوم «سيري» بقراءتها بصوت مرتفع. بل إنه يدعوك لإملاء رد، من دون حتى رفع عينيك عن الطريق. ولا يستطيع «أندرويد» القيام بهذا.
* التطبيقات والإنترنت
* بإمكان كلا النظامين الاستفادة من بعض التطبيقات الخاصة بالهاتف. إنهما يتعرفان على أوامر مثل «اعقد اجتماعا مع السيد فلان ظهيرة يوم الخميس» (تفاعل تقويمي)، «أعد ملحوظة لسداد الأموال إلى هارولد»، «أرسل رسالة بريد إلكتروني إلى داني كوبر» (بريد) و«ما عنوان منزل ستيف ألبر؟» (جهات اتصال).
وعلى الرغم من ذلك، يستغنى «أندرويد» عن نظام التشغيل «آي أو إس»، في عمليات البحث على الإنترنت. يقوم كلا النوعين من الهواتف بمهمة مذهلة في جلب تحديثات الطقس (كيف سيكون الطقس في ديترويت نهاية هذا الأسبوع؟) وتحديثات الوقت (ما الوقت في بلجيكا؟)، وأسعار الأسهم ومعلومات عن الرياضات (ما لعبة رعاة البقر المقبلة) المحادثات (ما قيمة 32 يورو بالدولارات)، الحسابات (كم عدد الأيام المتبقية قبل حلول العيد المقبل؟) وكل أنواع الأسئلة الخاصة بالبحث على الإنترنت (كم عدد السعرات الحرارية في قطعة شوكولاته «هيرشي»؟ متى سيكون كسوف الشمس المقبل؟ كيف تتهجى كلمة schadenfreud؟ اعرض لي صورا لكورفيت 1985، وغير ذلك).
لكن العنصر الأساسي في «غوغل» هو عمليات البحث على الإنترنت، ومن ثم، عادة ما تكون استجابات «أندرويد» أكثر وأسرع. (لتجربة هذا الأسلوب على جهاز «آي فون»، قم بتنزيل تطبيق «غوغل سيرش»).
يعتبر «أندرويد» مذهلا على وجه الخصوص في الاتصال بأماكن من دون الحاجة للبحث عنها (اتصال بماسيز في شارع 34) واتجاهات (وصلني إلى مطار لا غارديا بالمواصلات العامة)، نظرا لأن تطبيق «ماب» (الخرائط) المضمن فيه رائع على نحو لا يمكن تصديقه. إضافة إلى ذلك، فإنه أيضا أكثر ذكاء فيما يتعلق بربط سؤال بآخر. إذا كان أول سؤال طرحته هو: «من هي هيلاري كلينتون؟»، فيمكنك أن تتبعه بسؤال: «من زوجها»؟
ويشتمل «غوغل» على سمة مضمنة خاصة بالتعرف على الموسيقى، مثل تطبيق «شازام». اضغط على أيقونة التعرف على الصوت، ودع الهاتف يستمع لأي أغنية تشغلها، وسوف تندهش من تعرفه على الفور على الأغنية والمغني.
* «سيري» و«أندرويد»
* لسوء الحظ، يشتمل «أندرويد» على عقب أخيل - فعليا، أقرب إلى ساق أخيل كاملة. ولإصدار أوامر شفهية، يتعين عليك أن تضغط على أيقونة الميكروفون على شريط بحث «غوغل». وهي موجودة فقط على الشاشة الرئيسة أو شاشة «غوغل ناو» (قم بالإدخال من أعلى لأسفل). بهذا، لا يمكنك أن توجه أوامر كلامية عندما يكون هاتفك مغلقا، أو عندما تكون داخل تطبيق آخر.
على «آي فون»، استمر في الضغط على زر Home أو على زر تحكم عن بعد على سلك سماعات أذنيك، بحيث يمكن أن تعمل سمة التحكم في الصوت عندما يكون الهاتف مغلقا أو في أي تطبيق.
بعبارة أخرى، لاستخدام سمات الحديث الخاصة بهاتف «أندرويد»، يتعين عليك أن تنتقيها بشكل متكرر، ودائما ما يتعين عليك أن تنظر إليها، الأمر الذي يقوض الجزء الأكبر من غرض تلك السمات. الاستثناء: يمكن ضبط هواتف «موتورولا» الجديدة، مثل «موتو إكس» بحيث تستمع إلى الكلام طوال الوقت.
يكون «سيري» أفضل مع المطاعم والأفلام أيضا. يفهم كلا الهاتفين عبارات مثل: «المطاعم الهندية الجيدة في المنطقة». لكن «سيري» يمكنه أيضا أن يسجل حجوزات، بفضل تكامله مع موقع OpenTable.com. على سبيل المثال، يمكنك أن تقول: «قم بالحجز في مطعم إيطالي رخيص ليلة السبت الساعة السابعة».
بالمثل، يوفر «سيري» شاشات إجابات جذابة مضمنة لأسئلة مثل: «ما الأفلام التي يعرض أول عرض لها هذا الأسبوع؟»، «أعطني تقييمات لفيلم ‹The Way, Way Back» أو «ما أوقات عرض (السنافر 2)». عرض لك «أندرويد» للتو فقط نتائج بحثك على «غوغل».
بعد ذلك، تأتي مسألة الشخصية. يشتمل «سيري» على تلك السمة، في حين لا يشتمل عليها «أندرويد». نحن نتحدث عن الملاحظات البارعة والنكات والموقف، من خلال مخاطبتك باسمك. إذا وجهت سؤالك لـ«سيري» قائلا: «من والدك؟» لأجابك: «أنت. هل يمكننا العودة إلى العمل الآن؟».
الآن، على ساحة المعركة الكبرى لحرب المعجبين بين «أبل» و«غوغل»، لا تزال الدعابة أمرا غير ذي أهمية. يفتح كارهو «أبل» أعينهم عن آخرها عندما تشير إلى الطابع المميز لسيري. وتأتي إجابتهم: «إنه ليس مفيدا! إنها خدعة! إنه يستنزفك لتجنب التجاوز في وصف مدى الغباء الذي تبدو عليه!».
وهذا أمر جيد. ولهذا، هناك خيار: معسكران في هذه المدرسة الفلسفية. (حسنا، هناك أيضا «ويندوز فون» و«بلاك بيري»، ولكن خاصية التعرف على الصوت بهما بدائية).
إذن: ضع سيفك في غمده. كلا النظامين مفيد إلى حد بعيد، بمجرد أن تخصص الوقت لتعلمهما. (هناك موقع إلكتروني يضم قائمة جيدة من أوامر الصوت الخاصة بـ«أندرويد»: j.mp/12kEFDo. وهناك آخر لـ«سيري»: j.mp/16Yy4yy.).
على الرغم من أن «سيري» يتمتع بالأفضلية، فإن الفجوة بينهما قد أغلقت بالكامل، وكلا النظامين يتطور بسرعة. على سبيل المثال، حتى وقت قريب، لم يكن «أندرويد» يتضمن سمات تحكم في الصوت على الإطلاق - عمليات بحث على الإنترنت فقط. وفي تحديث هذا الخريف لنظام iOS 7، سوف يكتسب «سيري» صوتا حديثا أكثر عذوبة، وعمليات بحث أسرع وقدرة على تغيير الإعدادات بالصوت (قم بتشغيل Airplane Mode، «شغل سمة الوضوح»، «شغل بلو توث» - شيء لا يمكن لأي هاتف القيام به الآن. ويعتبر هذا واضحا: سمة التعرف على الصوت بالهاتف الخلوي تتحسن بسرعة. عما قريب، سوف يقل حديثنا عبر هواتفنا، فيما سيزيد حديثنا إليها!
* خدمة «نيويورك تايمز»



ساعة ذكية «صحية» جديدة

ساعة ذكية «صحية» جديدة
TT

ساعة ذكية «صحية» جديدة

ساعة ذكية «صحية» جديدة

أعلنت «لينك2كير»؛ المنصة التكنولوجية في مجال الأجهزة القابلة للارتداء المعنية بالرعاية الصحية الوقائية، حديثاً عن إطلاق ساعتها الذكية «ووتش2كير فايتال» في الولايات المتحدة، خلال معرض الإلكترونيات الاستهلاكية في لاس فيغاس.

ساعة «صحية»

وروجت المنصة لساعة «ووتش2كير فايتال (Watch2Care Vital Smartwatch)»، بوصفها أول ساعة ذكية تجمع بين 3 آلاف عام من الطب الصيني التقليدي، وبيانات صحية واقعية تخص أكثر من 9 ملايين حالة، علاوة على أنظمة ذكاء اصطناعي متطورة. صحيح أنها تتعقب خطواتك؛ الأمر الذي اعتاده كثيرون منا (وأنا منهم)، إلا إنها تقدم أكثر من ذلك بكثير...

* مبادئ الطب الصيني. تحتوي الساعة الذكية مستشعرات متطورة تلتقط وتحلل «البيانات الحيوية الغربية»، وكذلك بيانات نبضات القلب، وفق «مبادئ الطب الصيني التقليدي»، وذلك في الوقت الفعلي.

باختصار؛ تشكل هذه الساعة جهازاً متطوراً لتتبع الصحة يُرتدى على المعصم. وأوضح أحد ممثلي «لينك2كير» أن الساعة الجديدة تتبع نهجاً شاملاً.

وتتضمن ميزاتها تكنولوجيا رائدة لمراقبة الحالة الصحية؛ تركز على تحليل وظائف أعضاء الجسم، مثل القلب والكبد والطحال والرئتين والكليتين. وتركز النتائج على تنبيه المستخدمين حال ظهور مؤشرات مبكرة على مشكلات صحية محتملة، وتشجيعهم على تعديل نمط حياتهم ونظامهم الغذائي.

* مراقبة مستمرة: توفر الساعة مراقبة مستمرة لـ38 مؤشراً فسيولوجياً، بما في ذلك تحليل النوم الضروري والشائع، وتتبع نمط الحياة النشط، ومراقبة أجهزة الجسم، والبيانات الحيوية في الوقت الفعلي.

* تقارير صحية بالذكاء الاصطناعي: كما توفر ساعة «ووتش2كير فايتال»، يومياً، تقارير صحية مُولّدة بالذكاء الاصطناعي، بالإضافة إلى مؤشرات صحية شاملة، عبر تطبيق «لينك2كير»، المتوفر على متجر تطبيقات «أبل» ومتجر «غوغل بلاي»، الذي يُستخدم كذلك لتحديثات البرامج الثابتة. وتتولى ميزة مراقبة النوم متابعة أي ارتفاعات غير طبيعية في معدل خفقان القلب خلال الليل.

وخلال الفترة القصيرة التي استخدمتُ فيها الساعة، لم أتمكن من رصد أي شيء لافت في جسمي، لكن إمكاناتها لفتت انتباهي دونما شك. ورغم أنها ليست ساعة ذكية بالمعنى المتعارف عليه، مثل ساعة «أبل ووتش»، فإنها توفر مزايا الرسائل، والإشعارات، والبريد الإلكتروني، علاوة على عدد كبير من التطبيقات، وإمكانية الاتصال بـ«كار بلاي».

يذكر أنه يجري تسويق الميزات الصحية للساعة بوصفها تتجاوز بكثير ما تقدمه الساعات الذكية الأخرى، وذلك بالاعتماد على الطب الصيني التقليدي. ولدى ارتدائك ساعة «ووتش2كير فايتال»، فإنك تتلقى أول تقرير يستند إلى مبادئ الطب الصيني التقليدي في غضون 24 ساعة. ويتضمن التقرير معلوماتٍ؛ مثل تقييم من 100 درجة لوظائف القلب والكبد والكلى والطحال. كما يحتوي ميزة لقياس مستوى الأكسجين في الدم.

بريد إلكتروني ورسائل نصية

وبما أنها على اتصال بهاتفك الذكي، فإن ساعة «ووتش2كير فايتال» ترسل تنبيهاً لدى ورود رسائل بريد إلكتروني، أو رسائل نصية جديدة... كما تعرض الساعة الوقت، وتوفر منبهاً، بجانب معلومات عن حالة الطقس... وهي تُستقى من هاتفك الذكي.

من حيث التصميم، تتميز الساعة بتصميم أنيق يتفوق على الساعات الذكية الأوسع شيوعاً. كما تتمتع ببطارية تستمر 48 ساعة؛ الأمر الذي أثبتته تجربتي الشخصية، إضافة إلى إمكانية شحنها بسرعة في غضون نحو ساعة ونصف. كما يأتي معها كابل شحن «يو إس بي» خاص. وتعمل شاشتها، التي تأتي بمقاس 1.43 بوصة، باللمس، وتتميز بحواف دائرية، ومدمجة في هيكل من التيتانيوم، وتدعم تكنولوجيا «بلوتوث 5.3» للاتصال. وتتميز بدقة عرض فائقة الوضوح تبلغ 466 × 466 بيكسل، بجانب أنها مقاومة للماء بمعيار «آي بي67».

وبصفتي من مستخدمي «أبل ووتش» منذ مدة طويلة، فقد وجدتُ أن شاشة اللمس في ساعة «ووتش2كير فايتال» سريعة الاستجابة وسهلة الاستخدام للوصول إلى الميزات والشاشات الأخرى. وفي المجمل، تتوفر 6 واجهات للساعة للاختيار من بينها، ولا يوجد خيار صحيح أو خاطئ؛ الأمر يعتمد على ما تفضله والمعلومات التي ترغب في رؤيتها. شخصياً، اخترت الواجهة التي تعرض الوقت بأكبر خط. ويبلغ ثمن الساعة 2384 دولاراً.

http://www.link2care.asia

* خدمات «تريبيون ميديا»


خبراء ينصحون بإبعاد الأطفال عن الدمى الناطقة بالذكاء الاصطناعي

شخصية «باز لايت يير» (بيكساباي)
شخصية «باز لايت يير» (بيكساباي)
TT

خبراء ينصحون بإبعاد الأطفال عن الدمى الناطقة بالذكاء الاصطناعي

شخصية «باز لايت يير» (بيكساباي)
شخصية «باز لايت يير» (بيكساباي)

مع أفلام مغامرات «حكاية لعبة» الشيّقة، إلى حركات «تيد» الطفولية، أصبحت فكرة الدمى والدببة المحشوة، التي تدب فيها الحياة فكرةً سينمائيةً مبتذلة.

وبينما أتاحت التطورات الحديثة في مجال الذكاء الاصطناعي إمكانية صنع ألعاب تبدو واعية، فإنها تبدو أقرب إلى شخصيات شريرة مثل المهرج في فيلم «بولترجايست» وشخصية «تشاكي» في فيلم «لعبة طفل» منها إلى شخصيتَي «وودي» و«باز لايت يير».

ووفقاً لمنظمة «كومن سينس ميديا»، الأميركية غير الحكومية المعنية بمراقبة السلع الإلكترونية الاستهلاكية، فإن الدمى وألعاب الأطفال التي تعمل بالذكاء الاصطناعي تقول كلاماً غير لائق للأطفال، وتنتهك خصوصية المنزل من خلال جمع بيانات واسعة النطاق.

يقول روبي تورني، رئيس قسم التقييمات الرقمية في «كومن سينس»: «أظهر تقييمنا للمخاطر أن دمى الذكاء الاصطناعي تشترك في مشكلات جوهرية تجعلها غير مناسبة للأطفال الصغار».

ويقول تورني: «أكثر من رُبع المنتجات تتضمَّن محتوى غير لائق، مثل الإشارة إلى إيذاء النفس، والمخدرات، والسلوكيات الخطرة»، مشيراً إلى أن هذه الأجهزة تستلزم «جمع بيانات مكثف»، وتعتمد على «نماذج اشتراك تستغل الروابط العاطفية».

ووفقاً لمنظمة «كومن سينس»، تستخدم بعض هذه الألعاب «آليات ترابط لخلق علاقات شبيهة بالصداقة»، محذِّرة من أن هذه الأجهزة في الوقت نفسه «تجمع بيانات واسعة النطاق في المساحات الخاصة بالأطفال»، بما في ذلك التسجيلات الصوتية، والنصوص المكتوبة، و«البيانات السلوكية».

وتؤكد «كومن سينس» ضرورة عدم وجود أي طفل دون سن الخامسة بالقرب من لعبة ذكاء اصطناعي، وأنَّ على الآباء توخي الحذر فيما يتعلق بالأطفال الذين تتراوح أعمارهم بين 6 و12 عاماً.

ويقول جيمس ستاير، مؤسِّس ورئيس منظمة «كومن سينس»: «ما زلنا نفتقر إلى ضمانات فعّالة لحماية الأطفال من الذكاء الاصطناعي»، مقارِناً بين غياب هذه الحماية و«الاختبارات الصارمة» للسلامة والملاءمة التي تخضع لها الألعاب الأخرى قبل الموافقة على طرحها للبيع.


بالخطأ... منصة في كوريا الجنوبية توزع «بتكوين» بقيمة 44 مليار دولار

شعار منصة تداول العملات المشفرة الكورية الجنوبية «بيثامب» (رويترز)
شعار منصة تداول العملات المشفرة الكورية الجنوبية «بيثامب» (رويترز)
TT

بالخطأ... منصة في كوريا الجنوبية توزع «بتكوين» بقيمة 44 مليار دولار

شعار منصة تداول العملات المشفرة الكورية الجنوبية «بيثامب» (رويترز)
شعار منصة تداول العملات المشفرة الكورية الجنوبية «بيثامب» (رويترز)

كشفت منصة تداول العملات المشفرة الكورية الجنوبية «بيثامب»، اليوم السبت، عن أنها وزعت عملات «بتكوين» بقيمة تتجاوز 40 مليار دولار على عملاء بوصفها مكافآت ترويجية عن طريق الخطأ، ما أدى إلى موجة بيع حادة على المنصة.

واعتذرت «‌بيثامب» عن ‌الخطأ الذي ‌وقع ⁠أمس ​الجمعة، ‌وقالت إنها استعادت 99.7 في المائة من إجمالي 620 ألف «بتكوين» بقيمة تبلغ نحو 44 مليار دولار بالأسعار الحالية. وقيدت عمليات التداول والسحب ⁠على 695 عميلاً متأثراً بالواقعة في ‌غضون 35 دقيقة ‍من التوزيع ‍الخاطئ أمس.

وأفادت تقارير إعلامية بأن ‍المنصة كانت تعتزم توزيع مكافآت نقدية صغيرة في حدود 2000 وون كوري (1.40 دولار) ​أو أكثر لكل مستخدم في إطار حدث ترويجي، لكن ⁠الفائزين حصلوا بدلاً من ذلك على ألفي «بتكوين» على الأقل لكل منهم.

وقالت «‌بيثامب» في بيان: «نود أن نوضح أن هذا لا علاقة له بقرصنة خارجية أو انتهاكات أمنية، ولا توجد مشاكل في أمن النظام ‌أو إدارة أصول العملاء».