نظم مطورة لمعالجة الصور والنصوص وتوفير الترجمة الفورية

تغطي فعاليات «مؤتمر غوغل للذكاء الصناعي»

نظم مطورة لمعالجة الصور والنصوص وتوفير الترجمة الفورية
TT

نظم مطورة لمعالجة الصور والنصوص وتوفير الترجمة الفورية

نظم مطورة لمعالجة الصور والنصوص وتوفير الترجمة الفورية

في مؤتمر تقني نظمته في مقرها الأحدث بمدينة زيوريخ السويسرية الأربعاء الماضي، عرضت «غوغل» آخر ما توصلت له في مجال الذكاء الصناعي وتعلم الآلة «MachineLearning» وهي التقنيات التي من شأنها أن تسهل علينا حياتنا اليومية بكل ظروفها. وحضرت «الشرق الأوسط» المؤتمر وقامت بمقابلة بعض المسؤولين للحديث عن هذه التقنيات وإمكانية توافرها في العالم العربي.

- تحويلات الصوت والنص
ترى «غوغل» أن مهمتها الرئيسية تتمثل في تنظيم معلومات العالم وجعلها في متناول الجميع بشكل مفيد. وبالفعل خلال العقد الماضي قدمت الشركة العديد من الخدمات والحلول في مختلف مجالات الحياة ولعل من أهمها تقنيات التعرف على الكلام Speech Recognition. ومع الذكاء الصناعي وصلت «غوغل» الآن لمستوى متقدم جداً، لدرجة أنها تستطيع التعرف على الكلام من أشخاص يعانون من صعوبات في التحدث كالتلعثم والتأتأة.
وللتأكيد على ذلك، قام عالم الأبحاث الروسي ديمتري كانفيسكي المتخصص في اللغات والكلام، الذي يعاني نفسه من صعوبة في الكلام، بتقديم عرض أمام الحضور. ورغم أننا لم نستطع فهم كل ما يقول فقد اعتمدنا على «غوغل» لتفريغ كلامه إلى نص، عُرض على شاشة كبيرة أثناء حديثه. كما عرف السيد ديمتري الحضور أيضاً على تطبيق جديد أسمته «غوغل» لوك أوت Lookout الذي يقوم بوصف أي شيء توجه له الكاميرا. فلو وجهت كاميرا الهاتف إلى طاولة مكتب سيعرّفك التطبيق صوتياً على كل ما هو موجود فوقها، مما يجعله تطبيقاً أساسياً لمن يعانون من صعوبات بصرية والمصابين بالعمى، بحيث يوفر لهم استقلالية لم تكن ممكنة من قبل.
وبخصوص الصعوبات البصرية توجد ميزة جديدة في متصفح «غوغل كروم» تعرض لك وصفاً لأي صورة موجودة على الإنترنت من خلال التعرف على المواد والأشياء الموجودة بها. وتم الحديث أيضاً عن خدمة Live Caption أو تفريغ النص اللحظي والتي تقوم بتفريغ أو عرض نص مكتوب لأي فيديو موجود على جهازك أو على الإنترنت. فلو كانت لغتك الإنجليزية ضعيفة مثلاً يمكنك تفعيل الخدمة الموجودة فقط حالياً في هاتف «غوغل بكسل 4» وسيقوم بعرض ترجمة نصية Subtitles لأي فيديو أو مقطع صوتي تشغله على الجهاز. وللقارئ أن يتخيل أهمية هذه الخدمة لمن يعانون من صعوبات في السمع أيضاً.

- ذكاء صناعي وحس اجتماعي
خصصت «غوغل» قسماً في مؤتمرها للحديث عن أهمية الذكاء الصناعي في مختلف جوانب الحياة كالمساعدة في التنبؤ بحدوث الفيضانات عن طريق تحليل بيانات ضخمة لصور ملتقطة من كاميرات الأقمار الصناعية - كتلك المستخدمة في خدمة «غوغل إيرث» - والتعرف على الأنماط المختلفة لحركة المياه ومعدل ارتفاعها في الوديان. كما قامت أيضاً، بمساعدة منظمات تهتم بحياة الحيوانات التي بدأت أعدادها تقل بشكل غير مسبوق وأصبحت معرضة بشكل كبير للانقراض. فعندما عجز العلماء عن معرفة السبب قاموا بالتعاون مع شركة «غوغل» لنصب عدد كبير من كاميرات المراقبة داخل الأدغال يتم تفعيلها بشكل أوتوماتيكي عن طريق مجس استشعار للحركة Motion Detection ليحصلوا بالنتيجة على كم هائل من المعلومات عن تحركات هذه الحيوانات ساعدتهم بشكل كبير في بحوثهم العلمية.
تعاونت «غوغل» أيضاً مع علماء يدرسون أنماط هجرة الحوت الأحدب، أحد أنواع الحيتان المهددة بالانقراض. تقوم كل مجموعة من هذه الحيتان بإصدار ما يشبه النغمة أو الأغنية الواحدة يتم تكرراها العديد من المرات كل ساعة أثناء هجرتها من مكان لآخر بمسافات تتعدى 25 ألف كيلومتر. ولكن الميكروفونات التي يستعملها العلماء للتنصت عليها تلتقط أيضاً أصوات الحيتان الأخرى بالإضافة إلى أصوات السفن مما يجعل من عملية تحديد مكانهم أمراً أشبه بالمستحيل. ولكن الوضع اختلف تماماً عندما تم إدخال تقنيات الذكاء الصناعي في عملية تحليل بيانات الأصوات التي تم التقاطها خلال الـ19 سنة الماضية من 12 موقعاً جغرافياً مختلفاً. الآن، وبفضل الذكاء الصناعي أصبح لدى العلماء فكرة شاملة عن دورة حياة هذه الحيتان وأنماط هجرتها وأماكن وجودها للمساعدة في الحد من ظاهرة الانقراض التي تهددها.

- الخصوصية والأمان
بما أن الذكاء الصناعي يعتمد أساساً على إدخال وتحليل البيانات التي تستقطبها «غوغل» من المستخدمين فإن التقدم في تعلم الآلة يجعل من حماية الخصوصية أحد أصعب التحديات التي تواجهها الشركة. ولذلك طورت الشركة نوعاً جديداً من طرق تعلم الآلة يسمىFederated Learning يسمح للمطورين بتدريب نماذج للذكاء الصناعي لصنع منتجات أكثر ذكاءً لا تعتمد على الحوسبة السحابية بل تقوم بتحليل البيانات ومعالجتها داخل جهازك دون الحاجة لرفعها إلى خوادم «غوغل». وهذا يعني أن الشركة يمكنها القيام بالمزيد بأقل نسبة من البيانات الشخصية.
لوحة المفاتيح GBroad الموجودة على ملايين من هواتف الأندرويد حول العالم كانت أولى هذه التطبيقات التي طبقت نظام Federated Learning لتحسين الكتابة التنبؤية وعرض اقتراحات للكلمات التالية في الجمل المراد كتابتها من قبل المستخدم. في السابق كانت GBoard تقترح عليك فقط الكلمات التي تستعملها أنت باستمرار أما الآن فستقترح عليك كلمات جديدة دون أن تعرف «غوغل» نفسها ما تكتبه أنت من كلمات. وأيضاً، يعتمد تطبيق الكاميرا الموجود بهواتف بكسل 4 الجديدة على هذه التقنية الجديدة فيمكن للجهاز ترجمة النصوص عن طريقة معالجتها داخل الهاتف نفسه مما يعني أنك ستحصل على الإجابات بسرعة أكبر، وأكثر أماناً.

- مترجم «غوغل»
بفضل الذكاء الصناعي يستطيع برنامج Google Translate الترجمة من وإلى أكثر من 100 لغة ولكن من الإضافات المميزة كان وضع المحادثة Conversation Mode والذي استخدمناه لطلب قهوة من شخص لا يفهم إلا اللغة البرتغالية. كل ما عليك فعله هو الضغط على الزر المخصص في التطبيق ثم التحدث بلغتك ليقوم التطبيق بترجمة ما قلته كلامياً - ولحظياً - للشخص الآخر.
في عام 2016. توقف فريق عمل تطبيق الترجمة عن استخدام نظام الترجمة الحرفية واستبدلها بالترجمة الآلية العصبية Neural Machine Translation. ومع NMT هذه، لا يقوم فريق عمل «غوغل» بتعليم النظام أي شيء عن اللغة المراد ترجمتها، بل يترك الأمر للنظام نفسه لتوليد الكلمات وترجمتها. ووظيفة فريق العمل بأن يعلمه أن هذه الجملة باللغة «ألف» يرادفها هذه الجملة من اللغة «باء» ليطور النظام نموذجه الخاص به لإعادة تنسيق وترجمة تلك الجمل بشكل مستقل.
كما نعلم فإن تطبيق الترجمة لا يدعم حالياً إلا اللغة العربية الفصحى، لذا، قمنا بسؤال المهندس ماك دف هيوغس رئيس قسم ترجمة «غوغل» عن احتمالية توفر اللهجات الدارجة في المنطقة العربية فقال إنه على دراية بهذه النقطة، وإن فريقه يسعى لإضافتها غير أن التحدي الأكبر الذي يواجهه فريقه أن هذه اللهجات غير مكتوبة وتستعمل فقط للمحادثة. وكلفتة جميلة منه، قام باستخدام وضع المحادثة في تطبيق ترجمة «غوغل» للرد علي وكانت الترجمة دقيقة بنسبة 100 في المائة.

- غوغل بكسل 4
استغلت الشركة المؤتمر لإعطاء تفاصيل أكثر عن أحدث هواتفها «غوغل بكسل 4» وعن تقنيات الذكاء الصناعي الموجودة فيه. عبر السنين، كان أهم ما يميز هواتف بكسل هو تقنيات التصوير المتقدمة التي تفوقت على كثير من المنافسين رغم أن هواتفها كانت تعتمد على عدسة واحدة فقط، فيما وصل المنافسون إلى أربع عدسات وأكثر.
ويرجع السبب في ذلك إلى أن الشركة تعول أكثر على التصوير الفوتوغرافي الحسابي computational photography أكثر من أي وقت مضى لتحسين الصور الملتقطة بالجهاز، لذلك دائماً ما تلاحظ أن الصور الملتقطة بأجهزة بكسل تستغرق بضع ثوانٍ لعرضها بعد التقطاها.
قامت «غوغل» أيضاً بإضافة عدسة ثانية في بكسل 4 لأول مرة في تاريخ أجهزة البكسل لتوفر «تقريباً رقمياً» يصل إلى 8 مرات دون التأثير على جودة ودقة الصورة. كما يوجد أيضاً وضع جديد في تطبيق الكاميرا تحت اسم Photo Booth وهو نمط يقوم عند تفعيله باختيار الوقت الأنسب لالتقاط الصورة بحيث لا تحتاج لأن تضغط على أي زر، ولك أن تتخيل أهمية هذه الميزة عند التقاط صور للأطفال أو الحيوانات الكثيرة الحركة. كما يأتي الهاتف بتطبيق لتسجيل المكالمات بإمكانه تفريغ الكلام المسجل لحظياً إلى نص ليسهل من عملية تفريغ المحاضرات للطلبة أو تفريغ المقابلات بالنسبة للصحافيين.
وعندما سألنا السيد براندون بأربيلو عن سبب عدم تمتع هواتف بكسل بأقوى المواصفات أسوة بالمنافسين رد بالقول إن «غوغل» لا تركز كثيراً على توفير العتاد الأقوى وإنما تعطي أولوية لتجربة المستخدم ككل من ناحية سلاسة وخفة النظام، الحفاظ على عمر البطارية وتوفير قدرات التصوير المتقدمة اعتماداً على تقنيات الذكاء الصناعي. سألناه أيضاً عن سبب إهمال الشركة لسوق الشرق الأوسط وقال إنه سيتواصل مع قسم المبيعات ليعلمه بأهمية السوق ودراسة إمكانية توفير الأجهزة لمحبي شركة «غوغل» في الوطن العربي.


مقالات ذات صلة

مدير عام «آي بي إم» لـ«الشرق الأوسط»: الذكاء الاصطناعي قادر على جني 4 تريليونات دولار سنوياً

خاص تتوافق مبادرات «آي بي إم» في مجال الذكاء الاصطناعي مع «رؤية 2030» مما يضع المنطقة في موقع رائد في مجال الابتكار (أدوبي)

مدير عام «آي بي إم» لـ«الشرق الأوسط»: الذكاء الاصطناعي قادر على جني 4 تريليونات دولار سنوياً

يعدّ سعد توما مدير عام «آي بي إم» في الشرق الأوسط وأفريقيا خلال لقاء مع «الشرق الأوسط»، أن الذكاء الاصطناعي «ليس مجرد أداة أخرى، بل ورشة عمل بأكملها».

نسيم رمضان (لندن)
تكنولوجيا يستمر معرض «CES 2025» حتى التاسع من شهر يناير بمشاركة عشرات الآلاف من عشاق التكنولوجيا والشركات التقنية في مدينة لاس فيغاس (CES)

معرض «CES» يكشف أحدث صيحات التقنيات الاستهلاكية لـ2025

إليكم بعض أبرز الابتكارات التي تكشف عنها كبريات شركات التكنولوجيا خلال أيام المعرض الأربعة في مدينة لاس فيغاس.

نسيم رمضان (لندن)
خاص توفر السيارة أحدث التقنيات بما في ذلك نظام صوتي قوي وميزات مساعدة السائق المتقدمة والتكامل السلس مع الهواتف الذكية (كاديلاك)

خاص تعرف على التقنيات التي تطرحها «كاديلاك» في «إسكاليد 2025»

«الشرق الأوسط» تـتحدث إلى سارة سميث مديرة هندسة البرامج في «كاديلاك».

نسيم رمضان (لندن)
تكنولوجيا تعد تطبيقات اللياقة البدنية أداة قوية لتتبع التقدم مع ضمان بقاء بياناتك آمنة (أدوبي)

كيف تحمي خصوصيتك أثناء استخدام تطبيقات اللياقة البدنية في 2025؟

إليك بعض النصائح لاستخدام تطبيقات اللياقة البدنية بأمان في العصر الرقمي.

نسيم رمضان (لندن)
الاقتصاد مقر هيئة الاتصالات والفضاء والتقنية في الرياض (الموقع الإلكتروني)

بدء تطبيق المرحلة الإلزامية الأولى لتوحيد منافذ الشحن في السعودية

بدأ تطبيق المرحلة الإلزامية الأولى لتوحيد منافذ الشحن للهواتف المتنقلة والأجهزة الإلكترونية في السوق، لتكون من نوع «USB Type - C».

«الشرق الأوسط» (الرياض)

منفذ هجوم نيو أورليانز استخدمها... ماذا نعرف عن نظارات «ميتا»؟

شمس الدين جبار يصور نفسه في المرآة بنظارات «ميتا» قبل هجوم نيو أورليانز (أ.ف.ب)
شمس الدين جبار يصور نفسه في المرآة بنظارات «ميتا» قبل هجوم نيو أورليانز (أ.ف.ب)
TT

منفذ هجوم نيو أورليانز استخدمها... ماذا نعرف عن نظارات «ميتا»؟

شمس الدين جبار يصور نفسه في المرآة بنظارات «ميتا» قبل هجوم نيو أورليانز (أ.ف.ب)
شمس الدين جبار يصور نفسه في المرآة بنظارات «ميتا» قبل هجوم نيو أورليانز (أ.ف.ب)

استخدم المهاجم الذي قاد شاحنة عبر شارع بوربون في مدينة نيو أورليانز الأميركية في يوم رأس السنة الجديدة نظارات «ميتا» الذكية لاستطلاع المشهد قبل أسابيع، وفقاً لمكتب التحقيقات الفيدرالي (إف بي آي)، بحسب شبكة «سي إن إن».

وقال ليونيل ميرثيل، وكيل مكتب التحقيقات الفيدرالي الخاص المسؤول في نيو أورليانز، إن شمس الدين جبار أقام في منزل مستأجر في نيو أورليانز بدءاً من 30 أكتوبر (تشرين الأول) وارتدى النظارات الذكية لتسجيل الفيديوهات أثناء ركوبه دراجته عبر الحي الفرنسي. ارتدى جبار النظارات مرة أخرى في يوم رأس السنة الجديدة لكنه لم يقم بتنشيطها.

وأوضح ميرثيل ضمن مؤتمر صحافي: «كان جبار يرتدي زوجاً من نظارات (ميتا) عندما نفذ الهجوم على شارع بوربون، لكنه لم ينشط النظارات لبث أفعاله مباشرة في ذلك اليوم».

ما هي نظارات «ميتا»؟

أصدرت «ميتا» نظاراتها الذكية في عام 2021 بالتعاون مع شركة «راي بان». وتبلغ أسعار نظارات «ميتا» الذكية 379 دولاراً، وفقاً لموقع «راي بان» على الويب.

يمكن لنظارات «ميتا» الذكية -التي تعد جزءاً من دفع اصطناعي أوسع نطاقاً لجعل التكنولوجيا القابلة للارتداء من دون استخدام اليدين منصة الحوسبة الكبيرة التالية- التقاط الصور واستخدام الذكاء الاصطناعي للإجابة عن أسئلة المستخدم حول محيطه.

كما ضمنت «ميتا» ميزة حتى يعرف المارة متى يلتقط المستخدم صورة أو يصور مقطع فيديو: ضوء LED صغير مواجه للأمام يضيء باللون الأبيض عندما تعمل الكاميرا.

وفي سبتمبر (أيلول)، أعلنت شركة «ميتا» عن إصدار جديد أكثر تقدماً من النظارات، يُدعى «أوريون»، والذي يتضمن تقنية الواقع المعزز، مما يسمح للمستخدمين برؤية الصور المجسمة، مثل الرسائل النصية أو رسائل البريد الإلكتروني، وهي تطفو في الفضاء حولهم.

وفقاً لإعلان الشركة، تم توفير نظارات الواقع المعزز لموظفي «ميتا» وبعض المستخدمين خارج الشركة حيث تعمل على تطوير إصدار للمستهلكين.

مؤسس شركة «ميتا» مارك زوكربيرغ يحمل زوجاً من نظارات «أوريون إي آر» (أ.ب)

التصوير الفوتوغرافي وتسجيل الفيديو

تستطيع الكاميرات عالية الدقة المدمجة في النظارات التقاط الصور وتسجيل مقاطع الفيديو لمدة تصل إلى ثلاث دقائق. ويمكن بعد ذلك استيراد هذه الصور ومقاطع الفيديو تلقائياً إلى تطبيق «ميتا فيو» على الهواتف الذكية للمستخدمين، إذا كانت الميزة قيد التشغيل.

لالتقاط الصور، يمكن للمستخدمين النقر فوق زر التقاط على جانب إطار النظارات. إذا تم تمكين عناصر التحكم الصوتي، يمكنهم التقاط صورة أو بدء التسجيل من دون استخدام اليدين، وفقاً لموقع الشركة على الويب. من خلال قول Hey Meta يمكن للمستخدمين إخبار النظارات ببدء التسجيل.

تستطيع النظارات أيضاً فتح البث المباشر عن طريق ربط حسابات «فيسبوك» أو «إنستغرام» بـ Meta View. بمجرد الاتصال، يمكن للمستخدمين التبديل بين الكاميرات بالضغط مرتين على زر التقاط الصور الخاص بنظاراتهم.

يمكن التحكم في نظارات «ميتا» الذكية صوتياً في بلدان مختارة، فقط عند التحدث باللغة الإنجليزية، لطرح أسئلة الذكاء الاصطناعي المدمجة.

تحتوي النظارات على مكبر صوت مدمج يعمل على تشغيل الموسيقى والذكاء الاصطناعي.

الخصوصية

يحتوي موقع النظارات أيضاً على قسم يتضمن نصائح مثل «احترم تفضيلات الأشخاص» و«أطفئ الجهاز في الأماكن الخاصة» و«كن عضواً جيداً في المجتمع»، حيث يقول: «احترم القانون. لا تستخدم نظارتك للقيام بأنشطة ضارة مثل التحرش أو انتهاك حقوق الخصوصية أو التقاط معلومات حساسة مثل رموز التعريف الشخصية».

تحتوي النظارات على مصباحين: مصباح LED مواجه للداخل لإعلام المستخدمين بالتقاط الصور ومصباح LED مواجه للخارج لإعلام الآخرين عند تشغيل النظارات والتقاط الصور أو مقاطع الفيديو.

تقول «ميتا» على الموقع: «إذا كان مصباح LED لالتقاط الصور مغطى، فسيتم إخطارك بذلك...».

لكن توصية «ميتا» بعدم استعمال النظارات لغزو خصوصية الآخرين تعتمد على اهتمام المستخدمين أنفسهم بهذا الطلب.