نظم مطورة لمعالجة الصور والنصوص وتوفير الترجمة الفورية

نظم مطورة لمعالجة الصور والنصوص وتوفير الترجمة الفورية

تغطي فعاليات «مؤتمر غوغل للذكاء الصناعي»
الثلاثاء - 29 شهر ربيع الأول 1441 هـ - 26 نوفمبر 2019 مـ رقم العدد [ 14973]
زيوريخ: هشام الكوحة
في مؤتمر تقني نظمته في مقرها الأحدث بمدينة زيوريخ السويسرية الأربعاء الماضي، عرضت «غوغل» آخر ما توصلت له في مجال الذكاء الصناعي وتعلم الآلة «MachineLearning» وهي التقنيات التي من شأنها أن تسهل علينا حياتنا اليومية بكل ظروفها. وحضرت «الشرق الأوسط» المؤتمر وقامت بمقابلة بعض المسؤولين للحديث عن هذه التقنيات وإمكانية توافرها في العالم العربي.



- تحويلات الصوت والنص

ترى «غوغل» أن مهمتها الرئيسية تتمثل في تنظيم معلومات العالم وجعلها في متناول الجميع بشكل مفيد. وبالفعل خلال العقد الماضي قدمت الشركة العديد من الخدمات والحلول في مختلف مجالات الحياة ولعل من أهمها تقنيات التعرف على الكلام Speech Recognition. ومع الذكاء الصناعي وصلت «غوغل» الآن لمستوى متقدم جداً، لدرجة أنها تستطيع التعرف على الكلام من أشخاص يعانون من صعوبات في التحدث كالتلعثم والتأتأة.

وللتأكيد على ذلك، قام عالم الأبحاث الروسي ديمتري كانفيسكي المتخصص في اللغات والكلام، الذي يعاني نفسه من صعوبة في الكلام، بتقديم عرض أمام الحضور. ورغم أننا لم نستطع فهم كل ما يقول فقد اعتمدنا على «غوغل» لتفريغ كلامه إلى نص، عُرض على شاشة كبيرة أثناء حديثه. كما عرف السيد ديمتري الحضور أيضاً على تطبيق جديد أسمته «غوغل» لوك أوت Lookout الذي يقوم بوصف أي شيء توجه له الكاميرا. فلو وجهت كاميرا الهاتف إلى طاولة مكتب سيعرّفك التطبيق صوتياً على كل ما هو موجود فوقها، مما يجعله تطبيقاً أساسياً لمن يعانون من صعوبات بصرية والمصابين بالعمى، بحيث يوفر لهم استقلالية لم تكن ممكنة من قبل.

وبخصوص الصعوبات البصرية توجد ميزة جديدة في متصفح «غوغل كروم» تعرض لك وصفاً لأي صورة موجودة على الإنترنت من خلال التعرف على المواد والأشياء الموجودة بها. وتم الحديث أيضاً عن خدمة Live Caption أو تفريغ النص اللحظي والتي تقوم بتفريغ أو عرض نص مكتوب لأي فيديو موجود على جهازك أو على الإنترنت. فلو كانت لغتك الإنجليزية ضعيفة مثلاً يمكنك تفعيل الخدمة الموجودة فقط حالياً في هاتف «غوغل بكسل 4» وسيقوم بعرض ترجمة نصية Subtitles لأي فيديو أو مقطع صوتي تشغله على الجهاز. وللقارئ أن يتخيل أهمية هذه الخدمة لمن يعانون من صعوبات في السمع أيضاً.



- ذكاء صناعي وحس اجتماعي

خصصت «غوغل» قسماً في مؤتمرها للحديث عن أهمية الذكاء الصناعي في مختلف جوانب الحياة كالمساعدة في التنبؤ بحدوث الفيضانات عن طريق تحليل بيانات ضخمة لصور ملتقطة من كاميرات الأقمار الصناعية - كتلك المستخدمة في خدمة «غوغل إيرث» - والتعرف على الأنماط المختلفة لحركة المياه ومعدل ارتفاعها في الوديان. كما قامت أيضاً، بمساعدة منظمات تهتم بحياة الحيوانات التي بدأت أعدادها تقل بشكل غير مسبوق وأصبحت معرضة بشكل كبير للانقراض. فعندما عجز العلماء عن معرفة السبب قاموا بالتعاون مع شركة «غوغل» لنصب عدد كبير من كاميرات المراقبة داخل الأدغال يتم تفعيلها بشكل أوتوماتيكي عن طريق مجس استشعار للحركة Motion Detection ليحصلوا بالنتيجة على كم هائل من المعلومات عن تحركات هذه الحيوانات ساعدتهم بشكل كبير في بحوثهم العلمية.

تعاونت «غوغل» أيضاً مع علماء يدرسون أنماط هجرة الحوت الأحدب، أحد أنواع الحيتان المهددة بالانقراض. تقوم كل مجموعة من هذه الحيتان بإصدار ما يشبه النغمة أو الأغنية الواحدة يتم تكرراها العديد من المرات كل ساعة أثناء هجرتها من مكان لآخر بمسافات تتعدى 25 ألف كيلومتر. ولكن الميكروفونات التي يستعملها العلماء للتنصت عليها تلتقط أيضاً أصوات الحيتان الأخرى بالإضافة إلى أصوات السفن مما يجعل من عملية تحديد مكانهم أمراً أشبه بالمستحيل. ولكن الوضع اختلف تماماً عندما تم إدخال تقنيات الذكاء الصناعي في عملية تحليل بيانات الأصوات التي تم التقاطها خلال الـ19 سنة الماضية من 12 موقعاً جغرافياً مختلفاً. الآن، وبفضل الذكاء الصناعي أصبح لدى العلماء فكرة شاملة عن دورة حياة هذه الحيتان وأنماط هجرتها وأماكن وجودها للمساعدة في الحد من ظاهرة الانقراض التي تهددها.



- الخصوصية والأمان

بما أن الذكاء الصناعي يعتمد أساساً على إدخال وتحليل البيانات التي تستقطبها «غوغل» من المستخدمين فإن التقدم في تعلم الآلة يجعل من حماية الخصوصية أحد أصعب التحديات التي تواجهها الشركة. ولذلك طورت الشركة نوعاً جديداً من طرق تعلم الآلة يسمىFederated Learning يسمح للمطورين بتدريب نماذج للذكاء الصناعي لصنع منتجات أكثر ذكاءً لا تعتمد على الحوسبة السحابية بل تقوم بتحليل البيانات ومعالجتها داخل جهازك دون الحاجة لرفعها إلى خوادم «غوغل». وهذا يعني أن الشركة يمكنها القيام بالمزيد بأقل نسبة من البيانات الشخصية.

لوحة المفاتيح GBroad الموجودة على ملايين من هواتف الأندرويد حول العالم كانت أولى هذه التطبيقات التي طبقت نظام Federated Learning لتحسين الكتابة التنبؤية وعرض اقتراحات للكلمات التالية في الجمل المراد كتابتها من قبل المستخدم. في السابق كانت GBoard تقترح عليك فقط الكلمات التي تستعملها أنت باستمرار أما الآن فستقترح عليك كلمات جديدة دون أن تعرف «غوغل» نفسها ما تكتبه أنت من كلمات. وأيضاً، يعتمد تطبيق الكاميرا الموجود بهواتف بكسل 4 الجديدة على هذه التقنية الجديدة فيمكن للجهاز ترجمة النصوص عن طريقة معالجتها داخل الهاتف نفسه مما يعني أنك ستحصل على الإجابات بسرعة أكبر، وأكثر أماناً.



- مترجم «غوغل»

بفضل الذكاء الصناعي يستطيع برنامج Google Translate الترجمة من وإلى أكثر من 100 لغة ولكن من الإضافات المميزة كان وضع المحادثة Conversation Mode والذي استخدمناه لطلب قهوة من شخص لا يفهم إلا اللغة البرتغالية. كل ما عليك فعله هو الضغط على الزر المخصص في التطبيق ثم التحدث بلغتك ليقوم التطبيق بترجمة ما قلته كلامياً - ولحظياً - للشخص الآخر.

في عام 2016. توقف فريق عمل تطبيق الترجمة عن استخدام نظام الترجمة الحرفية واستبدلها بالترجمة الآلية العصبية Neural Machine Translation. ومع NMT هذه، لا يقوم فريق عمل «غوغل» بتعليم النظام أي شيء عن اللغة المراد ترجمتها، بل يترك الأمر للنظام نفسه لتوليد الكلمات وترجمتها. ووظيفة فريق العمل بأن يعلمه أن هذه الجملة باللغة «ألف» يرادفها هذه الجملة من اللغة «باء» ليطور النظام نموذجه الخاص به لإعادة تنسيق وترجمة تلك الجمل بشكل مستقل.

كما نعلم فإن تطبيق الترجمة لا يدعم حالياً إلا اللغة العربية الفصحى، لذا، قمنا بسؤال المهندس ماك دف هيوغس رئيس قسم ترجمة «غوغل» عن احتمالية توفر اللهجات الدارجة في المنطقة العربية فقال إنه على دراية بهذه النقطة، وإن فريقه يسعى لإضافتها غير أن التحدي الأكبر الذي يواجهه فريقه أن هذه اللهجات غير مكتوبة وتستعمل فقط للمحادثة. وكلفتة جميلة منه، قام باستخدام وضع المحادثة في تطبيق ترجمة «غوغل» للرد علي وكانت الترجمة دقيقة بنسبة 100 في المائة.



- غوغل بكسل 4

استغلت الشركة المؤتمر لإعطاء تفاصيل أكثر عن أحدث هواتفها «غوغل بكسل 4» وعن تقنيات الذكاء الصناعي الموجودة فيه. عبر السنين، كان أهم ما يميز هواتف بكسل هو تقنيات التصوير المتقدمة التي تفوقت على كثير من المنافسين رغم أن هواتفها كانت تعتمد على عدسة واحدة فقط، فيما وصل المنافسون إلى أربع عدسات وأكثر.

ويرجع السبب في ذلك إلى أن الشركة تعول أكثر على التصوير الفوتوغرافي الحسابي computational photography أكثر من أي وقت مضى لتحسين الصور الملتقطة بالجهاز، لذلك دائماً ما تلاحظ أن الصور الملتقطة بأجهزة بكسل تستغرق بضع ثوانٍ لعرضها بعد التقطاها.

قامت «غوغل» أيضاً بإضافة عدسة ثانية في بكسل 4 لأول مرة في تاريخ أجهزة البكسل لتوفر «تقريباً رقمياً» يصل إلى 8 مرات دون التأثير على جودة ودقة الصورة. كما يوجد أيضاً وضع جديد في تطبيق الكاميرا تحت اسم Photo Booth وهو نمط يقوم عند تفعيله باختيار الوقت الأنسب لالتقاط الصورة بحيث لا تحتاج لأن تضغط على أي زر، ولك أن تتخيل أهمية هذه الميزة عند التقاط صور للأطفال أو الحيوانات الكثيرة الحركة. كما يأتي الهاتف بتطبيق لتسجيل المكالمات بإمكانه تفريغ الكلام المسجل لحظياً إلى نص ليسهل من عملية تفريغ المحاضرات للطلبة أو تفريغ المقابلات بالنسبة للصحافيين.

وعندما سألنا السيد براندون بأربيلو عن سبب عدم تمتع هواتف بكسل بأقوى المواصفات أسوة بالمنافسين رد بالقول إن «غوغل» لا تركز كثيراً على توفير العتاد الأقوى وإنما تعطي أولوية لتجربة المستخدم ككل من ناحية سلاسة وخفة النظام، الحفاظ على عمر البطارية وتوفير قدرات التصوير المتقدمة اعتماداً على تقنيات الذكاء الصناعي. سألناه أيضاً عن سبب إهمال الشركة لسوق الشرق الأوسط وقال إنه سيتواصل مع قسم المبيعات ليعلمه بأهمية السوق ودراسة إمكانية توفير الأجهزة لمحبي شركة «غوغل» في الوطن العربي.
أميركا سويسرا Technology الإنترنت غوغل

اختيارات المحرر

الوسائط المتعددة