نظم مطورة لمعالجة الصور والنصوص وتوفير الترجمة الفورية

تغطي فعاليات «مؤتمر غوغل للذكاء الصناعي»

نظم مطورة لمعالجة الصور والنصوص وتوفير الترجمة الفورية
TT

نظم مطورة لمعالجة الصور والنصوص وتوفير الترجمة الفورية

نظم مطورة لمعالجة الصور والنصوص وتوفير الترجمة الفورية

في مؤتمر تقني نظمته في مقرها الأحدث بمدينة زيوريخ السويسرية الأربعاء الماضي، عرضت «غوغل» آخر ما توصلت له في مجال الذكاء الصناعي وتعلم الآلة «MachineLearning» وهي التقنيات التي من شأنها أن تسهل علينا حياتنا اليومية بكل ظروفها. وحضرت «الشرق الأوسط» المؤتمر وقامت بمقابلة بعض المسؤولين للحديث عن هذه التقنيات وإمكانية توافرها في العالم العربي.

- تحويلات الصوت والنص
ترى «غوغل» أن مهمتها الرئيسية تتمثل في تنظيم معلومات العالم وجعلها في متناول الجميع بشكل مفيد. وبالفعل خلال العقد الماضي قدمت الشركة العديد من الخدمات والحلول في مختلف مجالات الحياة ولعل من أهمها تقنيات التعرف على الكلام Speech Recognition. ومع الذكاء الصناعي وصلت «غوغل» الآن لمستوى متقدم جداً، لدرجة أنها تستطيع التعرف على الكلام من أشخاص يعانون من صعوبات في التحدث كالتلعثم والتأتأة.
وللتأكيد على ذلك، قام عالم الأبحاث الروسي ديمتري كانفيسكي المتخصص في اللغات والكلام، الذي يعاني نفسه من صعوبة في الكلام، بتقديم عرض أمام الحضور. ورغم أننا لم نستطع فهم كل ما يقول فقد اعتمدنا على «غوغل» لتفريغ كلامه إلى نص، عُرض على شاشة كبيرة أثناء حديثه. كما عرف السيد ديمتري الحضور أيضاً على تطبيق جديد أسمته «غوغل» لوك أوت Lookout الذي يقوم بوصف أي شيء توجه له الكاميرا. فلو وجهت كاميرا الهاتف إلى طاولة مكتب سيعرّفك التطبيق صوتياً على كل ما هو موجود فوقها، مما يجعله تطبيقاً أساسياً لمن يعانون من صعوبات بصرية والمصابين بالعمى، بحيث يوفر لهم استقلالية لم تكن ممكنة من قبل.
وبخصوص الصعوبات البصرية توجد ميزة جديدة في متصفح «غوغل كروم» تعرض لك وصفاً لأي صورة موجودة على الإنترنت من خلال التعرف على المواد والأشياء الموجودة بها. وتم الحديث أيضاً عن خدمة Live Caption أو تفريغ النص اللحظي والتي تقوم بتفريغ أو عرض نص مكتوب لأي فيديو موجود على جهازك أو على الإنترنت. فلو كانت لغتك الإنجليزية ضعيفة مثلاً يمكنك تفعيل الخدمة الموجودة فقط حالياً في هاتف «غوغل بكسل 4» وسيقوم بعرض ترجمة نصية Subtitles لأي فيديو أو مقطع صوتي تشغله على الجهاز. وللقارئ أن يتخيل أهمية هذه الخدمة لمن يعانون من صعوبات في السمع أيضاً.

- ذكاء صناعي وحس اجتماعي
خصصت «غوغل» قسماً في مؤتمرها للحديث عن أهمية الذكاء الصناعي في مختلف جوانب الحياة كالمساعدة في التنبؤ بحدوث الفيضانات عن طريق تحليل بيانات ضخمة لصور ملتقطة من كاميرات الأقمار الصناعية - كتلك المستخدمة في خدمة «غوغل إيرث» - والتعرف على الأنماط المختلفة لحركة المياه ومعدل ارتفاعها في الوديان. كما قامت أيضاً، بمساعدة منظمات تهتم بحياة الحيوانات التي بدأت أعدادها تقل بشكل غير مسبوق وأصبحت معرضة بشكل كبير للانقراض. فعندما عجز العلماء عن معرفة السبب قاموا بالتعاون مع شركة «غوغل» لنصب عدد كبير من كاميرات المراقبة داخل الأدغال يتم تفعيلها بشكل أوتوماتيكي عن طريق مجس استشعار للحركة Motion Detection ليحصلوا بالنتيجة على كم هائل من المعلومات عن تحركات هذه الحيوانات ساعدتهم بشكل كبير في بحوثهم العلمية.
تعاونت «غوغل» أيضاً مع علماء يدرسون أنماط هجرة الحوت الأحدب، أحد أنواع الحيتان المهددة بالانقراض. تقوم كل مجموعة من هذه الحيتان بإصدار ما يشبه النغمة أو الأغنية الواحدة يتم تكرراها العديد من المرات كل ساعة أثناء هجرتها من مكان لآخر بمسافات تتعدى 25 ألف كيلومتر. ولكن الميكروفونات التي يستعملها العلماء للتنصت عليها تلتقط أيضاً أصوات الحيتان الأخرى بالإضافة إلى أصوات السفن مما يجعل من عملية تحديد مكانهم أمراً أشبه بالمستحيل. ولكن الوضع اختلف تماماً عندما تم إدخال تقنيات الذكاء الصناعي في عملية تحليل بيانات الأصوات التي تم التقاطها خلال الـ19 سنة الماضية من 12 موقعاً جغرافياً مختلفاً. الآن، وبفضل الذكاء الصناعي أصبح لدى العلماء فكرة شاملة عن دورة حياة هذه الحيتان وأنماط هجرتها وأماكن وجودها للمساعدة في الحد من ظاهرة الانقراض التي تهددها.

- الخصوصية والأمان
بما أن الذكاء الصناعي يعتمد أساساً على إدخال وتحليل البيانات التي تستقطبها «غوغل» من المستخدمين فإن التقدم في تعلم الآلة يجعل من حماية الخصوصية أحد أصعب التحديات التي تواجهها الشركة. ولذلك طورت الشركة نوعاً جديداً من طرق تعلم الآلة يسمىFederated Learning يسمح للمطورين بتدريب نماذج للذكاء الصناعي لصنع منتجات أكثر ذكاءً لا تعتمد على الحوسبة السحابية بل تقوم بتحليل البيانات ومعالجتها داخل جهازك دون الحاجة لرفعها إلى خوادم «غوغل». وهذا يعني أن الشركة يمكنها القيام بالمزيد بأقل نسبة من البيانات الشخصية.
لوحة المفاتيح GBroad الموجودة على ملايين من هواتف الأندرويد حول العالم كانت أولى هذه التطبيقات التي طبقت نظام Federated Learning لتحسين الكتابة التنبؤية وعرض اقتراحات للكلمات التالية في الجمل المراد كتابتها من قبل المستخدم. في السابق كانت GBoard تقترح عليك فقط الكلمات التي تستعملها أنت باستمرار أما الآن فستقترح عليك كلمات جديدة دون أن تعرف «غوغل» نفسها ما تكتبه أنت من كلمات. وأيضاً، يعتمد تطبيق الكاميرا الموجود بهواتف بكسل 4 الجديدة على هذه التقنية الجديدة فيمكن للجهاز ترجمة النصوص عن طريقة معالجتها داخل الهاتف نفسه مما يعني أنك ستحصل على الإجابات بسرعة أكبر، وأكثر أماناً.

- مترجم «غوغل»
بفضل الذكاء الصناعي يستطيع برنامج Google Translate الترجمة من وإلى أكثر من 100 لغة ولكن من الإضافات المميزة كان وضع المحادثة Conversation Mode والذي استخدمناه لطلب قهوة من شخص لا يفهم إلا اللغة البرتغالية. كل ما عليك فعله هو الضغط على الزر المخصص في التطبيق ثم التحدث بلغتك ليقوم التطبيق بترجمة ما قلته كلامياً - ولحظياً - للشخص الآخر.
في عام 2016. توقف فريق عمل تطبيق الترجمة عن استخدام نظام الترجمة الحرفية واستبدلها بالترجمة الآلية العصبية Neural Machine Translation. ومع NMT هذه، لا يقوم فريق عمل «غوغل» بتعليم النظام أي شيء عن اللغة المراد ترجمتها، بل يترك الأمر للنظام نفسه لتوليد الكلمات وترجمتها. ووظيفة فريق العمل بأن يعلمه أن هذه الجملة باللغة «ألف» يرادفها هذه الجملة من اللغة «باء» ليطور النظام نموذجه الخاص به لإعادة تنسيق وترجمة تلك الجمل بشكل مستقل.
كما نعلم فإن تطبيق الترجمة لا يدعم حالياً إلا اللغة العربية الفصحى، لذا، قمنا بسؤال المهندس ماك دف هيوغس رئيس قسم ترجمة «غوغل» عن احتمالية توفر اللهجات الدارجة في المنطقة العربية فقال إنه على دراية بهذه النقطة، وإن فريقه يسعى لإضافتها غير أن التحدي الأكبر الذي يواجهه فريقه أن هذه اللهجات غير مكتوبة وتستعمل فقط للمحادثة. وكلفتة جميلة منه، قام باستخدام وضع المحادثة في تطبيق ترجمة «غوغل» للرد علي وكانت الترجمة دقيقة بنسبة 100 في المائة.

- غوغل بكسل 4
استغلت الشركة المؤتمر لإعطاء تفاصيل أكثر عن أحدث هواتفها «غوغل بكسل 4» وعن تقنيات الذكاء الصناعي الموجودة فيه. عبر السنين، كان أهم ما يميز هواتف بكسل هو تقنيات التصوير المتقدمة التي تفوقت على كثير من المنافسين رغم أن هواتفها كانت تعتمد على عدسة واحدة فقط، فيما وصل المنافسون إلى أربع عدسات وأكثر.
ويرجع السبب في ذلك إلى أن الشركة تعول أكثر على التصوير الفوتوغرافي الحسابي computational photography أكثر من أي وقت مضى لتحسين الصور الملتقطة بالجهاز، لذلك دائماً ما تلاحظ أن الصور الملتقطة بأجهزة بكسل تستغرق بضع ثوانٍ لعرضها بعد التقطاها.
قامت «غوغل» أيضاً بإضافة عدسة ثانية في بكسل 4 لأول مرة في تاريخ أجهزة البكسل لتوفر «تقريباً رقمياً» يصل إلى 8 مرات دون التأثير على جودة ودقة الصورة. كما يوجد أيضاً وضع جديد في تطبيق الكاميرا تحت اسم Photo Booth وهو نمط يقوم عند تفعيله باختيار الوقت الأنسب لالتقاط الصورة بحيث لا تحتاج لأن تضغط على أي زر، ولك أن تتخيل أهمية هذه الميزة عند التقاط صور للأطفال أو الحيوانات الكثيرة الحركة. كما يأتي الهاتف بتطبيق لتسجيل المكالمات بإمكانه تفريغ الكلام المسجل لحظياً إلى نص ليسهل من عملية تفريغ المحاضرات للطلبة أو تفريغ المقابلات بالنسبة للصحافيين.
وعندما سألنا السيد براندون بأربيلو عن سبب عدم تمتع هواتف بكسل بأقوى المواصفات أسوة بالمنافسين رد بالقول إن «غوغل» لا تركز كثيراً على توفير العتاد الأقوى وإنما تعطي أولوية لتجربة المستخدم ككل من ناحية سلاسة وخفة النظام، الحفاظ على عمر البطارية وتوفير قدرات التصوير المتقدمة اعتماداً على تقنيات الذكاء الصناعي. سألناه أيضاً عن سبب إهمال الشركة لسوق الشرق الأوسط وقال إنه سيتواصل مع قسم المبيعات ليعلمه بأهمية السوق ودراسة إمكانية توفير الأجهزة لمحبي شركة «غوغل» في الوطن العربي.


مقالات ذات صلة

رئيس «أبل» للمطورين الشباب في المنطقة: احتضنوا العملية... وابحثوا عن المتعة في الرحلة

تكنولوجيا تيم كوك في صورة جماعية مع طالبات أكاديمية «أبل» في العاصمة السعودية الرياض (الشرق الأوسط)

رئيس «أبل» للمطورين الشباب في المنطقة: احتضنوا العملية... وابحثوا عن المتعة في الرحلة

نصح تيم كوك، الرئيس التنفيذي لشركة «أبل»، مطوري التطبيقات في المنطقة باحتضان العملية بدلاً من التركيز على النتائج.

مساعد الزياني (دبي)
تكنولوجيا خوارزمية «تيك توك» تُحدث ثورة في تجربة المستخدم مقدمة محتوى مخصصاً بدقة عالية بفضل الذكاء الاصطناعي (أ.ف.ب)

خوارزمية «تيك توك» سر نجاح التطبيق وتحدياته المستقبلية

بينما تواجه «تيك توك» (TikTok) معركة قانونية مع الحكومة الأميركية، يظل العنصر الأبرز الذي ساهم في نجاح التطبيق عالمياً هو خوارزميته العبقرية. هذه الخوارزمية…

عبد العزيز الرشيد (الرياض)
خاص تم تحسين هذه النماذج لمحاكاة سيناريوهات المناخ مثل توقع مسارات الأعاصير مما يسهم في تعزيز الاستعداد للكوارث (شاترستوك)

خاص «آي بي إم» و«ناسا» تسخّران نماذج الذكاء الاصطناعي لمواجهة التحديات المناخية

«الشرق الأوسط» تزور مختبرات أبحاث «IBM» في زيوريخ وتطلع على أحدث نماذج الذكاء الاصطناعي لفهم ديناميكيات المناخ والتنبؤ به.

نسيم رمضان (زيوريخ)
خاص يمثل تحول الترميز الطبي في السعودية خطوة حاسمة نحو تحسين كفاءة النظام الصحي ودقته (شاترستوك)

خاص ما دور «الترميز الطبي» في تحقيق «رؤية 2030» لنظام صحي مستدام؟

من معالجة اللغة الطبيعية إلى التطبيب عن بُعد، يشكل «الترميز الطبي» عامل تغيير مهماً نحو قطاع طبي متطور ومستدام في السعودية.

نسيم رمضان (لندن)
خاص من خلال الاستثمارات الاستراتيجية والشراكات وتطوير البنية التحتية ترسم السعودية مساراً نحو أن تصبح قائداً عالمياً في التكنولوجيا (شاترستوك)

خاص كيف يحقق «الاستقلال في الذكاء الاصطناعي» رؤية السعودية للمستقبل؟

يُعد «استقلال الذكاء الاصطناعي» ركيزة أساسية في استراتيجية المملكة مستفيدة من قوتها الاقتصادية والمبادرات المستقبلية لتوطين إنتاج رقائق الذكاء الاصطناعي.

نسيم رمضان (لندن)

«جيميناي 2.0»... «غوغل» بدأت إتاحة نموذجها الأحدث للذكاء الاصطناعي التوليدي

شعار «جيميناي» يظهر على شاشة هاتف جوال (رويترز)
شعار «جيميناي» يظهر على شاشة هاتف جوال (رويترز)
TT

«جيميناي 2.0»... «غوغل» بدأت إتاحة نموذجها الأحدث للذكاء الاصطناعي التوليدي

شعار «جيميناي» يظهر على شاشة هاتف جوال (رويترز)
شعار «جيميناي» يظهر على شاشة هاتف جوال (رويترز)

أعلنت شركة «غوغل» اليوم (الأربعاء) بدء العمل بنموذجها الأكثر تطوراً إلى اليوم في مجال الذكاء الاصطناعي التوليدي «جيميناي 2.0» Gemini 2.0 الذي تسعى من خلاله إلى منافسة شركات التكنولوجيا العملاقة الأخرى في قطاع يشهد نمواً سريعاً، وفقاً لـ«وكالة الصحافة الفرنسية».

وتوقّع رئيس مجموعة «ألفابت» التي تضم «غوغل» سوندار بيشاي أن تفتح هذه النسخة الحديثة من البرنامج «عصراً جديداً» في مجال الذكاء الاصطناعي التوليدي القادر على أن يسهّل مباشرة الحياة اليومية للمستخدمين.

وأوضحت «غوغل» أن الصيغة الجديدة من «جيميناي» غير متاحة راهناً إلا لقلّة، أبرزهم المطوّرون، على أن تُوفَّر على نطاق أوسع في مطلع سنة 2025. وتعتزم الشركة دمج الأداة بعد ذلك في مختلف منتجاتها، وفي مقدّمها محركها الشهير للبحث، وبأكثر من لغة.

وشرح سوندار بيشاي ضمن مقال مدَوَّنة أعلن فيه عن «جيميناي 2.0» أن هذه الأداة توفّر «القدرة على جعل المعلومات أكثر فائدة، مشيراً إلى أن في وِسعها فهم سياق ما وتوقّع ما سيلي استباقياً واتخاذ القرارات المناسبة للمستخدم».

وتتنافس «غوغل» و«أوبن إيه آي» (التي ابتكرت تشات جي بي تي) و«ميتا» و«أمازون» على التوصل بسرعة فائقة إلى نماذج جديدة للذكاء الاصطناعي التوليدي، رغم ضخامة ما تتطلبه من أكلاف، والتساؤلات في شأن منفعتها الفعلية للمجتمع في الوقت الراهن.

وبات ما تسعى إليه «غوغل» التوجه الجديد السائد في سيليكون فالي، ويتمثل في جعل برنامج الذكاء الاصطناعي بمثابة «خادم رقمي» للمستخدم وسكرتير مطّلع على كل ما يعنيه، ويمكن استخدامه في أي وقت، ويستطيع تنفيذ مهام عدة نيابة عن المستخدم.

ويؤكد المروجون لهذه الأدوات أن استخدامها يشكّل مرحلة كبرى جديدة في إتاحة الذكاء الاصطناعي للعامّة، بعدما حقق «تشات جي بي تي» تحوّلاً جذرياً في هذا المجال عام 2022.

وأشارت «غوغل» إلى أن ملايين المطوّرين يستخدمون أصلاً النسخ السابقة من «جيميناي».

وتُستخدَم في تدريب نموذج «جيميناي 2.0» وتشغيله شريحة تنتجها «غوغل» داخلياً، سُمّيت بـ«تريليوم». وتقوم نماذج الذكاء الاصطناعي التوليدي بشكل أساسي على معدات تصنعها شركة «نفيديا» الأميركية العملاقة المتخصصة في رقائق وحدات معالجة الرسومات (GPUs).