نظم مطورة لمعالجة الصور والنصوص وتوفير الترجمة الفورية

تغطي فعاليات «مؤتمر غوغل للذكاء الصناعي»

نظم مطورة لمعالجة الصور والنصوص وتوفير الترجمة الفورية
TT

نظم مطورة لمعالجة الصور والنصوص وتوفير الترجمة الفورية

نظم مطورة لمعالجة الصور والنصوص وتوفير الترجمة الفورية

في مؤتمر تقني نظمته في مقرها الأحدث بمدينة زيوريخ السويسرية الأربعاء الماضي، عرضت «غوغل» آخر ما توصلت له في مجال الذكاء الصناعي وتعلم الآلة «MachineLearning» وهي التقنيات التي من شأنها أن تسهل علينا حياتنا اليومية بكل ظروفها. وحضرت «الشرق الأوسط» المؤتمر وقامت بمقابلة بعض المسؤولين للحديث عن هذه التقنيات وإمكانية توافرها في العالم العربي.

- تحويلات الصوت والنص
ترى «غوغل» أن مهمتها الرئيسية تتمثل في تنظيم معلومات العالم وجعلها في متناول الجميع بشكل مفيد. وبالفعل خلال العقد الماضي قدمت الشركة العديد من الخدمات والحلول في مختلف مجالات الحياة ولعل من أهمها تقنيات التعرف على الكلام Speech Recognition. ومع الذكاء الصناعي وصلت «غوغل» الآن لمستوى متقدم جداً، لدرجة أنها تستطيع التعرف على الكلام من أشخاص يعانون من صعوبات في التحدث كالتلعثم والتأتأة.
وللتأكيد على ذلك، قام عالم الأبحاث الروسي ديمتري كانفيسكي المتخصص في اللغات والكلام، الذي يعاني نفسه من صعوبة في الكلام، بتقديم عرض أمام الحضور. ورغم أننا لم نستطع فهم كل ما يقول فقد اعتمدنا على «غوغل» لتفريغ كلامه إلى نص، عُرض على شاشة كبيرة أثناء حديثه. كما عرف السيد ديمتري الحضور أيضاً على تطبيق جديد أسمته «غوغل» لوك أوت Lookout الذي يقوم بوصف أي شيء توجه له الكاميرا. فلو وجهت كاميرا الهاتف إلى طاولة مكتب سيعرّفك التطبيق صوتياً على كل ما هو موجود فوقها، مما يجعله تطبيقاً أساسياً لمن يعانون من صعوبات بصرية والمصابين بالعمى، بحيث يوفر لهم استقلالية لم تكن ممكنة من قبل.
وبخصوص الصعوبات البصرية توجد ميزة جديدة في متصفح «غوغل كروم» تعرض لك وصفاً لأي صورة موجودة على الإنترنت من خلال التعرف على المواد والأشياء الموجودة بها. وتم الحديث أيضاً عن خدمة Live Caption أو تفريغ النص اللحظي والتي تقوم بتفريغ أو عرض نص مكتوب لأي فيديو موجود على جهازك أو على الإنترنت. فلو كانت لغتك الإنجليزية ضعيفة مثلاً يمكنك تفعيل الخدمة الموجودة فقط حالياً في هاتف «غوغل بكسل 4» وسيقوم بعرض ترجمة نصية Subtitles لأي فيديو أو مقطع صوتي تشغله على الجهاز. وللقارئ أن يتخيل أهمية هذه الخدمة لمن يعانون من صعوبات في السمع أيضاً.

- ذكاء صناعي وحس اجتماعي
خصصت «غوغل» قسماً في مؤتمرها للحديث عن أهمية الذكاء الصناعي في مختلف جوانب الحياة كالمساعدة في التنبؤ بحدوث الفيضانات عن طريق تحليل بيانات ضخمة لصور ملتقطة من كاميرات الأقمار الصناعية - كتلك المستخدمة في خدمة «غوغل إيرث» - والتعرف على الأنماط المختلفة لحركة المياه ومعدل ارتفاعها في الوديان. كما قامت أيضاً، بمساعدة منظمات تهتم بحياة الحيوانات التي بدأت أعدادها تقل بشكل غير مسبوق وأصبحت معرضة بشكل كبير للانقراض. فعندما عجز العلماء عن معرفة السبب قاموا بالتعاون مع شركة «غوغل» لنصب عدد كبير من كاميرات المراقبة داخل الأدغال يتم تفعيلها بشكل أوتوماتيكي عن طريق مجس استشعار للحركة Motion Detection ليحصلوا بالنتيجة على كم هائل من المعلومات عن تحركات هذه الحيوانات ساعدتهم بشكل كبير في بحوثهم العلمية.
تعاونت «غوغل» أيضاً مع علماء يدرسون أنماط هجرة الحوت الأحدب، أحد أنواع الحيتان المهددة بالانقراض. تقوم كل مجموعة من هذه الحيتان بإصدار ما يشبه النغمة أو الأغنية الواحدة يتم تكرراها العديد من المرات كل ساعة أثناء هجرتها من مكان لآخر بمسافات تتعدى 25 ألف كيلومتر. ولكن الميكروفونات التي يستعملها العلماء للتنصت عليها تلتقط أيضاً أصوات الحيتان الأخرى بالإضافة إلى أصوات السفن مما يجعل من عملية تحديد مكانهم أمراً أشبه بالمستحيل. ولكن الوضع اختلف تماماً عندما تم إدخال تقنيات الذكاء الصناعي في عملية تحليل بيانات الأصوات التي تم التقاطها خلال الـ19 سنة الماضية من 12 موقعاً جغرافياً مختلفاً. الآن، وبفضل الذكاء الصناعي أصبح لدى العلماء فكرة شاملة عن دورة حياة هذه الحيتان وأنماط هجرتها وأماكن وجودها للمساعدة في الحد من ظاهرة الانقراض التي تهددها.

- الخصوصية والأمان
بما أن الذكاء الصناعي يعتمد أساساً على إدخال وتحليل البيانات التي تستقطبها «غوغل» من المستخدمين فإن التقدم في تعلم الآلة يجعل من حماية الخصوصية أحد أصعب التحديات التي تواجهها الشركة. ولذلك طورت الشركة نوعاً جديداً من طرق تعلم الآلة يسمىFederated Learning يسمح للمطورين بتدريب نماذج للذكاء الصناعي لصنع منتجات أكثر ذكاءً لا تعتمد على الحوسبة السحابية بل تقوم بتحليل البيانات ومعالجتها داخل جهازك دون الحاجة لرفعها إلى خوادم «غوغل». وهذا يعني أن الشركة يمكنها القيام بالمزيد بأقل نسبة من البيانات الشخصية.
لوحة المفاتيح GBroad الموجودة على ملايين من هواتف الأندرويد حول العالم كانت أولى هذه التطبيقات التي طبقت نظام Federated Learning لتحسين الكتابة التنبؤية وعرض اقتراحات للكلمات التالية في الجمل المراد كتابتها من قبل المستخدم. في السابق كانت GBoard تقترح عليك فقط الكلمات التي تستعملها أنت باستمرار أما الآن فستقترح عليك كلمات جديدة دون أن تعرف «غوغل» نفسها ما تكتبه أنت من كلمات. وأيضاً، يعتمد تطبيق الكاميرا الموجود بهواتف بكسل 4 الجديدة على هذه التقنية الجديدة فيمكن للجهاز ترجمة النصوص عن طريقة معالجتها داخل الهاتف نفسه مما يعني أنك ستحصل على الإجابات بسرعة أكبر، وأكثر أماناً.

- مترجم «غوغل»
بفضل الذكاء الصناعي يستطيع برنامج Google Translate الترجمة من وإلى أكثر من 100 لغة ولكن من الإضافات المميزة كان وضع المحادثة Conversation Mode والذي استخدمناه لطلب قهوة من شخص لا يفهم إلا اللغة البرتغالية. كل ما عليك فعله هو الضغط على الزر المخصص في التطبيق ثم التحدث بلغتك ليقوم التطبيق بترجمة ما قلته كلامياً - ولحظياً - للشخص الآخر.
في عام 2016. توقف فريق عمل تطبيق الترجمة عن استخدام نظام الترجمة الحرفية واستبدلها بالترجمة الآلية العصبية Neural Machine Translation. ومع NMT هذه، لا يقوم فريق عمل «غوغل» بتعليم النظام أي شيء عن اللغة المراد ترجمتها، بل يترك الأمر للنظام نفسه لتوليد الكلمات وترجمتها. ووظيفة فريق العمل بأن يعلمه أن هذه الجملة باللغة «ألف» يرادفها هذه الجملة من اللغة «باء» ليطور النظام نموذجه الخاص به لإعادة تنسيق وترجمة تلك الجمل بشكل مستقل.
كما نعلم فإن تطبيق الترجمة لا يدعم حالياً إلا اللغة العربية الفصحى، لذا، قمنا بسؤال المهندس ماك دف هيوغس رئيس قسم ترجمة «غوغل» عن احتمالية توفر اللهجات الدارجة في المنطقة العربية فقال إنه على دراية بهذه النقطة، وإن فريقه يسعى لإضافتها غير أن التحدي الأكبر الذي يواجهه فريقه أن هذه اللهجات غير مكتوبة وتستعمل فقط للمحادثة. وكلفتة جميلة منه، قام باستخدام وضع المحادثة في تطبيق ترجمة «غوغل» للرد علي وكانت الترجمة دقيقة بنسبة 100 في المائة.

- غوغل بكسل 4
استغلت الشركة المؤتمر لإعطاء تفاصيل أكثر عن أحدث هواتفها «غوغل بكسل 4» وعن تقنيات الذكاء الصناعي الموجودة فيه. عبر السنين، كان أهم ما يميز هواتف بكسل هو تقنيات التصوير المتقدمة التي تفوقت على كثير من المنافسين رغم أن هواتفها كانت تعتمد على عدسة واحدة فقط، فيما وصل المنافسون إلى أربع عدسات وأكثر.
ويرجع السبب في ذلك إلى أن الشركة تعول أكثر على التصوير الفوتوغرافي الحسابي computational photography أكثر من أي وقت مضى لتحسين الصور الملتقطة بالجهاز، لذلك دائماً ما تلاحظ أن الصور الملتقطة بأجهزة بكسل تستغرق بضع ثوانٍ لعرضها بعد التقطاها.
قامت «غوغل» أيضاً بإضافة عدسة ثانية في بكسل 4 لأول مرة في تاريخ أجهزة البكسل لتوفر «تقريباً رقمياً» يصل إلى 8 مرات دون التأثير على جودة ودقة الصورة. كما يوجد أيضاً وضع جديد في تطبيق الكاميرا تحت اسم Photo Booth وهو نمط يقوم عند تفعيله باختيار الوقت الأنسب لالتقاط الصورة بحيث لا تحتاج لأن تضغط على أي زر، ولك أن تتخيل أهمية هذه الميزة عند التقاط صور للأطفال أو الحيوانات الكثيرة الحركة. كما يأتي الهاتف بتطبيق لتسجيل المكالمات بإمكانه تفريغ الكلام المسجل لحظياً إلى نص ليسهل من عملية تفريغ المحاضرات للطلبة أو تفريغ المقابلات بالنسبة للصحافيين.
وعندما سألنا السيد براندون بأربيلو عن سبب عدم تمتع هواتف بكسل بأقوى المواصفات أسوة بالمنافسين رد بالقول إن «غوغل» لا تركز كثيراً على توفير العتاد الأقوى وإنما تعطي أولوية لتجربة المستخدم ككل من ناحية سلاسة وخفة النظام، الحفاظ على عمر البطارية وتوفير قدرات التصوير المتقدمة اعتماداً على تقنيات الذكاء الصناعي. سألناه أيضاً عن سبب إهمال الشركة لسوق الشرق الأوسط وقال إنه سيتواصل مع قسم المبيعات ليعلمه بأهمية السوق ودراسة إمكانية توفير الأجهزة لمحبي شركة «غوغل» في الوطن العربي.


مقالات ذات صلة

تعرف على التقنيات التي تطرحها «كاديلاك» في «إسكاليد 2025»

خاص توفر «كاديلاك إسكاليد IQ Sport 2025» قوة تبلغ 750 حصاناً و785 رطلاً من عزم الدوران ما يوفر تسارعاً مثيراً وقدرات سحب هائلة (كاديلاك)

تعرف على التقنيات التي تطرحها «كاديلاك» في «إسكاليد 2025»

«الشرق الأوسط» تـتحدث إلى سارة سميث مديرة هندسة البرامج في «كاديلاك».

نسيم رمضان (لندن)
تكنولوجيا تعد تطبيقات اللياقة البدنية أداة قوية لتتبع التقدم مع ضمان بقاء بياناتك آمنة (أدوبي)

كيف تحمي خصوصيتك أثناء استخدام تطبيقات اللياقة البدنية في 2025؟

إليك بعض النصائح لاستخدام تطبيقات اللياقة البدنية بأمان في العصر الرقمي.

نسيم رمضان (لندن)
الاقتصاد مقر هيئة الاتصالات والفضاء والتقنية في الرياض (الموقع الإلكتروني)

بدء تطبيق المرحلة الإلزامية الأولى لتوحيد منافذ الشحن في السعودية

بدأ تطبيق المرحلة الإلزامية الأولى لتوحيد منافذ الشحن للهواتف المتنقلة والأجهزة الإلكترونية في السوق، لتكون من نوع «USB Type - C».

«الشرق الأوسط» (الرياض)
الاقتصاد جانب من اجتماع خلال منتدى حوكمة الإنترنت الذي عقد مؤخراً بالعاصمة الرياض (الشرق الأوسط)

تقرير دولي: منظومات ذكية ومجتمعات ممكّنة تشكل مستقبل الاقتصاد الرقمي

كشف تقرير دولي عن عدد من التحديات التي قد تواجه الاقتصاد الرقمي في العام المقبل 2025، والتي تتضمن الابتكار الأخلاقي، والوصول العادل إلى التكنولوجيا، والفجوة…

«الشرق الأوسط» (الرياض)
تكنولوجيا تتميز سمكة «موبولا راي» بهيكلها العظمي الغضروفي وأجنحتها الضخمة ما يسمح لها بالانزلاق بسهولة في الماء (أدوبي)

سمكة تلهم باحثين لتطوير نموذج مرشّح مياه صناعي!

طريقة تغذية سمكة «موبولا راي» تدفع باحثي معهد ماساتشوستس للتكنولوجيا لتطوير أنظمة ترشيح فعالة.

نسيم رمضان (لندن)

تعرّف على تقنيات الذكاء الاصطناعي المقبلة في عام 2025

ثورة تقنيات الذكاء الاصطناعي الجديدة... تأثيرات عميقة مقبلة على حياتنا اليومية
ثورة تقنيات الذكاء الاصطناعي الجديدة... تأثيرات عميقة مقبلة على حياتنا اليومية
TT

تعرّف على تقنيات الذكاء الاصطناعي المقبلة في عام 2025

ثورة تقنيات الذكاء الاصطناعي الجديدة... تأثيرات عميقة مقبلة على حياتنا اليومية
ثورة تقنيات الذكاء الاصطناعي الجديدة... تأثيرات عميقة مقبلة على حياتنا اليومية

يستمر تطور تقنيات الذكاء الاصطناعي، خصوصاً مع تطور قدرات الحوسبة والتخزين وسرعة نقل البيانات وتطوير خوارزميات جديدة مفيدة للمستخدمين في شتى جوانب الحياة.

سيزداد تبني تقنيات الذكاء الاصطناعي مباشرة على الأجهزة المختلفة دون الحاجة إلى الاتصال بالإنترنت

وسنسلط الضوء في هذا المقال على أبرز تقنيات الذكاء الاصطناعي الجديدة التي سنشهدها خلال عام 2025، مثل تطور تقنيات الرؤية الذكية وظهور الأنظمة المركبة للذكاء الاصطناعي، وانتشار الذكاء الاصطناعي الطرفي، وتطور مساعدات الذكاء الاصطناعي. كما سنتعرّف على أحدث المزايا المقبلة لـ«ذكاء أبل» وكيف ستُسهم في تعزيز تجربة المستخدم. دعونا نستكشف هذا العالم المثير من الذكاء الاصطناعي، ونكتشف كيف سيغيّر هذا التطور من شكل حياتنا في المستقبل.

تستطيع تقنيات الذكاء الاصطناعي الجديدة التعرّف على العناصر الموجودة في الصور والفيديوهات بدقة فائقة

اقتراب «ذكاء» المستقبل

التقنية الأولى التي يُتوقع أن تتقدم بشكل كبير هي التعرف على العناصر الموجودة في الصور والفيديوهات بدقة فائقة وتصنيفها بشكل صحيح والتعرف على النصوص فيها «AI Vision»، وذلك بسبب زيادة إنتاج المستخدمين للصور والفيديوهات وتحليل الذكاء الاصطناعي لها من خلال منصات مشاركة هذه الملفات وفهمه للمشاهد المعقدة فيها. ومن المتوقع أن تساعد هذه التقنية في إنتاج صور وفيديوهات توليدية بشكل أكثر إبهاراً، بالإضافة إلى دعم الشركات لها من خلال كاميرات الهواتف الجوالة (مثل «عدسة غوغل» Google Lens للتعرف على العناصر المحيطة بالمستخدم) ومراقبة الأصناف الموجودة في المتاجر والسيارات ذاتية القيادة، وغيرها. ولكن هذا الأمر قد يشكّل خطراً على خصوصية المستخدمين واحتمال مراقبتهم دون علمهم ما لم يتم اتخاذ التدابير اللازمة لمنع ذلك.

ومن المتوقع أن يتم استخدام نظم ذكاء اصطناعي مركبة «Composite AI» من أكثر من مصدر تستطيع إتمام مهام أكثر تعقيداً مما يستطيع نظام واحد القيام به. وتستطيع هذه التقنيات إيجاد روابط عميقة بين البيانات المعقدة بسهولة وتقديم فيديوهات تحتوي على الأشخاص أنفسهم عبر الكثير من المشاهد وتعديل الإضاءة حسب البيئة وتغيير لغة المحادثات على الفور، وغيرها. وليس من البعيد تطوير خدمات تقدم مجموعات كبيرة من تقنيات الذكاء الاصطناعي ليختار المستخدم ما يحتاج إليه منها لتلبية طلبه وتحقيق هدفه، وكأنها «متجر» للذكاء الاصطناعي يقدم للمستخدم الخدمة حسب الحاجة والرغبة.

وبسبب انتشار المعالجات التي تدعم تقنيات الذكاء الاصطناعي في الكمبيوترات والهواتف الجوالة والكثير من الأجهزة الأخرى، فمن المتوقع أن نشهد إطلاق مزيد من التقنيات التي تدعم الذكاء الاصطناعي مباشرة من على الجهاز عوضاً عن الحاجة إلى الاتصال بالإنترنت للقيام بذلك عبر «Edge AI».

مثال على ذلك: استخدام معالجات متقدمة في كاميرات المراقبة للتعرف على الكثير من الحالات غير الطبيعية، مثل الحوادث أو السرقات، أو في الأجهزة الطبية لتسريع عملية التشخيص أو التحليل، وغيرها. هذا الأمر من شأنه زيادة مستويات الخصوصية بسبب عدم مشاركة البيانات الحساسة مع الأجهزة الخادمة عبر الإنترنت، والعمل بكفاءة عالية دون وجود أي اتصال بالإنترنت.

كما سينتشر «عملاء الذكاء الاصطناعي» AI Agents بشكل متسارع، حيث سنشهد ظهور «برامج» تفهم طلب المستخدم وتقوم بتقسيمه إلى وظائف صغيرة، وتعمل على إتمامها بشكل آلي يحاكي التصرف البشري، وقد تساعد الأطباء في إجراء سلاسل فحوصات على المرضى وتعديل الفحص التالي وفقاً لنتائج الفحص السابق، وهكذا. وقد نشهد دخول هذه التقنية إلى مجال التعليم أيضاً.

تحديثات عديدة مقبلة لـ«ذكاء أبل» على الهواتف الجوالة والكومبيوترات الشخصية

مزايا «ذكاء أبل» المقبلة

أطلقت «أبل» مزايا «ذكاء أبل» Apple Intelligence للذكاء الاصطناعي، وقدمت مجموعة من التحديثات عبر نظامي التشغيل «آي أو إس» و«ماك أو إس»، ولكن لا تزال هناك مزايا ستطلقها خلال العام الجاري، نذكر مجموعة منها:

* الميزة الأولى هي «فيلم الذكريات» Memory Movie على الكومبيوترات التي تعمل بنظام «ماك أو إس»، والتي تقوم بصنع فيلم قصير مكون من الصور وعروض الفيديو الموجودة في تطبيق الصور وفقاً لوصف المستخدم، مثل قيام الميزة بإيجاد فيديو يحتوي على أهم لحظات الإجازة في البحر مع العائلة، أو فيديو للمنزل الجديد الذي انتقل المستخدم إليه، مع القدرة على اختيار مدة الفيلم والموسيقى ومشاركته مع الأهل والأصدقاء عبر الشبكات الاجتماعية. وعلى الرغم من أن هذه الميزة موجودة على هواتف «آيفون» المحدثة، فإنها ستصبح متوافرة على كمبيوترات «ماك» قريباً.

* وبالحديث عن نظام التشغيل «ماك أو إس»، فمن المتوقع أن يحصل الإصدار 15.3 (سيتم إطلاقه في أواخر يناير «كانون الثاني») على ميزة «الرموز التعبيرية التوليدية» Genmoji التي تسمح بصنع «رموز تعبيرية» Emoji مخصصة وفقاً لرغبة المستخدم، بواسطة الذكاء الاصطناعي وكتابة الوصف النصي المرغوب للحصول على رمز تعبيري يمكن مشاركته مع الآخرين بكل سهولة. ويمكن استخدام هذه الأداة لإيجاد شخصيات تشابه الأصدقاء باستخدام صورهم وكتابة وصف للرمز التعبيري الجديد المطلوب.

* وسيحصل مساعد «سيري» على تحسينات مزايا ذكاء اصطناعي ممتدة، تشمل إمكانية البحث عن الملفات وفهم ما يظهر على شاشة المستخدم والتكامل مع الكثير من التطبيقات الأخرى. وسيتمكن «سيري» من تتبع مكان كل شيء على جهاز المستخدم، مثل: الرسائل النصية، والبريد الإلكتروني، والملفات، والصور؛ للمساعدة في العثور على أي شيء يتم البحث عنه. كما سيتمكن المساعد من فهم ما يظهر على الشاشة وتنفيذ الأوامر بناء على ذلك، مثل معاينة ملف ما وقول «سيري، أرسل هذه الملف إلى مديري في العمل عبر رسالة بريد إلكتروني»، لتتم العملية بكل سلاسة. كما سيتمكن «سيري» من تنفيذ المهام المعقدة التي تتطلب استخدام أكثر من تطبيق لتنفيذها، مثل تحرير صورة ومشاركتها مع صديق محدد، من خلال أمر واحد.

اصنع فيديوهات مبهرة من صورك وفيديوهاتك آليا باستخدام "فيلم الذكريات" على الهواتف الجوالة والكومبيوترات الشخصية cut out

تجدر الإشارة إلى أن ميزة «ذكاء أبل» تدعم حالياً اللغة الإنجليزية فقط، ولكن من المتوقع أن تدعم الشركة اللغات التالية خلال عام 2025: الصينية والفرنسية والألمانية والإيطالية واليابانية والكورية والبرتغالية والإسبانية والفيتنامية.