تعمل شركة «ميتا» على تطوير نظام الترجمة عالية الدقة بين اللغات باستخدام تقنيات الذكاء الصناعي. وكشفت الشركة عن عزمها على رفع عدد اللغات التي يدعمها هذا النظام من 100 إلى 200 لغة، وذلك بهدف مساعدة الأشخاص على التواصل بشكل أفضل في الوقت الحالي وتمكينهم من أن يصبحوا جزءاً من عالم «ميتافيرس» في المستقبل.
وتحدثت «الشرق الأوسط» حصرياً مع أنطوان بورد، مدير عام أبحاث «فيسبوك» للذكاء الصناعي (Facebook AI Research FAIR) لدى «ميتا»، في آفاق تقنيات الذكاء الصناعي في الترجمة الآلية الدقيقة بين هذه اللغات، ومستقبل تفاعل المستخدمين معاً في الإنترنت والعالمين الحقيقي و«ميتافيرس».
وقال أنطوان إن «اللغة تعبر عن ثقافتنا وهويتنا، وتمثل شرياناً يمد العالم بالحياة. ولكن نظراً إلى عدم وجود أدوات ترجمة عالية الجودة لمئات اللغات، فلا يمكن لمليارات الأشخاص اليوم الوصول إلى المحتوى الرقمي أو المشاركة بالكامل في المحادثات والمجتمعات على الإنترنت بلغاتهم المفضلة أو الأصلية. وينطبق ذلك خصوصاً على مئات الملايين من الأشخاص الذين يتحدثون العديد من لغات قارتي أفريقيا وآسيا».
وترى الشركة أن عدداً قليلاً من اللغات يهيمن على محتوى الإنترنت، وهو الإنجليزية والعربية والإسبانية والماندارين؛ «الأمر الذي يعني أن كثيراً من اللغات الأخرى غير موجودة، وبالتالي لن يستطيع متحدثو تلك اللغات قليلة الاستخدام الحفاظ على لغاتهم، وما ينجم عن ذلك من أخطاء في التعبير عن الاحتياجات أو المشاعر (جراء عدم استخدام التعابير غير اللفظية في الترجمة، مثل لغة الجسد، أو حتى نبرة الصوت جراء تغير مشاعر المتحدث) جراء استخدام لغات أخرى وسيطة وترجمة المحتوى إليها يدوياً أو باستخدام أدوات بسيطة».
ومن اللغات التي لا تُستخدم كثيراً والتي يدعمها برنامج «لن نترك لغة (No Language Left Behind NLLB)» الذي يستخدم تقنيات الذكاء الصناعي الجديدة، 55 لغة أفريقية بنتائج عالية الجودة، مثل الكامبا واللاوية. ويستطيع هذا النموذج الواحد توفير ترجمات عالية الجودة للغات يتحدث بها مليارات الأشخاص حول العالم؛ بما فيها اللغات الأفريقية والهندية.
وستدعم التطورات البحثية لهذا البرنامج أكثر من 25 مليار ترجمة تعرض يومياً على آخر أخبار «فيسبوك» و«إنستغرام» والمنصات الأخرى. ويمكن من خلال هذه التقنية زيارة مجموعة ما على «فيسبوك»، مثلاً، وقراءة منشور مكتوب بلغتي الإيجبو أو لوغندا، بكل سهولة وبلغتك الأم بنقرة زر واحدة. كما يمكن أن تساعد الترجمات عالية الدقة لمزيد من اللغات في اكتشاف المحتوى الضار، والمعلومات المضللة، وحماية نزاهة الانتخابات، والحد من حالات الاستغلال الجنسي والاتجار بالبشر على الإنترنت. كما يمكن توسيع نطاق عمل التقنية لتشمل تقنيات «الواقع المعزز (Augmented Reality)» و«تحويل النصوص المكتوبة إلى كلام (Optical Character Recognition OCR)» والترجمة الفورية للمحادثات، إضافة إلى عرض الترجمة الفورية عالية الدقة بين 200 لغة لأي نص أمام المستخدم، وبشكل سلس للغاية، سواء أكان ذلك لأغراض التعليم أم السياحة أم الترفيه... وغيرها.
وتُطبق حالياً تقنيات وضع النماذج والدروس المكتسبة من بحث هذا البرنامج على أنظمة الترجمة التي يستخدمها محررو «ويكيبيديا» لتوفير أدوات الترجمة لملايين الأشخاص والمساعدة على تحسين أنظمة الترجمة. ورأت الشركة أن هناك إصدارات من «ويكيبيديا» بأكثر من 300 لغة، ولكن يحتوي أغلبها على عدد مقالات أقل بكثير من المقالات المتوفرة باللغة الإنجليزية البالغ عددها أكثر من 6 ملايين مقال. ويعدّ هذا التفاوت كبيراً؛ خصوصاً بالنسبة إلى اللغات التي يُتحدث بها بشكل أساسي خارج أوروبا وأميركا الشمالية. وعلى سبيل المثال؛ هناك نحو 3.260 مقال على «ويكيبيديا» بلغة اللينجالا، وهي لغة يتحدث بها 45 مليون شخص في جمهورية الكونغو الديمقراطية، وجمهورية الكونغو، وجمهورية أفريقيا الوسطى، وجنوب السودان. ويمكن مقارنة ذلك بلغة مثل السويدية التي يبلغ عدد المتحدثين بها 10 ملايين ولديها أكثر من 2.5 مليون مقال.
كما يمكن استخدام هذه التقنية في إنشاء أنظمة تضيف ترجمات دقيقة باللغة السواحيلية أو الأورومو إلى أفلام «بوليوود» مثلاً. ومع بدء تشكيل عالم «ميتافيرس»، ستساعد القدرة على بناء تقنيات تعمل جيداً بمئات أو حتى آلاف اللغات على توفير الوصول إلى تجارب جديدة وجذابة في العوالم الافتراضية.
يذكر أن «Meta AI» تقدم أيضاً ما يصل إلى 200 ألف دولار أميركي من المِنح للمؤسسات غير الهادفة للربح لتطبيق هذا النموذج في العالم الحقيقي. ويُتوقع ألا نستطيع التمييز بين الترجمة باستخدام الذكاء الصناعي والبشرية في خلال 10 سنوات.
ويرى أنطوان أنه من أهم فوائد هذا النظام الشمولية بسبب عدم استخدام بعض اللغات بين المستخدمين، إضافة إلى كسر الحواجز لدى الدخول إلى عالم «ميتافيرس» بحيث يمكن لأي مستخدم التفاعل مع الآخرين في هذا العالم الافتراضي بغض النظر عن اللغة المستخدمة.
نص البرنامج مفتوح المصدر وموجود في منصة «GitHub» لمزيد من الشفافية، مع إمكانية استكشاف عرض توضيحي لنموذج «NLLB - 200» باتباع الرابط التالي الذي يعرِض طريقة ترجمة النموذج للقصص من جميع أنحاء العالم: nllb.metademolab.com.
«ميتا»: الإنترنت تحت هيمنة 4 لغات
مدير أبحاثها للذكاء الصناعي أكد لـ«الشرق الأوسط» العمل على نموذج يدعم 25 مليار ترجمة يومياً
«ميتا»: الإنترنت تحت هيمنة 4 لغات
لم تشترك بعد
انشئ حساباً خاصاً بك لتحصل على أخبار مخصصة لك ولتتمتع بخاصية حفظ المقالات وتتلقى نشراتنا البريدية المتنوعة