«ميتا»: الإنترنت تحت هيمنة 4 لغات

مدير أبحاثها للذكاء الصناعي أكد لـ«الشرق الأوسط» العمل على نموذج يدعم 25 مليار ترجمة يومياً

«ميتا»: الإنترنت تحت هيمنة 4 لغات
TT

«ميتا»: الإنترنت تحت هيمنة 4 لغات

«ميتا»: الإنترنت تحت هيمنة 4 لغات

تعمل شركة «ميتا» على تطوير نظام الترجمة عالية الدقة بين اللغات باستخدام تقنيات الذكاء الصناعي. وكشفت الشركة عن عزمها على رفع عدد اللغات التي يدعمها هذا النظام من 100 إلى 200 لغة، وذلك بهدف مساعدة الأشخاص على التواصل بشكل أفضل في الوقت الحالي وتمكينهم من أن يصبحوا جزءاً من عالم «ميتافيرس» في المستقبل.
وتحدثت «الشرق الأوسط» حصرياً مع أنطوان بورد، مدير عام أبحاث «فيسبوك» للذكاء الصناعي (Facebook AI Research FAIR) لدى «ميتا»، في آفاق تقنيات الذكاء الصناعي في الترجمة الآلية الدقيقة بين هذه اللغات، ومستقبل تفاعل المستخدمين معاً في الإنترنت والعالمين الحقيقي و«ميتافيرس».
وقال أنطوان إن «اللغة تعبر عن ثقافتنا وهويتنا، وتمثل شرياناً يمد العالم بالحياة. ولكن نظراً إلى عدم وجود أدوات ترجمة عالية الجودة لمئات اللغات، فلا يمكن لمليارات الأشخاص اليوم الوصول إلى المحتوى الرقمي أو المشاركة بالكامل في المحادثات والمجتمعات على الإنترنت بلغاتهم المفضلة أو الأصلية. وينطبق ذلك خصوصاً على مئات الملايين من الأشخاص الذين يتحدثون العديد من لغات قارتي أفريقيا وآسيا».
وترى الشركة أن عدداً قليلاً من اللغات يهيمن على محتوى الإنترنت، وهو الإنجليزية والعربية والإسبانية والماندارين؛ «الأمر الذي يعني أن كثيراً من اللغات الأخرى غير موجودة، وبالتالي لن يستطيع متحدثو تلك اللغات قليلة الاستخدام الحفاظ على لغاتهم، وما ينجم عن ذلك من أخطاء في التعبير عن الاحتياجات أو المشاعر (جراء عدم استخدام التعابير غير اللفظية في الترجمة، مثل لغة الجسد، أو حتى نبرة الصوت جراء تغير مشاعر المتحدث) جراء استخدام لغات أخرى وسيطة وترجمة المحتوى إليها يدوياً أو باستخدام أدوات بسيطة».
ومن اللغات التي لا تُستخدم كثيراً والتي يدعمها برنامج «لن نترك لغة (No Language Left Behind NLLB)» الذي يستخدم تقنيات الذكاء الصناعي الجديدة، 55 لغة أفريقية بنتائج عالية الجودة، مثل الكامبا واللاوية. ويستطيع هذا النموذج الواحد توفير ترجمات عالية الجودة للغات يتحدث بها مليارات الأشخاص حول العالم؛ بما فيها اللغات الأفريقية والهندية.
وستدعم التطورات البحثية لهذا البرنامج أكثر من 25 مليار ترجمة تعرض يومياً على آخر أخبار «فيسبوك» و«إنستغرام» والمنصات الأخرى. ويمكن من خلال هذه التقنية زيارة مجموعة ما على «فيسبوك»، مثلاً، وقراءة منشور مكتوب بلغتي الإيجبو أو لوغندا، بكل سهولة وبلغتك الأم بنقرة زر واحدة. كما يمكن أن تساعد الترجمات عالية الدقة لمزيد من اللغات في اكتشاف المحتوى الضار، والمعلومات المضللة، وحماية نزاهة الانتخابات، والحد من حالات الاستغلال الجنسي والاتجار بالبشر على الإنترنت. كما يمكن توسيع نطاق عمل التقنية لتشمل تقنيات «الواقع المعزز (Augmented Reality)» و«تحويل النصوص المكتوبة إلى كلام (Optical Character Recognition OCR)» والترجمة الفورية للمحادثات، إضافة إلى عرض الترجمة الفورية عالية الدقة بين 200 لغة لأي نص أمام المستخدم، وبشكل سلس للغاية، سواء أكان ذلك لأغراض التعليم أم السياحة أم الترفيه... وغيرها.
وتُطبق حالياً تقنيات وضع النماذج والدروس المكتسبة من بحث هذا البرنامج على أنظمة الترجمة التي يستخدمها محررو «ويكيبيديا» لتوفير أدوات الترجمة لملايين الأشخاص والمساعدة على تحسين أنظمة الترجمة. ورأت الشركة أن هناك إصدارات من «ويكيبيديا» بأكثر من 300 لغة، ولكن يحتوي أغلبها على عدد مقالات أقل بكثير من المقالات المتوفرة باللغة الإنجليزية البالغ عددها أكثر من 6 ملايين مقال. ويعدّ هذا التفاوت كبيراً؛ خصوصاً بالنسبة إلى اللغات التي يُتحدث بها بشكل أساسي خارج أوروبا وأميركا الشمالية. وعلى سبيل المثال؛ هناك نحو 3.260 مقال على «ويكيبيديا» بلغة اللينجالا، وهي لغة يتحدث بها 45 مليون شخص في جمهورية الكونغو الديمقراطية، وجمهورية الكونغو، وجمهورية أفريقيا الوسطى، وجنوب السودان. ويمكن مقارنة ذلك بلغة مثل السويدية التي يبلغ عدد المتحدثين بها 10 ملايين ولديها أكثر من 2.5 مليون مقال.
كما يمكن استخدام هذه التقنية في إنشاء أنظمة تضيف ترجمات دقيقة باللغة السواحيلية أو الأورومو إلى أفلام «بوليوود» مثلاً. ومع بدء تشكيل عالم «ميتافيرس»، ستساعد القدرة على بناء تقنيات تعمل جيداً بمئات أو حتى آلاف اللغات على توفير الوصول إلى تجارب جديدة وجذابة في العوالم الافتراضية.
يذكر أن «Meta AI» تقدم أيضاً ما يصل إلى 200 ألف دولار أميركي من المِنح للمؤسسات غير الهادفة للربح لتطبيق هذا النموذج في العالم الحقيقي. ويُتوقع ألا نستطيع التمييز بين الترجمة باستخدام الذكاء الصناعي والبشرية في خلال 10 سنوات.
ويرى أنطوان أنه من أهم فوائد هذا النظام الشمولية بسبب عدم استخدام بعض اللغات بين المستخدمين، إضافة إلى كسر الحواجز لدى الدخول إلى عالم «ميتافيرس» بحيث يمكن لأي مستخدم التفاعل مع الآخرين في هذا العالم الافتراضي بغض النظر عن اللغة المستخدمة.
نص البرنامج مفتوح المصدر وموجود في منصة «GitHub» لمزيد من الشفافية، مع إمكانية استكشاف عرض توضيحي لنموذج «NLLB - 200» باتباع الرابط التالي الذي يعرِض طريقة ترجمة النموذج للقصص من جميع أنحاء العالم: nllb.metademolab.com.


مقالات ذات صلة

بدء إصلاح كابل بيانات متضرر في بحر البلطيق

أوروبا كابل الاتصالات البحري «سي ليون 1» أثناء وضعه في قاع بحر البلطيق عام 2015 (أ.ف.ب)

بدء إصلاح كابل بيانات متضرر في بحر البلطيق

 بدأ إصلاح كابل اتصالات بحري متضرر بين هلسنكي وميناء روستوك الألماني في بحر البلطيق، الاثنين.  

«الشرق الأوسط» (كوبنهاغن)
المشرق العربي أطفال انفصلوا عن شقيقهم بعد فراره من شمال غزة ينظرون إلى صورته على هاتف جوال (رويترز)

انقطاع كامل للإنترنت في شمال غزة

أعلنت شركة الاتصالات الفلسطينية (بالتل)، اليوم (السبت)، عن انقطاع كامل لخدمات الإنترنت في محافظة شمال قطاع غزة، بسبب «عدوان الاحتلال المتواصل».

«الشرق الأوسط» (غزة)
يوميات الشرق حبُّ براد بيت سهَّل الوقوع في الفخ (رويترز)

«براد بيت زائف» يحتال بـ325 ألف يورو على امرأتين «مكتئبتين»

أوقفت الشرطة الإسبانية 5 أشخاص لاستحصالهم على 325 ألف يورو من امرأتين «ضعيفتين ومكتئبتين»... إليكم التفاصيل.

«الشرق الأوسط» (مدريد)
أوروبا سانيا أميتي المسؤولة في حزب الخضر الليبرالي (أ.ب)

مسؤولة محلية سويسرية تعتذر بعد إطلاق النار على ملصق ديني

قدمت عضوة في مجلس مدينة سويسرية اعتذارها، وطلبت الحماية من الشرطة بعد أن أطلقت النار على ملصق يُظهِر لوحة تعود إلى القرن الرابع عشر لمريم العذراء والسيد المسيح.

«الشرق الأوسط» (زيوريخ)
شؤون إقليمية كنعاني خلال مؤتمر صحافي في طهران (الخارجية الإيرانية)

إيران ترد على «مزاعم» اختراقها الانتخابات الأميركية

رفضت طهران ما وصفتها بـ«المزاعم المتكررة» بشأن التدخل في الانتخابات الأميركية، في حين دعت واشنطن شركات تكنولوجيا مساعدة الإيرانيين في التهرب من رقابة الإنترنت.


مشروع توثيق الكرة السعودية: رصد 103 أعوام واعتماد البطولات المناطقية

استعرض فريق العمل النتائج التي توصل لها في المرحلة الخامسة (الاتحاد السعودي)
استعرض فريق العمل النتائج التي توصل لها في المرحلة الخامسة (الاتحاد السعودي)
TT

مشروع توثيق الكرة السعودية: رصد 103 أعوام واعتماد البطولات المناطقية

استعرض فريق العمل النتائج التي توصل لها في المرحلة الخامسة (الاتحاد السعودي)
استعرض فريق العمل النتائج التي توصل لها في المرحلة الخامسة (الاتحاد السعودي)

كشف فريق عمل مشروع توثيق تاريخ كرة القدم السعودية عن بلوغ نسبة الإنجاز 81 في المائة حتى الآن، إذ تم توثيق 103 أعوام من تاريخ كرة القدم السعودية.

وعقد فريق عمل المشروع اجتماعه الدوري في الرياض، واستعرض فريق العمل النتائج التي توصل لها في المرحلة الخامسة التي شملت عهد خادم الحرمين الشريفين الملك فهد بن عبد العزيز، والممتدة من عام 1982 - 2005.

وتم الإعلان عن منهجية التعامل مع مسابقات الأندية في مشروع توثيق تاريخ كرة القدم السعودية، حيث شملت 4 مبادئ أساسية، هي: احترام المكتسبات، والدقة، والمقارنات الدولية، والمرونة.

وحُددت أربع جهات قامت بتنظيم المسابقات عبر تاريخ كرة القدم السعودية وهي: الجهة المنظمة (فترة الرواد)، ويقصد بها الجهة أو الجهات أو الشخصيات التي قامت بتنظيم مسابقات ومباريات وشؤون كرة القدم داخل المملكة العربية السعودية بمشاركة غير إلزامية من أندية أو منتخبات سعودية قبل انضمام المملكة للاتحاد الدولي لكرة القدم.

تم الإعلان عن منهجية التعامل مع مسابقات الأندية في مشروع توثيق تاريخ كرة القدم السعودية (الاتحاد السعودي)

أما الجهة المنظمة (المختصة) المحلية فهي الجهة التي صدر قرار أو نظام يعطيها الصلاحية بتنظيم شؤون كرة القدم على مستوى الأندية والمنتخبات والمسابقات والمباريات في المملكة العربية السعودية بين مختلف الأندية والمنتخبات المسجلة رسمياً لدى هذه الجهة، وتكون هذه الجهة هي الممثل الرسمي للمملكة على الصعيد الدولي في مجال كرة القدم.

وفيما يقصد بالجهة المنظمة (المختصة) الخارجية، فهي الجهة الخارجية التي وافقت أو انضمت لها الجهة المختصة المحلية بقرار أو نظام أو اتفاقية، وبذلك منحت الجهة الخارجية الصلاحية بتنظيم شؤون كرة القدم على مستوى الأندية والمنتخبات والمسابقات والمباريات في نطاق جغرافي محدد.

ورابع هذه الجهات، كانت الجهة المنظمة غير المختصة (محلياً وخارجياً) وهي الجهة أو الجهات أو الشخصيات التي قامت بتنظيم مسابقات ومباريات وشؤون كرة القدم داخل المملكة العربية السعودية أو خارجها بمشاركة غير إلزامية من أندية أو منتخبات سعودية في الفترة ما بعد انضمام المملكة للاتحاد الدولي لكرة القدم، وبموافقة رسمية من الجهة المختصة المحلية.

من جانبه، تحدث سعيد أبو داهش ممثل نادي النصر في مشروع توثيق كرة القدم السعودية لـ«الشرق الأوسط»، وبيّن أن اللجنة اعتمدت معيار البطولات المناطقية بمعاييرها، وقال أبو داهش: النصر هو النادي الوحيد على مستوى المملكة الذي بطولاته واضحة منذ تأسيسه حتى هذه اللحظة، والأوضح من ذلك بطولات النصر موثقة من تاريخ تأسيسه حتى عام 2000 من المرجعية، وهذا أمر مهم.

وأضاف أبو داهش أنه في حال طرح أي أمر للتصويت يجب أن يرسل لنا قبلها بفترة زمنية كافية حتى تتم مراجعته، وألا نتفاجأ بأن يعرض علينا في الشاشة مباشرة ويطلب منا التصويت، وهذا ما اعترضنا عليه واللجنة تقبلته بصدر رحب.

من جانبه، أكد فارس العلياني، ممثل نادي الشباب في مشروع توثيق تاريخ كرة القدم السعودية، لـ«الشرق الأوسط»، أنهم اقترحوا أن توضع البطولات التي انتهت بتتويج في جدول خاص بها، وأيضاً وضع المنجزات التي لم تنته بتتويج في جدول آخر مستقل.

وقال العلياني: كان لدينا في السابق عمل احترافي وأخذ بعين الاعتبار، وسيتم إنصاف الجميع في الفترة التي أطلق عليها «فترة الرواد»، وهي ما قبل 1957، وأما الفترة التي بعدها فهي واضحة للجميع، والآن وصلنا إلى نسبة واحد وثمانين في المائة، وفي الجلسة المقبلة في يناير (كانون الثاني) لدينا فترة الملك فهد من عام 1402 حتى 1425، وقبل الإعلان النهائي في مارس (آذار) ستكون الأمور واضحة لنا في الأندية، وسيتم تزويد كل نادٍ بمسودة العمل للاطلاع عليها قبل الإعلان النهائي.

وأوضح العلياني أنه تم التصويت على تأجيل توثيق تاريخ كرة القدم النسائية والشاطئية والصالات والرياضات الإلكترونية حتى نهاية المشروع الأول.

وقال إبراهيم اليحيى، ممثل نادي الهلال في مشروع توثيق تاريخ كرة القدم السعودية لـ«الشرق الأوسط»: فريق مشروع التوثيق طلب من الأندية تقديم البطولات والمنجزات، حتى للفئات السنية على مستوى المملكة والمناطق، والإنجازات الفردية للاعبين، والبطولات جزء قليل من مشروع ضخم لتوثيق تاريخ الرياضة.

ومجالس إدارات الاتحاد والمسابقات والمنتخبات رسمي وودي، ونطمئن بأنه خلال ما حصل من نقاشات ما راح يضيع أي بطولة لأي نادٍ مهما كانت ودية أو رسمية مناطق أو غير مناطق وكأس أو غيرها وسيوضع لها الآلية المناسبة التي ستستوعب كل البطولات.