باحثون يطورون برنامجاً للتعرف على 25 لهجة عربية

هل سافرت إلى إحدى المدن العربية، وعانيت من فهم بعض اللهجات المحلية، مما أعاق قدرتك على التواصل مع أشقائك العرب، رغم أن اللغة التي تجمعكم واحدة، وهي اللغة العربية؟ هذه المشكلة شغلت بال باحثين عملوا على الاستفادة من تقنيات الذكاء الاصطناعي للمساهمة في إيجاد حلول لها، وأثمر عملهم عن تطوير واجهة إلكترونية عامة، تحت اسم «برنامج التعرف التلقائي على اللهجات العربية» (ADIDA)، الذي يملك القدرة على تصنيف اللهجات من 25 مدينة عربية على امتداد العالم العربي.
ويعد هذا البرنامج ثمرة تعاون بين فريق من الباحثين في جامعة نيويورك أبوظبي، تحت إشراف د. نزار حبش، الأستاذ المشارك في علوم الحاسوب مدير مختبر الأساليب الحاسوبية لنمذجة اللغة في جامعة نيويورك أبوظبي (CAMeL Lab)، بالشراكة مع باحثين من مؤسسات تعليمية أخرى.
ووفق بيان صحافي صدر أمس من جامعة نيويورك أبوظبي، وصلت «الشرق الأوسط» نسخة منه، فإن مستخدمي البرنامج يمكنهم إدراج نص باللغة العربية في برنامج التعرف التلقائي على اللهجات العربية، للحصول على نتائج على شكل خريطة جغرافية للعالم العربي، تظهر فيها المدن التي تستخدم هذا النص من بين الـ25 مدينة، ثم تستعرض الواجهة الإلكترونية المدن الخمس الأولى، من حيث احتمال استخدامها للنص المكتوب، إلى جانب اللغة العربية الفصحى.
ويوضح البيان نموذجاً عملياً، حيث يمكن للبرنامج تحديد ما إذا كانت كلمة «ماشي» تعني «حسناً» في القاهرة وبيروت أو «لا» في صنعاء.
ويقول د. نزار حبش، الباحث الرئيسي للمشروع، في تصريحات خاصة لـ«الشرق الأوسط»: «قاعدة معلومات البرنامج تحتوي على 100 ألف جملة مترجمة من الإنجليزية أو الفرنسية إلى لهجات المدن الـ25، وتحتوي كذلك على 12 ألف جملة في العربية الفصحى، ويبلغ عدد الكلمات المستخدمة في كل الجمل نحو 800 ألف كلمة، كما تم بناء قاموس متعدد اللهجات يحتوي على 47 ألف مفردة.
ويضيف أن عدد المشاركين في هذا المشروع 55 شخصاً، من الألسنيين ومحبي اللهجات من كل المدن التي ركزنا عليها في المشروع، ومبرمجين وباحثي ذكاء اصطناعي.
وعن وجود أكثر من لهجة في الدولة الواحدة، ومدى قدرة البرنامج على التعامل مع كل هذه اللهجات، أوضح د. حبش أنهم يركزون على لهجات المدن، وليس الدول أو المناطق الجغرافية، لذلك تم اختيار المدن التي تمثل مناطق اللهجات المختلفة في العالم العربي. فمثلاً في مصر، اختاروا 3 مدن، هي: الإسكندرية والقاهرة وأسوان. ومن العراق، اختاروا الموصل وبغداد والبصرة.
ويطمح المشروع إلى إضافة مدن أخرى في المستقبل، لكنه ركز في هذه المرحلة على 25 مدينة فقط بسبب القيود الزمنية والمالية، كما أكد د. حبش.
ولا يخشى العاملون بالمشروع الانتقادات التي قد توجه لهم بتشجيع استخدام اللهجات المحلية، في وقت ينبغي أن يعطوا فيه الأولوية للعربية الفصحى، وقال د. حبش: «نحن كاختصاصيين عرب في الذكاء الاصطناعي وتقنيات اللغات هدفنا الأول والأخير هو تحسين القدرات الآلية لتحليل اللغة العربية (فصحى وعامية) لتناهض القدرات الآلية المتوفرة للغات الأجنبية (الإنجليزية والفرنسية خصوصاً)».