بدأ «مجمع الملك سلمان العالمي للغة العربية» العمل في مشروع «أصوات السعودية»، الذي يمثل مدونة عامة منطوقة ومُفرَّغة كتابياً، ذات مستويات لغوية متعددة؛ سواء لغة فصيحة أم لهجات محلية مُستقاة من أوعية ومصادر مختلفة من العربية الممتدة داخل البلاد وفقاً لأحدث المعايير العلمية، على نحو يتوافق مع مستهدفات برنامج تنمية القدرات البشرية، أحد برامج تحقيق «رؤية 2030».
ويهدف المجمع من المشروع، الذي يخطط لاكتمال مرحلته الأولى نهاية هذا العام، إلى تعزيز الحراك العلمي والبحثي في صناعة المدونات العربية الصوتية، وجمع بيانات صوتية متعددة للهجات السعودية، وبناء مدونة وفقاً للمنهجيات الحديثة، كما يسعى لتمثيل الطبقات المجتمعية المختلفة، وتوثيق لهجاتها صوتيّاً داخل المجتمع، والاستفادة من التقنيات في إيصال تلك البيانات للمجتمع اللغوي العلمي؛ لدراسة ظواهرها، وإتاحة مادة صوتية مقروءة آليّاً ومدعومة بالتحليلات «الصرفية، والنحوية، والمعجمية، والدلالية» لنماذج الذكاء الاصطناعي.
وتستهدف «مدونة أصوات» صُنَّاع معاجم اللهجات المحكية، وباحثي الذكاء الاصطناعي، والمهتمين بدراسة الظواهر اللغوية المقارنة بين طبقات المجتمع العمرية أو اللهجات المتعددة، كذلك تستهدف الباحثين في واقع اللغة العربية والتخطيط والسياسة اللغوية العربية.
وتتميّز باعتمادها على أحدث المعايير العالمية في هيكلة البيانات الصوتية وإدارتها كمعيارَي «CODA» و«TEI»، وإتاحة المشاركة لفئات عمرية مختلفة؛ لتمثيل الواقع اللغوي الحقيقي للهجات السعودية المتنوعة، باستهداف أكثر من 40 نقطة جغرافية داخل المملكة؛ إذ ستُسجّل في كل نقطة أصوات فئات عدة، تضم «الأطفال، والشباب، وكبار السن»، من الرجال والنساء، لتُرفع جميعها عبر منصة «فلك» للمدونات اللغوية.
وتحتوي المدونة على موضوعات عدة؛ منها: «سرد القصص المصورة، والحديث عن الأماكن، والأطعمة، والعادات والتقاليد، والأعياد، والمواقف اليومية، والاقتباسات». وستكون متاحة للباحثين والمهتمين؛ للاستفادة منها في إعداد الدراسات والأبحاث، وبناء التطبيقات، والمشاركة في إضافة نقاط جغرافية جديدة، كما ستفيد مطوري تطبيقات الذكاء الاصطناعي في تجاوز تحديات نقص البيانات الكافية لدراسة اللهجات العربية، والاختلافات اللغوية بين فئات المجتمع، والتعرّف الآلي إلى الأصوات أو الإملاء الصوتي باللغة المحكية.
يشار إلى أن «أصوات» تتواءم مع الخطط الاستراتيجية للمجمع في دعم مجالات الحوسبة اللغوية، وتسريع وتيرة البحث العلمي فيها، وتعزيز مصادر البيانات، وتوظيف تقنيات الذكاء الاصطناعي في تطبيقات اللغة العربية، والمحافظة على سلامتها، ودعمها نطقاً وكتابة، وتعزيز مكانتها عالميّاً، ورفع مستوى الوعي بها، وتيسير تعليمها وتعلُّمها داخل السعودية وخارجها.