«الدقة المختلطة»... نهج لتسريع العمليات الحسابية

«الدقة المختلطة»... نهج لتسريع العمليات الحسابية

استخدمه علماء «كاوست» لنمذجة مجموعات البيانات الجغرافية المكانية الكبيرة والمعقدة
الاثنين - 27 ذو القعدة 1443 هـ - 27 يونيو 2022 مـ رقم العدد [ 15917]
حاسوب «شاهين» العملاق في جامعة «كاوست»

من خلال نهج «الحسابات مختلطة الدقة»، الذي استخدمه علماء جامعة الملك عبد الله للعلوم والتقنية (كاوست)، سيصبح بمقدورنا تحليل مجموعات كبيرة ومعقدة من البيانات الجغرافية المكانية في وقتٍ قياسي. ويواكب هذا النهج تصاعد أهمية البيانات الجغرافية المكانية في الأنشطة الإحصائية؛ إذ تقول الأمم المتحدة إن تلك البيانات أصبحت لا غنى عنها لفهم موقع الأمكنة التي يعيش ويعمل الناس فيها وسياقها، ولفهم الأشخاص المنوط بالحكومات خدمتهم وصلتهم بمجتمعاتهم، وهو ما يسمح بتحديد جذور المشاكل.
ومع ثورة البيانات وظهور التقنيات المبتكرة اليوم، تمكَّن فريق بحثي دولي تقوده «كاوست»، من تسريع نمذجة مجموعات بيانات جغرافية مكانية كبيرة بشكل كبير، دون فقدان الدقة بشكل كليّ، وذلك من خلال تطبيق حسابات عالية الدقة فقط عندما تشتد إليها الحاجة. وتشير كلمة «الدقة» Precision إلى المستوى التفصيلي في القياس، وترتبط بعملية موازنة جهاز القياس وتقويمه، مثل جهاز قياس كمية المطر.
ويشمل ذلك أيضاً العمليات الحسابية؛ ففي بعض الحسابات اليدوية التي تختلف في درجة الدقة بعدد الأرقام العشرية، كلما ازداد عدد هذه الأرقام ارتفعت نسبة الدقة. وتكون الدقة مطلوبة في كثير من الطرائق الإحصائية عند حساب القيمة الحرجة لمقارنتها مع القيمة الجدولية.
وسيسمح هذا النهج بتحليل مجموعات بيانات أكبر في وقت أقصر، الذي يتم تنفيذه على نظام حوسبة عالي الأداء يعتمد على وحدات معالجة الرسوميات المتوازية بشكل كبير (GPU).
وفي الوقت الذي تمتلك فيه أجهزة الكومبيوتر القدرة على إجراء عمليات حسابية كبيرة جداً، وبسرعة ملحوظة، فإن النتيجة في بعض الأحيان قد تكون أقل دقة من الحسابات اليدوية بسبب محدودية الكيفية التي يتم بها تخزين الأرقام في الأنظمة الرقمية. كما تضم «أرقام الدقة القياسية أو الفردية» من 6 إلى 9 أرقام عشرية من الدقة؛ مما يعني أنه سيتم اقتطاع أي عملية حسابية ينتج عنها تسلسل أطول للأرقام، وبالتالي سيتم فقدان المعلومات.
في حين أن إمكانية استخدام «أرقام الدقة المزدوجة» ما زالت مطروحة، إلا أنها تُضاعِف من كثافة الذاكرة والعمليات الحسابية. أمّا عن استعمالها في مجموعات البيانات الجغرافية المكانية فسيكبّلها حجم مجموعات البيانات التي يمكن حسابها بدقة، حيث يمكن أن يؤدي تراكم مثل هذه الأخطاء في الدقة إلى نتائج نمذجة خاطئة.
وفي هذا الشأن، قام الدكتور سامح عبد الله رفقة زملائه في«كاوست»: الدكتور حاتم لطيف، والبروفسور مارك جنتون، والدكتورة يينغ صن، والبروفسور ديفيد كيز، بالتعاون مع باحثين من جامعة تينيسي، الواقعة في ناشفيل (UTK) في الولايات المتحدة الأميركية، بتطوير حل لهذه المشكلة عن طريق نهج «الدقة المختلطة»، حسب الحاجة.
يُذكر أن الاستخدام الشائع «للحسابات المختلطة الدقة» - أحد أشكال حساب الفاصلة العائمة الذي يستخدم أرقاماً ذات عروض مختلفة في عملية واحدة - هو العمل على أرقام غير دقيقة بعرض صغير وتوسيعها لتمثيل أكبر وأكثر دقة.
يقول عبد الله: «لطالما اعتمدَت نمذجة البيانات البيئية على مدى عقود من الزمن على العمليات الحسابية ذات الدقة المزدوجة للتنبؤ بالبيانات المفقودة». ويردف قائلاً: «لكن اليوم، هناك أجهزة حوسبة ذات أداء عالي يمكنها إجراء عمليات حسابية تتميز بدقة أحادية نصفية مع تسريع يقدر بنحو 16 و32 مرة مقارنة بالحسابات ذات الدقة المزدوجة. ولتحقيق أقصى استفادة من ذلك، نطرح (إطاراً ثلاثي الدقة)، يمكنه استغلال عملية تسريع الدقة المنخفضة مع الحفاظ على الدقة باستخدام عمليات الحساب ذات الدقة المزدوجة للمعلومات الأساسية».
علاوة على ذلك، استخدم الباحثون نظام وقت التشغيل لنظام «بارسيك» PaRSEC الذي طوّرته جامعة تينيسي (UTK)، الذي يسمح بالدقة عند الطلب، وتنسيق المهام وحركة البيانات عبر وحدات معالجة الرسوميات المتوازية المتعددة. وعن طريق هذا النظام استغل الباحثون العلاقات الإحصائية في البيانات لتقليل الدقة للمواقع المكانية ضعيفة الارتباط إلى دقة أحادية نصفية على أساس المسافة. ويرجع السبب في ذلك إلى أن «حسابات الدقة المزدوجة»، يتم تطبيقها فقط على المواقع شديدة الارتباط، التي لها التأثير الأكبر على دقة النموذج.
يقول عبد الله: «إن الهدف الرئيسي من هذا المشروع يكمن في الاستفادة من خوارزميات الجبر الخطي المتوازي الحديثة التي طورها مركز أبحاث الحوسبة الفائقة في (كاوست) لتوسيع نطاق تطبيقات الإحصاء الجغرافي المكاني على البنى الموازية الرائدة».
ويكمل: «لقد أظهرنا أنه بمقدورنا تحقيق تسريع كبير مقارنة بالنمذجة الحسابية التي لديها دقة مزدوجة بشكل كامل مع الحفاظ على تقديرات المعلمات ودقة التنبؤ لتلبية متطلبات التطبيق».
ويوضح قائلاً: «تتمثل الخطوة التالية في دمج التقريبات مع الدقة المختلطة لتقليل أثر الذاكرة بشكل أكبر وتقصير وقت العملية الحسابية».


اختيارات المحرر

فيديو