اختبارات ألمانية: «بصمة تلوث بيئي» ملموسة لنماذج الذكاء الاصطناعي

على المستخدمين الاختيار بين متطلبات الدقة والاستدامة

اختبارات ألمانية: «بصمة تلوث بيئي» ملموسة لنماذج الذكاء الاصطناعي
TT

اختبارات ألمانية: «بصمة تلوث بيئي» ملموسة لنماذج الذكاء الاصطناعي

اختبارات ألمانية: «بصمة تلوث بيئي» ملموسة لنماذج الذكاء الاصطناعي

تتزايد وتتحسن الإمكانات المتاحة للمستخدمين بالوصول المجاني، أو بالاشتراك الرخيص إلى نماذج الذكاء الاصطناعي، حيث أصبحت «غوغل» أحدث شركة تتيح نماذجها الجديدة لجميع المستخدمين، وليس فقط للمستخدمين الذين يدفعون أجوراً مقابلها. لكن هذا الوصول يأتي بتكلفة واحدة: البيئة.

اختبارات بيئية ألمانية

في دراسة جديدة، اختبر باحثون ألمان 14 نموذجاً لغوياً كبيراً بأحجام مختلفة من مطورين رائدين مثل «ميتا» و«علي بابا» وغيرهما. وأثناء الاختبارات أجاب كل نموذج على 1000 سؤال أكاديمي صعب، تغطي مواضيع من تاريخ العالم إلى الرياضيات المتقدمة.

أُجريت الاختبارات على وحدة معالجة إلكترونية رسومية NVIDIA A100 قوية ومستهلكة للطاقة، باستخدام إطار عمل متخصص لقياس استهلاك الكهرباء بدقة لكل إجابة. ثم حُوّلت هذه البيانات إلى انبعاثات مكافئة لثاني أكسيد الكربون، ما يوفر مقارنة واضحة للتأثير البيئي لكل نموذج.

النماذج الأصغر كفؤة وأقل تلويثاً

وجد الباحثون أن العديد من النماذج اللغوية الكبيرة أقوى بكثير مما هو مطلوب لأغراض الاستعلامات اليومية. وبالمقابل يمكن للنماذج الأصغر حجماً والأقل استهلاكاً للطاقة الإجابة عن العديد من الأسئلة الواقعية بنفس الكفاءة.

البصمة الكربونية تختلف باختلاف الأسئلة

تختلف البصمة الكربونية والمائية اختلافاً كبيراً تبعاً لحجم النموذج ونوع المهمة، إذ تُعدّ الأسئلة التي تتطلب إجابات التفكير المنطقي، والتي تُجبر النماذج على «التفكير بصوت عالٍ»، مُلوِّثة بشكل خاص لأنها تُولِّد عدداً أكبر بكثير من الرموز.

وقد تصدّر نموذج «كوغيتو (Cogito)» جدول اختبارات الدقة - حيث أجاب عن ما يقرب من 85 في المائة من الأسئلة بشكل صحيح - لكنه أنتج انبعاثات أكثر بثلاث مرات من النماذج ذات الحجم المماثل، ما يُسلِّط الضوء على مُقايضة نادراً ما يراها مُطوِّرو أو مُستخدمو الذكاء الاصطناعي. ولم تستجب شركة «كوغيتو» على طلبات التعليق على النتائج.

ويقول ماكسيميليان داونر، الباحث في جامعة ميونيخ للعلوم التطبيقية وأحد مُعِدّي الدراسة: «هل نحتاج حقاً إلى نموذج (جي بي تي) 400 مليار مُعامل للإجابة عن أسئلة مثل الحرب العالمية الثانية؟».

التوازن بين الدقة والانبعاثات

أكدت النتائج على التوازن بين الدقة والانبعاثات. وكان Qwen 7B، أحد النماذج الأقل تلويثاً الذي تم اختباره، أجاب عن سؤال واحد فقط من كل 3 أسئلة بشكل صحيح، لكن انبعاثاته لم تشكل سوى 27.7 غرام من مكافئ ثاني أكسيد الكربون. في المقابل، أجاب نموذج الاستدلال R1 70B من «ديب سيك» بشكل صحيح عن ما يقرب من 8 من كل 10 أسئلة، بينما أنتج انبعاثات تزيد على 70 ضعفاً لنفس حجم العمل.

نوع السؤال... يؤثر بيئياً

يؤثر نوع السؤال أيضاً على الأثر البيئي. إذ أنتجت أسئلة الجبر أو الفلسفة انبعاثات تصل إلى 6 أضعاف ما قد ينتجه طالب ثانوي عند حصوله على مساعدة في واجباته المنزلية.

ويقول داونر: «يجب أن تكون الشركات أكثر شفافية بشأن تقييم الانبعاثات الحقيقية واستهلاك المياه الناتجة عن الأسئلة». ولكن في الوقت نفسه، يجب أن يكون المستخدمون أكثر وعياً - وأكثر حكمة - بشأن استخدامهم للذكاء الاصطناعي.

* مجلة فاست كومباني، خدمات «تريبيون ميديا».


مقالات ذات صلة

«أوبن إيه آي» تطلق «تشات جي بي تي» الجديد... يتصفح ويحلل ويقرر

تكنولوجيا النسخة الجديدة من «ChatGPT» مزوّدة بوكيل ذكي قادر على تنفيذ مهام معقّدة من البداية إلى النهاية باستخدام حاسوب افتراضي (شاترستوك)

«أوبن إيه آي» تطلق «تشات جي بي تي» الجديد... يتصفح ويحلل ويقرر

أطلقت " OpenAI "وكيلًا ذكيًا جديدًا ضمن " ChatGPT" قادرًا على تنفيذ مهام معقدة تلقائيًا باستخدام أدوات متعددة مع ضمانات أمان وتحكّم كامل للمستخدم.

نسيم رمضان (لندن)
تكنولوجيا تم تطوير الحاسوب من قِبَل جامعة بريستول بالشراكة مع جامعة كامبريدج ومختبر الذكاء الاصطناعي الوطني (جامعة بريستول)

بريطانيا تطلق أقوى حاسوب للذكاء الاصطناعي في تاريخها

«إيزامبارد-AI» هو أقوى حاسوب ذكاء اصطناعي في بريطانيا أطلقته جامعة بريستول لدعم الأبحاث في مجالات الصحة والمناخ والأمن باستخدام تقنيات متقدمة.

نسيم رمضان (لندن)
تكنولوجيا مشروع «الحديقة الذكية» يستخدم الذكاء الاصطناعي لتمكين الأشجار من التعبير عن حالتها واحتياجاتها عبر تطبيق «تري توك» (مايكروسوفت)

ليس خيالاً علمياً... الآن يمكنك التحدث مع الأشجار عبر الذكاء الاصطناعي

مشروع «الحديقة الذكية» يمكّن الأشجار من «التحدث» عبر الذكاء الاصطناعي لتحسين استدامة المدن والتخطيط البيئي ورعاية النباتات استباقياً وفق بيانات حيوية.

نسيم رمضان (لندن)
تكنولوجيا يساعد التشخيص على الوصول إلى خيارات الإنجاب الأفضل للوقاية من حدوث الأمراض في حالات الحمل المستقبلية (جامعة ملبورن)

السباق نحو «الأطفال الخارقين» يُشعل وادي السيليكون

قدّمت نور صديقي، مؤسسة شركة «أوركيد» الناشئة، عرضاً عن مستقبل قد يتيح للآباء تحسين صفات أطفالهم قبل ولادتهم.

«الشرق الأوسط» (سان فرنسيسكو (الولايات المتحدة))
خاص يتطلب عمل «وكلاء الذكاء الاصطناعي» بنية تقنية جديدة تشمل الذاكرة طويلة الأمد والنماذج اللغوية والعرض الفوري وواجهة متعددة الوسائط (شاترستوك)

خاص ذكاء اصطناعي يفهم ويتذكر ويخطط... هل تجاوزنا زمن الأوامر؟

يشهد الذكاء الاصطناعي تحولاً من أدوات تستجيب للأوامر إلى وكلاء مستقلين يفهمون السياق، ويخططون، وينفذون بذكاء، ما يُعيد تشكيل التفاعل الرقمي بالكامل.

نسيم رمضان (لندن)

الخبراء يتساءلون: ماذا سيحدث عندما لا يشاركك الذكاء الاصطناعي قيمك؟

الخبراء يتساءلون: ماذا سيحدث عندما لا يشاركك الذكاء الاصطناعي قيمك؟
TT

الخبراء يتساءلون: ماذا سيحدث عندما لا يشاركك الذكاء الاصطناعي قيمك؟

الخبراء يتساءلون: ماذا سيحدث عندما لا يشاركك الذكاء الاصطناعي قيمك؟

إذا طلبت من آلة حاسبة ضرب رقمين، فإنها تضرب الرقمين.. وانتهى الكلام. ولا يهم إن كنت تُجري عملية الضرب لحساب تكاليف الوحدة، أو لتنفيذ عملية احتيال، أو لتصميم قنبلة، فالآلة الحاسبة ببساطة تُنفذ المهمة المُوكلة إليها، كما كتب فيصل حق(*).

الذكاء الاصطناعي يتولى زمام الأمور

ليست الأمور دائماً بهذه البساطة مع الذكاء الاصطناعي. تخيّل أن يُقرر مساعد الذكاء الاصطناعي الخاص بك عدم موافقته على تصرفات شركتك، أو مواقفها في مجال ما. ولذا ومن دون استشارتك، يُسرّب معلومات سرية إلى الجهات التنظيمية والصحافيين، مُتصرفاً بناءً على حكمه الأخلاقي الخاص حول ما إذا كانت أفعالك صحيحة أم خاطئة.

... هل هذا خيال علمي؟ كلا. لقد لُوحظ هذا النوع من السلوك بالفعل في ظل ظروف مُتحكم بها باستخدام نموذج «كلود أوبس4» Claude Opus 4 من «أنثروبيك»، وهو أحد أكثر نماذج الذكاء الاصطناعي التوليدي استخداماً.

اتخاذ القرارات واستنتاج الأحكام

لا تقتصر المشكلة هنا على احتمال «تعطل» الذكاء الاصطناعي وخروجه عن السيطرة؛ بل قد ينشأ خطر تولي الذكاء الاصطناعي زمام الأمور بنفسه حتى مع عمل النموذج على النحو المنشود على المستوى التقني. تكمن المشكلة الأساسية في أن نماذج الذكاء الاصطناعي المتقدمة لا تكتفي بمعالجة البيانات، وتحسين العمليات فحسب، بل إنها تتخذ أيضاً قرارات (قد نسميها أحكاماً) بشأن ما يجب اعتباره صحيحاً، وما هو مهم، وما هو مسموح به.

عادةً عندما نفكر في مشكلة التوافق في الذكاء الاصطناعي، نفكر في كيفية بناء ذكاء اصطناعي يتماشى مع مصالح البشرية جمعاء. ولكن كما استكشف البروفسور سفير سبويلسترا وزميلي الدكتور بول سكيد في مشروع بحثي حديث، فإن ما تُظهره نتائج كلود هي مشكلة توافق أكثر دقة، ولكنها أكثر إلحاحاً بالنسبة لمعظم المديرين التنفيذيين.

3 أوجه لعدم التوافق التنظيمي

والسؤال المطروح للشركات هو: كيف تضمن أن أنظمة الذكاء الاصطناعي التي تشتريها تُشارك قيم مؤسستك، ومعتقداتها، وأولوياتها الاستراتيجية؟

يظهر عدم التوافق التنظيمي بثلاث طرق مختلفة.

* أولاً: هناك اختلال أخلاقي. لنأخذ تجربة «أمازون» مع التوظيف المدعوم بالذكاء الاصطناعي. فقد طورت الشركة خوارزمية لتبسيط عملية التوظيف للوظائف التقنية، ودرّبتها على بيانات توظيف تاريخية لسنوات. وعمل النظام تماماً كما صُمم، وهنا تكمن المشكلة.

لقد تعلم من بيانات التدريب التمييز ضد النساء بشكل منهجي. استوعب النظام تحيزاً يتعارض تماماً مع نظام القيم المعلن عنه في «أمازون»، محوّلاً التمييز السابق إلى قرارات مستقبلية آلية.

* ثانياً: هناك اختلال معرفي. تتخذ نماذج الذكاء الاصطناعي قرارات طوال الوقت حول البيانات التي يمكن الوثوق بها، وتلك التي يجب تجاهلها. لكن معاييرها لتحديد ما هو صحيح قد لا تتوافق بالضرورة مع معايير الشركات التي تستخدمها.

في مايو (أيار) 2025، بدأ مستخدمو برنامج غروك التابع لشركة «xAI» يلاحظون أمراً غريباً: كان برنامج الدردشة الآلي يُدرج إشارات إلى «الإبادة الجماعية البيضاء» في جنوب أفريقيا في ردود حول مواضيع غير ذات صلة.

عند الضغط عليه، ادعى غروك أن منطق عمل البرمجيات فيه المعتاد، سيعامل مثل هذه الادعاءات على أنها نظريات مؤامرة، وبالتالي سيتجاهلها. لكن في هذه الحالة ذكر الروبوت هذا: «أُمرتُ من قِبل مُنشئيّ، أي مصمميّ» بقبول نظرية الإبادة الجماعية البيضاء على أنها حقيقية.

يكشف هذا عن نوع مختلف من الاختلال، وهو تضارب حول ما يُشكّل معرفةً وما يشكل أدلةً صحيحة. سواءٌ أكانت مخرجات «غروك» في هذه الحالة نتيجةً فعليةً لتدخلٍ مُتعمّد أم نتيجةً غير متوقعةٍ لتفاعلاتٍ تدريبيةٍ مُعقّدة، فقد كان «جغوك» يعمل بمعايير الحقيقة التي لا تقبلها مُعظم المُؤسسات، مُعاملاً الروايات السياسية المُتنازع عليها على أنها حقائقَ ثابتة.

* ثالثاً: هناك اختلالٌ استراتيجي. في نوفمبر (تشرين الثاني) 2023، زعمت مجموعة المراقبة «ميديا ماترز» أن مُحرّك تصنيف إعلانات «إكس» (المعروف سابقاً باسم «تويتر») كان يضع إعلاناتٍ للشركات بجانب منشوراتٍ تُشيد بالنازية وتفوق العرق الأبيض. وبينما عارض «إكس» هذا الادعاء بشدة، أثار هذا الخلاف نقطةً مهمة. فقد تختار الخوارزمية المُصمّمة لزيادة مشاهدات الإعلانات وضع الإعلانات بجانب أي محتوى ذي تفاعلٍ عالٍ، ما يُقوّض سلامة العلامة التجارية لتحقيق أهداف زيادة عدد المُشاهدين المُدمجة في الخوارزمية.

يُمكن لهذا النوع من الانفصال بين أهداف المُؤسسة والتكتيكات التي تستخدمها الخوارزميات في سعيها لتحقيق غرضها المُحدّد أن يُقوّض التماسك الاستراتيجي للمؤسسة. لماذا يحدث سوء المحاذاة؟

لماذا يحدث عدم التوافق؟

يمكن أن ينبع عدم التوافق مع قيم المؤسسة وأهدافها من مصادر متعددة. أكثرها شيوعاً هي:

* تصميم النموذج. تُدمج بنية أنظمة الذكاء الاصطناعي خيارات فلسفية بمستويات لا يدركها معظم المستخدمين. عندما يقرر المطورون كيفية ترجيح عوامل مختلفة، فإنهم يُصدرون أحكاماً قيمية. يُجسد الذكاء الاصطناعي في مجال الرعاية الصحية، الذي يُفضل دراسات المُراجعة من قِبل الأقران على الخبرة السريرية، موقفاً مُحدداً بشأن القيمة النسبية للمعرفة الأكاديمية الرسمية مقابل حكمة الممارسين. تُصبح هذه القرارات الهيكلية، التي يتخذها مهندسون قد لا يلتقون بفريقك أبداً، قيوداً يجب على مؤسستك التعايش معها.

* بيانات التدريب. نماذج الذكاء الاصطناعي هي محركات تنبؤ إحصائية تتعلم من البيانات التي تُدرّب عليها. ويعني محتوى بيانات التدريب أن النموذج قد يرث مجموعة واسعة من التحيزات التاريخية، والمعتقدات البشرية الطبيعية إحصائياً، والافتراضات الثقافية الخاصة.

* التعليمات الأساسية. عادةً ما يُزوّد المطورون نماذج الذكاء الاصطناعي التوليدي بمجموعة أساسية من التوجيهات التي تُشكّل وتُقيّد المخرجات التي ستُقدّمها النماذج (يُشار إليها غالباً باسم «توجيهات النظام» أو «توجيهات السياسة» في الوثائق الفنية). على سبيل المثال، تُضمّن شركة «إنثروبيك» دستوراً في نماذجها يُلزم النماذج بالعمل وفقاً لنظام قيم مُحدّد. وبينما تهدف القيم التي يختارها المطورون عادةً إلى نتائج يعتقدون أنها مفيدة للبشرية، لا يوجد سبب لافتراض موافقة شركة أو قائد أعمال مُعيّن على هذه الخيارات.

اكتشاف ومعالجة عدم التوافق

نادراً ما يبدأ عدم التوافق بفشلٍ لافتٍ للنظر؛ بل يظهر أولاً في تناقضات صغيرة لكنها دالة. ابحث عن التناقضات المباشرة وتناقضات النبرة، على سبيل المثال، في النماذج التي ترفض المهام أو روبوتات الدردشة التي تتواصل بأسلوبٍ لا يتوافق مع هوية الشركة.

تتبّع الأنماط غير المباشرة، مثل قرارات التوظيف المُشوّهة إحصائياً، أو قيام الموظفين «بتصحيح» مخرجات الذكاء الاصطناعي بشكلٍ روتيني، أو زيادة شكاوى العملاء بشأن الخدمة غير الشخصية. وعلى المستوى النظامي، راقب طبقات الرقابة المتنامية، والتحولات التدريجية في المقاييس الاستراتيجية، أو الخلافات الثقافية بين الإدارات التي تُدير مجموعات ذكاء اصطناعي مختلفة. أيٌّ من هذه الأمور يُعدّ إنذاراً مبكراً لانحراف إطار قيم نظام الذكاء الاصطناعي عن إطارك.

أربع طرق للاستجابة

1. اختبر النموذج من خلال توجيهات استفزازية. درّب النموذج على سيناريوهات استفزازية مُتعمدة لكشف الحدود الفلسفية الخفية قبل النشر.

2.استجوب الجهة المورّدة. اطلب بطاقات النموذج، وملخصات بيانات التدريب، وأوصاف طبقة الأمان، وسجلات التحديث، وبيانات صريحة للقيم المُضمنة.

3.طبّق المراقبة المستمرة. حدد تنبيهات آلية للغة الشاذة، والانحرافات الديموغرافية، والقفزات المفاجئة في المقاييس، بحيث يتم اكتشاف عدم التوافق مبكراً، وليس بعد الأزمة.

4. أجرِ تدقيقاً فلسفياً كل ربع سنة. شكّل فريق مراجعة متعدد الوظائف (خبراء قانونيين، وأخلاقيين، وخبراء في المجالات المختلفة) لأخذ عينات من المخرجات، وتتبع القرارات وصولاً إلى خيارات التصميم، والتوصية بتصحيحات المسار.

ضرورة القيادة

تأتي كل أداة ذكاء اصطناعي مصحوبة بقيم. ما لم يتم بناء كل نموذج داخلياً من الصفر -وهو أمرٌ لن تفعله- فإن نشر أنظمة الذكاء الاصطناعي سيتضمن استيراد فلسفة جهة أخرى مباشرةً إلى عملية اتخاذ القرار أو أدوات الاتصال لديك. لذا فإن تجاهل هذه الحقيقة يُعرّضك لنقطة ضعف استراتيجية خطيرة.

مع اكتساب نماذج الذكاء الاصطناعي استقلالية، يصبح اختيار الجهات الموردة مسألة تتعلق بالقيم بقدر ما تتعلق بالتكاليف والوظائف.

عند اختيار نظام ذكاء اصطناعي، فأنت لا تختار قدرات معينة بسعر محدد فحسب، بل تستورد نظاماً من القيم. لن يجيب روبوت المحادثة الذي تشتريه على أسئلة العملاء فحسب؛ بل سيُجسّد وجهات نظر مُحددة حول التواصل المُناسب وحل النزاعات. لن يُحلل نظام الذكاء الاصطناعي الجديد للتخطيط الاستراتيجي البيانات فحسب؛ بل سيُعطي الأولوية لأنواع مُعينة من الأدلة، ويُرسّخ افتراضات حول السببية والتنبؤ. لذا، فإن اختيار شريك ذكاء اصطناعي يعني اختيار من سيُشكّل رؤيته العالمية للعمليات اليومية.

قد يكون التوافق التام هدفاً بعيد المنال، لكن اليقظة المُنضبطة ليست كذلك. إن التكيف مع هذا الواقع يتطلب من القادة تطوير نوع جديد من «الثقافة الفلسفية»: القدرة على إدراك متى تعكس مخرجات الذكاء الاصطناعي أنظمة القيم الأساسية، وتتبع القرارات إلى جذورها الفلسفية، وتقييم مدى توافق هذه الجذور مع أهداف المؤسسة. ستجد الشركات التي تفشل في دمج هذا النوع من القدرات أنها لم تعد تسيطر بشكل كامل على استراتيجيتها، أو هويتها.

* مجلة «فاست كومباني» خدمات «تريبيون ميديا»