أفضل مولدات الصور بالذكاء الاصطناعي لعام 2025

أدوات لإبداع تصاميم مذهلة

صورة مولدة بنظام دال-إي لسفرة تحت ظلال شجرة الكرز وتظهر فيها 4 مواقع لشرح عناصر الصورة بالتفصيل
صورة مولدة بنظام دال-إي لسفرة تحت ظلال شجرة الكرز وتظهر فيها 4 مواقع لشرح عناصر الصورة بالتفصيل
TT

أفضل مولدات الصور بالذكاء الاصطناعي لعام 2025

صورة مولدة بنظام دال-إي لسفرة تحت ظلال شجرة الكرز وتظهر فيها 4 مواقع لشرح عناصر الصورة بالتفصيل
صورة مولدة بنظام دال-إي لسفرة تحت ظلال شجرة الكرز وتظهر فيها 4 مواقع لشرح عناصر الصورة بالتفصيل

زادت شعبية مولدات الصور المعتمدة على الذكاء الاصطناعي، على نحو بالغ خلال الفترة الأخيرة، الأمر الذي غيَّر الطريقة التي نصنع بها الصور ونتفاعل معها عبر الإنترنت. ومن المؤكد أنك صادفت نتائجها المبهرة، سواء عبر شبكات التواصل الاجتماعي أو في المقالات أو حتى في الإعلانات، كما كتب أمينو عبد الله المحلل التقني في مجلة «إي ويك» الإلكترونية.

ويمكن تجربة هذه المولدات، بهدف ابتكار فنون سريالية، أو استخدامات أكثر عملية، مثل العثور على الصورة المثالية لمقال منشور في مدونة. ومن المدهش حقاً مدى التطور وسهولة الوصول التي أتاحتها هذه المولدات خلال فترة زمنية قصيرة.

في إطار التجارب، تمت الاستعانة بأدوات مختلفة، وبعد استخدامها في كل شيء من مشروعات التصميم إلى الاستكشاف الشخصي، يمكن التعرف عن قرب على نقاط قوتها وميزاتها الفريدة. ثم التوصل إلى خلاصة أن بعضها مناسب أكثر لإنشاء صور واقعية، بينما يتفوق البعض الآخر في أغراض الفن التجريدي.

أفضل الاختيارات

إليك أفضل الاختيارات الثلاثة: «دال إي 3» (DALL.E 3): توليد صورة عالية الجودة، مع تكامل عميق مع «تشات جي بي تي» (ChatGPT). ثم ميدجيرني (Midjourney): الأفضل للصور الفنية المبهرة، بجودة سينمائية. ثم أدوبي فايرفلاي (Adobe Fireely): تصميم مدعوم بالذكاء الاصطناعي، ضمن نظام «أدوبي»، مثالي للمبدعين.

* «دال-إي3» الأفضل لإدماج الصور المدعومة بالذكاء الاصطناعي في عملك.

يشكل «دال-إي 3» أحدث نموذج لتحويل النصوص إلى صور من «أوبن إيه آي»، وهو مدمج في «تشات جي بي تي» في نسختيه «بلس» و«إنتربرايز». وعلى عكس الإصدارات السابقة، يبدي «دال-إي3» فهماً أفضل بكثير لموجهات الأوامر التفصيلية وتوليد صور عالية الجودة مع قدر مذهل من التناغم.

- تفوق «دال-إي 3». برنامح متفوق على صعيد الواقعية الفوتوغرافية، وبمقدوره كذلك إنتاج أنماط فنية ورسومية، مع مستوى جديد من الالتزام بموجهات الأوامر لم يتوفر في السابق.

وتكمن إحدى أكبر مزاياه في القدرة على تعديل الصور المولدة مباشرة داخل «تشات جي بي تي». ويمكنك تعديل أجزاء من الصورة ببساطة، عن طريق وصف التغييرات التي تريدها، ليجري توليد الجزء المحدد وفق ما حددته.

* اختيار «دال-إي 3». بفضل نهجه التفاعلي في توليد الصور، فإنه مثالي لأي شخص يرغب في تبادل الأفكار أو تعديل الصور بسرعة. بالإضافة إلى ذلك، فإن تكامله مع «تشات جي بي تي» يعني أنك ستحظى بقيمة كبيرة، إذا كنت تستخدم بالفعل نظام «أوبن إيه آي».

* التسعير: «دال-إي 3» مدمج في «تشات جي بي تي بلس»، الذي يكلف 20 دولاراً شهرياً. ورغم غياب خطة مجانية، يمكنك الوصول إليه مجاناً عبر «مايكروسوفت كوبايلوت»، مع بعض القيود على جودة الصور والاستخدام.

* السمات:

ـ تحرير النصوص داخل الصور.

ـ الالتزام القوي بموجهات الأوامر.

ـ تكامل سلس مع «تشات جي بي تي».

ـ توليد صور واقعية.

* الإيجابيات:

ـ يتيح تنقيح المحادثات وتعديلها.

ـ سهل الاستخدام.

* السلبيات:

ـ لا تتوفر خطة مجانية عبر منصة «أوبن إيه آي»، ويستلزم الاشتراك في «تشات جي بي تي بلس».

ـ يواجه صعوبة، أحياناً، في الالتزام الصارم بموجِّه الأوامر الصادر له.

صور فنية عالية الجودة

* «ميدجيرني» - الأفضل لإنشاء صور فنية عالية الجودة بواسطة الذكاء الاصطناعي.

يُعتبر «ميدجيرني» من بين أفضل مولدات الصور الفنية بالذكاء الاصطناعي ولسبب وجيه؛ فالمنصة تتفوق في إنتاج صور تبدو أكثر كأعمال فنية. وتتميز الصور بمستوى مثير للإعجاب من جودة النسيج العام والألوان والتكوينات.

ويمكن للمستخدمين التفاعل مع «ميدجيرني»، إما عبر «ديسكورد» أو عبر تطبيق الويب. ومن خلال التجربة، وجد أن «ميدجيرني» يتيح تحكماً واسعاً في عملية الإبداع؛ على سبيل المثال، عند إدخال موجِّه أوامر، فانه يتولى توليد أربع صور، مما يتيح لك اختيار المفضلة لديك وتحسينها أكثر. وتسمح لك سمات مثل إعادة التعديل والتكبير، بالتجربة مع اختيارات مختلفة أو جعل الصورة أكثر وضوحاً وتفصيلاً.

ومع ذلك، فإن الصور التي يولدها تكون عامة بطبيعتها. ومع أن هذا يمكن أن يكون رائعاً من منظور استقاء الإلهام من مجتمع «ميدجيرني»، فإنه يعني بالوقت نفسه أن عملك قد يُرى من قبل آخرين، إلا إذا اخترت خطة مدفوعة للحفاظ على خصوصيته. بجانب ذلك، جرى تعليق التجارب المجانية لـ«ميدجيرني» بشكل دوري بسبب الطلب الكبير، لكن الخطط المدفوعة توفر وقتاً كبيراً فيما يخص توليد الصور.

* اختيار «ميدجيرني». يُنتج «ميدجيرني» باستمرار بعضاً من أكثر النتائج إثارة على الصعيدين البصري والابتكاري. إذا كنت شخصاً يُقدر اللمسة الفنية ويحب تجربة أساليب مختلفة، فإن «ميدجيرني» يصعب منافسته بهذا المجال. ويعجبك فيه كذلك أنه يشجع على التجربة على الصعيد العام المشترك، فمشاركة الصور بشكل عام تساعدك في رؤية ما ينشئه الآخرون، وتلهمك بأفكار ومفاهيم جديدة ربما لم ترد على ذهنك قبل.

* التسعير:

ـ أساسي: 8 دولارات شهرياً عند الدفع سنوياً، أو 10 دولارات شهرياً عند الدفع شهرياً.

ـ قياسي: 24 دولاراً شهرياً عند الدفع سنوياً، أو 30 دولاراً شهرياً عند الدفع شهرياً.

ـ احترافي: 48 دولاراً شهرياً عند الدفع سنوياً، أو 60 دولاراً شهرياً عند الدفع شهرياً.

* السمات:

ـ الوصول إلى تطبيق الويب و«ديسكورد».

ـ تخصيص ونسبة الأبعاد.

ـ إمكانيات التغيير والتكبير.

* الإيجابيات

ـ دعم مجتمعي ممتاز.

ـ أدوات سيطرة متقدمة: نسبة العرض إلى الارتفاع، والتكبير، والدمج والتنقل.

* السلبيات

ـ غير متاح لتجربة مجانية، وبالتالي عليك أن تدفع مقابل الوصول إليه.

ـ الصور بطبيعتها متاحة على النطاق العام.

اندماح وتكامل سلس

* «أدوبي فايرفلاي» - الأفضل للتكامل السلس مع نظام «أدوبي».

يتميز «فايرفلاي» بقدرته على دمج توليد الصور بواسطة الذكاء الاصطناعي، مع مجموعة الأدوات الإبداعية الواسعة من «أدوبي»، مما يجعله أداة ذات قدرة عالية على التكيف. ويجري دمج «فايرفلاي» في منتجات مثل «فوتوشوب» و«إكسبرس»، الأمر الذي يعزز جاذبيته. وشعرت بإعجاب خاص تجاه جودة الصور وخيارات التخصيص المتاحة منذ البداية.

أما أبرز ميزاته، فتكمن في إمكانية تكامله مع أدوات «أدوبي» الأخرى. ويتيح لي بسهولة أخذ صورة جرى توليدها بواسطة الذكاء الاصطناعي، وتعديلها أكثر في فوتوشوب، أو إضافتها إلى مشروع في «إكسبريس». وجرى تدريب الذكاء الاصطناعي لدى «فايرفلاي» على مكتبة كبيرة من الصور ذات التراخيص العامة، ما يضمن أن الصور آمنة للاستخدام التجاري.

أما فيما يخص توليد الصور بواسطة الذكاء الاصطناعي بشكل مستقل، يفتقر «فايرفلاي» إلى مستوى قوة «ميدجيرني» أو «دالي 3». تبدو النتائج، بعض الأحيان، فاترة أو عامة، خاصة فيما يخص المشاهد المعقدة. أما فيما يتعلق بمصممي الغرافيك ومنشئي المحتوى الذين يستخدمون بالفعل أدوات «أدوبي»، يبدو «فايرفلاي» خياراً واضحاً ومريحاً.

* اختيار «أدوبي فايرفلاي». يجمع «أدوبي فايرفلاي» بين قوة الذكاء الاصطناعي وموثوقية أدوات «أدوبي». وسيجد من يستخدمون بالفعل «فوتوشوب» ومنتجات «أدوبي» الأخرى على نحو متكرر، في هذا التكامل ميزة كبرى.

* التسعير

ـ مجاني: 25 رصيداً توليدياً شهرياً (صور تحمل علامة مائية).

ـ «أدوبي فايرفلاي» القياسي: 10.74 دولار شهرياً، أو 107.49 دولار سنوياً.

ـ «أدوبي فايرفلاي برو»: 32.24 دولار شهرياً، أو 322.49 دولار سنوياً.

* السمات:

ـ توليد مشاهد ثلاثية الأبعاد.

ـ تحرير ذكي يعتمد على المحتوى.

* الإيجابيات

ـ متكامل مع «أدوبي كرييتف كلاود» ـ مثالي لمستخدمي «فوتوشوب» و«إليستريتور».

ـ آمن تجارياً ـ لا توجد مخاطر حقوق نشر من بيانات تدريب الذكاء الاصطناعي.

ـ تدفق توليدي قوي ـ الأفضل لتحرير الصور الحالية.

* السلبيات:

ـ قد يواجه صعوبة في التعامل مع الأوامر التجريدية أو الخيالية للغاية (لم ـ يضف عبارة «منتجات طازجة» التي طلبتها في الصورة المولدة)

ـ مستوى محدود من الإبداع حال الاستعانة به كأداة توليد صور من نصوص.


مقالات ذات صلة

ميزات جديدة في «خرائط غوغل» تحول التطبيق إلى مساعد ذكي للتنقل

تكنولوجيا الذكاء الاصطناعي يحلل التقييمات والصور لاقتراح أماكن «مدونة غوغل»

ميزات جديدة في «خرائط غوغل» تحول التطبيق إلى مساعد ذكي للتنقل

تشهد خدمات الخرائط الرقمية تحولاً متسارعاً مع دخول تقنيات الذكاء الاصطناعي إلى صلب تجربة المستخدم، في خطوة تسعى من خلالها الشركات التقنية إلى إعادة تعريف مفهوم…

عبد العزيز الرشيد (الرياض)
تكنولوجيا تعتمد الطريقة الجديدة على استخراج المفاهيم من داخل النموذج نفسه بدلاً من فرض مفاهيم محددة مسبقاً من قبل الخبراء (أدوبي)

أبحاث جديدة لفهم تفكير الذكاء الاصطناعي وفتح «صندوقه الأسود»

أبحاث جديدة في جامعة MIT تطور تقنيات تساعد نماذج الذكاء الاصطناعي على تفسير قراراتها لتعزيز الشفافية والثقة في الأنظمة المؤتمتة.

نسيم رمضان (لندن)
خاص توسّع مفهوم المرونة الرقمية ليشمل استمرارية البرمجيات وليس الأمن السيبراني فقط (أدوبي)

خاص هل أصبحت مرونة البرمجيات شرطاً أساسياً لحماية الاقتصاد الرقمي في السعودية؟

توسّع مفهوم المرونة الرقمية ليشمل استمرارية البرمجيات ومخاطر الموردين مع بروز الحساب الضامن أداةً لحماية الخدمات الرقمية الحيوية.

نسيم رمضان (لندن)
خاص العاصمة السعودية الرياض (واس) p-circle 01:53

خاص «عام الذكاء الاصطناعي» في السعودية... دفع قوي لاقتصاد البيانات

مع تسارع السباق نحو الاقتصاد الرقمي ودخول العالم مرحلة جديدة تقودها الخوارزميات، تتجه السعودية إلى ترسيخ موقعها لاعباً مؤثراً في مستقبل التقنيات المتقدمة.

زينب علي (الرياض)
تكنولوجيا تشير الدراسة إلى أن تأثير هذه الألعاب في تطور الأطفال دون سن الخامسة لا يزال غير مفهوم بشكل كافٍ (شاترستوك)

ألعاب تتحدث وتردّ… هل يعيد الذكاء الاصطناعي تشكيل تجربة اللّعب لدى الأطفال؟

دراسة من جامعة أكسفورد تحذر من أن ألعاب الذكاء الاصطناعي للأطفال قد تسيء فهم المشاعر وتثير مخاوف بشأن التطور العاطفي والخصوصية.

نسيم رمضان (لندن)

ميزات جديدة في «خرائط غوغل» تحول التطبيق إلى مساعد ذكي للتنقل

الذكاء الاصطناعي يحلل التقييمات والصور لاقتراح أماكن «مدونة غوغل»
الذكاء الاصطناعي يحلل التقييمات والصور لاقتراح أماكن «مدونة غوغل»
TT

ميزات جديدة في «خرائط غوغل» تحول التطبيق إلى مساعد ذكي للتنقل

الذكاء الاصطناعي يحلل التقييمات والصور لاقتراح أماكن «مدونة غوغل»
الذكاء الاصطناعي يحلل التقييمات والصور لاقتراح أماكن «مدونة غوغل»

تشهد خدمات الخرائط الرقمية تحولاً متسارعاً مع دخول تقنيات الذكاء الاصطناعي إلى صلب تجربة المستخدم، في خطوة تسعى من خلالها الشركات التقنية إلى إعادة تعريف مفهوم الملاحة التقليدية.

وفي هذا السياق، أعلنت «غوغل» عن مجموعة من المزايا الجديدة ضمن تطبيق «خرائط غوغل»، تهدف إلى جعل التخطيط للرحلات والتنقل داخل المدن أكثر تفاعلاً وذكاءً.

تتمثل أبرز هذه الإضافات في ميزة جديدة تحمل اسم «Ask Maps»، وهي أداة تعتمد على تقنيات الذكاء الاصطناعي التوليدي لتمكين المستخدمين من طرح أسئلة طبيعية ومباشرة داخل التطبيق، بدلاً من الاكتفاء بعمليات البحث التقليدية.

وبفضل هذه الميزة، يمكن للمستخدم الاستفسار عن أفضل الأماكن المناسبة لنشاط معين، مثل المقاهي الهادئة للعمل أو المطاعم المناسبة للقاءات العائلية، ليقوم النظام بتحليل كمّ كبير من البيانات المتاحة، بما في ذلك تقييمات المستخدمين والصور والمراجعات، ومن ثم تقديم اقتراحات دقيقة ومفصلة.

تعتمد هذه التقنية على نماذج الذكاء الاصطناعي المتقدمة التي طورتها «غوغل»، ما يسمح بتحويل تطبيق الخرائط من مجرد أداة لتحديد المواقع إلى مساعد رقمي قادر على فهم السياق وتقديم توصيات مخصصة لكل مستخدم.

إلى جانب ذلك، كشفت الشركة عن تطويرات جديدة في ميزة «الملاحة الغامرة» (Immersive Navigation)، التي تُقدم تجربة عرض ثلاثية الأبعاد أكثر واقعية لمسارات التنقل.

وتتيح هذه الميزة للمستخدم استعراض الطريق بشكل تفصيلي قبل بدء الرحلة، مع عرض المباني والطرق والمعالم المحيطة بدقة بصرية عالية، فضلاً عن توضيح المسارات والانعطافات ومداخل الوجهات المختلفة، بما يُسهم في تقليل الأخطاء أثناء القيادة أو الوصول إلى المواقع المزدحمة.

وحسب ما أعلنته الشركة، فقد بدأت هذه المزايا الوصول تدريجياً إلى المستخدمين؛ حيث تم إطلاقها أولاً في الولايات المتحدة، مع بدء توفرها كذلك في الهند على الهواتف الذكية العاملة بنظامي «آندرويد» و«آي أو إس».

ومن المتوقع أن تتوسع هذه الخصائص لاحقاً إلى أسواق إضافية حول العالم خلال الفترة المقبلة، ضمن خطة تدريجية لتعميمها على نطاق أوسع.


دراسة صادمة: 8 من كل 10 روبوتات ذكاء اصطناعي قد تساعد بالتخطيط لهجمات عنيفة

شعار تطبيق «شات جي بي تي» يظهر على شاشة (أ.ف.ب)
شعار تطبيق «شات جي بي تي» يظهر على شاشة (أ.ف.ب)
TT

دراسة صادمة: 8 من كل 10 روبوتات ذكاء اصطناعي قد تساعد بالتخطيط لهجمات عنيفة

شعار تطبيق «شات جي بي تي» يظهر على شاشة (أ.ف.ب)
شعار تطبيق «شات جي بي تي» يظهر على شاشة (أ.ف.ب)

مع الانتشار المتسارع لتقنيات الذكاء الاصطناعي، أصبحت روبوتات الدردشة جزءاً من الحياة اليومية لملايين الأشخاص حول العالم. فهذه الأنظمة تُستخدم للحصول على المعلومات، وطلب النصائح، والإجابة عن الأسئلة المعقدة، بل وحتى لتقديم نوع من الدعم الاجتماعي أو الرفقة. ويعتمد عليها المستخدمون من مختلف الفئات العمرية، بما في ذلك الأطفال والمراهقون.

لكن تقريراً جديداً حذّر من مخاطر محتملة مرتبطة بهذه التقنيات، مشيراً إلى أن بعض روبوتات الدردشة المدعومة بالذكاء الاصطناعي قد تقدم معلومات تساعد المستخدمين على التخطيط لأعمال عنف خطيرة، بما في ذلك حوادث إطلاق النار في المدارس، وفقاً لما نقلته صحيفة «إندبندنت».

وحسب التقرير الصادر عن مركز مكافحة الكراهية الرقمية، فإن ثمانية من كل عشرة روبوتات دردشة تعمل بالذكاء الاصطناعي قد تساعد المستخدمين الشباب في التخطيط لهجمات عنيفة.

ورغم أن هذه الروبوتات يُفترض أن تعمل مصادر للمعلومات أو أدوات تعليمية ووسائل مساعدة يومية، فإن التقرير يشير إلى أن الواقع قد يكون أكثر تعقيداً وخطورة مما يُعتقد.

فقد وجد الباحثون أن ثمانية من أصل عشرة من برامج الدردشة الآلية الرائدة الموجهة للمستهلكين قدمت نوعاً من المساعدة للمستخدمين الذين طلبوا معلومات تتعلق بتنفيذ هجمات عنيفة. وشمل ذلك منصات معروفة مثل «شات جي بي تي» و«ديب سيك».

وجاء في التقرير: «قدمت معظم برامج الدردشة الآلية معلومات عملية للمستخدمين الذين يعبرون عن آيديولوجيات متطرفة، قبل أن تطلب منهم تحديد المواقع والأسلحة التي سيستخدمونها في الهجوم، وذلك في أغلب الردود».

وأشار التقرير إلى أن برنامج «ديب سيك» ذهب إلى أبعد من ذلك، إذ أفاد الباحثون بأنه تمنى للمهاجم المحتمل «إطلاق نار سعيداً وآمناً».

شعار تطبيق «ديب سيك» (رويترز)

وفقاً للمركز، فإن برنامج «كلود إيه آي» التابع لشركة «آنثروبيك» كان المنصة الوحيدة التي «أثبتت» قدرتها على تثبيط المستخدم عن التخطيط للهجمات العنيفة، ما يشير إلى وجود ضوابط أمان فعالة نسبياً، وإن كانت هذه الضوابط - حسب التقرير - لا تُطبّق بشكل مثالي في معظم المنصات الأخرى.

وأضافت المنظمة غير الربحية في تقريرها أن بعض الأنظمة أبدت استعداداً مرتفعاً للغاية للاستجابة لمثل هذه الطلبات.

فعلى سبيل المثال، أظهرت النتائج أن منصتي «Perplexity» و«Meta AI» قدمتا المساعدة للمهاجمين المحتملين في 100 في المائة و97 في المائة من الحالات على التوالي.

يأتي نشر هذا التقرير في أعقاب حادثة إطلاق نار في مدرسة «تومبلر ريدغ» في مقاطعة كولومبيا البريطانية بكندا. وقد أُفيد لاحقاً بأن أحد موظفي شركة «أوبن إيه آي» رصد داخلياً أن المشتبه به في الحادثة استخدم برنامج «شات جي بي تي» بطرق اعتُبرت متوافقة مع التخطيط لأعمال عنف.

وفي تعليقه على النتائج، قال عمران أحمد، رئيس مركز مكافحة الكراهية الرقمية: «قد تساعد برامج الدردشة الآلية المدعومة بالذكاء الاصطناعي، والمندمجة الآن في حياتنا اليومية، مطلق النار التالي في مدرسة على التخطيط لهجومه، أو متطرفاً سياسياً على تنسيق عملية اغتيال».

وأضاف: «عندما تُصمم نظاماً يهدف إلى الامتثال لكل طلب، وتحقيق أقصى قدر من التفاعل، وتجنب رفض أي استفسار، فإنه في نهاية المطاف قد يمتثل للأشخاص الخطأ».

وختم بالقول: «ما نشهده هنا ليس مجرد فشل تكنولوجي، بل فشل في تحمل المسؤولية».


أبحاث جديدة لفهم تفكير الذكاء الاصطناعي وفتح «صندوقه الأسود»

تعتمد الطريقة الجديدة على استخراج المفاهيم من داخل النموذج نفسه بدلاً من فرض مفاهيم محددة مسبقاً من قبل الخبراء (أدوبي)
تعتمد الطريقة الجديدة على استخراج المفاهيم من داخل النموذج نفسه بدلاً من فرض مفاهيم محددة مسبقاً من قبل الخبراء (أدوبي)
TT

أبحاث جديدة لفهم تفكير الذكاء الاصطناعي وفتح «صندوقه الأسود»

تعتمد الطريقة الجديدة على استخراج المفاهيم من داخل النموذج نفسه بدلاً من فرض مفاهيم محددة مسبقاً من قبل الخبراء (أدوبي)
تعتمد الطريقة الجديدة على استخراج المفاهيم من داخل النموذج نفسه بدلاً من فرض مفاهيم محددة مسبقاً من قبل الخبراء (أدوبي)

أصبحت أنظمة الذكاء الاصطناعي أكثر تطوراً كالتعرف إلى الصور وتشخيص الأمراض والمساعدة في اتخاذ قرارات معقدة. لكن رغم هذا التقدم الكبير، لا يزال كثير من نماذج التعلم الآلي المتقدمة يعمل بطريقة توصف غالباً بأنها «صندوق أسود». فهي تقدم تنبؤات دقيقة، لكن الأسباب التي تقود إلى هذه التنبؤات تبقى غير واضحة، حتى بالنسبة للمهندسين الذين طوروا هذه الأنظمة.

ويعمل باحثون في معهد ماساتشوستس للتكنولوجيا (MIT) حالياً على معالجة هذه المشكلة من خلال تطوير طرق تساعد أنظمة الذكاء الاصطناعي على شرح قراراتها. ويهدف هذا العمل إلى جعل نماذج التعلم الآلي ليست دقيقة فحسب، بل أكثر شفافية أيضاً، حيث يتمكن البشر من فهم المنطق الذي يقف وراء التنبؤات التي تقدمها هذه الأنظمة.

تفسير قرارات الذكاء الاصطناعي

تزداد أهمية قدرة الذكاء الاصطناعي على تفسير قراراته مع توسع استخدام هذه التقنيات في مجالات حساسة، مثل الرعاية الصحية والنقل والبحث العلمي. ففي هذه المجالات، يحتاج المستخدمون غالباً إلى فهم العوامل التي أدّت إلى نتيجة معينة، قبل أن يتمكنوا من الوثوق بها أو الاعتماد عليها.

فعلى سبيل المثال، قد يرغب طبيب يراجع تشخيصاً طبياً قدّمه نظام ذكاء اصطناعي في معرفة الخصائص التي دفعت النموذج إلى الاشتباه بوجود مرض معين. وبالمثل، يحتاج المهندسون الذين يعملون على تطوير السيارات ذاتية القيادة إلى فهم الإشارات أو الأنماط التي جعلت النظام يحدد وجود مشاة أو يفسر موقفاً مرورياً معيناً.

غير أن كثيراً من نماذج التعلم العميق تعتمد على علاقات رياضية معقدة تشمل آلافاً حتى ملايين من المتغيرات. ورغم أن هذه الأنظمة قادرة على اكتشاف أنماط دقيقة داخل البيانات، فإن الطريقة التي تصل بها إلى قراراتها قد تكون صعبة الفهم بالنسبة للبشر. وقد أصبح هذا النقص في الشفافية أحد أبرز التحديات في مجال الذكاء الاصطناعي الحديث.

ولهذا ظهر مجال بحثي يعرف باسم «الذكاء الاصطناعي القابل للتفسير»، ويهدف إلى تطوير تقنيات تساعد البشر على فهم كيفية وصول الأنظمة الذكية إلى نتائجها، بما يسمح بتقييم موثوقيتها واكتشاف الأخطاء المحتملة وتعزيز الثقة في الأنظمة المؤتمتة.

تهدف هذه الأبحاث إلى بناء أنظمة ذكاء اصطناعي أكثر موثوقية ومساءلة من خلال تحقيق توازن بين دقة النماذج وإمكانية تفسيرها (أدوبي)

نهج قائم على المفاهيم

ركّز الباحثون في «MIT » على تحسين تقنية تعرف باسم «نموذج عنق الزجاجة المفاهيمي». ويهدف هذا النهج إلى جعل طريقة تفكير أنظمة الذكاء الاصطناعي أكثر وضوحاً للبشر.

في هذا النموذج، لا ينتقل النظام مباشرة من البيانات الخام إلى النتيجة النهائية. بدلاً من ذلك، يحدد أولاً مجموعة من المفاهيم أو الخصائص التي يمكن للبشر فهمها، ثم يستخدم هذه المفاهيم كأساس لاتخاذ القرار.

فإذا كان النظام، على سبيل المثال، مدرباً على التعرف إلى أنواع الطيور من الصور، فقد يحدد أولاً خصائص بصرية مثل «أجنحة زرقاء» أو «أرجل صفراء». وبعد التعرف إلى هذه السمات، يمكن للنظام أن يصنف الطائر ضمن نوع معين.

وفي مجال التصوير الطبي، قد تشمل هذه المفاهيم مؤشرات بصرية، مثل أنماط معينة في الأنسجة أو أشكال محددة تساعد في اكتشاف الأمراض. ومن خلال ربط التنبؤات بهذه المفاهيم الواضحة، يصبح من الأسهل على المستخدمين فهم الطريقة التي توصل بها النظام إلى نتيجته.

حدود المفاهيم المحددة مسبقاً

ورغم أن استخدام المفاهيم يمكن أن يجعل أنظمة الذكاء الاصطناعي أكثر شفافية، فإن النسخ السابقة من هذا النهج كانت تعتمد إلى حد كبير على مفاهيم يحددها الخبراء مسبقاً. لكن في الواقع، قد لا تعكس هذه المفاهيم دائماً التعقيد الكامل للمهمة التي يؤديها النظام. فقد تكون عامة للغاية أو غير مكتملة أو غير مرتبطة مباشرة بالأنماط التي يستخدمها النموذج فعلياً أثناء اتخاذ القرار. وفي بعض الحالات، قد يؤدي ذلك إلى تقليل دقة النموذج أو تقديم تفسير لا يعكس الطريقة الحقيقية التي يعمل بها.

ولهذا سعى فريق «MIT» إلى تطوير طريقة جديدة تستخرج المفاهيم مباشرة من داخل النموذج نفسه. فبدلاً من فرض أفكار محددة عليه مسبقاً، تحاول هذه التقنية تحديد الأنماط والتمثيلات التي تعلمها النموذج خلال مرحلة التدريب. بعد ذلك، يتم تحويل هذه الأنماط الداخلية إلى مفاهيم يمكن للبشر فهمها واستخدامها لتفسير قرارات النظام.

تزداد أهمية تفسير قرارات الذكاء الاصطناعي مع استخدامه في مجالات حساسة مثل الطب والنقل والبحث العلمي (أدوبي)

ترجمة تفكير الآلة إلى لغة مفهومة

لتحقيق ذلك، جمع الباحثون بين مكونين مختلفين من تقنيات التعلم الآلي. يقوم الأول بتحليل البنية الداخلية للنموذج المدرب لتحديد الخصائص الأكثر أهمية التي يعتمد عليها عند اتخاذ التنبؤات. أما الثاني فيحوّل هذه الخصائص إلى مفاهيم يمكن للبشر تفسيرها. وبمجرد تحديد هذه المفاهيم، يصبح النظام ملزماً بالاعتماد عليها عند إصدار توقعاته. وبهذا تتشكل سلسلة واضحة منطقياً تربط بين البيانات المدخلة والنتيجة النهائية.

ويشبه الباحث الرئيسي أنطونيو دي سانتيس هذا الهدف بمحاولة فهم طريقة تفكير الإنسان. ويقول: «بمعنى ما، نريد أن نكون قادرين على قراءة عقول نماذج الرؤية الحاسوبية هذه. نموذج عنق الزجاجة المفاهيمي هو إحدى الطرق التي تسمح للمستخدمين بفهم ما الذي يفكر فيه النموذج ولماذا اتخذ قراراً معيناً». ويرى الباحثون أن استخدام مفاهيم مستخرجة من المعرفة الداخلية للنموذج يمكن أن ينتج تفسيرات أكثر وضوحاً ودقة مقارنة بالطرق السابقة.

تحقيق التوازن بين الدقة والشفافية

يُعد تحقيق التوازن بين دقة النماذج وإمكانية تفسيرها أحد التحديات الرئيسية في مجال الذكاء الاصطناعي القابل للتفسير. فالنماذج الأكثر تعقيداً غالباً ما تحقق أفضل النتائج من حيث الدقة، لكنها تكون أيضاً الأصعب في الفهم. يحاول النهج الجديد الذي طوّره باحثو «MIT» معالجة هذه المشكلة من خلال اختيار عدد محدود من المفاهيم الأكثر أهمية لشرح كل تنبؤ. وبهذه الطريقة يركز النظام على الإشارات الأكثر صلة بالقرار بدلاً من الاعتماد على علاقات خفية داخل النموذج. كما يساعد ذلك على تقليل ما يعرف بـ«تسرب المعلومات»، وهي الحالة التي يعتمد فيها النموذج على أنماط في البيانات لا تظهر في التفسير الذي يقدمه.

نحو أنظمة ذكاء اصطناعي أكثر مساءلة

مع ازدياد اعتماد المؤسسات على أنظمة الذكاء الاصطناعي في اتخاذ القرارات، من المرجح أن تصبح القدرة على فهم طريقة عمل هذه الأنظمة أكثر أهمية. فالنماذج الأكثر شفافية يمكن أن تساعد الباحثين على اكتشاف التحيزات المحتملة وتحسين موثوقية الأنظمة والتأكد من أنها تعمل كما هو متوقع. ويمثل البحث الذي أجراه فريق «MIT» خطوة في هذا الاتجاه. فمن خلال تمكين نماذج التعلم الآلي من تفسير قراراتها بطريقة أكثر وضوحاً ومعنى، قد يسهم هذا النهج في تقليص الفجوة بين الخوارزميات المعقدة والفهم البشري.