في جزء من الثانية... «هارت» يولد صوراً عالية الجودة عبر الذكاء الاصطناعي

بسرعة أكبر بتسع مرات من النماذج الحالية!

مزج الباحثون بين نماذج الذكاء الاصطناعي التوليدية لإنشاء أداة سريعة تنتج صوراً بدقة عالية (Christine Daniloff, MIT)
مزج الباحثون بين نماذج الذكاء الاصطناعي التوليدية لإنشاء أداة سريعة تنتج صوراً بدقة عالية (Christine Daniloff, MIT)
TT

في جزء من الثانية... «هارت» يولد صوراً عالية الجودة عبر الذكاء الاصطناعي

مزج الباحثون بين نماذج الذكاء الاصطناعي التوليدية لإنشاء أداة سريعة تنتج صوراً بدقة عالية (Christine Daniloff, MIT)
مزج الباحثون بين نماذج الذكاء الاصطناعي التوليدية لإنشاء أداة سريعة تنتج صوراً بدقة عالية (Christine Daniloff, MIT)

يُعدُّ توليد صور عالية الجودة بكفاءة تحدياً بالغ الأهمية، خصوصاً للتطبيقات، مثل تدريب السيارات ذاتية القيادة، أو تصميم بيئات ألعاب الفيديو، أو محاكاة سيناريوهات العالم الحقيقي. وفي حين حققت نماذج الذكاء الاصطناعي تقدماً كبيراً في توليد الصور، لا تزال الطرق الحالية تواجه مفاضلة بين السرعة والجودة.

نماذج الانتشار (Diffusion Models)، مثل تلك المستخدمة في «DALL-E» و«Stable Diffusion»، تنتج صوراً واقعية مذهلة، لكنها تتطلب قوة حاسوبية كبيرة ووقتاً طويلاً. من ناحية أخرى، النماذج الانحدارية الذاتية (Autoregressive Models) المشابهة لتلك المستخدمة في نماذج اللغة الكبيرة مثل «تشات جي بي تي» (ChatGPT) تولد الصور بسرعة، لكنها غالباً ما تعاني مع التفاصيل الدقيقة، ما يؤدي إلى نتائج مشوهة أو ضبابية. الآن، طور فريق من الباحثين من معهد «ماساتشوستس للتكنولوجيا» (MIT) وشركة «إنفيديا» (NVIDIA) حلّاً مبتكراً يُدعى «هارت» (HART) وهو نموذج ذكاء اصطناعي جديد يجمع بين مزايا الطريقتين لتقديم صور عالية الجودة بسرعات غير مسبوقة.

أفضل ما في الطريقتين

يعمل «HART» على مبدأ بسيط لكنه قوي. أولاً، يقوم النموذج برسم الخطوط العريضة للصورة بسرعة، ثم يقوم نموذج انتشار صغير بتنقيح التفاصيل، فماذا يعني ذلك؟

يوضح هاوتيان تانغ، طالب الدكتوراه في «MIT»، والمؤلف الرئيسي المشارك للبحث، الأمر بهذه العبارة: «تخيَّل الأمر مثل الرسم». ويتابع: «إذا غطّيت اللوحة كلها دفعة واحدة، فقد تبدو النتيجة خاماً. لكن إذا بدأت برسم عام، ثم نقحته بضربات فرشاة أصغر وأدق، تصبح الصورة النهائية أكثر إتقاناً».

تعمل نماذج الانتشار التقليدية عن طريق إزالة الضوضاء من الصورة خطوة بخطوة حتى تظهر صورة واضحة. وهذه العملية تضمن دقة عالية لكنها بطيئة وتستهلك موارد كبيرة. في المقابل، تولد نماذج «هارت» (HART) الصور بشكل تسلسلي، متنبئة بأجزاء صغيرة في كل مرة. وفي حين تكون أسرع، فإنها غالباً ما تفقد تفاصيل مهمة بسبب الضغط.

يملأ «HART» هذه الفجوة باستخدام نموذج انحدار ذاتي للتعامل مع الجزء الأكبر من توليد الصورة، ثم تطبيق نموذج انتشار خفيف فقط لتحسين التفاصيل المتبقية، أي تلك العناصر الدقيقة التي تجعل الصورة حية مثل ملمس الشعر، وبريق العين، أو الحواف الدقيقة للأجسام.

يتميز نموذج «HART» الجديد بقدرته على إنتاج صور بجودة تعادل أو تفوق أحدث نماذج الانتشار لكن بسرعة أعلى بتسع مرات (MIT)

السرعة دون التضحية بالجودة

من أكثر إنجازات «HART» إثارة للإعجاب هي كفاءته. وفي حين تتطلب نماذج الانتشار الحديثة مليارات المعلمات وعشرات الخطوات للتنقيح، يُحقق «هارت» نتائج مماثلة أو حتى أفضل بجزء بسيط من التكلفة الحاسوبية.

في الاختبارات، أنتج «HART» صوراً أسرع بتسع مرات من نماذج الانتشار الرائدة، مع الحفاظ على مستوى التفاصيل نفسه. والأكثر إثارة، أنه يفعل ذلك باستخدام طاقة حاسوبية أقل بنسبة 31 في المائة، ما يجعله قابلاً للتشغيل على أجهزة المستهلك العادية، مثل أجهزة اللابتوب أو الهواتف الذكية.

يقول تانغ: «نموذج الانتشار في (HART) لديه مهمة أبسط بكثير... فهو يحتاج فقط لتصحيح التفاصيل الدقيقة، وليس الصورة بأكملها، ما يجعل العملية أكثر كفاءة».

فتح آفاق جديدة

تمتد آثار «HART» إلى ما هو أبعد من مجرد توليد صور أسرع. تصميمه الهجين يجعله شديد التكيف للدمج مع أنظمة الذكاء الاصطناعي متعددة الوسائط، مثل نماذج الرؤية واللغة التي يُمكنها تفسير وتوليد النصوص والصور معاً.

تخيَّل أن تطلب من مساعد ذكي أن يرشدك خلال تجميع قطعة أثاث، مع عرض مرئي لكل خطوة في الوقت الفعلي، أو فكِّر في سيارات ذاتية القيادة يتم تدريبها في بيئات افتراضية فائقة الواقعية، تتعلم تجنب المخاطر غير المتوقعة، قبل أن تصل حتى إلى الطريق. سرعة ودقة «HART» مكَّنَتا من جعل هذه التطبيقات ليست ممكنة فحسب، بل عملية أيضاً.

في المستقبل، يُخطط الباحثون لتوسيع قدرات «HART»، لتشمل توليد الفيديو وتركيب الصوت، مستفيدين من تصميمه القابل للتوسع لمهام أكثر تعقيداً.

خطوة نحو ذكاء اصطناعي أذكى

يُمثل «HART» قفزة كبيرة إلى الأمام في مجال الذكاء الاصطناعي التوليدي، مبرهناً على أن السرعة والجودة يجب ألا يكونا متناقضين. من خلال الجمع الذكي بين نقاط قوة النماذج الانحدارية الذاتية ونماذج الانتشار، يفتح الباحثون أبواباً جديدة لتوليد الصور عالية الدقة في الوقت الفعلي، ما يقربنا من مستقبل يمكن فيه للذكاء الاصطناعي أن يدمج الإبداع والكفاءة بسلاسة.

هذا البحث، المدعوم من مختبر «MIT-IBM Watson» للذكاء الاصطناعي، ومركز «MIT» و«Amazon للعلوم»، ومؤسسة «العلوم الوطنية الأميركية»، سيُعرض في المؤتمر الدولي حول التمثيلات التعليمية. ومع مزيد من التطوير، قد يصبح «HART» قريباً حجر الزاوية في تطبيقات الذكاء الاصطناعي من الجيل التالي، ما يُعيد تشكيل طريقة تفاعلنا مع الذكاء الاصطناعي والاستفادة منه.


مقالات ذات صلة

جهاز يحصد الماء من الهواء دون كهرباء أو شبكة مياه!

تكنولوجيا أثبتت التجارب في «وادي الموت» أن الجهاز يمكنه إنتاج 160 مل من المياه يومياً حتى في رطوبة منخفضة تبلغ 21 في المائة (MIT)

جهاز يحصد الماء من الهواء دون كهرباء أو شبكة مياه!

ابتكر باحثو «MIT» جهازاً صغيراً يستخلص مياه شرب نقية من الهواء دون الحاجة للكهرباء ما يقدّم حلاً واعداً لأزمة المياه في البيئات الجافة.

نسيم رمضان (لندن)
تكنولوجيا مع انتشار السيارات ذاتية القيادة تبرز الحاجة إلى أنظمة قادرة على اتخاذ قرارات أخلاقية في مواقف مصيرية على الطريق (غيتي)

في القيادة الذاتية... من يتحمّل القرار الأخلاقي عند اللحظة الحاسمة؟

مع اقتراب انتشار السيارات الذاتية القيادة، تبرز تساؤلات أخلاقية حول قدرتها على اتخاذ قرارات مصيرية، ومن يتحمّل المسؤولية عند وقوع الحوادث.

نسيم رمضان (لندن)
تكنولوجيا استخدم المهاجمون قواعد بيانات سحابية غير مؤمنة لجمع بيانات حساسة ما يعكس ضعفاً في إعدادات الحماية لدى المستخدمين والمؤسسات

تسريب 16 مليار بيانات دخول في أكبر خرق أمني بالتاريخ

أكبر تسريب لبيانات الدخول في التاريخ يكشف عن 16 مليار سجل، دون أن يتضمن اختراقاً مباشراً لأي شركة كبرى، ما يسلط الضوء على خطورة ضعف الوعي الأمني لدى المستخدمين.

نسيم رمضان (لندن)
تكنولوجيا يتيح النظام للمستخدمين إنشاء مقاطع مدتها حتى 21 ثانية بخيارات حركة تلقائية أو مخصصة وبتكلفة منخفضة نسبياً (شاترستوك)

«ميدجورني» تدخل عالم الفيديو... صور متحركة يولّدها الذكاء الاصطناعي

أطلقت «ميدجورني» نموذجها الأول للفيديو «V1» الذي يتيح تحريك الصور باستخدام الذكاء الاصطناعي بسهولة وتكلفة منخفضة وسط إشادة المستخدمين ومخاوف قانونية.

نسيم رمضان (لندن)
تكنولوجيا «غارتنر»: نجاح تطبيق الذكاء الاصطناعي في اتخاذ القرار يعتمد على وجود حوكمة قوية وبُنية بيانات متماسكة (غيتي)

«غارتنر»: الذكاء الاصطناعي سيتخذ نصف قرارات الأعمال بحلول 2027

بحلول 2027، سيتولى الذكاء الاصطناعي نصف قرارات الأعمال، ما يعني أن نجاح المؤسسات سيتوقف على الحوكمة وجودة البيانات ووعي القادة بقدرات التقنية وحدودها.

نسيم رمضان (لندن)

جهاز يحصد الماء من الهواء دون كهرباء أو شبكة مياه!

أثبتت التجارب في «وادي الموت» أن الجهاز يمكنه إنتاج 160 مل من المياه يومياً حتى في رطوبة منخفضة تبلغ 21 في المائة (MIT)
أثبتت التجارب في «وادي الموت» أن الجهاز يمكنه إنتاج 160 مل من المياه يومياً حتى في رطوبة منخفضة تبلغ 21 في المائة (MIT)
TT

جهاز يحصد الماء من الهواء دون كهرباء أو شبكة مياه!

أثبتت التجارب في «وادي الموت» أن الجهاز يمكنه إنتاج 160 مل من المياه يومياً حتى في رطوبة منخفضة تبلغ 21 في المائة (MIT)
أثبتت التجارب في «وادي الموت» أن الجهاز يمكنه إنتاج 160 مل من المياه يومياً حتى في رطوبة منخفضة تبلغ 21 في المائة (MIT)

تخيّل أن تتمكّن من الحصول على مياه شرب نقية من الهواء دون كهرباء أو شبكة مياه. هذا ما تمكن مهندسو معهد «ماساتشوستس للتكنولوجيا» (MIT) من تحقيقه عبر لوح أسود بحجم نافذة يُمكنه استخلاص الماء من الجو، حتى في أكثر البيئات جفافاً. هذا الجهاز الجديد، الذي يُعرف باسم «حاصد المياه من الهواء»، يعتمد على تقنية هلامية لامتصاص بخار الماء من الهواء وتحويله إلى ماء صالح للشرب.

أهمية الابتكار

أزمة المياه تُهدد العالم، حيث تشير إحصاءات أن أكثر من 2.2 مليار شخص يفتقرون إلى مياه شرب آمنة، ونحو 46 مليون أميركي يعانون من ضعف التزويد أو رداءة الجودة. الحلول التقليدية القائمة على الأنهار والخزانات أصبحت تحت ضغط هائل. وهنا يأتي الابتكار الجديد ليستغل مخزوناً غير مرئي لكنه هائل. إنه بخار الماء الموجود في الهواء.

تصميم بسيط وفعّال

يتكوّن الجهاز من لوح عمودي بحجم نافذة، مصنوع من مادة هلامية سوداء تُشبه الفقاعات البلاستيكية، ومثبت داخل حجرة زجاجية باردة. خلال الليل، يمتص الهلام الرطوبة من الهواء ويتضخم، ثم تؤدي حرارة الشمس خلال النهار إلى تبخير هذه الرطوبة، فيتكثف البخار على الزجاج ويُجمع كماء نقي. التصميم مستوحى من فنّ الأوريغامي لتوسيع السطح المُعرّض للهواء وزيادة الفاعلية.

يعتمد الجهاز على مادة هلامية تمتص الرطوبة ليلاً وتطلقها نهاراً لتتكثف وتتحوّل إلى مياه نقية داخل حجرة زجاجية (MIT)

تشغيل دون طاقة

على عكس العديد من الابتكارات السابقة، لا يحتاج هذا الجهاز إلى كهرباء أو خلايا شمسية أو بطاريات. وقد تم اختباره ميدانياً لمدة أسبوع في «وادي الموت» بكاليفورنيا وهو أحد أكثر الأماكن جفافاً في أميركا. تمكّن الابتكار من إنتاج ما يصل إلى 160 مل من المياه يومياً حتى عند انخفاض الرطوبة إلى 21 في المائة، وهي كمية تقترب من كوب ماء يومياً، يمكن مضاعفتها باستخدام عدة ألواح.

مياه آمنة بدون تعقيدات

الميزة الأهم هي أن الماء الناتج آمن تماماً للشرب. الأجهزة السابقة اعتمدت على أملاح مثل كلوريد الليثيوم لتحسين الامتصاص، لكنها تسببت في تلوث الماء. استخدم الفريق في جامعة «MIT» مادة الغلسرين وأزال المسام النانوية من الهلام، مما سمح بجمع مياه نظيفة دون الحاجة إلى فلاتر إضافية.

ابتكر هذا الفريق جهازاً بحجم نافذة قادراً على استخلاص مياه الشرب من الهواء دون استخدام الكهرباء أو الطاقة الشمسية (MIT)

قابلية التوسّع والتطبيق

رغم أن كل لوح ينتج كمية محدودة، فإن تركيب عدة وحدات معاً يُمكن أن يلبي احتياجات منزل كامل في البيئات الصحراوية. يتميز الجهاز بحجمه الصغير وتكلفة تصنيعه المنخفضة نسبياً. وقد تم نشر البحث في مجلة «نايتشور ووتر» (Nature Water) ما يُبرز أهميته العلمية والتطبيقية. وقد قاد المشروع البروفسور شوانهي تشاو، أستاذ الهندسة الميكانيكية والمدنية في «MIT»، وشارك فيه باحثون من المعهد ومن جامعة سنغافورة الوطنية (NUS). وقد أشرف الباحث تشانغ ليو وفريقه على التجارب الميدانية وتصميم المواد الفعّالة.

ما الخطوة التالية؟

رغم النتائج المبشرة، لا يزال الابتكار في مراحله الأولية. يعمل الفريق حالياً على توسيع حجم الألواح، وتحسين المواد المستخدمة، وإجراء تجارب ميدانية في مناطق تعاني من ندرة المياه. الهدف هو تطوير نظام مرن ومتنقل يمكن نشره في المناطق المعزولة أو في حالات الطوارئ.

يعكس هذا الابتكار من «MIT » مستقبلاً جديداً لإمكانية الوصول إلى المياه، قائماً على العلم البسيط والتصميم الذكي. في عالم يُهدده تغيّر المناخ وشح الموارد، قد يكون مثل هذا الجهاز البسيط هو المفتاح لحلّ أزمة المياه العالمية.