في جزء من الثانية... «هارت» يولد صوراً عالية الجودة عبر الذكاء الاصطناعي

بسرعة أكبر بتسع مرات من النماذج الحالية!

مزج الباحثون بين نماذج الذكاء الاصطناعي التوليدية لإنشاء أداة سريعة تنتج صوراً بدقة عالية (Christine Daniloff, MIT)
مزج الباحثون بين نماذج الذكاء الاصطناعي التوليدية لإنشاء أداة سريعة تنتج صوراً بدقة عالية (Christine Daniloff, MIT)
TT
20

في جزء من الثانية... «هارت» يولد صوراً عالية الجودة عبر الذكاء الاصطناعي

مزج الباحثون بين نماذج الذكاء الاصطناعي التوليدية لإنشاء أداة سريعة تنتج صوراً بدقة عالية (Christine Daniloff, MIT)
مزج الباحثون بين نماذج الذكاء الاصطناعي التوليدية لإنشاء أداة سريعة تنتج صوراً بدقة عالية (Christine Daniloff, MIT)

يُعدُّ توليد صور عالية الجودة بكفاءة تحدياً بالغ الأهمية، خصوصاً للتطبيقات، مثل تدريب السيارات ذاتية القيادة، أو تصميم بيئات ألعاب الفيديو، أو محاكاة سيناريوهات العالم الحقيقي. وفي حين حققت نماذج الذكاء الاصطناعي تقدماً كبيراً في توليد الصور، لا تزال الطرق الحالية تواجه مفاضلة بين السرعة والجودة.

نماذج الانتشار (Diffusion Models)، مثل تلك المستخدمة في «DALL-E» و«Stable Diffusion»، تنتج صوراً واقعية مذهلة، لكنها تتطلب قوة حاسوبية كبيرة ووقتاً طويلاً. من ناحية أخرى، النماذج الانحدارية الذاتية (Autoregressive Models) المشابهة لتلك المستخدمة في نماذج اللغة الكبيرة مثل «تشات جي بي تي» (ChatGPT) تولد الصور بسرعة، لكنها غالباً ما تعاني مع التفاصيل الدقيقة، ما يؤدي إلى نتائج مشوهة أو ضبابية. الآن، طور فريق من الباحثين من معهد «ماساتشوستس للتكنولوجيا» (MIT) وشركة «إنفيديا» (NVIDIA) حلّاً مبتكراً يُدعى «هارت» (HART) وهو نموذج ذكاء اصطناعي جديد يجمع بين مزايا الطريقتين لتقديم صور عالية الجودة بسرعات غير مسبوقة.

أفضل ما في الطريقتين

يعمل «HART» على مبدأ بسيط لكنه قوي. أولاً، يقوم النموذج برسم الخطوط العريضة للصورة بسرعة، ثم يقوم نموذج انتشار صغير بتنقيح التفاصيل، فماذا يعني ذلك؟

يوضح هاوتيان تانغ، طالب الدكتوراه في «MIT»، والمؤلف الرئيسي المشارك للبحث، الأمر بهذه العبارة: «تخيَّل الأمر مثل الرسم». ويتابع: «إذا غطّيت اللوحة كلها دفعة واحدة، فقد تبدو النتيجة خاماً. لكن إذا بدأت برسم عام، ثم نقحته بضربات فرشاة أصغر وأدق، تصبح الصورة النهائية أكثر إتقاناً».

تعمل نماذج الانتشار التقليدية عن طريق إزالة الضوضاء من الصورة خطوة بخطوة حتى تظهر صورة واضحة. وهذه العملية تضمن دقة عالية لكنها بطيئة وتستهلك موارد كبيرة. في المقابل، تولد نماذج «هارت» (HART) الصور بشكل تسلسلي، متنبئة بأجزاء صغيرة في كل مرة. وفي حين تكون أسرع، فإنها غالباً ما تفقد تفاصيل مهمة بسبب الضغط.

يملأ «HART» هذه الفجوة باستخدام نموذج انحدار ذاتي للتعامل مع الجزء الأكبر من توليد الصورة، ثم تطبيق نموذج انتشار خفيف فقط لتحسين التفاصيل المتبقية، أي تلك العناصر الدقيقة التي تجعل الصورة حية مثل ملمس الشعر، وبريق العين، أو الحواف الدقيقة للأجسام.

يتميز نموذج «HART» الجديد بقدرته على إنتاج صور بجودة تعادل أو تفوق أحدث نماذج الانتشار لكن بسرعة أعلى بتسع مرات (MIT)
يتميز نموذج «HART» الجديد بقدرته على إنتاج صور بجودة تعادل أو تفوق أحدث نماذج الانتشار لكن بسرعة أعلى بتسع مرات (MIT)

السرعة دون التضحية بالجودة

من أكثر إنجازات «HART» إثارة للإعجاب هي كفاءته. وفي حين تتطلب نماذج الانتشار الحديثة مليارات المعلمات وعشرات الخطوات للتنقيح، يُحقق «هارت» نتائج مماثلة أو حتى أفضل بجزء بسيط من التكلفة الحاسوبية.

في الاختبارات، أنتج «HART» صوراً أسرع بتسع مرات من نماذج الانتشار الرائدة، مع الحفاظ على مستوى التفاصيل نفسه. والأكثر إثارة، أنه يفعل ذلك باستخدام طاقة حاسوبية أقل بنسبة 31 في المائة، ما يجعله قابلاً للتشغيل على أجهزة المستهلك العادية، مثل أجهزة اللابتوب أو الهواتف الذكية.

يقول تانغ: «نموذج الانتشار في (HART) لديه مهمة أبسط بكثير... فهو يحتاج فقط لتصحيح التفاصيل الدقيقة، وليس الصورة بأكملها، ما يجعل العملية أكثر كفاءة».

فتح آفاق جديدة

تمتد آثار «HART» إلى ما هو أبعد من مجرد توليد صور أسرع. تصميمه الهجين يجعله شديد التكيف للدمج مع أنظمة الذكاء الاصطناعي متعددة الوسائط، مثل نماذج الرؤية واللغة التي يُمكنها تفسير وتوليد النصوص والصور معاً.

تخيَّل أن تطلب من مساعد ذكي أن يرشدك خلال تجميع قطعة أثاث، مع عرض مرئي لكل خطوة في الوقت الفعلي، أو فكِّر في سيارات ذاتية القيادة يتم تدريبها في بيئات افتراضية فائقة الواقعية، تتعلم تجنب المخاطر غير المتوقعة، قبل أن تصل حتى إلى الطريق. سرعة ودقة «HART» مكَّنَتا من جعل هذه التطبيقات ليست ممكنة فحسب، بل عملية أيضاً.

في المستقبل، يُخطط الباحثون لتوسيع قدرات «HART»، لتشمل توليد الفيديو وتركيب الصوت، مستفيدين من تصميمه القابل للتوسع لمهام أكثر تعقيداً.

خطوة نحو ذكاء اصطناعي أذكى

يُمثل «HART» قفزة كبيرة إلى الأمام في مجال الذكاء الاصطناعي التوليدي، مبرهناً على أن السرعة والجودة يجب ألا يكونا متناقضين. من خلال الجمع الذكي بين نقاط قوة النماذج الانحدارية الذاتية ونماذج الانتشار، يفتح الباحثون أبواباً جديدة لتوليد الصور عالية الدقة في الوقت الفعلي، ما يقربنا من مستقبل يمكن فيه للذكاء الاصطناعي أن يدمج الإبداع والكفاءة بسلاسة.

هذا البحث، المدعوم من مختبر «MIT-IBM Watson» للذكاء الاصطناعي، ومركز «MIT» و«Amazon للعلوم»، ومؤسسة «العلوم الوطنية الأميركية»، سيُعرض في المؤتمر الدولي حول التمثيلات التعليمية. ومع مزيد من التطوير، قد يصبح «HART» قريباً حجر الزاوية في تطبيقات الذكاء الاصطناعي من الجيل التالي، ما يُعيد تشكيل طريقة تفاعلنا مع الذكاء الاصطناعي والاستفادة منه.


مقالات ذات صلة

طرق لمساعدة ابنك المراهق على الابتعاد عن الشاشات

يوميات الشرق وسائل التواصل الاجتماعي تُهدد الصحة النفسية للمراهقين (رويترز)

طرق لمساعدة ابنك المراهق على الابتعاد عن الشاشات

ذكر موقع «سايكولوجي توداي» أن هناك عدة طرق، لمساعدة ابنك المراهق على الابتعاد عن الشاشات والأجهزة الذكية.

«الشرق الأوسط» (لندن)
خاص تحول «يوتيوب» من منصة ترفيهية إلى مساحة للتعليم والتغيير الاجتماعي والتمكين الاقتصادي ما جعله جزءاً حيوياً من المشهد الرقمي العربي

خاص «يوتيوب» في عيده العشرين... ثورة ثقافية واقتصادية غيرت المحتوى الرقمي

«يوتيوب» يحتفل بمرور 20 عاماً على انطلاقه، مؤكداً دوره المحوري في تمكين صناع المحتوى، خصوصاً في السعودية عبر أدوات، ودعم وفرص دخل متنامية.

نسيم رمضان (سان فرانسيسكو - الولايات المتحدة)
تكنولوجيا خطوات بسيطة مثل منح العمال الإذن باستخدام الذكاء الاصطناعي قد تساعد في مضاعفة اعتماد التكنولوجيا الجديدة (رويترز)

«غوغل»: يمكن للعمال توفير 122 ساعة سنوياً عبر استخدام الذكاء الاصطناعي في المهام الإدارية

أظهرت برامج تجريبية أن العمال يمكنهم توفير أكثر من 120 ساعة سنوياً باستخدام الذكاء الاصطناعي في المهام الإدارية.

«الشرق الأوسط» (واشنطن - لندن)
تكنولوجيا أظهرت الدراسة أن البشر يتفقون بدرجة عالية على تقييم مشاهد التفاعل الاجتماعي في حين فشل أكثر من 350 نموذجاً للذكاء الاصطناعي في محاكاتهم

جامعة «جونز هوبكنز»: نماذج الذكاء الاصطناعي تفشل في فهم التفاعلات البشرية

الدراسة تكشف أن الذكاء الاصطناعي لا يزال عاجزاً عن فهم التفاعلات الاجتماعية ويحتاج لإعادة تصميم ليحاكي التفكير البشري.

نسيم رمضان (لندن)
يوميات الشرق الروبوت يستطيع القفز لمسافة تصل إلى 10 أقدام بلا أرجل (جامعة جورجيا)

روبوت لعمليات الإنقاذ يقفز 10 أقدام بلا أرجل

طوّر باحثون في جامعة جورجيا الأميركية روبوتاً قادراً على القفز لمسافة تصل إلى 10 أقدام من دون الحاجة إلى أرجل... إليكم التفاصيل.

«الشرق الأوسط» (القاهرة )

«غوغل»: يمكن للعمال توفير 122 ساعة سنوياً عبر استخدام الذكاء الاصطناعي في المهام الإدارية

خطوات بسيطة مثل منح العمال الإذن باستخدام الذكاء الاصطناعي قد تساعد في مضاعفة اعتماد التكنولوجيا الجديدة (رويترز)
خطوات بسيطة مثل منح العمال الإذن باستخدام الذكاء الاصطناعي قد تساعد في مضاعفة اعتماد التكنولوجيا الجديدة (رويترز)
TT
20

«غوغل»: يمكن للعمال توفير 122 ساعة سنوياً عبر استخدام الذكاء الاصطناعي في المهام الإدارية

خطوات بسيطة مثل منح العمال الإذن باستخدام الذكاء الاصطناعي قد تساعد في مضاعفة اعتماد التكنولوجيا الجديدة (رويترز)
خطوات بسيطة مثل منح العمال الإذن باستخدام الذكاء الاصطناعي قد تساعد في مضاعفة اعتماد التكنولوجيا الجديدة (رويترز)

كشفت شركة «غوغل» أن بريطانيا قد تجني 400 مليار جنيه إسترليني (533 مليار دولار) من النمو الاقتصادي القائم على الذكاء الاصطناعي إذا درّبت قوتها العاملة، وذلك بعد أن أظهرت برامج تجريبية في البلاد أن العمال يمكنهم توفير أكثر من 120 ساعة سنوياً باستخدام الذكاء الاصطناعي في المهام الإدارية.

وأضافت «غوغل» في تقرير عن برامجها التجريبية نُشر يوم الجمعة أن خطوات بسيطة، مثل منح العمال الإذن باستخدام الذكاء الاصطناعي وبضع ساعات من التدريب لبدء العمل، يمكن أن تساعد في مضاعفة اعتماد التكنولوجيا الجديدة، وبالتالي تعزيز النمو الاقتصادي، بحسب شبكة «سي إن إن».

وقالت شركة التكنولوجيا الأميركية العملاقة، التي طورت روبوت المحادثة Gemini AI، إنه وفقاً لتحليل أجرته شركة Public First، فإن ثلثي العمال - وخاصة النساء الأكبر سناً من خلفيات اجتماعية واقتصادية أدنى - لم يستخدموا الذكاء الاصطناعي التوليدي في العمل مطلقاً.

صرحت ديبي وينشتاين، رئيسة «غوغل» لأوروبا والشرق الأوسط وأفريقيا، بأن التجارب لبرنامج AI Works - التي أُجريت بالتعاون مع شبكة شركات صغيرة وهيئات تعليمية - أظهرت أن بإمكان الموظفين توفير 122 ساعة عمل سنوياً في المتوسط ​​باستخدام الذكاء الاصطناعي في المهام الإدارية.

لكن أحد العوائق التي حالت دون خوض البعض غمار التجربة هو القلق من أن استخدام الذكاء الاصطناعي في وظائفهم غير مشروع أو عادل.

وقالت وينشتاين في مقابلة: «أراد الناس الحصول على إذن بالتوجيه. هل من المقبول أن أفعل هذا؟ لذا كان من المهم جداً طمأنتهم».

وأفادت بأنه بعد بضع ساعات من التدريب على الذكاء الاصطناعي لتعزيز الثقة، تضاعف استخدام العمال للتقنية، واستمر استخدامهم لها لعدة أشهر.

وأوضحت «غوغل» في تقريرها أن هذه التدخلات البسيطة ساعدت في تضييق فجوة تبني الذكاء الاصطناعي بين المشاركين في الدراسات التجريبية.

قبل التدريب، على سبيل المثال، استخدمت 17 في المائة فقط من النساء فوق سن 55 عاماً في مجموعات الدراسة الذكاء الاصطناعي أسبوعياً، و9 في المائة فقط يومياً.

بعد ثلاثة أشهر، أصبحت 56 في المائة منهن يستخدمنه أسبوعياً، واعتمدته 29 في المائة منهن يومياً.