في جزء من الثانية... «هارت» يولد صوراً عالية الجودة عبر الذكاء الاصطناعي

بسرعة أكبر بتسع مرات من النماذج الحالية!

مزج الباحثون بين نماذج الذكاء الاصطناعي التوليدية لإنشاء أداة سريعة تنتج صوراً بدقة عالية (Christine Daniloff, MIT)
مزج الباحثون بين نماذج الذكاء الاصطناعي التوليدية لإنشاء أداة سريعة تنتج صوراً بدقة عالية (Christine Daniloff, MIT)
TT

في جزء من الثانية... «هارت» يولد صوراً عالية الجودة عبر الذكاء الاصطناعي

مزج الباحثون بين نماذج الذكاء الاصطناعي التوليدية لإنشاء أداة سريعة تنتج صوراً بدقة عالية (Christine Daniloff, MIT)
مزج الباحثون بين نماذج الذكاء الاصطناعي التوليدية لإنشاء أداة سريعة تنتج صوراً بدقة عالية (Christine Daniloff, MIT)

يُعدُّ توليد صور عالية الجودة بكفاءة تحدياً بالغ الأهمية، خصوصاً للتطبيقات، مثل تدريب السيارات ذاتية القيادة، أو تصميم بيئات ألعاب الفيديو، أو محاكاة سيناريوهات العالم الحقيقي. وفي حين حققت نماذج الذكاء الاصطناعي تقدماً كبيراً في توليد الصور، لا تزال الطرق الحالية تواجه مفاضلة بين السرعة والجودة.

نماذج الانتشار (Diffusion Models)، مثل تلك المستخدمة في «DALL-E» و«Stable Diffusion»، تنتج صوراً واقعية مذهلة، لكنها تتطلب قوة حاسوبية كبيرة ووقتاً طويلاً. من ناحية أخرى، النماذج الانحدارية الذاتية (Autoregressive Models) المشابهة لتلك المستخدمة في نماذج اللغة الكبيرة مثل «تشات جي بي تي» (ChatGPT) تولد الصور بسرعة، لكنها غالباً ما تعاني مع التفاصيل الدقيقة، ما يؤدي إلى نتائج مشوهة أو ضبابية. الآن، طور فريق من الباحثين من معهد «ماساتشوستس للتكنولوجيا» (MIT) وشركة «إنفيديا» (NVIDIA) حلّاً مبتكراً يُدعى «هارت» (HART) وهو نموذج ذكاء اصطناعي جديد يجمع بين مزايا الطريقتين لتقديم صور عالية الجودة بسرعات غير مسبوقة.

أفضل ما في الطريقتين

يعمل «HART» على مبدأ بسيط لكنه قوي. أولاً، يقوم النموذج برسم الخطوط العريضة للصورة بسرعة، ثم يقوم نموذج انتشار صغير بتنقيح التفاصيل، فماذا يعني ذلك؟

يوضح هاوتيان تانغ، طالب الدكتوراه في «MIT»، والمؤلف الرئيسي المشارك للبحث، الأمر بهذه العبارة: «تخيَّل الأمر مثل الرسم». ويتابع: «إذا غطّيت اللوحة كلها دفعة واحدة، فقد تبدو النتيجة خاماً. لكن إذا بدأت برسم عام، ثم نقحته بضربات فرشاة أصغر وأدق، تصبح الصورة النهائية أكثر إتقاناً».

تعمل نماذج الانتشار التقليدية عن طريق إزالة الضوضاء من الصورة خطوة بخطوة حتى تظهر صورة واضحة. وهذه العملية تضمن دقة عالية لكنها بطيئة وتستهلك موارد كبيرة. في المقابل، تولد نماذج «هارت» (HART) الصور بشكل تسلسلي، متنبئة بأجزاء صغيرة في كل مرة. وفي حين تكون أسرع، فإنها غالباً ما تفقد تفاصيل مهمة بسبب الضغط.

يملأ «HART» هذه الفجوة باستخدام نموذج انحدار ذاتي للتعامل مع الجزء الأكبر من توليد الصورة، ثم تطبيق نموذج انتشار خفيف فقط لتحسين التفاصيل المتبقية، أي تلك العناصر الدقيقة التي تجعل الصورة حية مثل ملمس الشعر، وبريق العين، أو الحواف الدقيقة للأجسام.

يتميز نموذج «HART» الجديد بقدرته على إنتاج صور بجودة تعادل أو تفوق أحدث نماذج الانتشار لكن بسرعة أعلى بتسع مرات (MIT)

السرعة دون التضحية بالجودة

من أكثر إنجازات «HART» إثارة للإعجاب هي كفاءته. وفي حين تتطلب نماذج الانتشار الحديثة مليارات المعلمات وعشرات الخطوات للتنقيح، يُحقق «هارت» نتائج مماثلة أو حتى أفضل بجزء بسيط من التكلفة الحاسوبية.

في الاختبارات، أنتج «HART» صوراً أسرع بتسع مرات من نماذج الانتشار الرائدة، مع الحفاظ على مستوى التفاصيل نفسه. والأكثر إثارة، أنه يفعل ذلك باستخدام طاقة حاسوبية أقل بنسبة 31 في المائة، ما يجعله قابلاً للتشغيل على أجهزة المستهلك العادية، مثل أجهزة اللابتوب أو الهواتف الذكية.

يقول تانغ: «نموذج الانتشار في (HART) لديه مهمة أبسط بكثير... فهو يحتاج فقط لتصحيح التفاصيل الدقيقة، وليس الصورة بأكملها، ما يجعل العملية أكثر كفاءة».

فتح آفاق جديدة

تمتد آثار «HART» إلى ما هو أبعد من مجرد توليد صور أسرع. تصميمه الهجين يجعله شديد التكيف للدمج مع أنظمة الذكاء الاصطناعي متعددة الوسائط، مثل نماذج الرؤية واللغة التي يُمكنها تفسير وتوليد النصوص والصور معاً.

تخيَّل أن تطلب من مساعد ذكي أن يرشدك خلال تجميع قطعة أثاث، مع عرض مرئي لكل خطوة في الوقت الفعلي، أو فكِّر في سيارات ذاتية القيادة يتم تدريبها في بيئات افتراضية فائقة الواقعية، تتعلم تجنب المخاطر غير المتوقعة، قبل أن تصل حتى إلى الطريق. سرعة ودقة «HART» مكَّنَتا من جعل هذه التطبيقات ليست ممكنة فحسب، بل عملية أيضاً.

في المستقبل، يُخطط الباحثون لتوسيع قدرات «HART»، لتشمل توليد الفيديو وتركيب الصوت، مستفيدين من تصميمه القابل للتوسع لمهام أكثر تعقيداً.

خطوة نحو ذكاء اصطناعي أذكى

يُمثل «HART» قفزة كبيرة إلى الأمام في مجال الذكاء الاصطناعي التوليدي، مبرهناً على أن السرعة والجودة يجب ألا يكونا متناقضين. من خلال الجمع الذكي بين نقاط قوة النماذج الانحدارية الذاتية ونماذج الانتشار، يفتح الباحثون أبواباً جديدة لتوليد الصور عالية الدقة في الوقت الفعلي، ما يقربنا من مستقبل يمكن فيه للذكاء الاصطناعي أن يدمج الإبداع والكفاءة بسلاسة.

هذا البحث، المدعوم من مختبر «MIT-IBM Watson» للذكاء الاصطناعي، ومركز «MIT» و«Amazon للعلوم»، ومؤسسة «العلوم الوطنية الأميركية»، سيُعرض في المؤتمر الدولي حول التمثيلات التعليمية. ومع مزيد من التطوير، قد يصبح «HART» قريباً حجر الزاوية في تطبيقات الذكاء الاصطناعي من الجيل التالي، ما يُعيد تشكيل طريقة تفاعلنا مع الذكاء الاصطناعي والاستفادة منه.


مقالات ذات صلة

الهند وماليزيا تتعهّدان التعاون في مجال الرقائق الإلكترونية

الاقتصاد رئيس الوزراء الهندي ناريندرا مودي يصافح نظيره الماليزي أنور إبراهيم خلال مؤتمر صحافي في ماليزيا 8 فبراير 2026 (رويترز)

الهند وماليزيا تتعهّدان التعاون في مجال الرقائق الإلكترونية

جدَّد رئيس الوزراء الهندي ناريندرا ​مودي، ونظيره الماليزي أنور إبراهيم، الأحد، تعهداتهما بتعزيز التجارة واستكشاف أوجه التعاون المحتملة في مجالات أشباه الموصلات.

«الشرق الأوسط» (كوالالمبور)
تكنولوجيا شعار منصة تداول العملات المشفرة الكورية الجنوبية «بيثامب» (رويترز)

بالخطأ... منصة في كوريا الجنوبية توزع «بتكوين» بقيمة 44 مليار دولار

كشفت منصة تداول العملات المشفرة الكورية الجنوبية «بيثامب»، اليوم السبت، عن أنها وزعت عملات بتكوين بقيمة تتجاوز 40 مليار دولار.

«الشرق الأوسط» (سيول)
الاقتصاد قطعة نقدية من فئة 2 يورو إلى جانب ورقة نقدية من فئة 10 جنيهات إسترلينية في صورة توضيحية (رويترز)

«المركزي الأوروبي»: تأخير «اليورو الرقمي» يعزز هيمنة شركات التكنولوجيا الأجنبية

دعا البنك المركزي الأوروبي، الاتحادَ الأوروبي، إلى تسريع اعتماد «اليورو الرقمي»، محذراً من أن أي تأخير قد يعمّق اعتماد القارة على شركات التكنولوجيا الأجنبية.

«الشرق الأوسط» (فرانكفورت)
الاقتصاد متداول يعمل في بورصة نيويورك (أ.ب)

تدفقات قوية نحو صناديق الأسهم العالمية بقيادة أوروبا وآسيا

شهدت صناديق الأسهم العالمية تدفقات قوية بقيادة أوروبا وآسيا، في مؤشر على توجه المستثمرين نحو التنويع وتقليل الانكشاف على أسهم التكنولوجيا الأميركية المتقلبة.

«الشرق الأوسط» (لندن )
الاقتصاد تمثيلات للعملة الرقمية «بتكوين» في هذا الرسم التوضيحي (رويترز)

بعد ملامسة الـ60 ألف دولار... البتكوين ترتد من أدنى مستوى في 16 شهراً

ارتفع سعر البتكوين، يوم الجمعة، بعد وصوله إلى أدنى مستوى له في 16 شهراً عند 60 ألف دولار، مع ظهور بوادر تراجع الضغوط العالمية على أسهم شركات التكنولوجيا.

«الشرق الأوسط» (سنغافورة )

ساعة ذكية «صحية» جديدة

ساعة ذكية «صحية» جديدة
TT

ساعة ذكية «صحية» جديدة

ساعة ذكية «صحية» جديدة

أعلنت «لينك2كير»؛ المنصة التكنولوجية في مجال الأجهزة القابلة للارتداء المعنية بالرعاية الصحية الوقائية، حديثاً عن إطلاق ساعتها الذكية «ووتش2كير فايتال» في الولايات المتحدة، خلال معرض الإلكترونيات الاستهلاكية في لاس فيغاس.

ساعة «صحية»

وروجت المنصة لساعة «ووتش2كير فايتال (Watch2Care Vital Smartwatch)»، بوصفها أول ساعة ذكية تجمع بين 3 آلاف عام من الطب الصيني التقليدي، وبيانات صحية واقعية تخص أكثر من 9 ملايين حالة، علاوة على أنظمة ذكاء اصطناعي متطورة. صحيح أنها تتعقب خطواتك؛ الأمر الذي اعتاده كثيرون منا (وأنا منهم)، إلا إنها تقدم أكثر من ذلك بكثير...

* مبادئ الطب الصيني. تحتوي الساعة الذكية مستشعرات متطورة تلتقط وتحلل «البيانات الحيوية الغربية»، وكذلك بيانات نبضات القلب، وفق «مبادئ الطب الصيني التقليدي»، وذلك في الوقت الفعلي.

باختصار؛ تشكل هذه الساعة جهازاً متطوراً لتتبع الصحة يُرتدى على المعصم. وأوضح أحد ممثلي «لينك2كير» أن الساعة الجديدة تتبع نهجاً شاملاً.

وتتضمن ميزاتها تكنولوجيا رائدة لمراقبة الحالة الصحية؛ تركز على تحليل وظائف أعضاء الجسم، مثل القلب والكبد والطحال والرئتين والكليتين. وتركز النتائج على تنبيه المستخدمين حال ظهور مؤشرات مبكرة على مشكلات صحية محتملة، وتشجيعهم على تعديل نمط حياتهم ونظامهم الغذائي.

* مراقبة مستمرة: توفر الساعة مراقبة مستمرة لـ38 مؤشراً فسيولوجياً، بما في ذلك تحليل النوم الضروري والشائع، وتتبع نمط الحياة النشط، ومراقبة أجهزة الجسم، والبيانات الحيوية في الوقت الفعلي.

* تقارير صحية بالذكاء الاصطناعي: كما توفر ساعة «ووتش2كير فايتال»، يومياً، تقارير صحية مُولّدة بالذكاء الاصطناعي، بالإضافة إلى مؤشرات صحية شاملة، عبر تطبيق «لينك2كير»، المتوفر على متجر تطبيقات «أبل» ومتجر «غوغل بلاي»، الذي يُستخدم كذلك لتحديثات البرامج الثابتة. وتتولى ميزة مراقبة النوم متابعة أي ارتفاعات غير طبيعية في معدل خفقان القلب خلال الليل.

وخلال الفترة القصيرة التي استخدمتُ فيها الساعة، لم أتمكن من رصد أي شيء لافت في جسمي، لكن إمكاناتها لفتت انتباهي دونما شك. ورغم أنها ليست ساعة ذكية بالمعنى المتعارف عليه، مثل ساعة «أبل ووتش»، فإنها توفر مزايا الرسائل، والإشعارات، والبريد الإلكتروني، علاوة على عدد كبير من التطبيقات، وإمكانية الاتصال بـ«كار بلاي».

يذكر أنه يجري تسويق الميزات الصحية للساعة بوصفها تتجاوز بكثير ما تقدمه الساعات الذكية الأخرى، وذلك بالاعتماد على الطب الصيني التقليدي. ولدى ارتدائك ساعة «ووتش2كير فايتال»، فإنك تتلقى أول تقرير يستند إلى مبادئ الطب الصيني التقليدي في غضون 24 ساعة. ويتضمن التقرير معلوماتٍ؛ مثل تقييم من 100 درجة لوظائف القلب والكبد والكلى والطحال. كما يحتوي ميزة لقياس مستوى الأكسجين في الدم.

بريد إلكتروني ورسائل نصية

وبما أنها على اتصال بهاتفك الذكي، فإن ساعة «ووتش2كير فايتال» ترسل تنبيهاً لدى ورود رسائل بريد إلكتروني، أو رسائل نصية جديدة... كما تعرض الساعة الوقت، وتوفر منبهاً، بجانب معلومات عن حالة الطقس... وهي تُستقى من هاتفك الذكي.

من حيث التصميم، تتميز الساعة بتصميم أنيق يتفوق على الساعات الذكية الأوسع شيوعاً. كما تتمتع ببطارية تستمر 48 ساعة؛ الأمر الذي أثبتته تجربتي الشخصية، إضافة إلى إمكانية شحنها بسرعة في غضون نحو ساعة ونصف. كما يأتي معها كابل شحن «يو إس بي» خاص. وتعمل شاشتها، التي تأتي بمقاس 1.43 بوصة، باللمس، وتتميز بحواف دائرية، ومدمجة في هيكل من التيتانيوم، وتدعم تكنولوجيا «بلوتوث 5.3» للاتصال. وتتميز بدقة عرض فائقة الوضوح تبلغ 466 × 466 بيكسل، بجانب أنها مقاومة للماء بمعيار «آي بي67».

وبصفتي من مستخدمي «أبل ووتش» منذ مدة طويلة، فقد وجدتُ أن شاشة اللمس في ساعة «ووتش2كير فايتال» سريعة الاستجابة وسهلة الاستخدام للوصول إلى الميزات والشاشات الأخرى. وفي المجمل، تتوفر 6 واجهات للساعة للاختيار من بينها، ولا يوجد خيار صحيح أو خاطئ؛ الأمر يعتمد على ما تفضله والمعلومات التي ترغب في رؤيتها. شخصياً، اخترت الواجهة التي تعرض الوقت بأكبر خط. ويبلغ ثمن الساعة 2384 دولاراً.

http://www.link2care.asia

* خدمات «تريبيون ميديا»


خبراء ينصحون بإبعاد الأطفال عن الدمى الناطقة بالذكاء الاصطناعي

شخصية «باز لايت يير» (بيكساباي)
شخصية «باز لايت يير» (بيكساباي)
TT

خبراء ينصحون بإبعاد الأطفال عن الدمى الناطقة بالذكاء الاصطناعي

شخصية «باز لايت يير» (بيكساباي)
شخصية «باز لايت يير» (بيكساباي)

مع أفلام مغامرات «حكاية لعبة» الشيّقة، إلى حركات «تيد» الطفولية، أصبحت فكرة الدمى والدببة المحشوة، التي تدب فيها الحياة فكرةً سينمائيةً مبتذلة.

وبينما أتاحت التطورات الحديثة في مجال الذكاء الاصطناعي إمكانية صنع ألعاب تبدو واعية، فإنها تبدو أقرب إلى شخصيات شريرة مثل المهرج في فيلم «بولترجايست» وشخصية «تشاكي» في فيلم «لعبة طفل» منها إلى شخصيتَي «وودي» و«باز لايت يير».

ووفقاً لمنظمة «كومن سينس ميديا»، الأميركية غير الحكومية المعنية بمراقبة السلع الإلكترونية الاستهلاكية، فإن الدمى وألعاب الأطفال التي تعمل بالذكاء الاصطناعي تقول كلاماً غير لائق للأطفال، وتنتهك خصوصية المنزل من خلال جمع بيانات واسعة النطاق.

يقول روبي تورني، رئيس قسم التقييمات الرقمية في «كومن سينس»: «أظهر تقييمنا للمخاطر أن دمى الذكاء الاصطناعي تشترك في مشكلات جوهرية تجعلها غير مناسبة للأطفال الصغار».

ويقول تورني: «أكثر من رُبع المنتجات تتضمَّن محتوى غير لائق، مثل الإشارة إلى إيذاء النفس، والمخدرات، والسلوكيات الخطرة»، مشيراً إلى أن هذه الأجهزة تستلزم «جمع بيانات مكثف»، وتعتمد على «نماذج اشتراك تستغل الروابط العاطفية».

ووفقاً لمنظمة «كومن سينس»، تستخدم بعض هذه الألعاب «آليات ترابط لخلق علاقات شبيهة بالصداقة»، محذِّرة من أن هذه الأجهزة في الوقت نفسه «تجمع بيانات واسعة النطاق في المساحات الخاصة بالأطفال»، بما في ذلك التسجيلات الصوتية، والنصوص المكتوبة، و«البيانات السلوكية».

وتؤكد «كومن سينس» ضرورة عدم وجود أي طفل دون سن الخامسة بالقرب من لعبة ذكاء اصطناعي، وأنَّ على الآباء توخي الحذر فيما يتعلق بالأطفال الذين تتراوح أعمارهم بين 6 و12 عاماً.

ويقول جيمس ستاير، مؤسِّس ورئيس منظمة «كومن سينس»: «ما زلنا نفتقر إلى ضمانات فعّالة لحماية الأطفال من الذكاء الاصطناعي»، مقارِناً بين غياب هذه الحماية و«الاختبارات الصارمة» للسلامة والملاءمة التي تخضع لها الألعاب الأخرى قبل الموافقة على طرحها للبيع.


بالخطأ... منصة في كوريا الجنوبية توزع «بتكوين» بقيمة 44 مليار دولار

شعار منصة تداول العملات المشفرة الكورية الجنوبية «بيثامب» (رويترز)
شعار منصة تداول العملات المشفرة الكورية الجنوبية «بيثامب» (رويترز)
TT

بالخطأ... منصة في كوريا الجنوبية توزع «بتكوين» بقيمة 44 مليار دولار

شعار منصة تداول العملات المشفرة الكورية الجنوبية «بيثامب» (رويترز)
شعار منصة تداول العملات المشفرة الكورية الجنوبية «بيثامب» (رويترز)

كشفت منصة تداول العملات المشفرة الكورية الجنوبية «بيثامب»، اليوم السبت، عن أنها وزعت عملات «بتكوين» بقيمة تتجاوز 40 مليار دولار على عملاء بوصفها مكافآت ترويجية عن طريق الخطأ، ما أدى إلى موجة بيع حادة على المنصة.

واعتذرت «‌بيثامب» عن ‌الخطأ الذي ‌وقع ⁠أمس ​الجمعة، ‌وقالت إنها استعادت 99.7 في المائة من إجمالي 620 ألف «بتكوين» بقيمة تبلغ نحو 44 مليار دولار بالأسعار الحالية. وقيدت عمليات التداول والسحب ⁠على 695 عميلاً متأثراً بالواقعة في ‌غضون 35 دقيقة ‍من التوزيع ‍الخاطئ أمس.

وأفادت تقارير إعلامية بأن ‍المنصة كانت تعتزم توزيع مكافآت نقدية صغيرة في حدود 2000 وون كوري (1.40 دولار) ​أو أكثر لكل مستخدم في إطار حدث ترويجي، لكن ⁠الفائزين حصلوا بدلاً من ذلك على ألفي «بتكوين» على الأقل لكل منهم.

وقالت «‌بيثامب» في بيان: «نود أن نوضح أن هذا لا علاقة له بقرصنة خارجية أو انتهاكات أمنية، ولا توجد مشاكل في أمن النظام ‌أو إدارة أصول العملاء».