مواقع وخدمات وبرامج ترفع دقة الصور

باستخدام تقنيات الذكاء الصناعي

صورة منخفضة الدقة (يسار) بعد رفع دقتها (يمين) عبر موقع «غيغابكسل إيه آي»
صورة منخفضة الدقة (يسار) بعد رفع دقتها (يمين) عبر موقع «غيغابكسل إيه آي»
TT

مواقع وخدمات وبرامج ترفع دقة الصور

صورة منخفضة الدقة (يسار) بعد رفع دقتها (يمين) عبر موقع «غيغابكسل إيه آي»
صورة منخفضة الدقة (يسار) بعد رفع دقتها (يمين) عبر موقع «غيغابكسل إيه آي»

هل لديك صور قديمة منخفضة الدقة وترغب برفع دقتها؟ على الرغم من أن هذا الأمر قد يبدو محصورا على الأفلام والمسلسلات الاستخباراتية، فإن تقنيات الذكاء الصناعي جعلت هذا الأمر حقيقة دون أي تدخل من المستخدم أو الحاجة لوجود خبرة مسبقة في مجال تحرير الصور. وبدأت بعض الشركات باستخدام هذه التقنيات لرفع دقة صور الألعاب القديمة آليا دون الحاجة لتطوير أي محتوى جديد. وسنركز في هذا الموضوع على مجموعة من المواقع والخدمات والبرامج التي تستخدم تقنيات الذكاء الصناعي لرفع دقة الصور.
- دقة الصورة
بداية يجب أن ننوه بأنه لا يوجد برنامج أو موقع أو خدمة واحدة للحصول على النتائج الأفضل في جميع الحالات، بل يمكن أن يقدم موقع أو برنامج ما، جودة أفضل في الصور البعيدة للطبيعة، بينما يقدم موقع أو برنامج آخر جودة أفضل في الصور القريبة للأوجه البشرية.
> الموقع الأول هو imglarger الذي يسمح برفع الصورة إلى الموقع أو استخدام برنامجه على الكومبيوترات الشخصية التي تعمل بنظامي التشغيل «ويندوز» و«ماك»، أو تطبيقه على الهواتف الجوالة التي تعمل بنظامي التشغيل «آندرويد» و«آي أو إس». ويكفي إنشاء حساب والضغط على زر واحد في الموقع واختيار الصورة منخفضة الدقة، ومن ثم اختيار فئة الصورة من بين «رسمة» و«صورة حقيقية» و«وجه» و«جودة عالية»، ومن ثم اختيار معامل رفع الدقة من بين الضعف أو 4 أضعاف، والنقر على زر البدء بتنفيذ العملية.
ويقدم الموقع قيودا على الصورة الأصلية، مثل ضرورة أن يكون حجم ملف الصورة 5 ميغابايت أو أقل، أو أن تكون دقة الصورة 1200x1200 بكسل أو أقل. وبعد انتهاء الموقع من رفع دقة الصورة، يمكن تحميلها إلى جهاز المستخدم. ويقدم الموقع القدرة على معالجة 19 صورة شهريا مجانا، أو يمكن الاشتراك لقاء الحصول على المزيد (99 أو 999 صورة شهريا) ورفع دقة الصورة الأصلية (إلى 2000x2000 بكسل) وحجم الملف (إلى 10 ميغابايت)، ورفع دقة مضاعفة الصورة إلى 8 أضعاف وإزالة الإعلانات والسماح بمعالجة عدة صور في آن واحد. جودة الصورة النهائية لهذا - الموقع مبهرة.
> الموقع الثاني هو LetsEnhance IO الذي يتطلب إنشاء حساب أيضا، والذي يسمح بمعالجة 5 صور مجانا، ومن ثم الضغط على زر واحد في الموقع واختيار الصورة منخفضة الدقة ومن ثم اختيار فئة الصورة من بين الصور العادية والفنية، والرسومات، مع تقديم خيارات لتصحيح الألوان وإضافة الأسطح Textures إلى الصورة، ومن ثم اختيار معامل رفع الدقة من بين الضعف أو 4 أضعاف. وتجدر الإشارة إلى أن الموقع يستطيع رفع دقة الصور بشكل ملفت للنظر، ولكنه ليس مناسبا للصور القريبة من الأوجه، حيث تواجه خوارزمية الذكاء الصناعية (الخوارزمية هي نهج عمل برنامج ما لتحقيق النتيجة المرغوبة).
ويمكن استخدام الموقع مجانا بشرط ألا تتجاوز دقة الصورة الأصلية 15 ميغابكسل وألا يتجاوز حجم الملف 15 ميغابايت. ولا توجد قيود لدى الاشتراك فيما يتعلق بحجم الملف الواحد، مع وضع حد أقصى لدقة الصورة يبلغ 30 ميغابكسل. ويمكن الاشتراك والحصول على 100 أو 300 صورة شهريا، مع القدرة على رفع دقة الصور لغاية 512 ميغابكسل أو أي دقة أخرى يرغب بها المستخدم.
- إزالة الشوائب
> وننتقل الآن إلى موقع Deep-Image AI الذي يقدم 5 صور مجانية شهريا ويدعم معالجة عدة صور موجودة في حساب Google Drive الخاص بالمستخدم. ويمكن رفع أي صورة إلى الموقع بضغطة زر واحدة دون وجود أي قيود على عدد الصور التي يمكن رفعها إلى الموقع. القيد الوحيد هو أن تكون دقة الصورة الأصلية لا تتجاوز 5000x5000 بكسل. ويمكن اختيار رفع الدقة من بين الضعف أو 3 أو 4 أضعاف، مع القدرة على إزالة الشوائب البصرية. وتجدر الإشارة إلى أن المستخدم ليس مضطرا للتسجيل في الموقع لاستخدام هذه الخدمة. ويتميز الموقع بسرعته في معالجة الصورة، مع تقديم معاينة للصور قبل وبعد معالجتها على شكل صورة يقسمها خط يفصل بين الجزء الأصلي والجزء الذي تمت معالجته، والذي يمكن تحريكه إلى اليمين أو اليسار للمقارنة. ويستطيع التطبيق معالجة الصور بجودة عالية، وخصوصا الأوجه القريبة. ويمكن الاشتراك بالموقع لمعالجة صور يصل عددها إلى 50 ألف صورة في الشهر (وفقا للباقة المختارة).
> ونذكر أيضا موقع BigJPG الذي يسمح برفع الصورة إلى الموقع أو استخدام برنامجه على الكومبيوترات الشخصية التي تعمل بنظامي التشغيل «ويندوز» و«ماك»، أو تطبيقه على الهواتف الجوالة التي تعمل بنظام التشغيل «آندرويد». ويمكن اختيار فئة الصورة (رسومات أو صورة حقيقية) ومعامل رفع الدقة من بين الضعف أو 4 أضعاف وإزالة الشوائب البصرية آليا. أما جودة الصورة المعالجة فهي عالية ولن يلاحظ المستخدم أي أمور خارجة عن المألوف إلا لو دقق في الصورة عن قرب وقارنها بمواقع أخرى تقدم خدمة مشابهة. ويمكن استخدام الموقع مجانا بشرط ألا تتجاوز دقة الصورة الأصلية 3000x3000 بكسل وألا يتجاوز حجم الملف 10 ميغابايت، ويمكن الاشتراك بالخدمة للحصول على خيارات لمعامل رفع الدقة يصل إلى 16 ضعفا، ومعالجة 2000 صورة شهريا، والسماح بمعالجة عدة صور في آن واحد.
> أما موقع ImageUpscalerفيسمح للمستخدم بمعالجة الصورة، مع عرض معاينة لها قبل وبعد رفع دقتها. وتعتبر هذه الخدمة من أفضل الخدمات الموجودة بالنسبة للأوجه القريبة. كما يوفر الموقع خيار معالجة الصور يدويا من خلال خبرائهم لقاء مبلغ يتم الاتفاق عليه حسب كل حالة.
> برامج التصوير. وإن أردت استخدام برنامج عوضا عن موقع، فنذكر TopazLabs Gigapixel AI المفيد لمن لديه كمية كبيرة من الصور التي تتطلب معالجة، حيث إن الخدمات والمواقع الأخرى مرتبطة باشتراكات شهرية لقاء عدد محدد، بينما يمكن شراء هذا البرنامج مرة واحدة واستخدامه لعدد غير محدود من المرات. أضف إلى ذلك أن هذه التطبيق مثبت على كومبيوتر المستخدم ويمكن استخدامه دون وجود اتصال بالإنترنت، على خلاف خدمات المواقع الأخرى. ويسمح البرنامج برفع الدقة من بين نصف الدقة أو الضعف أو 4 أو 6 أضعاف أو قيمة أخرى يختارها المستخدم، مع القدرة على إزالة الشوائب البصرية وتصحيح المناطق غير الواضحة، وتحسين جودة صورة وألوان الأوجه. كما يسمح البرنامج بمعاينة الصورة قبل وبعد معالجتها، وتقريب الصورة إلى منطقة محددة فيها ومقارنة تلك المنطقة عن كثب.
وبالحديث عن البرامج، فنذكر أكثرها شهرة، وهو فوتوشوب Photoshop الذي يسمح برفع دقة الصور بالذهاب إلى قائمة الصورة Image ومن ثم اختيار حجم الصورة Image Sizeواختيار الدقة المرغوبة، وتفعيل خيار Resample واختيار Preserve Details 2.0 من القائمة المجاورة. كما يمكن تفعيل ميزة إزالة الشوائب البصرية من الصورة بكل سهولة. ويقدم التطبيق القدرة على معالجة عدد غير محدود من الصور دون الحاجة للاتصال بالإنترنت، وبجودة عالية.


مقالات ذات صلة

«أدوبي» تتيح تحويل ملفات «PDF» إلى عروض تقديمية وبودكاست صوتي

تكنولوجيا التحول نحو المستندات متعددة الوسائط يعكس تغير توقعات المستخدمين في بيئات العمل والتعليم (شاترستوك)

«أدوبي» تتيح تحويل ملفات «PDF» إلى عروض تقديمية وبودكاست صوتي

«أدوبي» توسّع دور «PDF» بإضافة ذكاء اصطناعي يحوّل المستندات إلى عروض تقديمية وبودكاست، ما يعكس تحولاً نحو محتوى مرن متعدد الوسائط في العمل.

نسيم رمضان (لندن)
يوميات الشرق صورة للتطبيق نشرتها شركة «مون سكيب تكنولوجيز» المطورة له

«هل أنت ميت؟»... تطبيق صيني للاطمئنان على من يعيشون بمفردهم

انتشر في الصين على نطاق واسع تطبيق جديد يحمل اسماً مقلقاً، وهو «هل أنت ميت»، ويعتمد على فكرة بسيطة لكنها مثيرة للجدل، وهي دعم الأشخاص الذين يعيشون بمفردهم.

«الشرق الأوسط» (بكين)
تكنولوجيا شهد المعرض آلاف المنتجات الاستهلاكية توزعت في مختلف المعارض وقاعات الفنادق في لاس فيغاس بأكملها (أ.ب)

في معرض «المنتجات الاستهلاكية»… هل تجاوزت تقنيات الصحة مفهوماً أوسع للعافية؟

تبرز تقنيات الصحة بوصفها قطاعاً ناضجاً ينتقل من الأجهزة القابلة للارتداء إلى حلول وقائية منزلية شاملة، جامعة الذكاء الاصطناعي وسهولة الاستخدام لمراقبة العافية.

نسيم رمضان (لاس فيغاس)
تكنولوجيا «إكس» تطمح للتحول إلى منصة اتصال شاملة تجمع النشر والمراسلة والخدمات في مكان واحد (إكس)

«إكس» توحّد نظام المراسلة وتدمج الرسائل الخاصة مع «XChat» في تبويب واحد

يتيح النظام الجديد للمستخدمين الوصول إلى محادثاتهم من خلال واجهة موحدة بدلاً من الأقسام المتعددة.

عبد العزيز الرشيد (الرياض)
تكنولوجيا «إكس» تطمح للتحول إلى منصة اتصال شاملة تجمع النشر والمراسلة والخدمات في مكان واحد (إكس)

«إكس» توحّد نظام المراسلة وتدمج الرسائل الخاصة مع «XChat» في تبويب واحد

يتيح النظام الجديد للمستخدمين الوصول إلى محادثاتهم من خلال واجهة موحدة بدلاً من الأقسام المتعددة.

عبد العزيز الرشيد (الرياض)

تحذير لمستخدمي «ChatGPT»: دعوات مزيفة عبر «أوبن إيه آي»

يستغل المحتالون ميزات الدعوات الرسمية في «OpenAI» لإرسال رسائل احتيالية تبدو موثوقة تقنياً (شاترستوك)
يستغل المحتالون ميزات الدعوات الرسمية في «OpenAI» لإرسال رسائل احتيالية تبدو موثوقة تقنياً (شاترستوك)
TT

تحذير لمستخدمي «ChatGPT»: دعوات مزيفة عبر «أوبن إيه آي»

يستغل المحتالون ميزات الدعوات الرسمية في «OpenAI» لإرسال رسائل احتيالية تبدو موثوقة تقنياً (شاترستوك)
يستغل المحتالون ميزات الدعوات الرسمية في «OpenAI» لإرسال رسائل احتيالية تبدو موثوقة تقنياً (شاترستوك)

حذّر خبراء أمن سيبرانيون مستخدمي «شات جي بي تي» (ChatGPT) ومنصات «أوبن إيه آي» الأخرى من أسلوب احتيالي جديد يستغل آلية إرسال الدعوات داخل المنصة، ما يجعل رسائل احتيالية تبدو وكأنها صادرة رسمياً من «أوبن إيه آي».

وبحسب رصد حديث أجرته شركة «كاسبرسكي»، فقد اكتشف باحثوها أن مهاجمين باتوا يسيئون استخدام ميزات إنشاء «المؤسسات» ودعوة أعضاء الفريق في منصة «OpenAI» لإرسال رسائل احتيالية من عناوين بريد إلكتروني حقيقية تعود إلى الشركة نفسها. هذا الأمر يمنح الرسائل مصداقية تقنية عالية، ويزيد من فرص تجاوزها لفلاتر البريد المزعج وكسب ثقة المتلقين.

ولا يعتمد هذا الأسلوب على اختراق أنظمة «أوبن إيه آي»، بل على التلاعب بخصائص مشروعة صُممت في الأصل لتسهيل التعاون والعمل الجماعي، ثم تحويلها إلى أداة للهندسة الاجتماعية.

مثال على رسالة بريد إلكتروني احتيالية (كاسبرسكي)

كيف تعمل الحيلة؟

تبدأ العملية بإنشاء حساب عادي على منصة «أوبن إيه آي». وخلال التسجيل، يُطلب من المستخدم إنشاء «مؤسسة» وتحديد اسم لها. هذا الحقل مخصص عادة لاسم شركة أو فريق، لكنه يسمح بإدخال رموز ونصوص متنوعة.

يستغل المحتالون هذه المرونة لإدراج عبارات مضللة مباشرة في اسم المؤسسة، مثل رسائل تحذيرية أو عروض زائفة، وأحياناً أرقام هواتف أو روابط مشبوهة. وبعد إنشاء المؤسسة، تقترح المنصة خطوة «دعوة فريقك»، حيث يُدخل المهاجمون عناوين البريد الإلكتروني للضحايا المستهدفين.

عند إرسال الدعوات، تصل الرسائل من عناوين رسمية تابعة لـ«أوبن إيه آي»، وتظهر للمتلقي على أنها إشعار حقيقي لإضافته إلى مشروع أو فريق عمل. ويحتوي البريد الإلكتروني على القالب المعتاد لدعوات التعاون، لكن النص الاحتيالي الذي أدرجه المهاجم يظهر بشكل بارز داخل الرسالة. ويراهن المحتالون على أن كثيراً من المستخدمين سيركزون على العنوان الموثوق والرسالة المظللة، دون الانتباه إلى عدم منطقية المحتوى أو سبب تلقيهم دعوة لمؤسسة غير معروفة.

أنماط الرسائل الاحتيالية

رصدت «كاسبرسكي» عدة أنواع من الرسائل التي جرى تمريرها بهذه الطريقة. بعضها يروج لخدمات أو عروض احتيالية، بينما يتخذ الآخر طابعاً أكثر خطورة. أحد الأساليب الشائعة هو إرسال إشعارات كاذبة تفيد بتجديد اشتراك مرتفع التكلفة. وتطلب الرسالة من الضحية الاتصال برقم هاتف مرفق «لإلغاء العملية». هذا النوع من الهجمات يُعرف بـ«التصيد الصوتي» (Vishing)، حيث يحاول المحتالون أثناء المكالمة إقناع الضحية بالكشف عن بيانات شخصية أو مالية، أو تنفيذ خطوات تؤدي إلى اختراق إضافي. وفي جميع الحالات، يبقى الهدف دفع المتلقي إلى التصرف بسرعة، سواء عبر الضغط على رابط أو إجراء مكالمة قبل التحقق من صحة الرسالة.

تعتمد الحيلة على إدراج نصوص مضللة داخل اسم «المؤسسة» ثم إرسال دعوات تصل من عناوين بريد رسمية (غيتي)

لماذا تبدو الرسائل مقنعة؟

تكمن خطورة هذا الأسلوب في أن الرسائل ليست مزورة بالطريقة التقليدية. فهي تُرسل عبر قنوات رسمية وتخرج من بنية بريدية حقيقية تابعة للمنصة. لذلك، يختفي كثير من الإشارات التحذيرية المعتادة، مثل عناوين المرسل المشبوهة. ورغم أن محتوى الرسالة غالباً ما يكون غير منسجم مع قالب «دعوة للتعاون»، فإن هذا التناقض قد لا يكون واضحاً للجميع، خصوصاً لمن لا يتوقعون أن تُستغل منصة موثوقة بهذا الشكل. ويرى خبراء أمنيون أن هذه الحالة تسلط الضوء على مشكلة أوسع. حتى الخدمات ذات السمعة الجيدة يمكن أن تتحول إلى أدوات في يد المحتالين إذا أسيء استخدام ميزاتها.

ما الذي ينبغي فعله؟

بالنسبة لمستخدمي «تشات جي بي تي» ومنصات «أوبن إيه آي» عموماً، تشكل هذه الحملة تذكيراً بأهمية الحذر، حتى عند تلقي رسائل تبدو رسمية. وينصح الخبراء بالتعامل مع أي دعوة غير متوقعة بشكّ، خصوصاً إذا تضمنت لغة استعجال أو مطالب مالية أو أرقام هواتف. كما يُفضل تجنب الضغط على الروابط المضمنة أو الاتصال بالأرقام المذكورة في رسائل مشبوهة. وإذا كانت هناك حاجة فعلية للتواصل مع الدعم، فمن الأفضل زيارة الموقع الرسمي للخدمة والبحث عن بيانات الاتصال هناك.

كما أن الإبلاغ عن الرسائل المشبوهة للمنصة يساعد في الحدّ من انتشارها، في حين يظل تفعيل المصادقة الثنائية خطوة مهمة لتعزيز الأمان، حتى إن لم يعتمد هذا النوع من الاحتيال على اختراق الحسابات مباشرة. ورغم أن هذه الحملة تستهدف الأفراد، فإنها تطرح أيضاً تساؤلات أوسع أمام الشركات التي تدير منصات تعاونية. فالأدوات المصممة لتسهيل الانضمام والعمل الجماعي قد تتحول إلى نقاط ضعف إذا لم تُقيّد أو تُراقب بشكل كافٍ.


ماذا يعني أن تصبح «سيري» شبيهة بـ«ChatGPT»؟

تعمل «أبل» على إعادة تصميم «سيري» لتتحول من منفذة أوامر إلى مساعد حواري سياقي شبيه بـ«ChatGPT» (شاترستوك)
تعمل «أبل» على إعادة تصميم «سيري» لتتحول من منفذة أوامر إلى مساعد حواري سياقي شبيه بـ«ChatGPT» (شاترستوك)
TT

ماذا يعني أن تصبح «سيري» شبيهة بـ«ChatGPT»؟

تعمل «أبل» على إعادة تصميم «سيري» لتتحول من منفذة أوامر إلى مساعد حواري سياقي شبيه بـ«ChatGPT» (شاترستوك)
تعمل «أبل» على إعادة تصميم «سيري» لتتحول من منفذة أوامر إلى مساعد حواري سياقي شبيه بـ«ChatGPT» (شاترستوك)

تستعد «سيري»، المساعد الصوتي من شركة «أبل»، لأكبر تحول في تاريخها منذ إطلاقها قبل أكثر من عقد. فحسب تقارير متطابقة من وسائل إعلام تقنية، تعمل «أبل» على إعادة تصميم «سيري» لتتحول من أداة تعتمد على الأوامر الصوتية البسيطة إلى مساعد حواري متقدم، قادر على إجراء محادثات سياقية طويلة، على غرار «شات جي بي تي» (ChatGPT) وغيره من روبوتات الدردشة التوليدية.

لطالما واجهت «سيري» انتقادات بسبب محدودية فهمها للغة الطبيعية مقارنة بمنافسين مثل مساعد «غوغل» ونماذج الذكاء الاصطناعي التوليدي الحديثة. ففي الوقت الذي أصبحت فيه روبوتات الدردشة قادرة على تلخيص المعلومات وشرح المفاهيم المعقدة، والتفاعل مع المستخدمين بسلاسة، بقيت «سيري» مرتبطة بمهام أساسية، مثل ضبط المنبهات أو فتح التطبيقات، مع تحسينات تدريجية لم تغيّر جوهر التجربة.

اليوم، يبدو أن «أبل» تعترف بأن هذا النهج لم يعد كافياً.

من الأوامر إلى الحوار

تُشير التقارير إلى أن «أبل» تعمل على تحويل «سيري» إلى مساعد حواري متكامل، يستطيع متابعة السياق والرد عبر الصوت أو النص، والتعامل مع الأسئلة المركبة بطريقة أكثر طبيعية. ويُمثل هذا التحول قطيعة مع التصميم التقليدي لـ«سيري»، الذي بُني أساساً على تنفيذ أوامر محددة بدلاً من إجراء حوار مفتوح.

ووفق ما نُشر، تعتمد «أبل» في هذه المرحلة على دمج تقنيات ذكاء اصطناعي توليدي متقدمة، من بينها نماذج مثل «جيميناي» من «غوغل» ضمن إطارها الخاص المعروف باسم «ذكاء أبل» (Apple Intelligence). ولا يعني ذلك التخلي عن تطويرها الداخلي، بل الاستفادة من أفضل النماذج المتاحة لتعزيز قدرات «سيري» اللغوية والحوارية. الهدف هو جعل التفاعل مع «سيري» أقرب إلى محادثة حقيقية، بدلاً من سلسلة أوامر منفصلة، وهو ما أصبح معياراً جديداً في عالم المساعدات الذكية.

«سيري» ستستفيد من «غوغل جيميناي» لتعزيز الحوار والسياق ضمن توجه «أبل» لمواكبة الذكاء الاصطناعي التفاعلي (شاترستوك)

استجابة متأخرة

يأتي هذا التحول فيما تتسارع المنافسة على الذكاء الاصطناعي الحواري، فقد اعتاد المستخدمون خلال العامين الماضيين أدوات قادرة على إنتاج نصوص وشرح أفكار والمساعدة في التخطيط واتخاذ القرار. وفي المقابل، بدا أن «أبل» تتحرك بوتيرة أبطأ، مع تركيز واضح على الخصوصية والاستقرار بدل السبق التقني.

ورغم أن الشركة بدأت سابقاً دمج «ChatGPT» خياراً مساعداً ضمن بعض ميزات «ذكاء أبل»، فإن هذه الخطوة أبرزت الفجوة بين «سيري» التقليدية وتجربة الدردشة التوليدية الحديثة. ومع تزايد الاعتماد اليومي على هذه الأدوات، بات من الصعب على «أبل» تجاهل التحول الجاري في طريقة تفاعل المستخدمين مع التقنية.

الخصوصية في التصميم

على عكس بعض المنافسين، لا يبدو أن «أبل» تسعى إلى تحويل «سيري» إلى مجرد واجهة لخدمة سحابية خارجية، فالتقارير تشير إلى أن جزءاً كبيراً من المعالجة سيجري على الجهاز نفسه أو عبر خوادم خاضعة لسيطرة «أبل»، بما ينسجم مع سياستها التقليدية في تقليل جمع البيانات وحماية خصوصية المستخدم. هذا التوازن بين القدرات المتقدمة والخصوصية قد يكون العامل الفارق في تجربة «سيري» الجديدة، لكنه في الوقت نفسه يفرض قيوداً تقنية قد تؤثر في سرعة التطوير مقارنة بمنافسين يعتمدون بشكل أوسع على الحوسبة السحابية.

«سيري» الجديدة تستهدف التكامل العميق مع النظام لفهم ما على الشاشة وربط التطبيقات وتنفيذ مهام متعددة بطلب واحد (شاترستوك)

أكثر من دردشة

ولا يقتصر طموح «أبل» على جعل «سيري» أكثر بلاغة فحسب، بل على جعلها أكثر فاعلية، فالتقارير تُشير إلى أن النسخة الجديدة ستكون قادرة على فهم ما يجري على شاشة الجهاز، وربط المعلومات بين التطبيقات، وتنفيذ مهام متعددة بناءً على طلب واحد بلغة طبيعية. بهذا المعنى، لا تسعى «أبل» إلى تقديم «روبوت دردشة» فقط، بل إلى مساعد ذكي قادر على التحرك داخل النظام، وإدارة المهام اليومية، والتفاعل مع محتوى المستخدم وسياقه. وهذا يعكس توجهاً أوسع في صناعة التقنية نحو ما يُعرف بـ«الذكاء القابل للتنفيذ»؛ حيث لا يكتفي النظام بالإجابة بل يتخذ إجراءً.

ماذا يعني ذلك للمستخدمين؟

من المتوقع أن تكشف «أبل» عن ملامح هذا التحول خلال مؤتمرها السنوي للمطورين في شهر يونيو (حزيران) المقبل، على أن تُطرح التجربة الجديدة ضمن الإصدارات المقبلة من أنظمة «iOS» و«macOS» و«iPadOS». وإذا نجحت الشركة في تنفيذ رؤيتها، فقد تصبح «سيري» جزءاً أكثر مركزية في الحياة الرقمية اليومية لمستخدمي أجهزة «أبل».

لكن التحدي لا يزال قائماً، فالمستخدمون الذين اعتادوا مرونة وسرعة أدوات مثل «ChatGPT» ستكون لديهم توقعات عالية. وسيُقاس نجاح «سيري» الجديدة بمدى قدرتها على الجمع بين الحوار العميق، والتنفيذ العملي، والخصوصية من دون التضحية بتجربة الاستخدام.


روبوتات تفكر وتتحرك: ما الذي يميّز «Rho-Alpha» من «مايكروسوفت»؟

نموذج «Rho-Alpha» يدمج الرؤية واللغة والفعل في إطار تعلم واحد ما يمكّن الروبوتات من التفاعل مع العالم المادي بمرونة أعلى (مايكروسوفت)
نموذج «Rho-Alpha» يدمج الرؤية واللغة والفعل في إطار تعلم واحد ما يمكّن الروبوتات من التفاعل مع العالم المادي بمرونة أعلى (مايكروسوفت)
TT

روبوتات تفكر وتتحرك: ما الذي يميّز «Rho-Alpha» من «مايكروسوفت»؟

نموذج «Rho-Alpha» يدمج الرؤية واللغة والفعل في إطار تعلم واحد ما يمكّن الروبوتات من التفاعل مع العالم المادي بمرونة أعلى (مايكروسوفت)
نموذج «Rho-Alpha» يدمج الرؤية واللغة والفعل في إطار تعلم واحد ما يمكّن الروبوتات من التفاعل مع العالم المادي بمرونة أعلى (مايكروسوفت)

يشهد الذكاء الاصطناعي تقدماً سريعاً في فهم اللغة والصور، إلا أن تحويل هذا الذكاء إلى أفعال ملموسة في العالم الحقيقي لا يزال أحد أكثر التحديات تعقيداً في مجال الحوسبة. وفي هذا السياق، تخطو أبحاث «مايكروسوفت» خطوة مهمة نحو سد هذه الفجوة، من خلال الكشف عن أعمال جديدة تهدف إلى تمكين الروبوتات من الإدراك والتفكير والتنفيذ بفاعلية أكبر داخل البيئات المادية الديناميكية.

وفي صميم هذا التوجه يأتي نموذج جديد يُعرف باسم «Rho-Alpha»، وهو نموذج يجمع بين الرؤية واللغة والفعل، ويهدف إلى مساعدة الروبوتات على تجاوز السلوكيات المبرمجة مسبقاً، والعمل بدرجة أعلى من الاستقلالية. ويعكس هذا النموذج طموح «مايكروسوفت» الأوسع في تطوير أنظمة ذكاء اصطناعي لا تكتفي بفهم المعلومات الرقمية، بل قادرة أيضاً على التفاعل مع العالم الفيزيائي بطرق أكثر مرونة وواقعية.

دمج الإدراك والفعل

على عكس الأنظمة الروبوتية التقليدية التي تعتمد على سلاسل هندسية منفصلة حيث تُعالج الرؤية والتخطيط والتحكم كوحدات مستقلة، يدمج نموذج «Rho-Alpha» هذه القدرات ضمن إطار تعلم واحد. ويتم تدريب النموذج على تحليل المدخلات البصرية، وفهم التعليمات باللغة الطبيعية، وتوليد أفعال جسدية مناسبة، ما يسمح للروبوتات بالاستجابة بسلاسة أكبر للمهام المعقدة.

ويعالج هذا النهج أحد التحديات المزمنة في عالم الروبوتات، المعروف بمشكلة «الميل الأخير». فعلى الرغم من قدرة نماذج الذكاء الاصطناعي على التعرف على الأشياء أو تنفيذ أوامر محددة، فإنها غالباً ما تفشل عند حدوث تغييرات غير متوقعة في البيئة. فاختلاف بسيط في الإضاءة أو موقع الأجسام أو سلوك البشر قد يؤدي إلى تعطل الأنظمة التقليدية. وتسعى أبحاث «مايكروسوفت» إلى جعل الروبوتات أكثر قدرة على التكيف من خلال ربط قراراتها بالسياق الواقعي بدلاً من القواعد الجامدة.

تعلم يتجاوز المختبر

يستند نموذج «Rho-Alpha» إلى التطورات الحديثة في النماذج التأسيسية، مستفيداً من مفاهيم النماذج اللغوية الضخمة والأنظمة متعددة الوسائط، مع تكييفها لمتطلبات التفاعل المادي. وبدلاً من تعلم المهام بشكل منفصل، يستطيع النموذج التعميم عبر سيناريوهات مختلفة، ما يمكّن الروبوتات من التعامل مع أشياء أو تعليمات لم تُصادفها صراحة أثناء التدريب. وتُعد هذه القدرة أساسية لنشر الروبوتات خارج المختبرات والبيئات الخاضعة للتحكم. وتصف أبحاث «مايكروسوفت» هذا العمل بأنه جزء من رؤية أوسع لما يُعرف بـ«الذكاء الاصطناعي المتجسد»، حيث يتشكل الذكاء ليس فقط من البيانات، بل من التفاعل المباشر مع العالم المادي. وفي هذا الإطار، تصبح الرؤية والفعل عنصرين متلازمين، ما يسمح للآلات بالتعلم من التجربة بأسلوب أقرب إلى السلوك البشري.

آفاق التطبيق العملي

تتعدد التطبيقات المحتملة لهذه التقنيات عبر قطاعات مختلفة. ففي البيئات الصناعية، يمكن للروبوتات الأكثر مرونة دعم مهام التصنيع والخدمات اللوجيستية التي تتطلب إعادة تهيئة مستمرة. أما في مجالات الرعاية الصحية والخدمات، فقد تساعد هذه الأنظمة في تنفيذ أنشطة يومية تتطلب تفاعلاً مباشراً مع البشر وبيئات غير متوقعة. ورغم أن «مايكروسوفت» لم تعلن عن منتجات تجارية قائمة على «Rho-Alpha»، فإن هذا البحث يسلط الضوء على قدرات أساسية قد تُمهّد لتطبيقات مستقبلية.

تؤكد «مايكروسوفت» أن التقدم في مجال الذكاء الاصطناعي للعالم المادي لا يقتصر على الأداء التقني فحسب، بل يشمل أيضاً اعتبارات السلامة والموثوقية ومواءمة الأنظمة مع النيات البشرية. فالروبوتات ذاتية التشغيل يجب أن تكون قادرة على فهم التعليمات بدقة، والتعامل مع الحالات الاستثنائية، خصوصاً في البيئات المشتركة مع البشر. لذلك، لا تركز الأبحاث على تعزيز القدرات فقط، بل أيضاً على المتانة والتصميم المسؤول.

يعتمد النموذج على مفهوم الذكاء الاصطناعي المتجسّد حيث يتعلم الروبوت من التجربة المباشرة والتفاعل مع البيئة كما يفعل البشر (مايكروسوفت)

من الذكاء إلى الفعل

يعكس إطلاق نموذج «Rho-Alpha» تحولاً أوسع في صناعة التكنولوجيا. فمع تزايد قدرات الذكاء الاصطناعي في السياقات الرقمية، يتجه الاهتمام تدريجياً نحو كيفية تجسيد هذه القدرات في آلات تعمل في العالم الحقيقي. ويطرح هذا التحول أسئلة جديدة حول جمع البيانات والمحاكاة وطرق التقييم، نظراً لأن البيئات المادية أقل قابلية للتنبؤ مقارنة بالبيئات الافتراضية.

وتشير أبحاث «مايكروسوفت» إلى أن المرحلة المقبلة من تطور الذكاء الاصطناعي لن تُقاس فقط بذكاء النماذج، بل بقدرتها على تحويل هذا الذكاء إلى أفعال ملموسة. ومن خلال توحيد الرؤية واللغة والتحكم ضمن إطار واحد، يمثل نموذج «Rho-Alpha» محطة بحثية مهمة في مسار جعل الذكاء الاصطناعي أكثر حضوراً وفاعلية خارج نطاق الشاشات والخوادم.

ومع تلاشي الحدود بين الذكاء الرقمي والأنظمة المادية، قد تُسهم مثل هذه التطورات في إعادة تشكيل طريقة تعاون الروبوتات مع البشر عبر مختلف القطاعات، في تحول تدريجي من آلات مبرمجة إلى شركاء أكثر وعياً بالسياق وقدرة على التكيف مع العالم الحقيقي.