تعرف على أبرز أدوات الذكاء الاصطناعي لمختلف الاستخدامات

من المنصات الشاملة إلى المساعدين المتخصصين: كيف تُغير أدوات الذكاء الاصطناعي طريقة عملنا وإبداعنا

أداة «رانواي إم إل» لتوليد الفيديوهات المتقدمة بالذكاء الاصطناعي
أداة «رانواي إم إل» لتوليد الفيديوهات المتقدمة بالذكاء الاصطناعي
TT

تعرف على أبرز أدوات الذكاء الاصطناعي لمختلف الاستخدامات

أداة «رانواي إم إل» لتوليد الفيديوهات المتقدمة بالذكاء الاصطناعي
أداة «رانواي إم إل» لتوليد الفيديوهات المتقدمة بالذكاء الاصطناعي

يشهد عالمنا اليوم ثورة رقمية غير مسبوقة، يقودها التطور المتسارع في مجال الذكاء الاصطناعي. ومع تزايد المهام الرقمية وتعقيدها، باتت الحاجة ملحة لأدوات ذكية تُسهم في تبسيط العمليات وتعزيز الإنتاجية وإطلاق العنان للإبداع.

وأدى هذا التطور إلى ظهور جيل جديد من أدوات الذكاء الاصطناعي، تتراوح بين المنصات الشاملة التي تجمع عشرات القدرات في مكان واحد والمساعدين المتخصصين الذين يركزون على مهام محددة بدقة فائقة.

ونقدم في هذا الموضوع مجموعة من تلك الأدوات الرائدة، ونشرح قدراتها المتنوعة، وكيف تُعيد تشكيل طريقة تفاعلنا مع التقنية في حياتنا اليومية والمهنية.

منصة «غلوبال جي بي تي» الشاملة بأكثر من 100 أداة ونموذج من نماذج الذكاء الاصطناعي

منصة ذكاء اصطناعي شاملة

تشكل منصة «غلوبال جي بي تي» GlobalGPT إضافة بارزة إلى مشهد الذكاء الاصطناعي المتطور بسرعة، حيث تقدم نفسها منصةً شاملةً تهدف إلى دمج أكثر من 100 أداة ونموذج من نماذج الذكاء الاصطناعي في اشتراك واحد. واكتسبت هذه المنصة شعبية واسعة وسريعة، حيث جمعت أكثر من 100 ألف مستخدم وملايين المحادثات، وتكمن جاذبيتها الأساسية في وعدها بأن تكون حلاً واحداً لتلبية احتياجات الذكاء الاصطناعي المتنوعة، بدءاً من توليد النصوص وصولاً إلى إنشاء الصور واسترجاع المعلومات بسرعة، مما يلغي الحاجة إلى اشتراكات منفصلة ومكلفة لكل أداة على حدة.

وتقدم «غلوبال جي بي تي» للمستخدمين إمكانية الوصول إلى مجموعة واسعة من نماذج الذكاء الاصطناعي الرائدة، مثل GPT-4o وClaude 3.5 وClaude 3.7 وGemini 1.5 Pro، بالإضافة إلى أدوات توليد الصور الشهيرة مثل Midjourney وDall-E3 ومنصات البحث المدعومة بالذكاء الاصطناعي مثل Perplexity AI.

ويسمح هذا الدمج الشامل للمستخدمين إنجاز مهام متعددة بكفاءة، سواء كانت إجراء الأبحاث أو إنشاء صور احترافية أو إنتاج عروض فيديو سينمائية أو حتى المساعدة في مهام البرمجة والبحث المعقدة. وتهدف المنصة إلى تبسيط تجربة المستخدم وتوفير الوقت والجهد الذي قد يبذل في التنقل بين تطبيقات وخدمات ذكاء اصطناعي مختلفة.

أضف تقنيات الذكاء الاصطناعي إلى تطبيق «تلغرام»

قدرات الذكاء الاصطناعي داخل تطبيق «تلغرام»

يقدم المساعد الذكي «بيست تي جي إيه آي بوت» Best TG AI Bot نفسه كحل شامل ومبتكر ضمن بيئة تطبيق «تلغرام»، حيث يجمع بين قدرات نماذج ذكاء اصطناعي رائدة مثل «تشات جي بي تي» وGPT-4o وClaude 3.5 وMidjourney V6 وPerplexity AI في واجهة واحدة سهلة الاستخدام. ويهدف هذا «البوت» إلى أن يكون المساعد الأمثل للمستخدمين لإنجاز مجموعة واسعة من المهام اليومية والمعقدة بكفاءة، بدءاً من الكتابة والبرمجة وصولاً إلى إنشاء الصور والبحث، كل ذلك ضمن منصة واحدة.

وتكمن جاذبية المساعد الذكي في قدرته على توفير الراحة وخفض التكاليف، حيث إنه يلغي الحاجة إلى اشتراكات متعددة ومكلفة لأدوات الذكاء الاصطناعي المختلفة. ويستفيد هذا المساعد الذكي من مزايا تطبيق «تلغرام»، مثل واجهة برمجة التطبيقات المفتوحة والمحادثات السرية المشفرة من طرف إلى طرف، مما يعزز خصوصية المستخدم وسهولة الوصول. كما أن وضعه المجاني الذي لا يتطلب رسوم اشتراك هو نقطة جذب قوية في سوق تعج بالخدمات المدفوعة، مما يجعله خياراً مغرياً للمستخدمين الذين يبحثون عن حلول ذكاء اصطناعي متقدمة دون تكلفة.

مساعد «فيلو إيه آي» الشخصي الذكي بأدواته المتعددة

مساعد شخصي ذكي بأدوات ممتدة

ويقدم «فيلو إيه آي» Felo AI الياباني نفسه بوصفه تطبيقاً ذكياً يعتمد على أحدث تقنيات الذكاء الاصطناعي، مثل معالجة اللغات الطبيعية NLP والتعلم العميق بهدف مساعدة المستخدمين في مختلف جوانب حياتهم المهنية والشخصية. ويعمل التطبيق كمساعد شخصي ذكي مصمم لتبسيط المهام وتوفير الوقت والجهد.

ويتميز بتقديمه مجموعة واسعة من القدرات التي تجعله أداة متعددة الاستخدامات، حيث إنه يوفر ترجمة فورية ودقيقة بين عشرات اللغات، ويسمح للمستخدمين بإنشاء محتوى متنوع مثل التقارير والنصوص الإبداعية، وغيرها. كما يقدم ردوداً ذكية للرسائل والبريد الإلكتروني تلقائياً، ويحول الصوت إلى نص بسرعة، وبدقة عالية، بالإضافة إلى تقديمه المساعدة في البرمجة والتحليل الرياضي وتوليد الأفكار الإبداعية للتسويق.

وتتعدد فوائد استخدامه لتشمل توفير الوقت والجهد بشكل كبير، حيث يمكنه إنجاز المهام في ثوانٍ بدلاً من ساعات.

وتعتمد هذه الخدمة على أحدث نماذج الذكاء الاصطناعي مثل «جي بي تي 4» و«بيرت» Bert لضمان تقديم دقة عالية في النتائج، وهو مناسب لشرائح واسعة من المستخدمين، من الطلاب الذين يمكنهم استخدامه في الأبحاث وتلخيص الكتب وحل المسائل الرياضية، إلى المحترفين والمسوقين الذين يستفيدون منه في كتابة التقارير وتحليل البيانات وإنشاء محتوى مبتكر. كما تدعم الخدمة عدة لغات، من بينها العربية والفرنسية والألمانية والصينية، وغيرها، مما يجعله أداة عالمية. ويمكن استخدام الخدمة على شكل تطبيق عبر متجري «غوغل بلاي» و«آب ستور».

أدوات الذكاء الاصطناعي لتوليد وتحرير الفيديوهات

وننتقل الآن إلى أدوات الذكاء الاصطناعي المخصصة للفيديو التي شهدت تطوراً ملحوظاً بتقديم مقدمة حلول مبتكرة لتحويل الأفكار إلى محتوى مرئي احترافي بأقل جهد ووقت. ومن تلك الأدوات «رانواي إم إل» Runway ML التي تقدم قدرات متقدمة في توليد الفيديوهات بالذكاء الاصطناعي، مما يتيح للمستخدمين تحويل النصوص والصور الأولية إلى مشاهد مذهلة، مع توفير تحكم إبداعي عال وموارد تعليمية لمساعدة المستخدمين على صقل مهاراتهم في هندسة الأوامر.

وفي السياق ذاته، تبرز «بيكتوري» Pictory كأداة قوية لإنشاء مقاطع فيديو جذابة في دقائق دون الحاجة لخبرة في التحرير، حيث يمكنها تحويل النصوص أو عناوين المواقع أو حتى العروض التقديمية PowerPoint إلى فيديوهات احترافية بأصوات واقعية من خلال الذكاء الاصطناعي.

أداة «بيكتوري» لتحرير عروض الفيديو بوصف نصي فقط

وكذلك ومطابقة تلقائية للمرئيات والموسيقى واستخراج أبرز اللقطات من الفيديوهات الطويلة وإضافة تسميات توضيحية تلقائية لزيادة الوصول والمشاهدة.

وتتخصص بعض الأدوات في تبسيط مهام التحرير المعقدة، حيث أحدثت «ديسكربت» Descript ثورة في تحرير الفيديوهات من خلال السماح للمستخدمين بتحرير الفيديو عن طريق تحرير النص المكتوب، مما يوفر تحكماً بديهياً ويسهل عملية التحرير الصوتي والمرئي. أما أداة «سنثيجيا» Synthesia، فتركز على إنشاء فيديوهات باستخدام شخصيات رقمية (أفاتار) عالية الجودة مع دعم العديد من اللغات، مما يجعلها مثالية لقطاع التعليم الإلكتروني وإنشاء المحتوى التوضيحي.

تبسيط مهام التحرير المعقدة

ومن جهتها تقدم أداة «وايزكات» Wisecut حلاً لتبسيط عملية تحرير الفيديو، حيث تستخدم الذكاء الاصطناعي لاكتشاف أبرز اللقطات وتزيل فترات الصمت تلقائياً، وتضيف موسيقى خلفية بذكاء، وتقوم بإنشاء تسميات توضيحية وترجمات تلقائية مما يسهل على المبتدئين إنتاج مقاطع فيديو سلسة وجذابة.

وتقدم أدوات أخرى نهجاً شاملاً أو تتكامل مع برامج التحرير الاحترافية، مثل «ماجيستو» Magisto من «فيميو» Vimeo التي تُعتبر منصة لإنشاء وتحرير الفيديوهات تعتمد على الذكاء الاصطناعي، حيث تقوم بتحليل اللقطات بصرياً وصوتياً وسردياً لتحديد الأجزاء الأكثر إثارة للاهتمام، ثم تقوم بتجميع الفيديو بسلاسة بناء على النمط والقالب المختار، مما يجعل إنشاء الفيديو متاحاً للمستخدمين دون مهارات تحرير متقدمة.

برامج احترافية وحلول شاملة

أما برنامج «أدوبي بريميير برو» Adobe Premiere Pro، فيعزز سير عمل التحرير بميزات الذكاء الاصطناعي المدعومة بتقنية «سينساي إيه آي» Sensei AI. وتشمل هذه الميزات Generative Extend لإضافة أجزاء من الفيديو وتمديد الصوت، وMedia Intelligence للبحث عن العروض باستخدام اللغة الطبيعية والترجمة التلقائية للتسميات التوضيحية والتحرير المستند إلى النص وتصنيف الصوت بالذكاء الاصطناعي وتحسين الكلام واكتشاف تحرير المشاهد وتصحيح الألوان تلقائياً، إضافة إلى ميزات أخرى مهمة مثل Morph Cut وColor Match وRemix وAuto Ducking وAuto Reframe لتبسيط المهام المعقدة وتوفير الوقت.

أدوات لتحويل المحتوى المكتوب وتحرير الفيديو الشامل

وتكمل هذه المجموعة أدوات أخرى تركز على تحويل المحتوى المكتوب إلى فيديو أو تقديم مجموعة واسعة من أدوات التحرير المدعومة بالذكاء الاصطناعي، ومنها «لومين 5» Lumen 5 التي تُعتبر منصة لإنشاء الفيديو عبر الإنترنت تحول المحتوى النصي، مثل منشورات المدونات أو النصوص، إلى فيديوهات احترافية في دقائق، حيث يختار الذكاء الاصطناعي تلقائياً المقاطع والصور ذات الصلة ويوفر قوالب ومكتبة وسائط ضخمة.

وتقدم أداة «كابوينغ» Kapwing محرر فيديو مدعوماً بالذكاء الاصطناعي يضم أدوات لإنشاء النصوص البرمجية وترجمة الفيديو إلى أكثر من 30 لغة، وتوليد لقطات مختصرة B-Roll وتنظيف الصوت، وإزالة الصمت تلقائياً وتحويل النص إلى كلام وتصحيح التواصل البصري ومزامنة الشفاه وفصل الأصوات.

وأخيراً، تقدم أداة «فيد.آي أو» Veed.io مجموعة شاملة من ميزات الذكاء الاصطناعي لأتمتة مهام تحرير الفيديو، بما في ذلك التسميات التوضيحية التلقائية وتحويل النص إلى كلام وإزالة ضوضاء الخلفية أو خلفية الفيديو ونسخ الفيديو وتوليد الصور والموسيقى بالذكاء الاصطناعي وترجمة الفيديو وتصحيح التواصل البصري وإنشاء شخصيات افتراضية بالذكاء الاصطناعي وميزة القص السحري Magic Cut التي تختصر ساعات من التحرير وقص الفيديو يدوياً.


مقالات ذات صلة

تحذير لمستخدمي «ChatGPT»: دعوات مزيفة عبر «أوبن إيه آي»

تكنولوجيا يستغل المحتالون ميزات الدعوات الرسمية في «OpenAI» لإرسال رسائل احتيالية تبدو موثوقة تقنياً (شاترستوك)

تحذير لمستخدمي «ChatGPT»: دعوات مزيفة عبر «أوبن إيه آي»

يحذّر خبراء «كاسبرسكي» من أسلوب احتيالي جديد يستغل دعوات «أوبن إيه آي» الرسمية لخداع مستخدمي «ChatGPT» ودفعهم إلى الروابط والمكالمات الوهمية.

نسيم رمضان (لندن)
الاقتصاد الخريّف يتحدث في إحدى الجلسات التي استضافها «البيت السعودي» على هامش اجتماعات دافوس (الشرق الأوسط)

وزير الصناعة السعودي من دافوس: علاقة التكنولوجيا والتعدين «تكافلية»

شدد وزير الصناعة والثروة المعدنية السعودي، بندر الخريّف، على وجود «علاقة تكافلية» بين التكنولوجيا والتعدين.

«الشرق الأوسط» (دافوس)
تكنولوجيا تعمل «أبل» على إعادة تصميم «سيري» لتتحول من منفذة أوامر إلى مساعد حواري سياقي شبيه بـ«ChatGPT» (شاترستوك)

ماذا يعني أن تصبح «سيري» شبيهة بـ«ChatGPT»؟

تعمل «أبل» على تحويل «سيري» إلى مساعد شبيه بـ«ChatGPT»، يركز على السياق والتنفيذ والخصوصية، في خطوة تعكس تغير تفاعل المستخدمين مع الذكاء الاصطناعي.

نسيم رمضان (لندن)
الاقتصاد رئيس البنك الدولي يتحدث في جلسة خاصة بالاقتصاد السعودي في دافوس (الشرق الأوسط)

رئيس البنك الدولي من دافوس: الأسواق الناشئة تواجه مشاكل هيكلية ونظامية

قدّم رئيس مجموعة البنك الدولي، أجاي بانغا، خلال جلسة حول الاقتصاد السعودي في دافوس، خريطة طريق للفصل بين التقلبات العابرة والأزمات الهيكلية الجسيمة.

«الشرق الأوسط» (دافوس)
الاقتصاد إيلون ماسك يتحدث في جلسة حوارية بدافوس (إ.ب.أ)

ماسك في «إطلالة دافوس»: الذكاء الاصطناعي سيتجاوز عقل الإنسان بحلول نهاية 2026

سجل الملياردير الأميركي إيلون ماسك حضوراً طاغياً في منتدى دافوس الاقتصادي، يوم الخميس، مُنهياً سنوات من الجفاء والتوتر مع منظمي المنتدى.

«الشرق الأوسط» (دافوس)

تحذير لمستخدمي «ChatGPT»: دعوات مزيفة عبر «أوبن إيه آي»

يستغل المحتالون ميزات الدعوات الرسمية في «OpenAI» لإرسال رسائل احتيالية تبدو موثوقة تقنياً (شاترستوك)
يستغل المحتالون ميزات الدعوات الرسمية في «OpenAI» لإرسال رسائل احتيالية تبدو موثوقة تقنياً (شاترستوك)
TT

تحذير لمستخدمي «ChatGPT»: دعوات مزيفة عبر «أوبن إيه آي»

يستغل المحتالون ميزات الدعوات الرسمية في «OpenAI» لإرسال رسائل احتيالية تبدو موثوقة تقنياً (شاترستوك)
يستغل المحتالون ميزات الدعوات الرسمية في «OpenAI» لإرسال رسائل احتيالية تبدو موثوقة تقنياً (شاترستوك)

حذّر خبراء أمن سيبرانيون مستخدمي «شات جي بي تي» (ChatGPT) ومنصات «أوبن إيه آي» الأخرى من أسلوب احتيالي جديد يستغل آلية إرسال الدعوات داخل المنصة، ما يجعل رسائل احتيالية تبدو وكأنها صادرة رسمياً من «أوبن إيه آي».

وبحسب رصد حديث أجرته شركة «كاسبرسكي»، فقد اكتشف باحثوها أن مهاجمين باتوا يسيئون استخدام ميزات إنشاء «المؤسسات» ودعوة أعضاء الفريق في منصة «OpenAI» لإرسال رسائل احتيالية من عناوين بريد إلكتروني حقيقية تعود إلى الشركة نفسها. هذا الأمر يمنح الرسائل مصداقية تقنية عالية، ويزيد من فرص تجاوزها لفلاتر البريد المزعج وكسب ثقة المتلقين.

ولا يعتمد هذا الأسلوب على اختراق أنظمة «أوبن إيه آي»، بل على التلاعب بخصائص مشروعة صُممت في الأصل لتسهيل التعاون والعمل الجماعي، ثم تحويلها إلى أداة للهندسة الاجتماعية.

مثال على رسالة بريد إلكتروني احتيالية (كاسبرسكي)

كيف تعمل الحيلة؟

تبدأ العملية بإنشاء حساب عادي على منصة «أوبن إيه آي». وخلال التسجيل، يُطلب من المستخدم إنشاء «مؤسسة» وتحديد اسم لها. هذا الحقل مخصص عادة لاسم شركة أو فريق، لكنه يسمح بإدخال رموز ونصوص متنوعة.

يستغل المحتالون هذه المرونة لإدراج عبارات مضللة مباشرة في اسم المؤسسة، مثل رسائل تحذيرية أو عروض زائفة، وأحياناً أرقام هواتف أو روابط مشبوهة. وبعد إنشاء المؤسسة، تقترح المنصة خطوة «دعوة فريقك»، حيث يُدخل المهاجمون عناوين البريد الإلكتروني للضحايا المستهدفين.

عند إرسال الدعوات، تصل الرسائل من عناوين رسمية تابعة لـ«أوبن إيه آي»، وتظهر للمتلقي على أنها إشعار حقيقي لإضافته إلى مشروع أو فريق عمل. ويحتوي البريد الإلكتروني على القالب المعتاد لدعوات التعاون، لكن النص الاحتيالي الذي أدرجه المهاجم يظهر بشكل بارز داخل الرسالة. ويراهن المحتالون على أن كثيراً من المستخدمين سيركزون على العنوان الموثوق والرسالة المظللة، دون الانتباه إلى عدم منطقية المحتوى أو سبب تلقيهم دعوة لمؤسسة غير معروفة.

أنماط الرسائل الاحتيالية

رصدت «كاسبرسكي» عدة أنواع من الرسائل التي جرى تمريرها بهذه الطريقة. بعضها يروج لخدمات أو عروض احتيالية، بينما يتخذ الآخر طابعاً أكثر خطورة. أحد الأساليب الشائعة هو إرسال إشعارات كاذبة تفيد بتجديد اشتراك مرتفع التكلفة. وتطلب الرسالة من الضحية الاتصال برقم هاتف مرفق «لإلغاء العملية». هذا النوع من الهجمات يُعرف بـ«التصيد الصوتي» (Vishing)، حيث يحاول المحتالون أثناء المكالمة إقناع الضحية بالكشف عن بيانات شخصية أو مالية، أو تنفيذ خطوات تؤدي إلى اختراق إضافي. وفي جميع الحالات، يبقى الهدف دفع المتلقي إلى التصرف بسرعة، سواء عبر الضغط على رابط أو إجراء مكالمة قبل التحقق من صحة الرسالة.

تعتمد الحيلة على إدراج نصوص مضللة داخل اسم «المؤسسة» ثم إرسال دعوات تصل من عناوين بريد رسمية (غيتي)

لماذا تبدو الرسائل مقنعة؟

تكمن خطورة هذا الأسلوب في أن الرسائل ليست مزورة بالطريقة التقليدية. فهي تُرسل عبر قنوات رسمية وتخرج من بنية بريدية حقيقية تابعة للمنصة. لذلك، يختفي كثير من الإشارات التحذيرية المعتادة، مثل عناوين المرسل المشبوهة. ورغم أن محتوى الرسالة غالباً ما يكون غير منسجم مع قالب «دعوة للتعاون»، فإن هذا التناقض قد لا يكون واضحاً للجميع، خصوصاً لمن لا يتوقعون أن تُستغل منصة موثوقة بهذا الشكل. ويرى خبراء أمنيون أن هذه الحالة تسلط الضوء على مشكلة أوسع. حتى الخدمات ذات السمعة الجيدة يمكن أن تتحول إلى أدوات في يد المحتالين إذا أسيء استخدام ميزاتها.

ما الذي ينبغي فعله؟

بالنسبة لمستخدمي «تشات جي بي تي» ومنصات «أوبن إيه آي» عموماً، تشكل هذه الحملة تذكيراً بأهمية الحذر، حتى عند تلقي رسائل تبدو رسمية. وينصح الخبراء بالتعامل مع أي دعوة غير متوقعة بشكّ، خصوصاً إذا تضمنت لغة استعجال أو مطالب مالية أو أرقام هواتف. كما يُفضل تجنب الضغط على الروابط المضمنة أو الاتصال بالأرقام المذكورة في رسائل مشبوهة. وإذا كانت هناك حاجة فعلية للتواصل مع الدعم، فمن الأفضل زيارة الموقع الرسمي للخدمة والبحث عن بيانات الاتصال هناك.

كما أن الإبلاغ عن الرسائل المشبوهة للمنصة يساعد في الحدّ من انتشارها، في حين يظل تفعيل المصادقة الثنائية خطوة مهمة لتعزيز الأمان، حتى إن لم يعتمد هذا النوع من الاحتيال على اختراق الحسابات مباشرة. ورغم أن هذه الحملة تستهدف الأفراد، فإنها تطرح أيضاً تساؤلات أوسع أمام الشركات التي تدير منصات تعاونية. فالأدوات المصممة لتسهيل الانضمام والعمل الجماعي قد تتحول إلى نقاط ضعف إذا لم تُقيّد أو تُراقب بشكل كافٍ.


ماذا يعني أن تصبح «سيري» شبيهة بـ«ChatGPT»؟

تعمل «أبل» على إعادة تصميم «سيري» لتتحول من منفذة أوامر إلى مساعد حواري سياقي شبيه بـ«ChatGPT» (شاترستوك)
تعمل «أبل» على إعادة تصميم «سيري» لتتحول من منفذة أوامر إلى مساعد حواري سياقي شبيه بـ«ChatGPT» (شاترستوك)
TT

ماذا يعني أن تصبح «سيري» شبيهة بـ«ChatGPT»؟

تعمل «أبل» على إعادة تصميم «سيري» لتتحول من منفذة أوامر إلى مساعد حواري سياقي شبيه بـ«ChatGPT» (شاترستوك)
تعمل «أبل» على إعادة تصميم «سيري» لتتحول من منفذة أوامر إلى مساعد حواري سياقي شبيه بـ«ChatGPT» (شاترستوك)

تستعد «سيري»، المساعد الصوتي من شركة «أبل»، لأكبر تحول في تاريخها منذ إطلاقها قبل أكثر من عقد. فحسب تقارير متطابقة من وسائل إعلام تقنية، تعمل «أبل» على إعادة تصميم «سيري» لتتحول من أداة تعتمد على الأوامر الصوتية البسيطة إلى مساعد حواري متقدم، قادر على إجراء محادثات سياقية طويلة، على غرار «شات جي بي تي» (ChatGPT) وغيره من روبوتات الدردشة التوليدية.

لطالما واجهت «سيري» انتقادات بسبب محدودية فهمها للغة الطبيعية مقارنة بمنافسين مثل مساعد «غوغل» ونماذج الذكاء الاصطناعي التوليدي الحديثة. ففي الوقت الذي أصبحت فيه روبوتات الدردشة قادرة على تلخيص المعلومات وشرح المفاهيم المعقدة، والتفاعل مع المستخدمين بسلاسة، بقيت «سيري» مرتبطة بمهام أساسية، مثل ضبط المنبهات أو فتح التطبيقات، مع تحسينات تدريجية لم تغيّر جوهر التجربة.

اليوم، يبدو أن «أبل» تعترف بأن هذا النهج لم يعد كافياً.

من الأوامر إلى الحوار

تُشير التقارير إلى أن «أبل» تعمل على تحويل «سيري» إلى مساعد حواري متكامل، يستطيع متابعة السياق والرد عبر الصوت أو النص، والتعامل مع الأسئلة المركبة بطريقة أكثر طبيعية. ويُمثل هذا التحول قطيعة مع التصميم التقليدي لـ«سيري»، الذي بُني أساساً على تنفيذ أوامر محددة بدلاً من إجراء حوار مفتوح.

ووفق ما نُشر، تعتمد «أبل» في هذه المرحلة على دمج تقنيات ذكاء اصطناعي توليدي متقدمة، من بينها نماذج مثل «جيميناي» من «غوغل» ضمن إطارها الخاص المعروف باسم «ذكاء أبل» (Apple Intelligence). ولا يعني ذلك التخلي عن تطويرها الداخلي، بل الاستفادة من أفضل النماذج المتاحة لتعزيز قدرات «سيري» اللغوية والحوارية. الهدف هو جعل التفاعل مع «سيري» أقرب إلى محادثة حقيقية، بدلاً من سلسلة أوامر منفصلة، وهو ما أصبح معياراً جديداً في عالم المساعدات الذكية.

«سيري» ستستفيد من «غوغل جيميناي» لتعزيز الحوار والسياق ضمن توجه «أبل» لمواكبة الذكاء الاصطناعي التفاعلي (شاترستوك)

استجابة متأخرة

يأتي هذا التحول فيما تتسارع المنافسة على الذكاء الاصطناعي الحواري، فقد اعتاد المستخدمون خلال العامين الماضيين أدوات قادرة على إنتاج نصوص وشرح أفكار والمساعدة في التخطيط واتخاذ القرار. وفي المقابل، بدا أن «أبل» تتحرك بوتيرة أبطأ، مع تركيز واضح على الخصوصية والاستقرار بدل السبق التقني.

ورغم أن الشركة بدأت سابقاً دمج «ChatGPT» خياراً مساعداً ضمن بعض ميزات «ذكاء أبل»، فإن هذه الخطوة أبرزت الفجوة بين «سيري» التقليدية وتجربة الدردشة التوليدية الحديثة. ومع تزايد الاعتماد اليومي على هذه الأدوات، بات من الصعب على «أبل» تجاهل التحول الجاري في طريقة تفاعل المستخدمين مع التقنية.

الخصوصية في التصميم

على عكس بعض المنافسين، لا يبدو أن «أبل» تسعى إلى تحويل «سيري» إلى مجرد واجهة لخدمة سحابية خارجية، فالتقارير تشير إلى أن جزءاً كبيراً من المعالجة سيجري على الجهاز نفسه أو عبر خوادم خاضعة لسيطرة «أبل»، بما ينسجم مع سياستها التقليدية في تقليل جمع البيانات وحماية خصوصية المستخدم. هذا التوازن بين القدرات المتقدمة والخصوصية قد يكون العامل الفارق في تجربة «سيري» الجديدة، لكنه في الوقت نفسه يفرض قيوداً تقنية قد تؤثر في سرعة التطوير مقارنة بمنافسين يعتمدون بشكل أوسع على الحوسبة السحابية.

«سيري» الجديدة تستهدف التكامل العميق مع النظام لفهم ما على الشاشة وربط التطبيقات وتنفيذ مهام متعددة بطلب واحد (شاترستوك)

أكثر من دردشة

ولا يقتصر طموح «أبل» على جعل «سيري» أكثر بلاغة فحسب، بل على جعلها أكثر فاعلية، فالتقارير تُشير إلى أن النسخة الجديدة ستكون قادرة على فهم ما يجري على شاشة الجهاز، وربط المعلومات بين التطبيقات، وتنفيذ مهام متعددة بناءً على طلب واحد بلغة طبيعية. بهذا المعنى، لا تسعى «أبل» إلى تقديم «روبوت دردشة» فقط، بل إلى مساعد ذكي قادر على التحرك داخل النظام، وإدارة المهام اليومية، والتفاعل مع محتوى المستخدم وسياقه. وهذا يعكس توجهاً أوسع في صناعة التقنية نحو ما يُعرف بـ«الذكاء القابل للتنفيذ»؛ حيث لا يكتفي النظام بالإجابة بل يتخذ إجراءً.

ماذا يعني ذلك للمستخدمين؟

من المتوقع أن تكشف «أبل» عن ملامح هذا التحول خلال مؤتمرها السنوي للمطورين في شهر يونيو (حزيران) المقبل، على أن تُطرح التجربة الجديدة ضمن الإصدارات المقبلة من أنظمة «iOS» و«macOS» و«iPadOS». وإذا نجحت الشركة في تنفيذ رؤيتها، فقد تصبح «سيري» جزءاً أكثر مركزية في الحياة الرقمية اليومية لمستخدمي أجهزة «أبل».

لكن التحدي لا يزال قائماً، فالمستخدمون الذين اعتادوا مرونة وسرعة أدوات مثل «ChatGPT» ستكون لديهم توقعات عالية. وسيُقاس نجاح «سيري» الجديدة بمدى قدرتها على الجمع بين الحوار العميق، والتنفيذ العملي، والخصوصية من دون التضحية بتجربة الاستخدام.


روبوتات تفكر وتتحرك: ما الذي يميّز «Rho-Alpha» من «مايكروسوفت»؟

نموذج «Rho-Alpha» يدمج الرؤية واللغة والفعل في إطار تعلم واحد ما يمكّن الروبوتات من التفاعل مع العالم المادي بمرونة أعلى (مايكروسوفت)
نموذج «Rho-Alpha» يدمج الرؤية واللغة والفعل في إطار تعلم واحد ما يمكّن الروبوتات من التفاعل مع العالم المادي بمرونة أعلى (مايكروسوفت)
TT

روبوتات تفكر وتتحرك: ما الذي يميّز «Rho-Alpha» من «مايكروسوفت»؟

نموذج «Rho-Alpha» يدمج الرؤية واللغة والفعل في إطار تعلم واحد ما يمكّن الروبوتات من التفاعل مع العالم المادي بمرونة أعلى (مايكروسوفت)
نموذج «Rho-Alpha» يدمج الرؤية واللغة والفعل في إطار تعلم واحد ما يمكّن الروبوتات من التفاعل مع العالم المادي بمرونة أعلى (مايكروسوفت)

يشهد الذكاء الاصطناعي تقدماً سريعاً في فهم اللغة والصور، إلا أن تحويل هذا الذكاء إلى أفعال ملموسة في العالم الحقيقي لا يزال أحد أكثر التحديات تعقيداً في مجال الحوسبة. وفي هذا السياق، تخطو أبحاث «مايكروسوفت» خطوة مهمة نحو سد هذه الفجوة، من خلال الكشف عن أعمال جديدة تهدف إلى تمكين الروبوتات من الإدراك والتفكير والتنفيذ بفاعلية أكبر داخل البيئات المادية الديناميكية.

وفي صميم هذا التوجه يأتي نموذج جديد يُعرف باسم «Rho-Alpha»، وهو نموذج يجمع بين الرؤية واللغة والفعل، ويهدف إلى مساعدة الروبوتات على تجاوز السلوكيات المبرمجة مسبقاً، والعمل بدرجة أعلى من الاستقلالية. ويعكس هذا النموذج طموح «مايكروسوفت» الأوسع في تطوير أنظمة ذكاء اصطناعي لا تكتفي بفهم المعلومات الرقمية، بل قادرة أيضاً على التفاعل مع العالم الفيزيائي بطرق أكثر مرونة وواقعية.

دمج الإدراك والفعل

على عكس الأنظمة الروبوتية التقليدية التي تعتمد على سلاسل هندسية منفصلة حيث تُعالج الرؤية والتخطيط والتحكم كوحدات مستقلة، يدمج نموذج «Rho-Alpha» هذه القدرات ضمن إطار تعلم واحد. ويتم تدريب النموذج على تحليل المدخلات البصرية، وفهم التعليمات باللغة الطبيعية، وتوليد أفعال جسدية مناسبة، ما يسمح للروبوتات بالاستجابة بسلاسة أكبر للمهام المعقدة.

ويعالج هذا النهج أحد التحديات المزمنة في عالم الروبوتات، المعروف بمشكلة «الميل الأخير». فعلى الرغم من قدرة نماذج الذكاء الاصطناعي على التعرف على الأشياء أو تنفيذ أوامر محددة، فإنها غالباً ما تفشل عند حدوث تغييرات غير متوقعة في البيئة. فاختلاف بسيط في الإضاءة أو موقع الأجسام أو سلوك البشر قد يؤدي إلى تعطل الأنظمة التقليدية. وتسعى أبحاث «مايكروسوفت» إلى جعل الروبوتات أكثر قدرة على التكيف من خلال ربط قراراتها بالسياق الواقعي بدلاً من القواعد الجامدة.

تعلم يتجاوز المختبر

يستند نموذج «Rho-Alpha» إلى التطورات الحديثة في النماذج التأسيسية، مستفيداً من مفاهيم النماذج اللغوية الضخمة والأنظمة متعددة الوسائط، مع تكييفها لمتطلبات التفاعل المادي. وبدلاً من تعلم المهام بشكل منفصل، يستطيع النموذج التعميم عبر سيناريوهات مختلفة، ما يمكّن الروبوتات من التعامل مع أشياء أو تعليمات لم تُصادفها صراحة أثناء التدريب. وتُعد هذه القدرة أساسية لنشر الروبوتات خارج المختبرات والبيئات الخاضعة للتحكم. وتصف أبحاث «مايكروسوفت» هذا العمل بأنه جزء من رؤية أوسع لما يُعرف بـ«الذكاء الاصطناعي المتجسد»، حيث يتشكل الذكاء ليس فقط من البيانات، بل من التفاعل المباشر مع العالم المادي. وفي هذا الإطار، تصبح الرؤية والفعل عنصرين متلازمين، ما يسمح للآلات بالتعلم من التجربة بأسلوب أقرب إلى السلوك البشري.

آفاق التطبيق العملي

تتعدد التطبيقات المحتملة لهذه التقنيات عبر قطاعات مختلفة. ففي البيئات الصناعية، يمكن للروبوتات الأكثر مرونة دعم مهام التصنيع والخدمات اللوجيستية التي تتطلب إعادة تهيئة مستمرة. أما في مجالات الرعاية الصحية والخدمات، فقد تساعد هذه الأنظمة في تنفيذ أنشطة يومية تتطلب تفاعلاً مباشراً مع البشر وبيئات غير متوقعة. ورغم أن «مايكروسوفت» لم تعلن عن منتجات تجارية قائمة على «Rho-Alpha»، فإن هذا البحث يسلط الضوء على قدرات أساسية قد تُمهّد لتطبيقات مستقبلية.

تؤكد «مايكروسوفت» أن التقدم في مجال الذكاء الاصطناعي للعالم المادي لا يقتصر على الأداء التقني فحسب، بل يشمل أيضاً اعتبارات السلامة والموثوقية ومواءمة الأنظمة مع النيات البشرية. فالروبوتات ذاتية التشغيل يجب أن تكون قادرة على فهم التعليمات بدقة، والتعامل مع الحالات الاستثنائية، خصوصاً في البيئات المشتركة مع البشر. لذلك، لا تركز الأبحاث على تعزيز القدرات فقط، بل أيضاً على المتانة والتصميم المسؤول.

يعتمد النموذج على مفهوم الذكاء الاصطناعي المتجسّد حيث يتعلم الروبوت من التجربة المباشرة والتفاعل مع البيئة كما يفعل البشر (مايكروسوفت)

من الذكاء إلى الفعل

يعكس إطلاق نموذج «Rho-Alpha» تحولاً أوسع في صناعة التكنولوجيا. فمع تزايد قدرات الذكاء الاصطناعي في السياقات الرقمية، يتجه الاهتمام تدريجياً نحو كيفية تجسيد هذه القدرات في آلات تعمل في العالم الحقيقي. ويطرح هذا التحول أسئلة جديدة حول جمع البيانات والمحاكاة وطرق التقييم، نظراً لأن البيئات المادية أقل قابلية للتنبؤ مقارنة بالبيئات الافتراضية.

وتشير أبحاث «مايكروسوفت» إلى أن المرحلة المقبلة من تطور الذكاء الاصطناعي لن تُقاس فقط بذكاء النماذج، بل بقدرتها على تحويل هذا الذكاء إلى أفعال ملموسة. ومن خلال توحيد الرؤية واللغة والتحكم ضمن إطار واحد، يمثل نموذج «Rho-Alpha» محطة بحثية مهمة في مسار جعل الذكاء الاصطناعي أكثر حضوراً وفاعلية خارج نطاق الشاشات والخوادم.

ومع تلاشي الحدود بين الذكاء الرقمي والأنظمة المادية، قد تُسهم مثل هذه التطورات في إعادة تشكيل طريقة تعاون الروبوتات مع البشر عبر مختلف القطاعات، في تحول تدريجي من آلات مبرمجة إلى شركاء أكثر وعياً بالسياق وقدرة على التكيف مع العالم الحقيقي.