عام 2025: ثورة في عالم نماذج الذكاء الاصطناعي

أعادت خدمة «ديب سيك» Deepseek نظر الشركات الأميركية القيادية حالياً في الخدمات التي تقدمها بأسعار مرتفعة، وقامت بتحديث تلك الخدمات بعد إطلاق «ديب سيك» بشكل فوري، لتحافظ على ماء وجهها أمام المستخدمين والمستثمرين على حد سواء. وكما هو متوقع، قامت كل من «أوبن إيه آي» و«غوغل» و«مايكروسوفت» بإطلاق نماذج جديدة من «تشات جي بي تي» و«جيميناي» و«كوبايلوت» مقدمة خدمات مجانية وقدرات إضافية للمستخدمين، وسنتعرف في هذا الموضوع على أبرز تلك المزايا.

يتفوق نموذج «أو3-ميني» على إصدارات «تشات جي بي تي» السابقة بشكل كبير

«تشات جي بي تي أو3-ميني»

طرحت «أوبن إيه آي» نموذج «تشات جي بي تي أو3-ميني» ChatGPT o3-mini لأصحاب الحسابات المجانية، الذي يقدم سرعة أداء ودقة أعلى مقارنة بالإصدارات السابقة، تصل إلى 24 في المائة أسرع في تقديم الإجابات، بجانب زيادة قدراته في حل مسائل الرياضيات والعلوم والبرمجة والمسائل المتعلقة بالاستنباط المنطقي. ويعرض هذا النموذج خطوات الوصول إلى الإجابة عوضاً عن تقديمها مباشرة، على غرار «ديب سيك».

ويُعد هذا النموذج نسخة مصغرة من نموذج «أو3»، الأمر الذي من شأنه خفض تكاليف التشغيل وزيادة سرعة الأداء من خلال اعتماد «أو3-ميني» على ما يُعرف بـ«تقطير المعرفة» Knowledge Distillation من نماذجها، والتي تعني نقل المعرفة من نموذج ذكاء اصطناعي متقدم إلى نموذج أصغر وأعلى كفاءة، بهدف رفع مستويات الأداء، عوضاً عن تدريب ذلك النموذج المصغر من الصفر على كميات ضخمة جداً من البيانات. وتوفر الشركة هذا النموذج في 3 مستويات هي الأساسية والمتوسطة والعالية.

تفوق مطلق في الاختبارات

وتمت مقارنة هذا النموذج مع نماذج سابقة شملت o1-preview وo1 إضافة إلى مقارنة مستوياته الثلاثة o3-mini Low وo3-mini Medium وo3-mini High؛ حيث تفوق نموذج o3-mini High على جميع المستويات والنماذج السابقة بشكل واضح في عدة اختبارات، منها اختبار SWE-bench لدقة البرمجيات (بنسبة 49.3 في المائة مقارنة بـ41.3 في المائة و48.9 في المائة و40.8 في المائة و42.9 في المائة لـo1-preview وo1 وo1-mini وo3-mini Low)، واختبار FrontierMath لحل المسائل الرياضية (بنسبة 20 في المائة مقارنة بـ12.8 في المائة لكل من o1 وo1-mini).

كما تفوق هذا النموذج السريع في اختبار Graduate-level Good-proof Q&A GPQA لتقييم قدرة نماذج الذكاء الاصطناعي على الإجابة على الأسئلة المعقدة التي يصعب العثور على إجابتها في الإنترنت، بدقة وصلت نسبتها إلى 79.7 في المائة (مقارنة بـ78.3 في المائة و78 في المائة و60 في المائة و70.6 في المائة و76.8 في المائة لـo1-preview وo1 وo1-mini وo3-mini Low وo3-mini Medium)، واختبار الرياضيات الأميركي AIME بنسبة 87.3 في المائة (مقارنة بـ56.7 في المائة و83.3 في المائة و63.6 في المائة و60 في المائة و79.6 في المائة لـo1-preview وo1 وo1-mini وo3-mini Low وo3-mini Medium)، واختبار البرمجة Codeforces ELO Score لمهام البرمجة بقيمة 2130 نقطة (مقارنة بـ1258 و1891 و1650 و1831 و2036 نقطة لـo1-preview وo1 وo1-mini وo3-mini Low وo3-mini Medium).

أما بالنسبة لاختبار المعرفة العامة، فتفوق في امتحانين للمعرفة العامة بنسبة 86.9 في المائة (مقارنة بــ85.2 في المائة و84.9 في المائة و85.9 في المائة لنماذج o1-mini وo3-mini Low وo3-mini Medium) و97.9 في المائة (مقارنة بـ90 في المائة و95.8 في المائة و97.3 في المائة لنماذج o1-mini وo3-mini Low وo3-mini Medium). كما تفوق في اختبار المعرفة العامة للرياضيات بنسبة 92 في المائة مقارنة بـ89.9 في المائة و55.1 في المائة و90.8 في المائة لنماذج o1-mini وo3-mini Low وo3-mini Medium، و13.8 في المائة، مقارنة بـ7.6 في المائة و13 في المائة و13.4 في المائة لنماذج o1-mini وo3-mini Low وo3-mini Medium في اختبار المعرفة العامة للحقائق.

كيفية استخدام نموذج «أو3-ميني»

ويمكن لمستخدمي الإصدار المجاني من «تشات جي بي تي» تفعيل «أو3-ميني» باختيار «المنطق» Reason في الجهة السفلية من صندوق الرسائل. أما إن كنت من مستخدمي الإصدارات المدفوعة لـ«تشات جي بي تي» (مثل ChatGPT Plus وTeam وPro)، فيمكنك اختيار المستوى المرغوب من قائمة النماذج في الجهة العلوية لغاية 150 رسالة يومياً، مع توفير النموذج عبر واجهة برمجة التطبيقات API الخاصة بـ«أوبن إيه آي» لدمجه في التطبيقات والبرامج، أو من خلال خدمات «مايكروسوفت أزور» Microsoft Azure و«غيت هاب كوبايلوت» GitHub Copilot.

«البحث العميق»

وعلى صعيد ذي صلة، أضافت الشركة ميزة «البحث العميق» Deep Research التي تقوم بعمليات البحث والتحليل متعدد الخطوات، وإعادة التقييم، في حال عدم الوصول إلى النتيجة المرغوبة أو وفقاً لمعلومات جديدة، ولكن على حساب الوقت المستغرق في ذلك. ويمكن لهذه الميزة تحليل النصوص والصور والملفات (مثل وثائق PDF وجداول الحسابات) في خلال فترة تتراوح بين 5 و30 دقيقة، مع تقديم تحديثات لما يفكر به الذكاء الاصطناعي، والخطوات التي يتبعها للوصول إلى النتيجة على غرار أسلوب «ديب سيك».

وتعمل هذه الميزة بمستوى يعادل مستوى محترفي تحليل الأبحاث، ولكنها تواجه صعوبات تتمثل بعدم التمييز بين المعلومات الموثوقة والشائعات، وعدم القدرة على تحديد دقة بعض النتائج، ما يدل على أهمية التحليل البشري، وعدم الاعتماد على الذكاء الاصطناعي في المجالات المهمة حالياً؛ بل ضرورة استخدامه كأداة للبحث والتلخيص، ومن ثم مراجعة كل ما يشاركه مع المستخدم للتأكد منه.

هذه الميزة متاحة لمشتركي فئة الخدمة Pro، وتقدم 100 عملية استعلام شهرياً، مع وعد الشركة بتقديم عدد أعلى لعمليات الاستخدام لدى تطوير إصدار أعلى كفاءة وسرعة.

وتفوقت هذه الميزة بنسبة 26.6 في المائة لدى تفعيل أدوات التصفح ولغة البرمجة Python في اختبار الذكاء الاصطناعي Humanity’s Last Exam لقياس قدرة النماذج على الإجابة عن أسئلة عالية المستوى، مقارنة بـ3.3 في المائة و13 في المائة لنموذجي GPT-4o وo3-mini.

«جيميناي 2.0 فلاش»

من جهتها، أطلقت «غوغل» أسرع نموذج ذكاء اصطناعي خاص بها إلى الآن اسمه «جيميناي 2.0 فلاش» Gemini 2.0 Flash وبشكل مجاني. وتزداد سرعة الإجابة في هذا النموذج بشكل كبير، ولكن على حساب الدقة، إلا أنه يُعتبر تحسيناً شاملاً أفضل مقارنة بالإصدار السابق «جيميناي 1.5 فلاش».

ويمكن اختيار النموذج المرغوب من قائمة النماذج في الجهة العلوية، بين هذا النموذج ونموذجي «جيميناي 1.5 فلاش» و«جيميناي 1.5 فلاش برو» (سيبقى هذان النموذجان متاحين لبضعة أسابيع مقبلة دون تحديد تاريخ توقفهما عن العمل).

«غوغل» تطرح نموذج «جيميناي 2.0 فلاش» فائق السرعة مجاناً لجميع المستخدمين

ويقدم نموذج «فلاش» نسخة مصغرة من الذكاء الاصطناعي أعلى سرعة، وعادة ما تكون مجانية، بينما توجد نماذج أخرى أقل سرعة ولكنها أفضل في القدرة، مثل نموذج «جيميناي أدفانسد» المدفوع الذي يستطيع تحليل ملفات وثائق ضخمة يصل حجمها إلى 1500 صفحة، إضافة إلى تقديم النماذج المتخصصة Gems في مجالات محددة تناسب الشركات والمحترفين لقاء اشتراكات شهرية.

كما كشفت «غوغل» عن ترقية منصة توليد الصور بالذكاء الاصطناعي، لتعتمد على نموذج «إماجين3» Imagen3 المتقدم الذي يستطيع إيجاد صور واقعية بشكل كبير، بمجرد تقديم وصف نصي للصورة المرغوبة.

«مايكروسوفت كوبايلوت»

وأعلنت «مايكروسوفت» عن إتاحة نموذج «تشات جي بي تي أو1» ChatGPT o1، مجاناً لكافة مستخدمي مساعدها «كوبايلوت» Copilot على الكومبيوترات التي تعمل بنظام التشغيل «ويندوز» أو عبر المتصفح، وذلك ضمن ميزة «التفكير الأعمق» Think Deeper للتعامل مع الأسئلة المعقدة وتحليلها من عدة جوانب، وهي عملية تستغرق نحو 30 ثانية لتقديم إجابة تحليلية عميقة. هذا، وسيعرض «كوبايلوت» خطوات التفكير خلال عملية التحليل وعرض النتيجة، على غرار أسلوب «ديب سيك».

ومن المتوقع أن يشهد عام 2025 نقلة نوعية لتقنيات الذكاء الاصطناعي، لتصبح أكثر تطوراً في المهام المعقدة، مثل المعادلات الرياضية الصعبة، وتطوير الأدوية واللقاحات، والتعرف على الأمراض من الصور الإشعاعية بدقة عالية، وخصوصاً مع انطلاق عصر «وكلاء الذكاء الاصطناعي» AI Agents من «مايكروسوفت» و«غوغل» وغيرها من الشركات المتخصصة، وفي ظل المنافسة مع الشركات الصينية التي بدأت تكشف عن قدراتها المتقدمة والثورية في تقنيات الذكاء الاصطناعي.