«تشات جي بي تي 4.5» و«غوغل جيميناي 2.0»: صراع العمالقة في عالم الذكاء الاصطناعي

في سباق محموم نحو تطوير الذكاء الاصطناعي، تطل علينا شركتا «أوبن إيه آي» و«غوغل» بإصدارين جديدين يعدان بنقلة نوعية في عالم نماذج اللغة الكبيرة: «تشات جي بي تي 4.5» Chat GPT 4.5 و«غوغل جيميناي 2.0» Google Gemini 2.0، وهما نموذجان يقدِّمان ميزات وقدرات متطورة تجعل منهما أداتين قويتين ومتنوعتين قادرتين على التعامل مع مهام معقدة بكفاءة ودقة عالية.

وسنستعرض في هذا الموضوع أبرز المزايا التي يقدمها هذان النموذجان ونقارن بينهما في جوانب عدة، لنكشف عن نقاط القوة والضعف في كل منهما ونسلط الضوء على الفروقات التي قد تكون حاسمةً في اختيار النموذج الأنسب لكم.

قفزة «جي بي تي» النوعية

يتجسَّد في «تشات جي بي تي 4.5»، الفهم المحسَّن للسياق. وهو يمثل قفزةً نوعيةً في عالم نماذج اللغة الكبيرة، حيث يأتي بتحسينات ملحوظة في الأداء والقدرات مقارنة بالإصدارات السابقة. وهذه التحسينات تجعله أداةً أكثر قوةً وتنوعاً، قادرةً على التعامل مع مجموعة واسعة من المهام بكفاءة ودقة عالية.

وسنستعرض فيما يلي أبرز المزايا التي يقدِّمها هذا النموذج المطور.

• الميزة الأولى: الفهم المُحسَّن للسياق، حيث يتمتع «تشات جي بي تي 4.5» بقدرة مُحسَّنة على فهم السياق في المحادثات المعقدة والطويلة. وهذا الأمر يعني أنه يمكنه تتبع التفاصيل الدقيقة للمحادثة وفهم العلاقات بين الأفكار المختلفة وتقديم استجابات أكثر دقةً وملاءمة.

وهذه الميزة تجعل النظام أكثر فاعليةً في المهام التي تتطلب فهماً عميقاً للنصوص، مثل تلخيص المستندات الطويلة أو الإجابة عن الأسئلة المعقدة.

• الميزة الثانية: تقديم دقة أعلى في الإجابات، حيث تم تحسينه لتقديم إجابات أكثر دقةً وموثوقيةً، مع خفض الهلوسة أو توليد معلومات خاطئة. وهذا التحسين يجعله أداةً أكثر موثوقيةً للاستخدام في مجموعة متنوعة من المهام المتخصصة، مثل البحث عن المعلومات أو كتابة المحتوى.

• الميزة الثالثة التي يتمتع بها «تشات جي بي تي 4.5»، هي تقديم قدرات إبداعية محسنة، إذ يتمتع بقدرات إبداعية مُطوَّرة تسمح له بتوليد نصوص أكثر إبداعاً وتنوعاً. ويمكن استخدام هذه الميزة لكتابة القصص والشعر والنصوص المتقدمة والمحتوى الإبداعي.

• الميزة الرابعة هي دعم قدرات الوسائط المتعددة؛ حيث تتكامل مع أحدث ميزات «تشات جي بي تي»، بما في ذلك تحميل الملفات والصور وقدرات البحث، وغيرها. ومع ذلك، لا تزال قدرات الوسائط المتعددة مثل الوضع الصوتي ومعالجة الفيديو ومشاركة الشاشة غير مدعومة في هذا الإصدار الجديد.

«جيميناي 2.0»: تكامل مع «غوغل»

يمثل «غوغل جيميناي 2.0» خطوةً ثوريةً في مجال نماذج الذكاء الاصطناعي، حيث يجمع بين قوة التعلم العميق، وقدرات معالجة البيانات الهائلة؛ لتقديم أداء غير مسبوق في مجموعة متنوعة من المهام. ويتميز هذا الإصدار الجديد بقدرته على فهم وتوليد النصوص والصور والصوتيات وعروض الفيديو، مما يجعله نموذجاً متعدد الوسائط، قادراً على التكيف مع احتياجات المستخدمين في مختلف المجالات.

• الميزة الأولى لـ«غوغل جيميناي 2.0» هي دعم الوسائط المتعددة، حيث إن له قدرةً فائقةً على فهم وتوليد المحتوى عبر مختلف الوسائط، بما في ذلك النصوص والصور والصوتيات وعروض الفيديو. ويمكنه تحليل الصور والفيديوهات بدقة عالية وفهم محتواها وتوليد أوصاف نصية دقيقة لها. كما يمكنه توليد الصوتيات وتحويل النصوص إلى كلام منطوق، والعكس. هذه القدرات المتعددة الوسائط تجعله أداةً متقدمةً جداً للإبداع والتواصل والتعلم.

• الميزة الثانية، هي الفهم المتقدم للغات؛ ما يسمح له بتحليل النصوص المعقدة وفهم العلاقات بين الكلمات والجمل بدقة عالية، حيث يمكنه فهم السياق واستخلاص المعلومات المهمة والإجابة عن الأسئلة المعقدة بدقة وموضوعية. وهذا الفهم المتقدم للغة (يشمل فهم اللغة العربية) يجعله أداةً قيّمة للبحث عن المعلومات وتلخيص النصوص والترجمة بين اللغات المختلفة وكتابة المحتوى.

• الميزة الثالثة: تحسن الإصدار من حيث قدرات كتابة النصوص البرمجية، وذلك نتيجة تحسينه للتعامل مع المهام البرمجية المعقدة، حيث يمكنه فهم وتوليد النصوص البرمجية بلغات البرمجة المختلفة وتصحيح الأخطاء واقتراح التحسينات للنصوص الحالية. وهذه القدرات البرمجية تجعله مرجعاً مهماً للمطورين والمبرمجين، حيث يمكنهم استخدامه لكتابة النصوص بشكل أسرع وأكثر كفاءة.

• الميزة الرابعة، وهي تكامله السلس مع خدمات «غوغل»، حيث يتكامل الإصدار الجديد بسلاسة مع مجموعة واسعة من خدمات «غوغل»؛ ما يجعله متاحاً للمستخدمين في مختلف التطبيقات والمنصات. ويمكن استخدامه في محرك البحث و«مساعد غوغل» والخدمات السحابية لـ«غوغل» التي تشمل «وثائق غوغل» وجداول الحسابات وعروض التقديم، وغيرها من الخدمات الأخرى. هذا التكامل السلس يجعل من الإصدار الجديد أداةً عالية الكفاءة للبحث عن المعلومة وإنجاز المهام والتواصل مع الآخرين.

مقارنة بين الإصدارين الجديدين

ولدى طلب التخطيط لقضاء إجازة في منطقة، قدَّم «تشات جي بي تي 4.5» خط سير مفصلاً مع اقتراحات للسير لمسافات طويلة، وأماكن لتناول الطعام، وخيارات للسكن، إلى جانب نصائح حول كيفية الوصول إلى الوجهة. وفي المقابل، قدَّم «غوغل جيميناي 2.0» مقترحات جيدة للسير لمسافات طويلة وتناول الطعام، ولكنه كان أقل تحديداً حول أماكن السكن.

وفي ما يتعلق بالترجمة، قدم كلا النموذجين ترجمات دقيقة بين اللغات العربية والإنجليزية والفرنسية. وكان الفارق الوحيد هو أن «تشات جي بي تي 4.5» قدَّم روابط مع الترجمة. أما لدى سؤال الإصدارين حول حالة الطقس في مدينة الرياض، فقدَّم «غوغل جيميناي 2.0» حالة الطقس الحالي، بينما قدم «تشات جي بي تي 4.5» توقعات لكل ساعة مع صور وكلمات تصف حالة الطقس.

وفي الخلاصة، لا يمكن اعتبار أي منهما أفضل بشكل قاطع من الآخر، على الرغم من وجود بعض الاختلافات الطفيفة بينهما، والتي قد لا تكون ملحوظةً في الاستخدامات اليومية العادية. ويُنصح بالتحقق من جميع النتائج حتى لا يقع المستخدم في مشكلة الهلوسة (تأليف الذكاء الاصطناعي للمعلومة التي لا يعرفها لتبدو وكأنها حقيقية).

النموذجان متقدمان والاختيار بينهما يعتمد على تفضيلات المستخدمين بشكل فردي. ولكن يبقى فارق أخير بينهما يستحق الذكر، وهو أن «غوغل جيميناي 2.0» يسمح بتحميل الملفات والوثائق الكبيرة وتلخيصها والإجابة عن أي استفسارات مرتبطة بها بشكل مجاني، مقارنة باشتراك مدفوع في «تشات جي بي تي 4.5» وقيوده فيما يتعلق بحجم الملفات وعدد مرات استخدام هذا الميزة في اليوم الواحد.

«أبل» تؤجّل ميزات الذكاء الاصطناعي الجديدة

من جهتها أعلنت «أبل» تأجيل إطلاق النسخة المُحدَّثة من مساعدها الصوتي «سيري» التي كان من المفترض أن تُقدِّم قدرات متطورة لفهم السياق الشخصي وتنفيذ المهام داخل التطبيقات. وأوضحت الشركة أنها ستطلق هذه التحديثات خلال العام المقبل دون تحديد موعد دقيق لذلك. ويأتي هذا التأجيل نتيجة لصعوبات واجهت «أبل» في تطوير «سيري» المحدث، وإدراكها أن خططها لربط المساعد الصوتي بنموذج لغة كبير لتعزيز قدراته قد تستغرق سنوات عدة لتنضج بالشكل المرغوب، مقارنة بقدرات «سامسونغ» للذكاء الاصطناعي التي أطلقتها في سلسلة هواتفها «غالاكسي إس 25»، التي أطلقتها في شهر فبراير (شباط) الماضي، والتي تدعم تنفيذ المهام داخل التطبيقات بشكل مدمج.

وكانت «أبل» قد قدَّمت «سيري» المطور بوصفه جزءاً أساسياً من رؤيتها لـ«ذكاء أبل»، حيث وعدت بقدرة المساعد الصوتي على فهم ما يحدث في الجوال وتنفيذ الإجراءات داخل التطبيقات. ولكن ما تم إطلاقه حتى الآن يقتصر على ميزات مبسطة مثل الكتابة إلى «سيري» وفهم وشرح ميزات منتجات «أبل» وتحسينات بصرية، وتكامل مع «تشات جي بي تي».

«تشات جي بي تي 4.5» و«غوغل جيميناي 2.0»: صراع العمالقة في عالم الذكاء الاصطناعي

مقارنة بين النموذجين الأحدث... ونظرة على قدراتهما