في مؤتمر «غوغل» للمطورين «Google I-O» الذي عُقد يوم الثلاثاء، قدم ساندر بيتشاي، الرئيس التنفيذي لشركة «غوغل» تطورات رائدة في مجال الذكاء الاصطناعي تَعِدُ بإعادة تشكيل مشهد التكنولوجيا والتفاعل مع المستخدمين. كان الحدث الأبرز في المؤتمر هو تقديم «جيمناي» بقدرات تشمل التفكير عبر النصوص والصور والفيديو والتعليمات البرمجية. يمثل هذا النهج المبتكر قفزة كبيرة في تحويل أي مدخلات إلى مخرجات، ويمهد الطريق لجيل جديد من تطبيقات الذكاء الاصطناعي.
حدود جديدة في الذكاء الاصطناعي
قبل عام، شاركت «غوغل» خططها الطموحة لـ«جيمناي» عبر طرح نماذجه الأولى التي أظهرت أداءً مميزاً عبر جميع المعايير متعددة الوسائط. استمر هذا التقدم مع تقديم «Gemini 1.5 Pro» وهو نموذج قادر على معالجة مليون رمز في الإنتاج بشكل متسق، مما يضع معياراً جديداً لنماذج الأساس واسعة النطاق.
واليوم يستخدم أكثر من 1.5 مليون مطور نماذج «Gemini» عبر أدوات مختلفة، مستفيدين من إمكاناتها لتصحيح أخطاء التعليمات البرمجية، واكتساب رؤى جديدة، وبناء الجيل التالي من تطبيقات الذكاء الاصطناعي. ويتجلى تأثير «Gemini» عبر مجموعة منتجات «غوغل» بما في ذلك البحث والصور و«Workspace» والبريد الإلكتروني وغير ذلك مما يعرض إمكاناتها التحويلية.
«جيمناي» إلى بحث «غوغل»
أحد أكثر تطبيقات «جيمناي» إثارةً هو دمجه في بحث «غوغل». على مدار العام الماضي، أجابت «غوغل» على مليارات الاستفسارات من خلال تجربة البحث التوليدية، مما سمح للمستخدمين بالبحث بطرق جديدة تماماً، بما في ذلك استخدام استعلامات أطول وأكثر تعقيداً، وحتى البحث بالصور. وكانت النتائج واعدة، مع زيادة استخدام البحث وزيادة رضا المستخدمين، كما تقول الشركة الأميركية.
وخلال مؤتمر المطورين، الثلاثاء، أعلن الرئيس التنفيذي لـ«غوغل» أنه سيتم إطلاق ميزة «AI Overviews» المُجددة بالكامل في الولايات المتحدة هذا الأسبوع، مع خطط للتوسع في مزيد من البلدان قريباً. تعمل هذه التجربة الجديدة على تعزيز قدرات «جيمناي» لإنشاء تجارب بحث أكثر قوة، وتغيير كيفية تفاعل المستخدمين مع المعلومات والعثور عليها على الإنترنت.
اسأل الصور
حصلت «صور غوغل» (Google Photos) على ترقية كبيرة أيضاً مع «جيمناي». تتيح ميزة «اسأل الصور» الجديدة للمستخدمين البحث في مكتبات الصور الخاصة بهم باستخدام استعلامات اللغة الطبيعية. على سبيل المثال، يمكن للمستخدمين أن يطلبوا من «تطبيق الصور» أن يوضح لهم متى تعلَّم أطفالهم السباحة أو كيف تطورت مهاراتهم في السباحة بمرور الوقت. تتجاوز هذه الميزة عمليات البحث البسيطة عن الكلمات الرئيسية، حيث تستخدم «جيمناي» لفهم السياقات المختلفة وتقديم ملخص شامل للذكريات المطلوبة. سيتم طرح تطبيق «Ask Photos» هذا الصيف، مما يوفِّر تجربة بحث أعمق وأكثر سهولة للمستخدمين.
تعدد الوسائط والسياق الطويل
تسمح قدرات «جيمناي» المتعددة الوسائط بمعالجة وربط أنواع مختلفة من المدخلات، مما يؤدي إلى توسيع نطاق الأسئلة التي يمكنه الإجابة عنها بشكل جذري. ويمكّن «Gemini 1.5 Pro» القادر على التعامل مع نافذة سياق مكونة من مليون رمز مميز، المطورين من جلب كميات هائلة من المعلومات، مثل مئات الصفحات النصية، أو ساعات من الصوت أو الفيديو، أو مستودعات التعليمات البرمجية بأكملها. وذكرت «غوغل» أنه جرى طرح هذه الإمكانية للمعاينة على مدار الأشهر القليلة الماضية، مع تحسينات الجودة عبر الترجمة والترميز والاستدلال.
وخلال الحدث صرح بيتشاي أيضاً بأن النسخة المحسنة من «Gemini 1.5 Pro» متاحة الآن لجميع المطورين على مستوى العالم وبشكل مباشر للمستهلكين في «Gemini Advanced» حيث تدعم 35 لغة. وأضاف أنه يتم توسيع نافذة السياق لتشمل مليوني رمز، متاحة في المعاينة الخاصة، مما يدفع حدود ما هو ممكن مع الذكاء الاصطناعي إلى أبعد من ذلك.
تحسين «Google Workspace»
تعمل إمكانات «جيمناي» أيضاً على تحسين «Google Workspace». على سبيل المثال، يمكن لـ«جيمناي» تلخيص جميع رسائل البريد الإلكتروني الأخيرة من المدرسة، وتحديد المعلومات ذات الصلة، وتحليل المرفقات مثل ملفات «PDF». ويمكنه أيضاً تلخيص التسجيلات الطويلة من «Google Meet»، وصياغة الردود على رسائل البريد الإلكتروني. تهدف هذه الميزات، المتوفرة الآن في «Workspace Labs»، إلى جعل الحياة أسهل للمستخدمين من خلال الاستفادة من الذكاء الاصطناعي للتعامل مع المهام المعقدة.
نظرة إلى المستقبل
وبالنظر إلى المستقبل، قدم بيتشاي مفهوم وكلاء الذكاء الاصطناعي، والأنظمة الذكية التي يمكنها التفكير والتخطيط وتنفيذ المهام عبر البرامج والأنظمة تحت إشراف المستخدم. يمكن لهؤلاء الوكلاء التعامل مع المهام المعقدة مثل تنظيم الانتقال إلى مدينة جديدة، والعثور على الخدمات المحلية، وتحديث العناوين عبر مواقع إنترنت متعددة. تمثل هذه الرؤية لوكلاء الذكاء الاصطناعي خطوة مهمة نحو إنشاء أنظمة ذكية يمكنها التفكير في المستقبل ومساعدة المستخدمين بطرق مفيدة.
ولدعم هذه التطورات، تواصل «غوغل» الاستثمار في البنية التحتية المتطورة. وقد أعلن الرئيس التنفيذي لـشركة طرح الجيل السادس من وحدات معالجة Tensor (TPUs)، التي تسمى «Trillium». توفر وحدات (TPU) الجديدة تحسيناً بمقدار 4.7x في أداء الحوسبة لكل شريحة مقارنةً بالجيل السابق، وستكون متاحة لعملاء السحابة في أواخر عام 2024. وإلى جانب وحدات (TPU) ستقدم «غوغل» أيضاً وحدات المعالجة المركزية ووحدات معالجة الرسومات الجديدة، بما في ذلك وحدات معالجة الرسوميات «Blackwell» من «إنفيديا»، لدعم أعباء العمل المختلفة.
«جيمناي» في «خرائط غوغل»
ولم تنسَ «غوغل» تطبيقها الأشهر على الإطلاق «خرائط غوغل»، إذ ستعمل على إدماج قدرات «جيمناي» فيه وتحديداً في واجهة برمجة التطبيقات الموجَّهة إلى المطورين، إذ سيتمكن المطورون من عرض ملخصات الذكاء الاصطناعي للأماكن والمناطق في تطبيقاتهم ومواقعهم الإلكترونية، وستكون تلك الملخصات مبنية على تحليل التعليقات في مجتمع «خرائط غوغل» الذي يضم أكثر من 300 مليون مساهم.
ومع استمرار «غوغل» في تطوير الذكاء الاصطناعي، فإنها تظل ملتزمة التطوير المسؤول. وتشكل مبادرات مثل «الفريق الأحمر» بمساعدة الذكاء الاصطناعي، و«SynthID»، وهي أداة لوضع العلامات المائية على المحتوى الذي ينشئه الذكاء الاصطناعي، جزءاً من هذا الجهد. وشدد بيتشاي على أهمية مجتمع المطورين في قيادة هذه الابتكارات، ودعا الجميع للانضمام إلى تشكيل المستقبل.
سلَّطت «غوغل» في حدث «Google I-O 2024» الضوء على الإمكانات التحويلية للذكاء الاصطناعي، خصوصاً خلال «عصر جيمناي». ومع التقدم في الوسائط المتعددة والسياق الطويل ووكلاء الذكاء الاصطناعي، تستعد الشركة لإحداث ثورة في تفاعلات العملاء وتجاربهم عبر مجموعة منتجاتها.