محاولات جدية لتحسين جودة صوت الهواتف الجوالة

تدني نوعيتها يزيد من استخدام قنوات الاتصال الإنترنتية والرسائل النصية

محاولات جدية لتحسين جودة صوت الهواتف الجوالة
TT

محاولات جدية لتحسين جودة صوت الهواتف الجوالة

محاولات جدية لتحسين جودة صوت الهواتف الجوالة

صوت الاتصالات بالهواتف الجوالة يبدو مريعا، وقد تدنت نوعيته أو جودته مع مرور السنين، خلافا لتطور التقنيات العصرية الأخرى، لتصل أحيانا إلى حد تحول مستخدمي الهاتف إلى الصياح والتلعثم، وعدم فهم مَن في الطرف الآخر. وأسباب ذلك كثيرة ومعقدة، وتعود إلى التقنية السمعية السيئة التي تقطع الصوت إلى أجزاء ومقاطع. وعندما يجري بعد ذلك بث هذه المقاطع عبر اتصال مزدحم، يضيع بعضها، وما يبقى منها الذي يصل إلى الطرف الآخر، يكون مشوشا وغير كامل، أشبه باستخدام لعبة على شاكلة هاتف.
لكن الحل يبدو في الأفق، ففي عام 2010، كان من المفترض للجيل المقبل من الشبكات الهاتفية أن يحول المكالمات إلى وجهتها من دون أي تأخير. وفي عام 2011 كانت شبكات «إل إي تي» التي تدعى أحيانا «4 جي» أي الجيل الرابع، وشيكة الظهور، وتعمل مع هواتف أفضل التي من شأنها تحسين نوعية الاتصالات. لكن تبين بعد ذلك أن الأمر كان مكلفا، وأكثر صعوبة مما توقعته شركات الخدمات الهاتفية، مما جعلها لا تكمل المشروع.

* صوت عالي النقاء
اليوم تحوم في الأفق تقنية جيدة النوعية على شكل صوت «إتش دي» HD عالي الوضوح والنقاء. ورغم أن هذه التقنية واعدة، لكن الخبراء غير متأكدين أنها ستصل إلينا قبل أن نتحول غالبيتنا إلى استخدام «سكايب»، و«غوغل فويس»، أو التوقف عن إجراء المكالمات الهاتفية نهائيا.
وصوت «إتش دي» هذا هو تعبير صناعي للجمع بين انضغاط صوتي أفضل (أي ضغط البيانات الرقمية لكي تأخذ حيزا أقل)، والمجال الواسع العريض للترددات الصوتية، والأجهزة الهاتفية، للوصول إلى صوت أفضل مع إلغاء الضجيج. وصوت «إتش دي» هذا يوسع صوت الهاتف الجوال من نحو أربعة أوكتاف octave (مجموعة من ثمانية وحدات) إلى أكثر من سبعة. وهذا قريب جدا من الصوت البشري الحقيقي، الذي نسمعه عادة يبلغ عشرة أوكتاف.
والنتيجة مكالمات أفضل، وضجيج أقل في الخلفية، مع الأمل بتأخر زمني أقل، ونوعية جيدة كجودة الخطوط الأرضية، أو ربما أفضل.
وكانت «تي موبايل» الشركة الأولى التي طرحت صوت «إتش دي» على شبكاتها. والصوت هذا يعمل حاليا، ولكن مع بعض المحاذير، منها أن يكون الطرفان المتكلمان يستخدمان خدمة «تي - موبايل»، وأن يكونا يستخدمان هاتفا يدعم صوت «إتش دي»، وبالتالي يتوجب لهذا الغرض أن يدعم برنامج الانضغاط المحدد الذي تستخدمه شركة الخدمات الهاتفية.
والهواتف المزودة بكل هذه التقنية هي «آي فون 5»، والأنواع الجديدة من هذا الهاتف، و«سامسونغ غالاكسي إس 3»، والنسخ الجديدة منه، و«إتش تي سي وأن لاين»، وبعض أنواع الهواتف الأخرى القليلة. وبذلك، إن كان أفراد العائلة كلهم يملكون الهواتف الجديدة هذه، ويستخدمون شبكة «تي - موبايل»، يمكنهم التمتع باتصالات جيدة عالية النوعية.
وتقوم شركة «سبرينت» تدريجيا بإضافة صوت «إتش دي» إلى شبكتها، فقد أعلنت عن ذلك في العام الماضي، ولم تفعل شيئا كثيرا حيال ذلك لبضعة شهور، لكن كبير مديريها دان هيس أعلن أخيرا، أن هذا الصوت وصل إلى مائة سوق من أسواقها، بما فيها نيويورك، وشيكاغو، ودالاس، وميامي، تمهيدا لمخطط يغطي الولايات المتحدة برمتها، ويبدأ في أواسط العام الحالي. لكن هيس ذكر أن صوت «إتش دي» سيعمل فقط في الاتصالات التي تجري ضمن شبكة «سيرينت» عبر هواتف تدعم ذلك، نظرا لأن الشركة تستخدم شبكتها القديمة، وتقنية الانضغاط، لإجراء المكالمات بصوت «إتش دي». وهذا من شأنه تضييق مجال الهواتف التي تدعم ذلك بصورة أكثر، نظرا لأن الهواتف القديمة من «آي فون»، مثل «آي فون 5» على سبيل المثال، لا تدعم تقنية الانضغاط لدى «سبرينت»، لكن الجديدة منها تفعل ذلك.
أما بالنسبة إلى شركة «إيه تي أند تي»، و«فيريزون» فلا تزالان تنتظران. فقد ذكرت الأولى في يناير (كانون الثاني) الماضي أنها ستشرع باستخدام صوت «إتش دي» في العام الحالي، في حين لم تأتِ «فيريزون» على ذكر صوت «إتش دي» إلا نادرا، واكتفت مرة بالقول فقط «في وقت ما عام 2014»، ولدى قيام الشركتين بإضافة هذه الخدمة، فإنه من المحتمل أن يجري ذلك ضمن «الصوت عبر إل إي تي».

* قنوات صوتية
ورغم كل هذه الفوضى والاضطراب، يعدّ صوت «إتش دي» تقنية قياسية عادية، استنادا إلى جمعية «جي إس إم» التي تمثل مشغلي الهواتف الجوالة عبر العالم، والتي وضعت قوانين وأحكاما للشبكات وصانعي الهواتف اليدوية الراغبين في استخدام شعارها «صوت إتش دي»، بحيث ندرك جميعنا أننا نستخدم الشيء ذاته.
وفي هذا الصدد يقول ديفيد هاتون مدير المجموعة لشؤون التقنية في حديث نقلته «نيويورك تايمز»، إنه إذا كان جميع شركات الخدمات الهاتفية ومنتجي الهواتف يستخدمون تقنيات متطابقة، «فلا يوجد سبب أن لا تكون تعمل مع جميع الشبكات التي تدعم شعار صوت (إتش دي)».
وفي عام 2011، وجدت «جاي دي باور وشركاؤها» في استطلاع لها أن نوعية المكالمات قد توقفت عند حد معين، مقارنة مع استخدام البيانات والرسائل النصية. ولاحظت الدراسة اتجاها متزايدا نحو استخدام الرسائل النصية، وهو أمر لا يدعو للدهشة، في ضوء تدني جودة المكالمات، والتشويش الحاصل بالسمع، وانقطاع المكالمات فجأة.
وتتعرض شركات الخدمات الهاتفية أيضا إلى ضغط من قبل وسائل الاتصال الأخرى، مثل «سكايب»، و«غوغل فويس»، وتدعم الأولى سلفا صوت «إتش دي» بالنطاق العريض، ويبدو الصوت مدهشا إذا كان الاتصال جيدا. فإذا كنت تملك هاتف «4 جي» فيمكنك استخدام «سكايب» للاتصالات والحصول على تجربة جيدة من الاتصال الهاتفي العادي. و«مايكروسوفت» التي تملك «سكايب» قد قامت بدمجه مع لوحة مفاتيح هاتفية في «ويندوز 8.1»، مما يمكن أي هاتف «ويندوز» تجاوز خدمة شركة الهاتف تماما.
والاتصال الهاتفي عن طريق «سكايب» يستخدم برنامج البيانات في الهاتف، بدلا من الدقائق أثناء المكالمات، وشركات الهاتف لا ترغب في ذلك، بل ترغب في التحكم بالصوت والبيانات عن طريق شبكاتها، مما يعني أنها لا ترغب في تعطيل خدماتها الهاتفية.



3 نماذج ذكاء اصطناعي جديدة من «مايكروسوفت» للصوت والصورة والنص

أطلقت «مايكروسوفت» 3 نماذج «MAI» جديدة تشمل تحويل الصوت إلى نص وتوليد الصوت وإنشاء الصور (مايكروسوفت)
أطلقت «مايكروسوفت» 3 نماذج «MAI» جديدة تشمل تحويل الصوت إلى نص وتوليد الصوت وإنشاء الصور (مايكروسوفت)
TT

3 نماذج ذكاء اصطناعي جديدة من «مايكروسوفت» للصوت والصورة والنص

أطلقت «مايكروسوفت» 3 نماذج «MAI» جديدة تشمل تحويل الصوت إلى نص وتوليد الصوت وإنشاء الصور (مايكروسوفت)
أطلقت «مايكروسوفت» 3 نماذج «MAI» جديدة تشمل تحويل الصوت إلى نص وتوليد الصوت وإنشاء الصور (مايكروسوفت)

أطلقت «مايكروسوفت» 3 نماذج جديدة من الذكاء الاصطناعي ضمن منصة «فاوندري (Foundry)» في خطوة تعكس توجهاً واضحاً نحو بناء منظومة متكاملة تدعم التطبيقات متعددة الوسائط، بدلاً من الاعتماد على نماذج منفصلة لكل استخدام. وبحسب ما ورد في مدونة رسمية للشركة، تشمل النماذج الجديدة «MAI-Transcribe-1» لتحويل الصوت إلى نص، و«MAI-Voice-1» لتوليد الصوت، و«MAI-Image-2» لإنشاء الصور، وهي متاحة حالياً للمطورين عبر «Foundry» وبيئة «MAI Playground».

من نماذج منفصلة إلى منظومة متكاملة

تعكس هذه الخطوة تحولاً في طريقة بناء تطبيقات الذكاء الاصطناعي. فبدلاً من الاعتماد على نموذج واحد شامل، تتجه «مايكروسوفت» نحو تطوير مجموعة من النماذج المتخصصة، كل منها يعالج نوعاً مختلفاً من بيانات الصوت والصورة والنص.

هذا النهج ينسجم مع الاتجاه الأوسع في الصناعة نحو ما يُعَرف بـ«الذكاء الاصطناعي متعدد الوسائط»، حيث يمكن للأنظمة التعامل مع أنواع مختلفة من المدخلات والمخرجات ضمن تجربة واحدة متكاملة.

أحد أبرز النماذج الجديدة هو «MAI-Transcribe-1»، المصمم لتحويل الكلام إلى نَصٍّ بدقة عالية، حتى في البيئات غير المثالية مثل الضوضاء أو تسجيلات الاجتماعات.

تشير «مايكروسوفت» إلى أنَّ النموذج يدعم 25 لغة من أكثر اللغات استخداماً، ويحقِّق أداءً متقدماً وفق معايير قياس معتمدة، مع سرعة معالجة أعلى مقارنة بأنظمة سابقة. كما تمَّ تصميمه للعمل في ظروف واقعية، مثل مراكز الاتصال أو الاجتماعات، حيث تتداخل الأصوات وتختلف جودة التسجيل. هذا التركيز على «البيئة الواقعية» يعكس تحولاً في تصميم النماذج، من الأداء في المختبرات إلى الأداء في الاستخدام الفعلي.

تركز النماذج على الأداء في البيئات الواقعية وسرعة المعالجة وليس فقط نتائج المختبر (مايكروسوفت)

الصوت الاصطناعي

يركز نموذج «MAI-Voice-1» على توليد الصوت، مع محاولة جعل النتائج أكثر واقعية من حيث النبرة والتعبير. ووفقاً للمدونة، يمكن للنموذج إنتاج صوت طبيعي يحافظ على هوية المتحدث حتى في المحتوى الطويل. كما يتيح إنشاء أصوات مخصصة باستخدام عينة قصيرة من التسجيل الصوتي. ويتميَّز كذلك بسرعة عالية، حيث يمكنه توليد دقيقة من الصوت خلال ثانية واحدة تقريباً، ما يفتح المجال أمام استخدامه في تطبيقات مثل المساعدات الصوتية، أو المحتوى الصوتي التفاعلي.

توليد الصور

أما النموذج الثالث الذي يدعى «MAI-Image-2» فيركز على إنشاء الصور مع تحسينات في السرعة والأداء. تشير «مايكروسوفت» إلى أنَّ النموذج يوفِّر سرعة توليد أعلى تصل إلى ضعفين مقارنة بالإصدارات السابقة، مع الحفاظ على جودة مناسبة للاستخدامات الإبداعية مثل التصميم والإعلانات. كما تمَّ تصميمه ليلبي احتياجات المُصمِّمين وصناع المحتوى، من خلال تحسين عناصر مثل الإضاءM، ودقة التفاصيل، والنصوص داخل الصور.

صور أنشأتها «WPP» باستخدام «MAI-Image-2» (مايكروسوفت)

السرعة والتكلفة... عاملان حاسمان

إلى جانب الأداء، تركز «مايكروسوفت» على جانب التكلفة الذي لا يقل أهمية. تشير الشركة إلى أنَّ النماذج الجديدة تقدِّم ما تصفه بـ«أفضل توازن بين السعر والأداء»، مع كفاءة أعلى في استخدام الموارد، بما في ذلك تقليل استهلاك وحدات المعالجة الرسومية (GPU). هذا الجانب يعكس واقعاً متزايد الأهمية في سوق الذكاء الاصطناعي، حيث لم يعد التحدي في بناء النماذج فقط، بل في تشغيلها على نطاق واسع بتكلفة مقبولة.

لا يمكن فصل هذا الإعلان عن استراتيجية «مايكروسوفت» الأوسع في مجال الذكاء الاصطناعي. فإطلاق نماذج داخلية يُعزِّز استقلالية الشركة، ويقلل اعتمادها على شركاء خارجيِّين، في ظلِّ منافسة متزايدة مع شركات مثل «غوغل»، و«أمازون». كما أنَّ دمج هذه النماذج داخل منتجات مثل «كوبايلوت (Copilot)»، و«تيمز (Teams)»، و«بينغ (Bing)» يشير إلى توجه نحو تحويل الذكاء الاصطناعي من ميزة إضافية إلى بنية أساسية داخل المنتجات الرقمية.

تسعى «مايكروسوفت» إلى تحقيق توازن بين الكفاءة والتكلفة في تشغيل نماذج الذكاء الاصطناعي (مايكروسوفت)

من النماذج إلى التطبيقات

رغم أنَّ الإعلان يركز على النماذج نفسها، فإنَّ القيمة الحقيقية تظهر في كيفية استخدامها. تَوفُّر هذه الأدوات للمطورين يعني إمكانية بناء تطبيقات تجمع بين الصوت والنص والصورة ضمن تجربة واحدة.

هذا قد يفتح المجال أمام تطبيقات جديدة، مثل أنظمة تحويل الاجتماعات إلى نصوص قابلة للبحث، ومساعدات صوتية أكثر واقعية، وأدوات تصميم مدعومة بالذكاء الاصطناعي.

في المجمل، يشير إطلاق هذه النماذج إلى مرحلة جديدة في تطور الذكاء الاصطناعي، حيث لم يعد التركيز على نموذج واحد قوي، بل على منظومة متكاملة من النماذج المتخصصة. وبينما لا تزال المنافسة في هذا المجال في مراحل متسارعة، فإنَّ ما يتضح هو أن الاتجاه العام يتجه نحو بناء بنى تحتية للذكاء الاصطناعي، وليس مجرد أدوات منفصلة.


القمر مختبراً... كيف يشكّل «أرتميس» بروفة «ناسا» لرحلات المريخ؟

رواد الفضاء الأربعة في مهمة «أرتميس ‌2» (ناسا)
رواد الفضاء الأربعة في مهمة «أرتميس ‌2» (ناسا)
TT

القمر مختبراً... كيف يشكّل «أرتميس» بروفة «ناسا» لرحلات المريخ؟

رواد الفضاء الأربعة في مهمة «أرتميس ‌2» (ناسا)
رواد الفضاء الأربعة في مهمة «أرتميس ‌2» (ناسا)

تُقدم مهمة «أرتميس ‌2» (Artemis II) من «ناسا» بوصفها أول رحلة مأهولة ضمن برنامج العودة إلى القمر منذ عقود. لكن في الواقع، يمكن فهم ذلك بشكل أدق كمرحلة تمهيدية «أو بروفة» لهدف أبعد وأكثر تعقيداً وهو إرسال البشر إلى المريخ.

فعلى عكس مهام «أبولو» في ستينات القرن الماضي وسبعيناته، التي ركزت على الهبوط قصير المدى والإنجاز الرمزي، صُمم برنامج «أرتميس» حول فكرة الوجود المستدام. وهذا الفرق جوهري في قيمته الاستراتيجية. فالقمر هنا ليس الوجهة النهائية، بل ساحة اختبار تُجرَّب فيها التقنيات والقدرات البشرية ونماذج التشغيل في بيئة فضائية حقيقية، قبل الانتقال إلى رحلات متعددة السنوات نحو المريخ.

رائد الفضاء فيكتور غلوفر يجري فحوص تسرّب على بدلته الفضائية داخل غرفة تجهيز الطاقم (ناسا)

اختبار التقنيات خارج مدار الأرض

يتمثل أحد الأدوار الأساسية لـ«أرتميس» في اختبار التقنيات التي ستكون حاسمة لاستكشاف الفضاء العميق. فبعثات المريخ ستتطلب أنظمة قادرة على العمل بشكل مستقل لفترات طويلة، مع دعم محدود من الأرض.

على سطح القمر، تخطط «ناسا» لاختبار أنظمة دعم الحياة القادرة على إعادة تدوير الهواء والماء بكفاءة لفترات ممتدة. ويجب أن تعمل هذه الأنظمة بشكل موثوق في بيئات يصعب فيها الإمداد، حيث لا مجال للأخطاء. كما ستُختبر أنظمة توليد الطاقة التي تعتمد إلى حد كبير على الطاقة الشمسية في ظروف قاسية، تشمل ليالي قمرية قد تمتد لأسبوعين.

ومن المجالات الأساسية أيضاً، استخدام الموارد المحلية (ISRU)؛ إذ يُعتقد أن القطب الجنوبي للقمر يحتوي على جليد مائي يمكن تحويله أكسجيناً للتنفس وهيدروجيناً كوقود. وإذا ثبتت جدوى ذلك، فقد يقلل الحاجة إلى نقل كميات كبيرة من الموارد من الأرض، وهو أمر يصبح ضرورياً في بعثات المريخ.

كما ستُختبر أنظمة الحركة على السطح، والمساكن، والعمليات الميدانية، بما في ذلك المركبات الجوالة المضغوطة، والوحدات السكنية القابلة للتوسعة، والأنظمة الروبوتية المساندة للرواد.

صورة أيقونية لأثر قدم بسطح القمر خلال السير على القمر في مهمة «أبوبو 11» 20 يوليو 1969 (ناسا)

قدرة الإنسان على التحمل

يطرح إرسال البشر خارج مدار الأرض المنخفض تحديات لم تُختبر بشكل كافٍ منذ حقبة «أبولو». ويوفر «أرتميس» فرصة لدراسة أداء الرواد خلال مهام أطول في بيئات فضائية أكثر قسوة.

ويُعدّ التعرض للإشعاع أحد أبرز هذه التحديات. فعلى عكس رواد محطة الفضاء الدولية، الذين يستفيدون من حماية جزئية يوفرها المجال المغناطيسي للأرض، سيتعرض رواد القمر ومن ثم المريخ لمستويات أعلى من الإشعاع الكوني. وفهم كيفية الحد من هذه المخاطر سيكون أمراً حاسماً.

كما أن العوامل النفسية والبدنية لا تقل أهمية؛ إذ يمكن للعزلة الطويلة وضيق المساحات وتأخر الاتصالات أن تؤثر على أداء الطاقم. ورغم أن القمر يبعد بضعة أيام فقط عن الأرض، فإنه يوفّر بيئة أكثر واقعية من المدار الأرضي لدراسة هذه التأثيرات. ومن المتوقع أن توفر مهام «أرتميس» خاصة تلك التي تتضمن إقامة أطول على سطح القمر، بيانات مهمة لتطوير معايير اختيار الرواد وتدريبهم والتخطيط لبعثات المريخ.

لقطة مقرّبة لوجه رائد الفضاء توماس سترافورد قائد مهمة «أبوبو 10» (ناسا)

بناء لوجيستيات الفضاء وإدارتها

تمثل اللوجيستيات مجالاً آخر يعمل فيه «أرتميس» كمنصة اختبار. فالوجود المستدام على القمر يتطلب تطوير سلاسل إمداد تمتد إلى ما وراء الأرض، تشمل نقل المعدات والوقود والمواد الاستهلاكية عبر مهام متعددة.

ويلعب «Lunar Gateway» دوراً محورياً في هذه المنظومة؛ إذ يُخطط أن يكون محطة مدارية حول القمر تُستخدم نقطةَ انطلاقٍ للبعثات إلى السطح والعودة منه، إضافة إلى كونه منصةً للتعاون الدولي.

ويعكس هذا النهج القائم على توزيع مكونات المهمة عبر منصات متعددة التعقيد المتوقع في بعثات المريخ، حيث يجب تنسيق العمل بين مركبات فضائية، وأنظمة سطحية، وبنية تحتية مدارية.

كما تشمل هذه المنظومة أنظمة الاتصال. فرغم أن القمر يتيح اتصالاً شبه فوري مع الأرض، فإن بعثات المريخ ستشهد تأخراً قد يصل إلى 20 دقيقة في كل اتجاه. لذلك؛ يُعدّ تطوير أنظمة أكثر استقلالية وقدرة على اتخاذ القرار، أمراً ضرورياً، ويشكّل «أرتميس» خطوة وسيطة نحو ذلك.

نموذج تشغيلي جديد

يعكس «أرتميس» أيضاً تحولاً في طريقة تنظيم المهام الفضائية. فبعكس «أبولو» التي كانت تقودها الحكومات بالكامل، يعتمد «أرتميس» بشكل كبير على الشراكات مع القطاع الخاص والجهات الدولية.

فمشاركة الشركات الخاصة مثل تطوير أنظمة الهبوط البشري تُدخل ديناميكيات جديدة تتعلق بالتكلفة والابتكار وتقاسم المخاطر. كما أن التعاون الدولي يوسّع نطاق البرنامج من الناحيتين التقنية والسياسية.

ومن المرجح أن يكون هذا النموذج ضرورياً لبعثات المريخ، التي تتطلب موارد وخبرات تتجاوز قدرات جهة واحدة. وبذلك يُعدّ «أرتميس» ليس فقط منصة اختبار تقنية، بل أيضاً تجربة في الحوكمة والتعاون.

صاروخ «ناسا» العملاق «أرتميس إس إل إس» في مركز كيندي الفضائي (ناسا)

القمر نقطةَ انطلاق

لم يكن اختيار القمر ميدانَ اختبار أمراً عشوائياً. فبفضل قربه من الأرض؛ يمكن تنفيذ مهام متكررة وتدريجية، مع الحفاظ على مستوى مقبول من المخاطر.

ففي حال حدوث خلل، تظل إمكانية التدخل أو الإمداد قائمة، على عكس بعثات المريخ، حيث تصبح هذه الخيارات شبه مستحيلة. وهذا يجعل القمر بيئة مناسبة لاختبار الأنظمة في ظروف واقعية دون تحمل المخاطر الكاملة للرحلات بين الكواكب.

ومع ذلك، لا يمكن تجاهل الفروقات بين القمر والمريخ، فالمريخ يمتلك غلافاً جوياً وجاذبية مختلفة وظروفاً بيئية أكثر تعقيداً. ورغم أن «أرتميس» لا يحاكي هذه العوامل بالكامل، فإنه يسهِم في تقليل درجة عدم اليقين في عناصر أساسية.

أبعد من مجرد عودة

قد يُقلل وصف «أرتميس» بأنه مجرد عودة إلى القمر من فهم غايته الحقيقية. فالبرنامج يمثل انتقالاً من الاستكشاف المؤقت إلى الوجود المستدام، ومن المهام المنفصلة إلى الأنظمة المتكاملة.

وبهذا المعنى، لا يتعلق «أرتميس» بإعادة زيارة وجهة معروفة، بل بالتحضير لوجهة غير مسبوقة. فالتقنيات ونماذج التشغيل والعوامل البشرية التي يجري اختبارها على القمر تشكّل جميعها عناصر أساسية لمهمة أكبر. ويبقى نجاح هذا النهج في تمهيد الطريق إلى المريخ سؤالاً مفتوحاً، في ظل التحديات التقنية والتمويلية وتأخيرات الجدول الزمني.

لكن ما يبدو واضحاً هو المنطق الاستراتيجي وراءه: القمر يوفر بيئة يمكن من خلالها اختبار أسس استكشاف الفضاء العميق. ومن خلال ذلك، يضع «أرتميس» نفسه ليس بوصفه نهاية، بل بوصفه خطوة أساسية نحو الوجهة التالية.


«Gemma 4» من «غوغل»: ذكاء اصطناعي مفتوح يعمل على الأجهزة الشخصية

أطلقت «غوغل» نموذج «Gemma 4» بترخيص مفتوح يتيح الاستخدام والتعديل والنشر دون قيود كبيرة (رويترز)
أطلقت «غوغل» نموذج «Gemma 4» بترخيص مفتوح يتيح الاستخدام والتعديل والنشر دون قيود كبيرة (رويترز)
TT

«Gemma 4» من «غوغل»: ذكاء اصطناعي مفتوح يعمل على الأجهزة الشخصية

أطلقت «غوغل» نموذج «Gemma 4» بترخيص مفتوح يتيح الاستخدام والتعديل والنشر دون قيود كبيرة (رويترز)
أطلقت «غوغل» نموذج «Gemma 4» بترخيص مفتوح يتيح الاستخدام والتعديل والنشر دون قيود كبيرة (رويترز)

توسّع شركة «غوغل» توجهها نحو الذكاء الاصطناعي المفتوح مع إطلاق «غاما4» (Gemma 4)، وهو جيل جديد من النماذج المصممة للعمل، ليس فقط في مراكز البيانات، بل أيضاً محلياً على الأجهزة الشخصية. يعكس هذا التوجه تحوّلاً أوسع في الصناعة نحو جعل الذكاء الاصطناعي المتقدم أكثر إتاحة، مع منح المطورين تحكماً أكبر في كيفية تشغيل هذه الأنظمة ومكانها.

يبني «Gemma 4» على عائلة نماذج «Gemma» التي طرحتها «غوغل» سابقاً كبديل خفيف لنماذجها الأكثر قوة ولكن المغلقة ضمن منظومة «جيميناي» ( Gemini). وعلى عكس النماذج التي تعتمد على السحابة، تم تصميم «غاما» ليكون خياراً أكثر مرونة، يتيح للمطورين تشغيل تطبيقات الذكاء الاصطناعي على أجهزتهم الخاصة.

تفعيل الميزة اختياري ويمنح المستخدم تحكماً كاملاً في البيانات التي يتم استخدامها (أ.ف.ب)

انفتاح وذكاء محلي

في هذا الإصدار الجديد، توسّع «غوغل» هذا النهج بشكل واضح، حيث أصبح «Gemma 4» متاحاً بترخيص «Apache 2.0»، ما يتيح للمطورين استخدام النماذج وتعديلها ونشرها بحرية دون قيود صارمة. وتُعد هذه الدرجة من الانفتاح مهمة في سوق لا تزال فيه العديد من النماذج «المفتوحة» تفرض قيوداً على الاستخدام أو الوصول.

إحدى أبرز ميزات «Gemma 4» هي قدرته على العمل محلياً عبر مجموعة واسعة من الأجهزة. فقد صُممت النماذج لتتدرج من الخوادم القوية إلى الحواسيب المحمولة والهواتف الذكية وحتى الأجهزة الصغيرة مثل «رازبيري باي» (Raspberry Pi). ويتيح هذا النهج المعروف بالاعتماد على التشغيل المحلي بناء تطبيقات لا تحتاج إلى اتصال دائم بالسحابة، ما يقلل من زمن الاستجابة والتكاليف التشغيلية، ويعزز خصوصية البيانات.

كما تعكس التحسينات التقنية في «Gemma 4» طموحاً أوسع، إذ تصفه «غوغل» بأنه الأكثر قدرة ضمن نماذجها المفتوحة حتى الآن، مع تحسينات في قدرات الاستدلال ودعم سير عمل أكثر تعقيداً. وتشمل هذه القدرات حل المشكلات متعددة الخطوات، إضافة إلى ما يُعرف بالقدرات «الوكيلة» (Agentic)، حيث يمكن للنظام تنفيذ مهام، واستدعاء وظائف، والتفاعل مع البيانات بشكل أكثر استقلالية.

ومن الجوانب المهمة أيضاً دعم تعدد الوسائط، حيث يمكن لـ«Gemma 4» التعامل ليس فقط مع النصوص، بل أيضاً مع أنواع أخرى من البيانات مثل الصور أو الصوت، بحسب النسخة المستخدمة. ويتماشى ذلك مع اتجاه أوسع في الصناعة نحو تطوير أنظمة قادرة على فهم ودمج أنواع مختلفة من المدخلات.

وتتوفر النماذج بأحجام متعددة، ما يمنح المطورين مرونة في الاختيار بين نسخ خفيفة مناسبة للأجهزة المحمولة، وأخرى أكبر للأعمال الأكثر تعقيداً. وتُعد هذه المرونة جزءاً أساسياً من استراتيجية «غوغل» لتوسيع استخدام الذكاء الاصطناعي في بيئات ذات موارد محدودة.

يعكس الإطلاق توجهاً نحو ذكاء اصطناعي أكثر انفتاحاً وتوزيعاً مع استمرار تحديات الأداء والحوكمة (أ.ف.ب)

صعود الذكاء المحلي

يسلّط هذا الإطلاق الضوء على الأهمية المتزايدة لـ«الذكاء الاصطناعي المحلي» (Local AI). فتشغيل النماذج مباشرة على الأجهزة وما يُعرف أيضاً بـ«Edge AI» يُنظر إليه بشكل متزايد كحل لمعالجة قضايا مثل سيادة البيانات والخصوصية والتكلفة. ومن خلال إبقاء البيانات على الجهاز، يمكن للمؤسسات تقليل اعتمادها على البنية التحتية السحابية والتحكم بشكل أكبر في المعلومات الحساسة.

ويكتسب هذا التوجه أهمية، خاصة في قطاعات مثل الرعاية الصحية والبرمجيات المؤسسية والخدمات الحكومية، حيث قد تقيّد المتطلبات التنظيمية استخدام الذكاء الاصطناعي القائم على السحابة. ويوفر التشغيل المحلي بديلاً يسمح بإدماج قدرات متقدمة مع الالتزام بمعايير الخصوصية.

في المقابل، يعكس الانفتاح المتزايد في النماذج أيضاً اشتداد المنافسة في سوق الذكاء الاصطناعي. فشركات مثل «ميتا» إلى جانب مجتمعات المصادر المفتوحة، تعمل على تطوير نماذج متقدمة، ما يدفع الشركات الكبرى إلى تبني استراتيجيات أكثر انفتاحاً. ومن خلال «Gemma 4» تسعى «غوغل» إلى ترسيخ موقعها ضمن هذا المشهد المتغير.

مع ذلك، يبقى مفهوم «الانفتاح» في الذكاء الاصطناعي محل نقاش. فحتى مع تراخيص مرنة مثل «Apache 2.0» لا تكون جميع جوانب تطوير النماذج مثل بيانات التدريب مكشوفة بالكامل. ويستمر الجدل حول ما إذا كانت هذه النماذج تمثل انفتاحاً حقيقياً، خصوصاً مع تزايد قوتها وتأثيرها.

كما تواجه النماذج المحلية تحديات عملية، إذ يتطلب تشغيل الذكاء الاصطناعي المتقدم على الأجهزة تحسينات دقيقة لتحقيق توازن بين الأداء وحدود العتاد، خاصة في الهواتف والأجهزة الصغيرة. ويزداد التعقيد عند محاولة ضمان أداء متسق عبر بيئات مختلفة.

تفعيل الميزة اختياري ويمنح المستخدم تحكماً كاملاً في البيانات التي يتم استخدامها (أ.ف.ب)

تحول نحو اللامركزية

رغم هذه التحديات، يشير إطلاق «Gemma 4» إلى اتجاه واضح، وهو انتقال الذكاء الاصطناعي من الاعتماد الكامل على السحابة إلى نماذج أكثر توزيعاً ومرونة. فلم يعد المطورون مضطرين للوصول إلى الذكاء الاصطناعي عبر واجهات برمجة التطبيقات فقط، بل بات بإمكانهم دمجه مباشرة داخل التطبيقات والأجهزة.

ويحمل هذا التحول تداعيات أوسع على كيفية تطوير الذكاء الاصطناعي والتحكم فيه وتحقيق العوائد منه. فالنماذج المفتوحة والمحلية قد تقلل الاعتماد على المنصات الكبرى، وتمنح الشركات الصغيرة والمطورين المستقلين مساحة أكبر للابتكار.

في الوقت نفسه، يثير هذا الانفتاح أسئلة جديدة حول الحوكمة والسلامة والمسؤولية. فكلما أصبحت أدوات الذكاء الاصطناعي أكثر قوة وانتشاراً، ازدادت الحاجة إلى ضمان استخدامها بشكل مسؤول.