تقنيات تحويل الأصوات إلى نصوص تزداد انتشاراً

ميزة «من الفم إلى الشاشة» تؤمن خدمات للطلاب والأطباء ورجال الأعمال

تقنيات تحويل الأصوات إلى نصوص تزداد انتشاراً
TT

تقنيات تحويل الأصوات إلى نصوص تزداد انتشاراً

تقنيات تحويل الأصوات إلى نصوص تزداد انتشاراً

يشتاق سام ليانغ لوالدته ويتمنّى لو أنّه يستطيع استعادة الأشياء التي كانت تقولها له عندما كان طالباً في المدرسة الثانوية. وعندما توفيت عام 2001 قال: «حقّاً أشتاق لها. لقد كانت لحظات ثمينة في حياتي».
هذا الأمر دفع بليانغ، الرئيس التنفيذي والشريك المؤسس في «أوتر»، إحدى شركات وادي السيليكون الناشئة، إلى وضع خطّة للتعامل مع هذه الأوضاع في المستقبل. وتقدّم شركته اليوم خدمة تساعد على تحويل الكلام إلى نص أوتوماتيكياً وبدقّة عالية. وقد بدأت هذه الخدمة باكتساب شعبية واسعة بين الصحافيين، والطلّاب، والمدوّنين الإلكترونيين، وموظفي الشركات.
تخزين الكلام
ساهم التحسّن الذي شهدته تقنية البرمجة الإلكترونية في تحويل تقنية نسخ الكلام إلى نص إلى حقيقة. فمن خلال تخزين كمّ هائل من الكلام البشري، أصبح بالإمكان تدريب برامج شبكات عصبية للتعرّف على اللغة المحكية بدقّة عالية تقارب 95 في المائة في أفضل الظروف. أضف إلى ذلك، يتيح تراجع تكلفة تخزين البيانات اليوم استخدام اللغة البشرية بطرق لم تخطر على بال أحد.
وشرح ليانغ، خرّيج الهندسة الكهربائية من جامعة ستانفورد وعضو الفريق الأساسي الذي صمم تطبيق «غوغل مابس»، أنّ «عمليات ضغط البيانات عزّزت إمكانية الاحتفاظ بالمحادثات الكلامية لشخص طوال حياته ودمجها في سعة 2 ترابايت، أي مدمجة بالقدر الكافي الذي يتيح وضعها على جهاز تخزين لا يتجاوز سعره 50 دولاراً».
خلال العقد الماضي، ساهم التقدّم السريع الذي شهدته تقنية التعرّف إلى الصوت في تطوير وانتشار أجهزة المساعدة الصوتية الافتراضية كـ«سيري» من آبل، و«أليكسا» من أمازون، و«غوغل فويس» و«كورتانا» من مايكروسوفت، وغيرها الكثير. هذا التقدّم نفسه يتوسّع اليوم ليشمل مجالات جديدة بدأت بالتأثير بشكل واضح على مجالات العمل.
ولكنّ هذه الأجهزة الصوتية المحمولة المصنوعة للاستهلاك تسببت في تصاعد مخاوف جديّة حول الخصوصية، فقد اعتبر مارك روتنبرغ، الرئيس والمدير التنفيذي في مركز معلومات الخصوصية الإلكترونية في واشنطن أنّ أجهزة الكومبيوتر تتمتّع بقدرة على تنظيم، واستغلال، وتقييم التواصل البشري أكبر بكثير من قدرة البشر. وقد عمد المركز عام 2015 إلى التقدّم بشكوى أمام هيئة التجارة الفيدرالية ضدّ سامسونغ، ادعى فيها أنّ تسجيل وتخزين المحادثات الذي تقوم به تلفزيوناتها الذكية يمثّل تهديداً جدياً للخصوصية. وأضاف روتنبرغ أنّ نسخ الكلام والمحادثات ينقل مخاوف الخصوصية إلى مجالات جديدة في المنزل والعمل على حدّ سواء.
من الصوت إلى النص
إنّ التطوّرات السريعة التي تحقّقت في سوق التحويل الآلي للصوت في السنة الأخيرة، تعكس احتمالات مذهلة وقريبة المدى على استخدامه في مجموعة جديدة وكبيرة من التطبيقات. فقد انطلقت مثلاً مع بداية الخريف حملة لتجهيز طلّاب جامعة كاليفورنيا - لوس أنجليس، الذين يحتاجون إلى مساعدة لتدوين الملاحظات (كأولئك الذين يعانون من مشاكل في السمع) بخدمة شركة «أوتر». وتمّ تصميم هذا النظام لاستبدال عملية تدوين الملاحظات الحالية التي يستخدمها الطلاب لتسجيل الملاحظات ونشرها لاحقاً.
وفي مايو (أيار)، عندما زارت ميشيل أوباما، السيّدة الأولى السابقة، حرم الجامعة على هامش احتفال بيوم التوقيع الوطني، تمّ تزويد الطلّاب الصمّ بنصّ آني لخطابها من إنتاج خدمة النسخ نفسها.
يقدّم «زوم»، نظام المؤتمرات المصوّرة، خيار نسخ الكلام إلى نص الذي تشغّله خدمة شركة «أوتر» لتزويد مستخدميه بنصٍّ آني لاجتماعات العمل، إلى جانب تسهيل تخزينها والبحث عنها عبر الإنترنت. تقدّم «أوتر» وغيرها من الشركات الكثير من الميّزات في خدماتها، وأهمّها إمكانية فصل وتسمية مختلف المتحدّثين في نسخة نصيّة واحدة.
وتعمد شركات أخرى كـ«ريف»، التي بدأت عام 2010 بتقديم نصوص مكتوبة من قبل موظفين للمحادثات بدولار للدقيقة، إلى تقديم خدمة نسخ آلية للمحادثات والخطابات بعشرة سنتات للدقيقة. في النتيجة، يبدو أنّ خدمة نسخ النصوص تتوسّع لتشمل مجالات جديدة، كعنونة محطّات اليوتيوب، وفيديوهات التدريب في الشركات، وشركات البحث السوقية التي تحتاج إلى نصوص من مجموعات التركيز.
يتيح نظام «ريف» لمستخدميه الاختيار بين ما إذا كانوا يريدون دقّة أعلى أو تحوّل سريع بتكلفة أقلّ، بحسب ما أفاد جايسن شيكولا، مؤسس الشركة ورئيسها التنفيذي، لافتاً إلى أنّ زبائنه يعتمدون أكثر فأكثر على النصوص التي تنتجها الآلات بدل نسخ أي خطاب أو محادثات من البداية. وقال شيكولا إنّه لم يعتقد يوماً أنّ خدمة النسخ الآلي للكلام ستؤدي يوماً إلى تقليص عدد القوى العاملة لديه، على الرغم من أنّ شركته تضمّ اليوم 40000 موظف ناسخ.
خدمات طبية
في المجال الطبي، تستخدم خدمة النسخ الآلي اليوم لتغيير الطريقة التي يسجّل بها الأطباء ملاحظاتهم. في السنوات الأخيرة، أصبحت أنظمة التسجيل الصحي الإلكترونية جزءاً من الزيارة الروتينية في أي عيادة، مما عرّض الأطباء للنقد بسبب تركيزهم على الشاشات والطباعة بدل الحفاظ على التواصل البصري مع المريض. ولكنّ شركات ناشئة كثيرة تقدّم اليوم خدمات نسخ تحفظ النصّ، وربّما الفيديو، من غرفة الفحص وتستخدم ناسخا بشريا أو كاتبا موجودا في مكان آخر، لتصحيح النصّ الآلي وإنتاج مجموعة «مرتّبة» من الملاحظات المسجّلة خلال زيارة المريض.
تعمل «روبين هيلث كير» واحدة من هذه الشركات في بيركلي - كاليفورنيا، على تسجيل زيارات العيادات بواسطة نظام نسخ آلي متصل بفريق عمل من «الكتبة» البشريين الذين يعملون في الولايات المتحدة، بحسب ما أفاد نواه أورهان، الرئيس التنفيذي للشركة. ومعظم هؤلاء الكتبة هم طلّاب السنوات الأولى في كليّة الطبّ، مهمتهم الإنصات لمحادثة الطبيب لإنتاج سجلّ كامل حول المريض خلال ساعتين من زيارته. يستخدم نظام «روبين هيلث كير» في جامعة كاليفورنيا - سان فرنسيسكو، وجامعة سان دييغو.
تعتمد شركة أخرى منافسة تعرف باسم «ديب سكرايب» في بيركلي أيضاً، مقاربة أكثر آلية لصناعة سجلّات صحية إلكترونية. إذ تستخدم الشركة محرّكات كلام كثيرة من تطوير شركات تقنية عملاقة كغوغل و«آي بي إم». لتسجيل المحادثات ووضع ملخّص للمعاينة، تتمّ مراجعته لاحقاً من قبل موظفين مختصّين.
افتقار إلى الدقة
من جهتهم، يؤكّد خبراء الكلام على أنّ أنظمة النسخ الآلية تزال بعيدة كلّ البعد عن المثالية رغم التقدّم الذي شهدته. صحيح أنّ النسخ الآلي قد يقدّم دقّة عالية تصل نسبتها إلى 95 في المائة، ولكن هذا الأمر لا يمكن تحقيقه إلّا في أفضل الظروف وأكثرها وضوحاً، لأنّ هذه الدقّة قد تنهار بسبب لكنة مختلفة، أو سوء في وضعية ميكروفون، أو أي ضجّة في الخلفية.
تراهن الآمال المستقبلية في هذا المجال على بروز تقنية خطابية أخرى تُعرف بالمعالجة الطبيعية للغة، والتي تهدف إلى التقاط معنى الكلمات والجمل لتساهم في تعزيز دقّة أجهزة الكومبيوتر حتّى تصبح موازية للقدرات البشرية. ولكن في الوقت الحالي، لا تزال معالجة اللغة الطبيعية تمثّل واحداً من أكبر التحديات والعوائق في عالم الذكاء الصناعي.

- خدمة «نيويورك تايمز».



الذكاء الاصطناعي وواقع البيانات... هل تواكب البنية التحتية هذا التسارع؟

النمو المتسارع للبيانات يفرض تحديات جديدة على البنية التحتية من حيث الكفاءة والاستدامة (غيتي)
النمو المتسارع للبيانات يفرض تحديات جديدة على البنية التحتية من حيث الكفاءة والاستدامة (غيتي)
TT

الذكاء الاصطناعي وواقع البيانات... هل تواكب البنية التحتية هذا التسارع؟

النمو المتسارع للبيانات يفرض تحديات جديدة على البنية التحتية من حيث الكفاءة والاستدامة (غيتي)
النمو المتسارع للبيانات يفرض تحديات جديدة على البنية التحتية من حيث الكفاءة والاستدامة (غيتي)

مع تسارع الذكاء الاصطناعي في توليد البيانات واستخدامها، يؤدي تزايد أهمية البنية التحتية إلى تحول أقل وضوحاً، لكنه أكثر عمقاً. فبينما يتركّز جزء كبير من النقاش العام حول الذكاء الاصطناعي على قوة الحوسبة وأداء النماذج، يشير قادة الصناعة بشكل متزايد إلى كيفية تخزين البيانات والوصول إليها وتوسيعها على نطاق واسع.

في إحاطة إعلامية خاصة حضرتها «الشرق الأوسط»، قدّم مسؤولون في شركة «سي غيت تكنولوجي» (Seagate Technology) هذا التحول بوصفه تغيراً هيكلياً، لا مجرد تحديث تقني. فالتحدي لم يعد يقتصر على إنتاج البيانات أو معالجتها، بل بات يتمحور حول القدرة على الحفاظ عليها وتوسيعها بكفاءة واستدامة وعلى نحو يمكن التنبؤ به. يقول ديف موسلي، الرئيس التنفيذي للشركة إن «ما نعلنه اليوم ليس مجرد إنجاز على مستوى المنتج، بل يعكس كيف يجب أن تتطور البنية التحتية لمواكبة التسارع غير المسبوق في نمو البيانات عالمياً».

ديف موسلي الرئيس التنفيذي لشركة «سي غيت تكنولوجي»

يصعب المبالغة في حجم هذا النمو. فحسب موسلي، انتقل حجم البيانات العالمية من نحو زيتابايت واحد في عام 2005 إلى أكثر من 70 زيتابايت في عام 2020، مع توقع إضافة مئات الزيتابايت في السنوات المقبلة. ورغم أن الذكاء الاصطناعي يعدّ محركاً رئيسياً لهذا التوسع، فإنه ليس العامل الوحيد؛ إذ تسهم خدمات الحوسبة السحابية والفيديو والأتمتة والمتطلبات التنظيمية في تشكيل منظومة بيانات أكثر تعقيداً واتساعاً.

هذا التداخل يعيد صياغة طريقة تقييم البنية التحتية. ويضيف موسلي أن «القصة لم تعد تتعلق بتقنية واحدة، بل بالبنية التحتية وتخصيص رأس المال». بمعنى آخر، لم يعد السؤال هو ما إذا كان بالإمكان إنتاج البيانات أو معالجتها، بل ما إذا كانت الأنظمة الداعمة قادرة على التوسع بكفاءة لمواكبة هذا النمو.

ما بعد الحوسبة

أحد أبرز الاستنتاجات هو أن مسار الذكاء الاصطناعي لا يمكن فهمه من خلال الحوسبة وحدها. فرغم أهمية المعالجات والمسرّعات، فإنها تعتمد بشكل أساسي على توفر البيانات.

ويشير موسلي إلى أنه «عندما يتحدث الناس عن بنية الذكاء الاصطناعي، يركّزون على الحوسبة التي لا يمكن أن تعمل دون بيانات. ماذا يحدث عندما تنفد البيانات من منصات الحوسبة؟ هذه مشكلة».

هذا الطرح يعيد وضع التخزين في قلب أنظمة الذكاء الاصطناعي. فالبيانات لا يكفي أن تكون موجودة، بل يجب الاحتفاظ بها وحمايتها وإمكانية استرجاعها على نطاق واسع. وفي بيئات الحوسبة فائقة الحجم، حيث تُتخذ القرارات على مدى خمس أو سبع أو حتى عشر سنوات، تتحول هذه المتطلبات معادلةً اقتصادية بقدر ما هي تقنية.

تكلفة التخزين لكل تيرابايت واستهلاك الطاقة وكثافة السعة لكل رفّ، كلها أصبحت عوامل حاسمة. وكما أفاد موسلي: «الذكاء الاصطناعي لا يتوسع بالحوسبة فقط، بل يعتمد على اقتصاديات مستدامة، والتخزين هو ما يحدد هذه الاقتصاديات».

الذكاء الاصطناعي لا يستهلك البيانات فقط... بل يضاعفها عبر النسخ وإعادة التدريب والاستخدام المستمر (غيتي)

من النمو إلى التراكم

جزء من هذا التحول يرتبط بطبيعة البيانات نفسها. فالذكاء الاصطناعي لا يستهلك البيانات فحسب، بل يضاعفها. ويصرح بي إس تيه، الرئيس التجاري للشركة بأن «الذكاء الاصطناعي لا يستهلك البيانات فقط، بل يراكمها». عملياً، يعني ذلك أن البيانات تُنسخ وتُوزَّع وتُحفظ ويُعاد استخدامها لتدريب النماذج وإعادة تدريبها. ونتيجة لذلك؛ لم يعد نمو البيانات خطياً، بل أصبح متسارعاً ومتراكماً.

ويظهر هذا الواقع في توسّع مراكز البيانات عالمياً. فهناك اليوم أكثر من 11 ألف مركز بيانات، مع توقع ارتفاع العدد إلى نحو 15 ألفاً خلال السنوات المقبلة. لكن الأهم هو حجم هذه المراكز. فما كان يُعدّ مركزاً ضخماً سابقاً بقدرة 10 ميغاواط تحل محله اليوم مراكز «عملاقة» تصل إلى 100 أو حتى 300 ميغاواط.

ويذكر تيه أنه «لا يكاد يمر يوم دون الإعلان عن بناء مركز بيانات جديد في مكان ما من العالم». لكن التحول الحقيقي لا يكمن في العدد فقط، بل في الحجم والضغط المتزايد على البنية التحتية.

التوسع دون اضطراب

مع هذا النمو، لا يتمثل التحدي في زيادة السعة فقط، بل في تحقيق ذلك دون إحداث اضطراب. فمشغلو البنية التحتية الضخمة لا يمكنهم تحمل تغييرات جذرية متكررة. ويلفت موسلي إلى أن بعض العملاء يتخذون قرارات تمتد لخمس أو سبع أو حتى عشر سنوات، ويحتاجون إلى ثقة بأن كثافة التخزين ستستمر في التوسع دون تغييرات معمارية معطِّلة.هذا التركيز على القابلية للتنبؤ أصبح بحد ذاته ميزة أساسية. فالتطور يجب أن يكون تدريجياً ومستمراً، لا أن يفرض إعادة تصميم مكلفة في كل مرحلة.

من جانبه، يوضح جون موريس، المدير التقني، أن التقنيات التقليدية لزيادة الكثافة وصلت إلى حدودها ويتابع: «تقنية التسجيل المغناطيسي التقليدية اقتربت من حدودها، ونحتاج إلى ابتكارات جديدة لدفع الجيل القادم من التخزين».

ولهذا؛ طوّرت الشركة تقنية التسجيل المغناطيسي بمساعدة الحرارة (HAMR)، التي تستخدم تسخيناً دقيقاً بالليزر لزيادة كثافة البيانات دون تغيير الحجم الفيزيائي للأقراص. ويشرح موريس بأن «الزيادة في السعة تتحقق من خلال الفيزياء الأساسية للتسجيل؛ ما يتيح اقتصاديات أفضل من حيث التكلفة لكل تيرابايت والاستثمار المطلوب». الأهم أن هذه التقنية لم تعد في مرحلة التجارب، بل انتقلت إلى بيئات الإنتاج الفعلية، حيث تم اعتمادها من قِبل عملاء في قطاع الحوسبة السحابية واسعة النطاق.

من الابتكار إلى الإنتاج الصناعي

تحويل الابتكار منتجاً فعلياً يتطلب أكثر من اختراق تقني، بل يحتاج إلى قدرة على التصنيع على نطاق واسع بدقة عالية. وحول ذلك يقول موريس إن «نقل هذه التقنية من البحث إلى الإنتاج تطلب تطوير تقنيات جديدة بالكامل»، مشيراً إلى التقدم في المواد والفوتونيات وعمليات التصنيع الدقيقة. وهذا ما يتيح التوسع التدريجي دون انقطاع. فكل جيل جديد يبني على السابق؛ ما يسمح بزيادة السعة دون الحاجة إلى إعادة تصميم الأنظمة بالكامل.

التحدي الأساسي لم يعد سرعة النماذج... بل قدرة البنية التحتية على التوسع بشكل مستدام وموثوق (غيتي)

اقتصاديات الحجم

على مستوى البنية التحتية الضخمة، حتى التحسينات الصغيرة تُحدِث فرقاً كبيراً. ويفسر موسلي بأنه في بيئة تخزين بحجم إكسابايت واحد، يمكن تحقيق تحسن في كفاءة الطاقة بنحو 47 في المائة مقارنة بالأنظمة السابقة، مع تقليل عدد الأقراص من نحو 50 ألفاً إلى نحو 22 ألفاً؛ ما يؤدي إلى تقليل المساحة والتبريد والتعقيد التشغيلي.

هذه ليست تحسينات هامشية، بل تغييرات تؤثر مباشرة على التكلفة والبنية.

وأشار تيه إلى أن الاستدامة أصبحت عاملاً مؤثراً في قرارات الشراء، قائلاً: «لم تعد الاستدامة مسألة ثانوية»، في إشارة إلى أهمية استهلاك الطاقة والبصمة الكربونية. كما أن نظرة المؤسسات إلى البيانات تغيّرت، حيث إنه «في السابق كانت البيانات تُعدّ تكلفة، أما اليوم فهي أصل استراتيجي يتراكم بمرور الوقت».

السؤال الحاسم

تشير هذه التطورات إلى تحول أوسع في تصميم بنية الذكاء الاصطناعي. فالتخزين الذي كان في الخلفية، أصبح اليوم في صميم التخطيط. في السابق، كانت الأولوية للحوسبة والذاكرة والشبكات. أما اليوم، فأصبح التخزين عاملاً حاسماً في قدرة الأنظمة على التوسع. وكما وصفه تيه: «كان التخزين مثل الهواء أو الماء أساسي، لكنه غير مرئي... إلى أن يغيب». اليوم، لم يعد كذلك، بل أصبح محورياً في بناء القدرات الرقمية.

بالنسبة لقيادة الشركة، يتجاوز هذا التحول حدود التقنية ليطرح سؤالاً أساسياً حول مستقبل الذكاء الاصطناعي. وباعتقاد موسلي أن «السؤال الأهم لهذا العقد ليس مدى سرعة تدريب النماذج، بل مدى قدرة البنية التحتية للبيانات على التوسع بشكل مستدام».

هذا الطرح يعيد توجيه النقاش، حيث إن مستقبل الذكاء الاصطناعي قد لا يعتمد فقط على تطور النماذج، بل على القدرة على إدارة البيانات على نطاق غير مسبوق بكفاءة واستقرار ودون انقطاع. وبهذا المعنى، قد لا يُقاس تقدم الذكاء الاصطناعي بذكائه فقط، بل بالبنية التحتية التي تجعله ممكناً.


«غوغل» تتيح نقل سجل المحادثات والتفضيلات إلى «جيميناي»

تتيح «غوغل» ميزة استيراد الذاكرة في «جيميناي» لنقل التفضيلات والسياق الشخصي من تطبيقات ذكاء اصطناعي أخرى (شاترستوك)
تتيح «غوغل» ميزة استيراد الذاكرة في «جيميناي» لنقل التفضيلات والسياق الشخصي من تطبيقات ذكاء اصطناعي أخرى (شاترستوك)
TT

«غوغل» تتيح نقل سجل المحادثات والتفضيلات إلى «جيميناي»

تتيح «غوغل» ميزة استيراد الذاكرة في «جيميناي» لنقل التفضيلات والسياق الشخصي من تطبيقات ذكاء اصطناعي أخرى (شاترستوك)
تتيح «غوغل» ميزة استيراد الذاكرة في «جيميناي» لنقل التفضيلات والسياق الشخصي من تطبيقات ذكاء اصطناعي أخرى (شاترستوك)

تسعى «غوغل» إلى معالجة إحدى أبرز العقبات في عالم تطبيقات الذكاء الاصطناعي للمستهلكين، وهي «مشكلة البدء من الصفر». فمع تنقُّل المستخدمين بين أكثر من مساعد ذكي، يجد كثيرون أنفسهم مضطرين لإعادة إدخال تفضيلاتهم، وشرح سياقهم الشخصي مراراً، وإعادة بناء سجل محادثاتهم من جديد. ومن خلال مجموعة ميزات جديدة في تطبيق «جيميناي»، تحاول الشركة تقليل هذا الاحتكاك عبر تمكين المستخدم من نقل «ذاكرته الرقمية» بين المنصات.

تعتمد عملية الاستيراد على توليد ملخص من التطبيق الآخر ثم إدخاله إلى «جيميناي»، ليتم تحليله وحفظه (غوغل)

استمرارية التجربة الرقمية

في تحديث بدأ طرحه في العالم العربي، تقدم «غوغل» ميزة «استيراد الذاكرة» (Memory Import) التي تتيح نقل عناصر أساسية من السياق الشخصي -مثل الاهتمامات والعلاقات والتفضيلات- من تطبيقات ذكاء اصطناعي أخرى مباشرة إلى «جيميناي».

الفكرة بسيطة، وهي أنه بدلاً من تدريب مساعد جديد من الصفر، يمكن للمستخدم أن ينقل معه طبقة جاهزة من الفهم تعكس طريقة تفاعله السابقة.

ورغم التعقيد التقني الكامن وراء هذه العملية، فإن تنفيذها جاء بشكل مبسَّط. من خلال إعدادات «جيميناي»، يمكن اختيار خيار الاستيراد؛ حيث يتم توليد «طلب» (Prompt) جاهز، ثم يقوم المستخدم بنسخ هذا الطلب إلى تطبيق ذكاء اصطناعي آخر، والذي بدوره يُنتج ملخصاً لتفضيلات المستخدم وسياقه. بعد ذلك، يتم لصق هذا الملخص داخل «جيميناي» الذي يقوم بتحليله وتخزينه ضمن ملف المستخدم. ومن ثمَّ، يصبح «جيميناي» قادراً على استخدام هذه البيانات لتخصيص ردوده، وكأنه يواصل رحلة المستخدم الرقمية بدلاً من البدء من جديد.

تمكِّن الميزة المستخدمين من تجنُّب البدء من الصفر عبر نقل فهم مسبق لطبيعة تفاعلاتهم واهتماماتهم (غيتي)

«الذكاء الشخصي»

تندرج هذه الخطوة ضمن توجه أوسع لدى «غوغل»، نحو ما تسميه «الذكاء الشخصي» (Personal Intelligence)، وهو نموذج يسعى إلى تقديم مساعد ذكي أكثر وعياً بالسياق. فبدلاً من التعامل مع كل طلب بشكل منفصل، يهدف «جيميناي» إلى تقديم إجابات مبنيَّة على فهم أعمق لتاريخ المستخدم وعاداته واهتماماته.

ولا يقتصر الأمر على استيراد الذاكرة فقط. فمع موافقة المستخدم، يمكن لـ«جيميناي» الاستفادة من بيانات عبر منظومة «غوغل» الأوسع، بما في ذلك «جيميل» و«صور غوغل» وسجل البحث، إضافة إلى المحادثات السابقة داخل التطبيق نفسه. وهذا يتيح مستوى أكثر تطوراً من التفاعل؛ حيث لا تعتمد الإجابة فقط على السؤال الحالي؛ بل على صورة أوسع تتشكل مع الوقت حول المستخدم.

تشتت سجل المحادثات

كما تعالج «غوغل» مشكلة أخرى برزت مع انتشار استخدام أدوات ذكاء اصطناعي متعددة، وهي تشتت سجل المحادثات؛ إذ بات بإمكان المستخدمين الآن تحميل أرشيف محادثاتهم من منصات أخرى بصيغة ملف مضغوط (ZIP) واستيراده إلى «جيميناي». وبذلك يمكنهم البحث داخل محادثاتهم السابقة، واستكمالها دون فقدان السياق.

تعكس هذه الميزة تحولاً مهماً في طريقة النظر إلى المساعدات الذكية. فهي لم تعد مجرد أدوات منفصلة؛ بل بدأت تأخذ شكل «رفيق رقمي» طويل الأمد؛ حيث تلعب الاستمرارية وتراكم السياق دوراً محورياً في قيمتها. وفي هذا الإطار، لا يُنظر إلى سجل المحادثات كأرشيف فقط؛ بل كجزء من «ذكاء» النظام نفسه.

بالنسبة للمستخدم، تكمن الفائدة المباشرة في الكفاءة. فالمهام التي كانت تتطلب شرحاً متكرراً، مثل التخطيط للسفر، أو إدارة المشاريع، أو تطوير أفكار إبداعية، يمكن الآن استئنافها بسهولة من حيث توقفت. أما بالنسبة لـ«غوغل»، فالدلالة الاستراتيجية واضحة، فتقليل تكلفة الانتقال بين المنصات يجعل من الأسهل على المستخدم اعتماد «جيميناي» مساعداً أساسياً، حتى لو كانت تجربته السابقة في مكان آخر.

يمكن لـ«جيميناي» الاستفادة من بيانات خدمات «غوغل» مثل «جيميل» و«صور غوغل» وسجل البحث لتحسين الاستجابات (غوغل)

الخصوصية والمنافسة الجديدة

في المقابل، تظل مسألة الخصوصية والتحكم في البيانات حاضرة. تؤكد «غوغل» أن هذه الميزات تعمل بموافقة المستخدم؛ خصوصاً عند الربط مع خدمات مثل «جيميل» و«صور غوغل». كما أن عملية الاستيراد نفسها تتطلب خطوات واضحة من المستخدم. ومع ذلك، فإن تعمُّق تكامل الذكاء الاصطناعي مع البيانات الشخصية سيبقى موضع نقاش مستمر.

يأتي إطلاق هذه الميزات أولاً عبر «الويب» في العالم العربي، على أن تصل إلى الأجهزة المحمولة خلال الأيام المقبلة، ما يعكس توجهاً نحو تقديم حلول مخصَّصة للأسواق الإقليمية؛ خصوصاً فيما يتعلق باللغة والسياق الثقافي.

بصورة أوسع، يشير هذا التحديث إلى تحول في طبيعة المنافسة في مجال الذكاء الاصطناعي. فلم يعد التميز يقتصر على قوة النماذج أو عدد الميزات؛ بل بات يرتبط بمدى قدرة المساعد على فهم المستخدم والاستمرار معه عبر الزمن. وفي هذا السياق، تصبح «الذاكرة» عاملاً حاسماً.

فمن خلال تمكين المستخدمين من نقل سياقهم معهم، لا تضيف «غوغل» مجرد ميزة جديدة؛ بل تعيد تعريف نقطة البداية في التفاعل، لتتحول من صفحة بيضاء إلى محادثة مستمرة.


«إنستغرام» يختبر نسخة مدفوعة بمزايا إضافية

شعار تطبيق «إنستغرام» (أ.ف.ب)
شعار تطبيق «إنستغرام» (أ.ف.ب)
TT

«إنستغرام» يختبر نسخة مدفوعة بمزايا إضافية

شعار تطبيق «إنستغرام» (أ.ف.ب)
شعار تطبيق «إنستغرام» (أ.ف.ب)

بدأ تطبيق «إنستغرام» اختبار نسخة جديدة للاشتراك المدفوع في العديد من الدول، مع مزايا إضافية تركز بشكل رئيسي على خاصية «ستوريز»، وفق ما قالت ناطقة باسم الشركة الأم «ميتا» لـ«وكالة الصحافة الفرنسية»، الاثنين، مؤكدة معلومات أوردها موقع «تِك كرانش».

كذلك، سيحصل المستخدمون الذين يدفعون على مزيد من التحكم في الحسابات المسموح لها بمشاهدة الصور أو مقاطع الفيديو التي يشاركونها في منشورات «ستوريز» التي عادة ما تختفي بعد 24 ساعة على الشبكة الاجتماعية.

وقالت الناطقة باسم الشركة إنه يتم اختبار هذه النسخة في «عدد قليل من البلدان»، دون تقديم مزيد من التفاصيل.

وبحسب «تِك كرانش» تشمل هذه البلدان اليابان والمكسيك والفلبين حيث تبلغ أسعار الاشتراك نحو دولارين شهرياً.

وأطلقت «ميتا» إصدارات مدفوعة خالية من الإعلانات من «فيسبوك» و«إنستغرام» في بريطانيا العام الماضي للامتثال للتشريعات في البلاد.

وتعرض منصتا «سناب تشات» و«إكس» نسخة مميزة مدفوعة منذ سنوات.