تهديد ينذر بانهياره... الذكاء الاصطناعي «يأكل نفسه»

تدريب التقنية الجديدة على بيانات من إنتاجها «رهان محفوف بالمخاطر»

الذكاء الاصطناعي أصبح يشكل خطراً على نفسه (رويترز)
الذكاء الاصطناعي أصبح يشكل خطراً على نفسه (رويترز)
TT

تهديد ينذر بانهياره... الذكاء الاصطناعي «يأكل نفسه»

الذكاء الاصطناعي أصبح يشكل خطراً على نفسه (رويترز)
الذكاء الاصطناعي أصبح يشكل خطراً على نفسه (رويترز)

إذا أُخضعت نماذج الذكاء الاصطناعي لتدريب متكرر باستخدام بيانات مُنتَجة أصلاً بهذه التقنية، فستبدأ بعرض محتويات متضاربة بصورة متزايدة، وهي مشكلة يتناولها عدد كبير من الدراسات العلمية.

النماذج القائمة على أدوات الذكاء الاصطناعي التوليدي، مثل برنامج «تشات جي بي تي»، التي تتيح إنتاج مختلف أنواع المحتوى بناءً على طلب بسيط بلغة يومية، تحتاج إلى التدريب من خلال كميات هائلة من البيانات.

ووفق ما ذكرته «وكالة الصحافة الفرنسية»، غالباً ما يجري الحصول على هذه البيانات من شبكة الإنترنت التي تنتشر فيها كميات متزايدة من الصور والنصوص المُنتَجة بوساطة الذكاء الاصطناعي.

ويؤدي هذا الوضع، الذي يُوصف بعبارة «الالتهام الذاتي»؛ إذ يتغذّى الذكاء الاصطناعي على نفسه، إلى انهيار النماذج، فتصبح الأدوات مُنتِجة لمعلومات غير منطقية حتى تصل إلى نتائج لا معنى لها، على ما توصلت إليه مقالة نُشرت في مجلة «نيتشر» العلمية في نهاية يوليو (تموز).

ومع استخدام هذا النوع من البيانات، الذي يُطلق عليه اسم «بيانات اصطناعية»؛ لأنه مُنتَج بوساطة آلات، يقل غنى العينة التي تستمد منها نماذج الذكاء الاصطناعي معطياتها لتوفير إجاباتها.

فالوضع مشابه لإنشاء نسخة من صورة بتقنية المسح الضوئي ثم طباعتها. ومع تكرار النسخ والطباعة، ستفقد النتيجة جودتها حتى تصبح في النهاية غير مقروءة.

وباء «جنون البقر»

توصّل باحثون من جامعتي «رايس» و«ستانفورد» الأميركيتين إلى النتيجة نفسها، بعد دراسة نماذج الذكاء الاصطناعي التي تولّد الصور، مثل «ميدجورني»، و«دال - إي»، و«ستيبل ديفيوجن».

وأظهر الباحثون أن الصور المُنتَجة أصبحت مليئة بعناصر غير متطابقة كلما أضافوا بيانات «مُنتَجة بوساطة الذكاء الاصطناعي» إلى النموذج، وشبّهوا هذه الظاهرة بمرض «جنون البقر».

فهذا الوباء، الذي ظهر في المملكة المتحدة، يعود مصدره إلى استخدام العلف الحيواني الذي يجري الحصول عليه من أجزاء غير مأكولة من جيف أبقار وحيوانات تحمل الفيروس، لتغذية المواشي.

وتستخدم شركات الذكاء الاصطناعي في مرات كثيرة «بيانات اصطناعية» لتدريب برامجها، بسبب سهولة الحصول عليها ووفرتها وتكلفتها المنخفضة مقارنة ببيانات ابتكرها البشر.

تدريب الذكاء الاصطناعي باستخدام بيانات مُنتَجة أصلاً بهذه التقنية يؤدي إلى نتائج متضاربة (رويترز)

وفي حديث إلى «وكالة الصحافة الفرنسية»، يقول الباحث المتخصص في التقنيات الجديدة لدى جامعة «موناش» في أستراليا جاثان سادوفسكي، إن «مصادر البيانات البشرية غير المستغلة وعالية الجودة والقابلة للقراءة آلياً تصير أكثر ندرة».

ويقول ريتشارد بارانيوك، أحد معدي المقالة المنشورة في «نيتشر»، في بيان: «في حال لم يُراقب الوضع على مر أجيال عدة، فسنكون أمام نتيجة كارثية تتمثّل في متلازمة انهيار نماذج ستؤثر سلباً في جودة البيانات على الإنترنت وتنوعها».

وكما أن أزمة «جنون البقر» أثّرت بشكل كبير في مجال إنتاج اللحوم في تسعينات القرن العشرين، قد تهدد شبكة الإنترنت المليئة بمحتوى مُنتَج بوساطة الذكاء الاصطناعي ونماذج تحولت إلى «مجنونة»، مستقبل مجال الذكاء الاصطناعي، الذي يشهد ازدهاراً كبيراً، وتبلغ قيمته مليارات الدولارات، حسب هؤلاء العلماء.

ويقول جاثان سادوفسكي إن «التساؤل الفعلي بالنسبة إلى الباحثين والشركات الذين يعملون على بناء أنظمة ذكاء اصطناعي هو في أي مرحلة يتجاوز استخدام البيانات الاصطناعية الحد اللازم؟».

سيناريو غير واقعي كثيراً

يرى بعض المتخصصين الآخرين أن المشكلة مبالغ فيها وليست حتمية تماماً.

وفي حديث إلى «وكالة الصحافة الفرنسية»، تؤكد شركتا «أنثروبك» و«هاغينغ فايس»، المتخصصتان في مجال الذكاء الاصطناعي، أنهما تستخدمان بيانات مُنتَجَة بوساطة الذكاء الاصطناعي.

ويقول أنتون لوزكوف، وهو مهندس متخصص في التعلم الآلي لدى شركة «هاغينغ فايس»، إن المقالة المنشورة في مجلة «نيتشر» توفّر رؤية نظرية مثيرة للاهتمام؛ لكن غير واقعية إلى حد كبير.

ويؤكد أن «تدريب النماذج على مجموعات عدة من البيانات الاصطناعية لا يتم في الواقع».

ويقر لوزكوف بأن الخبراء في الذكاء الاصطناعي يشعرون بالإحباط من واقع الإنترنت، على غرار ما ينتاب الجميع.

ويضيف أن «جزءاً من الإنترنت هو مجرد قمامة»، مشيراً إلى أن شركته بدأت تبذل جهوداً كبيرة لتنظيف البيانات التي جُمعت، وحذفت أحياناً ما يصل إلى 90 في المائة منها.


مقالات ذات صلة

تجميد الجثث أملاً في إحيائها مستقبلاً لم يعد يقتصر على الخيال العلمي

يوميات الشرق إميل كيندزورا أحد مؤسسي شركة «توموروو بايوستيتس» (على اليمين) داخل مركز تخزين الجثث في سويسرا (أ.ف.ب)

تجميد الجثث أملاً في إحيائها مستقبلاً لم يعد يقتصر على الخيال العلمي

قررت بيكا زيغلر البالغة 24 عاماً، تجميد جثتها في برّاد بعد وفاتها عن طريق مختبر في برلين، على أمل محدود بإعادة إحيائها مستقبلاً.

«الشرق الأوسط» (برلين)
تكنولوجيا شركات الذكاء الاصطناعي تتفق مع دور النشر بما يتيح لهذه الشركات استخدام الأعمال المنشورة لتدريب نماذجها القائمة على الذكاء الاصطناعي التوليدي (رويترز)

شركات الذكاء الاصطناعي التوليدي تلجأ إلى الكتب لتطوّر برامجها

مع ازدياد احتياجات الذكاء الاصطناعي التوليدي، بدأت أوساط قطاع النشر هي الأخرى في التفاوض مع المنصات التي توفر هذه التقنية سعياً إلى حماية حقوق المؤلفين.

«الشرق الأوسط» (باريس)
الاقتصاد شاشة تسجيل الوصول في مكتب «إنفيديا» في أوستن بتكساس (أ.ف.ب)

«إنفيديا» تتفوق على توقعات الأرباح مع ترقب المستثمرين للطلب على رقائق «بلاكويل» للذكاء الاصطناعي

أعلنت شركة «إنفيديا»، يوم الأربعاء، عن زيادة في أرباحها ومبيعاتها في الربع الثالث مع استمرار الطلب على رقائق الكمبيوتر المتخصصة.

«الشرق الأوسط» (نيويورك)
تكنولوجيا  الحكومة الأميركية تتحرك لإجبار «غوغل» على بيع متصفّحه «كروم»

 الحكومة الأميركية تتحرك لإجبار «غوغل» على بيع متصفّحه «كروم»

طلبت الحكومة الأميركية، الأربعاء، من القضاء إجبار «غوغل» على بيع متصفّحه «كروم»، في إجراء يهدف لمكافحة الممارسات الاحتكارية المتّهم بارتكابها عملاق التكنولوجيا.

«الشرق الأوسط» (واشنطن)
صحتك بهدف تكوين صورة بصرية ذات معنى لمشهد ما تقوم أعيننا بسلسلة من الحركات السريعة المنسقة (رويترز)

خلل بسيط في حركة العين قد يشير إلى إصابتك بألزهايمر

تبرز مؤخراً طريقة جديدة للكشف المبكر عن مرض ألزهايمر ترتبط بالاستماع إلى حركة عيون المرضى عبر ميكروفونات في آذانهم.

«الشرق الأوسط» (واشنطن)

شركات الذكاء الاصطناعي التوليدي تلجأ إلى الكتب لتطوّر برامجها

شركات الذكاء الاصطناعي تتفق مع دور النشر بما يتيح لهذه الشركات استخدام الأعمال المنشورة لتدريب نماذجها القائمة على الذكاء الاصطناعي التوليدي (رويترز)
شركات الذكاء الاصطناعي تتفق مع دور النشر بما يتيح لهذه الشركات استخدام الأعمال المنشورة لتدريب نماذجها القائمة على الذكاء الاصطناعي التوليدي (رويترز)
TT

شركات الذكاء الاصطناعي التوليدي تلجأ إلى الكتب لتطوّر برامجها

شركات الذكاء الاصطناعي تتفق مع دور النشر بما يتيح لهذه الشركات استخدام الأعمال المنشورة لتدريب نماذجها القائمة على الذكاء الاصطناعي التوليدي (رويترز)
شركات الذكاء الاصطناعي تتفق مع دور النشر بما يتيح لهذه الشركات استخدام الأعمال المنشورة لتدريب نماذجها القائمة على الذكاء الاصطناعي التوليدي (رويترز)

مع ازدياد احتياجات الذكاء الاصطناعي التوليدي، بدأت أوساط قطاع النشر هي الأخرى في التفاوض مع المنصات التي توفر هذه التقنية سعياً إلى حماية حقوق المؤلفين، وإبرام عقود مع الجهات المعنية بتوفير هذه الخدمات لتحقيق المداخيل من محتواها.

واقترحت دار النشر «هاربر كولينز» الأميركية الكبرى أخيراً على بعض مؤلفيها، عقداً مع إحدى شركات الذكاء الاصطناعي تبقى هويتها طي الكتمان، يتيح لهذه الشركة استخدام أعمالهم المنشورة لتدريب نماذجها القائمة على الذكاء الاصطناعي التوليدي.

وفي رسالة اطلعت عليها «وكالة الصحافة الفرنسية»، عرضت شركة الذكاء الاصطناعي 2500 دولار لكل كتاب تختاره لتدريب نموذجها اللغوي «إل إل إم» لمدة 3 سنوات.

آراء متفاوتة

ولكي تكون برامج الذكاء الاصطناعي قادرة على إنتاج مختلف أنواع المحتوى بناء على طلب بسيط بلغة يومية، تنبغي تغذيتها بكمية مزدادة من البيانات.

وبعد التواصل مع دار النشر أكدت الأخيرة الموافقة على العملية. وأشارت إلى أنّ «(هاربر كولينز) أبرمت عقداً مع إحدى شركات التكنولوجيا المتخصصة بالذكاء الاصطناعي للسماح بالاستخدام المحدود لكتب معينة (...) بهدف تدريب نماذج الذكاء الاصطناعي وتحسين أدائها».

وتوضّح دار النشر أيضاً أنّ العقد «ينظّم بشكل واضح ما تنتجه النماذج مع احترامها حقوق النشر».

ولاقى هذا العرض آراء متفاوتة في قطاع النشر، إذ رفضه كتّاب مثل الأميركي دانييل كيبلسميث الذي قال في منشور عبر منصة «بلوسكاي» للتواصل الاجتماعي: «من المحتمل أن أقبل بذلك مقابل مليار دولار، مبلغ يتيح لي التوقف عن العمل، لأن هذا هو الهدف النهائي من هذه التكنولوجيا».

هامش تفاوض محدود

ومع أنّ «هاربر كولينز» هي إحدى كبرى دور النشر التي أبرمت عقوداً من هذا النوع، فإنّها ليست الأولى. فدار «ويلي» الأميركية الناشرة للكتب العلمية أتاحت لشركة تكنولوجية كبيرة «محتوى كتب أكاديمية ومهنية منشورة لاستخدام محدد في نماذج التدريب، مقابل 23 مليون دولار»، كما قالت في مارس (آذار) عند عرض نتائجها المالية.

ويسلط هذا النوع من الاتفاقيات الضوء على المشاكل المرتبطة بتطوير الذكاء الاصطناعي التوليدي، الذي يتم تدريبه على كميات هائلة من البيانات تُجمع من الإنترنت، وهو ما قد يؤدي إلى انتهاكات لحقوق الطبع والنشر.

وترى جادا بيستيلي، رئيسة قسم الأخلاقيات لدى «هاغينغ فايس»، وهي منصة فرنسية - أميركية متخصصة بالذكاء الاصطناعي، أنّ هذا الإعلان يشكل خطوة إلى الأمام، لأنّ محتوى الكتب يدرّ أموالاً. لكنها تأسف لأنّ هامش التفاوض محدود للمؤلفين.

وتقول: «ما سنراه هو آلية لاتفاقيات ثنائية بين شركات التكنولوجيا ودور النشر أو أصحاب حقوق الطبع والنشر، في حين ينبغي أن تكون المفاوضات أوسع لتشمل أصحاب العلاقة».

ويقول المدير القانوني لاتحاد النشر الفرنسي (SNE) جوليان شوراكي: «نبدأ من مكان بعيد جداً»، مضيفاً: «إنّه تقدم، فبمجرّد وجود اتفاق يعني أن حواراً ما انعقد وثمة رغبة في تحقيق توازن فيما يخص استخدام البيانات مصدراً، التي تخضع للحقوق والتي ستولد مبالغ».

مواد جديدة

وفي ظل هذه المسائل، بدأ الناشرون الصحافيون أيضاً في تنظيم هذا الموضوع. ففي نهاية 2023، أطلقت صحيفة «نيويورك تايمز» الأميركية اليومية ملاحقات ضد شركة «أوبن إيه آي» مبتكرة برنامج «تشات جي بي تي» وضد «مايكروسوفت» المستثمر الرئيسي فيها، بتهمة انتهاك حقوق النشر. وقد أبرمت وسائل إعلام أخرى اتفاقيات مع «أوبن إيه آي».

وربما لم يعد أمام شركات التكنولوجيا أي خيار لتحسين منتجاتها سوى باعتماد خيارات تُلزمها بدفع أموال، خصوصاً مع بدء نفاد المواد الجديدة لتشغيل النماذج.

وأشارت الصحافة الأميركية أخيراً إلى أنّ النماذج الجديدة قيد التطوير تبدو كأنها وصلت إلى حدودها القصوى، لا سيما برامج «غوغل» و«أنثروبيك» و«أوبن إيه آي».

ويقول جوليان شوراكي: «يمكن على شبكة الإنترنت، جمع المحتوى القانوني وغير القانوني، وكميات كبيرة من المحتوى المقرصن، مما يشكل مشكلة قانونية. هذا من دون أن ننسى مسألة نوعية البيانات».