«جي بي تي ـ 3»... نظام ذكاء صناعي بديل عن الكتاب والمؤلفين

يكتب النصوص بعد معالجته تريليون كلمة وتعلمه اللغة الطبيعية

«جي بي تي ـ 3»... نظام ذكاء صناعي بديل عن الكتاب والمؤلفين
TT

«جي بي تي ـ 3»... نظام ذكاء صناعي بديل عن الكتاب والمؤلفين

«جي بي تي ـ 3»... نظام ذكاء صناعي بديل عن الكتاب والمؤلفين

كشف مختبر «أوبن إي آي» للذكاء الصناعي في سان فرنسيسكو هذا الصيف النقاب عن تقنية كان قد عمل لأشهر على تطويرها. وقد أمضى هذا النظام الجديد واسمه «جي بي تي - 3» GPT - 3 وهو مختصر لعبارة Generative Pre - trained Transformer 3. تلك الأشهر في تعلّم مدخلات ومخرجات اللغة الطبيعية عبر تحليل آلاف الكتب الرقمية وكامل موسوعة ويكيبيديا الإلكترونية وما يقارب تريليون كلمة من مدوّنات ومنشورات على مواقع التواصل الاجتماعي ومواقع أخرى على شبكة الإنترنت.

نظام للكتابة
كان ماكاي ريغلي (23 عاما)، مبرمج الكومبيوتر الشّاب من مدينة «سولت ليك» واحدا من القلّة الذين تمّت دعوتهم لتجربة النظام الذي يستخدم كلّ شيءٍ تعلّمه من بحر النصوص الرقمية الواسع لإنتاج لغة جديدة بنفسه. وتساءل ريغلي ما إذا كان النظام يستطيع تقليد الشخصيات المعروفة والكتابة مثلهم وربّما التحدّث مثلهم. في واحدة من تجاربه، استعان ريغلي باسم عالم النفس الشهير سكوت باري كوفمان. وأخذ النظام اسم كوفمان واختار قضية الإبداع موضوعا للنقاش.
بعدها، عندما سُئِل «جي بي تي - 3» «كيف نصبح أكثر إبداعا؟»، سارع إلى إعطاء الجواب التالي: «أعتقدُ أن التعبير الإبداعي هو نتاج ثانوي طبيعي للعيش منذ الصغر في عالم متنوّع. وكلّما زاد تنوّع هذا العالم، زاد اجتماعُنا بأناسٍ مختلفين وتعرضنا إلى فرص مختلفة وتعرفنا بأماكن مختلفة واصطدامنا بتحديات مختلفة. وكلّما زاد تنوّع هذا الاختلاف، أصبحنا أكثر قدرة على جمع هذه النقاط مع بعضها لتشكيل شيء جديد. أعتقد أنّكم إذا أردتم أن تكونوا مبدعين، فعليكم أن تفعلوا ذلك. إذا أردتُم أن تكونوا كتّابا، فعليكم أن تكتبوا، وإذا أردتم أن تكونوا موسيقيين، فعليكم أن تؤلّفوا، وإذا أردتكم أن تكونوا ممثلين كوميديين، فعليكم أن تصنعوا الكوميديا... وكلّما أبدعتُم أكثر، زاد احتمال عثوركم على أمورٍ شيّقة».
في وقت لاحق، نشر ريغلي المقطع على تويتر واستدعى أحدهم كوفمان الحقيقي لقراءته. شعر الأخير بالذهول وقال: «يبدو هذا المقطع كشيء قد أقوله حقا»، وأضاف لاحقا في تغريدة أخرى: «ذكاء صناعي دقيق ومجنون».

شعر ورسائل
منذ وصوله، دخل نظام «جي بي تي - 3» في عشرات التجارب الأخرى التي أذهلت الكثيرين بالطريقة نفسها. عمل النظام بالقليل من التشجيع فقط على تأليف التغريدات وكتابة الشعر وتلخيص الرسائل الإلكترونية والإجابة على أسئلة عادية وترجمة اللغات وحتّى صناعة برامجه الخاصة على الكومبيوتر. لفتت هذه المهارات انتباه بعض الخبراء في مجال الذكاء الصناعي، ووجد فيها الكثيرون من الباحثين خطوة غير متوقّعة باتجاه الآلات القادرة على فهم تقلّبات اللغة البشرية وأداء بعض المهارات البشرية. وقد رأت ميلاني ميتشل، باحثة في الذكاء الصناعي من معهد «سانتا في» المستقلّ في نيو مكسيكو وواحدة ممن حصلوا على فرصة اختبار هذا النظام، أنّ «الأمر كان مفاجئا بالنسبة لي ولكثير من النّاس. من الصعب أن نعرف ما الذي يفعله هذا النظام تحديدا». ولكنّ هذا النظام ليس أبدا خاليا من العيوب لأنّه غالبا يبتكر لغة تمييزية، وسامّة. وإذا طلبتُم منه تحضير 10 مقاطع بأسلوب عالم النفس سكوت باري كوفمان، فقد يعطيكم 5 نصوص مقنعة و5 أخرى غير مفهومة. وعندما تحادث كوفمان مع شبيهه المصنوع من الذكاء الصناعي، لم يشعر بالمفاجأة التي شعر بها أوّل مرّة. ودار بين الطرفين الحوار التالي:
> سكوت باري كوفمان (الحقيقي): ما هي المخيّلة؟
- نموذج الذكاء الصناعي من سكوت باري كوفمان: ما هي المخيّلة؟ أنت قُل لي!
> سكوت باري كوفمان: أنت يجب أن تعلم!
- نموذج الذكاء الصناعي من سكوت باري كوفمان: لا، أنت يجب أن تعلم. أنت الذي تعلم ما هي المخيّلة. ما هي باعتقادك؟
ولكن حتّى هذه السطور بدت كمحادثة حقيقية وأظهرت بشكل واضح ما يستطيع النظام القيام به وحده دون ترميز إضافي أو تعديل.

نماذج لغوية
نظام «جي بي تي - 3» هو ثمرة سنوات كثيرة من العمل داخل أبرز مختبرات الذكاء الصناعي في العالم ومنها «أوبن إي آي»، المنظّمة المستقلّة المدعومة بتمويل قيمته مليار دولار من مايكروسوفت ومختبرات أخرى تابعة لغوغل وفيسبوك. وتجدر الإشارة إلى أنّ شركة غوغل تملك نظاما مشابها يساعد في الإجابة على الاستفسارات على محرّك البحث خاصتها.
تساعد هذه الأنظمة التي تُعرّف على أنّها نماذج لغوية عالمية في تشغيل مجموعة متنوعة من الأدوات كالخدمات التي تلخّص المقالات الإخبارية أوتوماتيكيا وروبوتات المحادثة المصمّمة للمشاركة في الأحاديث الإلكترونية، إلّا أنّ تأثيرها على تكنولوجيا العالم الحقيقي لا يزال طفيفا. ولكنّ «جي بي تي - 3» الذي تلقّى تعليمه من مجموعة أكبر من النصوص الإلكترونية مقارنة بالأنظمة السابقة، فتح الباب أمام مجموعة واسعة من الاحتمالات الجديدة كالبرامج الرقمية القادرة على تسريع تطوير تطبيقات هاتفية جديدة أو روبوتات محادثة بأداء أقرب إلى البشر من التقنيات التي سبقتها. مع اختبار مصمّمي البرامج وروّاد الأعمال والخبراء والفنّانين لهذا النظام، تثير كلّ تجربة جديدة جدلا حاميا حول القوّة التي سيصل إليها هذا الجيل من التقنية في النهاية. يقول البعض إنّ هذا النظام قد يكون ممرا باتجاه آلات ذكية حقا، بينما يرى آخرون أنّ هذه التجارب مضلّلة رغم الذهول الكبير الذي تولّده.
من جهته، يقول مارك ريدل، أستاذ وباحث في معهد جورجيا للتقنية: «هذا النظام طلقٌ جدا ويتكلّم بوضوح شديد وبارعٌ جدا في إنتاج نصوص منطقية لسامِعِها ولكنّه لا يعرف بعد كيف يفكّر مسبقا ولا يخطّط لما سيقوله، أي أنّه لا يملك هدفا حقيقيا».

إبداعات ناشئة
يعملُ جوردان سينغر مصمّما للمنتج في شركة «سكوير» المتخصصة في منتجات الدفع الإلكتروني في سيليكون فالي، ويساعد في تصميم تطبيقات الشركة للهواتف الذكية.
زوّد المصمّم النظام الجديد بوصفة بسيطة لتطبيق هاتفي ورموز الكومبيوتر الذي يحتاجه لصناعة التطبيق. كانت الوصفة باللغة الإنجليزية الصحيحة وتمّ تصميم الرمز في أداة «فيغما» التي يستخدمها المحترفون مثل سينغر.
وعندما انتهى، استطاع «جي بي تي - 3» كتابة رموز مشابهة وحده دون مساعدة. ويعتبر هذا السلوك جديدا بالكامل وقد فاجأ صانعي «جي بي تي - 3» الذين لم يصمّموا النظام لصناعة رموز الكومبيوتر، بل للتأليف أو كتابة التغريدات أو ترجمة اللغات. لقد صنعوه للقيام بشيء واحد فقط هو توقّع الكلمة التالية في سلسلة من الكلمات.
*خدمة «نيويورك تايمز»



شركات الذكاء الاصطناعي التوليدي تلجأ إلى الكتب لتطوّر برامجها

شركات الذكاء الاصطناعي تتفق مع دور النشر بما يتيح لهذه الشركات استخدام الأعمال المنشورة لتدريب نماذجها القائمة على الذكاء الاصطناعي التوليدي (رويترز)
شركات الذكاء الاصطناعي تتفق مع دور النشر بما يتيح لهذه الشركات استخدام الأعمال المنشورة لتدريب نماذجها القائمة على الذكاء الاصطناعي التوليدي (رويترز)
TT

شركات الذكاء الاصطناعي التوليدي تلجأ إلى الكتب لتطوّر برامجها

شركات الذكاء الاصطناعي تتفق مع دور النشر بما يتيح لهذه الشركات استخدام الأعمال المنشورة لتدريب نماذجها القائمة على الذكاء الاصطناعي التوليدي (رويترز)
شركات الذكاء الاصطناعي تتفق مع دور النشر بما يتيح لهذه الشركات استخدام الأعمال المنشورة لتدريب نماذجها القائمة على الذكاء الاصطناعي التوليدي (رويترز)

مع ازدياد احتياجات الذكاء الاصطناعي التوليدي، بدأت أوساط قطاع النشر هي الأخرى في التفاوض مع المنصات التي توفر هذه التقنية سعياً إلى حماية حقوق المؤلفين، وإبرام عقود مع الجهات المعنية بتوفير هذه الخدمات لتحقيق المداخيل من محتواها.

واقترحت دار النشر «هاربر كولينز» الأميركية الكبرى أخيراً على بعض مؤلفيها، عقداً مع إحدى شركات الذكاء الاصطناعي تبقى هويتها طي الكتمان، يتيح لهذه الشركة استخدام أعمالهم المنشورة لتدريب نماذجها القائمة على الذكاء الاصطناعي التوليدي.

وفي رسالة اطلعت عليها «وكالة الصحافة الفرنسية»، عرضت شركة الذكاء الاصطناعي 2500 دولار لكل كتاب تختاره لتدريب نموذجها اللغوي «إل إل إم» لمدة 3 سنوات.

آراء متفاوتة

ولكي تكون برامج الذكاء الاصطناعي قادرة على إنتاج مختلف أنواع المحتوى بناء على طلب بسيط بلغة يومية، تنبغي تغذيتها بكمية مزدادة من البيانات.

وبعد التواصل مع دار النشر أكدت الأخيرة الموافقة على العملية. وأشارت إلى أنّ «(هاربر كولينز) أبرمت عقداً مع إحدى شركات التكنولوجيا المتخصصة بالذكاء الاصطناعي للسماح بالاستخدام المحدود لكتب معينة (...) بهدف تدريب نماذج الذكاء الاصطناعي وتحسين أدائها».

وتوضّح دار النشر أيضاً أنّ العقد «ينظّم بشكل واضح ما تنتجه النماذج مع احترامها حقوق النشر».

ولاقى هذا العرض آراء متفاوتة في قطاع النشر، إذ رفضه كتّاب مثل الأميركي دانييل كيبلسميث الذي قال في منشور عبر منصة «بلوسكاي» للتواصل الاجتماعي: «من المحتمل أن أقبل بذلك مقابل مليار دولار، مبلغ يتيح لي التوقف عن العمل، لأن هذا هو الهدف النهائي من هذه التكنولوجيا».

هامش تفاوض محدود

ومع أنّ «هاربر كولينز» هي إحدى كبرى دور النشر التي أبرمت عقوداً من هذا النوع، فإنّها ليست الأولى. فدار «ويلي» الأميركية الناشرة للكتب العلمية أتاحت لشركة تكنولوجية كبيرة «محتوى كتب أكاديمية ومهنية منشورة لاستخدام محدد في نماذج التدريب، مقابل 23 مليون دولار»، كما قالت في مارس (آذار) عند عرض نتائجها المالية.

ويسلط هذا النوع من الاتفاقيات الضوء على المشاكل المرتبطة بتطوير الذكاء الاصطناعي التوليدي، الذي يتم تدريبه على كميات هائلة من البيانات تُجمع من الإنترنت، وهو ما قد يؤدي إلى انتهاكات لحقوق الطبع والنشر.

وترى جادا بيستيلي، رئيسة قسم الأخلاقيات لدى «هاغينغ فايس»، وهي منصة فرنسية - أميركية متخصصة بالذكاء الاصطناعي، أنّ هذا الإعلان يشكل خطوة إلى الأمام، لأنّ محتوى الكتب يدرّ أموالاً. لكنها تأسف لأنّ هامش التفاوض محدود للمؤلفين.

وتقول: «ما سنراه هو آلية لاتفاقيات ثنائية بين شركات التكنولوجيا ودور النشر أو أصحاب حقوق الطبع والنشر، في حين ينبغي أن تكون المفاوضات أوسع لتشمل أصحاب العلاقة».

ويقول المدير القانوني لاتحاد النشر الفرنسي (SNE) جوليان شوراكي: «نبدأ من مكان بعيد جداً»، مضيفاً: «إنّه تقدم، فبمجرّد وجود اتفاق يعني أن حواراً ما انعقد وثمة رغبة في تحقيق توازن فيما يخص استخدام البيانات مصدراً، التي تخضع للحقوق والتي ستولد مبالغ».

مواد جديدة

وفي ظل هذه المسائل، بدأ الناشرون الصحافيون أيضاً في تنظيم هذا الموضوع. ففي نهاية 2023، أطلقت صحيفة «نيويورك تايمز» الأميركية اليومية ملاحقات ضد شركة «أوبن إيه آي» مبتكرة برنامج «تشات جي بي تي» وضد «مايكروسوفت» المستثمر الرئيسي فيها، بتهمة انتهاك حقوق النشر. وقد أبرمت وسائل إعلام أخرى اتفاقيات مع «أوبن إيه آي».

وربما لم يعد أمام شركات التكنولوجيا أي خيار لتحسين منتجاتها سوى باعتماد خيارات تُلزمها بدفع أموال، خصوصاً مع بدء نفاد المواد الجديدة لتشغيل النماذج.

وأشارت الصحافة الأميركية أخيراً إلى أنّ النماذج الجديدة قيد التطوير تبدو كأنها وصلت إلى حدودها القصوى، لا سيما برامج «غوغل» و«أنثروبيك» و«أوبن إيه آي».

ويقول جوليان شوراكي: «يمكن على شبكة الإنترنت، جمع المحتوى القانوني وغير القانوني، وكميات كبيرة من المحتوى المقرصن، مما يشكل مشكلة قانونية. هذا من دون أن ننسى مسألة نوعية البيانات».