أدوات ذكاء صناعي للتحقق من أصالة الأفكار

تميز بين النصوص الفكرية والمصنّعة

أدوات ذكاء صناعي للتحقق من أصالة الأفكار
TT

أدوات ذكاء صناعي للتحقق من أصالة الأفكار

أدوات ذكاء صناعي للتحقق من أصالة الأفكار

قريباً، قد يصبح أمراً عادياً أن نصطدم بتغريدة، أو مقال أو خبر، ونتساءل ما إذا كان معدّه برنامج ذكاء صناعي. قد تحيط التساؤلات بهويّة مؤلّف النصّ كما يحصل في الأوساط الأكاديمية، أو بموثوقيّة المحتوى في حالة المقالات.

أدوات التحقق من الأصالة
قد تدور الأسئلة أيضاً حول الأصالة: في حال ظهور فكرة مضلّلة فجأة في منشورات على الإنترنت، هل يتحرّك انتشارها بفعل نشاط المستخدمين، أم أنّ هذه المنشورات ولّدها الذكاء الصناعي للإيحاء بوجود شعبية لها؟
شهدت الشهور القليلة الماضية بداية نشوء أدوات التعريف التي تُحدّد ما إذا كانت النصوص من صناعة الذكاء الصناعي، وأبرزها أداةٌ من تطوير «أوبن إي آي»، الشركة التي ابتكرت برنامج «تشات جي بي تي». وتستخدم هذه الأداة نموذج ذكاء صناعي لرصد الفروقات بين النصوص الآلية الصنع وتلك التي يكتبها البشر.
عندما اختبرت الشركة أداتها، نجحت في التعرف على نصوص الذكاء الصناعي في حوالي نصف نماذج النصوص الآلية الصنع التي حلّلتها فقط. في ذلك الوقت، زعمت الشركة أنّها أطلقت هذا الراصد التجريبي «للحصول على انطباعات المستخدمين حول ما إذا كانت هذه الأدوات غير المثالية مفيدة».
يقول الخبراء إنّ تعريف النصوص الصناعية يزداد صعوبة مع استمرار تقدّم برمجيات كـ«تشات جي بي تي» وتقديمها نصوصا مقنعة كتلك التي يكتبها البشر. تختبر «أوبن إي آي» اليوم تقنية مهمّتها إدخال كلمات خاصّة على النصوص التي يولّدها «تشات جي بي تي» لتسهيل رصد نصوصه لاحقاً. تُعرف هذه التقنية بالعلامات المائية watermarking.
كشف جان ليك، رئيس قسم التنسيق في «أوبن إي آي»، أنّ «تقنية العلامات المائية التي تختبرها شركته شبيهة جداً بتقنية استعرضتها ورقة بحثية أخيرة نشرها باحثون من جامعة ماريلاند».
في هذه الحالة، قد يحاول أحدهم التخلّص من العلامة المائية من خلال توليف النص، ولكنّه لن يتمكّن من معرفة الكلمات التي يجب أن يغيّرها، وحتّى إذا نجح في تغيير بعضٍ من الكلمات المميّزة، لن ينجح على الأرجح إلّا في تقليل النسبة العامّة بنقاط قليلة.
من جهته، شرح توم غولدستين، أستاذ في جامعة ماريلاند والباحث المشارك في الورقة البحثية الخاصة بتقنية العلامات المائية، أنّ العلامة المائية خاصّتهم قابلة للرصد حتّى في «نصٍّ صغير جداً» كتغريدة مثلاً. في المقابل، تتطلّب أداة الرصد التي أطلقتها «أوبن إي آي» 1000 حرف، أو علامة، بالحدّ الأدنى.

محدودية الرصد
ولكنّ العلامات المائية ليست مثالية، شأنها شأن أيّ تقنية رصد أخرى، على حدّ تعبير غولدستين. إذ دُرّبت تقنية «أوبن إي آي» الحالية للرصد لتعريف نصوص يولدها 34 نموذجا لغويا مختلفا، إلا أن راصد العلامات المائية خاصتها يستطيع تعريف النصوص التي أنتجها نموذجٌ أو روبوت محادثة يستخدم نفس لائحة الكلمات المميزة التي يستخدمها الراصد.
هذا الأمر يعني أنّ هذه الوسيلة قد تقودنا إلى مستقبل تخضع فيه النصوص المريبة إلى مراجعة عدّة أدوات رصد بالعلامات المائية إلّا في حال اتفقت الشركات العاملة في مجال الذكاء الصناعي على وضع لائحة موحّدة بالمعايير التنفيذية للعلامات المائية.
في هذا السياق، اعتبر غولدستين أنّ ضمان فعالية العلامات المائية كلّ مرّة في منتجٍ يُستخدم على نطاق واسع كـ«تشات جي بي تي» دون التنازل عن نوعية مخرجاته سيتطلّب الكثير من الهندسة.
ولفت ليك من «أوبن إي آي» إلى أنّ الشركة لا تزال تدرس العلامات المائية كشكلٍ من أشكال الرصد، مضيفاً أنّها قد تعمد إلى استخدامها لتتمّة الأداة التي أطلقتها أخيراً على اعتبار أنّ كلتيهما «تتمتّع بمواطن قوّة وضعف مختلفة».
ومع ذلك، يعتقد الكثير من الخبراء أنّ تطوير أداة واحدة قادرة فعلاً على رصد كلّ النصوص التي يولّدها الذكاء الصناعي بدقّة ليس بالأمر الممكن، بسبب احتمال نشوء أدوات أخرى قد تساعد في إزالة الدليل الذي يثبت مسؤولية الذكاء الصناعي عن النصّ. علاوةً على ذلك، قد يصعب رصد النصّ الآلي الصنع، حتّى ولو كان يحمل علامة مائية، في حال كان جزءاً صغيراً من نصّ أكبر.
يقول الخبراء أيضاً إنّ أدوات الرصد خصوصاً تلك التي لا تستخدم علامات مائية، قد لا تتعرّف على النصوص الآلية الصنع التي شهدت تغييرات كثيرة.
وقال دايفيد كوكس، مدير مختبر «واطسون للذكاء الصناعي» التابع لمعهد ماساتشوستس للتكنولوجيا والمؤسسة الدولية للحواسيب (IBM): «أعتقد أنّ الفكرة هنا هي حتميّة توفّر أداة سحرية يطوّرها بائع النموذج أو طرف ثالث للمساعدة في إزالة الشكوك - ولكنّني لا أظنّ أنّنا سننعم بفرصة العيش في هذا العالم». ويعتقد بعض الخبراء أنّه على «أوبن إي آي» والشركات الأخرى المطوّرة لروبوتات المحادثة أن تأتي بحلول لأدوات الرصد قبل إطلاق منتجات للذكاء الصناعي خاصّتها وليس بعده.
أطلقت «أوبن إي آي» «تشات جي بي تي» في نهاية نوفمبر (تشرين الثاني) مثلاً، ولكنّها لم تصدر أداتها الخاصة للرصد إلّا بعد حوالي شهرين، في نهاية يناير (كانون الثاني). في ذلك الوقت، كان الأساتذة والباحثون قد بدأوا المطالبة بأدوات تساعدهم في تحديد النصوص المصنوعة آلياً. اشترك الكثيرون منهم لاستخدام أداة رصد جديدة اسمها «جي بي تي زيرو» GPTZero، طوّرها طالبٌ في جامعة برينستون خلال إجازته الشتوية وأصدرها في الأوّل من يناير (كانون الثاني).
وقال إدوارد تيان، مطوّر «جي بي تي زيرو»: «لقد سمعنا شكاوى من عدد كبير جداً من الأساتذة»، مضيفاً أنّ أكثر من 43 ألف أستاذ سجّلوا دخولهم لاستخدام الأداة منذ منتصف فبراير (شباط).
وأضاف أنّ «الذكاء الصناعي التوليدي تقنية مذهلة، ولكنّنا مع كلّ تقنية جديدة، نحتاج لتطوير ضمانات تساعد في تبنيها بشكلٍ مسؤول، على أن تتوفر هذه الضمانات فوراً وليس بعد أشهر أو سنوات من ظهور التقنية».
كيف يولّد الذكاء الصناعي النصوص؟

> عندما تصنع برمجيات الذكاء الصناعي مثل «تشات جي بي تي» النصوص، تدرس خيارات كثيرة لكلّ كلمة وتأخذ في الحسبان الإجابات السابقة التي كتبتها والسؤال الذي طُرح عليها.
تضع هذه البرامج نتيجة لكلّ خيار على اللائحة لتحديد احتمالية استخدام الكلمة بناءً على عددٍ كبير من النصوص البشرية التي حلّلتها.
بعدها، يختار «تشات جي بي تي»، الذي صُمّم بناء على ما يُعرف بنموذج لغوي كبير، الكلمة صاحبة النتيجة الأعلى وينتقل إلى اختيار الكلمة التالية.
تكون النتائج التي تقدّمها هذه البرامج غالباً منمّقة ومعقّدة إلى درجة توحي بأنّ روبوت المحادثة يفهم ما يقول، ولكنّه لا يفعل.
يعتمد كلّ خيار يقوم به هذا البرنامج على عمليات حسابية معقّدة وكميات كبيرة من البيانات تساعده غالباً في كتابة نصّ متماسك ودقيق. ولكن «تشات جي بي تي» لا يدرك خطأه أبداً عندما يقول شيئاً غير صحيح.

* خدمة «نيويورك تايمز».


مقالات ذات صلة

«بلاك هات» تعود إلى الرياض بنسختها الثالثة

عالم الاعمال «بلاك هات» تعود إلى الرياض بنسختها الثالثة

«بلاك هات» تعود إلى الرياض بنسختها الثالثة

تعود فعالية الأمن السيبراني الأبرز عالمياً «بلاك هات» في نسختها الثالثة إلى «مركز الرياض للمعارض والمؤتمرات» ببلدة ملهم شمال العاصمة السعودية الرياض.

تكنولوجيا «غوغل» تطلق النسخة الأولية من آندرويد 16 للمطورين مع ميزات جديدة لتعزيز الخصوصية ومشاركة البيانات الصحية (غوغل)

«غوغل» تطلق النسخة الأولية من آندرويد 16 للمطورين مع ميزات جديدة

أطلقت «غوغل» النسخة التجريبية الأولية من آندرويد 16 للمطورين، وهي خطوة تمهد الطريق للتحديثات الكبيرة المقبلة في هذا النظام.

عبد العزيز الرشيد (الرياض)
تكنولوجيا «أبل» تؤكد مشكلة اختفاء الملاحظات بسبب خلل بمزامنة (iCloud) وتوضح خطوات استعادتها مع توقع تحديث (iOS) قريب (أبل)

اختفاء الملاحظات في أجهزة آيفون... المشكلة والحلول

وفقاً لتقرير رسمي من «أبل»، فإن المشكلة تتعلق بإعدادات مزامنة الآيكلاود (iCloud).

عبد العزيز الرشيد (الرياض)
تكنولوجيا تمكنك «دورا» من تصميم مواقع ثلاثية الأبعاد مذهلة بسهولة تامة باستخدام الذكاء الاصطناعي دون الحاجة لأي معرفة برمجية (دورا)

صمم موقعك ثلاثي الأبعاد بخطوات بسيطة ودون «كود»

تتيح «دورا» للمستخدمين إنشاء مواقع مخصصة باستخدام الذكاء الاصطناعي عبر إدخال وصف نصي بسيط.

عبد العزيز الرشيد (الرياض)
خاص يحول الذكاء الاصطناعي الطابعات من مجرد خدمة بسيطة إلى أداة أكثر ذكاءً واستجابة لحاجات المستخدمين (أدوبي)

خاص كيف يجعل الذكاء الاصطناعي الطابعات أكثر ذكاءً؟

تلتقي «الشرق الأوسط» الرئيسة العامة ومديرة قسم الطباعة المنزلية في شركة «إتش بي» (HP) لفهم تأثير الذكاء الاصطناعي على عمل الطابعات ومستقبلها.

نسيم رمضان (بالو ألتو - كاليفورنيا)

شركات الذكاء الاصطناعي التوليدي تلجأ إلى الكتب لتطوّر برامجها

شركات الذكاء الاصطناعي تتفق مع دور النشر بما يتيح لهذه الشركات استخدام الأعمال المنشورة لتدريب نماذجها القائمة على الذكاء الاصطناعي التوليدي (رويترز)
شركات الذكاء الاصطناعي تتفق مع دور النشر بما يتيح لهذه الشركات استخدام الأعمال المنشورة لتدريب نماذجها القائمة على الذكاء الاصطناعي التوليدي (رويترز)
TT

شركات الذكاء الاصطناعي التوليدي تلجأ إلى الكتب لتطوّر برامجها

شركات الذكاء الاصطناعي تتفق مع دور النشر بما يتيح لهذه الشركات استخدام الأعمال المنشورة لتدريب نماذجها القائمة على الذكاء الاصطناعي التوليدي (رويترز)
شركات الذكاء الاصطناعي تتفق مع دور النشر بما يتيح لهذه الشركات استخدام الأعمال المنشورة لتدريب نماذجها القائمة على الذكاء الاصطناعي التوليدي (رويترز)

مع ازدياد احتياجات الذكاء الاصطناعي التوليدي، بدأت أوساط قطاع النشر هي الأخرى في التفاوض مع المنصات التي توفر هذه التقنية سعياً إلى حماية حقوق المؤلفين، وإبرام عقود مع الجهات المعنية بتوفير هذه الخدمات لتحقيق المداخيل من محتواها.

واقترحت دار النشر «هاربر كولينز» الأميركية الكبرى أخيراً على بعض مؤلفيها، عقداً مع إحدى شركات الذكاء الاصطناعي تبقى هويتها طي الكتمان، يتيح لهذه الشركة استخدام أعمالهم المنشورة لتدريب نماذجها القائمة على الذكاء الاصطناعي التوليدي.

وفي رسالة اطلعت عليها «وكالة الصحافة الفرنسية»، عرضت شركة الذكاء الاصطناعي 2500 دولار لكل كتاب تختاره لتدريب نموذجها اللغوي «إل إل إم» لمدة 3 سنوات.

آراء متفاوتة

ولكي تكون برامج الذكاء الاصطناعي قادرة على إنتاج مختلف أنواع المحتوى بناء على طلب بسيط بلغة يومية، تنبغي تغذيتها بكمية مزدادة من البيانات.

وبعد التواصل مع دار النشر أكدت الأخيرة الموافقة على العملية. وأشارت إلى أنّ «(هاربر كولينز) أبرمت عقداً مع إحدى شركات التكنولوجيا المتخصصة بالذكاء الاصطناعي للسماح بالاستخدام المحدود لكتب معينة (...) بهدف تدريب نماذج الذكاء الاصطناعي وتحسين أدائها».

وتوضّح دار النشر أيضاً أنّ العقد «ينظّم بشكل واضح ما تنتجه النماذج مع احترامها حقوق النشر».

ولاقى هذا العرض آراء متفاوتة في قطاع النشر، إذ رفضه كتّاب مثل الأميركي دانييل كيبلسميث الذي قال في منشور عبر منصة «بلوسكاي» للتواصل الاجتماعي: «من المحتمل أن أقبل بذلك مقابل مليار دولار، مبلغ يتيح لي التوقف عن العمل، لأن هذا هو الهدف النهائي من هذه التكنولوجيا».

هامش تفاوض محدود

ومع أنّ «هاربر كولينز» هي إحدى كبرى دور النشر التي أبرمت عقوداً من هذا النوع، فإنّها ليست الأولى. فدار «ويلي» الأميركية الناشرة للكتب العلمية أتاحت لشركة تكنولوجية كبيرة «محتوى كتب أكاديمية ومهنية منشورة لاستخدام محدد في نماذج التدريب، مقابل 23 مليون دولار»، كما قالت في مارس (آذار) عند عرض نتائجها المالية.

ويسلط هذا النوع من الاتفاقيات الضوء على المشاكل المرتبطة بتطوير الذكاء الاصطناعي التوليدي، الذي يتم تدريبه على كميات هائلة من البيانات تُجمع من الإنترنت، وهو ما قد يؤدي إلى انتهاكات لحقوق الطبع والنشر.

وترى جادا بيستيلي، رئيسة قسم الأخلاقيات لدى «هاغينغ فايس»، وهي منصة فرنسية - أميركية متخصصة بالذكاء الاصطناعي، أنّ هذا الإعلان يشكل خطوة إلى الأمام، لأنّ محتوى الكتب يدرّ أموالاً. لكنها تأسف لأنّ هامش التفاوض محدود للمؤلفين.

وتقول: «ما سنراه هو آلية لاتفاقيات ثنائية بين شركات التكنولوجيا ودور النشر أو أصحاب حقوق الطبع والنشر، في حين ينبغي أن تكون المفاوضات أوسع لتشمل أصحاب العلاقة».

ويقول المدير القانوني لاتحاد النشر الفرنسي (SNE) جوليان شوراكي: «نبدأ من مكان بعيد جداً»، مضيفاً: «إنّه تقدم، فبمجرّد وجود اتفاق يعني أن حواراً ما انعقد وثمة رغبة في تحقيق توازن فيما يخص استخدام البيانات مصدراً، التي تخضع للحقوق والتي ستولد مبالغ».

مواد جديدة

وفي ظل هذه المسائل، بدأ الناشرون الصحافيون أيضاً في تنظيم هذا الموضوع. ففي نهاية 2023، أطلقت صحيفة «نيويورك تايمز» الأميركية اليومية ملاحقات ضد شركة «أوبن إيه آي» مبتكرة برنامج «تشات جي بي تي» وضد «مايكروسوفت» المستثمر الرئيسي فيها، بتهمة انتهاك حقوق النشر. وقد أبرمت وسائل إعلام أخرى اتفاقيات مع «أوبن إيه آي».

وربما لم يعد أمام شركات التكنولوجيا أي خيار لتحسين منتجاتها سوى باعتماد خيارات تُلزمها بدفع أموال، خصوصاً مع بدء نفاد المواد الجديدة لتشغيل النماذج.

وأشارت الصحافة الأميركية أخيراً إلى أنّ النماذج الجديدة قيد التطوير تبدو كأنها وصلت إلى حدودها القصوى، لا سيما برامج «غوغل» و«أنثروبيك» و«أوبن إيه آي».

ويقول جوليان شوراكي: «يمكن على شبكة الإنترنت، جمع المحتوى القانوني وغير القانوني، وكميات كبيرة من المحتوى المقرصن، مما يشكل مشكلة قانونية. هذا من دون أن ننسى مسألة نوعية البيانات».