في دراسة شاملة أجراها باحثون من مستشفى «Mass General Brigham» في الولايات المتحدة، تم وضع كفاءة محرك «تشات جي بي تي» في اتخاذ القرارات السريرية تحت المجهر.
وقد أشارت النتائج إلى أن «ChatGPT» روبوت المحادثة الشهير الذي يعمل بالذكاء الاصطناعي عبر نموذج اللغة الكبيرة (LLM)، أظهر مستوى دقة جديراً بالثناء يبلغ نحو 72 في المائة في مجموعة متنوعة من المهام السريرية.
نطاق دراسة واسع
من خلال تغطية مختلف التخصصات الطبية، أظهر «تشات جي بي تي» كفاءة متسقة، سواء كان ذلك في سياقات الرعاية الأولية أو الطوارئ.
وقد قيمت الدراسة دعم القرار في «ChatGPT» بدءاً من التفاعلات الأولية مع المريض وحتى سيناريوهات الرعاية الكاملة أي بدءاً من صياغة التشخيصات المحتملة وحتى التشخيصات النهائية واتخاذ قرارات الرعاية المستنيرة.
ولإجراء هذا التقييم، استخدم الباحثون 36 مقالة سريرية موحدة، تم إدخال هذه المقالات القصيرة بشكل منهجي في «ChatGPT»، كانت المهمة الأولية لبرنامج الدردشة الآلي هي اقتراح قائمة بالتشخيصات المحتملة باستخدام البيانات الأولية للمريض، مثل العمر والجنس والأعراض ومدى إلحاح الحالة. ومع تقديم المزيد من التفاصيل، توسعت مهمة «ChatGPT» لتشمل قرارات الإدارة وتحديد تشخيص نهائي.
وبهدف الوصول إلى تقييم نقدي، تم قياس تشخيصات «ChatGPT» وقراراتها وفقاً لمعايير التشخيص التفريقي والاختبارات التشخيصية والتشخيص القاطع وقرارات الرعاية اللاحقة. تضمنت مقاييس التقييم منح نقاط لاتخاذ قرارات دقيقة والاستفادة من الانحدارات الخطية لتحديد ما إذا كان أداء روبوت الدردشة له أي علاقة بالخصائص الديموغرافية للمقالات القصيرة.
نتائج واعدة
وكانت النتيجة الشاملة هي أن «ChatGPT» تمكّن من تحقيق دقة إجمالية تبلغ نحو 72 في المائة. يكشف تحليل للنتائج أنه كان أكثر مهارة في الوصول إلى التشخيص النهائي بمعدل دقة 77 في المائة. ومع ذلك، فقد تعثر قليلاً عند اقتراح التشخيص التفريقي، حيث بلغت نسبة نجاحه 60 في المائة فقط. وعندما تم تكليف «ChatGPT» بقرارات الإدارة السريرية، مثل تحديد أفضل الأدوية بعد التشخيص الصحيح، حقق دقة بنسبة 68 في المائة.
وفي تعليقه على النتائج، أشار الدكتور مارك سوتشي، مؤلف الدراسة، إلى أن «ChatGPT» واجه صعوبة في اقتراح تشخيصات تفريقية، وهو جانب أساسي من الطب، حيث يقرر الطبيب الخطوات التالية. وشدد على أن «هذا يسلط الضوء على الخبرة المحورية للأطباء، خاصة في المراحل الأولى من رعاية المرضى عندما تكون هناك تشخيصات محتملة متعددة».
على الرغم من أن دمج أدوات مثل «ChatGPT» في المجالات السريرية يعد أمراً واعداً، فإن بعض الخبراء يرون أنه ليس بديلاً لخبرة الأطباء، حيث تظل الأبحاث المعيارية الصارمة والفحوصات التنظيمية أمراً ضرورياً.