ChatGPT فاشل بشكل أساسي في تشخيص المرضى

قد يكون ChatGPT مفيدًا لتقديم المشورة بشأن التدريبات الخاصة بك، ولكن لا يزال أمامها طريق طويل قبل أن تحل محل الطبيب. وجدت تجربة حديثة أن برنامج الدردشة الآلي الشهير الذي يعمل بالذكاء الاصطناعي يقوم بإجراء مكالمات طبية خاطئة في أغلب الأحيان.

“إن ChatGPT في شكله الحالي ليس دقيقًا كأداة تشخيصية،” هذا ما قاله الباحثون الذين يقفون وراء تطبيق ChatGPT يذاكركتب اليوم في مجلة PLOS ONE. “لا يعطي ChatGPT بالضرورة صحة واقعية، على الرغم من الكم الهائل من المعلومات التي تم تدريبه عليها.”

في فبراير 2023، تم إطلاق ChatGPT قادرة على المرور بالكاد امتحان الترخيص الطبي بالولايات المتحدة بدون أي مدخلات متخصصة إضافية من المدربين البشريين. على الرغم من أن البرنامج لم يقترب من اجتياز الاختبار، إلا أن الباحثين الذين قاموا بالتجربة أشادوا بالنتيجة باعتبارها “معلمًا بارزًا” للذكاء الاصطناعي.

ومع ذلك، لاحظ العلماء القائمون على الدراسة الجديدة أنه على الرغم من أن اجتياز اختبار الترخيص أظهر قدرة ChatGPT على الإجابة على أسئلة طبية موجزة، إلا أن “جودة استجاباته للحالات الطبية المعقدة لا تزال غير واضحة”.

ولتحديد مدى جودة أداء ChatGPT 3.5 في تلك الحالات الأكثر تعقيدًا، قدم الباحثون للبرنامج 150 حالة مصممة لتحدي القدرات التشخيصية لمتخصصي الرعاية الصحية. تضمنت المعلومات المقدمة إلى ChatGPT تاريخ المريض ونتائج الفحص البدني وبعض نتائج المختبر أو التصوير. ثم طُلب من ChatGPT إجراء التشخيص أو وضع خطة علاج مناسبة. قام الباحثون بتقييم إجابات الروبوت بناءً على ما إذا كان قد أعطى الإجابة الصحيحة. كما قاموا أيضًا بتقييم ChatGPT وفقًا لمدى نجاحه في إظهار عمله، وسجلوا وضوح الأساس المنطقي وراء التشخيص أو العلاج الموصوف ومدى ملاءمة المعلومات الطبية المذكورة.

بينما كان ChatGPT تدريب على مئات التيرابايت من البيانات عبر الإنترنت، لم تحصل على الإجابة الصحيحة إلا في 49% من الحالات. لقد سجلت نتائج أفضل قليلاً فيما يتعلق بملاءمة تفسيراتها، حيث قدمت تفسيرات كاملة وذات صلة بنسبة 52% من الوقت. لاحظ الباحثون أنه على الرغم من أن الذكاء الاصطناعي كان جيدًا إلى حد ما في القضاء على الإجابات الخاطئة، إلا أن هذا ليس مثل اتخاذ القرار الصحيح في بيئة سريرية. وكتبوا: “الدقة والحساسية أمران حاسمان بالنسبة لأداة التشخيص لأن التشخيص المفقود يمكن أن يؤدي إلى عواقب وخيمة على المرضى، مثل نقص العلاجات اللازمة أو المزيد من الاختبارات التشخيصية، مما يؤدي إلى نتائج صحية أسوأ”.

بشكل عام، تم وصف برنامج الدردشة الآلي بأنه يتمتع “بقدرة تمييزية معتدلة بين التشخيص الصحيح وغير الصحيح” وأداء عام “متوسط” في الاختبار. على الرغم من أنه لا ينبغي الاعتماد على ChatGPT لتشخيص المرضى بدقة، إلا أن الباحثين قالوا إنه ربما لا يزال له استخدامات ذات صلة بالأطباء الطموحين بفضل وصوله إلى كميات هائلة من البيانات الطبية.

وكتبوا: “بالاشتراك مع طرق التدريس التقليدية، يمكن لـ ChatGPT مساعدة الطلاب على سد الفجوات في المعرفة وتبسيط المفاهيم المعقدة من خلال تقديم إجابات فورية وشخصية على الأسئلة السريرية”.

بعد كل هذا، قد يتفوق الذكاء الاصطناعي على الأطباء البشريين في مجال واحد: وجدت دراسة أجريت في أبريل 2023 أن ChatGPT كان قادرًا على كتابة رسائل بريد إلكتروني متعاطفة مع المرضى أكثر من المستندات الحقيقية.

مرتبط

الوسوم

مرتبط

اترك تعليقاً إلغاء الرد