PEDİATRİK ACİL TIPTA BÜYÜK DİL MODELLERİNİN ROLÜ: CHATGPT'NİN DOĞRULUĞU VE KARAR DESTEK POTANSİYELİ

Çağlar KUAS, Ertuğ GÜNSOY, Mustafa Emin ÇANAKÇI, Murat ÇETİN, Volkan ERCAN, Engin ÖZAKIN, Nurdan ACAR

Anatolian Journal of Emergency Medicine - 2026;9(1):39-43

Eskişehir Osmangazi University Medical School, Eskişehir

 

Amaç: Bu çalışmada, yapılandırılmış çoktan seçmeli sorularda ChatGPT'nin doğruluğu insan yanıtlarıyla karşılaştırılarak, çocuk acil pratiğinde karar destek potansiyeli değerlendirildi. Gereç ve Yöntemler: Kesitsel çalışmada Pediatric Emergency Medicine: Just the Facts, Second Edition kitabından rastgele seçilen 100 soru kullanıldı. GPT-4o modeli ek komut verilmeden test edildi. Yanıtlar kaynak cevaplarla ve literatürde bildirilen insan doğruluk oranlarıyla karşılaştırıldı. Doğruluk oranları hesaplandı; z-testi ile karşılaştırma, Spearman testi ile korelasyon analizi yapıldı. Bulgular: ChatGPT 100 sorunun 85'ine doğru yanıt verdi (%85; GA %78,0 -92,0). İnsan doğruluk oranı ortalama %54 (GA %50,8 -57,4) olup fark istatistiksel olarak anlamlıydı (p < 0,001). Konu bazlı analizde ChatGPT'nin doğruluğu %75 -100, insan yanıtlarının doğruluğu %30 -65 arasında değişti. ChatGPT'nin yanlış yanıtladığı 15 sorunun %60'ı vaka bazlıydı; bu sorularda insan doğruluk oranı %35+/-17 idi. İnsan doğruluk oranları ile ChatGPT performansı arasında orta düzeyde pozitif korelasyon bulundu (rho = 0,40; p < 0,001). Sonuç: ChatGPT, bilgi yoğunluğu yüksek pediatrik acil sorularında yüksek doğruluk göstermiştir. Bulgular, modelin eğitim ve karar desteğinde tamamlayıcı bir araç olabileceğini göstermektedir. Bununla birlikte, vaka bazlı muhakemede sınırlılıkları devam etmektedir. ChatGPT ve benzeri modellerin klinik kullanıma entegrasyonu için ileriye dönük çalışmalara ihtiyaç vardır.