Ahmet Taha KAYAOĞLU, Esat KABA, Hafsa KOLLUK KAYAOĞLU, Hüseyin ER, Yusuf ÇUBUKÇU, Dilara BUDAK, Fatma BEYAZAL ÇELİKER, Nur HÜRSOY
İzmir Eğitim ve Araştırma Hastanesi Tıp Dergisi - 2026;30(1):77-82
Giriş: Bu çalışmanın amacı, ChatGPT modelinin pediatrik acil ultrason raporlarında acil patolojileri tespit etmedeki başarısını değerlendirmek ve sıfır atış ve az atış promptlama tekniklerinin etkinliğini karşılaştırmaktır. Gereç ve Yöntem: Çalışmaya toplam 196 pediatrik acil ultrason raporu dahil edildi. İlk olarak ultrason raporları anonimleştirildi. Board sertifikalı bir radyolog, raporları acil patoloji açısından pozitif veya negatif olarak etiketledi. ChatGPT-3.5 ve 4 modelleri, farklı prompt teknikleri (sıfır atış ve az atış) ve farklı zamanlarda (Mart ve Haziran) test edildi. Her modelin performansı doğruluk, duyarlılık, özgüllük ve F1 skoru kullanılarak değerlendirildi. İkili sınıfları karşılaştırmak için McNemar testi kullanıldı. Bulgular: En sık tespit edilen acil durum patolojileri testis torsiyonu, apandisit ve intussepsiyondu. ChatGPT-4 (Mart, sıfır atış) en yüksek başarı oranını elde etti (doğruluk %94, duyarlılık %91, özgüllük %95). İkili sınıflandırmada, yalnızca ChatGPT-3.5 sıfır atış (Haziran) ve ChatGPT-4 sıfır atış (Haziran) cevapları arasında istatistiksel olarak anlamlı bir fark bulundu (p<0,05). Tüm modellerin doğruluk oranları %88 ile %94 arasındaydı. Az atışlı komut verme, sıfır atış tekniğine göre önemli bir performans avantajı göstermedi. Sonuç: ChatGPT modelleri, radyologların yorumlamalarıyla karşılaştırıldığında acil patoloji durumlarını tespit etmek için başarılı bir yöntemdir. Çalışmamız, büyük dil modellerinin klinik iş akışlarında triyaj aracı olarak kullanılma potansiyelini göstermektedir.