Türk Medline
ADR Yönetimi
ADR Yönetimi

VARİKOSEL YÖNETİMİNDE UZMAN-YAPAY ZEKA UYUMU: CHATGPT-4.0 NE KADAR GÜVENİLİR?

Fahri Yavuz İLKİ, Emre BÜLBÜL, Selahattin BEDİR

Journal of Urological Surgery - 2026;13(1):39-45

University of Health Sciences Türkiye, Gülhane Training and Research Hospital, Clinic of Urology, Ankara

 

Amaç: ChatGPT-4.0 gibi yapay zeka tabanlı büyük dil modelleri, klinik karar destek süreçlerinde giderek daha fazla değerlendirilmektedir. Ancak, varikosel kaynaklı infertilite için klinik öneriler sunmadaki güvenilirlikleri henüz tam olarak değerlendirilmemiştir. Bu çalışma, ChatGPT-4.0'ın varikosel kaynaklı infertilite hastaları için klinik öneriler sunmadaki güvenilirliğini değerlendirmeyi amaçlamıştır. Gereç ve Yöntem: Dünya Sağlık Örgütü 6. baskı kriterlerine dayalı fizik muayene, hormonal profil ve semen analizi detaylarını içeren, varikoselli ve oligoastenoteratozoospermili 32 yaşında bir erkek hastayı kapsayan standart bir klinik senaryo oluşturulmuştur. On altı tanısal ve terapötik soru geliştirilmiş ve ChatGPT-4.0'a sunulmuştur. Yapay zeka tarafından üretilen yanıtlar, varikosel yönetimi konusunda uzmanlaşmış 24 deneyimli ürolog tarafından 5'li Likert ölçeği kullanılarak değerlendirilmiştir. Bulgular: Ürologlar, ChatGPT-4.0 önerileriyle %80,2 oranında uyum, %10,7 oranında anlaşmazlık ve %9,1 oranında tarafsızlık göstermiştir. 16 sorudan 14'ünde ürologların büyük çoğunluğu ChatGPT-4.0 ile aynı fikirde olduğunu veya kesinlikle katıldığını belirtmiştir. Varikosel ameliyatı endikasyonu, antioksidan kullanımı, 35 yaş üstü kadın partner, ameliyat sonrası takip, testosteron eksikliği ve normospermik varikosel ile ilgili öneriler en yüksek fikir birliğini göstermiştir. Ancak, mikrocerrahi varikosel ameliyatı (%54,1) ve ameliyat öncesi sperm dondurma (%16,7) için daha düşük uyum oranları kaydedilmiştir. Sonuç: ChatGPT-4.0, varikosel tedavisi ile ilgili çoğu senaryoda klinik öneriler sunma konusunda güvenilirlik göstermekte ve uzman klinisyenlerle güçlü bir uyum sergilemektedir. Bununla birlikte, kişiselleştirilmiş karar verme gerektiren belirli "gri bölge" senaryoları, deneyimli klinik yargının önemini vurgulayan sınırlamaları ortaya koymaktadır.