Türk Medline
ADR Yönetimi
ADR Yönetimi

CİNSİYET GELİŞİM BOZUKLUKLARININ YÖNETİMİNDE BÜYÜK DİL MODELLERİNİN KARŞILAŞTIRMALI ANALİZİ: KLİNİK KILAVUZLARA DAYALI BİR DEĞERLENDİRME

Saime Sundus Uygun, Fatma Ozcan Siki

Selçuk Tıp Dergisi - 2025;41(4):201-204

Selcuk University, Faculty of Medicine, Department of Naonatology, Konya, Türkiye

 

Amaç: Bu çalışma, günümüzde yaygın ol arak kullanılan iki yapay zekâ ta banlı sohbet sistemi olan ChatGPT ve Bing AI'nin, Türk Neonatoloji Derneği t arafından yayımlanan Cinsiyet Gelişim Bozuklukları kıl avuzunda yer alan klinik önerilerle uyum düzey lerini karşı laştırmayı amaçlamaktadır. Gereç ve Yöntemler: Türk Neonatoloji Derneği Cinsiyet Gelişim Bozuklukları kılavuzuna dayalı olarak hazı rlanmış 4 0 sorudan oluşan standart bir değe rlendirme seti kullanılmıştır . Sorular , klinik kar ar verme süre çlerini yansıtan altı ana kategor i altında gruplandır ılmış v e tamamı hem Cha tGPT hem de Bing AI'y a yön eltilmişt ir. Tüm sorular yazılı metin formatında iletilmiştir . Yanıtl ar, kılavuzla uyum açısından biri neonatoloji, diğeri çocu k cerrahisi uzm anı olmak üzere iki bağımsız uzman tarafından 5 puanlık Likert ölçeği ile değerlendirilmiştir. Her kategori i çin ChatGPT ve Bing AI'nin orta lama puanları hesaplanmış, bu puanlar aras ındaki far k Wilcoxon işaretli sıra testi ile istatistiksel olarak karşılaştırıl mıştır. Bulgular: ChatGPT, altı kategorinin tamamında Türk Neonatoloji Dern eği'nin Cinsiyet Gelişim Bozuklukları kılavuzu ile yüksek düzeyde uyum göstermişti r (o rtalama puan: 4,88). Buna karşın, Bing AI bazı kategorilerde daha düşük uyum sergilemiştir (ortalama puan: 3,25 ). İki sistem arasındaki ortalama puan farkları tüm kateg orilerde istatistiksel olar ak anlamlı bulunmuştur (p<0,05). Özellik le tanı sü reci/laboratuvar testler i ve teda vide multidisipliner yak laşım kategori lerinde Bing AI'nın perfo rmansı belirgin şekilde düşüktür. Son uç: ChatGPT, Cinsiyet Gelişim Bozuklukları konusu nda kılavuz temelli klinik destek sağlama açısından Bi ng AI'ya g öre d aha yüksek doğruluk ve tutarlılık göstermiştir. Güncel klinik kılavuzlarla uyumlu yapay zekâ destekli sistemlerin kullanımı, karm aşık ve mu ltidisipliner karar verme süreçlerinde hekimleri destekl eme potansiyeline sahiptir. Bu nedenle, klinik uygulamalarda kullanılacak yapay zekâ araçla rının seçi mi, bu tür sistematik değerlendirmelere dayanmalı dır. Güven ilir yapay zekâ tabanlı sistemler, hasta yönetiminde klinisyenlere öne mli katkılar sağlayabilir.