Türk Medline
ADR Yönetimi
ADR Yönetimi

BÜYÜK DİL MODELLERİNİN RESMİ PERİODONTOLOJİ SORULARI ÜZERİNDEKİ PERFORMANSI: TÜRK DİŞ HEKİMLİĞİ UZMANLIK SINAVI'NIN 13 YILLIK ANALİZİ

Fatih KARAASLAN, Yaren ERİŞKEN

Acıbadem Üniversitesi Sağlık Bilimleri Dergisi - 2026;17(1):0-0

Usak University, Faculty of Dentistry, Department of Periodontology, Usak, Türkiye

 

Amaç: Bu çalışma, Türk Diş Hekimliği Uzmanlık Sınavı'nın (DUS) resmi periodontoloji sorularında büyük dil modellerinin (LLM'lerin) performansını sistematik olarak değerlendirmeyi amaçlamıştır. Yöntem: Toplam 180 metin tabanlı soru (159 çoktan seçmeli (ÇSS), 21 kombinasyon tipi ÇSS (K-ÇSS)) 13 yıllık (2012-2024) süreçte dokuz alana ayrılmıştır. Nisan 2025'te sekiz LLM test edilmiştir: ChatGPT-4o, ChatGPT-4o mini, Gemini 1.5 Flash, Gemini 1.5 Pro, Gemini 2.0 Flash, Copilot, DeepSeek-V3 ve Qwen 2.5-Max. Bulgular: Doğruluk oranı alanlara göre anlamlı farklılık göstermiştir. Gemini 2.5 Pro en yüksek performansı göstermiş, altı alanda %100 doğruluk elde etmiştir. Sonuç: Periodontolojide LLM doğruluğu modele ve alana bağlıdır. Gemini 2.5 Pro gibi ileri sistemler eğitim ve klinik karar desteğinde umut vaat etmektedir.