Türk Medline
ADR Yönetimi
ADR Yönetimi

PEDİATRİK KONTAKT LENSLER İÇİN BÜYÜK DİL MODELİ SOHBET BOTLARININ DEĞERLENDİRİLMESİ: DOĞRULUK, OKUNABİLİRLİK VE GÜVENİLİRLİK

Mehmet Ömer KIRIŞTIOĞLU, Meral YILDIZ, Sevde İŞLEKER, Esin SÖĞÜTLÜ SARI, Ahmet Tuncer ÖZMEN, Mehmet BAYKARA

Uludağ Üniversitesi Tıp Fakültesi Dergisi - 2026;52(1):1780297-0

Department of Ophthalmology, Bursa Uludağ University, Faculty of Medicine, Bursa, Türkiye

 

Bu çalışma, pediatrik kontakt lenslerle ilgili sorulara verilen yapay zekâ tabanlı sohbet robotu yanıtlarının doğruluk, okuna bilirlik ve kapsamlılık açısından değerlendirilmesini, uzman değerlendirmeleri ve okunabilirlik ölçütleri kullanarak incelemiştir. ChatGPT -4o, Gemini 1.5, Perplexity, Copilot ve Claude 3.5 Sonnet olmak üzere beş büyük dil modeli, 28 adet seçilmiş soru ile test edilmiştir. Yanıtlar, DISCERN ve PEMAT -P gibi doğrulanmış araçlar, doğruluk ve kapsamlılık için 5 puanlık Likert ölçekleri ve çeşitli okunabilirlik indeksleri kullanılarak, iki pediatrik oftalmoloji uzmanı tarafından değerlendirilmiştir. Uzman yanıtları yalnızca okunabilirlik karşılaştırmalarında kullanılmıştır. ChatGPT'nin yanıtları en uzun (p<0,0001) ve en ayrıntılı olanlardı. Doğruluk ve kapsamlılık skorları modeller arasında anlamlı farklılık göstermiş (p=0,0216, p=0,0067) ve ChatGPT, Perplexity'den daha iyi performans sergilemiştir (p=0,0173, p=0,0087). Uzman yanıt ları daha kısa olmakla birlikte okunabilirlik indekslerinde da ha yüksek karmaşıklık göstermiştir. Tekrarlanabilirlik genel pediatrik kontakt lens sorularında yüksek bulunurken, afakik lenslerle ilgili sorularda anlamlı derecede düşük saptanmıştır (p=0,041). Özellikle afa kik kontakt lens konularında bazı olgusal hatal ar tespit edilmiştir. Büyük dil modelleri, hasta eğitimi materyallerini erişilebilir hale getirse de doğruluk ve bütünlükteki değişkenlik uzman gözetiminin önemini vurgulamaktadır. Bu çalışma, uzmanların sohbet robotu yanıtlarını değerlen dirmesini yansıtma kta olup, uzman yanıtlarıyla doğrudan bir karşılaştırma sunmamaktadır. Yapay zekâ sohbet robotları, pediatrik oftalmolojide k linik uzmanlığın yerini almak yerine onu tamamlayıcı bir araç olabilir.