Türk Medline
ADR Yönetimi
ADR Yönetimi

HALÜSİNASYONDAN HASSASİYETE: YAPAY ZEKA TARAFINDAN OLUŞTURULAN TIBBİ LİTERATÜRDE REFERANS DOĞRULUĞU VE İNTİHAL ÜZERİNE BOYLAMSAL BİR DEĞERLENDİRME (2024 -2026)

Mevlüt Okan AYDIN, Alper VATANSEVER, Sezer Erer KAFA

Uludağ Üniversitesi Tıp Fakültesi Dergisi - 2026;52(1):0-0

Department of Medical Education, Faculty of Medicine, Bursa Uludağ University, Bursa, Türkiye

 

Bu çalışma, genel amaçlı ve uzmanlaşmış yapay zeka araçlarının akademik yazım ve atıf doğruluğu konusundaki güvenilirliğinin zamana bağlı gelişimini değerlendirmeyi amaçlamaktadır. Kasım 2024 ve Ocak 2026 tarihlerinde sekiz farklı platform (ChatGPT, Gemini, QuillBot, Claude, Microsoft Copilot, Elicit, Consensus ve SciSpace), tıp odaklı beş standart istem kullanılarak analiz edilmiştir. Üretilen giriş bölümleri, PubMed, Google Scholar ve Web of Science üzerinden referans doğruluğu ve iThenticate aracılığıyla intihal oranları açısından incelenmiştir. Bulgular, Kasım 2024'te ChatGPT ve Claude gibi genel amaçlı modellerin bazı istemlerde sıfır doğru referans vererek yüksek halüsinasyon oranları sergilediğini, Elicit ve SciSpace gibi akademik odaklı araçların ise başlangıçtan itibaren tam doğruluk sağladığını göstermiştir. Ocak 2026 itibarıyla, ChatGPT'nin tüm istemlerde tam doğruluğa ulaşmasıyla genel amaçlı araçlarda büyük bir iyileşme gözlemlenmiştir. İntihal oranları genellikle %15'in altında kalsa da, Gemini 2024 yılında bir istemde %45 ile en yüksek seviyeye ulaşmıştır. SciSpace gibi akademik araçlar, 2026'da tek bir metinde 31 doğrulanmış referans sunarak yüksek hacimli atıf yönetiminde üstünlük göstermiştir. Hem genel hem de uzmanlaşmış yapay zeka araçları önemli ölçüde olgunlaşmış olsa da, araştırmacıların doğrulama protokollerini kullanmaya devam etmeleri önerilmektedir. Sonuç olarak, yapay zeka araçları akademik halüsinasyonlara eğilimli bir yapıdan, bilimsel literatür sentezi için oldukça güvenilir enstrümanlara hızla dönüşmüştür.