Türk Medline
ADR Yönetimi
ADR Yönetimi

LOMBER DİSK HERNİSİ OLAN HASTALARDA CHATGPT 4.0 VE GEMİNİ ADVANCED'İN BİLGİ KALİTESİ, GÜVENİRLİĞİ VE ANLAŞILABİLİRLİĞİNİN KARŞILAŞTIRMALI DEĞERLENDİRİLMESİ

Yağmur Çağla REİS ALTAN, Barış NACİR

Fiziksel Tıp ve Rehabilitasyon Bilimleri Dergisi - 2026;29(1):66-73

Ankara Çubuk Halil Şıvgın State Hospital, Clinic of Physical Medicine and Rehabilitation, Ankara, Türkiye

 

Amaç: Çalışmanın amacı, lomber disk hernisi (LDH) ile ilgili en çok aranan 26 soruya kamuya açık olarak erişilebilen 2 büyük dil modeli tabanlı sohbet robotu olan ChatGPT 4.0 ve Gemini Advanced tarafından verilen yanıtların geçerliliğini, güvenilirliğini ve anlaşılabilirliğinin değerlendirilmesidir. Gereç ve Yöntemler: LDH ile ilgili en sık aranan 26 soru, Google Trends verilerinden elde edildi. Bu sorular, ChatGPT 4.0 ve Gemini Advanced dil modellerine yöneltildi. ChatGPT 4.0 ve Gemini Advanced tarafından üretilen yanıtların bilgi kalitesi ve güvenilirliği, "Quality Criteria for Consumer Health Information (DISCERN)" ve Global Quality Scale (GQS) ölçüm araçları kullanılarak değerlendirildi. Ayrıca tüm metinlerin okunabilirliği, Flesch-Kincaid Okuma Düzeyi [Flesch-Kincaid Grade Level (FKGL)] ve Flesch-Kincaid Okuma Kolaylığı [Flesch-Kincaid Reading Ease (FKRE)] formülleri ile analiz edildi. Bulgular: ChatGPT 4.0 ve Gemini Advanced tarafından LDH hakkında üretilen yanıtlar DISCERN analizi ve GQS yoluyla değerlendirildiğinde, 2 grup arasında anlamlı bir fark bulunmadı. FKGL, Gemini Advanced grubunda ChatGPT 4.0 grubuna kıyasla anlamlı şekilde daha yüksek bulundu. Ancak, FKRE puanları 2 grup arasında istatistiksel olarak anlamlı bir fark göstermedi. Her iki dil modeli tarafından üretilen verilerin bilgi kalitesi, güvenilirlik ve anlaşılabilirlik açısından zayıf olduğu görüldü. Sonuç: Yapay zekâ destekli dil modelleri, geçerli ve güvenilir bilgi sağlama konusunda hâlâ yeterli değildir. Tıbbi bilgi edinme amacıyla yapay zekâ modellerine aşırı güvenmek, istenmeyen sonuçlara yol açabilir. Büyük dil modelleri, sağlık profesyonelleri tarafından yapılan kapsamlı tıbbi değerlendirme ve açıklamaların tamamen yerini almayabilir.