Türk Medline
ADR Yönetimi
ADR Yönetimi

MULTİMODAL BÜYÜK DİL MODELLERİNİN BT'DE BONE-RADS KLASİFİKASYONUNDAKİ TANISAL PERFORMANSI

Hasan Emin KAYA, Abdullah Enes ATAŞ

Uludağ Üniversitesi Tıp Fakültesi Dergisi - 2026;52(1):0-0

Bursa Uludağ University, School of Medicine, Department of Radiology, Bursa, Türkiye

 

Çalışmamızın amacı multimodal büyük dil modellerinin (MBDM) BT görüntülerinde tespit edilen soliter kemik lezyonlarına Bone-RADS kategorileri atamadaki performanslarını değerlendirmektir. Hastanemizin PACS'ı soliter kemik lezyonu içeren BT tetkikleri için taranmıştır (Ağustos 2024-Ağustos 2025). Her lezyon için bir kas-iskelet radyoloğu tarafından kitleyi en iyi temsil eden bir kesit seçilmiş ve lezyonlara birer referans Bone-RADS skoru atanmıştır. Daha sonra bir abdominal radyolog, ChatGPT 5 ve Gemini 2.5 Pro aynı vakaları kategorilemiştir. Doğruluk, doğru şekilde kategorize edilen Bone-RADS 1 ve 4 vakaları olarak tanımlanmış ve McNemar testi kullanılarak karşılaştırılmıştır. Referansla uyum, ağırlıklı Cohen kappa katsayısı kullanılarak değerlendirilmiş ve bootstrap yöntemi ile karşılaştırılmıştır. Referans kategorileri şu şekilde belirlenmiştir: Bone-RADS 1, n=23; 2, n=4; 3, n=0; 4, n=23. Doğruluk, radyolog için %84,8 (39/46), Gemini için %78,3 (36/46) ve ChatGPT için %65,2 (30/46) olarak bulunmuştur. Radyoloğun, ChatGPT'den daha iyi performans gösterdiği (p=0,012); radyolog ile Gemini (p=0,604) ve Gemini ile ChatGPT (p=0,360) arasındaki farkların anlamlı olmadığı görülmüştür. Radyolog, referans standardı ile en yüksek uyumu elde etmiş (kappa = 0,715, %95 GA: [0,543-0,887]), bunu Gemini (kappa = 0,542, %95 GA: [0,313-0,770]) ve ChatGPT (kappa = 0,292, %95 GA: [0,104-0,479]) izlemiştir. Bootstrap ile yapılan karşılaştırmalar, radyoloğun kappa değerinin ChatGPT'den daha yüksek olduğunu göstermiş (%95 GA: 0,140-0,675), ancak radyolog ile Gemini (%95 GA: -0,113-0,434) ve Gemini ile ChatGPT (%95 GA: -0,041-0,522) arasındaki fark anlamlı bulunmamıştır. Sonuç olarak genel amaçlı MBDM'ler henüz Bone-RADS kategorizasyonu için eğitimli radyologların yerini tutabilecek durumda görünmemekle beraber bu modellerin günlük pratikte radyologlara yardımcı olabileceği düşünülmektedir.