Murat BEYATLI, Tuncel UZEL, Nurullah Mustafa SISIK, Hasan Samet GUNGOR, Abdurrahman INKAYA, Resul SOBAY, Isa DAGLI, Ahmet TAHRA, Eyup Veli KUCUK
Medeniyet Medical Journal - 2026;41(1):51-58
Amaç: YouTube, cerrahi eğitim için giderek daha popüler bir platform haline gelmiştir; ancak tıbbi içeriklerinin kalitesi ve güvenilirliği belirsizliğini korumaktadır. Yapay zekâ (YZ) modellerinin gelişimiyle birlikte, ChatGPT gibi araçlar eğitimsel içeriklerin otomatik değerlendirilmesi için yeni olanaklar sunmaktadır. Yöntemler: Holmiyum lazer ile prostat enükleasyonu, prostatın transüretral rezeksiyonu (TURP), transvezikal prostatektomi ve ThuFLEP cerrahilerini içeren toplam 100 video incelendi. İki üroloji uzmanı ve ChatGPT-5 (iki bağımsız oturumda) her videoyu Global Quality Score (GQS) ve modifiye DISCERN ölçekleriyle değerlendirdi. İzlenme sayısı, beğeni, abone sayısı ve video süresi gibi popülerlik ölçütleri kaydedildi. Veriler non-parametrik testlerle ve Spearman korelasyonu ile analiz edildi. Bulgular: İnsan değerlendiriciler, her iki YZ oturumuna kıyasla anlamlı derecede daha yüksek DISCERN ve GQS puanları verdi (p<0.01). TURP videoları tüm değerlendiriciler arasında en düşük puanları aldı. Video kaynakları arasında kalite açısından anlamlı fark saptanmadı. Her iki YZ oturumu da güçlü iç tutarlılık gösterdi (rho=0.62-0.75) ve insan puanlama eğilimlerini benzer şekilde yansıttı, ancak ortalama değerler daha düşüktü. İzlenme ve beğeni gibi etkileşim ölçütleriyle kalite arasında zayıf veya anlamsız ilişki gözlendi. Sonuçlar: YZ modelleri tutarlı ve ölçeklenebilir kalite değerlendirmeleri sağlayabilir; ancak eğitimsel değeri insan uzmanlara kıyasla hâlâ düşük tahmin etmektedir. YZ ve uzman değerlendirmesinin birlikte kullanıldığı hibrit yaklaşımlar, çevrimiçi cerrahi video değerlendirmelerinde güvenilirliği artırabilir.