Esra Emekli, Rabia Soylu, Emre Emekli, Yavuz Selim Kıyak, Yasemin Hoşgören Alıcı, Özlem Coşkun, Işıl İrem Budakoğlu
Tıp Eğitimi Dünyası - 2025;24(74):209-216
Amaç: Tıp eğitiminde çoktan seçmeli sorular (ÇSS), objektiflikleri ve geniş bilgi kapsamı nedeniyle yaygın olarak kullanılmaktadır. Özellikle olgu temelli ÇSS'ler, öğrencilerin klinik muhakeme ve karar verme becerilerini ölçmede önemli avantajlar sağlamaktadır. Psikiyatri eğitimi, subjektif semptom tarifleri ve tanılar arası semptom örtüşmeleri nedeniyle özgün zorluklar içerir. Bu çalışmanın amacı, şablon tabanlı otomatik soru üretimi (OSÜ) ile üretilen psikiyatri alanındaki ÇSS'lerin psikometrik özelliklerinin (güçlük ve ayırt edicilik indeksleri) değerlendirilmesidir. Gereç ve Yöntem: Çalışma Gazi Üniversitesi Etik Kurulu onayıyla yürütülmüş, 2023-2024 ve 2024-2025 akademik yıllarında psikiyatri stajını tamamlayan 224 öğrenciden 138'i (%61,6) gönüllü olarak katılmıştır. Daha önce şablon tabanlı OSÜ yöntemiyle üretilen 1189 soru arasından rastgele seçilen 22 soruluk bir sınav oluşturulmuştur. Sınav sınıf ortamında gözetmen eşliğinde uygulanmış, öğrencilere soruların kaynağı açıklanmamıştır. Soruların güçlük indeksleri doğru cevaplanma oranı ile, ayırt edicilik indeksleri ise üst %27 ve alt %27'lik öğrenci gruplarının performansları karşılaştırılarak hesaplanmıştır. Ayrıca, alt ve üst gruplar arasında fark olup olmadığı Mann-Whitney U testi ile incelenmiş, her bir madde için düzeltilmiş madde-toplam korelasyonu değerleri hesaplanmış ve sınavın genel güvenirliği Cronbach alfa katsayısı (KR-20 eşdeğeri) ile değerlendirilmiştir. Bulgular: Sınavın genel ortalama puanı 22 üzerinden 15,21 +/- 3,55 bulunmuştur. Soruların ortalama güçlük indeksi 0,69 olup sınav genel olarak "kolay" kategorisinde değerlendirilmiştir. Soruların %63,6'sı çok kolay, %9,1'i kolay, %27,3'ü orta zorluktaydı. En zor soru somatizasyon (0,33), en kolay soru ise bipolar bozukluk (0,92) ile ilişkiliydi. Ayırt edicilik indeksleri 0,19-0,70 arasında değişmekte olup ortalama değer 0,37 idi. On soru (%45,6) çok iyi ayırt edicilik gösterirken, 11 soru (%50) kabul edilebilir, bir soru (%4,5) ise zayıf kategorisindeydi. En yüksek ayırt edicilik şizofreniform bozukluk (0,70), en düşük ise postpartum psikoz (0,19) sorusunda bulundu. Mann-Whitney U testleri tüm maddelerde üst ve alt gruplar arasında anlamlı fark olduğunu göstermiştir (p<0.05). Düzeltilmiş madde-toplam korelasyon değerleri 0,08-0,49 arasında değişmiş, ortalama 0,30 ve ortanca 0,34 bulunmuştur. On bir madde (%50) güçlü, sekiz madde (%36,4) kabul edilebilir, üç madde (%13,6) ise zayıf düzeydedir. Sınavın genel güvenirliği Cronbach alfa = 0,74 olarak hesaplanmıştır.