Ölçeklerde saptanan madde işlev farklılığının karma rasch modelleri ile incelenmesi

Tezin Türü: Doktora

Tezin Yürütüldüğü Kurum: Ankara Üniversitesi, Sağlık Bilimleri Enstitüsü, Türkiye

Tezin Onay Tarihi: 2012

Tezin Dili: Türkçe

Öğrenci: SELCEN YÜKSEL

Danışman: ATİLLA HALİL ELHAN

Özet:

Bu çalışmanın amacı, madde işlev farklılığı (MİF) gösteren maddeler içeren veri setlerinde Karma Rasch modelinin (KRM) MİF'e neden olan grubu belirlemedeki ve kişi parametre kestirimleri üzerindeki başarısını değerlendirmektir. Literatürde küçük örneklem büyüklüğüne sahip ve çok sonuçlu maddeler içeren veri setlerinde KRM'nin performansını değerlendiren çalışma yoktur. Bu çalışmanın sonuçları küçük örneklem büyüklüğü ve çok sonuçlu maddeler için genellenmiştir. Çalışmanın amacına yönelik, altın standart olarak MİF gösteren maddeler ve kişi parametreleri tanımlanmıştır. Yapılan benzetim çalışmasında altın standart değerler kullanılarak, farklı yüzde ve büyüklüklerde MİF gösteren maddeler içeren veri setleri türetilmiştir. Türetilen bu veri setleri sayesinde maddelere verilen yanıtlar açsından bireyler arasında farklılık yaratıldığı için, veri setlerinin heterojen olduğu söylenebilir. Türetilen veri setlerinde kısmi kredi modelinin (KKM) doğru saptadığı MİF gösteren madde yüzdeleri değerlendirilmiş, KRM ile gizli sınıf sayıları saptanmıştır. Ayrıca her iki modelden elde edilen kişi parametre kestirimleri altın standart değerler ile karşılaştırılmıştır. KKM ile MİF'i doğru saptama oranı sadece MİF gösteren madde yüzdesinin %10 ve MİF büyüklüğünün 1 olduğu durumda yüksek elde edilmiştir. KRM ile tüm veri setlerinde tek sınıflı yapı saptanmıştır. Dolayısıyla iki modelin de var olan MİF'i belirlemede tam olarak başarılı olamadıkları söylenebilir. Tüm benzetim koşulları için KRM'den elde edilen kişi parametre değerlerinin altın standart parametre değerlerine oldukça yakın olduğu görülmüştür. Veri setinin heterojenliği arttığında, KKM'den elde edilen kişi parametre değerlerinin altın standart parametre değerlerinden saptığı gözlenmiştir. Parametre kestirimleri bakımından KRM ile elde edilen yanlılık ve hata kareleri ortalaması değerlerinin KKM'ye göre daha düşük olduğu saptanmıştır. İki modelden elde edilen kişi parametrelerinin standart hataları benzerdir. Sonuç olarak, heterojen veri setlerinde KRM ile elde edilen kişi parametre kestirimlerinin altın standart değerlere oldukça yakın olduğu ve KKM'ye göre daha iyi kestirimler elde edildiği söylenebilir. Literatürde iki sonuçlu maddeler içeren ve küçük örnekleme sahip veri setlerinde KRM'nin etkin sonuç vermediği ifade edilmiştir. Bu çalışma ile çok sonuçlu maddeler içeren ve küçük örnekleme sahip veri setlerinde KRM'nin MİF'e neden olan etkeni tanımlamada başarılı olamadığı kanıtlanmıştır.AbstractThe aim of this study was to investigate the effectiveness of Mixed Rasch Model (MRM) on detecting the group that cause differential item functioning (DIF) and on person estimates while the data set known to be contain DIF. There is no study at the literature about how the MRM performs while the sample is small and items are polytomous. In this study, the results were generalized for small sample size and polytomous items. For this aim, gold standard items that include DIF and gold standard person parameters were defined. Using these gold standard values, the simulation study was performed. In this simulation study, items indicate different DIF percents and magnitudes. So that simulated data sets were heterogeneous with respect to person. True detection rates on gold standard DIF items were evaluated by Partial Credit Model (PCM). Number of latent classes were evaluated by MRM. Also person parameters got from both PCM and MRM were compared with gold standard values. True detection rate is high only for DIF percent is %10 and DIF magnitude is 1 or 2. For all simulated data set, one latent class was found by MRM. So one can conclude that both models were not successful on detected DIF. Person parameters were the same with gold standard parameters for MRM. While the data set became heterogeneous, PCM parameter estimates deviated from gold standard values. Also bias and mean square error for MRM was lower than PCM. Standard errors of person parameters were same for MRM and PCM. As a result, for heterogeneous data sets the MRM person estimates were similar with the gold standard person parameters and better estimates were obtained comparing with PCM. In the literature it is stated that MRM performs bad while the sample is small and items are dichotomous. In this study, it is verified that MRM performs bad to detect the group that cause DIF for data sets include small sample size and polytomous items.