İçerik Geçerliliği
İçerik Geçerliliği
İçerik geçerliliği, test içeriğinin ilgilenilen özelliğin veya özelliğin tüm yönlerini ne ölçüde kapsadığının tanımlayıcı bir göstergesidir (istatistik olarak verilmez).
Tahmin geçerliliği genellikle -1 ile 0 ile +1 arasında değişen olası değerlere sahip Pearson Korelasyon Katsayısı ‘r’ gibi bir korelasyon katsayısı ile ölçülür. Daha yüksek korelasyon katsayıları daha iyi geçerliliği gösterir.
Bir testin öngörücü geçerliliği, test puanının ilgilenilen sonraki bazı kriter değişkenlerini ne ölçüde öngördüğüdür. Örneğin, A-seviyesi sınavlarının tahmin geçerliliği, adayların elde ettiği A-seviyesi puanlarının aynı adayın sonraki derece performansını ne ölçüde öngördüğüdür.
Bu örnekte, A düzeyi puanı yordayıcı değişkendir ve derece performansı ölçüt değişkenidir. Olduğu gibi, ortalama olarak, A seviyelerinin öngörücü geçerliliği zayıftır, r yaklaşık 0,3’tür.
Bazı yazarlar, örneğin, 0,3’ten büyük herhangi bir korelasyonun, bir testin tahmin geçerliliği için kabul edilebilir bir katsayı olduğunu iddia etmektedir. Bu oldukça düşük görünmektedir ve kriter değişkenindeki değişimin yalnızca yaklaşık yüzde 10’u, bu kadar düşük bir geçerlilik katsayısına sahip bir yordayıcı test tarafından açıklanabilir.
Minimum kabul edilebilir katsayının 0,4’e yakın olması önerilir. Dikkate alınması gereken bariz bir soru, ölçütteki varyasyonun yalnızca küçük bir kısmını açıklayan bir testin öngörücü bir test olarak herhangi bir kullanımı olup olmadığıdır. Yine bu yargının araştırmacı tarafından yapılması gerekmektedir.
Eşzamanlı geçerlilik, yordayıcı geçerliliğe benzer, ancak hem yordayıcı hem de ölçüt testleri aynı anda alınır. Bir ders sonu matematik başarı testi bir öğretmen tarafından oluşturulur ve bir grup öğrenciye verilirse ve aynı zamanda standart bir sayısal yetenek testi uygulanırsa, iki test puanı arasındaki korelasyonlar eşzamanlı geçerliliğin bir ölçüsünü sağlayacaktır. matematik başarı testi. Kabul edilebilir eş zamanlı geçerlilik için en az 0,5’lik korelasyonların gerekli olduğu ileri sürülmektedir.
Yapı geçerliliği, hem içerik hem de eşzamanlı veya tahmin geçerliliğini bünyesinde barındırır. Bir testin güvenilirliğine ilişkin mevcut tüm kanıtları temsil eder. Kesin olarak, geçerlilik ve güvenilirlik, testin kendisinin bir özelliğinden ziyade bir testten elde edilen çıkarımları ifade eder. Geçerlilik katsayıları verildiğinde, geçerlilik katsayılarının dayandığı örneklem büyüklükleri kontrol edilmelidir. Yeterli geçerlilik için en az 100 örneklem büyüklüğü gereklidir.
Bir test seçerken göz önünde bulundurulması gereken bir diğer önemli husus, test güvenilirliği veya bir testin tutarlılığıdır. Yetenek, kişilik, zeka veya başarı ölçütleri gibi eğitsel veya psikolojik test puanları alındığında, bunlara gözlemlenen puanlar denir.
Bu gözlemlenen puanların iki kısımdan oluştuğu düşünülebilir; ilgilenilen özelliğin miktarını yansıtan gerçek bir puan bileşeni ve ölçüm hatası, transkripsiyon hatası gibi çeşitli hata kaynaklarını yansıtan bir sıkıntı veya hata bileşeni. gerçek puan bileşeni değil.
- Gözlemlenen puan = gerçek puan + hata puanı olarak ifade edilebilir.
Gözlemlenen bir ölçümün güvenilirliği, gerçek puan ve hata puanı bileşenlerinin göreli oranlarına bağlıdır. Hata kısmı gerçek puana göre büyük olduğunda, güvenilirlik düşüktür.
Kriter geçerliliği nedir
Yapı geçerliliği
Yordama geçerliliği Nedir
Yapı Geçerliliği örnek
GEÇERLİLİK Türleri
Görünüş geçerliliği Nedir
Yapı Geçerliliği Nedir
Ölçüt geçerliliği Nedir
Test güvenilirliğini artırmak için tüm hata kaynakları azaltılmalıdır. Geçerlilikte olduğu gibi, ölçüm güvenilirliği, genellikle korelasyon katsayısı ‘r’ olarak sunulan bir güvenilirlik katsayısı ile verilir. -1 ile +1 arasında değişebilen bir Pearson korelasyon katsayısının aksine, güvenilirlik katsayısı sıfırdan (tamamen güvenilirliğin yokluğu) +1’e (mükemmel güvenilirlik) kadar değişir.
Sorulması gereken ancak yanıtlaması kolay olmayan bir soru, maksimum r=+1 ise iyi bir güvenilirlik katsayısının ne kadar büyük olduğudur. Tutumları ve kişilik özelliklerini ölçmek için tasarlanmış araçlar (duygusal tip testler), başarı veya bilişsel yetenek ölçümlerinden (bilişsel tip testler) daha düşük katsayılara sahip olma eğilimindedir.
Duyuşsal tip testler için r=0.7 kadar düşük katsayılar kabul edilebilirken, dikkatlice oluşturulmuş ve standardize edilmiş bilişsel testlerin katsayılarının r=0.9’un üzerinde olması beklenir.
Her biri farklı durumlar için uygun olan, iç tutarlılık, kararlılık ve denklik olmak üzere üç genel test güvenilirlik ölçüsü türü vardır.
Bir Testin Ölçümünün Standart Hatası
Örnekleme hatası veya örnekleme değişkenliği fikri tanıtıldı. Şimdi bu fikri herhangi bir ölçüm setinin standart hatasına bakacak şekilde genişletmeyi düşünüyoruz. Basitçe ifade edilirse, bir ölçüler kümesinin değişkenliği, onun standart ölçüm hatası (sem) olarak adlandırılır ve ölçülerin ne kadar geniş ölçüde değiştiğinin bir indeksini temsil eder.
Değişkenlik ne kadar büyük olursa, sem o kadar büyük olur ve ölçüm o kadar az doğru olur. Standart hata fikri, bu kitap boyunca pek çok durumda karşımıza çıkacak olan çok önemli bir istatistiksel kavramdır. Bu standart hata kavramı, ölçek ölçümleri ve test puanlarının yanı sıra örnek istatistikler için de geçerlidir.
Örneğin, bir örneklem ortalamasının standart bir hatası vardır, bu ortalamanın standart hatasıdır. Bu fikir, bir örneklem ortalamasının örnekleme hatası (değişkenliği) olarak adlandırıldığı yerde sunuldu.
Gözden geçirmek için, 1000’in üzerinde büyük bir okul çocuğu popülasyonu olduğunu ve 20 çocuktan oluşan rastgele bir örnek alındığını varsayalım, bu 20 çocuk örneğinin ortalama veya ortalama okuma puanını hesaplamak mümkün olacaktır. Bu rakamı ortalama 1 olarak adlandırın. 100 örnek ortalaması olana kadar her örneğin ortalamasını hesaplayarak 20 çocuktan rastgele örnekler almaya devam edebiliriz.
Şimdi, ortalama(1)…ortalama(100) olacaktır ve bu 100 örnek ortalamanın ortalaması, popülasyon ortalama okuma başarısının makul bir tahmini olacaktır. Numune araçlarının her biri, elbette, gerçek popülasyon ortalaması etrafında bir dereceye kadar farklılık gösterecektir ve numune araçlarının veya numune ortalamalarının bu değişkenliği, ortalamanın standart hatasıdır. Bu, popülasyon ortalamasını tahmin etmek için herhangi bir örneklem ortalaması kullanılırsa, kişinin yapması muhtemel hatanın boyutunun bir göstergesini verir.
Ortalamanın standart hatasında olduğu gibi, bir ölçüm ölçeğinin veya testin de bir standart hatası vardır ve basitçe testin veya ölçek puanının standart hatası olarak adlandırılır. Bu genellikle test kılavuzlarında rapor edilir. Bir test puanının doğruluğunu temsil eder: bir ölçek için standart ölçüm hatası ne kadar büyükse, ilgilenilen yapıyı ölçmede ölçeğin doğruluğu o kadar az olur.
Bu ölçüm, araştırmacıların ve diğer test kullanıcılarının test ve ölçek puanlarındaki küçük farklılıklara gereğinden fazla önem vermemesi için sağlanmıştır. Çoğu zaman, doğru bir şekilde ‘güven aralığı’ olarak adlandırılan belirli bir güven derecesi olduğunu belirlemek istenir.
GEÇERLİLİK Türleri Görünüş geçerliliği Nedir Kriter geçerliliği nedir Ölçüt geçerliliği Nedir Yapı geçerliliği Yapı geçerliliği nedir Yapı Geçerliliği örnek Yordama geçerliliği nedir
Son yorumlar