FAKULTAS PSIKOLOGI
RINGKASAN 05
ITEM ANALYSIS
Item Analisis adalah proses yang dilakukan pembuat tes untuk mendapatkan alat tes yang efektif dan
menghasilkan skor dengan tingkat realibilitas dan validitas yang diperlukan untuk mengukur konsturk yang
diukur. Biasanya dilakukan dengan menguji item pool yaitu, memilih bagian-bagian dari item yang telah
dibuat untuk mendapatkan kumpulan dari item yang memenuhi validitas dan reliabilitas. Didefinisikan juga
sebagai komputasi dan eksamininasi dari property statistic apapun yang terdapat pada respon orang yang di
tes terhadap setiap item tes. Parameter item ada 3 kategori umum:
Jadi tujan item analisis adalah untuk meningkatkan reliabilitas dan validitas alat ukur yang kita buat.
KUANTITATIF:
1. Item difficulty (i): Saat item dichotomous (2 hal yang berlawana) dinilai, mean dari skor item sesuai
dengan proporsi dari peserta tes yang menjawab item dengan benar. Digunakan untuk menciptakan tes
dengan jumlah pertanyaan yang efektif (minimum) yang dapat mengukur level dari testee dengan baik. Hal
ini dapat kita lihat melalui Jarak parameter item difficulty (pi ) yang ada dari 0.01-1.00. Jarak parameter item
difficulty ini mempengaruhi total skor parameter karena:
Tingkat kesulitan dari rata-rata item pada tes, dapat dihitung dengan:
Saat mendeskripsikan performa kelompok peserta pada beberapa tes dari Panjang tes yang berbeda, item
difficulty mungkin lebih diinginkan dalam bentuk rawa score mean (bervariasi seperti fungsi dari skor
Panjang tesnya)
σ i2=p i . q i
Dengan konsumsi konstan degree dari semua item ,varian total skor tes akan dimaksimalkan saat pi -0.50.
Kebanyakan dari publish attitude dan achievement test dirancang untuk penilaian tes sesuai normative yang
biasanya jatuh pada range 0.6-8.0.
Contoh Alasan:
55:3=
Jika soalnya seperti diatas ada sangat kecil kemungkinan untuk peserta tes yang tidak tau jawabannya untuk
menjawab dengan benar. Maka observed p-value untuk item ini dan variannya berfungsi hanya pada
pengetahuan penjawab tes (nilai asli mereka pada item ini).
Jika soalnya
55:3=
18.3
16.2
17.8
15.3
Maka p-value akan dipengaruhi oleh nilai asli pada item dan penebakan jawaban oleh peserta.
Jadi:
1
po =Proporsi yang mengetahui jawaban+ ( proporsi yang tidak mengetahui jawaban)
m
Number of choices Proportion who Proportion who po Lor d ' s Po
know the answer guest answer
2. Item Discrimination adalah proses yang dilakukan pembuat tes untuk memberikan informasi tentang
perbedaan individu (individual differences), baik dengan konstruk yang diukur melalui tes atau dengan
mengukur beberapa kriteria-kriteria eksternal yang seharusnya diprediksi oleh skor hasil tes tersebut.
Untuk mengetahui bagaimana setiap item yang kita buat mendeskripsikan/memberitahu perbedaan antara
high performers dan low performers dalam tes. Dengan proses ini kita dapat membedakan antara peserta
yang mengerti materi dan yang tidak. Caranya adalah dengan mendapatkan total skor setiap peserta tes dan
mengurutkannya dari tinggi ke rendah. Lalu ambil top 27% (high performers) dan bottom 27% (low
performers). Kumulasikan item difficulty pada setiap groupnya (low performers dan high performers).
Setelah itu mengurangi item difficulty high performer dan low performer dan hasilnya adalah indeks of
discrimination.
D= p u− p1
ρ Xi σ x −σ i
ρi (X −1)= 2 2
√ σ +σ −2 ρ
i x X1 σ x σi
ρi (X −1)= korelasi antara skor item dan skor total dengan item yang dihapus
σ x dan σ i = standar deviasi item masing-masing
Secara matematika, hubungan antara biserial dan point biserial correlation adalah:
pq
p pbis = √ p pbis
Y
Karena nilai kordinat Y pada kurva normal selalu kurang dari √ pq , nilai biserial correlation akan
selalu setidaknya seperlima lebih besar dari point biserial correlation untuk variabel yang sama.
Perbedaan pecahan dalam besaran ini tetap cukup layak untuk item dengan tingkat kesulitan
sedang; namun karena p-value turun di bawah 0,25 atau meningkat di atas 0,75, perbedaan antara
biserial dan point biserial correlation meningkat tajam. Secara grafis bahwa pada rentang kesulitan
ekstrim, biserial correlation mungkin empat kali lebih besar dari point biserial correlation antara
skor item dan skor total.
c. Phi Coefficient
Ketika skor dari skor item yang dichotomous akan dikorelasikan dengan skor dari dichotomous
criterion (contoh: sukses atau kegagalan dari program rehabilitiasi, atau demografi karakteristik
seperti gender), phi coefficient bisa digunakan. Selain itu juga bisa digunakan untuk menentukan
derajat kestabilan dalam menanggapi item dichotomous yang sama oleh peserta tes yang sama di
keadaan yang berbeda. Penggunaan phi paling sesuai ketika variabel yang terlibat benar-benar
dichotomous. Ketika kelompok criterion dibentuk dengan memberlakukan titik potong buatan
(artificial cutoff) pada distribusi berkelanjutan, statistik ini tidak mengizinkan penggunaan penuh
informasi yang tersedia. Dengan kata lain, jika semua peserta tes yang skornya jatuh diatas nilai
cutoff maka diklasifikasikan dengan 1 untuk lulus dan 0 untuk gagal, informasi kuantitatif tentang
perbedaan antara skor kelompok lulus dan gagal akan hilang. Kemungkinan lain dari pembatasan
phi adalah nilainya hanya bisa mencapai 1.00 ketika p-value untuk dua variabel sama (karena phi
coefficient, seperti point biserial, diturunkan secara langsung dari Pearson product moment
correlation).
d. Tetrachoric Correlation Coefficient
Saat-saat ketika pembuat tes tertarik dengan seberapa kuat dua variabel dichotomous berkorelasi
ketika setiap variabel dibuat melalui dychotomizing distribusi normal yang mendasari. Dalam kasus
seperti itu Tetrachoric Correlation Coefficient sesuai. Penghitungan statistik ini rumit dan jarang
dilakukan kecuali test developer sangat percaya bahwa indeks korelasi yang lain, seperti phi, cukup
untuk memenuhi tujuan.
4. Jika pembuat tes cukup percaya bahwa samplel di masa depan akan mirip kemampuannya
dengan sampe item analisis saat ini dan tujuan untuk memilih item yang akan memiliki high
internal consistency, maka direkomendasikan point biserial correlation.
5. Pada kasus item dan variable kriteria sama-sama di skor secara dichotomous, phi atau
tetrachoric coefficient sebaiknya digunakan. Phi mudah untuk dihitung tetap akan terbatas
ketika proporsi di kedua dikotomi tidak sama.
QUALITATIVE
Item analisis kualitatif adalah istilah umum untuk prosedur non statistic yang dirancang pembuat tes untuk
melihat bagaimana tes yang kita rancang saat diujikan dan banyak bergantung pada respon verbal. Jadi pada
kulitatif pembuat tes lebih fokus untuk berdiskusi pengalaman pengerjaan tes secara individu dan
kelompok.
Dalam kualitatif terdapat cara melakukan item analysis karen atidak menggunakan perhitungan maka kita
dapat menggunakan table untuk menganalisis setiap item yang dibuat.
1. Menebak (Guessing)
Adanya kemungkinan partisipan tes menebak-nebak jawaban pertanyaan, namun hal ini bisa saja
terjadi lewat pengetahuan subjektif peserta. Guessing memungkinkan partisipan mendapatkan nilai
yang bagus dan terkadang dapat kehilangan point. Untuk menghindari guessing, pembuat tes
memberikan instruksi khusus pada panduannya seperti memberikan informasi spesifik mengenai
penilaian.
2. Item fairness
Masalah saat pembuat tes memberikan tes kepada kelompok yang tidak sesuai (bias pada item).
Untuk mengetahui bias nya item, dapat menggunakan kurva karakter item (item-characteristic
curve). Hal ini dapat diatasi dengan menambah jumlah partisipan agar hasilnya lebih sesuai,
karakteristik partisipan juga dapat mempengaruhi fairness dalam suatu tes.
3. Speed test (Kecepatan)
Terdapat pada tes yang waktunya dibatasi karen partisipan menjadi cenderung tergesa gesa dalam
menjawab dan akhirnya tes menjadi berkorelasi positif.
Merupakan metode analisis dengan menggunakan beberapa prosedur misalnya problem solving,
klinis, dan lain-lain. Bila dalam analisis tes hanya melibatkan tester dan peserta. Tester dapat memberikan
instruksi dan memperhatikan partisipan sepenuhnya. Bila menggunakan tes pencapaian maka penggunaan
administrasi tes ini dapat embantu bagi partisipan yang salah atau tidak mengerti tes dengan memintanya
untuk merefleksikan lagi.
2. Expert Panels:
Merupakan cara untuk mengetahui permasalahan pada tes melalui interview bersama partisipan dalam
penelitian kualitatif. Melalui interview ini peneliti membahas mengenai sensitivitas item-item yang
diberikan sehingga peneliti dapat mendapatkan item yang sesuai dengan standar dan fair. Review ini juga
penting karena sensitivitas item merupakan standar dalam penelitian.
Familiarities: Partisipan berpikira bahwa item yang diberikan cukup mirip dan pernah
dikerjakan sebelumnya
Offensive choice: Beberapa item mungkin saja memiliki arti yang dapat merendahkan
partisipan, hal ini dapat dikurangi dengan memperhatikan karakteristik partisipan terlebih
dahulu dan menyesuaikannya terutama pada cara pemberian kata-katanya.
Other: Permintaan pada partisipan untuk mengerjakannya secara spesifik mengenai bias
lainnya
DAFTAR PUSTAKA