Anda di halaman 1dari 7

PROGRAM STUDI S1

FAKULTAS PSIKOLOGI

Campus ID 201807000260 Jenis Tugas RINGKASAN


Student ID 02018003247 INDIVIDUAL
Nama Lengkap MARIA IVANA AGUSTINE MANALU Batas Pengumpulan : 21/10/2019 23:59 WIB

RINGKASAN 05
ITEM ANALYSIS

Item Analisis adalah proses yang dilakukan pembuat tes untuk mendapatkan alat tes yang efektif dan
menghasilkan skor dengan tingkat realibilitas dan validitas yang diperlukan untuk mengukur konsturk yang
diukur. Biasanya dilakukan dengan menguji item pool yaitu, memilih bagian-bagian dari item yang telah
dibuat untuk mendapatkan kumpulan dari item yang memenuhi validitas dan reliabilitas. Didefinisikan juga
sebagai komputasi dan eksamininasi dari property statistic apapun yang terdapat pada respon orang yang di
tes terhadap setiap item tes. Parameter item ada 3 kategori umum:

1. Indeks yang mendeskripsikikan distribusi item distribusi item


2. Indeks yang mendeskripsikan tingkta keterhubungan apa yang kita mau ukur dan apa yang
sebenarnya diukur dalam tes
3. Indeks yang berfungsi sebagai varian item dan hubungannya ke kriteria yang kita buat

Jadi tujan item analisis adalah untuk meningkatkan reliabilitas dan validitas alat ukur yang kita buat.

Teknik-teknik pada item analisis:

KUANTITATIF:
1. Item difficulty (i): Saat item dichotomous (2 hal yang berlawana) dinilai, mean dari skor item sesuai
dengan proporsi dari peserta tes yang menjawab item dengan benar. Digunakan untuk menciptakan tes
dengan jumlah pertanyaan yang efektif (minimum) yang dapat mengukur level dari testee dengan baik. Hal
ini dapat kita lihat melalui Jarak parameter item difficulty (pi ) yang ada dari 0.01-1.00. Jarak parameter item
difficulty ini mempengaruhi total skor parameter karena:

Tingkat kesulitan dari rata-rata item pada tes, dapat dihitung dengan:

Saat mendeskripsikan performa kelompok peserta pada beberapa tes dari Panjang tes yang berbeda, item
difficulty mungkin lebih diinginkan dalam bentuk rawa score mean (bervariasi seperti fungsi dari skor
Panjang tesnya)

σ i2=p i . q i
Dengan konsumsi konstan degree dari semua item ,varian total skor tes akan dimaksimalkan saat pi -0.50.
Kebanyakan dari publish attitude dan achievement test dirancang untuk penilaian tes sesuai normative yang
biasanya jatuh pada range 0.6-8.0.

PDU 303 210 SEKSI C 1 dari 7


PROGRAM STUDI S1
FAKULTAS PSIKOLOGI

Contoh Alasan: 

55:3=

Jika soalnya seperti diatas ada sangat kecil kemungkinan untuk peserta tes yang tidak tau jawabannya untuk
menjawab dengan benar. Maka observed p-value untuk item ini dan variannya berfungsi hanya pada
pengetahuan penjawab tes (nilai asli mereka pada item ini). 

Jika soalnya 

55:3=

 18.3
 16.2
 17.8
 15.3

Maka p-value akan dipengaruhi oleh nilai asli pada item dan penebakan jawaban oleh peserta.

Jadi:

1
po =Proporsi yang mengetahui jawaban+ ( proporsi yang tidak mengetahui jawaban)
m
Number of choices Proportion who Proportion who po Lor d ' s Po
know the answer guest answer

2 0.50 0.50/2 0.50+ (0.50/2) =


0.75

3 0.50 0.50/3 0.50+ (0.50/3) =


0.60

4 0.50 0.50/4 0.50+ (0.50/4) =


0.62

2. Item Discrimination adalah proses yang dilakukan pembuat tes untuk memberikan informasi tentang
perbedaan individu (individual differences), baik dengan konstruk yang diukur melalui tes atau dengan
mengukur beberapa kriteria-kriteria eksternal yang seharusnya diprediksi oleh skor hasil tes tersebut.
Untuk mengetahui bagaimana setiap item yang kita buat mendeskripsikan/memberitahu perbedaan antara
high performers dan low performers dalam tes. Dengan proses ini kita dapat membedakan antara peserta
yang mengerti materi dan yang tidak. Caranya adalah dengan mendapatkan total skor setiap peserta tes dan
mengurutkannya dari tinggi ke rendah. Lalu ambil top 27% (high performers) dan bottom 27% (low
performers). Kumulasikan item difficulty pada setiap groupnya (low performers dan high performers).
Setelah itu mengurangi item difficulty high performer dan low performer dan hasilnya adalah indeks of
discrimination.

D= p u− p1

pu= proporsi kelompok atas, yang menjawab item denganbenar


p1= proporsi kelompok bawah, yang menjawab item dengan benar
Range nilai D = -1.00 sampai +1.00

PDU 303 1910 SEKSI C 2 dari 7


PROGRAM STUDI S1
FAKULTAS PSIKOLOGI

(+) = item mendukung kelompok atas (high-scoring group)


(-) = reverse discriminator, item mendukung lower-scoring group

3.Correlational Indices of Item Discrimination


Pada chapter 2 dijelaskan tentang Pearson product moment correlation coefficient untuk
mengukur derajat hubungan linear antar dua variabel. Jika item tes yang sedang dikembangkan
memiliki kemungkinan skor dengan range 1 sampai 4, 1 sampai 5, atau lebih besar dari (seperti Likert),
rumus ini biasa digunakan untuk mengestimasi derajat hubungan antara item dengan criterion scores.
Meksipun rumus yang sama dapat digunakan pada variabel skor yang bersifat dichotomous, terdapat
rumus yang telah dikembangkan agar lebih mudah digunakan ketika salah satu atau kedua variabel
memiliki skor yang dichotomous. Empat indeks korelasi tersebut adalah:
a. Point Biserial Correlation
Salah satu situasi yang sering terjadi dalam item analysis adalah ketika test developer tertarik
dengan seberapa dekat kinerja pada item tes yang diberi skor 0 hingga 1 terkait dengan kinerja
pada skor total tes (atau kriteria lain yang didistribusikan secara terus-menerus). Rumus Point
Biserial Correlation:
p pbis =¿ ¿
µ+¿¿= mean dari skor criterion untuk examinee yang menjawab item dengan benar
µx = mean dari skor criterion untuk seluruh kelompok
σ x = standar deviasi dari kelompok
p = item difficulty
q=(1− p)
Saat jumlah itemnya 25 keatas maka tidak masalah menggunakan rumus diatas, namun jika
jumlah itemnya kecil maka menjadi:

ρ Xi σ x −σ i
ρi (X −1)= 2 2
√ σ +σ −2 ρ
i x X1 σ x σi
ρi (X −1)= korelasi antara skor item dan skor total dengan item yang dihapus
σ x dan σ i = standar deviasi item masing-masing

b. Biserial Correlation Coefficient


Jika kita ingin mengasumsikan bahwa variabel laten yang mendasari kinerja item terdistribusi
secara normal, maka kita akan mendapatkan rumus untuk korelasi antara variabel dengan kriteria
yang terus didistribusikan seperti skor tes. Statistik ini disebut dengan Biserial Correlation
Coefficient:
r pbis =¿ ¿
µ+¿¿= mean dari skor criterion untuk examinee yang menjawab item dengan benar
σ x = standar deviasi
p+¿¿ = proporsi examinee yang menjawab item dengan benar
Y = ordinat Y dari kurva normal standar di z-score terkait dengan p-value untuk item ini.

Secara matematika, hubungan antara biserial dan point biserial correlation adalah:
pq
p pbis = √ p pbis
Y
Karena nilai kordinat Y pada kurva normal selalu kurang dari √ pq , nilai biserial correlation akan
selalu setidaknya seperlima lebih besar dari point biserial correlation untuk variabel yang sama.

PDU 303 1910 SEKSI C 3 dari 7


PROGRAM STUDI S1
FAKULTAS PSIKOLOGI

Perbedaan pecahan dalam besaran ini tetap cukup layak untuk item dengan tingkat kesulitan
sedang; namun karena p-value turun di bawah 0,25 atau meningkat di atas 0,75, perbedaan antara
biserial dan point biserial correlation meningkat tajam. Secara grafis bahwa pada rentang kesulitan
ekstrim, biserial correlation mungkin empat kali lebih besar dari point biserial correlation antara
skor item dan skor total.
c. Phi Coefficient
Ketika skor dari skor item yang dichotomous akan dikorelasikan dengan skor dari dichotomous
criterion (contoh: sukses atau kegagalan dari program rehabilitiasi, atau demografi karakteristik
seperti gender), phi coefficient bisa digunakan. Selain itu juga bisa digunakan untuk menentukan
derajat kestabilan dalam menanggapi item dichotomous yang sama oleh peserta tes yang sama di
keadaan yang berbeda. Penggunaan phi paling sesuai ketika variabel yang terlibat benar-benar
dichotomous. Ketika kelompok criterion dibentuk dengan memberlakukan titik potong buatan
(artificial cutoff) pada distribusi berkelanjutan, statistik ini tidak mengizinkan penggunaan penuh
informasi yang tersedia. Dengan kata lain, jika semua peserta tes yang skornya jatuh diatas nilai
cutoff maka diklasifikasikan dengan 1 untuk lulus dan 0 untuk gagal, informasi kuantitatif tentang
perbedaan antara skor kelompok lulus dan gagal akan hilang. Kemungkinan lain dari pembatasan
phi adalah nilainya hanya bisa mencapai 1.00 ketika p-value untuk dua variabel sama (karena phi
coefficient, seperti point biserial, diturunkan secara langsung dari Pearson product moment
correlation).
d. Tetrachoric Correlation Coefficient
Saat-saat ketika pembuat tes tertarik dengan seberapa kuat dua variabel dichotomous berkorelasi
ketika setiap variabel dibuat melalui dychotomizing distribusi normal yang mendasari. Dalam kasus
seperti itu Tetrachoric Correlation Coefficient sesuai. Penghitungan statistik ini rumit dan jarang
dilakukan kecuali test developer sangat percaya bahwa indeks korelasi yang lain, seperti phi, cukup
untuk memenuhi tujuan.

4.Comparison of Item Discrimination Indices (Perbandingan Indeks Diskriminasi Item)


Sejauh ini lima metode yang berbeda untuk menyelidiki item discrimination telah disajikan. Dalam beberapa
situasi, dikarenakan skoring variabel, satu teknik mungkin lebih sesuai daripada yang lain. Di waktu lain,
mungkin lebih sesuai jika menggunakan lebih dari satu metode. Dengan demikian tampaknya masuk akal
untuk mempertanyakan kesamaan hasil yang diperoleh dari berbagai metode.
Rekomendasi berikut dapat ditawarkan berkenaan dengan pilihan prosedur diskriminasi item untuk
skor item yang dichotomous:
1. Ketika item memiliki tingkat kesulitan sedang, maka akan membuat perbedaan yang kecil
dalam memilih statistik diskriminasi mana yang digunakan. Jika tes uji signifikansi statistik yang
diinginkan, maka salah satu dari prosedur korelasi harus digunakan.
2. Jika tujuannya untuk memilih item pada satu rentang kesulitan yang ekstrim, biserial p
disarankan (jika masuk akal untuk mengasumsikan distribusi normal dari sifat yang mendasari
kinerja item)
3. Jika test developer mencurigai bahwa sampel di masa depan akan berbeda dalam
kemampuannya dari kelompok analysis item saat ini, biserial p sekali lagi direkomendasikan
karena urutan relatif diskriminasi item untuk statistik ini harus tetap lebih stabil dari sampel ke
sampel jika sampel memiliki kemampuan yang berbeda. Cara lain untuk mengatakan ini adalah
bahwa p-value biserial yang rendah untuk sampel dari tingkat kemampuan apa pun
menunjukkan bahwa item tersebut memiliki daya diskriminatif (membedakan) rendah, tetapi
nilai biserial titik yang rendah untuk sampel yang daya diskriminatifnya rendah (atau
berkemampuan tinggi) mungkin hanya sebuah fungsi dari item difficulty, dan tidak selalu
menunjukkan bahwa item tersebut merupakan diskriminator yang buruk.

PDU 303 1910 SEKSI C 4 dari 7


PROGRAM STUDI S1
FAKULTAS PSIKOLOGI

4. Jika pembuat tes cukup percaya bahwa samplel di masa depan akan mirip kemampuannya
dengan sampe item analisis saat ini dan tujuan untuk memilih item yang akan memiliki high
internal consistency, maka direkomendasikan point biserial correlation.
5. Pada kasus item dan variable kriteria sama-sama di skor secara dichotomous, phi atau
tetrachoric coefficient sebaiknya digunakan. Phi mudah untuk dihitung tetap akan terbatas
ketika proporsi di kedua dikotomi tidak sama.

QUALITATIVE
Item analisis kualitatif adalah istilah umum untuk prosedur non statistic yang dirancang pembuat tes untuk
melihat bagaimana tes yang kita rancang saat diujikan dan banyak bergantung pada respon verbal. Jadi pada
kulitatif pembuat tes lebih fokus untuk berdiskusi pengalaman pengerjaan tes secara individu dan
kelompok.
Dalam kualitatif terdapat cara melakukan item analysis karen atidak menggunakan perhitungan maka kita
dapat menggunakan table untuk menganalisis setiap item yang dibuat.

Pertimbangan dalam Item analisis kualitatif:

1. Menebak (Guessing)
Adanya kemungkinan partisipan tes menebak-nebak jawaban pertanyaan, namun hal ini bisa saja
terjadi lewat pengetahuan subjektif peserta. Guessing memungkinkan partisipan mendapatkan nilai
yang bagus dan terkadang dapat kehilangan point. Untuk menghindari guessing, pembuat tes
memberikan instruksi khusus pada panduannya seperti memberikan informasi spesifik mengenai
penilaian.
2. Item fairness
Masalah saat pembuat tes memberikan tes kepada kelompok yang tidak sesuai (bias pada item).
Untuk mengetahui bias nya item, dapat menggunakan kurva karakter item (item-characteristic
curve). Hal ini dapat diatasi dengan menambah jumlah partisipan agar hasilnya lebih sesuai,
karakteristik partisipan juga dapat mempengaruhi fairness dalam suatu tes.
3. Speed test (Kecepatan)
Terdapat pada tes yang waktunya dibatasi karen partisipan menjadi cenderung tergesa gesa dalam
menjawab dan akhirnya tes menjadi berkorelasi positif.

Metode dalam analisis kualitatif:

1. “Think aloud” test administration

Merupakan metode analisis dengan menggunakan beberapa prosedur misalnya problem solving,
klinis, dan lain-lain. Bila dalam analisis tes hanya melibatkan tester dan peserta. Tester dapat memberikan
instruksi dan memperhatikan partisipan sepenuhnya. Bila menggunakan tes pencapaian maka penggunaan
administrasi tes ini dapat embantu bagi partisipan yang salah atau tidak mengerti tes dengan memintanya
untuk merefleksikan lagi.

2. Expert Panels:

Merupakan cara untuk mengetahui permasalahan pada tes melalui interview bersama partisipan dalam
penelitian kualitatif. Melalui interview ini peneliti membahas mengenai sensitivitas item-item yang
diberikan sehingga peneliti dapat mendapatkan item yang sesuai dengan standar dan fair. Review ini juga
penting karena sensitivitas item merupakan standar dalam penelitian.

Beberapa bias pada item yang terdapat dalam achievement test:

 Status: Kedudukan seseorang misalnya ketua kelompok atau pemimpin


 Stereotype: Pandangan dari suatu kelompok mengenai suatu karakteristik tertentu

PDU 303 1910 SEKSI C 5 dari 7


PROGRAM STUDI S1
FAKULTAS PSIKOLOGI

 Familiarities: Partisipan berpikira bahwa item yang diberikan cukup mirip dan pernah
dikerjakan sebelumnya
 Offensive choice: Beberapa item mungkin saja memiliki arti yang dapat merendahkan
partisipan, hal ini dapat dikurangi dengan memperhatikan karakteristik partisipan terlebih
dahulu dan menyesuaikannya terutama pada cara pemberian kata-katanya.
 Other: Permintaan pada partisipan untuk mengerjakannya secara spesifik mengenai bias
lainnya

PDU 303 1910 SEKSI C 6 dari 7


PROGRAM STUDI S1
FAKULTAS PSIKOLOGI

DAFTAR PUSTAKA

Crocker & Algina, 2008: Chp. 14, hal. 311-321)

Cohen & Swerdlik, 2018: Chp. 8; hal. 252-253, 256-260)

PDU 303 1910 SEKSI C 7 dari 7

Anda mungkin juga menyukai