Anda di halaman 1dari 17

TUGAS

EVALUASI PENDIDIKAN MATEMATIKA

ITEMAN

OLEH:

NAMA : HASMIWATI

STAMBUK : A1C1 13 116

JURUSAN PENDIDIKAN MATEMATIKA

FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN

UNIVERSITAS HALU OLEO

KENDARI

2015
A. GAMBARAN UMUM

ITEM AND TEST ANALYSISI (ITEMAN) merupakan perangkat lunak (softwere)


yang dibuat melalui bahasa pemrograman computer dan dibuat khusus untuk analisis butir
soal dan tes. Hasil analisis meliputi : tingkat kesukaran butir soal, daya pembeda soal,
statistic sebarab jawaban, kehandalan/reliabilitas tes, kesalahan pengukuran (standard
error), dan distribusi skor serta skor setiap peserta tes.
Untuk menginstal program ITEMAN cukup dengan mengcopy file ITEMAN.EXE.
untuk lebih memudahkan dalam melakukan analisis sebaiknya file DATA yang akan
dianalisis, file ITEMAN.EXE dan file HASIL analisis ditempatkan dalam satu sub
direktori.

FORMAT FILE DATA


Langkah pertama dilakukan dengan memasukkan (entry) jawaban siswa (respons) ke dalam
suatu file data dalam bentuk text yang dapat dilakukan melalui klik start-all programs-
accessories-noteped. Data tersebut dapat berupa alphabetic (Al-Qur'an,B, C, D,........) atau
numeric (1, 2, 3, 4, ....). sebagai contoh kita akan menganalisis butir soal dari suatu tes yang
terdiri atas 15 butir soal. Data respons siswa dapat diketik ke dalam file data (misal
HASMI.TXT) sebagai berikut:
015 o n 04
DBACCCADBDADDDD
444444444444444
YYYYYYYYYYYYYYY
001 CDDABDADBDABDDA
002 DBACDCABDCBADDD
003 DBADCCDBBDCDDAD
004 DBCCCDADDDADDCD
005 CBADCCABBDCDADD
006 BBACCDABBDCDDDD
007 CDACCBADBDCDDAD
008 BAAACCABBDDDDAD
009 DDACCDADBBADDAD
010 CBACCBDDBDBDBDD
011 BBACCBADBBCDDDB
012 CBABCCADBBDADDB
013 DACCCCADBDCADDD
014 CBDACCADBDCBDDB
015 ABACCAADBBDADDD
016 DBACCCADBDADDDD
017 BBACCCADDBDADDD
018 BBACCCDDBDADDCD
019 DBACCAADDDABBDD
020 BBACCCADDBADDDB
Agar file dapat dianalisis dengan ITEMAN diperlukan 4 baris perintah baris control yang
diketik mulai dari baris pertama kolom pertama. Empat baris pertama sebagai baris control
adalah sebagai berikut:

Baris pertama
Kolom keterangn Dalam contoh
1-3 jumlah butir soal 015
4 kosong/spasi -
5 untuk jawaban omit (kosong) 0
6 kosong/spasi -
7 untuk soal yang belum dikerjakan n
8 kosong/spasi -
9-10 jumlah identitas data siswa 04

Keterangan:
Kolom 1-3 : Diisi dengan angka yang menunjukkan jumlah butir soal yang
dianalisis. Kolom 1 untuk ratusan, kolom 2 untuk puluhan, dan kolom 3 untuk
satuan. Artinya untuk menuliskan jumlah butir soal sebanyak 15 angka 1 dimulai
pada kolom kedua dan angka 0 pada kolom ketiga. Atau dapat ditulis 015.
Kolom 5 : Disikan angka 9 atau 0 untuk butir soal yang tidak dijawa.
Kolom 7 : Disikan N atau n untuk soal yang belum sempat dikerjakan.
Kolom 9-10 : Disikan dengan panjang karakter untuk identitas siswa. Sebagai
contoh untuk identitas sebanyak 4 karakter dapat ditulis 04 atau 4.

Baris kedua : Berisi kunci jawaban (option yang benar). Penulisan kunci jawaban
harus sesuai dengan kode untuk data baik alphabetic maupun numeric
Baris ketiga : Berisi jumlah pilihan jawaban (option). Diisi dengan angka, misalnya
2, 3, 4, .... dan seterusnya sesuai dengan jumlah option
Baris keempat : Berisi kode/skala tes : Y = butir soal yang dianalisis dan N =
butir soal yang tidak dianalisis. Dapat pula diisikan bilangan 0, 1, 2, ....dan
seterusnya untuk tes berskala.
Baris kelima dan seterusnya : Berisi jawaban siswa yang diketik dengan
alphabetic maupun numeric, dengan ketentuan setiap satu baris menunjukkan
jawaban dari satu responden

B. MENJALANKAN PROGRAM

Aktifkan Personal Computer yang kita gunakan, selanjutnya lakukan langkah-


langkah sebagai berikut:
a. Klik start lalu All Programs pilih Accessories dan klik Notepad kemudian buka
file baru atau klik file lalu open
b. Masukkan data yang akan dianalisis dengan ketentuan yang digunakan
sebagaimana dikemukakan di atas kemudian disimpan, missal HASMI.TXT
c. Yakinkan bahwa file ITEMAN.TXT sudah diinstal (dicopy)
d. Double Klik file ITEMAN.TXT maka akan tampil di layar

e. Ketikkan nama file data yang akan dianalisis, misalnya HASMI.TXT lalu tekan
tombol ENTER. Selanjutnya akan tampil di layar.

Komputer meminta diisikan nama output file (file hasil analisis)


f. Ketikkan nama file output (hasil) yang kita kehendaki, misalnya HASIL.TXT
lalu tekan tombol ENTER maka akan muncul tampilan
Komputer meminta jawaban Y atau N

g. Ketikkan Y (=yes) bila kita inginkan file hasil skor, atau N(=no) bila kita tidak
menghendakinya. Bila kita ketik Y maka akan muncul

Komputer meminta diisikan nama file untuk skor peserta tes


h. Ketikkan nama file untuk hasil skor, misalnya SKOR.TXT
lalu tekan tombol ENTER dalam waktu beberapa detik akan muncul tampilan

ITEM ANALYSIS IS COMPLETE

Ini menujukkan bahwa proses analisis telah selesai. File hasil analisis (HASIL.TXT)
dan hasil skor (SKOR.TXT) berada dalam sub direktori yang sama.

C. HASIL ANALISIS

Hasil dari analisis ITEMAN ini berupa dua file yaitu file statistic dan file skor.
Keduanya berupa file ASCII yang dapat dilihat dengan menggunakan program
pengolah kata (word processor)
1. File Statistik
Statistic hasil analisis ITEMAN dapat dibedakan ke dalam 2 bagian yaitu : (a)
Statistik butir soal dan (b) statistic tes/skala. Berikut menunjukkan hasil analisis
statistic butir soal dan hasil analisis statistic tes/skala.:
Keterangan:

a. Statistic butir soal


Untuk tes yang terdiri dari butir-butir soal yang bersifat dikotomi misalnya
pilihan ganda, statistic berikut output dari setiap butir soal yang dianalisis
1. Seq. No. Adalah urut butir soal dalam file data
2. Scala item adalah nomor urut butir soal dalam tes
3. Prop.Correct adalah Proporsi siswa yang menjawab benar butri tes.
Nilai ekstrem mendekati nol atau satu menunjukkan bahwa butir soal
tersebut terlalu sukar atau terlalu mudah untuk peserta tes. Indeks ini
disebut juga indeks tingkat kesukaran soal secara klasikal.
4. Biser adalah indeks daya pembeda soal dengan menggunakan koefisien
korelasi biserial. Nilai positif menunjukkan bahwa peserta tes yang
menjawab benar butir soal mempunyai skor relatif tinggi dalam tes
tersebut. Sebaliknya nilai negative menunjukkan bahwa peserta tes yang
menjawab benar butir soal memperoleh skor yang relatif rendah dalam
tes. Untuk statistic pilihan jawaban (alternative), korelasi biserial
negative sangat tidak dikehendaki untuk kunci jawaban dan sangat
dikehendaki untuk pilihan jawaban yang lain
5. Point biseerial adalah juga indeks daya pembeda soal dan pilihan
jawaban (alternative) dengan menggunakan koefisien point biserial,
penafsirannya sama dengan statistic biserial

Catatan:
- Nilai -9.00 menunjukkan bahwa statistic butir soal atas pilihan jawaban tidak dpat
dihitung. Hal ini seringkali terjadi apabila tidak ada pesserta tes yang menjawab
butir soal/pilihan jawaban tersebut.statistik pilihan jawaban memberikan informasi
yang sama dengan statistic butir soal. Perbedaannya adalah bahwa statistic pilihan
jawaban dihitung secara terpisah. Untuk setiap pilihan jawaban dan didasarkan pada
dipilih tidaknya alternative tersebut, bukan pada benarnya jawaban. Tanda bintang
(*) yang muncul disebelah kanan analisis menunjukkan kunci jawaban

b. Statistic tes

Program ini memberikan hasil analisis statistic untuk tes sebagai berikut:
1) N of Items : jumlah butir soal dalam tes yang dianalisi. Utu tes yang terdiri
atas butir-butir soal dikotomi hal ini merupakan jumlah total butir soal dlam
tes.
2) N of Examines : Jumlah peserta tes yang digunakan dalam analisi
3) Mean : skor/rata-rata peserta tes
4) Variance: Varian dari distribusi skor peserta tes yang memberikan gambaran
tentang sebaran skor peserta tes.
5) Std. Deviasi :Deviasi standard dari distribusi skor peserta tes. Deviasi
standard merupakan akar dari variance.
6) Skew : Kemiringan distribusi skor peserta yang memberikan gambaran
tentang bentuk distribusi skor pesertates. Kemiringan negative menunjukkan
bahwa sebagian besar skor berada pada bagian atas/skor tinggi dari distribusi
skor. Sebaliknya kemiringan postif menunjukkan bawhwa sebagian besar
skor berada pada bagian bawah/skor rendah dari distribusi skor. Kemiringan
nol menujukkan bahwa skor berdistribusi secara simetris di sekitar rata-
rata/mean.
7) Kurtosis : Puncak distribusi skor yang menggambarkan kelandaian
distribusi skor disbanding dengan distribusi normal. Niali positif
menunjukkan distribusi yang lebih lancip/memuncak dan nilai negative
menunjukkan distribusi yang lebih landai/merata. Kurtosis untuk distribusi
normal adalah nol
8) Minimum : skor terendah peserta dlama tes
9) Maximum : skor tertinggi peserta dalam tes
10) Median : skor tengan dimana 50% berada pada/lebih rendah dari skor
tersebut.
11) Alpha : koefisien reliabilitas alpha untuk tes yang merupakan indeks
homogenitas tes. Koefisien alpha bergerak dari 0,0 sampai 1.0. koefisien
alpha hanya cocok digunakan pada tes yang bukan mengukur kecepatan dan
hany mengukur satu dimensi (single trait(. Reliabilitas adalah kestabilan
skor yang diperoleh orang yang sama ketika diuji ulang dengan tes yang
sama pada situasi yang berbeda. Jadi reliabilitas dapat dikatakan sebagai
tingkat konsistensi hasil dua pengukuran terhadap hal yang sama. Dengan
perangkat sola yang reliable apabila tes diberikan dua kali pada orang yang
sama tetapi dalam selang waktu yang berbeda sepanjang tidak ada
perubahan kemampuan maka skor yang diperoleh akan konsisten.
12) SEM : kesalahan pengukuran standard untuk setiap tes. SEM merupakan
eslimit dari deviasi standard kesalahan pengukuran dalam skor tes.
Kesalahan pengukuran membantu pemakai tes dalam memahami kesalahan
yang bersifat random yang mempengaruhi skor peserta dalam pelaksanaan
tes.
13) Mean p : rata-rata tingkat kesukaran senua butir soal dalam tes secara
klasikal dihitung dengan cara mencari rata-rata peserta tes yang menjawab
benar untuk semua butir soal dalam tes
14) Mean item tot : nilai rata-rata indeks daya pembeda dari semua soal dalam
tes yang diperoleh dengan menghitung nilai rata-rata point biserial dari
semua soal dalam tes
15) Mean biserial :nilai rata-rata indeks daya pembeda yang diperoleh dengan
menghhitunh nilai rata-rata korelasi biserial dari semua butir soal dalam tes.
16) Scale intercorelation : indeks korelasi antara skor-skor peserta tes yang
diperoleh dari setiap subtes

2. File skor
Program ITEMAN juga memberikan skoar untuk setiap pesreta tes yang
menunjukkan jumlah benar sari seluruh jawaban. Dari contoh di atas, dapat
dilihat skor peserta tes pada file SKOR.TXT sebagai berikut:

Baris peertama pada output menunjukkan jumlah karakter untuk identitas


peserta tes (dalam contoh di atas: 4) .jumlah skala (dalam contoh di atas: 1) dan
nama file input. Kemudian hasil skala diberikan secara berurutan sesuai dengan
urutan peserta tes dalam file data.

Catatan:
Program ITEMAN mampu menganalisis maksimal 250 butir soal dalam satu file
engan kapasitas 3.000 responden.
D. INTERPRETASI HASIL ANALISIS
Secara umum criteria pemillihan soal pilihan ganda:

Criteria koefisien keputusan

Tingkat kesukaran 0,30 s.d 0,70 (sedang) diterima

0,10 s.d 0,29 atau 0,70 s.d 0,90 (sukar atau mudah) direvisi

<0,10 atau >0,90 (sangat sukar atau sangat mudah) ditolak

Daya pembeda > 0,3 diterima

0,10 s.d 0,29 direvisi


<0.10 ditolak

Proporsi Jawaban > 0,05 berfungsi baik

catatan:
- Ditijau dari tujuan pelaksanaan tes, perlu diperhatikan bahwa soal yang terlalu
mudah atau terlalu sukar mungkin memang kurang memberikan informasi yang
berguna bagi peserta tes pada umumnya, di antaranya kemungkinan karena belum
berfungsinya pengecoh dengan baik, namun demikian pada soal yang terlalu mudah
atau terlalu sukar ini, apabila pengecohnya berfungsi baik yakni Prop Endorsing
memenuhi ( .0,5) serta daya pembedanya negatif maka soal tersebut masih
memenuhi untuk diterima, terlebih kalau memang soal tersebut akan digunakan
untuk seleksi yang sifatnya sangat menetukan.
- Suatu soal kadang-kadang dikategorikan ke dalam keadaan ekstrem sukar yaitu
apabila p mendekati nol atau ekstrem mudah yaitu apabila p mendekati 1
- Soal yang ekstrem mudah atau soal yang ekstrem sukar tidak memberikan informasi
yang berguna bagi sebagian besar peserta tes. Oleh sebab itu soal seperti ini
ekmungkinan distribusi jawaban pada alternatif jawaban ada yang tidak memenuhi
syarat. Sekalipun soal terlalu sukar atau terlalu mudah apabila setiap pengecoh pada
soal tersebut menunjukkan kondisi distribusi jawaban merata atau distribusi
jawabannya logis dan daya pembedanya negatif (kecuali kunci) maka soal-soal
tersebut masih memenuhi syarat untuk diterima. Sekalipun soal terlalu sukar atau
terlalu mudah apabila memiliki daya pembeda dan statistikpengecoh memenuhi
kriteria maka soal tersebut dapat dipilih dan diterima sebagai salah satu alternatif
untuk disimpan dalam bank soal.
- Apabila soal ekstrem mudah atau ekstrem sukar serta daya pembeda dan statistik
pengecohnya belum memenuhi kriteria maka soal tersebut perlu direvisi dan diuji
coba lagi.
- Daya pembeda soal berfungsi untuk menentukan dapat tidaknya suatu soal
membedakan kelompok dalam aspek yang diukur sesuai dengan perbedaan yang
ada pada kelompok itu. Tujuan dari pengujian daya pembeda adalah untuk melihat
kemampuan butir soal dalam membedakan antara peserta didik yang
berkemampuan tinggi dengan peserta didik yang berkemampuan rendah. Korelasi
point biserial maupun korelasi biserial adalah korelasi product moment yang
diterapkan pada data, variabel yang dikorelasikan masing-masing bersifat berbeda
satu sama lain. Variabel soal dikotomi karena skor pada soal hanya ada nol dan satu.
Variabel skol total bersifat kontinum yang diperoleh dari jumlah jawaban yang
benar.
Butir soal nomor 1

Tingkat kesukaran soal ini adalah 0.350(sedang), cukup bagus, yakni 35% peserta tes dapat
menjawab soal dengan benar. Daya pembedanya r bis =0.524 dan rpbis=0.407 menunjukkan
keduanya bertanda positif. Hal ini berarti bahwa peserta tes yang pintar (skor totalnya
tinggi) cenderung menjawab benar soal ini dan peserta tes yang kurang pintar cenderung
menjawab salah soal ini. Karena alternatif jawaban D merupakan kunci, maka tanda positif
ini menunjukkan bahwa kunci jawaban sudah berfungsi sebagaimana mestinya. Ditinjau
dari distribusi jawaban yaitu persentase peserta tes merespons alternatif jawaban, semua
pengecoh tampak telah berfungsi dengan baik. Dapat dilihat pada kolom Prop Endorsing,
tampak bahwa sebanyak 5% peserta tes merespons alternatif jawaban A, 30% merespons
alternatif jawaban B, 30% merespons alternatif jawaban C. Dengan demikian soal ini
termasuk kategori soal yang cukup baik dan dapat digunakan walaupun ditinjau dari
pengecohnya tampak bahwa alternatif jawaban B, daya pembedanya juga bernilai positif
sebanyak 11,4% peserta tes mmerespon alternatif jawaban B ini. Pada soal ini tidak ada
peringatan untuk mengecek kembali, karena besarnya nilai daya pembeda pada kunci
jawaban (D) tetap lebih besar dari alternatif jawaban B, sehingga butir soal ini tetap bisa
diterima dan digunakan baik untuk digunakan.
Sama halnya dengan butir soal nomor 1, butir soal lain yang dapat diterima dan dapat baik
untuk digunakan adalah nomor 3, 6 dan nomor 8

Butir soal nomor 2

Tingkat kesukaran soal ini adalah 0,750 (mudah), sebanyak 75% peserta tes dapat
menjawab soal tersebut dengan benar. Daya pembedanya rbis =0,362 dan rpbis=0.266
menunjukkan keduanya bertanda positif. Hal ini berarti bahwa peserta tes yang pintar (skor
totalnya tinggi) cenderung menjawab benar soal ini dan peserta tes yang kurang pintar
cenderung menjawab salah soal ini.Karena alternatif jawaban B merupakan kunci, maka
tanda positif ini menunjukkan bahwa kunci jawaban sudah berfungsi sebagaimana
mestinya.Dapat dilihat pada kolom Prop Endorsing, tampak bahwa sebanyak 10% peserta
tes merespons alternatif jawaban A, 0% merespons alternatif jawaban C, 15% merespons
alternatif jawaban D. Ditinjau dari daya pembeda masing-masing jawaban pengecoh juga
dapat dikatakan berfungsi baik karena rbis dan rpbis untuk alternatif jawaban A,C dan D
seluruhnya bernilai negative artinya peserta tes yang pinta cebderung tidak memilih
alternatif jawaban itu dan siswa yang kurang pintar cenderung memilih alternatif jawaban
tersebut. Dengan kata lain, peserta tes yang skornya rendah lebih memilih pengecoh
sebagai jawaban yang benar. Kesimpulannya butir soal nomor 2 ini sudah cukup baik dan
dapat digunakan.
Sama halnya dengan butir soal nomor 2 ini, butir soal yang sudah dapat dikatakan baik dan
dapat digunakan adalah butir soal nomor 5,10,12 dan nomor 15.

Butir soal nomor 4

Tingkat kesukaran soal ini adalah 0.700(sedang), cukup bagus, yakni 70% peserta tes dapat
menjawab soal dengan benar. Daya pembedanya r bis =0.738 dan rpbis=0.560 menunjukkan
keduanya bertanda positif. Hal ini berarti bahwa peserta tes yang pintar (skor totalnya
tinggi) cenderung menjawab benar soal ini dan peserta tes yang kurang pintar cenderung
menjawab salah soal ini. Karena alternatif jawaban B merupakan kunci, maka tanda positif
ini menunjukkan bahwa kunci jawban sudah berfungsi sebagaimana mestinya. Ditinjau dari
distribusi jawaban yaitu persentase peserta tes merespons alternatif jawaban, semua
pengecoh tampak telah berfungsi dengan baik. Dapat dilihat pada kolom Prop Endorsing,
tampak bahwa sebanyak 15% peserta tes merespons alternatif jawaban A, 5% merespons
alternatif jawaban B, 10% merespons alternatif jawaban D. Ditinjau dari daya pembedanya
masing-masing pengecoh juga dapat dikatakn berfungsi baik karena rbis atau rpbis untuk
alternatif jawaban A, B dan D seluruhnya bernilai negative artinya peserta tes yang pintar
cenderung tidak memilih jawaban itu dan siswa yang kurang pintar cenderung alternatif
jawaban tersebut. Dengan kata lain, peserta tes yang skornya rendah lebih memilih
pengecoh sebagai jawaban yang benar. Kesimpulannya butir soal nomor 4 ini sudah cukup
baik dan dapat digunakan.
Sama halnya dengan butir soal nomor 4 ini, butir soal yang sudah cukup baik dan dapat
digunakan adalah butir soal nomor 11.

Butir soal nomor 7

Tingkat kesukaran soal ini adalah 0.850(mudah), cukup bagus, yakni 85% peserta tes dapat
menjawab soal dengan benar. Daya pembedanya rbis = -0.155 dan rpbis= -0.101 menunjukkan
keduanya bertanda negatif. Hal ini berarti bahwa peserta tes yang pintar (skor totalnya
tinggi) cenderung menjawab salah soal ini dan peserta tes yang kurang pintar cenderung
menjawab benar soal ini. Karena alternatif jawaban A merupakan kunci, maka tanda negatif
ini menunjukkan bahwa kunci jawaban belum berfungsi sebagaimana mestinya. Dengan
demikian, baik ditinjau dari besarnya nilai tingkat kesukaran maupun daya pembeda, soal
ini termasuk dalam kategori perlu direvisi. Hal ini didukung pula oleh belum berfungsinya
seluruh pengecoh dengan baik yang tampak dari distribusi jawaban yaitu sebanyak 0%
peserta tes merespon alternatif jawaba B, 0% peserta tes merespon alternatif jawaban C,
dan 15% pesreta tes merespon alternatif jawaban D. Tampak bahwa alternatif jawaban B
dan C belum berfungsi sebagai pengecoh yang baik. Selain itu, ditinjau dari daya
pembedanya, alternatif jawaban A dapat dikatakn belum berfungsi baik karena rbis atau
rpbisuntuk alternatif jawaban D ternyata bernilai positif dan lebih besar nilainya daripada
alternatif jawaban A sebagai kuncinya. Hal ini menunjukkan bahwa ada kecenderungan
peserta tes yang pintar memilih jawaban D ini dan siswa yang kurang pintar cenderung
tidak memilih alternatif jawaban D, walaupun besarnya hanya 15% dari peserta tes. Dengan
kata lain, ada peserta tes yang skornya tinggi lebih memilih alternatif jawaban D sebagai
jawaban yang benar. Kesimpulannya butir soal nomor 7 ini perlu ditinjau lagi dan sekiranya
akan digunakan maka perlu direvisi. Oleh karena itu dari hasil analisis tampak adanya
peringatan CHECK THE KEY C WAS work better yang menunjukkan bahwa kunci
jawaban alternatif A kurang tepat dan alternatif jawaban D tampak berfungsi dengan baik.
Oleh karena itu yang diperlu dilakukan guna merevisi soal ini antara lain adalah periksa
kembali kunci jawaban , apabila kunci jawaban ternyata salah lakukan kembali analisis
soal, dan apabila ternyata kunci jawaban sudah benar maka kemungkinan kesalahan terletak
pada kesalahan penguasaan konsep oleh peserta didik.
Sama halnya dengan butir soal nomor 7 ini, butir soal lain yang perlu direvisi adalah butir
soal nomor 9, 13, dan soal nomor 14.

Anda mungkin juga menyukai