Anda di halaman 1dari 13

A.

ARTI DAN MANFAAT ANALISIS TES


Evaluasi adalah segala upaya sistematis dan cermat untuk memahami kemampuan
dan kemajuan siswa baik sebelum,selama, maupun setelah proses pembelajaran, melalui
pengumpulan data, serta membandingkannya dengan norma atau criteria tertentu.
Tes adalah kegiatan atau proses sistematis mengukur kemampuan/kondisi
seseorang. Kegiatan tes { testing ) selalu menggunakan alat yang juga disebut tes ( test ).
Dalam tulisan ini pengertian tes lebih mengacu kepada alat dari pada kegiatan. Oleh
sebab itu tes diartikan: sejumlah pertanyaan yang oleh subyek dijawab benar atau salah,
atau sejumlah tugas yang yang oleh subyek dilaksanakan dengan berhasil atau gagal,
sehingga kemampuan subyek dapat dinyatakan dengan skor atau dinilai berdasarkan skala
tertentu.
Ada 2 macam tes, THB dan psikotes THB (tes hasil belajar) digunakan untuk
mengetahui sejauh mana siswa menguasai bahan / keterampilan yang telah dipelajari di
waktu yang lalu. Psikotes (tes psikologis) digunakan untuk mengetahui potensi individu
yang dapat dikembangkan/diwujudkan pada masa yang akan datang.
Khusus pada THB, ada dua bentuk soal yakni: tes bentuk uraian dan tes
bentuk pilihan ganda ( dulu lebih dikenal dengan nama tes obyektif ). Penggunaan nama
tes obyektif kini diganti dengan nama Tes Pilihan Ganda
Tes sebagai alat seleksi maupun evaluasi diharapkan menghasilkan nilai atau
skor yang obyektif dan akurat. Bila tes yang digunakan dosen/guru kurang baik, maka nilai
yang diperoleh siswa tidak obyektif dan berarti siswa diperlakukan tidak adil. Oleh sebab itu
perlu diusahakan agar tes yang diberikan kepada siswa cukup baik dan bermutu dilihat dari
berbagai segi. Kualitas tes mempengaruhi proses pembelajaran dan motivasi siswa dalam
belajar.
Sejak awal tes hendaknya disusun sesuai dengan prosedur dan prinsip
penyusunan tes. Dan pada akhirnya, setelah digunakan, perlu diketahui apakah tes itu
cukup obyektif dan efektif atau tergolong buruk. Tes yang baik mungkin dapat digunakan
berulang-ulang dengan sedikit perubahan, Sebaliknya tes yang buruk hendaknya dibuang,
bahkan kalau terlalu buruk sebaiknya tidak digunakan untuk member nilai kepada siswa
(dibatalkan).
Analisis tes adalah salah satu kegiatan dalam rangka mengkonstruksi tes
untuk mendapatkan gambaran tentang mutu tes, baik mutu keseluruhan tes maupun mutu
tiap buutir soal/tugas. Analisis dilakukan setelah tes disusun dan dicobakan kepada
sejumlah subyek dan hasilnya menjadi umpan balik untuk perbaikan/peningkatan mutu tes
bersangkutan. Oleh karena itu kegiatan analisis tes merupakan keharusan dalam
keseluruhan proses mengkonstruksi tes.
Buku ini merupakan pengantar untuk memahami pengertian, prosedur, dan
hal-hal mendasar yang berkaitan dengan analisis tes. Oleh sebab itu disajikan dalam

bentuk sederhana, ringkas, dan sedapat mungkin mencakup keseluruhan kegiatan analisis
tes.
B. CAKUPAN KEGIATAN ANALISIS TES
Kegiatan analisis tes meliputi empat hal yakni :
1. Analisis validitas tes
2. Analisis reliabilitas tes
3. Analisis butir soal yang meliputi :
a. Analisis daya pembeda tiap butir soal,
b. Analisis tingkat kesukaran tiap butir soal ,
c. Analisis pengecoh (distraktor) pada setiap butir soal,
d. Analisis homogenitas tiap butir soal.
4. Analisis teknis kegunaan tes.
Dengan melakukan analisis tes, guru dapat menabung-soal atau membuat
bank-soal yakni kumpulan soal-soal yang sudah teruji kebaikannya. Manfaat terbesar dari
kegiatan analisis tes ialah guru makin memahami bagaimana wujud tes yang baik,
bagaimana butir soal yang baik. Sehingga pada akhirnya guru makin terampil menyusun
tes dengan baik dan efisien.
Kritik terhadap tes bentuk pilihan ganda yang dianggap lebih buruk dari tes
bentuk uraian karena makin membodohkan siswa, sebenarnya bersumber pada tes
pilihan ganda yang buruk. Tes pilihan ganda(tes obyektif) yang baik, yang dianalisis dari
berbagai segi dan digunakan sesuai tujuan pendidikan, akan lebih baikdibanding tes bentuk
uraian yang tidak dianalisis. Oleh sebab itu tes bentuk apapun perlu dianalisis agar dapat
terjamin obyektifitas dan keakuratannya.
Pembahasan analisis tes di sini akan terbatas pada tes buatan guru/dosen, dan
bukan psikotes yang dibuat para ahli atau THB yang dibakukan.
C. APA DAN BAGAIMANA MENGETAHUI VALIDITAS TES?
Validitas tes adalah tingkat keabsahan atau ketepatan suatu tes. Tes yang valid
( absah = sah ) adalah tes benar-benar mengukur apa yang hendak diukur. Tes matematika
kelas dua SMP, hendaknya benar-benar mengukur hasil belajar matematika siswa SMP
kelas dua ; bukan siswa SMP kelas tiga atau siswa SD kelas enam. Dan bukan mengukur
hasil belajar dalam bidang studi lainnya. Tes yang disusun untuk mengukur hasil belajar
mata pelajaran kimia pada kelas tertentu, hendaknya tidak menyimpang sehingga
mengukur hasil belajar matematika atau bahasa, atau kimia untuk kelas lainny. Dengan
kata lain, validitas tes menunjukkan tingkat ketepatan tes dalam mengukur sasaran yang
hendak diukur.
Ada empat macam validitas tes hasil belajar, yakni:
1. Validitas permukaan ( face validity )

a.
b.
c.
d.
e.

2.

a.

b.

3.

Tingkat validitas permukaan diketahui dengan melakukan analisis atau telaah rasional
( semata-mata berdasarkan pertimbangan logis, bukan pada hitungan angka-angka empirik
). Analisis permukaan meliputi berbagai aspek berikut ini:
Apakah bahasa dan susunan kalimat (redaksi ) tiap butir soal cukup jelas dan sesuai
dengan kemampuan siswa?
Apakah isi jawaban yang diminta tidak membingungkan?
Apakah cara menjawab sudah dipahami siswa?
Jangan sampai siswa tahu isi jawabannya tetapi tidak tahu bagaimana cara menjawab soal
bersangkutan.
Apakah tes itu telah disusun berdasar kaidah/prinsip penulisan butir soal?
Tes yang tidak mengikuti kaidah penulisan butir soal akan tampak semerawut sehingga
membingungkan.
Setiap tes paling sedikit harus diperiksa melalui analisis permukaan. Walaupun analisis ini
tergolong paling lemah, namun lebih baik daripada tidak ada analisis sama sekali. Tentu
saja akan lebih baik bila suatu tes dianalisis lebih lanjut.
Validitas isi ( content validity )
Tingkat validitas isi juga diketahui dengan analisis rasional. Pada prinsipnya dilakukan
pemeriksaan terhadap tiap butir soal, apakah soal sudah sesuai dengan Tujuan
Pembelajaran Khusus atau dengan kompetensi yang hendak diukur atau dengan
indikator keberhasilan siswa. Cara yang lazim ialah mencocokkan tiap butir soal dengan
kisi-kisi yang disusun berdasarkan GBPP ( Garis Besar Program Pengajaran ).
Pengujian validitas isi dilakukan dengan menjawab pertanyaan berikut.
Apakah keseluruhantes telah sesuai dengan kisi-kisi?
Kisi-kisi adalah suatu bagian atau matrik yang menggambarkan penyebaran soal-soal
sesuai dengan aspek atau pokok bahasan yang hendak diukur, tingkat kesukaran dan jenis
soal. Kisi-kisi itu harus disusun sedemikian rupa sehingga mencakup seluruh bahan
pelajaran yang akan diteskan.
Tingkat kesesuaian seluruh butir soal dengan kisi-kisi ( dengan bahan yang akan diteskan )
menunjukkan tingkat validitas isi.
Apakah terdapat butir soal yang menyimpang, atau menuntut jawaban di luar bahan
pelajaran bersangkutan?
Misalnya soal dalam mata pelajaran fisika menjurus/menyimpang ke hitungan matematika
atau kemampuan di luar pokok bahasan yang diajarkan.
Penyimpangan yang tidak kentara itu perlu dihilangkan. Semakin banyak soal yang
menyimpang, semakin rendah tingkat validitas isi.
Untuk melakukan analisis validitas isi diperlukan adanya kisi-kisi tes yang disusun sebelum
soal-soal ditulis.
Validitas kriteria ( criterion validity )

4.

D.

1.

2.

Validitas ini diketahui dengan cara empirik, yakni menghitung koefisien korelasi antara tes
bersangkutan dengan tes lain sebagai kriterianya. Yang dapat digunakan sebagai kriteria
adalah tes yang sudah dianggap valid, atau nilai mata pelajaran yang sama yang
dipandang cukup obyektif. Sebagai contoh, skor tes Bahasa Inggris buatan guru
dikorelasikan dengan skor tes Bahasa Inggris yang telah dibakukan. Skor tes Matematika
kelas I SMA dikorelasikan dengan nilai rata-rata Matematika. Dengan rumus korelasi
Pearsons Product Moment dan menggunakan kalkulator, perhitungan validitas criteria
tersebut tidak terlalu sulit, apalagi bila menggunakan computer. Kesulitan utama dalam
menentukan validitas criteria ialah mencari skor tes yang akan dijadikan kriteria. Bila
kriterianya buruk atau tidak valid, maka validitas tes yang diperoleh akan percuma saja.
Validitas ramalan (predictive validity )
Validitas ini menunjukkan sejauh mana skor tes bersangkutan dapat digunakan
meramal keberhasilan siswa dimasa mendatang dalam bidang tertentu. Cara
menghitungnya sama seperti validitas kriteria, dalam hal ini skor tes dikorelasikan dengan
keberhasilan siswa di masa dating. Misalnya antara nilai UAN ( Ujian Akhir Nasional ) di
SMA, dengan prestasi belajar di perguruan tinggi dalam mata pelajaran yang sama.
Suatu tes yang baik biasanya memiliki angka validitas 0,50 atau lebih; tentu saja angka
itu makin tinggi makin baik. Suatu tes dengan angka validitas kurang dari 0,50 belum tentu
buruk. Mungkin kriterianya yang buruk atau keliru menentukan kriteria.
APA DAN BAGAIMANA MENGHITUNG RELIABILITAS TES ?
Reliabilitas tes adalah tingkat keajegan ( konsistensi ) suatu tes, yakni sejauh
mana suatu tes dapat dipercaya untuk menghasilkan skor yang ajeg/konsisten 9 tidak
berubah-ubah ). Tes yang reliabel atau dapat dipercaya adalah tes yang menghasilkan skor
secara ajeg, relatif tidak berubah walaupun diteskan pada situasi dan waktu yang berbedabeda. Sebaiknya, tes yang tidak reliabel seperti karet untuk mengukur panjang, hasil
pengukuran dengan karet dapat berubah-ubah ( tidak konsisten ).
Cara mengetahui reliabilitas tes
Ada tiga cara mengetahui reliabilitas tes. Pada prinsipnya diperoleh dengan menghitung
koefisien korelasi antara dua kelompok skor tes. Tiga cara itu sebagai berikut.
Tes-retest method ( metoda tes ulang )
Suatu tes ( yakni tes yang akan dihitung reliabilitasnya ), diteskan terhadap kelompok
siswa tertentu dua kali dengan jangka waktu tertentu ( misalnya satu semester atau satu
catur wulan ).
Skor hasil pengetesan pertama dikorelasikan dengan skor hasil pengetesan kedua.
Koefisien korelasi yang diperoleh menunjukkan koefisien reliabilitas tes tersebut.
Paralel test method 9 metoda tes parallel )
Cara ini mengharuskan adanya dua tes yang parallel, yakni dua tes yang disusun dengan
tujuan yang sama ( hanya sedikit perbedaan redaksi,isi atau susunan kalimatnya). Dua tes
tersebut diadministrasikan pada satu kelompok siswa dengan perbedaan waktu beberapa

hari saja. Skor dari kedua macam tes tersebut dikorelasikan dengan teknik yang sama
seperti pada metode tes-retest. Koefisien korelasi yang diperoleh menunjukkan tingkat
reliabilitas tes.
3. Split-half method ( metode belah dua )
Cara ini paling mudah dan seyogyanya diterapkan oleh para guru pada semua tes yang
diberikan kepada siswanya. Tidak perlu mengulangi pelaksanaan tes atau menyusun tes
yang parallel. Cukup satu tes dan diadministrasikan satu kali kepada sekelompok siswa
( minimal 30 siswa ).
Pada saatpenyekoran, tes dibelah menjadi dua sehingga tiap siswa memperoleh dua
macam skor, yakni skor yang diperoleh dari soal-soal bernomor genap. Skor total diperoleh
dengan menjumlah skor ganjil dan genap. Selanjutnya skor-ganjil dikorelasikan dengan
skor- genap, hasilnya adalah koefisien korelasi r gg. Atau koefisien korelasi ganjil-genap.

CONTOH
PERHITUNG
NAMA

SKOR

AN RELIABILITAS
SKOR
SISWA

NJIL

A
500
B
1520
C
728
D
1056
E
1419

GENAP
X

XY
20

25

400

625

38

40

1444

1600

28

26

784

676

33

32

1089

1024

33

43

1089

1849

GA

F
1080
G
272
H
1056
I
1260
J
1120

44

45

1935

2025

17

16

289

256

33

32

1089

1024

36

35

1296

1225

35

32

1225

1024

K
780
L
1596

4
JLH
13287

389

30

26

900

676

42

38

1764

144

390

13305

13448

12

Harga-harga tersebut di atas dimasukan kedalam rumus Pearsons Product Moment


diperoleh koefisien reliabilitas 0,94
Berarti tes ini tergolong baik sebab reliabilitasnya tinggi
E. APA YANG DIMAKSUD DENGAN ANALISIS BUTIR SOAL?
Baik buruknya tes tergantung pada butir-butir soal yang ada di dalamnya. Oleh
sebab itu untuk mendapatkan tes yang baik perlu dipilih butir-butir yang baik.Butir yang
buruk harus dibuang, yang kurang baik perlu direvisi. Untuk mengetahui kualitas tiap
butir soal perlu analisis satu persatu. Analisis meliputi perhitungan daya pembeda,
tingkat kesukaran, homogenitas tes serta analisis distraktor/pengecoh pada tes pilihan
ganda.
Daya pembeda menunjukkan sejauh mana tiap butir soal mampu membedakan
siswa yang menguasai bahan dan siswa yang tidak menguasai bahan. Butir soal yang
daya pembedanya rendah, tidak ada manfaatnya, malahan dapat merugikan siswa
yang belajar sungguh-sungguh.
Tingkat kesukaran menunjukkan apakah butir soal tergolong sukar, sedang atau
mudah. Tes yang baik memuat kira-kira 25 % soal mudah, 50 % sedang dan 25 %
sukar. Butir soal yang terlalu sukar sehingga hamper tidak terjawab oleh semua siswa
atau terlalu mudah sehingga dapat dijawab oleh hamper semua siswa, sebaiknya
dibuang karena tidak bermanfaat.

F.

1.
a.

b.
c.

2.
a.

b.

Tingkat homogenitas ( tingkat konsistensi ) soal menunjukkan apakah tiap butir


soal mengukur aspek atau kompetensi yang sama, atau sejauh mana tiap butir soal
menyumbang skor total tiap siswa. Butir soal yang homogeny adalah yang menunjang
skor total. Sebaliknya butir soal yang tidak seiring dengan skor-total dikatakan tidak
homogeny, dan lebih baik dibuang atau direvisi.
Analisis distraktor ( pengecoh/penyesat/option ) diperlukan hanya pada tes
bentuk pilihan ganda dimana siswa harus memilih satu dari beberapa alternative
jawaban. Tiap pengecoh/distraktor hendaknya bermanfaat, yakni ada sejumlah siswa
yang memilihnya. Pengecoh yang tidak dipilih sama sekali berarti tidak bermanfaat,
sedang pengecoh yang dipilih oleh hamper semua siswa berarti terlalu mirip dengan
jawaban yang benar.
Walaupun analisis butir soal pada tes bentuk pilihan ganda , walaupun tes
bentuk uraian prinsipnya sama, namun ada sedikit perbedaan dalam teknik
pelaksanaan analisis.
LANGKAH-LANGKAH KEGIATAN MENGANALISIS BUTIR SOAL TES PILIHAN
GANDA
Butir soal tes pilihan ganda jumlahnya cukup besar, biasanya antara 50 100
butir, bahkan ada yang sampai 200 butir dengan ragam soal yang berbeda-beda. Untuk
keperluan analisis, lembar jawaban siswa merupakandokumen utama. Analisis lengkap
meliputi semua hal, sedang analisis singkat hanya meliputi : reliabilitas belah-dua, daya
pembeda, dan tingkat kesukaran.
Langkah-langkah analisis butir soal adalah sebagai berikut.
Memberi skor pada lembar jawaban
Berilah tanda silang pada lembar jawaban, mana butir soal yang dijawab benar dan
mana yang salah. Yang benar diberi skor satu, yang salah diberi nol. Untuk pemberian
nilai, boleh saja jawaban benar diskor 4 dan jawaban yang salah diskor -1 ( dikenal
denda )
Skor tiap lembar jawaban ( tiap siswa ) dijumlahkan dengan 3 macam skor: (1) jumlah
skor soal bernomor ganjil, (2) jumlah skor soal bernomor genap, dan (3) skor total.
Jumlah skor ganjil dan genap digunakan untuk menghitung reliabilitas. Lihat teknik
analisis reliabilitas belah dua. Sedang skor total digunakan untuk mengurutkan dan
membuat kelompok Atas Bawah ( kelompok Unggul Asor )
Menghitung daya pembeda
Berdasar skor total, susunlah nama atau nomor siswa dari tertinggi hingga terendah.
Ambil 27% siswa yang skor-totalnya tinggi ( Kelompok Atas ), dan 27% yang rendah
( Kelompok Bawah ).
Buatlah tabel, khusus untuk siswa kelompok Atas dan kelompok Bawah. Jumlah kolom
dalam tabel minimal sama dengan jumlah butir soal, sehingga memuat seluruh jawaban
siswa.

c. Tanda 1 artinya jawaban betul dan 0 artinya jawaban salah.


d. Tabel ini digunakan untuk menghitung daya pembeda maupun tingkat kesukaran butir
soal.
e. Hitung jumlah jawaban yang benar ( bertanda 1 ), baik pada kelompok Atas, maupun
pada kelompok Bawah. Lihat contoh.
Daya pembeda dihitung dengan rumus :
DP = ------------------- x 100 %
DP = Indeks Daya Pembeda butir soal tertentu ( satu butir )
BA = jumlah jawaban benar pada Kelompok Atas
BB = jumlah jawaban yang benar pada Kelompok Bawah
NA = jumlah siswa pada salah satu kelompok A atau B
Kriteria daya pembeda sebagai berikut.
Negatif 9% = sangat buruk, harus dibuang
10% - 19% = buruk, sebaiknya dibuang
20% -29% = agak baik, kemungkinan perlu direvisi
30% - 49% = baik
50% keatas = sangat baik
Pada prinsipnya, daya pembeda dihitung berdasar selisih jawaban benar pada
kelompok Atas dan kelompok Bawah, dibagi dengan jumlah siswa padasalah satu
kelompok tersebut. Dikalikan 100% agar diperoleh angka bulat ( bukan pecahan, tetapi
persen ).
Masih ada beberapa teknik dan rumus menghitungdaya pembeda, namun cara
diatas paling sederhana sehingga cocok untuk para guru.
3.Menghitung tingkat kesukaran
Tabel skor yang digunakan disisni sama dengan tabel skor untuk menghitung
daya pembeda, tetapi menggunakan rumus;
TK = ------------------- x 100%
TK = indeks tingkat kesukaran butir soal tertentu ( satu butir )
BA = jumlah siswa yang menjawab benar pada kelompok A
BB
= jumlah siswa yang menjawab benar pada kelompok B
NA = jumlah siswa pada kelompok A ( atas/unggul )
NB = jumlah siswa pada kelompok B ( bawah/asor )
Makin besar harga TK, makin mudah butir soal tersebut, sehingga dapat juga
disebut tingkat kemudahan
Kriteria tingkat kesukaran ( tingkat kemudahan ) sebagai berikut.
0% - 15% = sangat sukar, sebaiknya dibuang
16% - 30% = sukar

31% - 70% = sedang


71% - 85% = mudah
86% - 100% = sangat mudah, sebaiknya dibuang
Tingkat kesukaran/kemudahan tiap butir soal lebih baik bila dihitung berdasarkan
jawaban seluruh siswa yang ikut tes ( bukan hanya kelompok unggul dan asor yang
berjumlah 54% )
Tetapi hal ini sulit dilaksanakan, kecuali menggunakan computer.
Rumus yang digunakan adalah :
TK = ------ x 100%
TK = indeks Tingkat Kesukaran butir soal tertentu ( satu butir soal )
nB = jumlah siswa yang menjawab benar pada butir itu
N
= jumlah seluruh siswa yang mengikuti tes
4. Menghitung homogenitas butir soal
Homogen tidaknya butir soal diketahui dengan menghitung koefisien korelasi
antara skor tiap butir soal dengan skor total.
Diperlukan perhitungan korelasi sebanyak butir soal dalam tes bersangkutan ( bila ada
50 butir soal, maka Anda harus menghitung koefisien korelasi sebanyak 50 kali ). Skor
tiap butir soal adalah 1 atau 0, sedang skor total tiap siswa cukup bervariasi.
Teknik korelasi yang digunakan boleh dengan Pearsons Product Moment, boleh juga
dengan teknik Korelasi Point Biserial. Namun teknik Pearsons lebih mudah bila
langsung menggunakan kalkulator atau computer. Hasil perhitungan korelasi tidak jauh
berbeda walau dengan teknik apapun.
Butir soal yang homogen, koefisien korelasinya sama atau di atas batas signifikasi
( batas kritis korelasi ).Butir soal yang tidak/kurang homogen koefisien korelasinya
negative atau lebih kecil dari batas signifikasi. Butir soal tersebut mungkin mengukur
aspek lain di luar bahan yang diajarkan ( soal tidaksesuai dengan tujuan pengajaran ),
maka sebaiknya direvisi atau ddibuang.
5.Analisis distraktor / pengecoh
Pada tes pilihan ganda ada beberapa option/alternative jawaban yang sengaja
dimasukkan sebagai pengecoh ( distraktor ). Butir soal yang baik pengecohnya akan
dipilih secara merata oleh siswa yang tidak dapat menjawab dengan benar. Sebaiknya
butir soal yang buruk, pengecohnya dipilih secara tidak merata.
Pengecoh dianggap baik bila jumlah siswa yang memilih pengecoh itu sama atau
mendekati jumlah ideal.
Indeks pengecoh dihitung dengan rumus :
IPc
= ------------------------------ x 100%
IPc
= Indeks Pengecoh/Distraktor
nPc
= Jumlah siswa yang memilih pengecoh itu
N = Jumlah seluruh subyek yang ikut tes

nB
= Jumlah subyek yang menjawab benar pada butir soal itu.
Alt
= Banyak alternative jawaban/option ( 3, 4, atau 5 )
Catatan:
Bila semua subyek menjawab benar pada butir soal tertentu ( semua sesuai kunci ),
maka IPc = 0 artinya buruk ( semua pengecoh tidak berfungsi )
Contoh analisis distraktor;
Misalnya Butir Soal No 32 dengan 5 alternatif jawaban dan kuncinya c ( yang benar ).
Dari 50 siswa, 20 siswa menjawab benar dan 30 siswa menjawab salah.
Yang ideal pengecoh dipilih secara merata, artinya semua pengecoh secara merata ikut
menyesatkan siswa. Seperti contoh butir soal berikut ( IPc mendekati 100% )
Option
a
b
c
d
e
Siswa yang memilih: 7
8
20
7
8
IPc
93% 107% **
93% 107%
Kualitas pengecoh:
++
++
**
++
++
Keterangan :
**
kunci jawaban
++
sangat baik
+
baik
- Kurang baik
Buruk
Sangat buruk
Pada contoh di atas, IPc butir a, b, d, dan e adalah: 93%, 107%, 93% dan 107%.
Semuanya dekat denganangka 100%, sehingga digolongkan sangat baik sebab semua
pengecoh itu berfungsi.
Contoh berikut adalah jawaban siswa yang menumpuk pada satu option:
Option:
a
b
c
d
e
Siswa yang memilih: 20
2
20
8
0
IPc:
267% 27% **
107% 0%
Kualitas pengecoh:
--**
++
-Pengecoh b dan e dikatakan tidak berfungsi, karena dipilih oleh sedikit siswa
atau malah tidak dipilih sama sekali. Pengecoh a dikatakan menyesatkan karena
banyak siswa yang menganggap option itu benar. Maka pengecoh a dan e perlu diganti
karena tergolong buruk, dan pengecoh b perlu revisi karena kurang baik.
Klasifikasi pengecoh berdasar Indeks Pengecoh sebagai berikut :
Sangat baik: IPc = 76% - 125% ( mendekati 100% )
Baik:
IPc = 51% - 75% atau 126% - 150%
Kurang baik: IPc = 26% - 50% atau 151% - 175%
Buruk:
IPc = 0% - 25% atau 176% - 200%
Sangat buruk: IPc = lebih dari 200%

Untuk analisis pengecoh perlu dibuat tabel khusus agar setiap butir soal diketahui
berapa siswa yang menjawab a, berapa yang menjawab b, berapa yang menjawab c,
dan seterusnya. Tentu saja sangat memakan waktu dan tenaga. Namun bila diolah
dengan computer dan data sudah dimasukkan dalam disket, pengolahan ini hanya
memerukan waktu beberapa deti saja.
Catatan:
Analisis homogenitas dan analisis distraktor, jarang sekali dilaksanakan oleh para guru.
Tetapi dengan program computer yang khusus digunakan untuk analisis tes, yakni
PROGRAM ANATES, kegiatan ini mudah dilakukan dan hanya memerlukan waktu
beberapa detik saja ( bila data sudah di-entry ).
G. ANALISIS BUTIR SOAL TES BENTUK URAIAN ( ESSAY )
Teknik analisis tes bentuk uraian dapat berbeda dengan teknik analisis tes pilihan
ganda. Bila terpaksa teknik analisis pilihan ganda ( seperti diuraikan diatas ) dapat
diterapkan untuk tes bentuk uraian. Tentu saja pekerjaan analisis tes bentuk uraian
akan lebih sederhana karena jumlah butir soal tes uraian biasanya hanya sedikit antara
5 10 butir. Skor per butir umumnya 0 10 atau 0 20.
Langkah-langkah analisis sebagai berikut :
1. Membuat tabel hasil penyekoran
Berilah skor pada seluruh pekerjaan/lembar jawaban siswa dan buatlah tabel
( matrik ) skor seluruh siswa. Berikut ini contoh tabel hasil penyekoran suatu tes dengan
9 butir soal yang dikerjakan oleh 36 siswa.
CONTOH TABEL SKOR UNTUK ANALISIS TES BENTUK URAIAN
Nama
Nomor butir Soal dan Skor
Skor
Skor Skor
Siswa
1 2 3 4 5 6 7 8 9
Ganjil Genap Tota
l
A
4 8 10 7 5 8 5 9 7
31
32
63
B
8 7 9 8 9 5 2 8 7
35
29
64
C
6 7 9 7 6 5 4 8 9
34
27
61
D
3 6 8 8 4 2 4 7 8
27
23
50
E
7 5 dst, dst
2. Menghitung reliabilitas
Untuk perhitungan reliabilitas ( metoda belah dua ), jumlah skor soal-ganjil
dikorelasikan dengan jumlah skor soal-genap. Kemudian hitung koefisien korelasi
ganjil-genapdan korelasi dengan rumus di muka ( lihat analisis reliabilitas, halaman di
muka ).
3.Menghitung daya pembeda butir soal
Untuk menghitung daya pembeda dan tingkat kesukaran tiap butir soal, susunlah
lebih dahulu skor total siswa mulai dari tertinggi sampai yang terendah ( diranking ).
Ambilah 27% kelompok teratas ( Atas ) dan 27% kelompok terbawah ( Bawah ). Bila
ada 36 siswa, maka kelompok A (Atas) terdiri atas 10 siswa terbaik dan kelompok B

4.

1.
2.
3.
4.
5.

(Bawah) terdiri atas 10 siswa yang terburuk. Jumlahkan skor tiap butir soal pada
kelompok A maupun kelompok B.
Hitung daya pembeda TIAP BUTIR soal dengan rumus yang paling sederhana:
SA - SB
DP = ----------------------- x 100 %
EA
DP = Indeks daya pembeda butir soal tertentu (satu butir )
SA = jumlah skor kelompok Atas pada butir soal yang diolah
SB = jumlah skor kelompok Bawah pada butir soal yang diolah
EA = jumlah skor IDEAL salah satu kelompok (Atas/Bawah) pada butir soal yang
sedang diolah.
Klasifikasi daya pembeda sama dengan tes pilihan ganda, yakni:
Negatif - 10% = sangat buruk, harus dibuang
10% - 19% = buruk, sebaiknya dibuang
20% - 29% = agak baik, kemungkinan perlu direvisi
30% - 49% = baik
50% ke atas = sangat baik
Bila menggunakan computer, analisis tes bentuk uraian lebih mudah dan hasilnya lebih
akurat. Disini digunakan teknik t-test, yakni menguji signifikasi perbedaan skor
kelompok Atas ( unggul ) dengan kelompok Asor ( bawah ), hasilnya. Angka-angka hasil
uji t tersebut dibandingkan dengan criteria berikut ( Uji-t satu pihak ).
Negatif - 0,52 = sangat buruk, harus dibuang
0,53 - 1,28 = buruk, sebaiknya dibuang
1,29 - 1,64 = agak baik, kemungkinan perlu direvisi
1,65 - 2,32 = baik
2,33 ke atas = sangat baik
Gunakan program Excel pada computer Anda !
Menghitung tingkat kesukaran (kemudahan) butir soal
Berdasarkan tabel kelompok Atas dan Bawah yang telah disusun itu, hitung tingkat
kesukaran tiap butir soal dengan rumus :
TKU = ---------x 100%
TKU = Indeks tingkat kesukaran butir soal tes uraian
SA
= jumlah skor pada kelompok A
SB
= jumlah skor pada kelompok B
EA
= jumlah skor ideal pada kelompok A
EB
= jumlah skor ideal pada kelompok B
Kriteria tingkat kesukaran (tingkat kemudahan) sama dengan pada tes pilihan ganda,
yakni :
0% - 15% = sangat sukar, sebaiknya dibuang

16% - 30% = sukar


31% - 70% = sedang
71% - 85% = mudah
86% - 100% = sangat mudah, sebaiknya dibuang.
5.Mengetahui homogenitas butir soal
Homogenitas tes uraian diketahui dengan menghitung koefisien korelasi skor tiap butir
soal dengan skor total. Dengan demikian dilakukan perhitungan korelasi sebanyak
jumlah butir soal. Teknik yang digunakan untuk analisis homoginitas butir soal sama
dengan teknik korelasi tersebut di muka.
H. PROGRAM KOMPUTER UNTUK ANALISIS TES
Kini komputer sudah digunakan di sekolah-sekolah maupun di kantor-kantor, sehingga
analisis tes makin mudah dilaksanakan dan waktunya lebih singkat. Beberapa paket
program computer dapat digunakan untuk analisis tes, yakni program pengolah data:
ECXEL, LOTUS-123, Q-PRO, serta program statistika misalnya MINITAB, MIKROSTAT,
dan SPSS.
Program khusus untuk analisis tes juga sudah tersedia, yakni ANATES Versi 4,0
( Under Windows ). Program ini dikembangkan oleh Karno To dan Yudi Wibisono,
merupakan penyempurnaan dari ANATES Versi 2.8 ( Under DOS ).
Dengan ANATES Versi 4.0. kegiatan analisis tes lebih cepat dan lebih mudah,
sehingga lebih menarik.
I. PENUTUP
Tidak semua tes buatan guru harus dianalisis. Tetapi semua tes yang digunakan
untuk keperluan diagnose, seleksi dan standarisasi, wajib melalui uji-coba dan analisis.
Tes yang tidak memerlukan analisis antara lain: tes formatif dan tes yang hanya akan
digunakan satu kali saja.
Ditengah hingar-bingarnya perubahan pelaksanaan pendidikan dalam era
otonomi daerah dan perubahan sesuai Kurikulum Berbasis Kompetensi, penulis yakin
bahwa tes yang baik masih tetap dan makin diperlukan untuk berbagai tujuan
pendidikan.
Penyusun program ANATES berpendapat bahwa mutu pendidikan dan mutu
sumber daya manusia Indonesia dapat ditingkatkan melalui perbaikan dan peningkatan
mutu alat serta system evaluasi hasil belajar. Oleh sebab itu para guru diharapkan
makin peduli terhadap kegiatan analisis tes, disamping upaya lain untuk meningkatkan
mutu pembelajaran dan pendidikan di sekolah.