Anda di halaman 1dari 15

BAB I

PENDAHULUAN
A. Latar Belakang
Usaha yang lebih baik yaitu untuk selalu meningkatkan mutu tes yang disusun
oleh seorang tenaga pendidik, namun hal ini tidak dilaksanakan karena kecenderungan
seseorang untuk beranggapan bahwa hasil karyanya adalah yang terbaik atau setidak –
tidaknya sudah cukup baik.
Tenaga pendidik yang sudah banyak berpengalaman mengajar dan menyusun soal
– soal tes, juga masih sukar menyadari bahwa tesnya masih belum sempurna. Oleh
karena itu, cara yang paling baik adalah secara jujur melihat hasil yang diperoleh oleh
siswa, masalah inilah yang melatarbelakangi penulisan makalah ini yang berjudul
Analisis Tes.
B. Rumusan Masalah
1. Apa pengertian Analisis Tes?
2. Bagaimana cara mengetahui Validitas Tes?
3. Bagaimana cara mengetahui Reliabitas Tes?
4. Bagaimana cara mengetahui Analisis Butir Soal (item analysis)?
C. Tujuan Penulisan

1. Untuk mengetahui pengertian analisis tes;


2. Untuk mengetahui cara validitas tes;
3. Untuk mengetahui cara reliabitas tes;
4. Untuk mengetahui analisis butir soal (item analysis).

1
BAB II
PEMBAHASAN
ANALISIS TES
A. Pengertian Analisis Tes
Analisis tes adalah salah satu kegiatan dalam rangka mengkonstruksi tes untuk
mendapatkan gambaran tentang mutu tes, baik mutu keseluruhan tes maupun mutu tiap
butir soal/tugas. Analisis dilakukan setelah tes disusun dan dicobakan kepada sejumlah
subyek dan hasilnya menjadi umpan balik untuk perbaikan/peningkatan mutu tes
bersangkutan. Oleh karena itu kegiatan analisis tes merupakan keharusan dalam
keseluruhan proses mengkonstruksi tes. Dalam analisis tes juga ada beberapa yang harus
kita perhatikan, diantaranya:
1. Menilai tes yang dibuat sendiri
Secara teoritis, siswa dalam satu kelas merupakan populasi atau kelompok
yang keadaannya heterogen. Dengan demikian, maka apabila dikenai sebuah tes
akan tercermin hasilnya dalam suatu kurva normal. Sebagai besar siswa berada di
daerah sedang, sebagian kecil berada di ekor kiri, dan sebagaian kecil yang lain
berada di ekor kanan kurva. [1]
Apabila keadaan setelah hasil dianalisis tidak seperti yang diharapkan dalam
kurva normal, maka tentu ada “apa-apa” dengan soal tesnya.
Apabila hampir seluruh siswa memperoleh skor jelek, berarti bahwa tes yang
disusun mungkin terlalu sukar. Sebaliknya jka seluruh siswa memperoleh skor
baik, dapat diartikan bahwa tesnya terlalu mudah. Tentu saja interpretasi terhadap
soal tes akan lain seandainya tes itu sudah disusun sebaik-baiknya sehingga
memenuhi persyaratan sebagai tes.
Dengan demikian maka apabila kita memperoleh keterangan tentang hasil tes,
akan membantu kita dalam mengadakan penilaian secara objektif terhadap tes yang
kita susun.
            Ada 4 (empat) cara untuk menilai tes, yaitu:
a. Cara pertama meneliti secara jujur soal-soal yang sudah disusun, kadang-kadang
dapat diperoleh jawaban tentang ketidakjelasan perintah atau bahasa, taraf
kesukaran, dan lain-lain keadaan soal tersebut. [2]
Pertanyaan-pertanyaan tersebut, antara lain:
 Apakah banyaknya soal untuk tiap topik sudah seimbang?

2
 Apakah semua soal menanyakan bahan yang telah diajarkan?
 Apakah soal yang kita susun tidak merupakan pertanyaan yang
membingungkan (dapat di salah tafsirkan)?
 Apakah soal itu tidak sukar untuk dimengerti?
 Apakah soal itu dapat dikerjakan oleh sebagaian bbesar siswa?
b. Cara kedua adalah mengadakan analisis soal (item analysis). Analisis soal adalah
suatu prosedur yang sistematis, yang akan memberikan informasi-informasi yang
sangat khusus terhadap butir tes yang kita susun.
c. Cara ketiga adalah mengadakan checking validitas. Validitas yang paling penting
dari tes buatan guru adalah validitas kurikuler (content validity). Untuk
mengadakan checking validitas kurikuler, kita harus merumuskan tujuan setiap
bagian pelajaran secara khusus dan jelas sehingga setiap soal dapat kita jodohkan
dengan setiap tujuan khusus tersebut.
2. Cakupan kegiatan analisis tes
      Kegiatan analisis tes meliputi empat hal yakni :
a. Analisis validitas tes
b. Analisis reliabilitas tes
c. Analisis butir soal yang meliputi :
 Analisis daya pembeda tiap butir soal,
 Analisis tingkat kesukaran tiap butir soal,
 Analisis pengecoh (distraktor) pada setiap butir soal,
 Analisis homogenitas tiap butir soal.
d. Analisis teknis kegunaan tes.
Dengan melakukan analisis tes, guru dapat “menabung-soal” atau membuat
“bank-soal” yakni kumpulan soal-soal yang sudah teruji kebaikannya. Manfaat
terbesar dari kegiatan analisis tes ialah guru makin memahami bagaimana wujud
tes yang baik, bagaimana butir soal yang baik. Sehingga pada akhirnya guru
makin terampil menyusun tes dengan baik dan efisien. [3]
Kritik terhadap tes bentuk pilihan ganda yang dianggap lebih buruk dari tes
bentuk uraian karena “makin membodohkan siswa”, sebenarnya bersumber pada
tes pilihan ganda yang buruk. Tes pilihan ganda (tes obyektif) yang baik, yang
dianalisis dari berbagai segi dan digunakan sesuai tujuan pendidikan, akan lebih

3
baik dibanding tes bentuk uraian yang tidak dianalisis. Oleh sebab itu tes bentuk
apapun perlu dianalisis agar dapat terjamin obyektifitas dan keakuratannya.
Pembahasan analisis tes di sini akan terbatas pada tes buatan guru/dosen,
dan bukan psikotes yang dibuat para ahli atau THB yang dibakukan.

B. Cara Mengetahui Validitas Tes


Validitas tes adalah tingkat keabsahan atau ketepatan suatu tes. Tes yang valid
(absah = sah) adalah tes benar-benar mengukur apa yang hendak diukur. Tes matematika
kelas dua SMP, hendaknya benar-benar mengukur hasil belajar matematika siswa SMP
kelas dua ; bukan siswa SMP kelas tiga atau siswa SD kelas enam. Dan bukan mengukur
hasil belajar dalam bidang studi lainnya. Tes yang disusun untuk mengukur hasil belajar
mata pelajaran kimia pada kelas tertentu, hendaknya tidak menyimpang sehingga
mengukur hasil belajar matematika atau bahasa, atau kimia untuk kelas lainnya. Dengan
kata lain, validitas tes menunjukkan tingkat ketepatan tes dalam mengukur sasaran yang
hendak diukur.
     Ada empat macam validitas tes hasil belajar, yakni:
1. Validitas permukaan (face validity)
Tingkat validitas permukaan diketahui dengan melakukan analisis atau telaah rasional
( semata-mata berdasarkan pertimbangan logis, bukan pada hitungan angka-angka
empirik ). Analisis permukaan meliputi berbagai aspek berikut ini:
a. Apakah bahasa dan susunan kalimat (redaksi) tiap butir soal cukup jelas dan
sesuai dengan kemampuan siswa?
b. Apakah isi jawaban yang diminta tidak membingungkan?
c. Apakah cara menjawab sudah dipahami siswa?
d. Jangan sampai siswa tahu isi jawabannya tetapi tidak tahu bagaimana cara
menjawab soal bersangkutan.
e. Apakah tes itu telah disusun  berdasar kaidah/prinsip penulisan butir soal?
Tes yang tidak mengikuti kaidah penulisan butir soal akan tampak
semerawut sehingga membingungkan. [4]
Setiap tes paling sedikit harus diperiksa melalui analisis permukaan.
Walaupun analisis ini tergolong paling lemah, namun lebih baik daripada tidak ada
analisis sama sekali. Tentu saja akan lebih baik bila suatu tes dianalisis lebih lanjut.

4
2. Validitas isi (content validity)
Tingkat validitas isi juga diketahui dengan analisis rasional. Pada prinsipnya
dilakukan pemeriksaan terhadap tiap butir soal, apakah soal sudah sesuai dengan
Tujuan Pembelajaran Khusus atau dengan kompetensi yang hendak diukur atau
dengan indikator  keberhasilan siswa. Cara yang lazim ialah mencocokkan tiap butir
soal dengan kisi-kisi yang disusun berdasarkan GBPP (Garis Besar Program
Pengajaran). Pengujian validitas isi dilakukan dengan menjawab pertanyaan berikut.
a. Apakah keseluruhan tes telah sesuai dengan kisi-kisi?
Kisi-kisi adalah suatu bagian atau matrik yang menggambarkan penyebaran
soal-soal sesuai dengan aspek atau pokok bahasan yang hendak diukur, tingkat
kesukaran dan jenis soal. Kisi-kisi itu harus disusun sedemikian rupa sehingga
mencakup seluruh bahan pelajaran yang akan diteskan.
Tingkat kesesuaian seluruh butir soal dengan kisi-kisi (dengan bahan yang akan
diteskan) menunjukkan tingkat validitas isi.
b. Apakah terdapat butir soal yang menyimpang, atau menuntut jawaban di luar
bahan pelajaran bersangkutan?
Misalnya soal dalam mata pelajaran fisika menjurus/menyimpang ke hitungan
matematika atau kemampuan di luar pokok bahasan yang diajarkan.
Penyimpangan yang tidak kentara itu perlu dihilangkan. Semakin banyak soal
yang menyimpang, semakin rendah tingkat validitas isi. Untuk melakukan
analisis validitas isi diperlukan adanya kisi-kisi tes yang disusun sebelum soal-
soal ditulis.
3. Validitas kriteria (criterion validity)
Validitas ini diketahui dengan cara empirik, yakni menghitung koefisien korelasi
antara tes bersangkutan dengan tes lain sebagai kriterianya. Yang dapat digunakan
sebagai kriteria adalah tes yang sudah dianggap valid, atau nilai mata pelajaran yang
sama yang dipandang cukup obyektif. Sebagai contoh, skor tes Bahasa Inggris buatan
guru dikorelasikan dengan skor tes Bahasa Inggris yang telah dibakukan. Skor tes
Matematika kelas I SMA dikorelasikan dengan nilai rata-rata Matematika. Dengan
rumus korelasi Pearson’s Product Moment dan menggunakan kalkulator, perhitungan
validitas criteria tersebut tidak terlalu sulit, apalagi bila menggunakan komputer.
Kesulitan utama dalam menentukan validitas kriteria ialah mencari skor tes yang akan
dijadikan kriteria. Bila kriterianya buruk atau tidak valid, maka validitas tes  yang
diperoleh akan percuma saja.
5
4. Validitas ramalan (predictive validity)
Validitas ini menunjukkan sejauh mana skor tes bersangkutan dapat digunakan
meramal keberhasilan siswa dimasa mendatang dalam bidang tertentu. Cara
menghitungnya sama seperti validitas kriteria, dalam hal ini skor tes dikorelasikan
dengan keberhasilan siswa di masa dating. Misalnya antara nilai UAN ( Ujian Akhir
Nasional ) di SMA, dengan prestasi belajar di perguruan tinggi dalam mata pelajaran
yang sama.
Suatu tes yang baik biasanya memiliki angka validitas 0,50 atau lebih; tentu saja
angka itu makin tinggi makin baik. Suatu tes dengan angka validitas kurang dari 0,50
belum tentu buruk. Mungkin kriterianya yang buruk atau keliru menentukan kriteria.
[5]
C. Cara Mengetahui Reliabitas Tes
Reliabilitas tes adalah tingkat keajegan (konsistensi) suatu tes, yakni sejauh mana
suatu tes dapat dipercaya untuk menghasilkan skor yang ajeg/konsisten (tidak berubah-
ubah). Tes yang reliabel atau dapat dipercaya adalah tes yang menghasilkan skor secara
ajeg, relatif tidak berubah walaupun diteskan pada situasi dan waktu yang berbeda-beda.
Sebaiknya, tes yang tidak reliabel seperti karet untuk mengukur panjang, hasil
pengukuran dengan karet dapat berubah-ubah ( tidak konsisten ).
Ada tiga cara mengetahui reliabilitas tes. Pada prinsipnya diperoleh dengan
menghitung koefisien korelasi antara dua kelompok skor tes. Tiga cara itu sebagai
berikut. [6]
1. Tes-retest method (metoda tes ulang)
Suatu tes (yakni tes yang akan dihitung reliabilitasnya), diteskan terhadap kelompok
siswa tertentu dua kali dengan jangka waktu tertentu (misalnya satu semester atau satu
catur wulan).
Skor hasil pengetesan pertama dikorelasikan dengan skor hasil pengetesan kedua.
Koefisien korelasi yang diperoleh menunjukkan koefisien reliabilitas tes tersebut.

6
Contoh:
Tes Pertama Tes Kedua
Siswa
Skor Ranking Skor Ranking
A 15 3 20 3
B 20 1 25 1
C 9 5 15 5
D 18 2 23 2
E 12 4 18 4

Walaupun tampak skornya naik, akan tetapi kenaikannya dialami oleh semua siswa.
Metode ini disebut self-correlation method (korelasi diri sendiri) karena
mengkorelasikan hasil dari tes yang sama.

2. Paralel test method (metoda tes parallel)


Cara ini mengharuskan adanya dua tes yang parallel, yakni dua tes yang disusun
dengan tujuan yang sama (hanya sedikit perbedaan redaksi, isi atau susunan
kalimatnya). Dua tes tersebut diadministrasikan pada satu kelompok siswa dengan
perbedaan waktu beberapa hari saja. Skor dari kedua macam tes tersebut
dikorelasikan dengan teknik yang sama seperti pada metode tes-retest. Koefisien
korelasi yang diperoleh menunjukkan tingkat reliabilitas tes.
3. Split-half method (metode belah dua)
Kelemahan penggunaan metode dua-tes kali percobaan dan satu-tes dua kali
percobaan diatasi dengan metode ketiga ini yaitu metode belah dua. Dalam
menggunakan metode  ini pengetes hanya menggunakan sebuah tes dan dicobakan
satu kali. Oleh karena itu, disebut juga single-test-single-trial-method.
Berbeda dengan metode pertama dan kedua yang setelah diketemukan koefisien dan
korelasi langsung ditafsirkan itulah koefisien reliabitas maka dengan metode ketiga
ini tidak dapat demikian. Pada waktu membelah dua dan mengkorelasikan dua
belahan, baru diketahui reliabitas separo tes. Untuk mengetahui reliabitas seluruh tes
harus digunakan rumus. Spearman-Brown sebagai berikut:
Contoh:
 

r11 =  7
 
Di mana:
r½½   = korelasi antara skor-skor setiap belahan tes
r11        = koefisien realibitas yang sudah disesuaikan

Contoh:
Korelasi antara belahan tes = 0,60

maka reliabitas tes =   =   = 0,75


Banyak pemakai metode ini salah membelah hasil tes pada waktu, menganalisis.
Yang mereka lakukan adalah mengelompokkan hasil separo subjek peserta tes dan
separo yang lain kemudian hasil kedua kelompok ini dikorelasikan. Yang benar
adalah membelah item atau butir soal. Tidak akan keliru kiranya bagi pemakai
metode ini harus ingat bahwa banyaknya butir soal harus genap agar dapt dibelah.
Ada dua cara membelah butir soal:
a. Membelah atas item-item genap dan item-item ganjil yang selanjutnya disebut
belahan ganjil-genap, dan
b. Membelah atas item-item awal dan item-item akhir yaitu separo jumlah pada
nomor-nomor awal dan separo pada nomor-nomor akhir yang selanjutnya
disebut belahan awal-akhir.

D. Cara Mengetahui Analisis Butir Soal (Item Analysis)


Analisis butir soal atau analisis item adalah pengkajian pertanyaan-pertanyaan tes
agar diperoleh perangkat pertanyaan yang memiliki kualitas yang memadai. [7] Ada dua
jenis analisis butir soal, yakni analisis tingkat kesukaran soal dan analisis daya pembeda
disamping validitas dab reliabitas. Menganalisis tingkat kesukaran soal artinya mengkaji
soal-soal mana yang termasuk mudah, sedang dan sukar. Sedangkan menganalisis daya
pembeda artinya mengkaji soal-soal tes dari segi kesanggupan tes tersebut dalam
membedakan siswa yang termasuk ke dalam kategori lemah atau rendah dan kategori
kuat atau tinggi prestasinya. Sedangkan validitas dan reliabitas mengkaji kesulitan dan
keajegan pertanyaan tes. [8]
Salah satu cara untuk memperbaiki proses belajar-mengajar yang paling efektif
ialah dengan jalan mengevaluasi test hasil belajar yang diperoleh hasil belajar dari proses

8
belajar-mengajar itu sendiri. Dengan kata lain, hasil test itu kita oleh sedemikian rupa
sehingga dari hasil pengolahan itu dapat diketahui kompenan-kompenan manakakah dari
proses belajar-mengajar itu yang masih lemah.
Pengolahan test hasil belajar dalam rangka memperbaiki proses belajar-mengajar
dapat dilakukan dengan berbagai cara, antara lain:
1. Dengan membuat analisis soal (item analysis)
2. Dengan mennghitung validitas dan  kaeandalan tes.
3. Dalam pasal ini khusus akan di bicarakan cara yang pertama,yaitu teknik analisis soal
atau yang biasa disebut item analisis. Cara yang kedua, yaitu menghitung validititas
dan keandalan tes.
Menurut thorndike dan hagen(1977), analisis terhadap soal-soal (items) tes yang
telah di jawab oleh murid-murid mempunyai dua tujuan penting. Pertama, jawaban-
jawaban soal itu merupakan informasi diagnostik untuk meneliti pelajaran dari kelas itu
dan kegagalan-kegagalan belajarnya, serta selanjutnya untuk membimbing ke arah
belajar yang lebih baik.
Kedua, jawaban-jawaban terhadap soal-soal yang terpisah dan perbaikan
(review) soal-soal yang didasarkan atas jawaban-jawaban itu merupakan basis bagi
penyiapan tes-tes yang lebih baik untuk tahun berikutnya.[9]
Jadi, tujuan khususnya dari items analysis ialah mencari soal tes mana yang baik
dan mana yang tidak baik,dan mengapa items atau soal itu di katakan baik atau tidak
baik. Dengan mengetahui soal-soal yang tidak baik itu selanjutnya kita dapat mencari
kemungkinan sebab-sebab mengapa item itu tidak baik. Dengan membuat analisis
soal, sedikitnya kita dapat mengetahui tiga hal penting yang dapat di peroleh dari tiap
soal,yaitu:
 Sampai dimana tingkat atau taraf kesukaran soal itu (difficulty levelof an item).
 Apakah soal itu mempunyai daya pembeda (discriminating power) sehingga dapat
membedakan kelompok siswa yang pandai dengan kelompok siswa yang bodoh.
 Apakah semua alternatif jawaban (options) menarik jawaban-jawaban ataukah ada
yang demikian tidak menarik tidak menarik sehingga tidak tidak perlu dimasukkan ke
dalam soal.

1. Taraf Kesukaran

9
Asumsi yang digunakan untuk memperoleh kualitas soal yang baik, disamping
memenuhi validitas dan reliabitas, adalah adanya keseimbangan dari tingkat kesulitan
soal tersebut. Keseimbangan yang dimaksudkan adalah adanya soal-soal yang termasuk
mudah, sedang, sukar secara proporsional. Tingkat kesukaran soal dipandang dari
kesanggupan atau kemampuan siswa dalam menjawabnya, bukan dilihat dari sudut guru
sebagai pembuat soal. Persoalan yanng penting dalam melakukan analisis tingkat
kesukaran soal adalah penentuan proporsi dan kriteria soal yang termasuk mudah,
sedang, dan sukar. [10]
Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar.
Soal yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha
memecahkannya. Sebaliknya soal yang terlalu sukar akan menyebabkan siswa menjadi
putus asa dan tidak mempunyai semangat untuk mencoba lagi karena di luar
jangkauannya. [11]
Bilangan yang menunjukan sukar dan mudahnya sesuatu soal tersebut indeks
kesukaran (difficulty index). Besarnya indeks kesukaran antara 0,00 sampai dengan 1,0.
Indeks kesukaran ini menunjukan taraf kesukaran soal. Soal dengan indeks kesukaran 0,0
menunjukan bahwa soal itu terlalu sukar, sebaliknya indeks 1,0 menunjukan bahwa
soalnya terlalu mudah. [12]
0,0                                                     1,0
                           Sukar                                                Mudah
  Di dalam istilah evaluasi, indeks kesukaran ini diberi simbol P (p besar),
singkatan dari kata “proporsi”. Dengan demikian maka soal dengan P = 0,70 lebih
mudah jika dibandingkan dengan P = 0,20. Sebaliknya soal dengan P = 0,30 lebih sukar
dengan P = 0,80.
Melihat besarnya bilangan indeks maka lebih cocok jika bukan disebut sebagai
indeks kesukaran tetapi indeks kemudahan atau indeks fasilitas, karena semakin mudah
soal itu, semakin besar pula bilangan indeksnya. Akan tetapi telah disepakati bahwa
walaupunseemakin tinggi indeksnya menunjukan soal yang semakin mudah, tetapi tetap
disebut indeks kesukaran.
Rumus mencari P adalah:
 

P
     Di mana:
P = Indeks kesukaran
=  
10
B = Banyaknya siswa yang menjawab soal itu dengan betul
JS = Jumlah seluruh siswa peserta tes

2. Daya Pembeda
Daya pembeda soal adalah kemampuan sesuatu soal untuk membedakan antara
siswa yang pandai (berkemampuan tinggi) dengan siswa yang bodoh (berkemampuan
rendah).
Angka yang menunjukan besarnya daya pembeda disebut indeks diskriminasi,
disingkat D (d besar). Seperti hanya indeks kesukaran, indeks diskriminasi (daya
pembeda) ini berkisar antara 0,00 sampai 1,00. Hanya bedanya, indeks kesukaran tidak
mengenal tanda negatif (-), tetapi pada indeks diskriminasi digunakan jika sesuatu soal
“terbalik” menunjukan kualitas testee. Yaitu anak pandai disebut bodoh dan anak bodoh
disebut pandai. Dengan demikian ada tiga titik pada daya pembeda, yaitu:

-1,00                            0,00                                1,00
.           daya pembeda             daya pembeda             daya pembeda
                 negatif                        rendah                     tinggi (positif)

Bagi soal yang dapat dijawab benar oleh siswa pandai maupun siswa bodoh, maka
soal itu tidak baik karena tidak mempunyai daya pembeda. Demikian pula jika semua
siswa baik pandai maupun bodoh tidak dapat menjawab dengan benar. Soal tersebut
tidak baik juga karena tidak mempunyai daya pembeda. Soal yang baik adalah soal yang
dapat dijawab benar oleh siswa-siswa pandai saja.
Analisis daya pembeda mengkaji butir-butir soal dengan tujuan untuk mengetahui
kesanggupan soal dalam membedakan siswa yang tergolong mampu (tinggi prestasinya)
dengan siswa yang tergolong kurang atau lemah prestasinya. Artinya, bila soal tersebut
diberikan kepada anak yang mampu, hasilnya menunjukan prestasi yang tinggi; dan bila
diberikan kepada siswa yang lemah, hasilnya rendah. Tes dikatakan tidak memiliki daya
pembeda apabila tes tersebut, jika diujikan kepada anak berprestasi, hasilnya rendah,
tetapi bila diberikan kepada anak yang lemah hasilnya lebih tinggi. Atau bila diiberikan
kepada kedua kategori siswa tersebut, hasilnya sama aja. Dengan demikian, tes yang
tiidak memiliki daya pembeda, tidak akan menghasilkan gambaran hasil yang sesuai
dengan kemampuan siswa yang sebenarnya. Sungguh aneh bila anak pandai tidak lulus,

11
tetapi anak bodoh lulus dengan baik tanpa dilakukan manipulasi oleh si penilai atau di
luar faktor kebetulan. [13]
Cara yang biasa dilakukan dalam analisis daya pembeda adalah dengan
menggunakan tabel atau kriteria dari Rose dan Stanley seperti berikut:
 

SR - ST
 

Di mana:
SR = Siswa yang menjawab salah dari kelompok rendah
ST = Siswa yang menjawab salah dari kelompok tinggi
Contoh: Tes pilihan ganda atau option 4 diberikan kepada 30 orang siswa. Jumlah soal
15. Setelah diperiksa, datanya adalah sebagai berikut:
Jumlah siswa Jumlah siswa
yang menjawab yang menjawab
No. Soal salah kelompok salah kelompok SR – ST Ket.
rendah (SR) tinggi (ST)
1 6 1 5
2 6 1 5
3 5 2 3
4 6 1 5
5 2 1 1
6 5 1 4
7 2 1 1
8 7 1 6
9 7 1 6
10 4 2 2
11 3 1 2
12 6 1 2
13 2 1 5
14 6 1 1
15 5 2 3

3. Pola jawaban soal


Yang dimaksud pola jawaban disini adalah distribusi testee dalam hal menentukan
pilihan jawaban pada soal bentuk pilihan ganda. Pola jawaban soal diperoleh dengan
menghitung banyaknya testee yang memilih pilihan jawaban a, b, c, atau d atau yang
tidak memilih pilihan manapun (blangko). Dalam istilah evaluasi disebut omit, disingkat
O.

12
Dan pola jawaban soal dapat ditentukan apakah pengecoh (distractor) berfungsi
sebagai pengecoh dengan baiik atau tidak. Pengecoh yang tidak dipilih sama sekali oleh
testee berarti bahwa pengecoh itu jelek, terlalu menyolok menyesatkan. Sebaliknya
sebuah distraktor (pengecoh) dapat dikatakan berfungsi dengan baik apabila distraktor
tersebut mempunyai daya tarik yang besar bagi pengikut-pengikut tes yang kurang
memahami konsep atau kurang menguasai bahan.
Dengan melihat pola jawaban soal, dapat diketahui:
a. Taraf kesukaran soal
b. Daya  pembeda soal
c. Baik dan tidaknya distraktor.
Sesuatu distraktor dapat diperlukan dengan 3 (tiga) cara:
a. Diterima, karena sudah baik,
b. Ditolak, karena tidak baik, dan
c. Ditulis kembali, karena kurang baik.
Kekurangannya mungkin hanya terletak pada rumusan kalimatnya sehingga hanya
perlu ditulis kembali, dengan perubahan seperlunya. Menulis soal adalah suatu pekerjaan
yang sulit, sehingga apabila masih dapat diperbaiki, sebaiknya diperbaiki saja, tidak
dibuang. Suatu distraktor dapat dikatakan berfungsi baik jika paling sedikit dipilih oleh
5% pengikut tes.

BAB III
PENUTUP
A.    Kesimpulan
Analisis tes adalah salah satu kegiatan dalam rangka mengkonstruksi tes untuk mendapatkan
gambaran tentang mutu tes, baik mutu keseluruhan tes maupun mutu tiap butir soal/tugas.
Kegiatan analisis tes meliputi empat hal yakni :
13
  Analisis validitas tes
  Analisis reliabilitas tes
  Analisis butir soal
  Analisis teknik kegunaan tes
Validitas tes adalah tingkat keabsahan atau ketepatan suatu tes. Tes yang valid (absah
= sah) adalah tes benar-benar mengukur apa yang hendak diukur.
Reliabilitas tes adalah tingkat keajegan (konsistensi) suatu tes, yakni sejauh mana suatu tes
dapat dipercaya untuk menghasilkan skor yang ajeg/konsisten (tidak berubah-ubah).
Dengan membuat analisis soal, sedikitnya kita dapat mengetahui tiga hal penting yang dapat
di peroleh dari tiap soal,yaitu:
   Sampai dimana tingkat atau taraf kesukaran soal itu (difficulty levelof an item).
   Apakah soal itu mempunyai daya pembeda (discriminating power)
   Apakah semua alternatif jawaban (options) menarik jawaban-jawaban ataukah ada yang
demikian tidak menarik tidak menarik sehingga tidak tidak perlu dimasukkan ke dalam soal.

DAFTAR PUSTAKA

Arikunto, Suharsimi. 2012. Dasar-dasar Evaluasi Pendidikan (Edisi 2). Jakarta: Bumi


Aksara
Arikunto, Suharsimi. 2011. Dasar-dasar Evaluasi Pendidikan (Edisi Revisi). Jakarta: Bumi
Aksara
Purwanto, Ngalim. 2012. Teknik Evaluasi Pembelajaran. Bandung: Rosda

14
Sudjana, Nana. 2009. Penilaian Hasil Proses Belajar Mengajar. Bandung: PT Remaja
Rosdakarya
http://mahmud09.blogspot.com/2012/06/tingkat-kesukaran dan-daya-beda.html
biomatectona.blogspot.com/2011/04/mengenal-analisis-tes.html

[1] Arikunto, Suharsimi. 2012. Dasar-dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara. hal 219

[2] Ibid. hal 220
[3] biomatectona.blogspot.com/2011/04/mengenal-analisis-tes.html

[5] Arikunto, Suharsimi. 2011. Dasar-dasar Evaluasi Pendidikan (Edisi Revisi). Jakarta: Bumi


Aksara. hal 69
[6] Arikunto, Suharsimi. 2012. Dasar-dasar Evaluasi Pendidikan (Edisi 2). Jakarta: Bumi
Aksara. hal 105
[7] Sudjana, Nana. 2009. Penilaian Hasil Proses Belajar Mengajar.  Bandung: PT Remaja
Rosdakarya. hal 135

[8] Ibid. hal 135


[9] Purwanto, Ngalim. 2012. Teknik Evaluasi Pembelajaran. Bandung: Rosda. hal 118
[10] Sudjana, Nana. 2009. Penilaian Hasil Proses Belajar Mengajar.  Bandung: PT Remaja
Rosdakarya. hal 135

15

Anda mungkin juga menyukai