Oleh :
ARIF OKTAFIANTO (3136159241)
LOURENSIUS (3136159236)
YULISAR (3136159248)
1
KATA PENGANTAR
Dalam penyusunan makalah ini tidak lepas dari sumbangsih berupa pemikiran-
pemikiran/ gagasan dari teman-teman untuk menyempurnakan isi makalah ini.
Semoga makalah ini sangat bermanfaat bagi pembaca terutama bagi teman-teman
mahasiswa dalam mata kuliah Evaluasi dalam Pembelajaran Matematika.
penulis
2
DAFTAR ISI
BAB I PENDAHULUAN
A. Latar belakang ……………………………………...… 4
B. Rumusan Masalah ……………………………………...… 4
C. Tujuan Masalah ……………………………………...… 5
D. Manfaat ……………………………………...… 5
BAB II PEMBAHASAN
A. Pengertian Tes Hasil Belajar ............……...................... 6
B. Bentuk Tes Hasil Belajar .............................................7
C. Ciri-ciri Tes yang Baik ................................................ 14
D. Penyusunan Kisi- Kisi Instrumen Tes Hasil Belajar Dan
Proses Validasi Instrumen ............................................... 16
E. Analisis Butir Soal ....................................... 24
3
BAB 1
PENDAHULUAN
A. Latar belakang
B. Rumusan Masalah
Dari uraian latar belakang diatas, permasalahan yang ingin dicari
solusinya adalah adalah sebagai berikut:
1. Apa saja bentuk tes hasil belajar?
2. Bagaimana penyusunan kisi-kisi instrumen tes hasil
belajar?
3. Bagaimana proses validasi instrumen?
4. Bagaimana analisis butir instrumen tes hasil belajar
dengan itemen?
4
C. Tujuan Masalah
Tujuan dari penulisan makalah ini adalah sebagai berikut:
1. Mengetahui bentuk tes hasil belajar
2. Mengetahui penyusunan kisi-kisi instrumen tes hasil belajar
3. Mengetahui proses validasi instrumen
4. Mengetahui analisis butir instrumen tes hasil belajar dengan itemen
D. Manfaat
Manfaat yang ingin dicapai dari penulisan makalah ini adalah bagi
mahasiswa dapat dijadikan panduan dalam mengikuti mata kuliah Evaluasi
dalam Pembelajaran Matematika dan yang ingin menyusun atau
mengembangkan instrumen tes hasil belajar.
BAB II
PEMBAHASAN
5
A. Pengertian Tes Hasil Belajar
Kata tes berasal dari bahasa Prancis kuno yang berarti piring untuk
menyisihkan logam-logam mulia, yang dimaksud disini adalah dengan
menggunakan alat berupa piring akan dapat diperoleh jenis-jenis logam
mulia yang bernilai tinggi. Dalam perkembangannya dan seiirng kemujuan
zaman tes berarti ujian atau percobaan. Ada beberapa istilah yang
memerlukan penjelasan sehubungan dengan uraian diatas yaitu tes, testing,
tester dan testee, yang masing-masing mempunyai pengertian berbeda
namun erat kaitannya dengan tes. Subino (1987: 79).
1. Tes adalah alat atau prosedur yang dipergunakan dalam rangka
pengukuran dan penilaian,
2. Testing berarti saat dilaksanakannya pengukuran dan penilaian atau
saat pengambilan tes
3. Tester artinya orang yang melaksanakan tes atau orang yang diserahi
untuk melaksanakan pengambilan tes terhadap para responden
4. Testee adalah pihak yang sedang dikenai tes.
Ada beberapa pendapat dari beberapa ahli tentang pengertian tes,
menurut Anne Anastasi dalam karya tulisnya yang berjudul Psychological
Testing, yang dimaksud dengan tes adalah alat pengukur yang mempunyai
standar yang obyektif sehingga dapat digunakan secara meluas, serta dapat
digunakan sebagai cara untuk mengukur dan membandingkan keadaan
pskis atau tingklah laku individu. Menurut Lee J. Cronbach dalam
bukunya berjudul Essential of Psychological Testing, tes merupakan suatu
perosedur yang sistematis untuk membandingkan tingkah laku dua orang
atau lebih. Sedangkan menurut Goodenough, tes adalah suatu tugas atau
serangkaian tugas yang diberikan kepada individu atau kelompok, yang
dimaksud untuk membandingkan kecakapan satu sama lain.
Dari pengertian dari para ahli tersebut dalam dunia pendidikan
dapat disimpulkan bahwa pengertian tes adalah cara yang digunakan atau
prosedur yang ditempuh dalam rangka pengukuran dan penilaian di bidang
pendidikan, yang memberikan tugas dan serangkaian tugas yang diberikan
6
oleh guru sehingga dapat dihasilkan nilai yang melambangkan tingkah
laku atau prestasi peserta didik.
Suatu tes akan berisiskan pertanyaan-pertanyaan dan atau soal-soal
yang harus dijawab dan atau dipecahkan oleh individu yang dites (testee),
maka disebut tes hasil belajar (achievement test). Tes hasil belajar
biasanya terdiri dari sejumlah butir soal yang memiliki tingkat kesukaran
tertentu (ada yang mudah, sedang, dan sukar). Tes tersebut harus dapat
dikerjakan oleh siswa dalam waktu yang sudah ditentukan. Oleh karena
itu, tes hasil belajar merupakan power test. Maksudnya adalah mengukur
kemampuan siswa dalam menjawab pertanyaan atau permasalahan.
7
a. Tes Essay (uraian)
Tes Essay adalah tes yang disusun dalam bentuk pertanyaan
terstruktur dan siswa menyusun, mengorganisasikan sendiri jawaban
tiap pertanyaan itu dengan bahasa sendiri. Tes essay ini sangat
bermanfaat untuk mengembangkan kemampuan dalam menjelaskan
atau mengungkapkan suatu pendapat dalam bahasa sendiri.
Subino, (1987:94) menyatakan bahwa berdasarkan tingkat
kebebasan jawaban yang dimungkinkan dalam tes bentuk uraian,
butir-butir soal dalam ini dapat dibedakan atas butir-butir soal yang
menuntut jawaban bebas. Butir-butir soal dengan jawaban terikat
cenderung akan membatasi, baik isi maupun bentuk jawaban;
sedangkan butir soal dengan jawaban bebas cenderung tidak
membatasi, baik isi maupun jawaban.
Kebaikan atau keuntungan penggunaan tes uraian antara lain:
1) Dapat mengukur hasil belajar yang kompleks, yang tidak dapat
diukur dengan tes atau cara yang lain.
2) Dapat mengukur perpaduan dan aplikasi tentang keterampilan
berpikir dan keterampilan memecahkan masalah.
3) Mudah disusun (dibuat)
8
interprestasi yang bermacam-macam.
b. Tes Objektif
Tes objektif adalah tes yang disusun sedemikian rupa dan
telah disediakan alternatif jawabannya. Tes ini terdiri dari berbagai
macam bentuk, antara lain ;
1. Tes objektif bentuk benar-salah (true-false test)
2. Tes objektif bentuk menjodohkan (matching test)
3. Tes objektif bentuk jawaban singkat (short answer)
4. Tes objektif bentuk pilihan ganda (multipel choice item test)
9
Kelemahan tes obyektif bentuk benar-salah (true-false test)
a) Mudah ditebak dan diduga
b) Membuka peluang bagi testee untuk berspekulasi dalam
memberikan jawaban
c) Sifatnya terbatas, dalam arti bahwa tes tersebut hanya dapat
mengungkap daya ingat dan pengenalan kembali, jadi lebih
bersifat hafalan
d) Umumnya tes obyektif jenis ini reliabilitasnya rendah, kecuali
apabila butir-butir soalnya dibuat dalam jumlah yang banyak
sekali
e) Dapat terjadi bahwa butir-butir soal tes objektif ini tidak dapat
dijawab dengan dua kemungkinan saja, yaitu betul atau salah
10
3). Tes Jawaban Singkat (Short Answer)
Keuntungan tes jawaban singkat antara lain:
Lebih mudah disusun, karena hasil belajar yang diukur relatif
sederhana
Siswa diminta hanya memberi jawaban
Keterbatasan tes jawaban singkat antara lain:
Tidak cocok untuk mengukur hasil belajar yang kompleks
11
A. Jika pernyataan betul, alasan betul, dan keduanya
menunjukkan hubungan sebab-akibat
B. Jika pernyataan betul, alasan betul, tetapi keduanya
tidak menunjukkan hubungan sebab-akibat
C. Jika pernyataan betul dan alasan salah
D. Jika pernyataan salah dan alasan betul
E. Jika pernyataan salah dan alasan sala
3. Dilihat dari sudut waktu kapan dan untuk apa tes itu dilakukan, yaitu:
a. Tes awal (pretest),
b. Tes akhir (posttest),
12
Tes Formatif, yaitu tes yang diberikan untuk memonitor kemajuan
belajar selama proses pembelajaran berlangsung. Tes ini diberikan
dalam tiap satuan unit pembelajaran. Manfaat tes formatif bagi
peserta didik adalah :
Untuk mengetahui apakah peserta didik sudah menguasai materi
dalam tiap unit pembelajaran. Merupakan penguatan bagi peserta
didik.
Merupakan usaha perbaikan bagi siswa, karena dengan tes formatif
peserta didik mengetahui kelemahan-kelemahan yang dimilikinya.
Peserta didik dapat mengetahui bagian dari bahan yang mana yang
belum dikuasainya.
b. Tes Summatif
Tes sumatif diberikan dengan maksud untuk mengetahui
penguasaan atau pencapaian peserta didik dalam bidang tertentu.
Tes sumatif dilaksanakan pada tengah atau akhir semester.
c. Tes Penempatan
Tes penempatan adalah tes yang diberikan dalam rangka
menentukan jurusan yang akan dimasuki peserta didik atau
kelompok mana yang paling baik ditempati atau dimasuki peserta
didik dalam belajar.
d. Tes Diagnostik
Tes diagnostik adalah tes yang digunakan untuk mendiagosis
penyebab kesulitan yang dihadapi seseorang baik dari segi
intelektual, emosi, fisik dan lain-lain yang mengganggu kegiatan
belajarnya.
13
Menurut arikonto (2006:42), Sebuah tes yang dapat dikatakan baik
sebagai alat pengukur harus memilki persyaratan tes, yaitu memiliki:
1. Validitas
Sebuah tes disebut valid apabila tes tersebut dapat tepat
mengukur apa yang hendak diukur. Contoh, untuk mengukur
partisipasi siswa dalam proses belajar mengajar, bukan diukur melalui
nilai yang diperoleh pada waktu ulangan, tetapi dilihat melalui:
kehadiran, terpusatnya perhatian pada pelajaran, ketepatan menjawab
pertanyaan-pertanyaan yang diajukan oleh guru dalam arti relevan
pada permasalahannya.
2. Reliabilitas
Berasal dari kata asal reliable yang artinya dapat dipercaya.
Tes dapat dikatakan dapat dipercaya jika memberikan hasil yang tetap
apabila diteskan berkali-kali. Sebuah tes dikatakan reliabel apabila
hasil-hasil tes tersebut menunjukan ketetapan. Jika dihubungkan
dengan validitas, maka: Validitas adalah ketepatan dan reliabilitas
adalah ketetapan.
3. Objektivitas
Sebuah dikatakan memiliki objektivitas apabila dalam
melaksanakan tes itu tidak ada faktor subjektif yang mempengaruhi.
hal ini terutama terjadi pada sistem scoringnya. Apabila dikaitkan
dengan reliabilitas maka objektivitas menekankan ketetapan pada
sistem scoringnya, sedangkan reliabilitas menekankan ketetapan
dalam hasil tes.
4. Praktikabilitas
Sebuah tes dikatakan memiliki praktibilitas yang tinggi
apabila tes tersebut bersifat praktis dan mudah pengadministrasiannya.
tes yang baik adalah yang mudah dilaksanakan, mudah
pemeriksaannya, dan dilengkapi dengan petunjuk-petunjuk yang jelas.
5. Ekonomis
14
Yang dimaksud ekonomis disini ialah bahwa pelaksanaan tes
tersebut tidak membutuhkan ongkos atau biaya yang mahal, tenaga
yang banyak, dan waktu yang lama.
D. Penyusunan Kisi- Kisi Instrumen Tes Hasil Belajar Dan Dan Proses
Validasi Instrumen
15
Ada berbagai pendapat mengenai validitas untuk instrumen yang
digunakan pengukuran, baik di bidang pendidikan maupun psikologi.
W.James Popham (1995) mengatakan bahwa dua pertanyaan penting
sesuai dengan pembuatan tes antara lain 1. Apa yang harus tes (dinilai )
dalam hal ini meliputi cognitive, psikomotorik, dan afektif. Cognitif
berdasarkan taksonomi Bloom terdiri dari: pengetahuan, pemahaman,
aplikasi, analisis dan sintesis, 2. Bagaimana melakukan tes tersebut dalam
hal ini meliputi bentuk tes yang jawabanya dapat berupa pilihan berganda,
menjodohkan, benar–salah, uraian dan jawaban singkat serta bentuk
portofolio yang valid sehingga dapat memberikan informasi yang sesuai
dengan proses belajar- mengajar di kelas.
Validitas itu dapat dikelompokkan menjadi tiga tipe, yaitu: (1)
validitas kriteria (criterion-related), (2) validitas isi, dan (3) validitas
konstruk (Nunnally, 1978, Allen & Yen, 1979, Fernandes, 1984, Woolfolk
& McCane, 1984, Kerlinger, 1986, dan Lawrence, 1994). Validitas ini
dapat diketahui melalui fakta keberadaaan validitas. Sumber fakta validitas
dapat dikelompokkan menjadi isi tes, proses respons, struktur internal,
hubungan dengan variabel lain, dan konsekuensi dari pelaksanaan tes.
Keberadaan validitas dari suatu perangkat tes ini dapat diketahui melalui
analisis isi tes dan analisis empiris dari skor tes data respons butir.
Validitas berdasarkan kriteria dibedakan menjadi dua, yaitu validitas
prediktif dan validitas konkuren. Dalam analisis validitas prediktif,
performansi yang hendak diprediksikan disebut dengan kriteria. Besar
kecilnya harga estimasi validitas prediktif suatu instrument digambarkan
dengan koefisien korelasi antara prediktor dengan kriteria tersebut.
Validitas isi suatu instrumen adalah sejauhmana butir-butir dalam
instrumen itu mewakili komponen-komponen dalam keseluruhan kawasan
isi objek yang hendak diukur dan sejauh mana butir-butir itu
mencerminkan ciri perilaku yang hendak diukur (Nunnally, 1978;
Fernandes, 1984). Validitas isi itu keterwakilan pertanyaan terhadap
kemampuan khusus yang harus diukur. Berdasarkan hal ini, dapat
disimpulkan bahwa validitas isi terkait dengan analisis rasional terhadap
16
domain yang hendak diukur untuk mengetahui keterwakilan instrumen
dengan kemampuan yang hendak diukur. Validitas konstruk adalah
validitas yang menunjukkan sejauh mana instrumen mengungkap suatu
kemampuan atau konstruk teoretis tertentu yang hendak diukurnya
(Nunnally, 1978, Fernandes, 1984). Prosedur validasi konstruk diawali dari
suatu identifikasi dan batasan mengenai variabel yang hendak diukur dan
dinyatakan dalam bentuk konstruk logis berdasarkan teori mengenai
variabel tersebut. Dari teori ini ditarik suatu konskuensi praktis mengenai
hasil pengukuran pada kondisi tertentu, dan konskuensi inilah yang akan
diuji. Apabila hasilnya sesuai dengan harapan maka instrumen itu
dianggap memiliki validitas konstruk yang baik. Pada tes prestasi belajar,
validitas merupakan syarat yang sangat diperlukan dalam pengembangan
tes. Menurut pendapat Sireci yang didukung Lissitz & Samuelsen (2007),
validasi tes yang dipergunakan dalam dunia pendidikan sebaiknya
melibatkan analisis isi tes dan analisis empiris dari skor tes dan data
respons terhadap butir oleh peserta tes. Analisis isi tes terkait dengan
validitas isi yang selanjutnya diperlukan juga analisis empiris untuk
mengetahui validitas konstruk. Kedua analisis ini dimaksudkan agar tes di
dunia pendidikan memenuhi syarat tes yang standar.
17
V
Contoh
Pada pengembangan instrumen pengukuran, misalnya tes, dikembangkan
kisi-kisi dahulu dan butir perangkatnya, minimal memuat indikator, bentuk
instrumen/tes, kemudian butir soal, dan penskorannya (pada kasus ini
penskoran tidak dituliskan karena perlu tempat yang cukup banyak).
Kemudian kisi-kisi berikut butir instrumen diberikan kepada ahli untuk
divalidasi, dengan memberikan masukan terkait butir- butir instrumen
sekaligus mengisi kesesuaian butir dengan indikator. Contoh
pengembangan instrument sebagai berikut :
18
u
1 Menentukan PG 1 3 5‘
Bentuk . 625
hasil akar dari 25 1 3
. 625
bilangan Dapat disederhanakan 25 2
berpangkat menjadi …. 1
serta A. 5 4 / 3 2 3 54 2
5
pembagian B. 5 2 / 3 4
bilangan 1 3
C. 51 / 3 25
berpangkat 5 2
D. 5 2 / 3 4
2
E. 54 / 3 5 3
2
2
5 3
2
Saran :
2 Menentukan PG Bentuk 5’
hasil dari 1 1/ 3
3 / 2
2
.a : 2a 3 / 2
pemangkatan 4
bilangan dapat disederhanakan
berpangkat menjadi …. 2
serta A. 4a 1 / 6
pembagian 2
B. 2a 1 / 6
bilangan
C. 4a 1 / 2
berpangkat 2
D. 4a 1 / 6
E. 2a 2
= 2a
Saran :
19
No Skor Validasi Keterangan
1 2 3 4 5
Tidak Kurang Cukup Valid Sangat
Valid valid Valid Valid
1
2
3
4
5
6
7
8
9
10
20
1. Kisi-kisi Instrumen /Tes
Setelah tujuan tes ditetapkan, kegiatan berikuimya adalah menyusun kisi-
kisi tes. Kisi-kisi ini padadasarnya merupakan tabel matrik yang berisi
spesifikasi soal yang akan ditulis. Kisi-kisi berisi tentang tujuan, standar
kompetensi, kompetensi dasar, materi pokok, dan penilaian yang berisi
bentuk dan jenis tagihan. Standar kompetenssi dijabarkan menjadi
kompetensi dasar, kompetensi dasar dipecah menjadi beberapa iindikator,
dan dari indikator inilah dibuat butir-butir instrumen.
Ada tiga langkah yang harus dipenuhi untuk menulis kisi-kisi,
yaitu: 1) memilih standar kompetensi dasar, (2) memilih kompetensi dasar,
(3) menulis indikator, dan (4) menentukan bentuk tes. Secara garis besar,
ada dua bentuk tes yang banyak digunakan oleh guru, yaitu bentuk
obyektif dan bentuk uraian atau nonobyektif. Sudah barang tentu, masing-
masing bentuk tes memiliki kelebihan dan kekurangan.
2. Kisi-kisi Instrumen nontes
Penyusunan instrumen nontes didahului dengan penentuan definisi
konseptual, kemudian dijabarkan lagi kedefinisi operasional. Dari definisi
operasional ini kemudian dijabarkan menjadi beberapa indikator yang
selanjutnya dijabarkan menjadi butir-butir instrumen. Seperti yang telah
dijelaskan di muka, instrumen nontes ini dibedakan menjadi dua, yaitu
skala, angket, dan inventori. 7
Skala digunakan untuk mengukur konstruk atau konsep psikologis
seperti: sikap, minat, motivasi, pendapat, dan trait lainnya, sedangkan
angket digunakan untuk mengukur fakta, atau yang dianggap fakta seperti:
pendidikan terakhir, jumlah anggota, penghasilan setiap bulan, dll.
Sementara itu, inventori digunakan untuk mengungkap kepemilikan benda
nyata, seperti: jumlah kursi, jumlah meja, dll. Secara ringkas, hubungan
antara tujuan, metode dan instrumen yang digunakan pada Tabel berikut.
Tujuan untuk
Metode Instrumen yg digunakan
mengungkap:
- perilaku, kebiasaan, observasi, wawancara lembar observasi, lembar
21
ketrampilan mendalam penilaian, catatan, peneliti
sendiri
- potensi termasuk di tes, perintah mengerjakan soal tes, lembar perintah
dalamnya unjuk kerja dilengkapi dg lembar
observasi/ lembar penilaian
- afektif: motivasi, sikap, wawancara, survei pedoman wawancara, skala
minat , kesukaan, dll
- data pribadi, data nyata wawancara, survei angket, inventori,
- data yang lalu, data dokumentasi daftar dokumen
sekunder
22
3 tes sekali, kemudian
skor dibelah dua dan
diestimasi
Stabilitas Tes dua kali dengan soal Product moment dan korelasi
sama, kemudian hasilnya intra kelas
dikorelasikan.
Ekivalen Beri tes dua kali dengan Product moment dan korelasi
soal yang berbeda intra kelas
kemudian dikorelasikan
Tabel di atas menunjukkan bahwa untuk mengestimasi validitas
dan reliabilitas instrumen diiperlukan kerja yang sangat hati-hati, Harus
diupayakan agar proses dan estimasi ini dilaksanakan dengan sebaik-
baiknya
23
diklasifikasikan menurut bentuk, tipe dan ragamnya (Asmawi Zainul,
dkk :1997). Pengukuran adalah pemberian angka kepada suatu atribut atau
karakteristik tertentu yang dimiliki oleh orang, hal atau obyek tertentu
menurut aturan atau formulasi yang jelas. Karakteristik dari pengukuran
adalah penggunaan angka atau skala tertentu dan menggunakan aturan atau
formula tertentu (Asmawi Zainul, dkk :1997). Penilaian adalah suatu
proses untuk mengambil keputusan dengan menggunakan informasi yang
diperoleh melalui pengukuran hasil belajar, baik yang menggunakan
instrumen tes atau non tes.
Dengan kata lain, penilaian adalah pemberian nilai terhadap
kualitas sesuatu. Keterkaitan antara tes, pengukuran dan penilaian adalah
penilaian hasil belajar baru dapat dilakukan dengan baik dan benar bila
menggunakan informasi yang diperoleh melalui pengukuran hasil belajar
yang menggunakan tes sebagai alat ukurnya. Kegunaan tes, pengukuran
dan penilaian dalam pendidikan antara lain adalah untuk seleksi,
penempatan, diagnosa, remedial, umpan balik, memotivasi dan
membimbing, perbaikan kurikulum, program pendidikan serta
pengembangan ilmu.
Perencanaan dalam pengujian sangat penting karena tes baru akan
berarti bila terdiri dari butir-butir soal yang menguji tujuan yang penting
dan mewakili ranah pengetahuan, kemampuan dan keterampilan secara
representatif. Ada enam hal yang perlu dipertimbangkan dalam
perencanaan tes yaitu: pengambilan sampel dan pemilihan butir soal, tipe
tes yang akan digunakan, aspek yang akan diuji, format butir soal, jumlah
butir soal dan distribusi tingkat kesukaran butir soal (Asmawi Zainul, dkk
:1997).
24
Kelemahan butir soal tidak terletak pada bentuk atau tipe butir
soal, tetapi lebih banyak ditentukan oleh butir soal yang dikonstruksi
dengan baik atau tidak baik. Butir soal obyektif akan sama baiknya dengan
butir soal uraian untuk mengukur keberhasilan belajar yang dikonstruksi
secara baik. Bahkan dalam beberapa hal butir soal uraian jauh lebih besar
resikonya daripada butir soal obyektif. Hal ini disebabkan mutu butir soal
uraian tidak hanya terletak pada kemampuan siswa untuk menjawab soal
tersebut, tetapi lebih banyak ditentukan oleh kemampuan dan obyektifitas
pembuat soal dalam memberikan skor pada hasil tes tersebut. Butir soal
obyektif dapat dianalisa secara lebih akurat dan bertanggung jawab
sehingga dapat diketahui kelemahannya secara tepat. Butir soal tes
obyektif dapat digunakan berulang-ulang, asalkan tidak dalam perangkat
tes yang sama.
Oleh karena itu ada manfaat atau kegunaan analisis butir soal,
kemudian direvisi sehingga butir soal yang kurang baik konstruksinya
dapat diperbaiki. Akhirnya akan diperoleh butir soal yang telah teruji dan
secara akurat mengukur hasil belajar yang ingin diukur.
Ada beberapa alasan mengapa diperlukan analisis butir soal. Menurut
(Asmawi Zainul, dkk :1997) alasan tersebut antara lain :
1. Untuk mengetahui kekuatan dan kelemahan butir tes, sehingga dapat
dilakukan seleksi dan revisi butir soal.
2. Untuk menyediakan informasi tentang spesifikasi butir soal secara
lengkap, sehingga akan lebih memudahkan bagi pembuat soal dalam
menyusun perangkat soal yang akan memenuhi kebutuhan ujian dalam
bidang dan tingkat tertentu.
3. Untuk segera dapat mengetahui masalah yang terkandung dalam butir
soal, seperti: kemenduaan butir soal, kesalahan meletakkan kunci
jawaban, soal yang terlalu sukar dan terlalu mudah, atau soal yang
mempunyai daya beda rendah. Masalah ini bila diketahui dengan
segera akan memungkinkan bagi pembuat soal untuk mengambil
keputusan apakah butir soal yang bermasalah itu akan digugurkan atau
direvisi guna menentukan nilai peserta didik.
25
4. Untuk dijadikan alat guna menilai butir soal yang akan disimpan
dalam kumpulan soal. e. Untuk memperoleh informasi tentang butir
soal sehingga memungkinkan untuk menyusun beberapa perangkat
soal yang paralel. Penyusunan perangkat seperti ini sangat bermanfaat
bila akan melakukan ujian ulang atau mengukur kemampuan beberapa
kelompok peserta tes dalam waktu yang berbeda.
PEMBAHASAN
1. Deskripsi Analisis Butir Soal
Penilaian terhadap butir soal pada dasarnya merupakan analisis
butir soal, dan selama ini pada umumnya para ahli pengukuran
mengatakan bahwa analisis butir soal maksudnya adalah penilaian
terhadap soal. Telah diketahui bersama bahwa penyusunan tes sangat
mempengaruhi kualitas butir soal. Pendekatan untuk menganalisis butir
soal yang berkembang saat ini terdiri dari dua pendekatan yaitu
pendekatan klasik dan pendekatan modern. Kedua pendekatan ini masing-
masing memiliki kelebihan dan kekurangan. Namun keduanya masih
sering digunakan dalam analisis butir soal. Analisis butir soal dengan
pendekatan klasik diantaranya dapat dilakukan menggunakan Program
Iteman.
Dengan melihat beberapa persyaratan yang harus dipenuhi,
penyusunan tes dituntut untuk mengikuti pedoman penyusunan tes dan
melakukan ujicoba. Kemudian berdasarkan hasil ujicoba, respon peserta
dianalisis menggunakan Program Iteman untuk mendapatkan karakteristik
butir soal. Data hasil analisis dengan Program Iteman dianalisis kembali
menggunakan instrumen penilaian butir soal yang memenuhi syarat
sebagai alat ukur yang baik. Suryabrata (1999) menyatakan bahwa analisis
butir soal mencakup telaah soal atau analisis kualitatif dan analisis
terhadap data empirik hasil ujicoba atau analisis kuantitatif.
26
Analisis butir soal secara kualitatif menekankan penilaian dari
ketiga segi yaitu materi, konstruksi, dan bahasa. Namun demikian dalam
pembahasan ini dikhususkan untuk menjelaskan analisis butir soal secara
kuantitatif. Analisis ini dilakukan berdasarkan data yang diperoleh secara
empiris melalui ujicoba dari suatu perangkat tes. Analisis kuantitatif sering
disebut dengan analisis item yang menghasilkan karakteristik atau
parameter butir dan tes, yaitu: tingkat kesukaran, daya beda dan distribusi
jawaban dan kunci setiap butir, serta reliabilitas dan kesalahan pengukuran
(SEM) dalam tes. Telah disinggung di depan bahwa analisis soal antara
lain bertujuan untuk mengadakan identifikasi soal-soal yang baik, kurang
lebih atau sedang dan soal yang tidak baik. Dengan analisis soal dapat
diperoleh informasi tentang kekurangan sebuah soal tes dan “petunjuk”
untuk mengadakan perbaikan.
Dalam tes dan pengukuran, dikenal beberapa karakteristik butir
soal. Untuk tes hasil belajar pada umumnya dipertimbangkan tiga
karakteristik butir soal, yaitu : tingkat kesukaran, daya beda dan distribusi
jawaban atau berfungsi tidaknya pilihan jawaban (distraktor). Ketiga
karakteristik butir soal ini secara bersama-sama akan menentukan mutu
butir soal. Bila salah satu dari ketiga karakteristik ini tidak memenuhi
persyaratan maka mutu butir soal akan turun
.
27
1) Klik Star, pilih Program, pilih Accessories, pilih dan klik Notepad;
2) Simpan dengan klik file, pilih dan klik Save as, lalu tulis nama file
data, misalnya : IPA-1 (jangan lupa, paling banyak 8 huruf/angka);
3) Pemasukan akan lebih cepat jika dilakukan oleh dua orang, seorang
membaca jawaban siswa dan seorang menuliskan. Agar tidak keliru
antara jawaban b dan d, maka pembacaannya: a untuk a, be untuk b,
ce untuk c, del untuk d, dan e untuk e;
4) Jika dilakukan sendiri, letakkan jari tengah tangan kiri pada huruf A
dan jari telunjuk pada huruf D; jari telunjuk tangan kanan pada huruf
C dan jari tengah pada huruf B pada keyboard (papan ketik). Mata
melihat jawaban peserta tes, hasilnya akan lebih cepat;
5) Agar data tidak hilang saat listrik mati, maka sebentar-sebentar
disimpan dengan klik File dan klik Save; dan
6) Tampilan file data seperti terlihat pada halaman berikut.
28
Contoh: File Data
Jumlah soal
Jumlah angka dan tempat kosong
sebelum menuliskan jawaban siswa
035 O N 04
CACDABDACACDACADACADCDCCABACADBBABD
44444444444444444444444444444444444 Kunci jawaban soal
YYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYY
001 CACDOAOACOBCACAOBCOACDBCACOCDDBBOBO
002 CACDAADACACCACADACAACDCCABACADBBABD
003 CACDAADACACCADADACAACDCCABACCDBBABCJumlah option
004 CACDCADACACCADACACADODCCADACDDBBABA
005 CACDAADACACCACADACAACDCCABACADBBABD
006 CACDAADACBAOBCAAACODCAAAABAOODBABAB
Nomor urut siswa
007 CACDAADACBCDACADACCDCDCCADACDDBBACD
008 DACCADDACBCBACAAACAACDCCABACBDBBDAD
009 CACDDADCACCAACBDACADCDCCABACADBBABB
010 CACDAADACACBACABACADCDCCABACDDBBABA Siswa tidak menjawab,
011 CACDAADACACCACADACADCDCCABACADBBABD Tulis O
012 CACDAADACACDACADACAACDCCABACACBBABD
013 CADDAADACACCACADACADCDCCABACDDBBABD
014 CCADAADDACADDBACBBBDCDCAADACBDBBCBD
015 CABDAADACACDACADACADCDCCABACDDBBABD
016 CAADOADDABBDACADABBDBDCCCBACDBAACCB
Jawaban siswa
017 CACDAADACACCACADACADCDCCABACADBBABD
018 CACDAADACACDACADACADCDCCABACADBBCAD
019 CACCBADACACCACACACADCDCOADACBDBBBCA
020 CAADAABDCBABDBADDAADBACCADACDCDABCD
021 CACCAADACACDACABACADCDCCABADDDBAABD
022 CACDAADACACCACBDACBDCDCCADADDDBBACB
023 COCDABDACOOOOBAOOOOOAOCBAOOCADBBDOD
024 CACDAADACACCACADACADCDCCABACADBBABD Setelah menulis huruf terakhir,
025 CACDABDACOBBACAAACAABACAADACDCBCABD Ingat …… jangan di enter
026 CAABAADACDBBADDDAABCCAAAADACADBBDAB
027 CACDAADACACDACADACADCDCCADACADBBABD
028 CACDAADACACBACABACADODCCABACDABBABO
029 CACDAADACACDACADACADCDCCABACBDBBDCA
030 CACDBCDACABDABADDCADCDCCABACADBBABD
Gambar 1. Tampilan File Data Analisis Butir Soal dengan Iteman
29
b). Analisis Data
1) Buka Program Iteman, dengan klik Star, pilih Program, pilih dan klik
Iteman.
2) Isi nama file data, pada Enter the name of the input file: D:\IPA-1.txt lalu
tekan enter.
3) Isikan nama file hasil, pada Enter the name of the output file: D:\IPA-
1.has
4) lalu tekan enter.
5) Lalu muncul pertanyaan Do you want the scores written to a file? ( Y / N ).
6) maka tulislah Y dan tekan enter.
7) Isikan nama file skor, pada Enter the name of the score file: D:\IPA-1.skr
8) Lalu tekan enter, lalu enter terus sampai selesai.
9) Tampilannya seperti terlihat pada gambar berikut.
30
MicroCAT (tm) Testing System Page 1
Copyright(c) 1982, 1984, 1986, 1988, 1993 by Assessment Systems
Corporation
Item and Test Analysis Program -- ITEMAN (tm) Version 3.50
Scale: 0
------- Cek dulu, apakah jumlah soal dan
Type of Scale DICHOT jumlah peserta tes, sudah benar?
N of Items 35
N of Examinees 30
31
B .00 .00 .00
C .03 .13 .00 -.28
D .00 .00 .00
Other .03 .00 .00 -.31
32
d). Menafsirkan Hasil Analisis Butir Soal
33
0,000 - 0,400 Rendah Kurang baik
Reliabilitas soal 0,401 - 0,700 Sedang Cukup
0,701 - 1,000 Tinggi Baik
Dari hasil analisis butir soal di atas, dengan jumlah soal 35 butir dan sampel 30
orang, penafsiran terhadap beberapa soal tersebut antara lain seperti berikut.
Soal nomor 1, kunci jawabannya C, penafsirannya:
- Tingkat kesukaran butir soal (Prop.Corrrect) = 0,97 ; artinya butir soal ini
‘sangat mudah’ (p>0,90) karena 97 % dari peserta tes menjawab benar soal
ini.
- Daya bedanya (Biserial) = 0,05 ; artinya ‘butir soal ini mempunyai daya
beda yang ‘sangat rendah’ (D>0,20).
- Option (alternatif jawaban) A dan B tidak berfungsi sebagai pengecoh
(distraktor), maka alternatif jawaban A dan B perlu diperbaiki. Sesuai
kriteria pengecoh yang ‘baik’ jika dipilih oleh 0,011 - 0,050 (1,1% - 5%).
Soal nomor 2, kunci jawabannya A, penafsirannya:
- Tingkat kesukaran butir soal (Prop.Corrrect) ini = 0,93 ; artinya butir soal
ini ‘sangat mudah’ (p>0,90) karena dari 93% peserta tes, menjawab benar
soal ini.
- Daya bedanya (Biserial) = 0,42 ; artinya ‘butir soal ini mempunyai daya
beda yang ‘tinggi’ ( D>0,40 ).
- Option (alternatif jawaban) B dan D belum berfungsi sebagai pengecoh
(distraktor), karena tidak ada satu testee-pun yang memilihnya.
Soal nomor 6, kunci jawabannya B, penafsirannya:
- Analisis butir soal ini ada informasi ‘Check The Key, B was specified, A
works better, artinya kunci jawaban A bekerja lebih baik daripada kunci
jawaban yang telah ditentukan, yaitu B. Butir soal ini perlu dicek kembali,
terbukti daya beda butir soal ini menunjukkan angka -0,31 (daya beda
‘sangat rendah’ karena D<0,20). Ini artinya, pada siswa pandai tidak dapat
menjawab benar soal ini, tetapi siswa kurang pandai dapat menjawab
benar (karena kebetulan saja).
- Tingkat kesukaran butir soal ini = 0,07 ; artinya butir soal ini ‘sangat
sukar’ (p>0,10) karena kurang dari 10% dari peserta tes menjawab benar
soal ini.
- Option (alternatif jawaban) semua berfungsi sebagai pengecoh (distraktor),
karena semua alternatif jawaban soal ini ada memilih.
34
E). Resume Hasil Analisis, Sebaran Skor dan Penentuan Nilai
35
28 1 14 47 3 |###
29 3 17 57 10 |##########
30 3 20 67 10 +##########
31 1 21 70 3 |###
32 5 26 87 17 |#################
33 4 30 99 13 |#############
34 0 30 99 0 |
35 0 30 99 0 +
|----+----+----+----+----+
5 10 15 20 25
Percentage of Examinees
36
Scores for examinees from file D:\IPA-1.TXT
001 19.00
002 32.00
003 29.00
004 26.00
005 32.00
006 19.00
007 29.00
008 25.00
009 27.00
010 30.00
011 33.00
012 32.00
013 31.00
014 18.00
015 32.00
016 17.00
017 33.00
018 32.00
019 24.00
020 15.00
021 29.00
022 26.00
023 17.00
024 33.00
025 23.00
026 17.00
027 33.00
028 28.00
029 30.00
030 30.00
Skor di atas kita ubah menjadi nilai skala 10 dengan program MsExcel
37
DAFTAR PUSTAKA
8. Nunnally, J.C. 1978. Psychometric theory. New York: McGraw Hill Book
Company.
38
10. Saifuddin Azwar. 1996. Tes Prestasi. Yogyakarta: Pustaka Pelajar.
11. Subino, 1987. Konstruksi Dan Analisi Tes Suatu Pengantar Kepada Teori
Tes Dan Pengukuran. Jakarta: Depdikbud.
39