Anda di halaman 1dari 39

MAKALAH INSTRUMEN TES HASIL BELAJAR

Disusun untuk memenuhi tugas mata kuliah


Evaluasi dalam Pembelajaran Matematika
Yang diampu oleh dosen Dra. Ratnaningsih, M.Si

Oleh :
ARIF OKTAFIANTO (3136159241)
LOURENSIUS (3136159236)
YULISAR (3136159248)

PROGRAM PASCA SARJANA PENDIDIKAN MATEMATIKA


FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS NEGERI JAKARTA
2016

1
KATA PENGANTAR

Rasa syukur kami panjatkan ke hadirat Allah SWT yang telah


melimpahkan rahmat dan karunia-Nya sehingga makalah ini dapat diselesaikan.

Penyusunan makalah ini disesuaikan berkaitan dengan Instrumen tes hasil


belajar dari sumber-sumber yang didapat, sehingga mudah dipahami.

Dalam penyusunan makalah ini tidak lepas dari sumbangsih berupa pemikiran-
pemikiran/ gagasan dari teman-teman untuk menyempurnakan isi makalah ini.
Semoga makalah ini sangat bermanfaat bagi pembaca terutama bagi teman-teman
mahasiswa dalam mata kuliah Evaluasi dalam Pembelajaran Matematika.

Jakarta, Maret 2016

penulis

2
DAFTAR ISI

HALAMAN JUDUL …………………………...…………… i


KATA PENGANTAR ……………………………...………… ii
DAFTAR ISI ……………………………………...… iii

BAB I PENDAHULUAN
A. Latar belakang ……………………………………...… 4
B. Rumusan Masalah ……………………………………...… 4
C. Tujuan Masalah ……………………………………...… 5
D. Manfaat ……………………………………...… 5

BAB II PEMBAHASAN
A. Pengertian Tes Hasil Belajar ............……...................... 6
B. Bentuk Tes Hasil Belajar .............................................7
C. Ciri-ciri Tes yang Baik ................................................ 14
D. Penyusunan Kisi- Kisi Instrumen Tes Hasil Belajar Dan
Proses Validasi Instrumen ............................................... 16
E. Analisis Butir Soal ....................................... 24

DAFTAR PUSTAKA …………………………………… 38

3
BAB 1
PENDAHULUAN

A. Latar belakang

Setiap kegiatan belajar harus diketahui sejauh mana proses belajar


tersebut telah memberikan kemampuan bagi siswa. Salah satu cara untuk
melihat peningkatan kemampuan tersebut adalah dengan melakukan tes
hasil belajar. Tes hasil belajar merupakan salah satu bentuk yang
digunakan untuk mengukur perkembangan belajar siswa setelah mengikuti
proses pembelajaran.
Sebagai pendidik yang professional, maka sebaiknya mengetahui
penyusunan dan pengembangan tes hasil belajar yang baik dan benar
sehingga tes dapat berfungsi dengan sebaik-baiknya. Dalam menyusun dan
mengembangkan tes hasil belajar matematika terdapat hal-hal yang harus
diperhatikan sehingga pendidik dapat mengukur tujuan instruksional
khusus pada pembelajaran matematika dan memberikan informasi
mengenai keberhasilan belajar siswa.
Dalam makalah ini akan dibahas mengenai bentuk tes hasil belajar,
penyusunan kisi-kisi instrumen tes hasil belajar dan proses validasi
instrumen, serta analisis butir instrumen tes hasil belajar dengan itemen.
Oleh karena itu, kita sebagai pendidik bisa melakukan evaluasi
pembelajaran dengan menyusun tes yang valid dan bisa mengukur
kemampuan peserta didik.

B. Rumusan Masalah
Dari uraian latar belakang diatas, permasalahan yang ingin dicari
solusinya adalah adalah sebagai berikut:
1. Apa saja bentuk tes hasil belajar?
2. Bagaimana penyusunan kisi-kisi instrumen tes hasil
belajar?
3. Bagaimana proses validasi instrumen?
4. Bagaimana analisis butir instrumen tes hasil belajar
dengan itemen?

4
C. Tujuan Masalah
Tujuan dari penulisan makalah ini adalah sebagai berikut:
1. Mengetahui bentuk tes hasil belajar
2. Mengetahui penyusunan kisi-kisi instrumen tes hasil belajar
3. Mengetahui proses validasi instrumen
4. Mengetahui analisis butir instrumen tes hasil belajar dengan itemen

D. Manfaat
Manfaat yang ingin dicapai dari penulisan makalah ini adalah bagi
mahasiswa dapat dijadikan panduan dalam mengikuti mata kuliah Evaluasi
dalam Pembelajaran Matematika dan yang ingin menyusun atau
mengembangkan instrumen tes hasil belajar.

BAB II

PEMBAHASAN

5
A. Pengertian Tes Hasil Belajar
Kata tes berasal dari bahasa Prancis kuno yang berarti piring untuk
menyisihkan logam-logam mulia, yang dimaksud disini adalah dengan
menggunakan alat berupa piring akan dapat diperoleh jenis-jenis logam
mulia yang bernilai tinggi. Dalam perkembangannya dan seiirng kemujuan
zaman tes berarti ujian atau percobaan. Ada beberapa istilah yang
memerlukan penjelasan sehubungan dengan uraian diatas yaitu tes, testing,
tester dan testee, yang masing-masing mempunyai pengertian berbeda
namun erat kaitannya dengan tes. Subino (1987: 79).
1. Tes adalah alat atau prosedur yang dipergunakan dalam rangka
pengukuran dan penilaian,
2. Testing berarti saat dilaksanakannya pengukuran dan penilaian atau
saat pengambilan tes
3. Tester artinya orang yang melaksanakan tes atau orang yang diserahi
untuk melaksanakan pengambilan tes terhadap para responden
4. Testee adalah pihak yang sedang dikenai tes.
Ada beberapa pendapat dari beberapa ahli tentang pengertian tes,
menurut Anne Anastasi dalam karya tulisnya yang berjudul Psychological
Testing, yang dimaksud dengan tes adalah alat pengukur yang mempunyai
standar yang obyektif sehingga dapat digunakan secara meluas, serta dapat
digunakan sebagai cara untuk mengukur dan membandingkan keadaan
pskis atau tingklah laku individu. Menurut Lee J. Cronbach dalam
bukunya berjudul Essential of Psychological Testing, tes merupakan suatu
perosedur yang sistematis untuk membandingkan tingkah laku dua orang
atau lebih. Sedangkan menurut Goodenough, tes adalah suatu tugas atau
serangkaian tugas yang diberikan kepada individu atau kelompok, yang
dimaksud untuk membandingkan kecakapan satu sama lain.
Dari pengertian dari para ahli tersebut dalam dunia pendidikan
dapat disimpulkan bahwa pengertian tes adalah cara yang digunakan atau
prosedur yang ditempuh dalam rangka pengukuran dan penilaian di bidang
pendidikan, yang memberikan tugas dan serangkaian tugas yang diberikan

6
oleh guru sehingga dapat dihasilkan nilai yang melambangkan tingkah
laku atau prestasi peserta didik.
Suatu tes akan berisiskan pertanyaan-pertanyaan dan atau soal-soal
yang harus dijawab dan atau dipecahkan oleh individu yang dites (testee),
maka disebut tes hasil belajar (achievement test). Tes hasil belajar
biasanya terdiri dari sejumlah butir soal yang memiliki tingkat kesukaran
tertentu (ada yang mudah, sedang, dan sukar). Tes tersebut harus dapat
dikerjakan oleh siswa dalam waktu yang sudah ditentukan. Oleh karena
itu, tes hasil belajar merupakan power test. Maksudnya adalah mengukur
kemampuan siswa dalam menjawab pertanyaan atau permasalahan.

B. Bentuk Tes Hasil Belajar


Tes merupakan serangkaian soal yang harus dijawab oleh siswa.
Dalam hal ini, tes hasil belajar dapat digolongkan kedalam beberapa
kategori sebagai berikut:
1. Berdasarkan bentuk pelaksanaanya, yaitu:
a. Tes lisan
Tes lisan dilakukan dengan pembicaraan atau wawancara tatap
muka antara guru dan murid.
b. Tes tulisan
Tes tertulis dalam pelaksanaannya lebih menekankan pada
penggunaan kertas dan pencil sebagai instrumen utamanya,
sehingga tes mengerjakan soal atau jawaban ujian pada kertas ujian
secara tertulis, baik dengan tulisan tangan maupun menggunakan
komputer.
c. Tes tindakan atau perbuatan. Tes perbuatan mengacu pada proses
penampilan seseorang dalam melakukan sesuatu unit kerja. Tes
perbuatan mengutamakan pelaksanaan perbuatan peserta didik.

2. Dari segi bentuk soal dan kemungkinan jawabannya tes, yaitu:

7
a. Tes Essay (uraian)
Tes Essay adalah tes yang disusun dalam bentuk pertanyaan
terstruktur dan siswa menyusun, mengorganisasikan sendiri jawaban
tiap pertanyaan itu dengan bahasa sendiri. Tes essay ini sangat
bermanfaat untuk mengembangkan kemampuan dalam menjelaskan
atau mengungkapkan suatu pendapat dalam bahasa sendiri.
Subino, (1987:94) menyatakan bahwa berdasarkan tingkat
kebebasan jawaban yang dimungkinkan dalam tes bentuk uraian,
butir-butir soal dalam ini dapat dibedakan atas butir-butir soal yang
menuntut jawaban bebas. Butir-butir soal dengan jawaban terikat
cenderung akan membatasi, baik isi maupun bentuk jawaban;
sedangkan butir soal dengan jawaban bebas cenderung tidak
membatasi, baik isi maupun jawaban.
Kebaikan atau keuntungan penggunaan tes uraian antara lain:
1) Dapat mengukur hasil belajar yang kompleks, yang tidak dapat
diukur dengan tes atau cara yang lain.
2) Dapat mengukur perpaduan dan aplikasi tentang keterampilan
berpikir dan keterampilan memecahkan masalah.
3) Mudah disusun (dibuat)

Keburukan atau kelemahan penggunaan tes bentuk uraian antara


lain:
1) Memiliki keterbatasan akibat tidak konsistensinya penyekoran.
2) Memerlukan banyak waktu untuk menilai jawaban.
3) Sampling yang diukur terbatas.

Saran dan petunjuk untuk menyusun pertanyaan essay, antara lain:


1) Hendaknya tes ini digunakan untuk mengukur hasil belajar yang
tidak dapat diukur tes objektif.
2) Rumuskan pertanyaan sehingga dapat mengukur tingkah laku
dengan tepat sesuai dengan hasil belajar.
3) Pertanyaan harus jelas sehingga tidak memunculkan

8
interprestasi yang bermacam-macam.

Petunjuk untuk menyekor pertanyaan essay, adalah:


1) Siapkan outline jawaban
2) Gunakan cara/metode menyekor yang lebih tepat
a) Point method
b) Rating method
3) Nilailah semua jawaban untuk satu pertanyaan sebelum
dilanjutkan ke pertanyaan berikutnya.

b. Tes Objektif
Tes objektif adalah tes yang disusun sedemikian rupa dan
telah disediakan alternatif jawabannya. Tes ini terdiri dari berbagai
macam bentuk, antara lain ;
1. Tes objektif bentuk benar-salah (true-false test)
2. Tes objektif bentuk menjodohkan (matching test)
3. Tes objektif bentuk jawaban singkat (short answer)
4. Tes objektif bentuk pilihan ganda (multipel choice item test)

1) Tes objektif benar-salah (true-false test)


Tes obyektif bentuk True-false merupakan salah satu bentuk tes
obyektif dimana butir-butir soal yang diajukan dalam test hasil
belajar berupa pernyataan (pernyataan dimana ada yang benar dan
ada yang salah).
Keunggulan tes obyektif bentuk benar-salah (true-false test)
a) Mudah dalam menyusun/pembuatannya mudah
b) Dapat digunakan berulang kali
c) Tidak terlalu banyak memakan lembaran kertas/tempat karena
biasanya pertanyaan-pertanyaannya singkat saja
d) Mampu mencakup bahan pelajaran yang luas
e) Bagi testee, cara mengerjakannya mudah
f) Bagi tester, cara mengkoreksinya juga mudah

9
Kelemahan tes obyektif bentuk benar-salah (true-false test)
a) Mudah ditebak dan diduga
b) Membuka peluang bagi testee untuk berspekulasi dalam
memberikan jawaban
c) Sifatnya terbatas, dalam arti bahwa tes tersebut hanya dapat
mengungkap daya ingat dan pengenalan kembali, jadi lebih
bersifat hafalan
d) Umumnya tes obyektif jenis ini reliabilitasnya rendah, kecuali
apabila butir-butir soalnya dibuat dalam jumlah yang banyak
sekali
e) Dapat terjadi bahwa butir-butir soal tes objektif ini tidak dapat
dijawab dengan dua kemungkinan saja, yaitu betul atau salah

2). Tes Menjodohkan (Matching Test):


Sering dikenal dengan istilah tes menjodohkan, tes mencari
pasangan, tes menyesuaikan, tes mencocokkan dan tes
mempertandingkan. Matching test terdiri atas satu seri pertanyaan
dan satu seri jawaban. Masing-masing pertanyaan mempunyai
jawabnya yang tercantum dalam seri jawaban.
Keunggulan tes obyektif bentuk menjodohkan (Matching Test):
 Pembuatannya mudah
 Dapat dinilai dengan mudah, cepat, dan obyektif
 Apabila tes ini dibuat dengan baik, maka faktor menebak praktis
dapat dhilangkan
Kelemahan tes obyektif bentuk menjodohkan (Matching Test):
 Cenderung lebih banyak mengungkap aspek hafalan atau daya
ingat saja
 Karena mudah disusun, maka tes ini kadang dijadikan pelarian
bagi pengajar, yaitu digunakan apabila pengajar tidak sempat
lagi untuk membuat tes bentuk lain
 Tes jenis ini kurang baik untuk mengevaluasi pengertian dan
kemampuan membuat tafsiran (interpretasi)

10
3). Tes Jawaban Singkat (Short Answer)
Keuntungan tes jawaban singkat antara lain:
 Lebih mudah disusun, karena hasil belajar yang diukur relatif
sederhana
 Siswa diminta hanya memberi jawaban
Keterbatasan tes jawaban singkat antara lain:
 Tidak cocok untuk mengukur hasil belajar yang kompleks

4). Tes Pilihan Berganda (multipel choice item test)


Multiple choice test terdiri atas suatu pertanyaan atau keterangan
tentang suatu pengertian yang belum lengkap, dan untuk
melengkapinya harus memilih satu dari beberapa kemungkinan
jawaban yang telah disediakan. Atau dengan kata lain, multiple
choice test terdiri atas bagian keterangan (stem) dan bagian
kemungkinan jawaban atau alternative (option). Kemungkinan
jawaban terdiri atas satu jawaban yang benar (sebagai kunci
jawaban) dan beberapa pengecoh (distractor), Arikunto (2006:168).
Contoh soal multiple Choice item, sebagai berikut:
a) Model melengkapi empat/lima pilihan
b) Model melengkapi berganda
Contoh:
Tulislah: A. Bila (1), (2), dan (3) betul
B. Bila (1) dan (3) betul
C. Bila (2) dan (4) betul
D. Bila hanya (4) yang betul
E. Bila semuanya betul

c) Model analisis hubungan antar hal


Contoh:

11
A. Jika pernyataan betul, alasan betul, dan keduanya
menunjukkan hubungan sebab-akibat
B. Jika pernyataan betul, alasan betul, tetapi keduanya
tidak menunjukkan hubungan sebab-akibat
C. Jika pernyataan betul dan alasan salah
D. Jika pernyataan salah dan alasan betul
E. Jika pernyataan salah dan alasan sala

Keunggulan tes Pilihan Ganda:


 Sifatnya lebih representatif dalam hal mencakup atau mewakili
materi yang telah diajarkan kepada peserta didik
 Memungkinkan bagi tester untuk bertindak lebih obyektif
 Lebih mudah dan cepat dalam mengoreksi
 Memberi kemungkinan orang lain untuk ditugasi/dimintai
bantuan mengoreksi hasil tes tersebut
 Butir soal pada tes obyektif jauh lebih mudah dianalisis
 Sangat tepat untuk ujian yang peserta banyak sedangkan
hasilnya harus segera seperti ujian akhir nasional maupun ujian
sekolah.

Kelemahan tes bentuk Pilihan Ganda:


 Menyusun butir tes obyektif tidak semudah menyusun tes uraian
 Umumnya kurang dapat mengukur proses berpikir yang lebih
tinggi atau mendalam
 Terbuka bagi testee untuk bermain spekulasi

3. Dilihat dari sudut waktu kapan dan untuk apa tes itu dilakukan, yaitu:
a. Tes awal (pretest),
b. Tes akhir (posttest),

4. Dari segi fungsi tes di sekolah, tes dibedakan menjadi :


a. Tes Formatif

12
Tes Formatif, yaitu tes yang diberikan untuk memonitor kemajuan
belajar selama proses pembelajaran berlangsung. Tes ini diberikan
dalam tiap satuan unit pembelajaran. Manfaat tes formatif bagi
peserta didik adalah :
Untuk mengetahui apakah peserta didik sudah menguasai materi
dalam tiap unit pembelajaran. Merupakan penguatan bagi peserta
didik.
Merupakan usaha perbaikan bagi siswa, karena dengan tes formatif
peserta didik mengetahui kelemahan-kelemahan yang dimilikinya.
Peserta didik dapat mengetahui bagian dari bahan yang mana yang
belum dikuasainya.
b. Tes Summatif
Tes sumatif diberikan dengan maksud untuk mengetahui
penguasaan atau pencapaian peserta didik dalam bidang tertentu.
Tes sumatif dilaksanakan pada tengah atau akhir semester.
c. Tes Penempatan
Tes penempatan adalah tes yang diberikan dalam rangka
menentukan jurusan yang akan dimasuki peserta didik atau
kelompok mana yang paling baik ditempati atau dimasuki peserta
didik dalam belajar.
d. Tes Diagnostik
Tes diagnostik adalah tes yang digunakan untuk mendiagosis
penyebab kesulitan yang dihadapi seseorang baik dari segi
intelektual, emosi, fisik dan lain-lain yang mengganggu kegiatan
belajarnya.

C. Ciri-ciri tes yang baik

13
Menurut arikonto (2006:42), Sebuah tes yang dapat dikatakan baik
sebagai alat pengukur harus memilki persyaratan tes, yaitu memiliki:
1. Validitas
Sebuah tes disebut valid apabila tes tersebut dapat tepat
mengukur apa yang hendak diukur. Contoh, untuk mengukur
partisipasi siswa dalam proses belajar mengajar, bukan diukur melalui
nilai yang diperoleh pada waktu ulangan, tetapi dilihat melalui:
kehadiran, terpusatnya perhatian pada pelajaran, ketepatan menjawab
pertanyaan-pertanyaan yang diajukan oleh guru dalam arti relevan
pada permasalahannya.
2. Reliabilitas
Berasal dari kata asal reliable yang artinya dapat dipercaya.
Tes dapat dikatakan dapat dipercaya jika memberikan hasil yang tetap
apabila diteskan berkali-kali. Sebuah tes dikatakan reliabel apabila
hasil-hasil tes tersebut menunjukan ketetapan. Jika dihubungkan
dengan validitas, maka: Validitas adalah ketepatan dan reliabilitas
adalah ketetapan.
3. Objektivitas
Sebuah dikatakan memiliki objektivitas apabila dalam
melaksanakan tes itu tidak ada faktor subjektif yang mempengaruhi.
hal ini terutama terjadi pada sistem scoringnya. Apabila dikaitkan
dengan reliabilitas maka objektivitas menekankan ketetapan pada
sistem scoringnya, sedangkan reliabilitas menekankan ketetapan
dalam hasil tes.
4. Praktikabilitas
Sebuah tes dikatakan memiliki praktibilitas yang tinggi
apabila tes tersebut bersifat praktis dan mudah pengadministrasiannya.
tes yang baik adalah yang mudah dilaksanakan, mudah
pemeriksaannya, dan dilengkapi dengan petunjuk-petunjuk yang jelas.

5. Ekonomis

14
Yang dimaksud ekonomis disini ialah bahwa pelaksanaan tes
tersebut tidak membutuhkan ongkos atau biaya yang mahal, tenaga
yang banyak, dan waktu yang lama.

D. Penyusunan Kisi- Kisi Instrumen Tes Hasil Belajar Dan Dan Proses
Validasi Instrumen

15
Ada berbagai pendapat mengenai validitas untuk instrumen yang
digunakan pengukuran, baik di bidang pendidikan maupun psikologi.
W.James Popham (1995) mengatakan bahwa dua pertanyaan penting
sesuai dengan pembuatan tes antara lain 1. Apa yang harus tes (dinilai )
dalam hal ini meliputi cognitive, psikomotorik, dan afektif. Cognitif
berdasarkan taksonomi Bloom terdiri dari: pengetahuan, pemahaman,
aplikasi, analisis dan sintesis, 2. Bagaimana melakukan tes tersebut dalam
hal ini meliputi bentuk tes yang jawabanya dapat berupa pilihan berganda,
menjodohkan, benar–salah, uraian dan jawaban singkat serta bentuk
portofolio yang valid sehingga dapat memberikan informasi yang sesuai
dengan proses belajar- mengajar di kelas.
Validitas itu dapat dikelompokkan menjadi tiga tipe, yaitu: (1)
validitas kriteria (criterion-related), (2) validitas isi, dan (3) validitas
konstruk (Nunnally, 1978, Allen & Yen, 1979, Fernandes, 1984, Woolfolk
& McCane, 1984, Kerlinger, 1986, dan Lawrence, 1994). Validitas ini
dapat diketahui melalui fakta keberadaaan validitas. Sumber fakta validitas
dapat dikelompokkan menjadi isi tes, proses respons, struktur internal,
hubungan dengan variabel lain, dan konsekuensi dari pelaksanaan tes.
Keberadaan validitas dari suatu perangkat tes ini dapat diketahui melalui
analisis isi tes dan analisis empiris dari skor tes data respons butir.
Validitas berdasarkan kriteria dibedakan menjadi dua, yaitu validitas
prediktif dan validitas konkuren. Dalam analisis validitas prediktif,
performansi yang hendak diprediksikan disebut dengan kriteria. Besar
kecilnya harga estimasi validitas prediktif suatu instrument digambarkan
dengan koefisien korelasi antara prediktor dengan kriteria tersebut.
Validitas isi suatu instrumen adalah sejauhmana butir-butir dalam
instrumen itu mewakili komponen-komponen dalam keseluruhan kawasan
isi objek yang hendak diukur dan sejauh mana butir-butir itu
mencerminkan ciri perilaku yang hendak diukur (Nunnally, 1978;
Fernandes, 1984). Validitas isi itu keterwakilan pertanyaan terhadap
kemampuan khusus yang harus diukur. Berdasarkan hal ini, dapat
disimpulkan bahwa validitas isi terkait dengan analisis rasional terhadap

16
domain yang hendak diukur untuk mengetahui keterwakilan instrumen
dengan kemampuan yang hendak diukur. Validitas konstruk adalah
validitas yang menunjukkan sejauh mana instrumen mengungkap suatu
kemampuan atau konstruk teoretis tertentu yang hendak diukurnya
(Nunnally, 1978, Fernandes, 1984). Prosedur validasi konstruk diawali dari
suatu identifikasi dan batasan mengenai variabel yang hendak diukur dan
dinyatakan dalam bentuk konstruk logis berdasarkan teori mengenai
variabel tersebut. Dari teori ini ditarik suatu konskuensi praktis mengenai
hasil pengukuran pada kondisi tertentu, dan konskuensi inilah yang akan
diuji. Apabila hasilnya sesuai dengan harapan maka instrumen itu
dianggap memiliki validitas konstruk yang baik. Pada tes prestasi belajar,
validitas merupakan syarat yang sangat diperlukan dalam pengembangan
tes. Menurut pendapat Sireci yang didukung Lissitz & Samuelsen (2007),
validasi tes yang dipergunakan dalam dunia pendidikan sebaiknya
melibatkan analisis isi tes dan analisis empiris dari skor tes dan data
respons terhadap butir oleh peserta tes. Analisis isi tes terkait dengan
validitas isi yang selanjutnya diperlukan juga analisis empiris untuk
mengetahui validitas konstruk. Kedua analisis ini dimaksudkan agar tes di
dunia pendidikan memenuhi syarat tes yang standar.

Membuktikan Validitas Isi


Validitas isi ditentukan menggunakan kesepakatan ahli. Kesepakatan ahli
bidang studi atau sering disebut dengan domain yang diukur menentukan
tingkatan validitas isi (content related). Hal ini dikarenakan instrumen
pengukuran, misalnya berupa tes atau angket dibuktikan valid jika ahli
(expert) meyakini bahwa istrumen tersebut mengukur penguasaan
kemampuan yang didefinisikan dalam domain ataupun juga konstruk
psikologi yang diukur. Untuk mengetahui kesepakatan ini, dapat
digunakan indeks validitas, diantaranya dengan indeks yang diusulkan
oleh Aiken (1980; 1985). Indeks validitas butir yang diusulkan Aiken ini
dirumuskan sebagai berikut:

17
V

S = skor yang ditetapkan oleh validator


n= Banyaknya Validator
c = Banyakya kategori yang dipilih validator
dengan V adalah indeks validitas butir; s skor yang ditetapkan setiap rater
dikurangi skor terendah dalam kategori yang dipakai (s = r – l o, dengan r =
skor kategori pilihan rater dan lo skor terendah dalam kategori
penyekoran); n banyaknya rater; dan c banyaknya kategori yang dapat
dipilih rater. Berdasarkan pendapat tersebut, V merupakan indeks
kesepakatan rater terhadap kesesuaian butir (atau sesuai tidaknya butir)
dengan indikator yang ingin diukur menggunakan butir tersebut. Jika
diterapkan untuk instrument pengukuran, menurut seorang rater maka n
dapat digantidengan m (banyaknya butir dalam satu instrumen). Indeks V
ini nilainya berkisar diantara 0-1.Contoh membuktikan validitas isi dari
instrumenyang disajikan pada contoh berikut.

Contoh
Pada pengembangan instrumen pengukuran, misalnya tes, dikembangkan
kisi-kisi dahulu dan butir perangkatnya, minimal memuat indikator, bentuk
instrumen/tes, kemudian butir soal, dan penskorannya (pada kasus ini
penskoran tidak dituliskan karena perlu tempat yang cukup banyak).
Kemudian kisi-kisi berikut butir instrumen diberikan kepada ahli untuk
divalidasi, dengan memberikan masukan terkait butir- butir instrumen
sekaligus mengisi kesesuaian butir dengan indikator. Contoh
pengembangan instrument sebagai berikut :

No Indikator Bentuk Butir Kunci Jawaban Score Wakt

18
u
1 Menentukan PG 1 3 5‘
Bentuk . 625
hasil akar dari 25 1 3
 . 625
bilangan Dapat disederhanakan 25 2
berpangkat menjadi …. 1
serta A. 5 4 / 3  2 3 54 2
5
pembagian B. 5 2 / 3 4
bilangan 1 3
C. 51 / 3  25
berpangkat 5 2
D. 5 2 / 3 4
2
E. 54 / 3 5 3
2
2

5 3
2
Saran :

2 Menentukan PG Bentuk 5’
hasil dari  1 1/ 3 
3 / 2
2
 .a  : 2a 3 / 2
pemangkatan  4 
bilangan dapat disederhanakan
berpangkat menjadi …. 2
serta A. 4a 1 / 6
pembagian 2
B. 2a 1 / 6
bilangan
C. 4a 1 / 2
berpangkat 2
D. 4a 1 / 6
E. 2a 2

= 2a
Saran :

Contoh format penilaian oleh ahli untuk mengetahui kesesuaian butir


Format Penilaian Ahli untuk mengetahui kesesuaian butir

19
No Skor Validasi Keterangan
1 2 3 4 5
Tidak Kurang Cukup Valid Sangat
Valid valid Valid Valid
1
2
3
4
5
6
7
8
9
10

Contoh hasil tabulasi dari 3 validator untuk soal diatas


No Validator 1 Validator 2 Validator 3
Butir
1 3 2 3
2 4 3 3
3 4 3 5
4 5 3 3
5 4 4 3
6 3 4 4
7 4 5 4
8 4 4 4
9 3 4 4
10 4 4 3

Contoh Hasil Menghitung Indeks Kesepakatan Ahli pada soal diatas


No Validator Validator Validator
Butir 1 2 3 S1 S2 S3 ∑S V
1 3 2 3 2 1 2 5 0.42
2 4 3 3 3 2 2 7 0.58
3 4 3 5 3 2 4 9 0.75
4 5 3 3 4 2 2 8 0.67
5 4 4 3 3 3 2 8 0.67
6 3 4 4 2 3 3 8 0.67
7 4 5 4 3 4 3 10 0.83
8 4 4 4 3 3 3 9 0.75
9 3 4 4 2 3 3 8 0.67
10 4 4 3 3 3 2 8 0.67

Secara rinci penyusunan kisi-kisi Instrumen Tes dan Non Tes


adalah sebagai berikut :

20
1. Kisi-kisi Instrumen /Tes
Setelah tujuan tes ditetapkan, kegiatan berikuimya adalah menyusun kisi-
kisi tes. Kisi-kisi ini padadasarnya merupakan tabel matrik yang berisi
spesifikasi soal yang akan ditulis. Kisi-kisi berisi tentang tujuan, standar
kompetensi, kompetensi dasar, materi pokok, dan penilaian yang berisi
bentuk dan jenis tagihan. Standar kompetenssi dijabarkan menjadi
kompetensi dasar, kompetensi dasar dipecah menjadi beberapa iindikator,
dan dari indikator inilah dibuat butir-butir instrumen.
Ada tiga langkah yang harus dipenuhi untuk menulis kisi-kisi,
yaitu: 1) memilih standar kompetensi dasar, (2) memilih kompetensi dasar,
(3) menulis indikator, dan (4) menentukan bentuk tes. Secara garis besar,
ada dua bentuk tes yang banyak digunakan oleh guru, yaitu bentuk
obyektif dan bentuk uraian atau nonobyektif. Sudah barang tentu, masing-
masing bentuk tes memiliki kelebihan dan kekurangan.
2. Kisi-kisi Instrumen nontes
Penyusunan instrumen nontes didahului dengan penentuan definisi
konseptual, kemudian dijabarkan lagi kedefinisi operasional. Dari definisi
operasional ini kemudian dijabarkan menjadi beberapa indikator yang
selanjutnya dijabarkan menjadi butir-butir instrumen. Seperti yang telah
dijelaskan di muka, instrumen nontes ini dibedakan menjadi dua, yaitu
skala, angket, dan inventori. 7
Skala digunakan untuk mengukur konstruk atau konsep psikologis
seperti: sikap, minat, motivasi, pendapat, dan trait lainnya, sedangkan
angket digunakan untuk mengukur fakta, atau yang dianggap fakta seperti:
pendidikan terakhir, jumlah anggota, penghasilan setiap bulan, dll.
Sementara itu, inventori digunakan untuk mengungkap kepemilikan benda
nyata, seperti: jumlah kursi, jumlah meja, dll. Secara ringkas, hubungan
antara tujuan, metode dan instrumen yang digunakan pada Tabel berikut.

Tujuan untuk
Metode Instrumen yg digunakan
mengungkap:
- perilaku, kebiasaan, observasi, wawancara lembar observasi, lembar

21
ketrampilan mendalam penilaian, catatan, peneliti
sendiri
- potensi termasuk di tes, perintah mengerjakan soal tes, lembar perintah
dalamnya unjuk kerja dilengkapi dg lembar
observasi/ lembar penilaian
- afektif: motivasi, sikap, wawancara, survei pedoman wawancara, skala
minat , kesukaan, dll
- data pribadi, data nyata wawancara, survei angket, inventori,
- data yang lalu, data dokumentasi daftar dokumen
sekunder

Tabel di atas menjelaskan bahwa metode dan instrumen yang


digunakan harus mengacu pada tujuan pengukuran. Hal ini penting agar
tidak terjadi kesalahan pengukuran.
Di muka telah dijelaskan pengertian dan jenis validitas dan
reliabilitas instrumen. Secara ringkas cara memvalidasi dan mengestimasi
reliabilitas instrumen dapat dilihat pada instrumen berikut.

Jenis Validitas Cara Memvalidasi Keterangan


Validitas isi: validitas -tanpa menggunakan teknik
kurikulum, validitas - menggunakan kisi-kisi statistik
tampang - konsultasi keahlinya

Validitas kriteria terkait -mengkorelasikan dengan Korelasi product moment


atau validitas empirik: data di masa datang
validitas prediktif, validitas
konkuren
Validitas konstruk: -mengkorelasikan skor - analisis faktor
validitas faktor butir dengan total - product moment
-analisis butir

Jenis Reliabilitas Prosedur Teknik yang dipakai


Internal Consistency: 1 dan 2, tes satu kali, 1. Koef. Alpha
1. data ordinal kemudian dianalisis atau 2. KR 20, KR 21
2. data nominal diestimasi reliabilitasnya 3. Spearman Brown

22
3 tes sekali, kemudian
skor dibelah dua dan
diestimasi
Stabilitas Tes dua kali dengan soal Product moment dan korelasi
sama, kemudian hasilnya intra kelas
dikorelasikan.
Ekivalen Beri tes dua kali dengan Product moment dan korelasi
soal yang berbeda intra kelas
kemudian dikorelasikan
Tabel di atas menunjukkan bahwa untuk mengestimasi validitas
dan reliabilitas instrumen diiperlukan kerja yang sangat hati-hati, Harus
diupayakan agar proses dan estimasi ini dilaksanakan dengan sebaik-
baiknya

E. ANALISIS BUTIR SOAL


Tes adalah suatu pernyataan, tugas atau seperangkat tugas yang
direncanakan untuk memperoleh informasi tentang trait atau atribut
pendidikan dan psikologi. Setiap butir pertanyaan atau tugas tersebut
mempunyai jawaban atau ketentuan yang dianggap benar. Tes dapat

23
diklasifikasikan menurut bentuk, tipe dan ragamnya (Asmawi Zainul,
dkk :1997). Pengukuran adalah pemberian angka kepada suatu atribut atau
karakteristik tertentu yang dimiliki oleh orang, hal atau obyek tertentu
menurut aturan atau formulasi yang jelas. Karakteristik dari pengukuran
adalah penggunaan angka atau skala tertentu dan menggunakan aturan atau
formula tertentu (Asmawi Zainul, dkk :1997). Penilaian adalah suatu
proses untuk mengambil keputusan dengan menggunakan informasi yang
diperoleh melalui pengukuran hasil belajar, baik yang menggunakan
instrumen tes atau non tes.
Dengan kata lain, penilaian adalah pemberian nilai terhadap
kualitas sesuatu. Keterkaitan antara tes, pengukuran dan penilaian adalah
penilaian hasil belajar baru dapat dilakukan dengan baik dan benar bila
menggunakan informasi yang diperoleh melalui pengukuran hasil belajar
yang menggunakan tes sebagai alat ukurnya. Kegunaan tes, pengukuran
dan penilaian dalam pendidikan antara lain adalah untuk seleksi,
penempatan, diagnosa, remedial, umpan balik, memotivasi dan
membimbing, perbaikan kurikulum, program pendidikan serta
pengembangan ilmu.
Perencanaan dalam pengujian sangat penting karena tes baru akan
berarti bila terdiri dari butir-butir soal yang menguji tujuan yang penting
dan mewakili ranah pengetahuan, kemampuan dan keterampilan secara
representatif. Ada enam hal yang perlu dipertimbangkan dalam
perencanaan tes yaitu: pengambilan sampel dan pemilihan butir soal, tipe
tes yang akan digunakan, aspek yang akan diuji, format butir soal, jumlah
butir soal dan distribusi tingkat kesukaran butir soal (Asmawi Zainul, dkk
:1997).

24
Kelemahan butir soal tidak terletak pada bentuk atau tipe butir
soal, tetapi lebih banyak ditentukan oleh butir soal yang dikonstruksi
dengan baik atau tidak baik. Butir soal obyektif akan sama baiknya dengan
butir soal uraian untuk mengukur keberhasilan belajar yang dikonstruksi
secara baik. Bahkan dalam beberapa hal butir soal uraian jauh lebih besar
resikonya daripada butir soal obyektif. Hal ini disebabkan mutu butir soal
uraian tidak hanya terletak pada kemampuan siswa untuk menjawab soal
tersebut, tetapi lebih banyak ditentukan oleh kemampuan dan obyektifitas
pembuat soal dalam memberikan skor pada hasil tes tersebut. Butir soal
obyektif dapat dianalisa secara lebih akurat dan bertanggung jawab
sehingga dapat diketahui kelemahannya secara tepat. Butir soal tes
obyektif dapat digunakan berulang-ulang, asalkan tidak dalam perangkat
tes yang sama.
Oleh karena itu ada manfaat atau kegunaan analisis butir soal,
kemudian direvisi sehingga butir soal yang kurang baik konstruksinya
dapat diperbaiki. Akhirnya akan diperoleh butir soal yang telah teruji dan
secara akurat mengukur hasil belajar yang ingin diukur.
Ada beberapa alasan mengapa diperlukan analisis butir soal. Menurut
(Asmawi Zainul, dkk :1997) alasan tersebut antara lain :
1. Untuk mengetahui kekuatan dan kelemahan butir tes, sehingga dapat
dilakukan seleksi dan revisi butir soal.
2. Untuk menyediakan informasi tentang spesifikasi butir soal secara
lengkap, sehingga akan lebih memudahkan bagi pembuat soal dalam
menyusun perangkat soal yang akan memenuhi kebutuhan ujian dalam
bidang dan tingkat tertentu.
3. Untuk segera dapat mengetahui masalah yang terkandung dalam butir
soal, seperti: kemenduaan butir soal, kesalahan meletakkan kunci
jawaban, soal yang terlalu sukar dan terlalu mudah, atau soal yang
mempunyai daya beda rendah. Masalah ini bila diketahui dengan
segera akan memungkinkan bagi pembuat soal untuk mengambil
keputusan apakah butir soal yang bermasalah itu akan digugurkan atau
direvisi guna menentukan nilai peserta didik.

25
4. Untuk dijadikan alat guna menilai butir soal yang akan disimpan
dalam kumpulan soal. e. Untuk memperoleh informasi tentang butir
soal sehingga memungkinkan untuk menyusun beberapa perangkat
soal yang paralel. Penyusunan perangkat seperti ini sangat bermanfaat
bila akan melakukan ujian ulang atau mengukur kemampuan beberapa
kelompok peserta tes dalam waktu yang berbeda.

PEMBAHASAN
1. Deskripsi Analisis Butir Soal
Penilaian terhadap butir soal pada dasarnya merupakan analisis
butir soal, dan selama ini pada umumnya para ahli pengukuran
mengatakan bahwa analisis butir soal maksudnya adalah penilaian
terhadap soal. Telah diketahui bersama bahwa penyusunan tes sangat
mempengaruhi kualitas butir soal. Pendekatan untuk menganalisis butir
soal yang berkembang saat ini terdiri dari dua pendekatan yaitu
pendekatan klasik dan pendekatan modern. Kedua pendekatan ini masing-
masing memiliki kelebihan dan kekurangan. Namun keduanya masih
sering digunakan dalam analisis butir soal. Analisis butir soal dengan
pendekatan klasik diantaranya dapat dilakukan menggunakan Program
Iteman.
Dengan melihat beberapa persyaratan yang harus dipenuhi,
penyusunan tes dituntut untuk mengikuti pedoman penyusunan tes dan
melakukan ujicoba. Kemudian berdasarkan hasil ujicoba, respon peserta
dianalisis menggunakan Program Iteman untuk mendapatkan karakteristik
butir soal. Data hasil analisis dengan Program Iteman dianalisis kembali
menggunakan instrumen penilaian butir soal yang memenuhi syarat
sebagai alat ukur yang baik. Suryabrata (1999) menyatakan bahwa analisis
butir soal mencakup telaah soal atau analisis kualitatif dan analisis
terhadap data empirik hasil ujicoba atau analisis kuantitatif.

26
Analisis butir soal secara kualitatif menekankan penilaian dari
ketiga segi yaitu materi, konstruksi, dan bahasa. Namun demikian dalam
pembahasan ini dikhususkan untuk menjelaskan analisis butir soal secara
kuantitatif. Analisis ini dilakukan berdasarkan data yang diperoleh secara
empiris melalui ujicoba dari suatu perangkat tes. Analisis kuantitatif sering
disebut dengan analisis item yang menghasilkan karakteristik atau
parameter butir dan tes, yaitu: tingkat kesukaran, daya beda dan distribusi
jawaban dan kunci setiap butir, serta reliabilitas dan kesalahan pengukuran
(SEM) dalam tes. Telah disinggung di depan bahwa analisis soal antara
lain bertujuan untuk mengadakan identifikasi soal-soal yang baik, kurang
lebih atau sedang dan soal yang tidak baik. Dengan analisis soal dapat
diperoleh informasi tentang kekurangan sebuah soal tes dan “petunjuk”
untuk mengadakan perbaikan.
Dalam tes dan pengukuran, dikenal beberapa karakteristik butir
soal. Untuk tes hasil belajar pada umumnya dipertimbangkan tiga
karakteristik butir soal, yaitu : tingkat kesukaran, daya beda dan distribusi
jawaban atau berfungsi tidaknya pilihan jawaban (distraktor). Ketiga
karakteristik butir soal ini secara bersama-sama akan menentukan mutu
butir soal. Bila salah satu dari ketiga karakteristik ini tidak memenuhi
persyaratan maka mutu butir soal akan turun
.

2. Analisis Butir Soal dengan Langkah Kerja Program Iteman


Micro Computer Adaptive Test (MicroCat) menyediakan program
Item analisis (Iteman) versi 3.50A, yaitu program analisis butir soal
dengan komputer, yang edisi kelimanya dipublikasikan mulai tahun 1993.
a). Langkah-langkah Kerja Program Iteman
Program ini hanya dapat menganalisis butir soal ragam pilihan
ganda. Analisis butir soal dengan program ini relatif mudah, yang penting
diperlukan ketelitian dalam memasukkan data (data entry), karena
kesalahan memasukkan data akan berakibat tidak tepat hasil analisisnya.
Langkah-langkah untuk memasukkan data (dengan file baru) adalah
sebagai berikut:

27
1) Klik Star, pilih Program, pilih Accessories, pilih dan klik Notepad;
2) Simpan dengan klik file, pilih dan klik Save as, lalu tulis nama file
data, misalnya : IPA-1 (jangan lupa, paling banyak 8 huruf/angka);
3) Pemasukan akan lebih cepat jika dilakukan oleh dua orang, seorang
membaca jawaban siswa dan seorang menuliskan. Agar tidak keliru
antara jawaban b dan d, maka pembacaannya: a untuk a, be untuk b,
ce untuk c, del untuk d, dan e untuk e;
4) Jika dilakukan sendiri, letakkan jari tengah tangan kiri pada huruf A
dan jari telunjuk pada huruf D; jari telunjuk tangan kanan pada huruf
C dan jari tengah pada huruf B pada keyboard (papan ketik). Mata
melihat jawaban peserta tes, hasilnya akan lebih cepat;
5) Agar data tidak hilang saat listrik mati, maka sebentar-sebentar
disimpan dengan klik File dan klik Save; dan
6) Tampilan file data seperti terlihat pada halaman berikut.

28
Contoh: File Data

Jumlah soal = 35 butir; jumlah option = 4 buah; jumlah estee = 30 orang


Nomor Testee : 3 angka (ditambah satu tempat kosong, menjadi 4 karakter)

Jumlah soal
Jumlah angka dan tempat kosong
sebelum menuliskan jawaban siswa
035 O N 04
CACDABDACACDACADACADCDCCABACADBBABD
44444444444444444444444444444444444 Kunci jawaban soal
YYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYY
001 CACDOAOACOBCACAOBCOACDBCACOCDDBBOBO
002 CACDAADACACCACADACAACDCCABACADBBABD
003 CACDAADACACCADADACAACDCCABACCDBBABCJumlah option
004 CACDCADACACCADACACADODCCADACDDBBABA
005 CACDAADACACCACADACAACDCCABACADBBABD
006 CACDAADACBAOBCAAACODCAAAABAOODBABAB
Nomor urut siswa
007 CACDAADACBCDACADACCDCDCCADACDDBBACD
008 DACCADDACBCBACAAACAACDCCABACBDBBDAD
009 CACDDADCACCAACBDACADCDCCABACADBBABB
010 CACDAADACACBACABACADCDCCABACDDBBABA Siswa tidak menjawab,
011 CACDAADACACCACADACADCDCCABACADBBABD Tulis O
012 CACDAADACACDACADACAACDCCABACACBBABD
013 CADDAADACACCACADACADCDCCABACDDBBABD
014 CCADAADDACADDBACBBBDCDCAADACBDBBCBD
015 CABDAADACACDACADACADCDCCABACDDBBABD
016 CAADOADDABBDACADABBDBDCCCBACDBAACCB
Jawaban siswa
017 CACDAADACACCACADACADCDCCABACADBBABD
018 CACDAADACACDACADACADCDCCABACADBBCAD
019 CACCBADACACCACACACADCDCOADACBDBBBCA
020 CAADAABDCBABDBADDAADBACCADACDCDABCD
021 CACCAADACACDACABACADCDCCABADDDBAABD
022 CACDAADACACCACBDACBDCDCCADADDDBBACB
023 COCDABDACOOOOBAOOOOOAOCBAOOCADBBDOD
024 CACDAADACACCACADACADCDCCABACADBBABD Setelah menulis huruf terakhir,
025 CACDABDACOBBACAAACAABACAADACDCBCABD Ingat …… jangan di enter
026 CAABAADACDBBADDDAABCCAAAADACADBBDAB
027 CACDAADACACDACADACADCDCCADACADBBABD
028 CACDAADACACBACABACADODCCABACDABBABO
029 CACDAADACACDACADACADCDCCABACBDBBDCA
030 CACDBCDACABDABADDCADCDCCABACADBBABD
Gambar 1. Tampilan File Data Analisis Butir Soal dengan Iteman

29
b). Analisis Data
1) Buka Program Iteman, dengan klik Star, pilih Program, pilih dan klik
Iteman.
2) Isi nama file data, pada Enter the name of the input file: D:\IPA-1.txt lalu
tekan enter.
3) Isikan nama file hasil, pada Enter the name of the output file: D:\IPA-
1.has
4) lalu tekan enter.
5) Lalu muncul pertanyaan Do you want the scores written to a file? ( Y / N ).
6) maka tulislah Y dan tekan enter.
7) Isikan nama file skor, pada Enter the name of the score file: D:\IPA-1.skr
8) Lalu tekan enter, lalu enter terus sampai selesai.
9) Tampilannya seperti terlihat pada gambar berikut.

MicroCat (tm) Testing System


Copyright © 1982,1984, 1986, 1988 by Assessment Systems Corporation
Beta-Test version – Univ. of Pittsburgh
Item and Test Analysis Program -- ITEMAN (tm) Version 3.00
Nama file data
Enter the name of the input file: D:\IPA-1.txt
Enter the name of the output file: D:\IPA-1.has Nama file hasil
Do you want the scores written to a file? ( Y / N ):Y
Enter the name of score file: D:\IPA-1.skr
Do you have a Key Exceptions File?: No Ditulis Y karena minta file skor
Do you want to write statistics to an external file?: No
** Item Analysis is Complete **
Nama file skor
Analisis selesai
Gambar 2. Tampilan analisis butir soal dengan Iteman

c). Hasil Analisis Butir Soal

Buka hasil analisis pada program MsWord dengan cara:


1) klik Star, pilih Program, pilih dan klik Microsoft Word
2) klik File, klik Open, dan cari file hasil pada drive D, dengan Files of Type: All
Files
3) Contoh file hasil analisis seperti pada halaman berikut.

30
MicroCAT (tm) Testing System Page 1
Copyright(c) 1982, 1984, 1986, 1988, 1993 by Assessment Systems
Corporation
Item and Test Analysis Program -- ITEMAN (tm) Version 3.50

Item analysis for data from file D:\IPA-1.TXT


Date: 12-15-05 Time: 7:04 pm

******************** ANALYSIS SUMMARY INFORMATION


********************

Data (Input) File: D:\IPA-1.TXT


Analysis Output File: D:\IPA-1.HAS
Score Output File: D:\IPA-1.SKR
Exceptions File: NONE
Statistics Output File: NONE

Scale Definition Codes: DICHOT = Dichotomous MPOINT =


Multipoint/Survey

Scale: 0
------- Cek dulu, apakah jumlah soal dan
Type of Scale DICHOT jumlah peserta tes, sudah benar?
N of Items 35
N of Examinees 30

***** CONFIGURATION INFORMATION *****


Taraf Sukar Soal (p)
Type of Correlations: Point-Biserial
Correction for Spuriousness: NO
Ability Grouping: YES Daya Beda Soal (D)
Subgroup Analysis: NO
Express Endorsements As: PROPORTIONS
Score Group Interval Width: 1

Item Statistics Alternative Statistics


----------------------- -----------------------------------
Seq. Scale Prop. Disc. Point Prop. Endorsing Point
No. -Item Correct Index Biser. Alt. Total Low High Biser. Key
---- ----- ------- ------ ------ ----- ----- ---- ---- ------ ---

1 0-1 .97 .00 .05 A .00 .00 .00


B .00 .00 .00
C .97 1.00 1.00 .05 *
D .03 .00 .00 -.05
Other .00 .00 .00

2 0-2 .93 .25 .42 A .93 .75 1.00 .42 *


Persentase Testee
tidak menjawab soal

31
B .00 .00 .00
C .03 .13 .00 -.28
D .00 .00 .00
Other .03 .00 .00 -.31

6 0-6 .07 -.25 -.31 A .87 .75 1.00 .20 ?


B .07 .25 .00 -.31 *
CHECK THE KEY C .03 .00 .00 .11
B was specified, A works better D .03 .00 .00 -.05
Other .00 .00 .00

32
d). Menafsirkan Hasil Analisis Butir Soal

Beberapa tokoh evaluasi, yaitu: Sumadi Suryabrata, (1987); Dali S. Naga,


(1992); Suharsimi Arikunto, (1993); dan Saifuddin Azwar, (1996); telah
menetapkan suatu kriteria mutu soal, yang satu dengan lainnya relatif sama, yaitu
seperti berikut.
Tabel 1. Kriteria Kualitas Butir Soal
Kriteria Indeks Klasifikasi
0,000 - 0,250 Sukar
Prop Corect (Taraf Sukar Soal
0,251 - 0,750 Sedang
atau p)
0,751 - 1,000 Mudah
D  0,199 Sangat Rendah
Point Biserial (Daya beda atau 0,200 - 0,299 Rendah
D) 0,300 - 0,399 Sedang
D  0,400 Tinggi
0,000 - 0,010 Kurang
Prop Endorsing Proporsi
0,011 - 0,050 Cukup
jawaban
0,051 - 1,000 Baik
0,000 - 0,400 Rendah
Alpha (Reliabilitas soal) 0,401 - 0,700 Sedang
0,701 - 1,000 Tinggi
Untuk memudahkan memilah-milah butir soal mana yang perlu direvisi atau
didrop dianjurkan untuk menggunakan kriteria berikut

Tabel 2. Kriteria Kualitas Soal untuk Kepentingan Pemilahan Butir


Kriteria Indeks Klasifikasi Penafsiran
0,000 - 0,099 Sangat Sukar Dibuang / perlu revisi total
0,100 - 0,299 Sukar Perlu direvisi
Tingkat kesukaran 0,300 - 0,700 Sedang Baik
(p) 0,701 - 0,900 Mudah Perlu direvisi
0,901 - 1,000 Sangat Dibuang / perlu direvisi total
Mudah
D  0,199 Sangat Dibuang / perlu direvisi total
Rendah
Daya beda ( D ) 0,200 - 0,299 Rendah Perlu direvisi
0,300 - 0,399 Sedang Sedikit atau tanpa revisi
D  0,400 Tinggi Bagus Sekali
0,000 - 0,010 Kurang Dibuang / perlu direvisi
Proporsi jawaban 0,011 - 0,050 Cukup Baik
0,051 - 1,000 Baik Baik sekali

33
0,000 - 0,400 Rendah Kurang baik
Reliabilitas soal 0,401 - 0,700 Sedang Cukup
0,701 - 1,000 Tinggi Baik
Dari hasil analisis butir soal di atas, dengan jumlah soal 35 butir dan sampel 30
orang, penafsiran terhadap beberapa soal tersebut antara lain seperti berikut.
Soal nomor 1, kunci jawabannya C, penafsirannya:
- Tingkat kesukaran butir soal (Prop.Corrrect) = 0,97 ; artinya butir soal ini
‘sangat mudah’ (p>0,90) karena 97 % dari peserta tes menjawab benar soal
ini.
- Daya bedanya (Biserial) = 0,05 ; artinya ‘butir soal ini mempunyai daya
beda yang ‘sangat rendah’ (D>0,20).
- Option (alternatif jawaban) A dan B tidak berfungsi sebagai pengecoh
(distraktor), maka alternatif jawaban A dan B perlu diperbaiki. Sesuai
kriteria pengecoh yang ‘baik’ jika dipilih oleh 0,011 - 0,050 (1,1% - 5%).
Soal nomor 2, kunci jawabannya A, penafsirannya:
- Tingkat kesukaran butir soal (Prop.Corrrect) ini = 0,93 ; artinya butir soal
ini ‘sangat mudah’ (p>0,90) karena dari 93% peserta tes, menjawab benar
soal ini.
- Daya bedanya (Biserial) = 0,42 ; artinya ‘butir soal ini mempunyai daya
beda yang ‘tinggi’ ( D>0,40 ).
- Option (alternatif jawaban) B dan D belum berfungsi sebagai pengecoh
(distraktor), karena tidak ada satu testee-pun yang memilihnya.
Soal nomor 6, kunci jawabannya B, penafsirannya:
- Analisis butir soal ini ada informasi ‘Check The Key, B was specified, A
works better, artinya kunci jawaban A bekerja lebih baik daripada kunci
jawaban yang telah ditentukan, yaitu B. Butir soal ini perlu dicek kembali,
terbukti daya beda butir soal ini menunjukkan angka -0,31 (daya beda
‘sangat rendah’ karena D<0,20). Ini artinya, pada siswa pandai tidak dapat
menjawab benar soal ini, tetapi siswa kurang pandai dapat menjawab
benar (karena kebetulan saja).
- Tingkat kesukaran butir soal ini = 0,07 ; artinya butir soal ini ‘sangat
sukar’ (p>0,10) karena kurang dari 10% dari peserta tes menjawab benar
soal ini.
- Option (alternatif jawaban) semua berfungsi sebagai pengecoh (distraktor),
karena semua alternatif jawaban soal ini ada memilih.

34
E). Resume Hasil Analisis, Sebaran Skor dan Penentuan Nilai

There were 30 examinees in the data file. Scale Statistics

N of Items 35  Jumlah soal


N of Examinees 30  Jumlah peserta tes
Mean 26.700  Rerata skor
Variance 33.543
Std. Dev. 5.792  Standar Deviasi
Skew -0.689
Kurtosis -0.946
Minimum 15.000  Skor terendah
Maximum 33.000  Skor tertinggi
Median 29.000
Alpha 0.874  Reliabilitas soal
SEM 2.058
Mean P 0.763  Taraf sukar soal
Mean Item-Tot. 0.424
Mean Biserial 0.627  Daya beda soal
Max Score (Low) 23
N (Low Group) 8
Min Score (High) 32
N (High Group) 9

SCALE # 0 Score Distribution Table

Number Freq- Cum


Correct uency Freq PR PCT
------- ------- ------ ---- ----
. . . No examinees below this score . . .
14 0 0 1 0 |
15 1 1 3 3 +###
16 0 1 3 0 |
17 3 4 13 10 |##########
18 1 5 17 3 |###
19 2 7 23 7 |#######
20 0 7 23 0 +
21 0 7 23 0 |
22 0 7 23 0 |
23 1 8 27 3 |###
24 1 9 30 3 |###
25 1 10 33 3 +###
26 2 12 40 7 |#######
27 1 13 43 3 |###

35
28 1 14 47 3 |###
29 3 17 57 10 |##########
30 3 20 67 10 +##########
31 1 21 70 3 |###
32 5 26 87 17 |#################
33 4 30 99 13 |#############
34 0 30 99 0 |
35 0 30 99 0 +
|----+----+----+----+----+
5 10 15 20 25
Percentage of Examinees

36
Scores for examinees from file D:\IPA-1.TXT

001 19.00
002 32.00
003 29.00
004 26.00
005 32.00
006 19.00
007 29.00
008 25.00
009 27.00
010 30.00
011 33.00
012 32.00
013 31.00
014 18.00
015 32.00
016 17.00
017 33.00
018 32.00
019 24.00
020 15.00
021 29.00
022 26.00
023 17.00
024 33.00
025 23.00
026 17.00
027 33.00
028 28.00
029 30.00
030 30.00

Skor di atas kita ubah menjadi nilai skala 10 dengan program MsExcel

Langkah menghitung skor Iteman dengan Program MsExcel


1. Blok semua nomor peserta dengan skornya;
2. Copy dan paste di Excel;
3. Klik data, pilih text to columns, klik fixed width;
4. Klik next, next, dan finish; dan
5. Lalu hitung nilai, misal: membagi skor dengan jumlah soal lalu dikalikan 10.

37
DAFTAR PUSTAKA

1. Allen, M.J. & Yen, W.M. 1979. Introduction to measurement theory.


Monterey, CA: Brooks/Cole Publishing Company.

2. Arikunto, Suharsimi, 2006. Dasar-dasar Evaluasi Pendidikan. Jakarta:


Bumi Aksara.

3. Asmawi Zainul dan Noehi Nasoetion. 1997. Penilaian Hasil Belajar.


Pusat Antar Universitas, Direktorat Jenderal Pendidikan Tinggi:
Departemen Pendidikan Dan kebudayaan.

4. Dali S. Naga. 1992. Pengantar Teori Sekor Pada Pengukuran Pendidikan.


Jakarta: Besbats.

5. Departemen Pendidikan Dan Kebudayaan. 1997. Manual Item And Test


Analysis (Iteman). Badan Penelitian dan Pengembangan Pendidikan dan
Kebudayaan: Pusat Penelitian dan Pengembangan Sistem Pengujian.

6. Hamid Hasan, S dan Asmawi Zainul. 1991. Evaluasi Hasil Belajar.


Jakarta: Depdikbud.

7. Maria, 2014. http://mariatulannisa.blogspot.co.id/2014/02/makalah-tes-


hasil-belajar-objektif.html. diakses pada 24 Maret 2016.

8. Nunnally, J.C. 1978. Psychometric theory. New York: McGraw Hill Book
Company.

9. Popham James. W. 1995. What teachers Need to Know

38
10. Saifuddin Azwar. 1996. Tes Prestasi. Yogyakarta: Pustaka Pelajar.

11. Subino, 1987. Konstruksi Dan Analisi Tes Suatu Pengantar Kepada Teori
Tes Dan Pengukuran. Jakarta: Depdikbud.

12. Suharsimi Arikunto. 2009. Dasar-Dasar Evaluasi Pendidikan. Jakarta:


Bumi Aksara.

13. Sumadi Suryabrata. 1987. Pengembangan Tes Hasil Belajar. Jakarta:


Rajawali.

14. Suryabrata, S. 1999. Pengembangan Alat Ukur Psikologis. Direktorat


jenderal Pendidikan Tinggi: Departemen Pendidikan dan Kebudayaan.

39

Anda mungkin juga menyukai