Anda di halaman 1dari 39

MAKALAH INSTRUMEN TES HASIL BELAJAR

Disusun untuk memenuhi tugas mata kuliah


Evaluasi dalam Pembelajaran Matematika
Yang diampu oleh dosen Dra. Ratnaningsih, M.Si

Oleh :
ARIF OKTAFIANTO

(3136159241)

LOURENSIUS

(3136159236)

YULISAR

(3136159248)

PROGRAM PASCA SARJANA PENDIDIKAN MATEMATIKA


FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS NEGERI JAKARTA
2016

KATA PENGANTAR

Rasa syukur kami panjatkan ke hadirat Allah SWT yang telah


melimpahkan rahmat dan karunia-Nya sehingga makalah ini dapat diselesaikan.
Penyusunan makalah ini disesuaikan berkaitan dengan Instrumen tes hasil
belajar dari sumber-sumber yang didapat, sehingga mudah dipahami.

Dalam penyusunan makalah ini tidak lepas dari sumbangsih berupa pemikiranpemikiran/ gagasan dari teman-teman untuk menyempurnakan isi makalah ini.
Semoga makalah ini sangat bermanfaat bagi pembaca terutama bagi teman-teman
mahasiswa dalam mata kuliah Evaluasi dalam Pembelajaran Matematika.

Jakarta, Maret 2016

penulis

DAFTAR ISI
HALAMAN JUDUL

...

KATA PENGANTAR ...


DAFTAR ISI

ii

...

iii

BAB I PENDAHULUAN
A. Latar belakang

...

B. Rumusan Masalah ...

C. Tujuan Masalah

...

D. Manfaat

...

BAB II PEMBAHASAN
A. Pengertian Tes Hasil Belajar ..................................
B. Bentuk Tes Hasil Belajar
C. Ciri-ciri Tes yang Baik

.............................................7
................................................

14

D. Penyusunan Kisi- Kisi Instrumen Tes Hasil Belajar Dan


Proses Validasi Instrumen ...............................................
E. Analisis Butir Soal
DAFTAR PUSTAKA

.......................................

16
24
38

BAB 1
PENDAHULUAN
A. Latar belakang
Setiap kegiatan belajar harus diketahui sejauh mana proses belajar
tersebut telah memberikan kemampuan bagi siswa. Salah satu cara untuk
melihat peningkatan kemampuan tersebut adalah dengan melakukan tes
hasil belajar. Tes hasil belajar merupakan salah satu bentuk yang
digunakan untuk mengukur perkembangan belajar siswa setelah mengikuti
proses pembelajaran.
Sebagai pendidik yang professional, maka sebaiknya mengetahui
penyusunan dan pengembangan tes hasil belajar yang baik dan benar
sehingga tes dapat berfungsi dengan sebaik-baiknya. Dalam menyusun dan
mengembangkan tes hasil belajar matematika terdapat hal-hal yang harus
diperhatikan sehingga pendidik dapat mengukur tujuan instruksional
khusus pada pembelajaran matematika dan memberikan informasi
mengenai keberhasilan belajar siswa.
Dalam makalah ini akan dibahas mengenai bentuk tes hasil belajar,
penyusunan kisi-kisi instrumen tes hasil belajar dan proses validasi
instrumen, serta analisis butir instrumen tes hasil belajar dengan itemen.
Oleh karena itu, kita sebagai pendidik bisa melakukan evaluasi
pembelajaran dengan menyusun tes yang valid dan bisa mengukur
kemampuan peserta didik.
B. Rumusan Masalah
Dari uraian latar belakang diatas, permasalahan yang ingin dicari
solusinya adalah adalah sebagai berikut:
1.
Apa saja bentuk tes hasil belajar?
2.
Bagaimana penyusunan kisi-kisi instrumen tes hasil
belajar?
3.
4.

Bagaimana proses validasi instrumen?


Bagaimana analisis butir instrumen tes hasil belajar
dengan itemen?

C. Tujuan Masalah
Tujuan dari penulisan makalah ini adalah sebagai berikut:
1. Mengetahui bentuk tes hasil belajar
2. Mengetahui penyusunan kisi-kisi instrumen tes hasil belajar
3. Mengetahui proses validasi instrumen
4. Mengetahui analisis butir instrumen tes hasil belajar dengan itemen

D. Manfaat
Manfaat yang ingin dicapai dari penulisan makalah ini adalah bagi
mahasiswa dapat dijadikan panduan dalam mengikuti mata kuliah Evaluasi
dalam Pembelajaran Matematika dan yang ingin menyusun atau
mengembangkan instrumen tes hasil belajar.

BAB II
PEMBAHASAN

A. Pengertian Tes Hasil Belajar


Kata tes berasal dari bahasa Prancis kuno yang berarti piring untuk
menyisihkan logam-logam mulia, yang dimaksud disini adalah dengan
menggunakan alat berupa piring akan dapat diperoleh jenis-jenis logam
mulia yang bernilai tinggi. Dalam perkembangannya dan seiirng kemujuan
zaman tes berarti ujian atau percobaan. Ada beberapa istilah yang
memerlukan penjelasan sehubungan dengan uraian diatas yaitu tes, testing,
tester dan testee, yang masing-masing mempunyai pengertian berbeda
namun erat kaitannya dengan tes. Subino (1987: 79).
1. Tes adalah alat atau prosedur yang dipergunakan dalam rangka
pengukuran dan penilaian,
2. Testing berarti saat dilaksanakannya pengukuran dan penilaian atau
saat pengambilan tes
3. Tester artinya orang yang melaksanakan tes atau orang yang diserahi
untuk melaksanakan pengambilan tes terhadap para responden
4. Testee adalah pihak yang sedang dikenai tes.
Ada beberapa pendapat dari beberapa ahli tentang pengertian tes,
menurut Anne Anastasi dalam karya tulisnya yang berjudul Psychological
Testing, yang dimaksud dengan tes adalah alat pengukur yang mempunyai
standar yang obyektif sehingga dapat digunakan secara meluas, serta dapat
digunakan sebagai cara untuk mengukur dan membandingkan keadaan
pskis atau tingklah laku individu. Menurut Lee J. Cronbach dalam
bukunya berjudul Essential of Psychological Testing, tes merupakan suatu
perosedur yang sistematis untuk membandingkan tingkah laku dua orang
atau lebih. Sedangkan menurut Goodenough, tes adalah suatu tugas atau
serangkaian tugas yang diberikan kepada individu atau kelompok, yang
dimaksud untuk membandingkan kecakapan satu sama lain.
Dari pengertian dari para ahli tersebut dalam dunia pendidikan
dapat disimpulkan bahwa pengertian tes adalah cara yang digunakan atau
prosedur yang ditempuh dalam rangka pengukuran dan penilaian di bidang
pendidikan, yang memberikan tugas dan serangkaian tugas yang diberikan

oleh guru sehingga dapat dihasilkan nilai yang melambangkan tingkah


laku atau prestasi peserta didik.
Suatu tes akan berisiskan pertanyaan-pertanyaan dan atau soal-soal
yang harus dijawab dan atau dipecahkan oleh individu yang dites (testee),
maka disebut tes hasil belajar (achievement test). Tes hasil belajar
biasanya terdiri dari sejumlah butir soal yang memiliki tingkat kesukaran
tertentu (ada yang mudah, sedang, dan sukar). Tes tersebut harus dapat
dikerjakan oleh siswa dalam waktu yang sudah ditentukan. Oleh karena
itu, tes hasil belajar merupakan power test. Maksudnya adalah mengukur
kemampuan siswa dalam menjawab pertanyaan atau permasalahan.
B.

Bentuk Tes Hasil Belajar


Tes merupakan serangkaian soal yang harus dijawab oleh siswa.
Dalam hal ini, tes hasil belajar dapat digolongkan kedalam beberapa
kategori sebagai berikut:
1.

Berdasarkan bentuk pelaksanaanya, yaitu:


a. Tes lisan
Tes lisan dilakukan dengan pembicaraan atau wawancara tatap
muka antara guru dan murid.
b. Tes tulisan
Tes tertulis dalam pelaksanaannya lebih menekankan pada
penggunaan kertas dan pencil sebagai instrumen utamanya,
sehingga tes mengerjakan soal atau jawaban ujian pada kertas ujian
secara tertulis, baik dengan tulisan tangan maupun menggunakan
komputer.
c. Tes tindakan atau perbuatan. Tes perbuatan mengacu pada proses
penampilan seseorang dalam melakukan sesuatu unit kerja. Tes
perbuatan mengutamakan pelaksanaan perbuatan peserta didik.

2. Dari segi bentuk soal dan kemungkinan jawabannya tes, yaitu:

a. Tes Essay (uraian)


Tes Essay adalah tes yang disusun dalam bentuk pertanyaan
terstruktur dan siswa menyusun, mengorganisasikan sendiri jawaban
tiap pertanyaan itu dengan bahasa sendiri. Tes essay ini sangat
bermanfaat untuk mengembangkan kemampuan dalam menjelaskan
atau mengungkapkan suatu pendapat dalam bahasa sendiri.
Subino, (1987:94) menyatakan bahwa berdasarkan tingkat
kebebasan jawaban yang dimungkinkan dalam tes bentuk uraian,
butir-butir soal dalam ini dapat dibedakan atas butir-butir soal yang
menuntut jawaban bebas. Butir-butir soal dengan jawaban terikat
cenderung akan membatasi, baik isi maupun bentuk jawaban;
sedangkan butir soal dengan jawaban bebas cenderung tidak
membatasi, baik isi maupun jawaban.
Kebaikan atau keuntungan penggunaan tes uraian antara lain:
1) Dapat mengukur hasil belajar yang kompleks, yang tidak dapat
diukur dengan tes atau cara yang lain.
2) Dapat mengukur perpaduan dan aplikasi tentang keterampilan
berpikir dan keterampilan memecahkan masalah.
3) Mudah disusun (dibuat)
Keburukan atau kelemahan penggunaan tes bentuk uraian antara
lain:
1) Memiliki keterbatasan akibat tidak konsistensinya penyekoran.
2) Memerlukan banyak waktu untuk menilai jawaban.
3) Sampling yang diukur terbatas.
Saran dan petunjuk untuk menyusun pertanyaan essay, antara lain:
1) Hendaknya tes ini digunakan untuk mengukur hasil belajar yang
tidak dapat diukur tes objektif.
2) Rumuskan pertanyaan sehingga dapat mengukur tingkah laku
dengan tepat sesuai dengan hasil belajar.
3) Pertanyaan harus jelas sehingga tidak memunculkan

interprestasi yang bermacam-macam.


Petunjuk untuk menyekor pertanyaan essay, adalah:
1) Siapkan outline jawaban
2) Gunakan cara/metode menyekor yang lebih tepat
a) Point method
b) Rating method
3) Nilailah semua jawaban untuk satu pertanyaan sebelum
dilanjutkan ke pertanyaan berikutnya.
b. Tes Objektif
Tes objektif adalah tes yang disusun sedemikian rupa dan
telah disediakan alternatif jawabannya. Tes ini terdiri dari berbagai
macam bentuk, antara lain ;
1. Tes objektif bentuk benar-salah (true-false test)
2. Tes objektif bentuk menjodohkan (matching test)
3. Tes objektif bentuk jawaban singkat (short answer)
4. Tes objektif bentuk pilihan ganda (multipel choice item test)
1) Tes objektif benar-salah (true-false test)
Tes obyektif bentuk True-false merupakan salah satu bentuk tes
obyektif dimana butir-butir soal yang diajukan dalam test hasil
belajar berupa pernyataan (pernyataan dimana ada yang benar dan
ada yang salah).
Keunggulan tes obyektif bentuk benar-salah (true-false test)
a) Mudah dalam menyusun/pembuatannya mudah
b) Dapat digunakan berulang kali
c) Tidak terlalu banyak memakan lembaran kertas/tempat karena
biasanya pertanyaan-pertanyaannya singkat saja
d) Mampu mencakup bahan pelajaran yang luas
e) Bagi testee, cara mengerjakannya mudah
f) Bagi tester, cara mengkoreksinya juga mudah

Kelemahan tes obyektif bentuk benar-salah (true-false test)


a) Mudah ditebak dan diduga
b) Membuka peluang bagi testee untuk berspekulasi dalam
memberikan jawaban
c) Sifatnya terbatas, dalam arti bahwa tes tersebut hanya dapat
mengungkap daya ingat dan pengenalan kembali, jadi lebih
bersifat hafalan
d) Umumnya tes obyektif jenis ini reliabilitasnya rendah, kecuali
apabila butir-butir soalnya dibuat dalam jumlah yang banyak
sekali
e) Dapat terjadi bahwa butir-butir soal tes objektif ini tidak dapat
dijawab dengan dua kemungkinan saja, yaitu betul atau salah
2). Tes Menjodohkan (Matching Test):
Sering dikenal dengan istilah tes menjodohkan, tes mencari
pasangan,

tes

menyesuaikan,

tes

mencocokkan

dan

tes

mempertandingkan. Matching test terdiri atas satu seri pertanyaan


dan satu seri jawaban. Masing-masing pertanyaan mempunyai
jawabnya yang tercantum dalam seri jawaban.
Keunggulan tes obyektif bentuk menjodohkan (Matching Test):
Pembuatannya mudah
Dapat dinilai dengan mudah, cepat, dan obyektif
Apabila tes ini dibuat dengan baik, maka faktor menebak praktis
dapat dhilangkan
Kelemahan tes obyektif bentuk menjodohkan (Matching Test):
Cenderung lebih banyak mengungkap aspek hafalan atau daya
ingat saja
Karena mudah disusun, maka tes ini kadang dijadikan pelarian
bagi pengajar, yaitu digunakan apabila pengajar tidak sempat
lagi untuk membuat tes bentuk lain
Tes jenis ini kurang baik untuk mengevaluasi pengertian dan
kemampuan membuat tafsiran (interpretasi)

10

3). Tes Jawaban Singkat (Short Answer)


Keuntungan tes jawaban singkat antara lain:
Lebih mudah disusun, karena hasil belajar yang diukur relatif
sederhana
Siswa diminta hanya memberi jawaban
Keterbatasan tes jawaban singkat antara lain:
Tidak cocok untuk mengukur hasil belajar yang kompleks
4). Tes Pilihan Berganda (multipel choice item test)
Multiple choice test terdiri atas suatu pertanyaan atau keterangan
tentang suatu pengertian yang belum lengkap, dan untuk
melengkapinya harus memilih satu dari beberapa kemungkinan
jawaban yang telah disediakan. Atau dengan kata lain, multiple
choice test terdiri atas bagian keterangan (stem) dan bagian
kemungkinan jawaban atau alternative (option). Kemungkinan
jawaban terdiri atas satu jawaban yang benar (sebagai kunci
jawaban) dan beberapa pengecoh (distractor), Arikunto (2006:168).
Contoh soal multiple Choice item, sebagai berikut:
a) Model melengkapi empat/lima pilihan
b) Model melengkapi berganda
Contoh:
Tulislah: A. Bila (1), (2), dan (3) betul
B. Bila (1) dan (3) betul
C. Bila (2) dan (4) betul
D. Bila hanya (4) yang betul
E. Bila semuanya betul

c) Model analisis hubungan antar hal


Contoh:

11

A. Jika pernyataan betul, alasan betul, dan keduanya


menunjukkan hubungan sebab-akibat
B.

Jika pernyataan betul, alasan betul, tetapi keduanya


tidak menunjukkan hubungan sebab-akibat

C.

Jika pernyataan betul dan alasan salah

D. Jika pernyataan salah dan alasan betul


E.

Jika pernyataan salah dan alasan sala

Keunggulan tes Pilihan Ganda:


Sifatnya lebih representatif dalam hal mencakup atau mewakili
materi yang telah diajarkan kepada peserta didik
Memungkinkan bagi tester untuk bertindak lebih obyektif
Lebih mudah dan cepat dalam mengoreksi
Memberi kemungkinan orang lain untuk ditugasi/dimintai
bantuan mengoreksi hasil tes tersebut
Butir soal pada tes obyektif jauh lebih mudah dianalisis
Sangat tepat untuk ujian yang peserta banyak sedangkan
hasilnya harus segera seperti ujian akhir nasional maupun ujian
sekolah.
Kelemahan tes bentuk Pilihan Ganda:
Menyusun butir tes obyektif tidak semudah menyusun tes uraian
Umumnya kurang dapat mengukur proses berpikir yang lebih
tinggi atau mendalam
Terbuka bagi testee untuk bermain spekulasi
3. Dilihat dari sudut waktu kapan dan untuk apa tes itu dilakukan, yaitu:
a. Tes awal (pretest),
b. Tes akhir (posttest),

4. Dari segi fungsi tes di sekolah, tes dibedakan menjadi :


a. Tes Formatif

12

Tes Formatif, yaitu tes yang diberikan untuk memonitor kemajuan


belajar selama proses pembelajaran berlangsung. Tes ini diberikan
dalam tiap satuan unit pembelajaran. Manfaat tes formatif bagi
peserta didik adalah :
Untuk mengetahui apakah peserta didik sudah menguasai materi
dalam tiap unit pembelajaran. Merupakan penguatan bagi peserta
didik.
Merupakan usaha perbaikan bagi siswa, karena dengan tes formatif
peserta didik mengetahui kelemahan-kelemahan yang dimilikinya.
Peserta didik dapat mengetahui bagian dari bahan yang mana yang
belum dikuasainya.
b. Tes Summatif
Tes

sumatif

diberikan

dengan

maksud

untuk

mengetahui

penguasaan atau pencapaian peserta didik dalam bidang tertentu.


Tes sumatif dilaksanakan pada tengah atau akhir semester.
c.

Tes Penempatan
Tes penempatan adalah tes yang diberikan dalam rangka
menentukan jurusan yang akan dimasuki peserta didik atau
kelompok mana yang paling baik ditempati atau dimasuki peserta
didik dalam belajar.

d. Tes Diagnostik
Tes diagnostik adalah tes yang digunakan untuk mendiagosis
penyebab kesulitan yang dihadapi seseorang baik dari segi
intelektual, emosi, fisik dan lain-lain yang mengganggu kegiatan
belajarnya.

C. Ciri-ciri tes yang baik

13

Menurut arikonto (2006:42), Sebuah tes yang dapat dikatakan baik


sebagai alat pengukur harus memilki persyaratan tes, yaitu memiliki:
1. Validitas
Sebuah tes disebut valid apabila tes tersebut dapat tepat
mengukur apa yang hendak diukur. Contoh, untuk mengukur
partisipasi siswa dalam proses belajar mengajar, bukan diukur melalui
nilai yang diperoleh pada waktu ulangan, tetapi dilihat melalui:
kehadiran, terpusatnya perhatian pada pelajaran, ketepatan menjawab
pertanyaan-pertanyaan yang diajukan oleh guru dalam arti relevan
pada permasalahannya.
2. Reliabilitas
Berasal dari kata asal reliable yang artinya dapat dipercaya.
Tes dapat dikatakan dapat dipercaya jika memberikan hasil yang tetap
apabila diteskan berkali-kali. Sebuah tes dikatakan reliabel apabila
hasil-hasil tes tersebut menunjukan ketetapan. Jika dihubungkan
dengan validitas, maka: Validitas adalah ketepatan dan reliabilitas
adalah ketetapan.
3. Objektivitas
Sebuah dikatakan memiliki objektivitas apabila dalam
melaksanakan tes itu tidak ada faktor subjektif yang mempengaruhi.
hal ini terutama terjadi pada sistem scoringnya. Apabila dikaitkan
dengan reliabilitas maka objektivitas menekankan ketetapan pada
sistem scoringnya, sedangkan reliabilitas menekankan ketetapan
dalam hasil tes.
4. Praktikabilitas
Sebuah tes dikatakan memiliki praktibilitas yang tinggi
apabila tes tersebut bersifat praktis dan mudah pengadministrasiannya.
tes

yang

baik

adalah

yang

mudah

dilaksanakan,

mudah

pemeriksaannya, dan dilengkapi dengan petunjuk-petunjuk yang jelas.

5. Ekonomis

14

Yang dimaksud ekonomis disini ialah bahwa pelaksanaan tes


tersebut tidak membutuhkan ongkos atau biaya yang mahal, tenaga
yang banyak, dan waktu yang lama.

D. Penyusunan Kisi- Kisi Instrumen Tes Hasil Belajar Dan Dan Proses
Validasi Instrumen

15

Ada berbagai pendapat mengenai validitas untuk instrumen yang


digunakan pengukuran, baik di bidang pendidikan maupun psikologi.
W.James Popham (1995) mengatakan bahwa dua pertanyaan penting
sesuai dengan pembuatan tes antara lain 1. Apa yang harus tes (dinilai )
dalam hal ini meliputi cognitive, psikomotorik, dan afektif. Cognitif
berdasarkan taksonomi Bloom terdiri dari: pengetahuan, pemahaman,
aplikasi, analisis dan sintesis, 2. Bagaimana melakukan tes tersebut dalam
hal ini meliputi bentuk tes yang jawabanya dapat berupa pilihan berganda,
menjodohkan,

benarsalah, uraian dan jawaban singkat serta bentuk

portofolio yang valid sehingga dapat memberikan informasi yang sesuai


dengan proses belajar- mengajar di kelas.
Validitas itu dapat dikelompokkan menjadi tiga tipe, yaitu: (1)
validitas kriteria (criterion-related), (2) validitas isi, dan (3) validitas
konstruk (Nunnally, 1978, Allen & Yen, 1979, Fernandes, 1984, Woolfolk
& McCane, 1984, Kerlinger, 1986, dan Lawrence, 1994). Validitas ini
dapat diketahui melalui fakta keberadaaan validitas. Sumber fakta validitas
dapat dikelompokkan menjadi isi tes, proses respons, struktur internal,
hubungan dengan variabel lain, dan konsekuensi dari pelaksanaan tes.
Keberadaan validitas dari suatu perangkat tes ini dapat diketahui melalui
analisis isi tes dan analisis empiris dari skor tes data respons butir.
Validitas berdasarkan kriteria dibedakan menjadi dua, yaitu validitas
prediktif dan validitas konkuren. Dalam analisis validitas prediktif,
performansi yang hendak diprediksikan disebut dengan kriteria. Besar
kecilnya harga estimasi validitas prediktif suatu instrument digambarkan
dengan koefisien korelasi antara prediktor dengan kriteria tersebut.
Validitas isi suatu instrumen adalah sejauhmana butir-butir dalam
instrumen itu mewakili komponen-komponen dalam keseluruhan kawasan
isi objek yang hendak diukur dan sejauh mana butir-butir itu
mencerminkan ciri perilaku yang hendak diukur (Nunnally, 1978;
Fernandes, 1984). Validitas isi itu keterwakilan pertanyaan terhadap
kemampuan khusus yang harus diukur. Berdasarkan hal ini, dapat
disimpulkan bahwa validitas isi terkait dengan analisis rasional terhadap

16

domain yang hendak diukur untuk mengetahui keterwakilan instrumen


dengan kemampuan yang hendak diukur. Validitas konstruk adalah
validitas yang menunjukkan sejauh mana instrumen mengungkap suatu
kemampuan atau konstruk teoretis tertentu yang hendak diukurnya
(Nunnally, 1978, Fernandes, 1984). Prosedur validasi konstruk diawali dari
suatu identifikasi dan batasan mengenai variabel yang hendak diukur dan
dinyatakan dalam bentuk konstruk logis berdasarkan teori mengenai
variabel tersebut. Dari teori ini ditarik suatu konskuensi praktis mengenai
hasil pengukuran pada kondisi tertentu, dan konskuensi inilah yang akan
diuji. Apabila hasilnya sesuai dengan harapan maka instrumen itu
dianggap memiliki validitas konstruk yang baik. Pada tes prestasi belajar,
validitas merupakan syarat yang sangat diperlukan dalam pengembangan
tes. Menurut pendapat Sireci yang didukung Lissitz & Samuelsen (2007),
validasi tes yang dipergunakan dalam dunia pendidikan sebaiknya
melibatkan analisis isi tes dan analisis empiris dari skor tes dan data
respons terhadap butir oleh peserta tes. Analisis isi tes terkait dengan
validitas isi yang selanjutnya diperlukan juga analisis empiris untuk
mengetahui validitas konstruk. Kedua analisis ini dimaksudkan agar tes di
dunia pendidikan memenuhi syarat tes yang standar.

Membuktikan Validitas Isi


Validitas isi ditentukan menggunakan kesepakatan ahli. Kesepakatan ahli
bidang studi atau sering disebut dengan domain yang diukur menentukan
tingkatan validitas isi (content related). Hal ini dikarenakan instrumen
pengukuran, misalnya berupa tes atau angket dibuktikan valid jika ahli
(expert) meyakini bahwa istrumen tersebut mengukur penguasaan
kemampuan yang didefinisikan dalam domain ataupun juga konstruk
psikologi yang diukur. Untuk mengetahui kesepakatan ini, dapat
digunakan indeks validitas, diantaranya dengan indeks yang diusulkan
oleh Aiken (1980; 1985). Indeks validitas butir yang diusulkan Aiken ini
dirumuskan sebagai berikut:

17

V
S = skor yang ditetapkan oleh validator
n= Banyaknya Validator
c = Banyakya kategori yang dipilih validator
dengan V adalah indeks validitas butir; s skor yang ditetapkan setiap rater
dikurangi skor terendah dalam kategori yang dipakai (s = r l o, dengan r =
skor kategori pilihan rater dan lo skor terendah dalam kategori
penyekoran); n banyaknya rater; dan c banyaknya kategori yang dapat
dipilih rater. Berdasarkan pendapat tersebut, V merupakan indeks
kesepakatan rater terhadap kesesuaian butir (atau sesuai tidaknya butir)
dengan indikator yang ingin diukur menggunakan butir tersebut. Jika
diterapkan untuk instrument pengukuran, menurut seorang rater maka n
dapat digantidengan m (banyaknya butir dalam satu instrumen). Indeks V
ini nilainya berkisar diantara 0-1.Contoh membuktikan validitas isi dari
instrumenyang disajikan pada contoh berikut.
Contoh
Pada pengembangan instrumen pengukuran, misalnya tes, dikembangkan
kisi-kisi dahulu dan butir perangkatnya, minimal memuat indikator, bentuk
instrumen/tes, kemudian butir soal, dan penskorannya (pada kasus ini
penskoran tidak dituliskan karena perlu tempat yang cukup banyak).
Kemudian kisi-kisi berikut butir instrumen diberikan kepada ahli untuk
divalidasi, dengan memberikan masukan terkait butir- butir instrumen
sekaligus

mengisi

kesesuaian

butir

dengan

indikator.

Contoh

pengembangan instrument sebagai berikut :

No

Indikator

Bentuk

Butir

Kunci Jawaban

Score

18

Wakt

Menentukan
hasil akar dari
bilangan
berpangkat
serta
pembagian
bilangan
berpangkat

PG

Bentuk

1 3
. 625
25

Dapat disederhanakan
menjadi .
A. 5 4 / 3
B. 5 2 / 3
C. 51 / 3
D. 5 2 / 3
E.
54 / 3

u
5
1 3
. 625
25
1
2 3 54
5
4
1 3
25
5

5
5

2
2
2

4
2
3

Saran :

Menentukan
hasil dari
pemangkatan
bilangan
berpangkat
serta
pembagian
bilangan
berpangkat

PG

Bentuk
1 1/ 3
.a

5
2

3 / 2

: 2a 3 / 2

dapat disederhanakan
menjadi .
A. 4a 1 / 6
B. 2a 1 / 6
C. 4a 1 / 2
D. 4a 1 / 6
E. 2a

2
2
2
2
= 2a

Saran :

Contoh format penilaian oleh ahli untuk mengetahui kesesuaian butir


Format Penilaian Ahli untuk mengetahui kesesuaian butir

19

No
1
Tidak
Valid

2
Kurang
valid

Skor Validasi
3
4
Cukup
Valid
Valid

Keterangan
5
Sangat
Valid

1
2
3
4
5
6
7
8
9
10
No
Butir
1
2
3
4
5
6
7
8
9
10
No
Butir
1
2
3
4
5
6
7
8
9
10

Contoh hasil tabulasi dari 3 validator untuk soal diatas


Validator 1
Validator 2
Validator 3
3
4
4
5
4
3
4
4
3
4

2
3
3
3
4
4
5
4
4
4

3
3
5
3
3
4
4
4
4
3

Contoh Hasil Menghitung Indeks Kesepakatan Ahli pada soal diatas


Validator
Validator
Validator
1
2
3
S1
S2
S3
S
3
2
3
2
1
2
5
4
3
3
3
2
2
7
4
3
5
3
2
4
9
5
3
3
4
2
2
8
4
4
3
3
3
2
8
3
4
4
2
3
3
8
4
5
4
3
4
3
10
4
4
4
3
3
3
9
3
4
4
2
3
3
8
4
4
3
3
3
2
8

V
0.42
0.58
0.75
0.67
0.67
0.67
0.83
0.75
0.67
0.67

Secara rinci penyusunan kisi-kisi Instrumen Tes dan Non Tes


adalah sebagai berikut :

20

1. Kisi-kisi Instrumen /Tes


Setelah tujuan tes ditetapkan, kegiatan berikuimya adalah menyusun kisikisi tes. Kisi-kisi ini padadasarnya merupakan tabel matrik yang berisi
spesifikasi soal yang akan ditulis. Kisi-kisi berisi tentang tujuan, standar
kompetensi, kompetensi dasar, materi pokok, dan penilaian yang berisi
bentuk dan jenis tagihan. Standar kompetenssi dijabarkan menjadi
kompetensi dasar, kompetensi dasar dipecah menjadi beberapa iindikator,
dan dari indikator inilah dibuat butir-butir instrumen.
Ada tiga langkah yang harus dipenuhi untuk menulis kisi-kisi,
yaitu: 1) memilih standar kompetensi dasar, (2) memilih kompetensi dasar,
(3) menulis indikator, dan (4) menentukan bentuk tes. Secara garis besar,
ada dua bentuk tes yang banyak digunakan oleh guru, yaitu bentuk
obyektif dan bentuk uraian atau nonobyektif. Sudah barang tentu, masingmasing bentuk tes memiliki kelebihan dan kekurangan.
2. Kisi-kisi Instrumen nontes
Penyusunan instrumen nontes didahului dengan penentuan definisi
konseptual, kemudian dijabarkan lagi kedefinisi operasional. Dari definisi
operasional ini kemudian dijabarkan menjadi beberapa indikator yang
selanjutnya dijabarkan menjadi butir-butir instrumen. Seperti yang telah
dijelaskan di muka, instrumen nontes ini dibedakan menjadi dua, yaitu
skala, angket, dan inventori. 7
Skala digunakan untuk mengukur konstruk atau konsep psikologis
seperti: sikap, minat, motivasi, pendapat, dan trait lainnya, sedangkan
angket digunakan untuk mengukur fakta, atau yang dianggap fakta seperti:
pendidikan terakhir, jumlah anggota, penghasilan setiap bulan, dll.
Sementara itu, inventori digunakan untuk mengungkap kepemilikan benda
nyata, seperti: jumlah kursi, jumlah meja, dll. Secara ringkas, hubungan
antara tujuan, metode dan instrumen yang digunakan pada Tabel berikut.

Tujuan untuk
mengungkap:
- perilaku, kebiasaan,

Metode
observasi, wawancara

Instrumen yg digunakan
lembar observasi, lembar

21

ketrampilan

mendalam

- potensi termasuk di
dalamnya unjuk kerja

tes, perintah mengerjakan

- afektif: motivasi, sikap,


minat , kesukaan, dll
- data pribadi, data nyata
- data yang lalu, data
sekunder

wawancara, survei

penilaian, catatan, peneliti


sendiri
soal tes, lembar perintah
dilengkapi dg lembar
observasi/ lembar penilaian
pedoman wawancara, skala

wawancara, survei
dokumentasi

angket, inventori,
daftar dokumen

Tabel di atas menjelaskan bahwa metode dan instrumen yang


digunakan harus mengacu pada tujuan pengukuran. Hal ini penting agar
tidak terjadi kesalahan pengukuran.
Di muka telah dijelaskan pengertian dan jenis validitas dan
reliabilitas instrumen. Secara ringkas cara memvalidasi dan mengestimasi
reliabilitas instrumen dapat dilihat pada instrumen berikut.
Jenis Validitas
Validitas isi: validitas

Cara Memvalidasi

kurikulum, validitas

- menggunakan kisi-kisi

tampang

- konsultasi keahlinya

Validitas kriteria terkait

-mengkorelasikan dengan

atau validitas empirik:

data di masa datang

Keterangan
-tanpa menggunakan teknik
statistik

Korelasi product moment

validitas prediktif, validitas


konkuren
Validitas

konstruk: -mengkorelasikan skor

validitas faktor

butir dengan total

- analisis faktor
- product moment
-analisis butir

Jenis Reliabilitas
Internal Consistency:

Prosedur
1 dan 2, tes satu kali,

Teknik yang dipakai


1. Koef. Alpha

1. data ordinal

kemudian dianalisis atau

2. KR 20, KR 21

2. data nominal

diestimasi reliabilitasnya

3. Spearman Brown

22

3 tes sekali, kemudian


skor dibelah dua dan
Stabilitas

Ekivalen

diestimasi
Tes dua kali dengan soal

Product moment dan korelasi

sama, kemudian hasilnya

intra kelas

dikorelasikan.
Beri tes dua kali dengan

Product moment dan korelasi

soal yang berbeda

intra kelas

kemudian dikorelasikan
Tabel di atas menunjukkan bahwa untuk mengestimasi validitas
dan reliabilitas instrumen diiperlukan kerja yang sangat hati-hati, Harus
diupayakan agar proses dan estimasi ini dilaksanakan dengan sebaikbaiknya

E. ANALISIS BUTIR SOAL


Tes adalah suatu pernyataan, tugas atau seperangkat tugas yang
direncanakan untuk memperoleh informasi tentang trait atau atribut
pendidikan dan psikologi. Setiap butir pertanyaan atau tugas tersebut
mempunyai jawaban atau ketentuan yang dianggap benar. Tes dapat

23

diklasifikasikan menurut bentuk, tipe dan ragamnya (Asmawi Zainul,


dkk :1997). Pengukuran adalah pemberian angka kepada suatu atribut atau
karakteristik tertentu yang dimiliki oleh orang, hal atau obyek tertentu
menurut aturan atau formulasi yang jelas. Karakteristik dari pengukuran
adalah penggunaan angka atau skala tertentu dan menggunakan aturan atau
formula tertentu (Asmawi Zainul, dkk :1997). Penilaian adalah suatu
proses untuk mengambil keputusan dengan menggunakan informasi yang
diperoleh melalui pengukuran hasil belajar, baik yang menggunakan
instrumen tes atau non tes.
Dengan kata lain, penilaian adalah pemberian nilai terhadap
kualitas sesuatu. Keterkaitan antara tes, pengukuran dan penilaian adalah
penilaian hasil belajar baru dapat dilakukan dengan baik dan benar bila
menggunakan informasi yang diperoleh melalui pengukuran hasil belajar
yang menggunakan tes sebagai alat ukurnya. Kegunaan tes, pengukuran
dan penilaian dalam pendidikan antara lain adalah untuk seleksi,
penempatan,
membimbing,

diagnosa,
perbaikan

remedial,

umpan

kurikulum,

balik,

program

memotivasi
pendidikan

dan
serta

pengembangan ilmu.
Perencanaan dalam pengujian sangat penting karena tes baru akan
berarti bila terdiri dari butir-butir soal yang menguji tujuan yang penting
dan mewakili ranah pengetahuan, kemampuan dan keterampilan secara
representatif. Ada enam hal yang perlu dipertimbangkan dalam
perencanaan tes yaitu: pengambilan sampel dan pemilihan butir soal, tipe
tes yang akan digunakan, aspek yang akan diuji, format butir soal, jumlah
butir soal dan distribusi tingkat kesukaran butir soal (Asmawi Zainul, dkk
:1997).

24

Kelemahan butir soal tidak terletak pada bentuk atau tipe butir
soal, tetapi lebih banyak ditentukan oleh butir soal yang dikonstruksi
dengan baik atau tidak baik. Butir soal obyektif akan sama baiknya dengan
butir soal uraian untuk mengukur keberhasilan belajar yang dikonstruksi
secara baik. Bahkan dalam beberapa hal butir soal uraian jauh lebih besar
resikonya daripada butir soal obyektif. Hal ini disebabkan mutu butir soal
uraian tidak hanya terletak pada kemampuan siswa untuk menjawab soal
tersebut, tetapi lebih banyak ditentukan oleh kemampuan dan obyektifitas
pembuat soal dalam memberikan skor pada hasil tes tersebut. Butir soal
obyektif dapat dianalisa secara lebih akurat dan bertanggung jawab
sehingga dapat diketahui kelemahannya secara tepat. Butir soal tes
obyektif dapat digunakan berulang-ulang, asalkan tidak dalam perangkat
tes

yang

sama.

Oleh karena itu ada manfaat atau kegunaan analisis butir soal,
kemudian direvisi sehingga butir soal yang kurang baik konstruksinya
dapat diperbaiki. Akhirnya akan diperoleh butir soal yang telah teruji dan
secara akurat mengukur hasil belajar yang ingin diukur.
Ada beberapa alasan mengapa diperlukan analisis butir soal. Menurut
(Asmawi Zainul, dkk :1997) alasan tersebut antara lain :
1. Untuk mengetahui kekuatan dan kelemahan butir tes, sehingga dapat
dilakukan seleksi dan revisi butir soal.
2. Untuk menyediakan informasi tentang spesifikasi butir soal secara
lengkap, sehingga akan lebih memudahkan bagi pembuat soal dalam
menyusun perangkat soal yang akan memenuhi kebutuhan ujian dalam
bidang dan tingkat tertentu.
3. Untuk segera dapat mengetahui masalah yang terkandung dalam butir
soal, seperti: kemenduaan butir soal, kesalahan meletakkan kunci
jawaban, soal yang terlalu sukar dan terlalu mudah, atau soal yang
mempunyai daya beda rendah. Masalah ini bila diketahui dengan
segera akan memungkinkan bagi pembuat soal untuk mengambil
keputusan apakah butir soal yang bermasalah itu akan digugurkan atau
direvisi guna menentukan nilai peserta didik.

25

4. Untuk dijadikan alat guna menilai butir soal yang akan disimpan
dalam kumpulan soal. e. Untuk memperoleh informasi tentang butir
soal sehingga memungkinkan untuk menyusun beberapa perangkat
soal yang paralel. Penyusunan perangkat seperti ini sangat bermanfaat
bila akan melakukan ujian ulang atau mengukur kemampuan beberapa
kelompok peserta tes dalam waktu yang berbeda.
PEMBAHASAN
1. Deskripsi Analisis Butir Soal
Penilaian terhadap butir soal pada dasarnya merupakan analisis
butir soal, dan selama ini pada umumnya para ahli pengukuran
mengatakan bahwa analisis butir soal maksudnya adalah penilaian
terhadap soal. Telah diketahui bersama bahwa penyusunan tes sangat
mempengaruhi kualitas butir soal. Pendekatan untuk menganalisis butir
soal yang berkembang saat ini terdiri dari dua pendekatan yaitu
pendekatan klasik dan pendekatan modern. Kedua pendekatan ini masingmasing memiliki kelebihan dan kekurangan. Namun keduanya masih
sering digunakan dalam analisis butir soal. Analisis butir soal dengan
pendekatan klasik diantaranya dapat dilakukan menggunakan Program
Iteman.
Dengan melihat beberapa persyaratan yang harus dipenuhi,
penyusunan tes dituntut untuk mengikuti pedoman penyusunan tes dan
melakukan ujicoba. Kemudian berdasarkan hasil ujicoba, respon peserta
dianalisis menggunakan Program Iteman untuk mendapatkan karakteristik
butir soal. Data hasil analisis dengan Program Iteman dianalisis kembali
menggunakan instrumen penilaian butir soal yang memenuhi syarat
sebagai alat ukur yang baik. Suryabrata (1999) menyatakan bahwa analisis
butir soal mencakup telaah soal atau analisis kualitatif dan analisis
terhadap data empirik hasil ujicoba atau analisis kuantitatif.

26

Analisis butir soal secara kualitatif menekankan penilaian dari


ketiga segi yaitu materi, konstruksi, dan bahasa. Namun demikian dalam
pembahasan ini dikhususkan untuk menjelaskan analisis butir soal secara
kuantitatif. Analisis ini dilakukan berdasarkan data yang diperoleh secara
empiris melalui ujicoba dari suatu perangkat tes. Analisis kuantitatif sering
disebut dengan analisis item yang menghasilkan karakteristik atau
parameter butir dan tes, yaitu: tingkat kesukaran, daya beda dan distribusi
jawaban dan kunci setiap butir, serta reliabilitas dan kesalahan pengukuran
(SEM) dalam tes. Telah disinggung di depan bahwa analisis soal antara
lain bertujuan untuk mengadakan identifikasi soal-soal yang baik, kurang
lebih atau sedang dan soal yang tidak baik. Dengan analisis soal dapat
diperoleh informasi tentang kekurangan sebuah soal tes dan petunjuk
untuk mengadakan perbaikan.
Dalam tes dan pengukuran, dikenal beberapa karakteristik butir
soal. Untuk tes hasil belajar pada umumnya dipertimbangkan tiga
karakteristik butir soal, yaitu : tingkat kesukaran, daya beda dan distribusi
jawaban atau berfungsi tidaknya pilihan jawaban (distraktor). Ketiga
karakteristik butir soal ini secara bersama-sama akan menentukan mutu
butir soal. Bila salah satu dari ketiga karakteristik ini tidak memenuhi
persyaratan maka mutu butir soal akan turun
.
2. Analisis Butir Soal dengan Langkah Kerja Program Iteman
Micro Computer Adaptive Test (MicroCat) menyediakan program
Item analisis (Iteman) versi 3.50A,

yaitu program analisis butir soal

dengan komputer, yang edisi kelimanya dipublikasikan mulai tahun 1993.


a). Langkah-langkah Kerja Program Iteman
Program ini hanya dapat menganalisis butir soal ragam pilihan
ganda. Analisis butir soal dengan program ini relatif mudah, yang penting
diperlukan ketelitian dalam memasukkan data (data entry), karena
kesalahan memasukkan data akan berakibat tidak tepat hasil analisisnya.
Langkah-langkah untuk memasukkan data (dengan file baru) adalah
sebagai berikut:

27

1) Klik Star, pilih Program, pilih Accessories, pilih dan klik Notepad;
2) Simpan dengan klik file, pilih dan klik Save as, lalu tulis nama file
data, misalnya : IPA-1 (jangan lupa, paling banyak 8 huruf/angka);
3) Pemasukan akan lebih cepat jika dilakukan oleh dua orang, seorang
membaca jawaban siswa dan seorang menuliskan. Agar tidak keliru
antara jawaban b dan d, maka pembacaannya: a untuk a, be untuk b,
ce untuk c, del untuk d, dan e untuk e;
4) Jika dilakukan sendiri, letakkan jari tengah tangan kiri pada huruf A
dan jari telunjuk pada huruf D; jari telunjuk tangan kanan pada huruf
C dan jari tengah pada huruf B pada keyboard (papan ketik). Mata
melihat jawaban peserta tes, hasilnya akan lebih cepat;
5) Agar data tidak hilang saat listrik mati, maka sebentar-sebentar
disimpan dengan klik File dan klik Save; dan
6) Tampilan file data seperti terlihat pada halaman berikut.

28

Contoh: File Data


Jumlah soal = 35 butir; jumlah option = 4 buah; jumlah estee = 30 orang
Nomor Testee : 3 angka (ditambah satu tempat kosong, menjadi 4 karakter)
Jumlah soal

Jumlah angka dan tempat kosong


sebelum menuliskan jawaban siswa

035 O N 04
CACDABDACACDACADACADCDCCABACADBBABD
44444444444444444444444444444444444
Kunci jawaban soal
YYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYY
001 CACDOAOACOBCACAOBCOACDBCACOCDDBBOBO
002 CACDAADACACCACADACAACDCCABACADBBABD
003 CACDAADACACCADADACAACDCCABACCDBBABCJumlah option
004 CACDCADACACCADACACADODCCADACDDBBABA
005 CACDAADACACCACADACAACDCCABACADBBABD
006 CACDAADACBAOBCAAACODCAAAABAOODBABAB
Nomor urut siswa
007 CACDAADACBCDACADACCDCDCCADACDDBBACD
008 DACCADDACBCBACAAACAACDCCABACBDBBDAD
009 CACDDADCACCAACBDACADCDCCABACADBBABB
010 CACDAADACACBACABACADCDCCABACDDBBABA Siswa tidak menjawab,
011 CACDAADACACCACADACADCDCCABACADBBABD Tulis O
012 CACDAADACACDACADACAACDCCABACACBBABD
013 CADDAADACACCACADACADCDCCABACDDBBABD
014 CCADAADDACADDBACBBBDCDCAADACBDBBCBD
015 CABDAADACACDACADACADCDCCABACDDBBABD
016 CAADOADDABBDACADABBDBDCCCBACDBAACCB
Jawaban siswa
017 CACDAADACACCACADACADCDCCABACADBBABD
018 CACDAADACACDACADACADCDCCABACADBBCAD
019 CACCBADACACCACACACADCDCOADACBDBBBCA
020 CAADAABDCBABDBADDAADBACCADACDCDABCD
021 CACCAADACACDACABACADCDCCABADDDBAABD
022 CACDAADACACCACBDACBDCDCCADADDDBBACB
023 COCDABDACOOOOBAOOOOOAOCBAOOCADBBDOD
Setelah menulis huruf terakhir,
024 CACDAADACACCACADACADCDCCABACADBBABD
Ingat jangan di enter
025 CACDABDACOBBACAAACAABACAADACDCBCABD
026 CAABAADACDBBADDDAABCCAAAADACADBBDAB
027 CACDAADACACDACADACADCDCCADACADBBABD
028 CACDAADACACBACABACADODCCABACDABBABO
029 CACDAADACACDACADACADCDCCABACBDBBDCA
030 CACDBCDACABDABADDCADCDCCABACADBBABD
Gambar 1. Tampilan File Data Analisis Butir Soal dengan Iteman

29

b). Analisis Data


1) Buka Program Iteman, dengan klik Star, pilih Program, pilih dan klik
Iteman.
2) Isi nama file data, pada Enter the name of the input file: D:\IPA-1.txt lalu
tekan enter.
3) Isikan nama file hasil, pada Enter the name of the output file: D:\IPA1.has
4) lalu tekan enter.
5) Lalu muncul pertanyaan Do you want the scores written to a file? ( Y / N ).
6) maka tulislah Y dan tekan enter.
7) Isikan nama file skor, pada Enter the name of the score file: D:\IPA-1.skr
8) Lalu tekan enter, lalu enter terus sampai selesai.
9) Tampilannya seperti terlihat pada gambar berikut.
MicroCat (tm) Testing System
Copyright 1982,1984, 1986, 1988 by Assessment Systems Corporation
Beta-Test version Univ. of Pittsburgh
Item and Test Analysis Program -- ITEMAN (tm) Version 3.00

Nama file data

Enter the name of the input file: D:\IPA-1.txt


Enter the name of the output file: D:\IPA-1.has
Nama file hasil
Do you want the scores written to a file? ( Y / N ):Y
Enter the name of score file: D:\IPA-1.skr
Ditulis Y karena minta file skor
Do you have a Key Exceptions File?: No
Do you want to write statistics to an external file?: No
** Item Analysis is Complete **
Analisis selesai

Nama file skor

Gambar 2. Tampilan analisis butir soal dengan Iteman

c). Hasil Analisis Butir Soal


Buka hasil analisis pada program MsWord dengan cara:
1) klik Star, pilih Program, pilih dan klik Microsoft Word
2) klik File, klik Open, dan cari file hasil pada drive D, dengan Files of Type: All
Files
3) Contoh file hasil analisis seperti pada halaman berikut.

30

MicroCAT (tm) Testing System


Page 1
Copyright(c) 1982, 1984, 1986, 1988, 1993 by Assessment Systems
Corporation
Item and Test Analysis Program -- ITEMAN (tm) Version 3.50
Item analysis for data from file D:\IPA-1.TXT
Date: 12-15-05
Time: 7:04 pm
******************** ANALYSIS SUMMARY INFORMATION
********************
Data (Input) File: D:\IPA-1.TXT
Analysis Output File: D:\IPA-1.HAS
Score Output File: D:\IPA-1.SKR
Exceptions File: NONE
Statistics Output File: NONE
Scale Definition Codes: DICHOT = Dichotomous MPOINT =
Multipoint/Survey
Scale:

0
------Type of Scale DICHOT
N of Items
35
N of Examinees
30

Cek dulu, apakah jumlah soal dan


jumlah peserta tes, sudah benar?

***** CONFIGURATION INFORMATION *****

Taraf Sukar Soal (p)

Type of Correlations: Point-Biserial


Correction for Spuriousness: NO
Ability Grouping: YES
Subgroup Analysis: NO
Express Endorsements As: PROPORTIONS
Score Group Interval Width: 1

Daya Beda Soal (D)

Item Statistics
Alternative Statistics
----------------------- ----------------------------------Seq. Scale Prop. Disc. Point
Prop. Endorsing Point
No. -Item Correct Index Biser. Alt. Total Low High Biser. Key
---- ----- ------- ------ ------ ----- ----- ---- ---- ------ --1

0-1

0-2

.97

.00

.05
A .00 .00 .00
B .00 .00 .00
C .97 1.00 1.00 .05 *
D .03 .00 .00 -.05
Other .00 .00 .00

.93

.25

.42

.93 .75 1.00

.42 *

Persentase Testee
tidak menjawab soal

31

B .00 .00 .00


C .03 .13 .00 -.28
D .00 .00 .00
Other .03 .00 .00 -.31
6

0-6

.07

-.25 -.31
A .87 .75 1.00 .20 ?
B .07 .25 .00 -.31 *
CHECK THE KEY
C .03 .00 .00 .11
B was specified, A works better
D .03 .00 .00 -.05
Other .00 .00 .00

32

d). Menafsirkan Hasil Analisis Butir Soal


Beberapa tokoh evaluasi, yaitu: Sumadi Suryabrata, (1987); Dali S. Naga,
(1992); Suharsimi Arikunto, (1993); dan Saifuddin Azwar, (1996); telah
menetapkan suatu kriteria mutu soal, yang satu dengan lainnya relatif sama, yaitu
seperti berikut.
Tabel 1. Kriteria Kualitas Butir Soal
Kriteria
Prop Corect (Taraf Sukar Soal
atau p)
Point Biserial (Daya beda atau
D)
Prop Endorsing Proporsi
jawaban
Alpha (Reliabilitas soal)

Indeks
0,000 - 0,250
0,251 - 0,750
0,751 - 1,000
D 0,199
0,200 - 0,299
0,300 - 0,399
D 0,400
0,000 - 0,010
0,011 - 0,050
0,051 - 1,000
0,000 - 0,400
0,401 - 0,700
0,701 - 1,000

Klasifikasi
Sukar
Sedang
Mudah
Sangat Rendah
Rendah
Sedang
Tinggi
Kurang
Cukup
Baik
Rendah
Sedang
Tinggi

Untuk memudahkan memilah-milah butir soal mana yang perlu direvisi atau
didrop dianjurkan untuk menggunakan kriteria berikut

Tabel 2. Kriteria Kualitas Soal untuk Kepentingan Pemilahan Butir


Kriteria

Tingkat kesukaran
(p)

Indeks
0,000 - 0,099
0,100 - 0,299
0,300 - 0,700
0,701 - 0,900
0,901 - 1,000
D 0,199

Daya beda ( D )

Proporsi jawaban

0,200 - 0,299
0,300 - 0,399
D 0,400
0,000 - 0,010
0,011 - 0,050
0,051 - 1,000

Klasifikasi
Sangat Sukar
Sukar
Sedang
Mudah
Sangat
Mudah
Sangat
Rendah
Rendah
Sedang
Tinggi
Kurang
Cukup
Baik

Penafsiran
Dibuang / perlu revisi total
Perlu direvisi
Baik
Perlu direvisi
Dibuang / perlu direvisi total
Dibuang / perlu direvisi total
Perlu direvisi
Sedikit atau tanpa revisi
Bagus Sekali
Dibuang / perlu direvisi
Baik
Baik sekali

33

0,000 - 0,400 Rendah


Kurang baik
0,401 - 0,700 Sedang
Cukup
0,701 - 1,000 Tinggi
Baik
Dari hasil analisis butir soal di atas, dengan jumlah soal 35 butir dan sampel 30
orang, penafsiran terhadap beberapa soal tersebut antara lain seperti berikut.
Soal nomor 1, kunci jawabannya C, penafsirannya:
- Tingkat kesukaran butir soal (Prop.Corrrect) = 0,97 ; artinya butir soal ini
sangat mudah (p>0,90) karena 97 % dari peserta tes menjawab benar soal
ini.
- Daya bedanya (Biserial) = 0,05 ; artinya butir soal ini mempunyai daya
beda yang sangat rendah (D>0,20).
- Option (alternatif jawaban) A dan B tidak berfungsi sebagai pengecoh
(distraktor), maka alternatif jawaban A dan B perlu diperbaiki. Sesuai
kriteria pengecoh yang baik jika dipilih oleh 0,011 - 0,050 (1,1% - 5%).
Soal nomor 2, kunci jawabannya A, penafsirannya:
- Tingkat kesukaran butir soal (Prop.Corrrect) ini = 0,93 ; artinya butir soal
ini sangat mudah (p>0,90) karena dari 93% peserta tes, menjawab benar
soal ini.
- Daya bedanya (Biserial) = 0,42 ; artinya butir soal ini mempunyai daya
beda yang tinggi ( D>0,40 ).
- Option (alternatif jawaban) B dan D belum berfungsi sebagai pengecoh
(distraktor), karena tidak ada satu testee-pun yang memilihnya.
Soal nomor 6, kunci jawabannya B, penafsirannya:
- Analisis butir soal ini ada informasi Check The Key, B was specified, A
works better, artinya kunci jawaban A bekerja lebih baik daripada kunci
jawaban yang telah ditentukan, yaitu B. Butir soal ini perlu dicek kembali,
terbukti daya beda butir soal ini menunjukkan angka -0,31 (daya beda
sangat rendah karena D<0,20). Ini artinya, pada siswa pandai tidak dapat
menjawab benar soal ini, tetapi siswa kurang pandai dapat menjawab
benar (karena kebetulan saja).
- Tingkat kesukaran butir soal ini = 0,07 ; artinya butir soal ini sangat
sukar (p>0,10) karena kurang dari 10% dari peserta tes menjawab benar
soal ini.
- Option (alternatif jawaban) semua berfungsi sebagai pengecoh (distraktor),
karena semua alternatif jawaban soal ini ada memilih.

Reliabilitas soal

34

E). Resume Hasil Analisis, Sebaran Skor dan Penentuan Nilai


There were 30 examinees in the data file. Scale Statistics

N of Items
35 Jumlah soal
N of Examinees
30 Jumlah peserta tes
Mean
26.700 Rerata skor
Variance
33.543
Std. Dev.
5.792 Standar Deviasi
Skew
-0.689
Kurtosis
-0.946
Minimum
15.000 Skor terendah
Maximum
33.000 Skor tertinggi
Median
29.000
Alpha
0.874 Reliabilitas soal
SEM
2.058
Mean P
0.763 Taraf sukar soal
Mean Item-Tot. 0.424
Mean Biserial 0.627 Daya beda soal
Max Score (Low) 23
N (Low Group)
8
Min Score (High) 32
N (High Group)
9

SCALE # 0

Score Distribution Table

Number
FreqCum
Correct
uency
Freq PR PCT
------- ------- ------ ---- ---. . . No examinees below this score . . .
14
0
0 1
0
|
15
1
1 3
3
+###
16
0
1 3
0
|
17
3
4 13 10
|##########
18
1
5 17
3
|###
19
2
7 23
7
|#######
20
0
7 23
0
+
21
0
7 23
0
|
22
0
7 23
0
|
23
1
8 27
3
|###
24
1
9 30
3
|###
25
1
10 33
3
+###
26
2
12 40
7
|#######
27
1
13 43
3
|###

35

28
29
30
31
32
33
34
35

1
3
3
1
5
4
0
0

14
17
20
21
26
30
30
30

47
57
67
70
87
99
99
99

3
|###
10
|##########
10
+##########
3
|###
17
|#################
13
|#############
0
|
0
+
|----+----+----+----+----+
5 10 15 20 25
Percentage of Examinees

36

Scores for examinees from file D:\IPA-1.TXT


001
002
003
004
005
006
007
008
009
010
011
012
013
014
015
016
017
018
019
020
021
022
023
024
025
026
027
028
029
030

19.00
32.00
29.00
26.00
32.00
19.00
29.00
25.00
27.00
30.00
33.00
32.00
31.00
18.00
32.00
17.00
33.00
32.00
24.00
15.00
29.00
26.00
17.00
33.00
23.00
17.00
33.00
28.00
30.00
30.00

Skor di atas kita ubah menjadi nilai skala 10 dengan program MsExcel

Langkah menghitung skor Iteman dengan Program MsExcel


1.
2.
3.
4.
5.

Blok semua nomor peserta dengan skornya;


Copy dan paste di Excel;
Klik data, pilih text to columns, klik fixed width;
Klik next, next, dan finish; dan
Lalu hitung nilai, misal: membagi skor dengan jumlah soal lalu dikalikan 10.

37

DAFTAR PUSTAKA

1. Allen, M.J. & Yen, W.M. 1979. Introduction to measurement theory.


Monterey, CA: Brooks/Cole Publishing Company.
2. Arikunto, Suharsimi, 2006. Dasar-dasar Evaluasi Pendidikan. Jakarta:
Bumi Aksara.
3. Asmawi Zainul dan Noehi Nasoetion. 1997. Penilaian Hasil Belajar.
Pusat Antar

Universitas, Direktorat Jenderal Pendidikan Tinggi:

Departemen Pendidikan Dan kebudayaan.


4. Dali S. Naga. 1992. Pengantar Teori Sekor Pada Pengukuran Pendidikan.
Jakarta: Besbats.
5. Departemen Pendidikan Dan Kebudayaan. 1997. Manual Item And Test
Analysis (Iteman). Badan Penelitian dan Pengembangan Pendidikan dan
Kebudayaan: Pusat Penelitian dan Pengembangan Sistem Pengujian.
6. Hamid Hasan, S dan Asmawi Zainul. 1991. Evaluasi Hasil Belajar.
Jakarta: Depdikbud.
7. Maria,

2014.

http://mariatulannisa.blogspot.co.id/2014/02/makalah-tes-

hasil-belajar-objektif.html. diakses pada 24 Maret 2016.


8. Nunnally, J.C. 1978. Psychometric theory. New York: McGraw Hill Book
Company.

9. Popham James. W. 1995. What teachers Need to Know

38

10. Saifuddin Azwar. 1996. Tes Prestasi. Yogyakarta: Pustaka Pelajar.


11. Subino, 1987. Konstruksi Dan Analisi Tes Suatu Pengantar Kepada Teori
Tes Dan Pengukuran. Jakarta: Depdikbud.
12. Suharsimi Arikunto. 2009. Dasar-Dasar Evaluasi Pendidikan. Jakarta:
Bumi Aksara.
13. Sumadi Suryabrata. 1987. Pengembangan Tes Hasil Belajar. Jakarta:
Rajawali.
14. Suryabrata, S. 1999. Pengembangan Alat Ukur Psikologis. Direktorat
jenderal Pendidikan Tinggi: Departemen Pendidikan dan Kebudayaan.

39

Anda mungkin juga menyukai