Anda di halaman 1dari 37

Cara Analisis Butir Soal Pilihan Ganda dan Uraian

Cara Analisis Butir Soal Pilihan Ganda dan Uraian


Analisis soal dilakukan untuk mengetahui berfungsi tidaknya sebuah soal. Analisis pada
umumnya dilakukan melalui dua cara, yaitu analisis kualitatif (qualitative control) dan analisis
kuantitatif (quantitative control). Analisis kualitatif sering pula dinamakan sebagai validitas logis
(logical validity) yang dilakukan sebelum soal digunakan. Gunanya untuk melihat berfungsi
tidaknya sebuah soal. Analisis soal secara kuantitatif sering pula dinamakan sebagai validitas
empiris (empirical validity) yang dilakukan untuk melihat lebih berfungsi tidaknya sebuah soal
setelah soal itu diujicobakan kepada sampel yang representatif.

Salah satu tujuan dilakukannya analisis adalah untuk meningkatkan kualitas soal, yaitu apakah
suatu soal (1) dapat diterima karena telah didukung oleh data statistic yang memadai, (2)
diperbaiki, karena terbukti terdapat beberapa kelemahan, atau bahkan (3) tidak digunakan sama
sekali karena terbukti secara empiris tidak berfungsi sama sekali.

Analisis Kualitatif. Yaitu berupa penelaahan yang dimaksudkan untuk menganalisis soal
ditinjau dari segi teknis, isi, dan editorial. Analisis secara teknis dimaksudkan sebagai
penelaahan soal berdasarkan prinsip-prinsip pengukuran dan format penulisan soal. Analisis
secara isi dimaksudkan sebagai penelaahan khusus yang berkaitan dengan kelayakan
pengetahuan yang ditanyakan. Analisis secara editorial dimaksudkan sebagai penelaahan yang
khususnya berkaitan dengan keseluruhan format dan keajegan editorial dari soal yang satu ke
soal yang lainnya.

Analisis kualitatif lainnya dapat juga dikategorikan dari segi materi, konstruksi, dan bahasa.
Analisis materi dimaksudkan sebagai penelaahan yang berkaitan dengan substansi keilmuan
yang ditanyakan dalam soal serta tingkat kemampuan yang sesuai dengan soal. Analisis
konstruksi dimaksudkan sebagai penelaahan yang umumnya berkaitan dengan teknik penulisan
soal. Analisis bahasa dimaksudkan sebagai penelaahan soal yang berkaitan dengan penggunaan
bahasa Indonesia yang baik dan benar menurut EYD.

Analisis Kuantitatif. Digunakan untuk mengetahui sejauh mana soal dapat membedakan antara
peserta tes yang kemampuannya tinggi dalam hal yang didefinisikan oleh kriteria dengan peserta
tes yang kemampuannya rendah (melalui analisis statistik).

Analisis soal secara kuantitatif menekankan pada analisis karakteristik internal tes melalui data
yang diperoleh secara empiris. Karakteristik internal secara kuantitatif dimaksudkan meliputi
parameter soal tingkat kesukaran, daya pembeda, dan reliabilitas. Khusus soal-soal pilihan
ganda, dua tambahan parameter yaitu dilihat dari peluang untuk menebak atau menjawab soal
dengan benar dan berfungsi tidaknya pilihan jawaban, yaitu penyebaran semua alternatif jawaban
dari subyek-subyek yang dites.

Tingkat Kesukaran. Ada beberapa alasan untuk menyatakan tingkat kesukaran soal. Bisa saja
tingkat kesukaran soal ditentukan oleh kedalaman soal, kompleksitas, atau hal-hal lain yang
berkaitan dengan kemampuan yang diukur oleh soal. Namun demikian, ketika kita mengkaji
lebih mendalam terhadap tingkat kesukaran soal, akan sulit menentukan mengapa sebuah soal
lebih sukar dibandingkan dengan soal yang lain.

Secara umum, menurut teori klasik, tingkat kesukaran dapat dinyatakan melalui beberapa cara
diantaranya (1) proporsi menjawab benar, (2) skala kesukaran linear, (3) indeks Davis, dan (4)
skala bivariat. Proporsi jawaban benar (p), yaitu jumlah peserta tes yang menjawab benar pada
butir soal yang dianalisis dibandingkan dengan jumlah peserta tes seluruhnya merupakan tingkat
kesukaran yang paling umum digunakan.

Intinya, bermutu atau tidaknya butir-butir item tes hasil belajar pertama-tama dapat diketahui
dari derajat kesukaran atau taraf kesukaran yang dimiliki oleh masing-masing butir item tersebut.
Butir-butir item tes hasil belajar dapat dinyatakan sebagai butir-butir item yang baik, apabila
butir-butir item tersebut tidak terlalu sukar dan tidak pula terlalu mudah dengan kata lain derajat
kesukaran item itu adalah sedang atau cukup. Angka yang dapat memberikan petunjuk mengenai
tingkat kesulitan item itu dikenal dengan istilah difficulty index (angka indeks kesukaran item),
yang dalam dunia evaluasi hasil belajar umumnya dilambangkan dengan huruf P, yaitu singkatan
dari kata proportion (proporsi = proporsa).

Kategori Tingkat Kesukaran


Nilai p Kategori
P < 0.3 Sukar
0.3 ≤ p ≤ 0.7 Sedang
P > 0.7 Mudah
Tindak Lanjut Hasil Analisis
Interpretasi Item Tindak Lanjut
1. butir item dibuang atau didrop dan tidak dikeluarkan
lagi dalam tes-tes hasil belajar yang akan
datang 2. diteliti ulang, dilacak, dan ditelusuri
sehingga dapat diketahui faktor yang menyebabkan butir
item yang bersangkutan sulit dijawab oleh testee, apakah
kalimat soalnya kurang jelas, apakah petunjuk cara
Sukar mengerjakan soalnya sulit dipahami, ataukah dalam soal
tersebut terdapat istilah-istilah yang tidak jelas, dsb.
Setelah dilakukan perbaikan, butir-butir item tersebut
dikeluarkan lagi dalam tes hasil belajar yang akan datang.
3. butir-butir yang terlalu sulit dapat digunakan
kembali dalam tes (terutama tes seleksi) yang sifatnya
sangat ketat.
Butir item ini dapat dikeluarkan lagi dalam tes-tes hasil
Sedang
belajar pada waktu-waktu yang akan datang
1. butir item dibuang atau didrop dan tidak dikeluarkan
Mudah lagi dalam tes-tes hasil belajar yang akan
datang 2. diteliti ulang, dilacak, dan ditelusuri
sehingga dapat diketahui faktor yang menyebabkan butir
item yang bersangkutan sulit dijawab oleh testee, apakah
kalimat soalnya kurang jelas, apakah petunjuk cara
mengerjakan solnya sulit dipahami, ataukah dalam soal
tersebut terdapat istilah-istilah yang tidak jelas, dsb.
Setelah dilakukan perbaikan, butir-butir item tersebut
dikeluarkan lagi dalam tes hasil belajar yang akan datang.
3. butir-butir yang terlalu sulit dapat digunakan
kembali dalam tes (terutama tes seleksi) yang sifatnya
longgar.

Daya Pembeda. Salah satu tujuan analisis kuantitatif soal adalah untuk menentukan dapat
tidaknya suatu soal membedakan kelompok dalam aspek yang diukur sesuai dengan perbedaan
yang ada dalam kelompok itu. Indeks yang digunakan dalam membedakan antara peserta tes
yang berkemampuan rendah adalah indeks daya pembeda (item discrimination). Indeks daya
pembeda soal-soal yang ditetapkan dari selisih proporsi yang menjawab dari masing-masing
kelompok. Indeks ini menunjukkan kesesuaian antara fungsi soal dengan fungsi tes secara
keseluruhan. Dengan demikian validitas soal ini sama dengan daya pembeda soal yaitu daya
dalam membedakan antara peserta tes yang berkemampuan tinggi dengan peserta tes yang
berkemampuan rendah.

Angka yang menunjukkan besarnya daya pembeda berkisar antara -1 sampai dengan +1. Tanda
negatif menunjukkan bahwa peserta tes yang kemampuannya rendah dapat menjawab benar
sedangkan peserta tes yang kemampuannya tinggi menjawab salah. Dengan demikian soal indeks
daya pembedanya negatif menunjukkan terbaliknya kualitas peserta.
Indeks diskriminasi item umumnya diberi lambang dengan huruf D (singkatan dari
discriminatory power).
Indeks Dsikriminasi
Klasifikasi Interpretasi
Item (D)
Butir item yang bersangkutan daya
pembedanya lemah sekali (jelek),
< 0,20 Poor
dianggap tidak memiliki daya pembeda
yang baik
Butir item yang bersangkutan telah
0,20 – 0,40 Satisfactory memiliki daya pembeda yang cukup
(sedang)
Butir item yang bersangkutan telah
0,40 – 0,70 Good
memiliki daya pembeda yang baik
Butir item yang bersangkutan telah
0,70 – 1,00 Excellent
memiliki daya pembeda yang baik sekali
Butir item yang bersangkutan daya
Bertanda negatif (-) - pembedanya negative sekali (jelek
sekali)

Fungsi Distraktor. Pada saat membicarakan tes objektif bentuk multiple choice item tersebut
untuk setiap butir item yang dikeluarkan dalam tes hasil belajar telah dilengkapi dengan beberapa
kemungkinan jawab, atau yang sering dikenal dengan istilah option atau alternatif.

Option atau alternatif itu jumlahnya berkisar antara 3 sampai dengan 5 buah, dan dari
kemungkinan-kemungkinan jawaban yang terpasang pada setiap butir item itu, salah satu
diantaranya adalah merupakan jawaban betul (kunci jawaban), sedangkan sisanya adalah
merupakan jawaban salah. Jawaban-jawaban salah itulah yang biasa dikenal dengan istilah
distractor (pengecoh).

Menganalisis fungsi distraktor sering dikenal dengan istilah lain, yaitu : menganalisis pola
penyebaran jawaban item. Adapun yang dimaksud dengan pola penyebaran jawaban item adalah
suatu pola yang dapat menggambarkan bagaimana testee menentukan pilihan jawabnya terhadap
kemungkinan-kemungkinan jawab yang telah dipasangkan pada setiap butir item.

Suatu kemungkinan dapat terjadi, yaitu bahwa dari keseluruhan alternatif yang dipasang pada
butir item tertentu, sama sekali tidak dipilih oleh testee. Dengan kata lain, testee menyatakan
“blangko”. Pernyataan blangko ini sering dikenal dengan istilah omiet dan biasa diberi lambang
dengan huruf O.

Distraktor dinyatakan telah dapat menjalankan fungsinya dengan baik apabila distraktor tersebut
sekurang-kurangnya sudah dipilih oleh 5 % dari seluruh peserta tes.

Sebagai tindak lanjut atas hasil penganalisaan terhadap fungsi distraktor tersebut maka distraktor
yang sudah dapat menjalankan fungsinya dengan baik dapat dipakai lagi pada tes-tes yang akan
datang, sedangkan distraktor yang belum dapat berfungsi dengan baik sebaiknya diperbaiki atau
diganti dengan distraktor yang lain.

Reliabilitas. Keajegan dan ketidakajegan skor tes merupakan fokus dari pengkajian tentang
reliabilitas. Berikut adalah faktor yang mempengaruhi perolehan skor peserta didik (Thorndike)
yang berakibat pada ketidakajegan terhadap skor.
Faktor yang Mempengaruhi Reliabilitas Skor
Karakteristik umum yang permanen peserta tes a. kemampuan yang
dimiliki peserta didik dalam menghadapi tes
1
b. kemampuan umum dan teknik yang digunakan ketika mengambil tes
c. kemampuan umum untuk memahami petunjuk tes
Karakteristik khusus yang permanent peserta tes a. kemampuan peserta
didik yang berkaitan dengan atribut yang diukur dalam sebuah tes
b. pengetahuan dan kemampuan khusus yang berkaitan dengan soal
c. keajegan respon peserta didik terhadap pilihan jawaban (misalnya
2 mereka cenderung memberi jawaban A dari 4 alternatif yang disediakan
atau cenderung memilih B dari soal benar salah yang disajikan)
Khusus yang berkaitan dengan soal
a. pengetahuan khusus yang berkaitan dengan fakta atau konsep khusus
b. pengetahuan dan kemampuan khusus yang berkaitan dengan soal
3 Karakteristik umum yang temporer seperti : a. kesehatan
b. kelelahan
c. motivasi
d. gangguan emosi
e. kemampuan umum dan teknik yang digunakan ketika mengambil tes
f. pemahaman mekanisme tes
g. faktor panas, cahaya, ventilasi, dan lain sebagainya
Karakteristik khusus yang temporer seperti : Khusus yang berkaitan
dengan tes secara keseluruhan
a. pemahaman terhadap petunjuk tes
b. trik atau teknik-teknik mengatasi tes
c. pengalaman/latihan menghadapi tes terlebih lagi dalam tes
4
psikomotor
d. kebiasaan menghadapi sebuah tes
Khusus yang berkaitan dengan soal
a. fluktuasi ingatan yang dimiliki peserta didik
b. hal-hal yang berkaitan dengan perhatian dan keakuratan
Faktor penyelenggaraan a. waktu, bebas dari gangguan, dan petunjuk
yang jelas
5
b. pengawasan
c. penskoran
Faktor yang tidak pernah diperhitungkan a. keberuntungan karena
6 faktor menebak
b. mengingat soal yang telah dilihatnya
ANALISIS BUTIR SOAL

A. Pengertian Analisi Butir Soal

Menurut Kamus Besar Bahasa Indonesia (2002) analisis adalah penguraian suatu pokok
atas berbagai bagiannya dan penelaahan bagian itu sendiri serta hubungan antar bagian untuk
memperoleh pengertian yang tepat dan pemahaman arti keseluruhan.
Analisis butir soal yang dalam bahasa inggris disebut item analiysis dilakukan terhadap
empirik. Maksudnya, analisis itu baru dapat dilakukan apabila suatu tes telah dilaksanakan dan
hasil jawaban terhadap butir-butir soal telah kita peroleh. Analisis butir soal adalah suatu
kegiatan analisis untuk menentukan tingkat kebaikan butir-butir soal yang terdapat dalam suatu
tes sehingga informasi yang dihasilkan dapat kita pergunakan untuk memperbaiki butir soal dan
tes tersebut.

Identifikasi terhadap setiap butir item soal dilakukan dengan harapan akan
menghasilkan berbagai informasi berharga, yang pada dasarnya akan merupakan umpan
balik (feed back) guna melakukan perbaikan, pembenahan, dan penyempurnaan kembali
terhadap butir-butir soal, sehingga pada masa-masa yang akan yang akan dating tes hasil
belajar yang disusun atau dirancang oleh guru itu betul-betul dapat menjalankan
fungsinya sebagai alat pengukur hasil belajar yang memiliki kualitas yang tinggi.
Aiken dalam Suprananto (2012) berpendapat bahwa kegiatan analisis butir soal merupakan
kegiatan penting dalam penyusunan soal agar diperoleh butir soal yang bermutu. Tujuan kegiatan
ini adalah:

1. Mengkaji dan menelaah setiap butir soal agar diperoleh soal yang bermutu sebelum digunakan,
2. meningkatkan kualitas butir tes melalui revisi atau membuang soal yang tidak efektif,
3. mengetahui informasi diagnostik pada siswa apakah mereka telah memahami materi yang telah
diajarkan.
Soal yang bermutu adalah soal yang dapat memberikan informasi setepat-tepatnya tentang
siswa mana yang telah menguasai materi dan siswa mana yang belum menguasai materi.
Selanjutnya menurut Anastasia dan Urbina (1997) dalam Suprananto (2012), analisis butir soal
dapat dilakukan secara kualitatif (berkaitan dengan isi dan bentuknya) dan kuantitatif (berkaitan
dengan ciri-ciri statistiknya). Analisis kualitatif mencakup pertimbangan validitas isi dan
konstruksi, sedangkan analisis kuantitatif mencakup pengukuran validitas dan reliabilitas butir
soal, kesulitan butir soal serta diskriminasi soal. Kedua teknik ini masing-masing memiliki
keunggulan dan kelemahan, oleh karena itu teknik terbaik adalah menggunakan atau memadukan
keduanya.

B. Teknik Analisis Butir Soal


Analisis soal dilakukan untuk mengetahui berfungsi atau tidaknya sebuah soal. Analisis pada
umumnya dilakukan melalui dua cara, yaitu analisis kualitatif (qualitatif control) dan analisis
kuantitatif (quantitatif control).

1. Analisis Butir Soal Secara Kualitatif

Pada prinsipnya analisis butir soal secara kualitatif dilaksanakan berdasarkan kaidah
penulisan soal (tes tertulis, perbuatan, dan sikap). Penelaahan ini biasanya dilakukan sebelum
soal digunakan atau diujikan. Aspek yang diperhatikan dalam penelaahan secara kualitatif
mencakup aspek materi, konstruksi, bahasa atau budaya, dan kunci jawaban.

Ada beberapa teknik yang digunakan untuk menganalisis butir soal secara kualitatif, yaitu
teknik moderator dan teknik panel. Teknik moderator merupakan teknik berdiskusi yang
didalamnya terdapat satu orang sebagai penengah. Berdasarkan teknik ini, setiap butir soal
didiskusikan secara bersama-sama dengan beberapa ahli.

Sedangkan teknik panel adalah teknik menelaah butir soal berdasarkan kaidah penulisan
butir soal. Kaidah itu diantaranya adalah materi, kontruksi, bahasa atau budaya, kebenaran kunci
jawaban. Caranya beberapa penelaah diberikan beberapa butir soal yang akan ditelaah, format
penelaahan, dan pedoman penelaahan.

Dalam menganalisis butir soal secara kualitatif penggunaan format penelaahan soal akan
membantu dan mempermudah prosedur pelaksanaannya. Format penelaahan soal digunakan
sebagai dasar untuk menganalisis setiap butir soal.

2. Analisis Butir Soal Secara Kuantitatif


Penelaahan soal secara kuantitatif adalah penelaahan butir soal didasarkan pada bukti empirik.
Salah satu tujuan utama pengujian butir-butir soal secara emperik adalah untuk mengetahui
sejauh mana masing-masing butir soal membedakan antara mereka yang tinggi kemampuannya
dalam hal yang didefinisikan oleh kriteria dari mereka yang rendah kemampuannya.

Data empirik ini diperoleh dari soal yang telah diujikan. Ada dua pendekatan dalam analisis
secara kuantitatif yaitu pendekatan secara klasik dan modern.

Analisis butir soal secara klasik adalah proses penelaahan butir soal melalui informasi dari
jawaban peserta tes guna meningkatkan mutu butir soal yang bersangkutan dengan menggunakan
teori tes klasik. Pada teori tes klasik, analisis item tes dilakukan dengan memperhitungkan
kedudukan item dalam suatu kelas atau kelompok. Karakteristik atau kualitas item sangat
tergantung pada kelompok dimana diujicobakan sehingga kualitas item terikat pada sampel
responden atau peserta tes yang memberikan respons (sample bounded).

Ada beberapa kelebihan analisis butir soal secara klasik adalah murah, sederhana, familiar,
dapat dilaksanakan sehari-hari dengan cepat menggunakan komputer dan dapat menggunakan
beberapa data dari peserta tes.

Analisis butir soal secara modern adalah penelaahan butir soal dengan menggunakan teori
respon butir atau item response theory. Teori ini merupakan suatu teori yang menggunakan
fungsi matematika untuk menghubungkan antara peluang menjawab benar suatu butir dengan
kemampuan siswa.

Teori ini muncul karena adanya beberapa keterbatasan pada analisis secara klasik, yaitu:

a. Tingkat kemampuan dalam teori klasik adalah true score. Artinya, jika suatu tes sulit
maka tingkat kemampuan peserta tes akan rendah.sebaiknya, jika suatu tes mudah maka
tingkat kemampuan peserta tes tinggi.
b. Tingkat kesukaran butir soal didefinisikan sebagai proporsi peserta tes yang menjawab
benar. Mudah atau sulitnya butir soal tergantung pada kemampuan peserta tes.
c. Daya pembeda, reliabilitas, dan validitas tes tergantung pada kondisi peserta tes.

C. Parameter Item Tes yang Baik


Sebagaimana telah disebut sebelumnya, bahwa item tes yang baik adalah item yang
memenuhi syarat sebagaimana kriteria atau karakteristik item tes yang baik. Karakteristik item
yang dimaksud adalah tingkat kesulitan atau kesukaran, daya pembeda, dan efektivitas pengecoh.

1. Tingkat Kesulitan atau Kesukaran

Tingkat kesukaran soal adalah peluang menjawab benar suatu soal pada tingkat kemampuan
tertentu yang biasanya dinyatakan dalam bentuk indeks. Tingkat kesukaran dinyatakan dalam
indeks kesukaran (dificulty index), yaitu angka yang menunjukkan proporsi siswa yang
menjawab benar soal tersebut. Semakin besar indeks tingkat kesukaran yang diperoleh dan hasil
hitungan, berarti semakin mudah soal itu.

Dalam hal ini, item yang baik adalah item yang tingkat kesukarannya dapat diketahui, tidak
terlalu sukar dan tidak terlalu mudah. Sebab, tingkat kesukaran item itu memiliki korelasi dengan
daya pembeda. Bilamana item memiliki tingkat kesukaran yang maksimal, maka daya
pembedanya akan rendah, demikian pula bila item itu terlalu mudah maka tidak akan memiliki
daya pembeda.

Oleh karena itu, sebaiknya tingkat kesukaran soal itu dipertahankan dalam batas yang mampu
memberikan daya pembeda. Namun, jika terdapat tujuan khusus dalam penyusunan tes, maka
tingkat kesukaran itu bisa dipertimbangkan. Misalnya, tingkat kesukaran item untuk tes sumatif
berbeda dengan tingkat kesukaran pada tes diagnostik.

Untuk menghitung taraf kesukaran soal dari suatu tes dipergunakan rumus sebagai berikut:

TK = U + L

Keterangan:

U = jumlah siswa yang termasuk kelompok pandai (upper group) yang menjawab benar untuk
tiap soal.

L = jumlah siswa yang termasuk kurang (lower group) yang menjawab benar untuk tiap soal.

T = jumlah siswa dari kelompok pandai dan kelompok kurang (jumlah upper group dan lower
group)
Misalkan suatu tes yang terdiri atas N soal yang diberikan kepada 40 siswa. Dari hasil tes
tersebut, tiap-tiap soal dianalisis taraf kesukarannya. mula-mula hasil tes itu kita susun kedalam
peringkat, kemudian kita ambil 25% (10 lembar jawaban siswa kelompok pandai), dan 10 lembar
jawaban siswa dari kelompok yang kurang pandai. Kemudian kita tabulasikan. Misalkan dari
tabulasi soal kita peroleh hasil sebagai berikut: yang menjawab benar dari kelompok pandai ada
9 siswa, dan yang menjawab benar dari kelompok kurang pandai ada 4 siswa.

Dengan menggunakan rumus diatas, maka taraf kesukaran atau TK dari soal adalah:

TK = U + L = 9 + 4 = 0,65 atau 65%

T 20

Jadi dapat disimpilkan bahwa nilai dari TK atau tingkat kesukarannya adalah 65%.

Sedangkan dalam bukunya Drs. H. Daryanto, rumus untuk mencari taraf kesukaran atau indeks
kesukaran adalah:

P= B

JS

Keterangan:

P = indeks kesukaran.

B = banyaknya siswa yang menjawab soal itu dengan benar.

JS = jumlah seluruh siswa peserta tes.

Contoh:

Jumlah siswa peserta tes dalam suatu kelas ada 40 siswa. Dari 40 siswa tersebut terdapat 12
siswa yang mampu mengerjakan soal no. 1 dengan benar. Maka berapa indeks kesukarannya?

Jawab:

P = B
JS
= 12
40
= 0,30
Menurut ketentuan yang sering diikuti, indeks kesukaran sering diklasifikasikan sebagai berikut:
a. Soal dengan P 0,00 sampai 0,30 adalah soal sukar.

b. Soal dengan P 0,30 sampai 0,70 adalah soal sedang.

c. Soal dengan P 0,70 sampai 1,00 adalah soal mudah.

2. Daya Pembeda

Perhitungan daya pembeda adalah pengukuran sejauh mana suatu butir soal mampu
membedakan peserta didik yang sudah menguasai kompetensi dengan peserta didik yang belum
atau kurang menguasai kompetensi berdasarkan kriteria tertentu. Semakin tinggi koofisien daya
pembeda suatu butir soal, semakin mampu butir soal tersebut membedakan antara peerta didik
yang menguasai kompetensi dengan pesertan didik yang kurang menguasai kompetensi.

Angka yang menunjukkan besarnya daya pembeda disebut indeks diskriminasi. Daya
pembeda suatu soal tes dapat dihitung dengan menggunakan rumus sebagai berikut:

DP = U – L

½T

Keterangan:

DP = indeks DP atau daya pembeda yang dicari.

U = jumlah siswa yang termasuk dalam kelompok pandai yang mampu menjawab benar
untuk tiap soal.

L = jumlah siswa yang termasuk kurang yang menjawab benar untuk tiap soal.

T = jumlah siswa keseluruhan.

Contoh:

Dari hasil tes lomba olimpiade IPS, jumlah siswa yang dites adalah 40 siswa, sedangkan tes
tersebut terdiri dari 20 soal. Setelah hasil tes tersebut diperiksa, kemudian disusun kedalam
peringkat untuk menentukan 25% siswa yang termasuk kelompok pandai (upper group) dan 25%
siswa yang termasuk kelompok kurang (lower group).

Kemudian hasil tes tersebut ditabulasikan dengan menggunakan format tabulasi jawaban tes,
kemudian hasil tabulasi dari kedua kelompok tersebut dimasukkan kedalam format analisis soal
tes, sehingga kita dapat menghitung tingkat kesukaran dan daya pembeda tiap soal yang kita
analisis.

Misalkan dari tabulasi soal no. 1 kita peroleh hasil sebagai berikut: yang menjawab benar dari
kelompok pandai ada 10 siswa, dan yang menjawab benar dari kelompok kurang ada 9 siswa.
Maka daya pembedanya adalah:

DP = U – L

½T

= 10 – 9

½ x (20)

= 1

10

= 0,10

Jadi dapat disimpulkan bahwa indeks pembedanya adalah 0,10.

Dalam bukunya Prof. Dr. Suharsimi Arikunto, dijelaskan mengenai klasifikasi daya pembeda,
yaitu:

D = 0,00 – 0,20 = jelek (poor).

D = 0,20 – 0,40 = cukup (satisfactory).

D = 0,40 – 0,70 = baik (good).

D = 0,70 – 1,00 = baik sekali (excellent).

3. Analisis pengecoh (Efektifitas Distraktor )

Instrumen evaluasi yang berbentuk tes dan objektif, selain harus memenuhi syarat-syarat yang
telah disebutkan terdahulu, harus mempunyai distraktor yang efektif. Yang disebut dengan
distraktor atau pengecoh adalah opsi-opsi yang bukan merupakan kunci jawaban (jawaban
benar).

Butir soal yang baik pengecohnya akan dipilih secara merata oleh peserta didik yang
menjawab salah. Sebaliknya, butir soal yang kurang baik, pengecohnya akan dipilih secara tidak
merata. Pengecoh dianggap baik bila jumlah peserta didik yang memilih pengecoh itu sama atau
mendekati jumlah ideal. Indeks pengecoh dihitung dengan rumus:

IP = P x 100%
(N - B) (n - 1)
Keterangan:
IP = indeks pengecoh
P = jumlah peserta didik yang memilih pengecoh
N = jumlah peserta didik yang ikut tes
B = jumlah peserta didik yang menjawab benar pada setiap soal
n = jumlah alternatif jawaban
1= bilangan tetap

Catatan:

Jika semua peserta didik menjawab benar pada butir soal tertentu (sesuai kunci jawaban), maka
IP = 0 yang berarti soal tersebut jelek. Dengan demikian pengecoh tidak berfungsi.

Contoh:

50 orang peserta didik dites dengan 10 soal bentuk pilihan ganda. Tiap soal memiliki alternatif
jawaban (a, b, c, d, e). Kunci jawaban (jawaban yang benar) no. 8 adalah c. Setelah soal no.8
diperiksa untuk semua peserta didik, ternyata dari 50 orang peserta didik, 20 peserta didik
menjawab benar dan 30 peserta didik menjawab salah. Idealnya, pengecoh dipilih secara merata.

Berikut ini adalah contoh soal no.8.

Alternatif jawaban A B C D E

Distribusi jawaban peserta


7 8 20 7 8
didik

IP 93% 107% ** 93% 107%

Kualitas pengecoh ++ ++ ++ ++ ++

Keterangan:

** = kunci jawaban

++ = sangat baik

+ = baik
 = kurang baik

_ = jelek

_ _ = sangat jelek

Pada contoh diatas, IP butir a, b, c, d, dan e adalah 93%, 107%, 93%, dan 107%. Semuanya
dekat dengan angka 100%, sehingga digolongkan sangat baik sebab semua pengecoh itu
berfungsi. Jika pilihan jawaban peserta didik menumpuk pada satu alternatif jawaban, misalnya
seperti berikut:

Alternatif jawaban A B C D E

Distribusi jawaban peserta didik 20 2 20 8 0

IP 267% 27% ** 107% 0%

Kualitas pengecoh _ - ** ++ _

Dengan demikian, dapat ditafsirkan pengecoh (d) yang terbaik, pengecoh (e) dan (b) tidak
berfungsi, pengecoh (a) menyesatkan, maka pengecoh (a) dan (e) perlu diganti karena termasuk
jelek, danpengecoh (b) perlu direvisikarena kurang baik. adapun kualitas pengecoh berdasar
indeks pengecoh adalah:

Sangat baik IP = 76% - 125%

Baik IP = 51% - 75% atau 126% - 150%

Kurang baik IP = 26% - 50% atau 151% - 175%

Jelek IP = 0% - 25% atau 176% - 200%

Sangat jelek IP = lebih dari 200%

D. Manfaat Kegiatan Menganalisis Butir Soal

Berdasarkan pendapat yang diungkapkan oleh Anastasia dan Urbina (1997) dalam
Suprananto (2012), analisis butir soal memiliki banyak manfaat, diantaranya yakni:
1. Membantu pengguna tes dalam mengevaluasi kualitas tes yang digunakan,
2. relevan bagi penyusunan tes informal seperti tes yang disiapkan guru untuk siswa dikelas,
3. mendukung penulisan butir soal yang efektif,
4. secara materi dapat memperbaiki tes di kelas,
5. meningkatkan validitas soal dan reliabilitas.
Linn dan Gronlund (1995) dalam Suprananto (2012: 163), menambahkan bahwa pelaksanaan
kegiatan analisis butir soal, biasanya didesain untuk menjawab pertanyaan-pertanyaan berikut:
1. Apakah fungsi soal sudah tepat?
2. Apakah soal telah memiliki tingkat kesukaran yang tepat?
3. Apakah soal bebas dari hal-hal yang tidak relevan?
4. Apakah pilihan jawabannya efektif?
Selain itu, data hasil analisis butir soal juga sangat bermanfaat sebagai dasar untuk:
1. Diskusi tentang efisien hasil tes,
2. kerja remedial
3. peningkatan secara umum pembelajaran di kelas,
4. peningkatan keterampilan pada kontruksi tes.
Berdasarkan uraian di atas menunjukkan bahwa analisis butir soal memberikan manfaat:
1. Menentukan soal-soal yang cacat atau tidak berfungsi dengan baik,
2. meningkatkan butir soal melalui tiga komponen analisis yaitu, tingkat kesukaran, daya pembeda
dan pengecoh soal,

3. merevisi soal yang tidak relevan degan materi yang diajarkan, ditandai dengan banyaknya anak
yang tidak dapat menjawab butir soal tertentu.
1.1 Validitas Instrumen
1.1.1 Pengertian
Karakter pertama dan memiliki peranan sangat penting dalam
instrument evaluasi adalah valid. Suatu instrument dikatakan valid,
seperti yang duterangkan oleh Gay (1983) dan Johnson & Johnson
(2002), apabila instrument yang digunakan dapat mengukur apa yang
seharusnya diukur (Sukardi, 2008).
Pernyataan serupa juga disampaikan oleh Scarvia B. Anderson (dalam
Arikunto, 1997) bahwa “A test is valid if it measures what is purpose
to measure”. Atau jika diartikan krang lebih, sebuah tes dikatakan
valid apabila tes tersebut mengukur apa yang hendak diukur. Dalam
bahasa Indonesia “Valid” disebut dengan istilah “Sahih”.
Menurut Sukardi (2008: 31) validitas instrument suatu evaluasi, tidak
lain adalah derajat yang menunjukkan dimana suatu tes mengukur
apa yang hendak diukur. Validitas suatu instrument evaluasi
mempunyai beberapa makna penting diantaranya seperti berikut:
1) Validitas berhubungan dengan ketepatan interpretasi hasil tes atau
instrument evaluasi untuk group individual dan bukan instrument itu
sendiri.
2) Validitas diartikan sebagai derajat yang menunjukkan kategori yang
bisa mencakup kategori rendah, menengah dan tinggi.
3) Prinsip suatu tes valid, tidak universal. Validitas suatu tes yang
perlu diperhatikan oleh para peneliti adalah bahwa Ia hanya valid
untuk suatu tujuan tertentu saja.
1.1.2 Macam-macam Validitas
Menurut Sukardi (2008) secara metodologis validitas suatu tes dapat
dibedakan menjadi empat macam, yaitu validitas isi, validitas
konstruk, validitas konkruen dan validitas prediksi. Macam-macam
validitas tersebut akan diuraikan sebagai berikut:
1) Validitas isi
Yang dimaksud validitas isi ialah derajat dimana sebuah tes evaluasi
mengukur cakupan substansi yang ingin diukur. Untuk mendapatkan
validitas isi memerlukan dua spek penting, yaitu valid isi dan valid
teknik sampling.Valid isi mencakup khususnya, hal-hal yang berkaitan
dengan apakah item-item evaluasi menggambarkan pengukuran
dalam cakupan yang ingin diukur. Sedangkan validitas teknik
sampling pada umunya berkaitan dengan bagaimanakah baiknya
suatu sampel tes mempresentasikan total cakupan isi (Sukardi, 2008).
Sedangkan Arikunto (1997: 64) sebuah tes dikatakan memiliki validitas
isi apabila mengukur tujuan khusus tertentu yang sejajar dengan
materi atau isi pelajaran yang diberikan. Oleh karena materi yang
diberikan tertera dalam kurikulum maka validitas isi juga disebut
validitas kurikuler.
2) Validitas Konstruk
Validitas konstruk merupakan derajat yang menunjukkan suatu tes
mengukur sebuah konstruk sementara atau Hyptotetical construct.
Secara definitife, konstruk merupakan suatu sifat yang tidak dapat
diobservasi, tetapi kita dapat merasakan pengaruhnya melalui salah
satu atau dua indera kita (Sukardi, 2008).
Sedangkan Arikunto(1997: 64) sebuah tes dikatakan memiliki validitas
konstruksi apabila butir-butir soal yang membangun tes tersebut
mengukur setiap aspek berfikir seperti disebutkan dalam tujuan
instruksional khusus. Dengan kata lain jika butir-butir soal mengukur
aspek berfikir tersebut sudah sesuai dengan aspek berfikir yang
menjadi tujuan instruksional.
3) Validitas Konkruen
Validitas konkruen adalah derajat dimana skor dalam suatu tes
dihubungkan dengan skor lain yang telah dibuat. Tes dengan validitas
konkruen biasanya diadministrasi dalam waktu yang sama atau
dengan criteria valid yang sudah ada. Sering kali juga terjadi bahwa
tes dibuat atau dikembangkan untuk pekerjaan yang sama seperti
beberapa tes lainnya, tetapi dengan cara yang lebih mudah dan lebih
cepat. Validitas konkruen ditentukan dengan membangun analisis
hubungan dan perbedaan (Sukardi, 2008).
4) Validitas Prediksi
Validitas prediksi adalah derajat yang menunjukkan suatu tes dapat
memprediksi tentang bagaimana baik seseorang akan melakukan
suatu prospek atau tugas atau pekerjaan yang direncanakan. Validitas
prediksi suatu tes pada umumnya ditentukan dengan membangun
hubungan antara skor tes dan beberapa ukuran keberhasilan dalam
situasi tertentu yang digunakan untuk memprediksi keberhasilan,
yang selanjutnya disebut sebagai predictor. Sedangkan tingkah laku
yang diprediksi disebut criterion (Sukardi, 2008).
Sedangkan menurut Arikunto(1997: 66) memprediksi artinya meramal,
dan meramal selalun mengenai hal yang akan datang jika sekarang
belum terjadi. Sebuah tes memiliki validitas prediksi atau validitas
ramalan apabila mempunyai kemampuan untuk meramalkan apa
yang akan terjadi pada masa yang akan datang.
1.1.3 Faktor-faktor yang Mempengaruhi Validitas
Banyak faktor yang dapat mempengaruhi hasil tes evaluasi tidak valid.
Beberapa faktor tersebut secara garis besar dapat dibedakan menurut
sumbernya, yaitu faktor internal dari tes, faktor eksternal tes, dan
faktor yang berasal dari siswa yang bersangkutan.
1) Faktor yang berasal dari dalam tes
1. Arahan tes yang disusun dengan makna tidak jelas sehingga
dapat mengurangi validitas tes
2. Kata-kata yang digunakan dalam struktur instrument evaluasi,
tidak terlalu sulit
3. Item tes dikonstruksi dengan jelas.
4. Tingkat kesulitan item tes tidak tepat dengan materi
pembelajaran yang diterima siswa.
5. Waktu yang dialokasikan tidak tepat, hal ini termasuk
kemungkinan terlalu kurang atau terlalu longgar.
6. Jumlah item terlalu sedikit sehingga tidak mewakili sampel
7. Jawaban masing-masing item evaluasi bisa diprediksi siswa
2) Faktor yang berasal dari administrasi dan skor tes.
1. Waktu pengerjaan tidak cukup sehingga siswa dalam
memberikan jawaban dalam situasi tergesa-gesa.
2. Adanya kecrangan dalam tes sehingga tidak membedakan
antara siswa yang belajar dengan melakukan kecurangan.
3. Pemberian petunjuk dari dari pengawas yang tidak dapat
dilakukan pada semua siswa.
4. Teknik pemberian skor yang tidak konsisten.
5. Siswa tidak dapat memngikuti arahan yang diberikan dalam tes
baku.
6. Adanya joki (orang lain bukan siswa) yang masuk dalam
menjawab item tes yang diberikan.
3) Faktor yang berasal dari jawaban siswa
Seringkali terjadi bahwa interpretasi terhadap item-item tes evaluasi
tidak valid, karena dipengaruhi oleh jawaban siswa dari pada
interpretasi item-item pada tes evaluasi (Sukardi, 2008).
1.1.4 Cara Mengetahui Validitas Alat Ukur
Sebuah tes dikatakan memiliki validitas jika hasilnya sesuai dengan
kriterium, dalam arti memilki kesejajaran antara hasil tes tersebut
dengan kriterium. Teknik yang digunakan untuk mengetahui
kesejajaran adalah dengan teknik korelasi product moment yang
dikemukakan oleh pearson (Arikunto, 1997)
1.2 Reliabelitas Instrumen
1.2.1 Pengertian
Menurut Sukardi (2008: 43) relaibelitas adalah karakter lain dari
evaluasi. Reliabelitas juga dapat diartikan sama dengan konsistensi
atau keajegan. Suatu instrument evaluasi dikatakan mempunyai nilai
reliabelitas tinggi, apabila tes yang dibuat mempunyai hasil konsisten
dalam mengukur yang hendak diukur.
Sehubungan dengan reliabelitas ini Scarvia B. Anderson dan kawan-
kawan (dalam Arikunto, 1997) menyatakan bahwa persyaratan bagi
tes, yaitu validitas dan reliabelitas ini penting. Dalam hal ini validitas
lebih penting, dan reliabelitas ini perlu, karena menyokong
terbentuknya validitas. Sebuah tes mungkin reliable tapi tidak valid.
Sebaliknya tes yang valid biasanya reliable.
1.2.2 Tipe-tipe Reliabelitas
Menurut Sukardi (2008) Ada beberapa tipe reliabelitas yang digunakan
dalam kegiatan evaluasi dan masing-masing reliebelitas mempunyai
konsistensi yang berbeda-beda. Beberap tipe reliebelitas di antaranya:
tes-retes, ekivalen, dan belah dua yang ditentukan melalui korelasi.
Berbagai tipe tersebut akan diuraikan sebagai berikut:
1) Relibalelitas Dengan Tes-Retes
Reliabelitas tes-retes tidak lain adalah derajat yang menunjukkan
konsistensi hasil sebuah tes dari waktu ke waktu. Tes-Retes
menunjukkan variasi skor yang diperoleh dari penyelenggaraan satu
tes evaluasi yang dilaksanakan dua kali atau lebih, sebagai akibat
kesalahan pengukuran. Dengan kata lain, kita tertarik dalam mencari
kejelasan bahwa skor siswa mencapai suatu tes pada waktu tertentu
adalah sama hasilnya, ketika siswa itu dites lagi dengan tes yang sama.
Dengan melakukan tes-retes tersebut. Seorang guru akan mengetahui
seberapa jauh konsistensi suatu tes mengukur apa yang ingin diukur
(Sukardi, 2008).
Sedangkan Arikunto (1997: 88) Metode tes ulang (tes-retes) dilakukan
untuk menghindari dua penyusunan dua seri tes. Dalam
menggunakan teknik atau metode ini pengetes hanya memiliki satu
seri tes tapi dicobakan dua kali. Oleh karena tesnya satu dan
dicobakan dua kali, maka metode ini dapat disebut juga
dengan single-test-double-trial-method.
Reliebelitas tes retes dapat dilakukan dengan cara seperti berikut:
1. Selenggarakan tes pada suatu kelompok yang tepat sesuai
dengan rencana.
2. Setelah selang waktu tertentu, misalnya satu minggu atau dua
minggu, lakukan kembali tes yang sama dengan kelompok yang
sama tersebut.
3. Korelasikan kedua hasil tes tersebut.
Jika hasil koefisien menunjukkan tinggi, berarti reliabilias tes adalah
bagus. Sebaliknya, jika korelasi rendah, berarti tes tersebut
mempunyai konsistensi rendah (Sukardi, 2008).
2) Reliabelitas Dengan Bentuk Ekivalensi
Sesuai dengan namanya yaitu ekivalen, maka tes evaluasi yang hendak
diukur reliabelitasnya dibuat identik dengan tes acuan. Setiap
tampilannya, kecuali substansi item yang ada, dapat berbeda. Kedua
tes tersebut sebaliknya mempunyai karate yang sama. Karakteristik
yang dimaksud misalnya mengukur variabel yang sama, mempunyai
jumlah item sama, struktur sama, mempunyai tingkat kesulitan dan
mempunyai petunjuk, cara penskoran, dan interpretasi yang sama
(Sukardi 2008).
Pernyataan serupa juga disampaikan oleh Arikunto (1997: 87) tes paralel
atau equivalent adalah dua buah tes yang mempunyai kesamaan
tujuan, tingkat kesukaran dan susunan, tetapi butir-butirnya berbeda.
Dalam istilah bahasa Inggris disebut Alternate-forms method
(parallel forms).
Tes reliabelitas secara ekivalen dapat dilaksanakan dengan mengikuti
langkah-langkah sebagai berikut:
1. Tentukan sasaran yang hendak dites
2. Lakukan tes yang dimaksud kepada subjek sasaran tersebut.
3. Administrasinya hasilnya secara baik.
4. Dalam waktu yang tidak terlalu lama, lakukan pengetesan yang
kedua kalinya pada kelompok tersebut
5. Korelasikan kedua hasil skor tersebut (Sukardi, 2008).
Perlu diketahui juga bahwa tes ekivalensi mempunyai kelemahan yaitu
bahwa membuat dua buah tes yang secara esensial ekivalen adalah
sulit. Akibatnya akan selalu terjadi kesalahan pengukuran (Sukardi,
2008). Pernyataan lain juga disampaikan oleh Arikunto (1997: 88)
kelemahan dari metode ini adalah pengetes pekerjaannya berat karena
harus menyusun dua seri tes. Lagi pula harus tersedia waktu yang
lama untuk mencobakan dua kali tes.
3) Reliebilitas Dengan Bentuk Belah Dua
Menurut Sukardi (2008: 47) Reliabilitas belah dua ini termasuk
reliabilitas yang mengukur konsistensi internal. Yang dimaksud
konsistensi internal adalah salah satu tipe reliabilitas yang didasarkan
pada keajegan dalam setiap item tes evaluasi. Relibilitas belah dua ini
pelaksanaanya hanya satu kali.
Cara melakukan reliabilitas belah dua pada dasarnya dapat dilakukan
dengan urutan sebagai berikut:
1. Lakukan pengetesan item-item yang telah dibuat kepada subjek
sasaran.
2. Bagi tes yang ada menjadi dua atas dasar dua item, yang paling
umum dengan membagi item dengan nomor ganjil dengan item
dengan nomor genap pada kelompok tersebut.
3. Hitung skor subjek pada kedua belah kelompok penerima item
genap dan item ganjil.
4. Korelasikan kedua skor tersebut, menggunakan formula
korelasi yang relevan dengan teknik pengukuran (Sukardi,
2008).
Untuk mengetahui seluruh tes harus digunakan rumus Spearman-Brown
(Arikunto, 1997):
1.2.3 Faktor-Faktor Yang Mempengaruhi Reliabilitas
Instrumen
Menurut Sukardi (2008:51-52) koefisien reliabilitas dapat dipengaruhi
oleh waktu penyelenggaraan tes-retes. Interval penyelenggaraan yang
terlalu dekat atau terlalu jauh, akan mempengaruhi koefisien
reliabilitas. Faktor-faktor lain yang juga mempengaruhi reliabilitas
instrument evaluasi di antaranya sebagai berikut::
1) Panjang tes, semakin panjang suatu tes evaluasi, semakin banyak
jumlah item materi pembelajaran diukur.
2) Penyebaran skor, koefisien reliabelitas secara langsung dipengaruhi
oleh bentuk sebaran skor dalam kelompok siswa yang di ukur.
Semakin tinggi sebaran, semakin tinggi estimasi koefisien reliable.
3) Kesulitan tes, tes normative yang terlalu mudah atau terlalu sulit
untuk siswa, cenderung menghasilkan skor reliabilitas rendah.

4) Objektifitas, yang dimaksud dengan objektif yaitu derajat dimana


siswa dengan kompetensi sama, mencapai hasil yang sama
TABEL SPESIFIKASI (KISI-KISI SOAL)

BAB I
PENDAHULUAN
A. Latar Belakang Masalah
Manusia dalam hidupnya berbeda antara individu yang satu dengan individu yang
lainnya. Tidak ada dua individu yang persis sama, baik dari segi fisik maupun psikisnya. Ini
merupakan salah satu bukti keagungan Allah SWT atas segala ciptaan-Nya dan agar kita semua
berbakti kepada-Nya. Adanya perbedaan individual itu sudah barang tentu dapat menentukan
berhasil tidaknya individu-individu tersebut dalam menjalankan tugas dan kewajibannya, baik
berupa kewajiban bekerja maupun kewajiban belajar, sehingga dengan demikian dapat berakibat
pula adanya perbedaan prestasi kerja maupun prestasi belajarnya.[1]
Oleh karena itu, untuk mengetahui perbedaan tiap-tiap individu, maka diperlukan sebuah
alat untuk mengukur keadaan individu, dan alat pengukur itulah yang biasa disebut tes. Dengan
alat pengukur berupa tes tersebut, maka orang dapat mengetahui adanya perbedaan antar
individu. Karena adanya aspek psikis yang berbeda-beda yang dapat membedakan individu yang
satu dengan individu yang lain, maka kemudian timbul berbagai macam tes.
Dalam melakukan sebuah tes perlu dilakukan beberapa tahapan, tahapan pertama adalah
penyiapan perangkat tes. Untuk melakukan penyiapan perangkat tes, maka diperlukan langkah-
langkah diantaranya, menetapkan tujuan tes, analisis kurikulum, analisis buku pelajaran,
menentukan kisi-kisi.[2] Untuk menjaga agar tes yang disusun tidak menyimpang dari bahan
(materi) serta aspek kejiwaan (tingkah laku) yang dicakup dalam tes, dibuatlah tabel spesifikasi
atau juga disebut dengan kisi-kisi.

B. Rumusan Masalah
1. Teknik Tes
2. Bentuk-bentuk Tes Hasil Belajar
3. Tabel Spesifikasi (Kisi-kisi Soal)

C. Tujuan Penulisan
1. Untuk Mengetahui Teknik-teknik Tes dalam Evaluasi Pembelajaran
2. Untuk Mengetahui Bentuk-bentuk Tes Hasil Belajar
3. Untuk Mengetahui Cara Pembuatan Tabel Spesifikasi (Kisi-kisi Soal)

BAB II
PEMBAHASAN
A. Teknis Tes
1. Pengertian tes
Tes adalah alat ukur yang sangat berharga dalam penelitian. Tes merupakan seperangkat
rangsangan yang diberikan kepada seseorang dengan maksud untuk mendapatkan jawaban-
jawaban yang menjadi dasar bagi penetapan skor angka.[3] Secara harfiyah, kata “tes” berasal
dari Bahasa Perancis Kuno: testum dengan arti: “piring untuk menyisihkan logam-logam mulia”
(maksudnya dengan menggunakan alat berupa piring itu akan dapat diperoleh jenis-jenis logam
mulia yang nilainya sangat tinggi) dalam Bahasa Inggris ditulis dengan test yang dalam Bahasa
Indonesia diterjemahkan dengan “tes” , “ujian” atau “percobaan”. Dalam Bahasa Arab: imtihan
)‫(إمتحان‬.[4]
Dari definisi di atas penulis dapat memberikan kesimpulan bahwa tes adalah sesuatu yang
dilakukan oleh seseorang kepada orang lain atau peserta didik untuk mengukur sejauh mana
materi yang disampaikan itu diterima oleh tiap-tiap individu sehingga dapat mengetahui
kemampuan yang dimiliki tiap masing-masing peserta didik. Yang dimaksud dengan tes hasil
belajar ialah tes yang dipergunakan untuk menilai hasil-hasil pelajaran yang telah diberikan oleh
guru kepada murid-muridnya, atau oleh dosen kepada mahasiswa, dalam jangka waktu
tertentu.[5] Sebagaimana ditunjukkan oleh namanya, tes prestasi belajar bertujuan untuk
mengukur prestasi atau hasil yang telah dicapai oleh siswa dalam belajar.[6]
Fungsi tes secara umum terdiri atas 2 (dua) macam, yaitu:
a. Sebagai alat pengukur terhadap peserta didik. Hal yang diukur dalam hal ini berupa tingkat
perkembangan atau kemajuan yang telah dicapai oleh peserta didik setelah menempuh proses
belajar.
b. Sebagai alat pengukur keberhasilan program pengajaran karena dapat diketahui sejauh mana
program pengajaran telah dicapai oeleh peserta didik.[7]
2. Langkah-langkah Penyusunan Tes
Dalam suatu tes perlu dilakukan beberapa tahapan. Tahapan pertama adalah penyiapan
perangkat tes. Untuk melakukan penyiapan perangkat tes maka langkah yang harus diikuti secara
sistematis sehingga dapat diperoleh tes yang lebih efektif.[8] Para ahli penyusun tes maupun para
pengajar umumnya telah menyepakati langkah-langkah sebagai berikut:
a. Menentukan tujuan mengadakan tes
b. Mengadakan pembatasan terhadap bahan yang diteskan.
c. Merumuskan tujuan instruksional khusus dari tiap bagian bahan.
d. Menderetkan semua indikator dalam tabel persiapan yang memuat pula aspek tingkah laku
terkandung dalam indikator itu. Tabel ini digunakan untuk mengadakan identifikasi terhadap
tingkah laku yang dikehendaki, agar tidak terlewati.

Contoh:
TABEL TIK DAN ASPEK TINGKAH LAKU YANG DICAKUP
Indikator Ingatan Pemahaman Aplikasi Keterangan
Aspek Tingkah Laku
1. Siswa dapat menjumlahkan 2
bilangan bersusun v v
2. Siswa dapat menerangkan
hukum komulatif dan v v
seterusnya.
e. Menyusun tabel spesifikasi atau kisi-kisi yang memuat pokok materi, aspek berpikir yang diukur
beserta imbangan antara kedua hal tersebut.
f. Menuliskan butir-butir soal, didasarkan atas indikator-indikator yang sudah dituliskan pada tabel
indikator dan aspek tingkah laku yang dicakup.[9]

B. Bentuk-Bentuk Tes Hasil Belajar


Tes pada umumnya digunakan untuk menilai dan mengukur hasil belajar siswa, terutama
hasil belajar kognitif berkenaan dengan penguasaan bahan pengajaran sesuai dengan tujuan
pendidikan dan pengajaran.[10] Tes hasil belajar adalah merupakan salah satu jenis tes yang
digunakan untuk mengukur perkembangan atau kemajuan belajar peserta didik, setelah mereka
mengikuti proses pembelajaran. Sebagai alat pengukur perkembangan dan kemajuan belajar
peserta didik, apabila ditinjau dari segi bentuk soalnya, dapat dibedakan menjadi dua macam,
yaitu: tes hasil belajar bentuk uraian (essai) dan tes hasil belajar bentuk objektif.[11]

1. Soal Tes Bentuk Uraian (Essai)


Tes uraian yaitu tes yang jawabannya berupa kalimat yang relatif panjang atau berupa
karangan.[12] Tes uraian (essay test) juga dikenal dengan istilah subjektif tes (subjective test)
adalah tes hasil belajar yang memiliki karakteristik sebagai berikut: pertama, tes tersebut
berbentuk pertanyaan atau perintah yang menghendaki jawaban berupa uraian atau paparan
kalimat yang pada umumnya panjang; kedua, bentuk-bentuk pertanyaan atau perintah yang
menuntut jawaban berupa penjelasan, komentar, penafsiran, bandingan perbedaan dan
sebagainya;[13] ketiga, jumlah soalnya terbatas; keempat, umumnya diawali dengan kata
jelaskan, mengapa, bagaimana, uraikan.
a. Penggolongan tes uraian
1) Tes uraian bentuk bebas/terbuka, yaitu tes yang menghendaki jawaban dari testee sepenuhnya.
2) Tes uraian bentuk terbatas yaitu, tes yang menghendaki jawaban yang sudah terarah.[14]
b. Kelebihan dan kekurangan
1) Kelebihan tes uraian (essai)
a) Mengukur proses mental para siswa dalam menuangkan ide ke dalam jawaban item secara tepat.
b) Mengukur kemampuan siswa dalam menjawab melalui kata dan bahasa mereka sendiri.
c) Mendorong siswa untuk mempelajari, menyusun, merangkai, dan menyatakan pemikiran siswa
secara aktif.
d) Mendorong siswa untuk berani mengemukakan pendapat serta menyusun dalam bentuk kalimat
mereka sendiri.
e) Mengetahui seberapa jauh siswa telah memahami dan mendalami suatu permasalahan atas dasar
pengetahuan yang diajarkan di dalam kelas.[15]
2) Kelemahan tes uraian (essai)
a) Kadar validitas dan realibilitas rendah karena sukar diketahui segi-segi mana dari pengetahuan
siswa yang telah betul-betul dikuasai.
b) Kurang representatif dalam hal mewakili seluruh bahan pelajaran yang akan diteskan karena
soalnya hanya terbatas.
c) Cara memeriksanya banyak dipengaruhi oleh unsur-unsur subjektif.
d) Pemeriksaannya lebih sulit sebab membutuhkan pertimbangan individual lebih banyak dari
penilai.
e) Waktu untuk koreksinya lama dan tidak dapat diwakilkan kepada orang lain.[16]
c. Petunjuk operasional penyusunan tes uraian
1) Diusahakan agar butir-butir soal tes uraian dapat mencakup materi yang telah diajarkan
2) Untuk menghindari kecurangan, susunan kalimat soal dibuat berlainan dengan kalimat di buku.
3) Setelah membuat tes, hendaknya dirumuskan dengan tegas.
4) Jangan membuat dengan perintah seragam.

5) Kalimat soal hendaknya disingkat secara ringkas.


6) Hendaknya dikemukakan pedoman dalam menjawab tes.[17]
2. Soal Tes Bentuk Objektif
Tes objektif (objective test) yang juga dikenal dengan istilah tes jawaban pendek. Tes
objektif adalah salah satu jenis tes hasil belajar yang terdiri dari butir-butir soal yang dapat
dijawab oleh testee dengan jalan memilih salah satu atau lebih di antara beberapa kemungkinan
jawaban yang telah dipasangkan pada masing-masing item.[18] Pada tes objektif, tugas siswa
adalah memanipulasikan data yang telah ada di butir soal. Soal tes objektif sangat bermanfaat
untuk mengukur hasil belajar kognitif tingkat rendah. Hasil-hasil belajar kompleks seperti
menciptakan dan mengorganisasikan gagasan kurang cocok diukur menggunakan soal bentuk
ini.[19] Tes objektif dalam pemeriksaannya dapat dilakukan secara objektif. Hal ini memang
dimaksudkan untuk mengatasi kelemahan-kelemahan dari tes bentuk essai.[20]
a. Kelebihan tes objektif
1) Mengandung lebih banyak segi-segi positif, misalnya lebih representatif mewakili isi dan luas
bahan, lebih objektif, dapat dihindari campur tangannya unsur-unsur subjektif baik dari segi
siswa maupun segi guru.
2) Cara memeriksanya lebih mudah dan cepat karena dapat menggunakan kunci jawaban.
3) Pemeriksaannya bisa diwakili kepada orang lain.
4) Dalam pemeriksaannya, tidak ada unsur subjektif yang memengaruhi.[21]

b. Kelemahan tes objektif


1) Kurang memberikan kesempatan untuk menyatakan isi hati atau kecakapan yang sesungguhnya
karena anak tidak membuat kalimat.
2) Memungkinkan anak mengisi jawaban dengan coba-coba.
3) Menyusun tes ini tidak mudah, sangat memerlukan waktu yang lama.
4) Kurang ekonomis karena memakan biaya yang cukup besar ketimbang denga tes essai.
c. Macam-macam tes objektif
1) Tes benar-salah (True-False) adalah tes yang butir-butir soalnya mengharuskan siswa
mempertimbangkan suatu pernyataan sebagai pernyataan yang benar atau salah.[22]
Contoh:
a) Y-N = Apakah Surabaya ibukota Jawa Tengah?
b) R-W = Joko Widodo merupakan presiden RI yang pertama.
2) Tes pilihan ganda (Multiple Choice Test) terdiri atas suatu keterangan atau pemberitahuan
tentang suatu pengertian yang belum lengkap. Dan untuk melengkapinya harus memilih satu dari
beberapa kemungkinan jawaban yang telah disediakan.[23]
Contoh:
Termometer ialah alat untuk mengukur….
a. Suhu udara c. Curah hujan
b. Suhu badan d. Kecepatan angin.
3) Menjodohkan (Matching Test)
Dalam bentuk tradisional item tes menjodohkan terdiri dari dua kolom yang paralel. Tiap
kata, bilangan, atau simbol dijodohkan dengan kalimat, frase, atau kata dalam kolom yang
lain.[24]
Contoh:
Premis Respon
1. Ibukota Indonesia a. Athena
2. Tempat penyelenggaraan Olimpiade b. Jakarta
pertama c. New York
3. Kota terbesar di dunia d. Paris
4. Disebut kota mode dunia e. New Delhi
f. Manila
4) Tes isian (Complition Test) merupakan tes yang butir-butir soalnya terdiri dari kalimat
pernyataan yang belum sempurna, di mana siswa diminta untuk melengkapi kalimat tersebut
dengan satu atau beberapa kata pada titik-titik yang telah disediakan.[25]
Contoh:
a) Columbus menemukan Benua Amerika pada tahun…….
b) Air dapat membeku pada suhu…….derajat Fahrenheit.
d. Petunjuk operasional Penyusunan tes objektif
Dengan tujuan agar tes objektif betul-betul dapat menjalankan fungsinya sebagai alat
pengukur hasil belajar, maka petunjuk operasional berikut ini kiranya dapat dijadikan pedoman
dalam menyusun butir-butir item tes objektif.
Pertama, untuk dapat menyusun butir-butir soal tes objektif yang bermutu tinggi, pembuat
soal tes harus membiasakan diri dan sering berlatih, sehingga dari waktu ke waktu dapat
merancang dan menyusun dengan lebih baik dan sempurna.[26]
Kedua, setelah selesai melakukan tes sebaiknya menganalisa item, dengan tujuan untuk
mengetahui butir-butir item mana yang masuk dalam kategori baik atau tidak.
Ketiga, dalam rangka mencegah timbulnya permainan spekulasi dan kerjasama, perlu
disiapkan peraturan di mana untuk soal yang dijawab salah akan mendapatkan pengurangan skor.
Dengan cara demikian testee akan bekerja secara jujur dan berusaha menjawab soal menurut
keyakinannya.
Keempat, dalam menyusun soal-soal objektif hendaknya menggunakan bahasa yang
ringkas, sederhana, dan mudah dipahami oleh testee.
Kelima, agar tes objektif di samping mengungkap aspek ingatan atau hafalan juga dapat
mengungkap aspek-aspek berpikir yang lebih dalam, maka dalam merancang butir-butir item tes
objektif hendaknya tester menggunakan alat berupa Tabel Spesifikasi soal yang biasa dikenal
dengan kisi-kisi soal. Diharapkan dengan menggunakan alat itu akan terjadi keseimbangan antara
jumlah soal dengan aspek psikologis testee.

C. Tabel Spesifikasi (Kisi-kisi Soal)


1. Pengertian Kisi-kisi Soal
Dalam pembicaraan mengenai validitas tes disebutkan bahwa sebuah tes harus memiliki
validitas isi dan tingkah laku. Dan memang validitas inilah yang terpenting dalam menyusun tes
prestasi. Untuk menjaga agar tes yang disusun tidak menyimpang dari bahan (materi) serta aspek
kejiwaan (tingkah laku) yang akan dicakup dalam tes, dibuatlah sebuah tabel spesifikasi.[27]
Tabel spesifikasi yang juga dikenal dengan istilah kisi-kisi soal atau blue print adalah sebuah
tabel analisis yang di dalamnya dimuat rincian materi tes dan tingkah laku beserta proporsi yang
dikehendaki oleh tester, di mana pada tiap petak (sel) dari tabel tersebut diisi dengan angka-
angka yang menunjukkan banyaknya butir soal yang akan dikeluarkan dalam tes hasil belajar
bentuk objektif.[28]
Dalam tabel spesifikasi, salah satu sisinya memuat uraian isi yang tercakup dalam
perencanaan tes dan sisi yang lain memuat komponen perilaku yang ditunjukkan oleh tingkat
kompetensi. Bila tingkat kompetensi atau komponen perilaku yang telah diungkap telah
ditetapkan, kedua aspek perencanaan tersebut kemudian dimuat ke dalam tabel spesifikasi.[29]
Dalam hubungan dengan pembuatan tabel spesifikasi soal tes hasil belajar ini patut
diketengahkan bahwa berdasarkan pedoman penyusunan tes sumatif yang diterbitkan oleh
proyek perintis sekolah pembangunan, taraf kompetensi yang perlu diukur bagi murid-murid
Sekolah Dasar, SMTP dan SMTA adalah mencakup tiga macam, yaitu: ingatan, pemahaman, dan
aplikasi,[30] dengan proporsi seperti dapat diperiksa pada tabel dibawah ini:

Format Tabel Spesifikasi


Pokok Materi Taraf Kompetensi
Ingatan Pemahaman Aplikasi Jumlah
Bab I ……………. ……………. ………….. ……………
Bab II ……………. ……………. ………….. ……………
Bab III ……………. …………… ………….. ……………
Jumlah ……………. ……………. ………….. ……………
2. Langkah-langkah Pembuatan Kisi-kisi Soal
Misalkan seorang guru matematika ingin melakukan evaluasi hasil belajar bidang studi
matematika dengan ketentuan-ketentuan sebagai berikut:
a. Alokasi waktu tes = 90 menit
b. Materi tes diambilkan dari buku matematika, mulai dari Bab I sampai dengan Bab V, yang
setelah penelusuran ternyata memiliki perbandingan persentase sebagai berikut:
* Bab I = 10%
* Bab II = 20%
* Bab III = 25%
* Bab IV = 30%
* Bab V = 15%
c. Aspek psikologis, dalam hal ini taraf kompetensi yang ingin diungkap adalah aspek ingatan,
pemahaman, dan aplikasi dengan persentase sebagai berikut:
* Aspek ingatan = 50%
* Aspek pemahaman = 30%
* Aspek aplikasi = 20%
d. Bentuk tes = tes objektif
e. Jumlah butir soal = 60 soal
Berdasarkan ketentuan-ketentuan yang disebutkan di atas, maka dalam rangka menyusun
butir-butir soal tes objektif itu ditempuh langkah-langkah atau prosedur kerja sebagaimana
dikemukakan berikut ini:
Langkah pertama, menyiapkan tabel spesifikasinya, sebagaimana dapat dilihat pada tabel
dibawah ini.
Materi Tes Taraf Kompetensi Total
Hafalan Pemahaman Aplikasi 100%
(50%) (30%) (20%)
Bab I = 10% 3 1,8 = 2 1,2 = 1 6
Bab II = 20% 6 3,6 = 4 2,4 = 2 12
Bab III= 25% 7,5 = 8 4,5 = 4 3 15
Bab IV= 30% 9 5,4 = 5 3,6 = 4 18
Bab V = 15% 4,5 = 4 2,7 = 3 1,8 = 2 9
Total = 100% 30 18 12 60 Soal
Keterangan
Proses pembuatan tabel spesifikasi di atas adalah sebagai berikut:
a. Jumlah butir soal yang akan dikeluarkan dalam tes adalah 60 butir
b. Persentase banyaknya butir soal dilihat dari segi isi mata pelajaran yang akan diujikan:
1) Bab I = 10% x 60 = 6 butir soal
2) Bab II = 20% x 60 = 12 butir soal
3) Bab III = 25% x 60 = 15 butir soal
4) Bab IV = 30% x 60 = 18 butir soal
5) Bab V = 15 % x 60 = 9 butir soal
Total = 60 butir soal
c. Persentase banyaknya butir soal dilihat dari segi taraf kompetensi yang akan diungkap dalam tes pada masing-masing
bab:
1) Bab I: Jumlah butir soal = 6, dengan perincian:
a) Taraf ingatan = 50% x 6 =3 = 3 soal
b) Taraf pemahaman = 30% x 6 = 1,8 = 2 soal
c) Taraf aplikasi = 20% x 6 = 1,2 = 1 soal
Total = 6 soal
2) Bab II: Jumlah butir soal = 12, dengan perincian:
a) Taraf ingatan = 50% x 12 =6 = 6 soal
b) Taraf pemahaman = 30% x 12 = 3,6 = 4 soal
c) Taraf aplikasi = 20% x 12 = 2,4 = 2 soal
Total = 12 soal
3) Bab III: Jumlah butir soal = 15, dengan perincian:
a) Taraf ingatan = 50% x 15 = 7,5 = 8 soal
b) Taraf pemahaman = 30% x 15 = 4,5 = 4 soal
c) Taraf aplikasi = 20% x 15 =3 = 3 soal
Total = 15 soal
4) Bab IV: Jumlah butir soal = 18, dengan perincian:
a) Taraf ingatan = 50% x 18 =9 = 9 soal
b) Taraf pemahaman = 30% x 18 = 5,4 = 5 soal
c) Taraf aplikasi = 20% x 18 = 3,6 = 4 soal
Total = 18 soal

5) Bab V: Jumlah butir soal = 9, dengan perincian:


a) Taraf ingatan = 50% x 9 = 4,5 = 4 soal
b) Taraf pemahaman = 30% x 9 = 2,7 = 3 soal
c) Taraf aplikasi = 20% x 9 = 1,8 = 2 soal
Total = 9 soal
Langkah kedua, menetapkan bentuk dan model tes objektif yang akan diterapkan dalam
rangka evaluasi hasil belajar, sebagai berikut:
a. Untuk mengungkap aspek ingatan yang mana dalam tabel spesifikasi di atas telah ditentukan
sebanyak 30 butir soal, dengan perinciannya sebagai berikut:
1) Benar-salah, sebanyak 10 butir soal.
2) Menjodohkan, sebanyak 10 butir soal.
3) Isian, sebanyak 10 butir soal.
b. Untuk mengungkap aspek pemahaman yang mana dalam tabel spesifikasi di atas telah ditentukan
sebanyak 18 butir soal, dengan perinciannya sebagai berikut:
1) Pilihan ganda model melengkapi lima pilihan, sebanyak 6 butir soal.
2) Pilihan ganda model asosiasi dengan lima pilihan, sebanyak 6 butir soal.
3) Pilihan ganda model analisis kasus, sebanyak 6 butir soal.
c. Untuk mengungkap aspek aplikasi yang mana dalam tabel spesifikasi di atas telah ditentukan
sebanyak 12 butir soal, dengan perincian sebagai berikut:
1) Pilihan ganda model analisis hubungan antar hal, sebanyak 4 butir soal.
2) Pilihan ganda model melengkapi berganda, sebanyak 4 butir soal.
3) Pilihan ganda model hal kecuali, sebanyak 4 butir soal.
Langkah ketiga, menetapkan banyaknya butir-butir soal yang diambilkan dari tiap masing-
masing bab, sehubungan dengan taraf kompetensi yang akan diungkap dan bentuk tes objektif
yang akan digunakan.[31]
Contoh:
Format Penentuan dan Penyebaran Soal
No Kompetensi Matter Indikator Bentuk No Ket
Dasar Soal Soal
1. 1.1 Melakukan 1.1 Operasi hitung 1.2 Menbedakan PG 1
operasi hitung bilangan bulat dan bilangan bulat Isian 2
bilangan bulat pecahan dan pecahan
dan pecahan 1.3 Menerapkan Menjodoh 3
prinsip tentang kan
bilangan bulat Benar- 4
dan pecahan salah
Langkah keempat, penulisan soal merupakan salah satu langkah penting untuk dapat
menghasilkan alat ukur atau tes yang baik. Penulisan soal adalah penjabaran indikator menjadi
pertanyaan-pertanyaan yang karakteristiknya sesuai dengan pedoman tabel spesifikasi. Setiap
pertanyaan harus jelas serta menggunakan bahasa yang efektif, baik bentuk pertanyaan maupun
bentuk jawabannya.[32]

Contoh:
Format Penulisan Kisi-kisi Soal
Sekolah : ……….. Jumlah soal : ……….
Mata pelajaran : ……….. Bentuk soal : ……….
Kurikulum : ……….. Penyusun : ……….
Alokasi waktu : ………..
No Standar Kompetensi Kls/smt Materi Indikator No soal
Kompetensi Dasar pokok soal
Hal-hal yang harus diperhatikan dalam menulis soal-soal:
1. Bahasanya harus sederhana dan mudah dipahami.
2. Suatu soal tidak boleh mengandung penafsiran ganda atau membingungkan
3. Cara memenggal kalimat perlu diperhatikan agar tidak salah penafsiran. Dalam matematika
misalnya, penulisan pangkat harus diusahakan pada tempat yang semestinya.
4. Petunjuk mengerjakan. Walaupun kadang-kadang siswa sudah biasa melihat bentuk-bentuk soal,
namun petunjuk mengerjakan soal merupakan hal yang penting tidak boleh diabaikan.[33]

BAB III
PENUTUP
A. Kesimpulan
Tes merupakan seperangkat rangsangan yang diberikan kepada seseorang dengan maksud
untuk mendapatkan jawaban-jawaban yang menjadi dasar bagi penetapan skor angka. Langkah-
langkah menyusun tes, yaitu: Menentukan tujuan tes, analisis kurikulum, analisis buku pelajaran,
menentukan kisi-kisi. Ditinjau dari segi bentuk soalnya, tes dapat dibedakan menjadi dua
macam, yaitu: tes hasil belajar bentuk uraian dan tes hasil belajar bentuk objektif. Tes hasil
belajar bentuk objektif banyak macamnya, diantaranya: Tes benar-salah, pilihan ganda,
menjodohkan, dan isian.
Kisi-kisi soal adalah sebuah tabel analisis yang di dalamnya dimuat rincian materi tes dan
tingkah laku beserta proporsi yang dikehendaki oleh tester, di mana pada tiap petak (sel) dari
tabel tersebut diisi dengan angka-angka yang menunjukkan banyaknya butir soal yang
dikeluarkan dalam tes hasil belajar bentuk objektif. Langkah-langkah untuk menyusun kisi-kisi
soal, yaitu: membuat tabel spesifikasi, menetapkan bentuk dan model tes, menetapkan
banyaknya butir-butir soal, dan langkah terakhir penulisan soal.
B. Saran
Demikianlah makalah yang kami berisikan tentang Tabel Spesifikasi (Kisi-kisi Soal).
Makalah inipun tak luput dari kesalahan dan kekurangan maupun target yang ingin dicapai.
Adapun kiranya terdapat kritik, saran maupun teguran digunakan sebagai penunjang pada
makalah ini. Sebelum dan sesudahnya kami ucapkan terima kasih.

Anda mungkin juga menyukai