Anda di halaman 1dari 10

ANALISIS BUTIR TES HASIL BELAJAR

Makalah ini dibuat untuk memenuhi salah satu tugas kelompok

Mata Kuliah Evaluasi Pembelajaran PAI

Dosen Pengampu :

Roni Harsoyo, M. Pd

Disusun oleh Kelompok 9 :

1. Asfiana Wahyuningtyas
2. M. Gufron Abduhu

PROGRAM STUDI PENDIDIKAN AGAMA ISLAM SEMESTER V

SEKOLAH TINGGI AGAMA ISLAM MIFTAHUL ‘ULA


( STAIM )
NGLAWAK KERTOSONO NGANJUK
September 2019
A. Latar Belakang

Setelah tes hasil belajar (THB) ditulis sesuai dengan kaidah penulisan butir
THB yang baik dan kisi-kisi yang direncanakan, maka THB tersebut secara
teoritik sudah baik. THB yang baik harus teruji dalam dua tahap pengujian,
yaitu secara teoritik dan empiric. Untuk menguji apakah THB baik secara
empiric maka harus dilakukan uji coba untuk membakukan THB sebagai THB
yang terbaik. Analisis dilakukan atas data hasil uji coba baik dalam butir
maupun perangkatnya.

THB merupakan instrument atau alat ukur yang digunakan untuk


mengumpulkan data hasil belajar dengan cara mengukur atau mengujikannya.
Sebagai sebuah alat ukur maka THB harus memenuhi persyaratan yang
dituntut untuk dimiliki oleh sebuah alat ukur yang baik sebagaimana alat ukur
yang digunakan untuk mengumpulkan data dalam ilmu alam. Alat ukur
pengumpulan data harus memenuhi dua syarat yaitu validitas dan reliabilitas.

Dalam pengujian validitas dan reliabilitas, THB diuji kualitasnya sebagai


sebuah perangkat secara keseluruhan. Pengujian kualitas perangkat dilakukan
setelah dilakukan pengujian atas kualitas butir-butirnya. Setelah dilakukan
pemilihan butir-butir THB yang baik dan membuang butir-butir yang jelek,
butir-butir yang baik ditata sebagai sebuah perangkat. Perangkat inilah yang
kemudian diuji dalam validitas dan reliabilitas. Oleh karena itu, sebelum
pengujian kualitas perangkat dilakukan, terlebih dulu diperiksa mutu butir-
butirnya dengan melakukan analisis butir.

B. Pengertian Teori Tes Klasik


Teori tes adalah teori mengenai analisis butir tes dimana analisis dilakukan
dengan memperhitungkan kedudukan butir dalam suatu kelas atau kelompok.
Karakteristik atau kualitas butir sangat tergantung pada kelompok dimana
analisi-analisis butir dilakukan sehingga kualitas butir terikat pada sampel
responden atau siswa yang memberikan respon. Karakteristik butir
berhubungan dengan tingkat kesukaran, daya beda dan efektivitas pengecoh.
Teori tes klasik mempunyai beberapa kelemahan. 1) Karakteristik butir sangat
tergantung pada sampel siswa yang mengerjakannya. Butir THB akan berubah
karakteristiknya apabila kepada sampel butir THB yang dikerjakannya.
Kemampuan siswa dapat diinterpretasikan berbeda dalam sampel butir yang
berbeda. Seorang siswa yang pandai (mendapatkan skor tinggi) dalam suatu
THB dengan sejumlah sampel butir, mungkin akan menjadi tidak pandai
(mendapat skor rendah) pada THB dengan sejumlah sampel butir lainnya.
Untuk mengatasi keterbatasan tes klasik maka dua hal yang harus
dipertimbangkan : 1) kelompok uji coba hendaknya mempunyai karakteristik
yang semirip mungkin dengan karakteristik siswa yang hendak diukur hasil
belajarnya menggunakan THB tersebut. 2) Agar hasil analisis uji coba cermat
dan stabil maka siswa uji coba yang digunakan harus berjumlah banyak
sehingga distribusi skor lebih berfariasi. Banyak siswa uji coba menurut Gable
adalah sekitar 6 sampai 10 kali lipat banyaknya butir yang akan dianalisis.

C. Karakteristik Butir Tes Dalam Teori Tes Klasik


Dalam teori tes klasik, ada sejumlah karakteristik butir yang diuji yaitu
tingkat kesukaran, daya beda dan efektifitas pengecoh. Setiap butir akan
diperiksa mutunya dalam tiga karakteristik tersebut. Butir yang baik adalah
butir yang mempunyai tingkat kesukaran sedang, daya beda yang tinggi dan
pengecoh yang berfungsi efektif. Karakteristik butir itu diuji dengan cara
tertentu berdasarkan data hasil uji coba butir secara empiris pada siswa uji
coba.
1. Tingkat kesukaran
Tingkat kesukaran (difficulity index) atau kita singkat TK dapat
didefinisikan sebagai proporsi siswa peserta tes yang menjawab benar dan
definisi itu dapat dinyatakan dengan sebuah rumus dimana TK adalah
jumlah peserta yang menjawab benar dibagi dengan jumlah peserta.
TK = ∑B
∑P
Keterangan :
TK = tingkat kesukaran
SB = jumlah siswa yang menjawab benar
SP = jumlah siswa peserta tes
2. Daya beda
Daya beda (discriminating power) atau kita singkat DB adalah
kemampuan butir soal THB membedakan siswa yang mempunyai
kemampuan tinggi dan rendah. DB berhubungan dengan derajat
kemampuan butir membedakan dengan baik perilaku pengambil tes dalam
tes yang dikembangkan DB harus diusahakan positif dan setinggi
mungkin. Butir soal yang mempunyai DB positif dan tinggi berarti butir
tersebut dapat membedakan dengan baik siswa kelompok atas dan bawah.
Siswa kelompok atas adalah kelompok siswa yang tergolong pandai atau
mencapai skor total hasil belajar yang tinggi dan siswa kelompok bawah
adalah kelompok siswa yang bodoh atau memperoleh skor total hasil
belajar yang rendah. DB itu dapa ditentukan besarnya dengan rumus
sebagai berikut :
DB = PT – PR atau DB = ∑TB - ∑RB
∑T ∑R
Keterangan :
PT = proporsi siswa yang menjawab benar pada kelompok siswa yang
mempunyai kemampuan tinggi.
PR = proporsi siswa yang menjawab benar pada kelompok siswa yang
mempunyai kemampuan rendah.
STB = jumlah peserta yang menjawab benar pada kelompok siswa yang
mempunyai kemampuan tinggi.
ST = jumlah kelompok siswa yang mempunyai kemampuan tinggi.
SRB = jumlah peserta yang menjawab benar pada kelompok siswa yang
mempunyai kemampuan rendah.
SR = jumlah siswa yang mempunyai kemampuan rendah.
3. Efektivitas pengecoh
Analisis butir juga dilakukan dengan memperhatikan pengecoh.
Pengecoh yang juga dikenal dengan istilah penyesat atau penggoda adalah
pilihan jawaban yang bukan merupakan kunci jawaban. Pengecoh bukan
sekedar pelengkap pilihan. Pengecoh diadakan untuk menyesatkan siswa
agar tidak memilih kunci jawaban, pengecoh menggoda siswa yang kurang
begitu memahami materi pelajaran untuk memilihnya. Agar dapat
melakuka fungsinya untuk mengecoh maka pengecoh harus dibuat semirip
mungkin dengan kunci jawaban.
Pengecoh dikatakan berfungsi efektif apabila paling tidak ada siswa
yang terkecoh memilih. Pengecoh yang sama sekali tidak dipilih tidak
dapat melakukan fungsinya sebagai pengecoh karena terlalu mencolok dan
dimengerti oleh semua siswa sebagai pengecoh soal. Pengecoh yang
berdasarkan hasil uji coba tidak efektif direkomendasikan untuk diganti
dengan pengecoh yang lebih menarik.

D. Contoh Pengujian Karakteristik Butir Tes


Sehubungan dengan analisis butir secara klasik dapat diberikan contih
sebagai berikut : THB uji coba adalah 10 butir soal tes obyektif pilihan ganda
f=dengan empat pilihan. Jawaban 10 orang siswa uji coba dilaporkan hasilnya
sebagai berikut :
Siswa Butir Soal
1 2 3 4 5 6 7 8 9 10
A B D C D B B C A C D
B B C C A B A C A B C
C C D A D A D D B C B
D D B A A C B A A C A
E A C B B A C D C D B
F A D B A D B D B C B
G C D D C A D A A C A
H B D B A B C D A C D
I D D D B C D A C D B
J B D A B C D D A C B
Kunci B D C A A B D A C B

Dari sebaran jawaban tersebut, penghitungan skor uji coba dan analisis butir
dapat diringkas dalam tabel sebagai berikut :
Siswa Butir Soal Jumlah
1 2 3 4 5 6 7 8 9 10
A 1 1 1 0 0 1 0 1 1 0 6
B 1 0 1 1 0 0 0 1 0 0 4
C 0 1 0 0 1 0 1 0 1 1 5
D 0 0 0 1 0 1 0 1 1 0 4
E 0 0 0 0 1 0 1 0 0 1 3
F 0 1 0 1 0 1 1 0 1 1 6
G 0 1 0 0 1 0 0 1 1 0 4
H 1 1 0 1 0 0 1 1 1 0 6
I 0 1 0 0 0 0 0 0 0 1 2
J 1 1 0 0 0 0 1 1 1 1 6
∑B 4 7 2 4 3 3 5 6 7 5
TK 0,40 0,70 0,20 0,40 0,30 0,30 0,50 0,60 0,70 0,50
DB 0,40 0,60 0 0 -0,20 0,20 0,60 0 0,60 0,20
EP E TE E E E E E E E E

Keterangan :
SB = jumlah siswa yang menjawab benar pada butir ke 1
TK = tingkat kesukaran
DB = daya beda
EP = efektivitas pengecohan
E = efektif
TE = tidak efektif
Bila ditetapkan kriteria untuk memberikan penelitian butir adalah sebagai
berikut :
1. TK butir harus sedang yaitu antara 0,33 sampai 0,66
2. DB harus tinggi yaitu minimal +0,30
3. Pengecoh paling tidak seorang siswa ada yang memilih.

Berdasarkan ringkasan analisis butir pada tabel diatas dan kriteria penilaian
butir yang baik maka dapat ditarik kesimpulan sebagai berikut :

1. Butir 3,5, dan 6 terlalu sukar.


2. Butir 3, 4, 5, 6, 8, dan 10 tidak mampu membedakan kemampuan siswa
kelompok atas dan bawah.
3. Pada butir 2 pengecoh A tidak efektif.

Perhitungan analisis butir itu selengkapnya dilakukan sebgai berikut :

1. Tingkat kesukaran
Misalnya TK butir 1 dihitung sebagai berikut :
TK (1) = 4 = 0,40
10
2. Daya beda
Perhitungan DB dilakukan dengan langkah sebagai berikut :
a. Menemukan siswa kelompok atas dan bawah.
Kelompok atas Kelompok bawah
Siswa Skor Siswa Skor
A 6 B 4
C 5 D 4
F 6 E 3
H 6 G 4
J 6 I 2
b. Menghitung perolehan skor tiap-tiap butir pada siswa kelompok atas
dan bawah.
Kelompok atas
Siswa Butir soal
1 2 3 4 5 6 7 8 9 10
A 1 1 1 0 0 1 0 1 1 0
C 0 1 0 0 1 0 1 0 1 1
F 0 1 0 1 0 1 1 0 1 1
H 1 1 0 1 0 0 1 1 1 0
J 1 1 0 0 0 0 1 1 1 1
Jumlah 3 5 1 2 1 2 4 3 5 3

Kelompok bawah

Siswa Butir soal


1 2 3 4 5 6 7 8 9 10
B 1 0 1 1 0 0 0 1 0 0
D 0 0 0 1 0 1 0 1 1 0
E 0 0 0 0 1 0 1 0 0 1
G 0 1 0 0 1 0 0 1 1 0
I 0 1 0 0 0 0 0 0 0 1
Jumlah 1 2 1 2 2 1 1 3 2 2
c. Cara menghitung DB butir.
Misalnya DB untuk butir 1 dapat dihitung sebagai berikut :
DB(1) = 3 - 1 = 2 = 0,40
5 5 5
3. Efektivitas pengecoh

Efektivitas pengecog dapat dianalisis sebagaimana ditabulasikan dan


sebagai contoh dianalisis tida butir soal sebagai berikut :

Butir Kunci Pemilih Pengecoh Pemilih Efektivitas pengecoh


1 B 4 A 2 Efektif
C 2 Efektif
D 2 Efektif
2 D 7 A 0 Tidak efektif
B 1 Efektif
C 2 Efektif
3 C 2 A 3 Efektif
B 3 Efektif
D 2 Efektif
Dan seterusnya

E. Penutup
Kesimpulan
Sebagai alat ukur, THB harus memenuhi alat ukur yang baik yaitu validitas
dan reliabilitas. Sebelum pengujian syarat alat ukur yang baik dilakukan, maka
terlebih dahulu butir-butir THB harus diuji coba menggunakan analisis butir.
Analisis butir dapat dilakukan menggunakan teori tes klasik atau modern.
Oleh karena pertimbangan kepraktisan, tes klasik lebih banyak digunakan
dengan beberapa kekurangannya.
Dalam analisis butir menggunakan teori tes klasik, karakteristik butir yang
diuji adalah tingkat kesukarannya, daya beda dan efektivitas pengecoh. Dalam
pengujian itu keputusan butir yang baik didasarkan oleh beberapa kriteria
yaitu tingkat kesukaran harus sedang, daya beda harus positif dan tinggi, dan
pengecoh harus dipilih paling tidak satu orang peserta tes.
Saran
F. Daftar Pustaka

Purwanto. 2009. Evaluasi Hasil Belajar. Yogyakarta : Pusaka Pelajar.

Dikutip dari http://cobah-ajah.blogspot.com/2012/06/analisis-butir-tes-hasil-


belajar.html pada pukul 23.20 tanggal 23 maret 2019.