KAJIAN TEORI
A. Deskripsi Teori
sistematis dan berkelanjutan untuk menentukan kualitas (nilai dan arti) dari sesuatu,
suatu proses yang sistematis untuk menentukan atau membuat keputusan sampai
menurut Edwin Wandt dan Gerald W. Brown dalam Anas Sudijono (2012: 1)
atau suatu proses untuk menentukan nilai dari sesuatu”. Sudaryono (2012: 38)
yang menggunakan hasil pengukuran lewat informasi tes dan asesmen untuk
menentukan kualitas”.
i
Dari pemaparan para ahli dapat diketaui bahwa evaluasi merupakan suatu
proses yang digunakan untuk mengetahui nilai ketercapaian suatu tujuan kegiatan
pembelajaran akan diadakan tes kepada peserta didik agar dapat diketahui hasil
memperoleh suatu hasil suatu hasil belajar. Hasil belajar mempunyai peranan
penting dalam proses pembelajaran. Menurut Hamalik (2004: 31) “hasil belajar
“hasil belajar merupakan hasil suatu interaksi tindak belajar dan tindak mengajar.
Dari sisi guru, tindak mengajar diakhiri dengan evaluasi hasil belajar. Dari sisi
siswa, hasil belajar merupakan berakhirnya penggal dan puncak proses belajar”.
adalah perubahan tingkah laku sebagai hasil belajar dalam pengertian yang lebih
belajar adalah suatu hasil yang diperoleh siswa setelah siswa tersebut melakukan
kegiatan belajar. Serta bukti keberhasilan yang telah dicapai seseorang dengan
ii
Dari pengertian yang telah dipaparkan para ahli mengenai evaluasi dan
hasil belajar dapat disimpulkan bahwa evaluasi hasil belajar merupakan suatu
proses yang berkelanjutan dan sistematis untuk mengetahui hasil dari proses
pembelajaran yang telah dilakukan sudah baik atau belum. Evaluasi hasil belajar
Iriani dan Soeharto (2015: 279) menjelaskan bahwa “evaluasi atau penilain
berarti tindakan untuk menentukan nilai sesuatu”. Lebih luasnya yaitu suatu proses
evaluasi diantaranya adalah sebagai alat ukur keberhasilan dengan maksud untuk
Untuk menentukan seberapa jauh target program pengajaran tercapai, maka yang
dijadikan tolak ukur adalah tujuan yang sudah dirumuskan dalam tahap
sepuluh orang yang mendapat nilai 10, dan setelah hasil ulangan diperiksa ternyata
hanya ada lima orang siswa yang memperoleh nilai 10. Dengan demikian, tingkat
keberhasilan guru tersebut hanya 5/10 x 100%, yaitu sama dengan 50%. Evaluasi
iii
evaluasi bukan hanya dilakukan serampangan saja, tetapi sistematis, rinci, dan
menggunakan prosedur yang sudah diuji secara cermat. Menurut Anas Sudijono
(2012: 16-17) tujuan evaluasi pendidikan dibedakan menjadi dua yaitu tujuan
1) Tujuan umum
2) Tujuan khusus Adapun yang menjadi tujuan khusus dari kegiatan evaluasi
pendidikan.
iv
1) Tujuan umum
telah digunakan.
2) Tujuan khusus
berikut:
v
1) Evaluasi berfungsi selektif
diagnostik.
sebab-sebab kelemahan ini, akan lebih mudah dicari cara untuk mengatasi.
Sekelompok siswa yang mempunyai hasil evaluasi yang sama, akan berada
yaitu faktor guru, metode mengajar, kurikulum, sarana dan sistem kurikulum.
vi
1) Untuk mengetahui kemajuan dan perkembangan serta keberhasilan siswa
bersangkutan.
Berdasarkan pemaparan para ahli, dapat disimpulkan fungsi evaluasi adalah untuk
tertentu serta dapat mengetahui kesalahan yang ada dan kesulitan yang dialami
belajar yang harus diperhatikan guru yang pada intinya menjadi faktor
vii
Maksud dari prinsip ini adalah bahwa kegiatan evaluasi dilaksanakan secara
terus menerus.
tingkah laku siswa baik aspek berpikir, aspek nilai atau sikap, maupun aspek
yang mempengaruhi, baik yang menyangkut bentuk evaluasi maupun dari pihak
evaluator sendiri.
benar dapat mengukur apa yang hendak diukur. Sedangkan reliabilitas adalah
suatu pengukuran sejauh mana pengukuran tersebut tanpa bias dan karena itu
instrumen.
relatif
6) Prinsip kegunaan
viii
Prinsip kegunaan ini menyatakan bahwa evaluasi yang dilakukan hendaklah
merupakan sesuatu yang bermanfaat, baik bagi siswa maupun bagi pelaksana .
1) Keterpaduan
Tiga kesatuan terpadu yang tidak boleh dipisahkan yaitu tujuan instruksional,
materi dan metode pengajaran, serta evaluasi. Karena itu, perencanaan evaluasi
2) Keterlibatan siswa
Dalam proses belajar mengajar, siswa dituntut untuk lebih aktif. Guru
siswa dalam proses belajar, siswa akan kecewa apabila usahanya tidak di
evaluasi.
3) Koherensi
pengajaran yang sudah disajikan dan sesuai dengan ranah kemampuan yang
hendak diukur.
4) Pedagogis
ix
Maksud dari prinsip pedagogis adalah evaluasi juga perlu diterapkan sebagai
upaya perbaikan sikap dan tingkah laku. Bagi siswa yang berhasil diberikan
hadiah dan yang kurang berhasil mendapat hukuman yang membuat siswa lebih
5) Akuntabilitas
orang tua dan lembaga pendidikan sendiri. Pihak-pihak ini perlu mengetahui
Menurut Anas Sudijono (2012: 31-33) evaluasi hasil belajar dapat dikatakan
1) Prinsip keseluruhan
perkembangan atau perubahan tingkah laku yang terjadi pada peseerta didik.
2) Prinsip berkesinambungan
x
Prinsip kesinambungan dimaksudkan disini bahwa evaluasi hasil belajar yang
baik adalah evaluasi hasil belajar yang dilaksanakan secara teratur dan sambung
3) Prinsip obyektivitas
yang diukur
2) objektif, berarti penilaian didasarkan pada prosedur dan kriteria yang jelas,
4) terpadu, berarti penilaian merupakan salah satu komponen yang tak terpisahkan
xi
6) menyeluruh dan berkesinambungan, berarti penilaian mencakup semua aspek
2) Menghimpun data
xii
Data yang telah berhasil dihimpun harus disaring terlebih dahulu sebelum
Setelah langkah verifikasi, maka data siap untuk diolah dan dianalisis agar
Setelah diperoleh data yang sudah dianalisis, maka data yang didapatkan
Data yang sudah diketahui kesimpulannya, maka dapat dilakukan tindak lanjut
pengambilan keputusan.
1) Teknik tes
Tes adalah cara (yang dapat dipergunakan) atau prosedur (yang perlu ditempuh)
pemberian tugas atau serangkaian tugas sehingga dapat dihasilkan nilai yang
2) Teknik non-tes Dengan teknik non-tes penilaian atau evaluasi hasil belajar
xiii
dilakukan dengan melakukan pengamatan secara sistematis, melakukan
dokumen.
Suharsimi (2012: 41) mengemukakan yang tergolong teknik non tes adalah:
b) Kuesioner e) Pengamatan
a. Pengertian Pengukuran
dan kualitatif. Data ini diperoleh melalui pengukuran”. Lebih rinci mengenai
objek yang dimaksudkan untuk membedakan tingkat orang atau objek itu mengenai
hal yang diukur dengan cara sistematis”. Sementara itu Keeves dan Masters dalam
dapat disimpulkan bahwa arti pengukuran adalah pemberian nilai atau angka dari
xiv
b. Pengertian Tes
suatu teknik atau cara yang digunakan dalam rangka melaksanakan kegiatan
serangkaian tugas yang harus dikerjakan atau dijawab oleh peserta didik”.
Sedangkan F.L Goodenough dalam Anas Sudijono (2012: 67) mengemukakan “tes
adalah suatu tugas atau serangkaian tugas yang diberikan kepada individu atau
perilaku itu dengan skala numerik atau sistem kategori”. Ngalim Purwanto (2009:
33) mendeskripsikan “tes hasil belajar sebagai tes yang dipergunakan untuk menilai
hasil-hasil pelajaran yang telah diberikan oleh guru kepada murid-muridnya atau
suatu alat atau prosedur yang sistematis dan objektif untuk memperoleh data-data
boleh dikatakan tepat dan cepat”. Sementara itu Djemari Mardapi dalam Sudji
xv
dilaksanakan harus dapat menyajikan informasi dengan kesalahan sekecil mungkin
agar keputusan yang dipilih bisa tepat dan memiliki resiko yang kecil.
Dari beberapa pendapat para ahli diatas dapat disimpulkan bahwa tes
adalah suatu alat yang digunakan untuk mengetahui kemampuan peserta didik
dapat dilihat dan diukur melalui berbagai cara salah satunya dengan tes. Hal inilah
maka salah satu fungsi dari tes adalah untuk mengukur kecerdasan seseorang setelah
mendapatkan ilmu dari berbagai hal. Fungsi tes hasil belajar menurut Anas Sudijono
Tes hasil belajar merupakan salah satu evaluasi yang digunakan untuk
oleh guru. Bentuk tes hasil belajar akan memberikan pengaruh yang signifikan
terhadap hasil tes oleh peserta didik terbagi menjadi dua, yaitu:
xvi
1) Ditinjau dari segi kegunaan untuk mengukur kemampuan peserta didik :
a) Tes Diagnostik
Menurut Suharsimi (2012: 48-49) “tes diagnostik adalah tes yang digunakan
tes yang dilaksanakan untuk menentukan secara tepat, jenis kesukaran yang
dihadapi oleh peserta didik dalam suatu mata pelajaran tertentu”. Pertanyaan dalam
tes diagnostik biasanya ditekankan pada materi biasanya sukar dikerjakan atau
dipahami oleh peserta didik dengan tujuan untuk mengetahui kelemahan peserta
didik. Bila tes yang dihasilkan dari bentuk ini rendah, maka diperlukan bimbingan
khusus untuk memperbaiki penguasaan materi oleh peserta didik pada tes diagnostik
ini.
b) Tes Formatif
Anas Sudijono (2012: 71-72) mengatakan tes formatif adalah tes hasil
belajar yang bertujuan untuk mengetahui sudah sejauh manakah peserta didik “telah
terbentuk” (sesuai dengan tujuan pengajaran yang telah ditentukan) setelah mereka
mengikuti proses pembelajaran dalam jangka waktu tertentu. Sementara itu Ngalim
Purwanto (2009: 26) “penilaian formatif adalah kegiatan penilaian yang bertujuan
untuk mencari umpan balik (feedback), yang selanjutnya hasil penilaian tersebut
sednag dilaksanakan”.
xvii
Tes formatif biasa dilakukan ditengah pembelajaran yaitu dilaksanakan
pada setiap kali materi atau supokok bahasan berakhir. Tindak lanjut yang dapat
dilakukan setelah mengetahui hasil tes formatif adalah jika hasil menunjukkan
bahwa materi telah dikuasai dengan baik maka dapat dilanjutkan pada pokok
bahasan selanjutnya, namun bila materi belum dikuasai dengan baik, maka bagian-
bagian yang belum dikuasai peserta didik dapat diulangi atau dijelaskan kembali.
c) Tes Sumatif
penilaian yang dilakukan untuk memperoleh data atau informasi sampai dimana
penguasaan atau pencapaian belajar peserta didik terhadap bahan pelajaran yang
telah dipelajarinya selama jangka waktu tertentu. Anas Sudijono (2012: 72)
memaparkan “tes sumatif adalah tes hasil belajar yang dilaksanakan setelah
peserta didik sebagai laporan terhadap orang tua dan pihak-pihak yang
berkepentingan lainnya.
2) Bentuk tes yang digunakan lembaga pendidikan dari segi sistem penskoran
a) Tes Subjektif
xviii
Suharsimi (2012: 177) “tes subjektif atau tes bentuk essai adalah sejenis tes
kemajuan belajar yang memerlukan jawaban yang bersifat pembahasan atau uraian
kata-kata”. Tes uraian (essay test) , yang juga sering dikenal dengan istilah tes
subjektif (subjective test), adalah salah satu jenis tes hasil belajar yang memiliki
Tes subjektif dapat disimpulkan sebagai tes yang memberikan kebebasan kepada
peserta didik untuk menjawab pertanyaan dalam bentuk uraian. Peserta didik dapat
perintah pada pertanyaan. Penilaian pada tes subjektif dipengaruhi oleh pemberi
skor. Menurut Anas Sudijono (2012: 102) kelebihan tes subjektif adalah:
(1) Tes uraian adalah jenis tes hasil belajar yang pembuatannya dapat dilakukan
xix
(3) Melalui butir-butir soal tes uraian, penyusun soal akan dapat mengetahui
(4) Dengan menggunakan tes uraian, testee akan terdorong dan terbiasa untuk berani
(1) Tes uraian pada umumnya kurang dapat menampung atau mencakup dan
(3) Dalam pemberian skor hasil tes uraian, terdapat kecenderungan bahwa testee
(4) Pekerjaan koreksi terhadap lembar-lembar jawaban tes biasa teruraian sulit untuk
(5) Daya ketepatan mengukur validitas dan daya keajegan mengukur reliabilitas
b) Tes Objektif
test) adalah salah satu jenis tes hasil belajar yang terdiri dari butir-butir soal (items)
yang dapat dijawab oleh testee dengan jalan memilih salah satu (atau lebih) diantara
xx
dengan jalan menuliskan (mengisikan) jawabannya berupa kata-kata atau simbol-
simbol tertentu pada tempat atau ruang yang telah disediakan untuk masing-masing
(2012:180) adalah
(1) Persiapan untuk menyusunnya jauh lebih sulit daripada tes essai karena
soalnya banyak dan harus teliti untuk menghindari kelemahan yang
lainnya
(2) Soalnya cenderung untuk mengatakan ingatan dan daya pengenalan
kembali saja, dan sukar untuk mengukur proses mental yang tinggi
(3) Banyak kesempatan untuk main untung-untungan
(4) “Kerja sama” antar peserta didik pada waktu mengerjakan soal tes lebih
terbuka.
(Lay Out) soal, yaitu sebuah daftar yang meliputi: cakupan pokok bahasan yang
xxi
Adapun Bentuk / Format Kisi – kisi Soal dapat diatur sendiri oleh
guru/sekolah, yang penting Kisi-kisi itu memuat hal-hal penting. Seperti berikut ini
2) Penentuan aspek-aspek intelektual yang akan diukur dalam setiap soal, baik
3) Penentuan jenis soal, apakah essai atau obyektif atau kombinasi antara keduanya
4) Perincian tingkat kesukaran soal, biasanya soal dibuat dengan format : mudah,
sedang dan sukar dengan perbandingan = mudah : sedang : sukar = 30% : 50% :
20%.
5) Penentuan waktu ujian, waktu keseluruhan maupun rincian waktu untuk masing-
(2) Menentukan prosentase jumlah soal sesuai dengan alokasi waktu tatap muka
(ujian).
xxii
(6) Menentukan jumlah soal untuk setiap bentuk tes.
Hasil prencanaan jumlah soal dimasukkan dalam blangko kisi-kisis soal ujian.
memperhatikan prinsip-prinsip penyusunan tes hasil belajar agar tes yang dibuat
pembelajaran.
Menurut Anas Sudijono (2012: 97-99) ada beberapa prinsip dasar yang perlu
1) Tes hasil belajar harus dapat mengukur secara jelas hasil belajar (outcomes
2) Butir-butir tes hasil belajar harus merupakan sampel yang representatif dari
3) Bentuk soal yang dikeluarkan dalam tes hasil belajar harus dibuat bervariasi.
4) Tes hasil belajar harus didesain sesuai dengan kegunaannya untuk memperoleh
xxiii
6) Tes hasil belajar disamping harus dapat dijadikan alat pengukur keberhasilan
belajar peserta didik, juga harus dapat dijadikan alat untuk mencari informasi
yang berguna untuk memperbaiki cara belajar peserta didik dan cara mengajar
guru.
Menurut Suharsimi (2012: 72) “ciri-ciri tes yang baik adalah bila tes tersebut
ekonomis”.
1) Validitas
Validitas dapat diartikan sebagai ketepatan sebuah tes digunakan sebagai alat
pengukur prestasi belajar peserta didik. Tes hasil belajar dapat dinyatakan valid
apabila tes hasil belajar tersebut (sebagai alat pengukur keberhasilan belajar
peserta didik) dengan secara tepat, benar, shahih, atau absah telah dapat
mengukur atau mengungkap hasil belajar yang telah tercapai oleh peserta didik,
setelah mereka menempuh proses belajar mengajar dalam jangka waktu tertentu.
2) Reliabilitas
berulang kali pada objek yang sama. Tes dikatakan reliabel atau ajeg bila dalam
beberapa kali tes tersebut diujikan memberikan hasil yang relatif sama.
3) Objektivitas
xxiv
Suatu tes dikatakan memiliki objektivitas apabila dalam melaksanakan tes
tersebut tidak ada atau tidak dipengaruhi faktor subjektif yang mempengaruhi
4) Praktibilitas
Praktibilitas adalah apabila suatu tes bersifat praktis dan mudah dalam
(d) Ekonomis
Tes dapat dikatakan ekonomis bila dalam tes tersebut tidak membutuhkan biaya
Untuk dapat mengembangkan tes hasil belajar yang baik perlu diperhatikan
1) Perencanaan Tes
xxv
(b) Memantapkan validitas isi
Menurut Daryanto (2008: 177) “analisis butir soal adalah suatu prosedur
butir tes yang kita susun”. Analisis butir soal tes dilakukan bertujuan untuk
siswa. Menurut Nana Sudjana (2008:135) “analisis butir soal atau analisis item
yang memiliki kualitas yang memadai”. Dari pemaparan para ahli, dapat
disimpulkan bahwa analisis butir soal adalah suatu prosedur sistematis berupa
Analisis butir soal pada dasarnya bertujuan untuk mengetahui apakah setiap item
xxvi
b. Teknik analisis butir soal kuantitatif
internal tes melalui data yang diperoleh secara empiris dari soal yang telah diujikan.
Adapun dua pendekatan dalam analisis secara kuantitatif antara lain adalah
pendekatan secara teori tes klasik dan pendekatan teori respon butir.
Analisis butir soal secara klasik adalah proses penelaahan butir soal melalui
informasi dari jawaban peserta didik guna meningkatkan mutu butir soal yang
bersangkutan menggunakan teori klasik. Menurut Dali S Naga (1992: 4-6) pada
pengukuran tes klasik, kelompok butir yang sama ditempuh atau diisi oleh
kelompok peserta yang sama. Artinya skor sangat tergantung kepada butir dan
peserta tes, sehingga semua peserta yang diskor perlu menempuh uji tes yang sama
dan dalam waktu yang bersamaan. Interpretasi menjadi bersifat khusus dengan
acuan norma, serta tidak dapat mencerminkan kemampuan peserta dengan benar.
Kelebihan analisis butir soal secara klasik adalah mudah, dapat dilaksanakan sehari
hari dengan cepat menggunakan komputer, murah sederhana, familiar, dan dapat
Aspek yang perlu diperhatikan dalam analisis butir soal secara klasik adalah
setiap butir soal ditelaah dari segi reliabilitas tes, tingkat kesukaran tes, daya
xxvii
Teori respon butir merupakan teori pengkuran modern yang biasanya
digunakan dalam analisis butir soal. Pada teori ini digunakan model matematis
“teori respon butir (Item Response Theory- IRT) pada dasarnya ingin memperbaiki
kelemahan yang terdapat pada sekor klasik yaitu ketergantungan ukuran ciri peserta
Pada teori respon butir terdapat tiga macam model logistik yaitu model
logistik satu parameter (L1P) model logistik dua parameter (L2P), dan model
logistik tiga parameter (L3P). Model yang biasa digunakan adalah model logistik
satu parameter yang hanya menggunakan para meter kemampuan yaitu indeks
kesukaran butir soal, bentuk tes sesuai dengan model ini adalah tes pilihan ganda.
c. Validitas
yang berkaitan dengan sejauh mana tes telah mengukur apa yang seharusnya
diukur”. Validitas tes perlu ditentukan untuk untuk mengetahui kualitas tes dalam
kaitannya dengan mengukur hal yang seharusnya diukur. Ngalim Purwanto (2009:
hubungan antara suatu pengukuran (diagnosis) dengan arti atau tujuan kriteria
xxviii
Validitas menunjukan sejauh mana ketepatan dan kecermatan suatu alat ukur
dalam melakukan fungsi ukurnya. Hasil ukur dai pengukuran tesebut harus
mencerminkan dengan tepat fakta atau keadaan sesungguhnya dari yang diukur.
sebagai berikut:
1) Validitas Tes
a) Validitas Rasional
Validitas rasional adalah validitas yang diperoleh atas dasar hasil pemikiran,
b) Validitas Empirik
Validitas empirik adalah ketepatan mengukur yang didasarkan pada hasil analisis
bersifat empirik.
2) Validitas Item
Validitas item adalah ketepatan mengukur yang dimiliki oleh sebutir item (yang
merupakan bagian tak terpisah dari tes sebagai suatu evaluasi) dalam mengukur apa
yang seharusnya diukur lewat butir item tersebut. Untuk menghitung validitas item
Mp − Mt 𝑝
𝛾𝑏𝑝𝑖 = √
S𝑡 𝑞
Keterangan:
𝛾𝑏𝑝𝑖 : koefisien korelasi point biserial
xxix
Mp : rerata skor dari subjek yang menjawab benar
Mt : rerata skor total
St : Standar deviasi dari skor total
p : proporsi siswa yang menjawab benar
banyaknya siswa yang benar
(𝑝= )
jumlah seluruh siswa
q : proporsi siswa yang enjawab salah ( q = 1-p )
(Suharsimi, 2012:93)
Berdasarkan patokan bahwa γpbi > 0,195 berarti valid dan apabila γpbi < 0,195 maka soal tidak
valid. Indeks korelasi point biserial (γpbi) yang diperoleh dari hasil perhitungan
d. Reliabilitas
berulang kali pada objek yang sama. Tes dikatakan reliabel atau ajeg bila dalam
beberapa kali tes tersebut diujikan memberikan hasil yang relatif sama. reliabilitas
n 𝑠 2 ⅀𝑝𝑞
𝑟11 = ( )( )
n−1 𝑠2
Keterangan:
r11 : reliabilitas tes secara keseluruhan
p : proporsi subjek yang menjawab item yang benar
q : proporsi subjek yang menjawab item dengan salah
⅀pq : jumlah hasil perkalian antara p dan q
n : banyaknya item
s : standar deviasi dari tes
(Suharsimi, 2012:102)
xxx
Selanjutnya dlam pemberian perhitungan interpretasi terhadap koefisien reliabilitas
tes (r11) pada umumnya digunakan patokan sebagai berikut (Anas Sudijono,
2012:209) :
Apabila r11 sama dengan atau lebih besar daripada 0,70 berarti tes hasil
belajar yang sedang diuji reliabilitasnya dinyatakan telah memiliki
reliabilitas yang tinggi (a reliable). Apabila r11 lebih kecil daripada
0,70 berarti bahwa tes hasil belajar yang sedang diuji reliabilitasnya
dinyatakan belum memiliki reliabilitas yang tinggi (unreliable).
e. Tingkat Kesukaran
dalam tingkat sukar, sedang atau mudah. Tingkat kesukaran dapat dihitung dengan
Keterangan:
TK : indeks kesukaran/tingkat kesukaran
Bu : banyaknya kelompok unggul yang menjawab soal benar
Ba : banyaknya kelompok asor/bawah yang menjawab soal benar
Nu : Jumlah testi pada kelompok unggul
Na : Jumlah testi pada kelompok asor/bawah
Biasanya diambil : Nu=Na = 27% x N (N= Jumlah testi)
xxxi
TK : 0,71 – 1,00 : Mudah
f. Daya Pembeda
Daya pembeda soal akan mengkaji soal-soal tes dari segi kemampuan tes
tersebut dalam membedakan siswa yang masuk dalam kategori prestasi rendah
maupun tinggi. Soal yang memiliki daya pembeda akan mampu menunjukkan hasil
yang tinggi bila diberikan kepada siswa dengan prestasi tinggi dan hasil yang rendah
bila diberikan kepada siswa berprestasi rendah. Daya pembeda dapat dihitung
𝐵𝐴 𝐵𝐵
𝐷= − = 𝑃𝐴 − 𝑃𝐵
𝐽𝐴 𝐽𝐵
Keterangan:
D : Indeks daya pembeda
BA : Banyaknya peserta kelompok atas yang menjawab benar
BB : Banyaknya peserta kelompok bawah yang menjawab benar
J : Jumlah peserta tes
JA : Jumlah peserta tes dari kelompok atas
JB : Jumlah peserta tes dari kelompok bawah
𝐵
PA : 𝐽 𝐴 = Proporsi peserta kelompok atas yang menjawab benar
𝐴
𝐵𝐵
PB : =Proporsi peserta kelompok bawah yang menjawab benar
𝐽𝐵
(Suharsimi, 2012:228)
sebagai berikut :
D : 0,00-0,19 : Jelek
D : 0,20-0,39 : Cukup
D : 0,40-0,69 : Baik
D : 0,70- 1,00 : Baik Sekali
xxxii
D : Negatif, semuanya tidak baik. Jadi semua butir soal yang
mempunyai nilai D negative sebaiknya dibuang saja.
(Suharsimi, 2012:232)
g. Efektifitas Pengecoh/Distractor
banyaknya testee yang memilih pilihan jawaban atau yang tidak memilih apapun.
Dari pola sebaran jawaban dapat ditentukan apakah pengecoh dapat berfungsi atau
tidak. Suatu butir soal dapat dikategorikan sebagai soal yang baik apabila pengecoh
atau distractor dapat berfungsi dengan baik. Pengecoh yang baik ditandai dengan
dipilih oleh sedikitnya 5% dari peserta tes. Sebuah pengecoh atau distractor dapat
dikatakan berfungsi dengan baik apabila pengecoh tersebut mempunyai daya tarik
yang besar bagi peserta tes yang kurang memahami konsep atau kurang menguasai
telah dapat menjalankan fungsinya dengan baik apabila pengecoh telah dapat
fungsinya baik dapat digunakan kembali pada tes yang akan datang.
salah dapat mengecoh peserta tes yang memang tidak mengetahui kunci jawaban
yang tersedia. Semakin banyak peserta tes yang memilih pengecoh tersebut, maka
xxxiii
pengecoh tersebut dapat menjalankan fungsinya dengan baik. Butir soal yang baik
pengecohnya akan dipilih secara merata oleh peserta didik yang menjawab salah.
Sebaliknya, soal yang kurang baik pengecohnya akan dipilih tidak merata. Indeks
Keterangan :
IP : Indeks pengecoh.
P : Jumlah peserta didik yang memilih pengecoh.
N : Jumlah peserta didik yang ikut tes.
B : Jumlah peserta didik yang menjawab benar.
N : Jumlah alternatif jawaban (opsi).
1 : Bilangan tetap.
Wibisono, S. T yang sudah memiliki hak cipta dengan nomor registrasi dirjen
ganda dan juga dapat menghitung dan mencatat skor tes yang dibuat melalui bahasa
pemograman komputer serta dibuat khusus untuk analisis butir soal. Hasil analisis
meliputi taraf signifikansi, reliabilitas, tingkat kesukaran butir soal, daya pembeda
soal, statistic sebaran jawaban berupa mean, variance, standar deviasi, skew,
kurtosis untuk jumlah skor pada jawaban benar, skor minimum dan maksimum,
reliabilitas tes, kesalahan pengukurran ( standard error ) distribusi skor serta skor
xxxiv
Program Anates mengharuskan input data dalam format file .ana (teks saja).
Jawaban butir soal yang diinput dapat dilakukan melalui manual entry data atau dari
mesin scanner. Program ini juga dapat menskor atau menganlisis data soal pilihan
ganda dan uraian untuk lebih dari 100.000 peserta didik serta lebih dari 100.000
butir soal.
Program ini dibuat dengan pendekatan teori tes klasik yang berguna untuk
menentukan kualitas butir soal dan tes berdasarkan data empiris hasil uji coba. Hasil
analisis butir soal mencakup informasi mengenai validitas setiap butir (daya
(Alpha). Program ini memberikan output skor untuk setiap peserta tes.
1. Penelitian yang dilakukan oleh Agus Nur Muhammad tahun 2013 yang berjudul
“Analisi Butir Soal Uji Coba Kompetensi Kejuruan Kelas XII Teknik
a. Berdasarkan tingkat kesukaran soal, butir soal yang termasuk kriteria mudah
b. Berdasarkan tingkat daya pembeda, soal yang baik sekali berjumlah 0 butir
xxxv
0 butir (0%), berkriteria jelek sebanyak 2 butir (4,44%), sedangkan soal sangat
2. Penelitian yang dilakukan oleh Yusuf Eko Riyanto tahun 2014 yang berjudul
“Analisi Butir Soal Ujian Akhir Semester Gasal Mata Diklat Teknik Dasar
a. Bedasarkan tingkat validitas item, butir soal yang valid berjumlah 33 butir
(66%), dan butir soal yang tidak valid berjumlah 17 soal (34%)
b. Berdasarkan tingkat kesukaran soal, butir soal yang termasuk kriteria mudah
c. Berdasarkan tingkat daya pembeda, soal yang baik sekali berjumlah 3 butir
butir (26%), berkriteria jelek sebanyak 3 butir (6%), sedangkan soal sangat jelek
d. Berdasarkan tingkat reliabilitas tes, soal memiliki reliabilitas sedang atau cukup
xxxvi
e. Berdasarkan efektivitas penggunaan pengecoh, berjumlah 50 semua tidak
Persamaan dengan penelitian yang dilakukan oleh Yusuf Eko Riyanto dan Agus Nur
meneliti mengenai analisis butir soal. Perbedaan dengan penelitian yang dilakukan
oleh Yusuf Eko Riyanto adalah analisis dilakukan pada soal tes sumatif buatan guru
mata pelajaran TDO kelas X TKR dan tempat penelitian di SMK Negeri 3
dilakukan oleh Agus Nur Muhammad adalah analisis dilakukan pada soal tes
sumatif buatan guru kelas XII Teknik Pemesinan dan tempat penelitian di SMK
C. Kerangka Berpikir
dengan materi dan metode belajar mengajar yang dipakai guru dalam memberikan
materi, dan siswa dalam menerima materi tersebut. Sejauh mana keberhasilan guru
memberikan materi dan sejauh mana siswa menyerap materi yang disajikan itu dapat
diperoleh informasinya melalui evaluasi. Analisis butir soal Ujian Akhir Semester
(UAS) digunakan oleh guru untuk mengetahui bagaimana peserta didiknya dalam
menerima pelajaran selama ini. Dalam melakukan analisis butir soal perlu
xxxvii
diperhatikan beberapa hal yaitu Validitas, Reliabilitas, Tingkat Kesukaran, Daya
Oleh karena itu diperlukan analisis butir soal yang digunakan pada Ujian
SMK Muhammadiyah Pakem. Dimana dengan hasil analisis butir soal tersebut akan
diketahui soal mana yang berkualitas dan tidak berkualitas. Tingkat validitas
berkenaan dengan ketepatan alat penilaian terhadap konsep yang dinilai sehingga
betul-betul menilai apa yang seharusnya dinilai. Soal dikatakan valid apabila skor
butir soal yang bersangkutan terbukti mempunyai korelasi positif yang signifikan
dengan skor totalnya. Untuk melihat apakah soal tersebut valid (sahih) harus
membandingkan skor peserta didik yang didapat dalam tes dengan skor yang
dianggap sebagai nilai baku. Tingkat reliabilitas suatu tes dapat dilihat apabila tes
tersebut menghasilkan hasil yang tetap. Reliabilitas tes atau keajekan berhubungan
terjadi dapat dikatakan tidak berarti. Tes yang reliabel jika koefisien reliabilitasnya
tinggi dan kesalahan baku pengukurannya rendah. Tingkat kesukaran soal adalah
peluang untuk menjawab benar suatu soal pada tingkat kemampuan tertentu yang
biasanya dinyatakan dalam bentuk indeks. Indeks tingkat kesukaran ini, pada
Semakin besar indeks tingkat kesukaran yang diperoleh dari hasil perhitungan,
xxxviii
Dengan demikian, tingkat kesukaran dipandang dari sudut siswa yang
mengerjakan soal, bukan dari sudut pandang guru sebagai pembuat soal. Daya
pembeda soal adalah kemampuan soal untuk membedakan antara siswa yang
mampu (menguasai materi) dan siswa yang kurang mapu (belum menguasai materi).
Semakin tinggi indeks daya pembeda yang diperoleh, maka semakin baik soal
tersebut dalam membedakan peserta didik yang satu dengan yang lainnya. Analisis
tersebut telah berfungsi secara efeketif atau tidak. Butir soal yang baik, pengecohnya
akan dipilih secara merata oleh peserta didik yang menjawab salah. Sebaliknya,
butir soal yang kurang baik pengecohnya akan dipilih secara tidak merata. Pengecoh
yang baik ditandai dengan dipilih oleh sedikitnya 5% dari peserta tes Analisis butir
mengikuti pelajaran dan dapat mengetahui mana siswa yang paham dan mana yang
tidak. Hasil yang diperoleh dari menganalisis butir soal adalah diketahuinya mana
soal yang berkualitas dan mana yang tidak. Apabila terdapat butir soal yang kurang
baik dapat direvisi dan digunakan kembali, butir soal yang tidak baik dapat dibuang
sedangkan butir soal yang baik disimpan di dalam bank soal dan dapat digunakan
kembali. Analisis butir soal juga dapat dijadikan guru sebagai acuan untuk membuat
xxxix
Gambar 1. Diagram Kerangka berpikir
D. Pertanyaan Penelitian
xl
3. Bagaimanakah tingkat kesukaran Soal Ujian Akhir Semester Gasal Mata
4. Bagaimanakah daya pembeda Soal Ujian Akhir Semester Gasal Mata Pelajaran
xli