Anda di halaman 1dari 26

BAB I

PENDAHULUAN

A. Latar Belakang

Biologimu.com Pendidikan merupakan salah satu sarana peningkat kualitas hidup manusia. Lembaga
pendidikan, sekolah misalnya memegang peranan yang cukup penting dalam proses pendidikan. Guru
sebagai pelaksana pendidikan juga berperan sebagai pendidik sekaligus fasilitator yang mengarahkan
siswanya untuk mencapai tujuan pendidikan.

Untuk mencapai tujuan pendidikan, seorang guru harus mengadakan evaluasi. Dengan evaluasi, maka
maju dan mundurnya kualitas pendidikan dapat diketahui, dan dengan evaluasi pula, kita dapat
mengetahui titik kelemahan serta mudah mencari jalan keluar untuk berubah menjadi lebih baik ke
depan Evaluasi pada dasarnya sebagai dasar keputusan, menyusun kebijakan, maupun progam
selanjutnya, keputusan apakah akan dilanjutkan, diperbaiki atau dihentikan.

Evaluasi adalah suatu proses merencanakan, memperoleh, dan rnenyediakan informasi yang sangat
diperlukan untuk membuat alternatif-alternatif keputusan. Berdasarkan pengertian tersebut maka
setiap kegiatan evaluasi atau penilaian merupakan suatu proses yang sengaja direncanakan untuk
memperoleh informasi atau data. Sehubungan dengan hal tersebut di dalam proses pembelajaran perlu
adanya teknik dalam menyusun dan melaksanakan tes hasil belajar. Setelah tes hasil belajar (THB) di
tulis sesuai dengan kaidah penulisan butir THB yang baik dan kisi-kisi yang di rencanakan, maka THB
tersebut secara teoritik sudah baik. THB yang baik harus teruji dalam dua tahap pengujian, yaitu secara
teoritik dan empiric. Untuk menguji apakah THB baik secara empirik maka harus di lakukan uji coba
untuk membakukan THB sebagai THB yang baik. Analisis di lakukan atas data hasil uji coba baik dalam
butir maupun perangkatnya.

B. Rumusan Masalah

Apakah pengertian dari analisis butir tes hasil belajar?

Apa saja manfaat analisis butir tes hasil belajar?

Bagaimana cara mengaanalisis butir tes hasil belajar?


C. Tujuan

Untuk mengetahui pengertian dari analisis butir tes hasil belajar

Untuk mengetahui manfaat analisis butir tes hasil belajar

Untuk mengetahui cara menganalisis butir tes hasil belajar

BAB II

PEMBAHASAN

A. Pengertian Analisis Tes Hasil Belajar

Kata tes berasal dari bahasa Prancis kuno yang berarti piring untuk menyisihkan logam-logam mulia
yang dimaksud disini adalah dengan menggunakan alat berupa piring akan dapat diperoleh jenis-jenis
logam mulia yang bernilai tinggi. Dalam perkembangannya dan seiirng kemujuan zaman tes berate ujian
atau percobaan. Ada beberapa istilah yang memerlukan penjelasan sehubungan dengan uraian diatas
yaitu test, testing, tester dan testee, yang masing-masing mempunyai pengertian berbeda namun erat
kaitannya dengan tes.

Tes adalah alat atau prosedur yang dipergunakan dalam rangka pengukuran dan penilaian,

Testing berarti saat dilaksanakannya pengukuran dan penilaian atau saat pengambilan tes

Tester artinya orang yang melaksanakan tes atau orang yang diserahi untuk melaksanakan pengambilan
tes terhadap para responden

Testee adalah pihak yang sedang dikenai tes.

Suatu tes akan berisiskan pertanyaan-pertanyaan dan atau soal-soal yang harus dijawab dan atau
dipecahkan oleh individu yang dites (testee), maka disebut tes hasil belajar (achievement test).
Berdasarkan pendapat itu, tes hasil belajar biasanya terdiri dari sejumlah butir soal yang memiliki tingkat
kesukaran tertentu (ada yang mudah, sedang, dan sukar). Tes tersebut harus dapat dikerjakan oleh
siswa dalam waktu yang sudah ditentukan. Oleh karena itu, tes hasil belajar merupakan power test.
Maksudnya adalah mengukur kemampuan siswa dalam menjawab pertanyaan atau permasalahan. Soal-
soal yang terdapat dalam tes hasil belajar seharusnya dilakukan analisis terlebih dahulu agar soal yang
diberikan bersifat baik dan bermutu.
Aiken dalam Suprananto (2012) berpendapat bahwa kegiatan analisis butir soal merupakan kegiatan
penting dalam penyusunan soal agar diperoleh butir soal yang bermutu. Tujuan kegiatan ini adalah:
mengkaji dan menelaah setiap butir soal agar diperoleh soal yang bermutu sebelum digunakan,
meningkatkan kualitas butir tes melalui revisi atau membuang soal yang tidak efektif, mengetahui
informasi diagnostik pada siswa apakah mereka telah memahami materi yang telah diajarkan. Soal yang
bermutu adalah soal yang dapat memberikan informasi setepat-tepatnya tentang siswa mana yang telah
menguasai materi dan siswa mana yang belum menguasai materi. Selanjutnya menurut Anastasia dan
Urbina (1997) dalam Suprananto (2012), analisis butir soal dapat dilakukan secara kualitatif (berkaitan
dengan isi dan bentuknya) dan kuantitatif (berkaitan dengan ciri-ciri statistiknya). Analisis kualitatif
mencakup pertimbangan validitas isi dan konstruksi, sedangkan analisis kuantitatif mencakup
pengukuran validitas dan reliabilitas butir soal, kesulitan butir soal serta diskriminasi soal. Kedua teknik
ini masing-masing memiliki keunggulan dan kelemahan, oleh karena itu teknik terbaik adalah
menggunakan atau memadukan keduanya. Dalam menganalisis hasil tes ada 4 cara untuk menilai tes,
yaitu :

Meneliti secara jujur soal-soal yang sudah disusun, kadang-kadang dapat diperoleh jawaban ketidak
jelasan perintah atau bahasa, taraf kesukaran, dan lain-lain keadaan soal tersebut.

Mengadakan analisis soal (item analysis). Analisis soal adalah suatu prosedur yang sistematis yang akan
memberikan informasi-informasi yang sangat khusus terhadap butir tes yang kita susun.

Mengadakan checking validitas. Validitas yang paling penting dari tes buatan guru adalah validitas
kurikuler, kita harus merumuskan tujuan setiap bagian pelajaran secara khusus dan jelas sehingga setiap
soal dapat kita jodohkan dengan setiap tujuan khusus tersebut.

Mengadakan checking reliabilitas. Salah satu indicator untuk tes yang mempunyai reliabilitas yang tinggi
adalah bahwa kebanyakan dari soal-soal tes itu mempunyai daya pembeda tinggi.

B. Fungsi Analisis Tes Hasil Belajar

Berdasarkan pendapat yang diungkapkan oleh Anastasia dan Urbina (1997) dalam Suprananto (2012),
analisis butir soal memiliki banyak manfaat, diantaranya yakni:

Membantu pengguna tes dalam mengevaluasi kualitas tes yang digunakan

Relevan bagi penyusunan tes informal seperti tes yang disiapkan guru untuk siswa dikelas,

Mendukung penulisan butir soal yang efektif

Secara materi dapat memperbaiki tes di kelas

Meningkatkan validitas soal dan reliabilitas.


Selain itu, data hasil analisis butir soal juga sangat bermanfaat sebagai dasar untuk:

Diskusi tentang efisien hasil tes,

Kerja remedial,

Peningkatan secara umum pembelajaran di kelas,

Peningkatan keterampilan pada kontruksi tes.

Berdasarkan uraian di atas menunjukkan bahwa analisis butir soal memberikan manfaat:

Menentukan soal-soal yang cacat atau tidak berfungsi dengan baik,

Meningkatkan butir soal melalui tiga komponen analisis yaitu, tingkat kesukaran, daya pembeda dan
pengecoh soal

Merevisi soal yang tidak relevan degan materi yang diajarkan, ditandai dengan banyaknya anak yang
tidak dapat menjawab butir soal tertentu.

A.Teori Tes Klasik

Salah satu teori pengukuran yang tertua didunia pengukuran behavioral adalah classical true-score
theory. Teori ini sering disebut dengan teori tes klasik. Teori tes klasik merupakan sebuah teori yang
mudah dalam penerapannya serta model yang cukup berguna dalam mendeskripsikan bagaimana
kesalahan dalam pengukuran dapat mempengaruhi skor amatan. Inti teori klasik adalah asumsi-asumsi
yang dirumuskan secara sistematis serta dalam jangka waktu yang lama. Dari asumsi-asumsi tersebut
kemudian dijabarkan dalam beberapa kesimpulan.

Ada tujuh macam asumsi yang ada dalam teori tes klasik ini. Allen & Yen menguraikan asumsi-asumsi
teori klasik sebagai berikut:

Asumsi pertama teori tes klasik adalah bahwa terdapat hubungan antara skor tampak (observed score)
yang dilambangkan dengan huruf X, skor murni (true score) yang dilambangkan dengan T dan skor
kasalahan (error) yang dilambangkan dengan E. Menurut Saifuddin Azwar (2001:30) yang dimaksud
kesalahan pada pengukuran dalam teori klasik adalah penyimpangan tampak dari skor harapan teoritik
yang terjadi secara random. Hubungan itu adalah bahwa besarnya skor tampak ditentukan oleh skor
murni dan kesalahan pengukuran. Dalam bahasa matematika dapat dilambangkan dengan X = T + E.
Asumsi kedua adalah bahwa skor murni (T) merupakan nilai harapan є (X). Dengan demikian skor murni
adalah nilai rata-rata skor perolehan teoretis sekiranya dilakukan pengukuran berulang-ulang (sampai
tak terhingga) terhadap seseorang dengan menggunakan alat ukur.

Asumsi ketiga teori tes klasik menyatakan bahwa tidak terdapat korelasi antara skor murni dan skor
pengukuran pada suatu tes yang dilaksanakan (ρet = 0). Implikasi dari asumsi adalah bahwa skor murni
yang tinggi tidak akan mempunyai error yang selalu positif ataupun selalu negatif.

Asumsi keempat meyatakan bahwa korelasi antara kesalahan pada pengukuran pertama dan nol (ρe1e2
= 0). Artinya bahwa skor-skor kesalahan pada dua tes untuk mengukur hal yang sama tidak memiliki
korelasi (hubungan). Dengan kesalahan pada pengukuran kedua adalah nol (demikian besarnya
kesalahan pada suatu tes tidak bergantung kesalahan pada tes lain.

Asumsi kelima menyatakan bahwa jika terdapat dua tes untuk mengukur atribut yang sama maka skor
kesalahan pada tes pertama tidak berkorelasi dengan skor murni pada tes kedua (ρelt2). Asumsi ini akan
gugur jika salah satu tes tersebut ternyata mengukur aspek yang berpengaruh terhadap teradinya
kesalahan pada pengukuran yang lain.

Asumsi keenam teori tes klasik adalah menyajikan tentang pengertian tes yang pararel. Dua perangkat
tes dapat dikatakan sebagai tes-tes yang pararel jika skor-skor populasi yang menempuh kedua tes
tersebut mendapat skor murni yang sama (T = T’ ) dan varian skor-skor kesalahannya sama (se 2=se’2).
Dalam prakteknya, asumsi keenam teori ini sulit terpenuhi.

Asumsi terakhir dari teori tes klasik menyatakan tentang definisi tes yang setara (essentially t
equivalent). Jika dua perangkat tes mempunyai skor-skor perolehan dan Xt1 dan Xt2 yang memenuhi
asumsi 1 sampai 5dan apabila untuk setiap populasi subyek X1 =X2 + C12, dimana C12 adalah bilangan
konstanta, maka kedua tes disebut tes yang pararel.

C. Teori tes klasik

Teori tes adalah teori mengenai analisis butir tes di mana analisis dilakukan dengan memperhitungkan
kedudukan butir dalam suatu kelas atau kelompok. Karakteristik atau kualitas butir sangat tergantung
pada kelompok di mana analisis analisis butir dilakukan sehingga kualitas butir terikat pada sampel
responden atau siswa yang memberikan respons (sample bounded). Karakteristik butir berhubungan
dengan tingkat kesukaran, daya beda dan efektivitas pengecoh.

Teori tes klasik mempunyai beberapa kelemahan .1) Karakteristik butir sangat tergantung pada sampel
siswa yang mengerjakannya. Butir THB akan berubah karakteristik nya apabila kepada sampel butir THB
yang di kerjakan nya .Kemampuan siswa dapat diinterprestasikan berbeda dalam sampel butir yang
berbeda .seorang siswa yang pandai (mendapatkan sekor tinggi )dalam suatu THB dengan sejumlah
sampel butir,mungkin akan menjadi tidak pandai(mendapat skor rendah )padaTHB dengan sejumlah
sampel butir lainnya (Naga,1992).
Untuk mengatasi keterbatasan tes klasik maka dua hal yang harus di pertimbangkan: 1) Kelompok uji
coba hendak nya nempunyai karakteristik yang semirip mungkim dengan kara kteristik siswa yang
hendak di ukur hasil belajar nya mennggunakan THB tersebut. 2) Agar hasil analisis uji coba cermat dan
setabilmaka siswa uji coba yang di gunakan harus berjumlah banyak sengga distribusi sekor lebih
berfariasi.Banyak siswa uji coba menurut Gable (1986) adalah sekitar 6 sampai10 kali lipat banyaknya
butir yang akan dianalisis.

D. Karakteristik butir dalam teori tes klasik

Dalam teori tes klasik,ada sejumlah karakteristik butir yang di uji yaitu tingkat kesukaran,daya beda dan
efektifitas pengecoh.Setiap butir akan diperiksa mutunya dalam tiga karakteristik tersebut.Butir yang
baik adalah butir yang mempunyai tingkat kesukaran sedang,daya beda yang tinggi dan pengecoh yang
berfungsi efektif.Karakteristik butir itu diuji dengan cara tertentu berdasarkan data hasil uji coba butir
secara empiris pada siswa uji coba.

1. Tinkat kesukaran

Tinkat kesukaran (difficulity index)atau kita singkat TK dapat didefinisikan sebagai proporsi siswa peserta
tes yang menjawab benar (crorcker dan Algina,1986:311).definisi itu dapat dinyatakan dengan sebuah
rumus dimana TK adalah jumlah peserta yang menjawab benar dibagi dgn jumlah peserta.

TK =

ΣB

ΣP

Keterangan:

TK=tingkat kesukaran

SB=jumlah siswa yang menjawab benar

SP=jumlah siswa peserta tes


Misalnya: dari 10siswa yang mengikuti uji coba THB,pada butir1 terdapat 7orang dapat menjawab benar
dan pada butir2 terdapat 2 orang dapat menjawab benar.berapakah tingkat kesukaran kedua butir soal
tersebut?

TK (1) = --- = 0,70.

10

TK (2) = --- = 0,20.

10

Nilai TK butir merentang antara 0 sampai1 TK sebuah butir sama dengan nol terjadi bila semua peserta
tidak ada yang menjawab benar,sebaliknya Tk sebuah butir akan sama dengan 1(satu) apabila semua
peserta menjawab benar pada butir tersebut.Semakin tinggi indeks TK maka butir soal semakin
mudah.Dalam THB,TK butir-butir soal diusahakan sedang.Kalau butir soal terlalu mudah atau terlalu
sukar bagi dua atau lebih peserta maka sekor tidak lagi dapat membedakan kemampuan para peserta
sekiranya di antara mereka terdapat perbedaan kemampuan.butir yang sangat sukar sehingga tidak ada
siswa yang dapat menjawab dengan benar menyebabkan butir tersebut kehilangan kemampuannya
membedakan siwa yang mempunyai kemampuan tinggi dan rendah.begitu pula dengan butir yang
sangat mudah sehiingga semua peserta dapat menjawab benar.Oleh karenanya,butir sebaiknya
mempunyai TK yang sedang.

TK butir yang sedang berada dalam suatu rentang nilai TK.Kriteria untuk menentukan rentang untuk TK
sedang sangat tergantung jumlah kategori yang diinginkan.Misalnya kategori TK meliputi sukar,sedang
dan mudah maka kriteria sedang adalah antara 0,33 sampai 0,66 Berikut pembagian kategori TK ke
dalam tiga kelompok:

Rentang TK

Kategori

0,00 – 0,32
Sukar

0,33 – 0,66

Sedang

0,67 – 1,00

Mudah

Namun, bila TK di klasifikasikan ke dalam lima kelompok :sangat sukar ,sukar ,sedang ,mudah dan sangat
mudah ,maka butir soal di katakana mempunyai TK sedang bila indeks TK berada antara 0,40-0,59.secara
keseluruhan pembagian rentang TK diatur sebagai berikut :

Rentang TK

Kategori

0,00 – 0,19

Sangat sukar

0,20 – 0,39

Sukar

0,40 – 0,59

Sedang

0,60 – 0,79

Mudah

0,80 – 1,00

Sangat mudah

Dalam beberapa situasi ,TK butir soal tidak di usahakan sedang .Pada keadaan di mana diingin kan
sebanyak mungkin peserta tes dapat di nyatakan lulus maka butir di usahakan sangat mudah ,missal nya
penerimaan siswa di mana diperkirakan jumlah daya tampung lebih banyak daripada pelamar yang
mendaftar .Sebalik nya,pada keadaan diinginkan peserta tes sekecil mungkin dapat dinyatakan lulus
,maka butir soal di usahakan sesukar mungkin.
2. Daya beda

Daya beda (discriminating power) atau kita singkat DB adalah kemampuan butir soal THB membedakan
siswa yang mempunyai kemampuan tinggi dan rendah .DB berhubungan dengan derajat kemampuan
butir membedakan dengan baik perilaku pengambil tes dalam tes yang di kembangkan (anstasi dan
urbina ,1997:179).DB harus di usahakan positif dan setinggi mungkin .Butir soal yang mempunyai DB
positif dan tinggi berarti buti tersebut dapat membedakan dengan baik siswa kelompok atas dan
bawah .Siswa kelompok atas adalah kelompok siswa yang tergolong pandai atau mencapai skor total
hasil belajar yang timggi dan siswa kelompok bawah adalah kelompok ssiswa yang bodoh atau
memperoleh sekor total hasil belajar yang rendah .DB itu dapat di tentukan basarannya dengan rumus
sebagai

berikut:

DB = PT – PR

Atau

DB =

ΣTB ΣRB

ΣT ΣR

Keterangan:

PT = proporsi siswa yang menjawab benar pada kelompok siswa yang mempunyai kemampuan tinggi .

PR = proporsi siswa yang menjawab benar pada kelompok siswa yang mempunyai kemampuan rendah.

STB = jumlah peserta yang menjawab benar pada kelompok siswa yang mempunyai kemampuan tinggi.

ST = jumlah kelompok siswa yang mempunyai kemampuan tinggi .

SRB = Jumlah peserta yang menjawab benar pada kelompok siswa yang mempunyai kemampuan rendah
.

SR = jumlah siswa yang mempunyai kemampuan rendah .


Sebagai sebuah penjelasan di berikan contoh sebagai berikut : Sebanyak 10 orang mengikuti uji coba
THB berbentuk objektif dengan hasil sebagai berikut:

Siswa

Butir soal

Jumlah

10

1
1

10

0
8

4
F

H
0

1
1

10

Perhitungan DB dapat di lakukan dengan langkah-langkah sebagai berikut:

1. Menentukan suswa kelompok atas dan bawah .Kelompok atas adalah setengah kelompok siswa (5
orang)yang mamperoleh sekor terendah .penentuan kelompok atas dan kelompok bwah dapat di
sajikan dalam tabel berikut:

Kelompok atas

Kelompok bawah

Siswa

Skor

Siswa

Skor

10

3
C

10

2. Menghitung perolehan sekor butir pada kelompok atas dan kelompok bawah.

Kelompok atas

Siswa

Butir soal

3
4

10

1
1

1
1

Jumlah

Kelompok bawah
Siswa

Butir soal

10

0
1

0
0

Jumlah

1
1

3. Menghitung DB

DB dihitung sebagai mana rumusnya sebagai barikut:

a. Butir 1

DB (1) =

= 0,80

b. Butir 2

DB (2) =

2
= - 0,40

Sebuah butir THB yang baik adalah butir soal yang mempunyai DB positif dan signifikan.DB akan positif
apabia jumlah siswa kelompok atas yang dapat menjawab dengan benar lebih banyak dari pada jumlah
siswa kelompok bawah.DB yang signifikan dimaksudkan sebagai mempunyai indexs minimal+0,30 yang
artinya pada butir yang baik jumlah siswa kelompok atas yang dapat menjawab benar minimal30%lebih
banyak dari pada jumlah siswa kelompok bawah yang dapat menjawab benar.

Nilai DB akan merentang antara -1,00 hingga +1,00. Dengan mengambil contoh soal diatas,beberapa
kondisi ekstrim dapat di jelaskan sebagai berikut:

a. Bila semua siswa kelompok atas dapat menjawab benar dan semua siswa kelompok bawah
menjawab salah,makaDB akan +1,00.

DB =

= + 1,00

b. Bila semua siswa kelompok atas dapat menjawab salah dan semua siswa kelompok bawah menjawab
benar,maka DB -1,00.

DB =
0

= - 1,00

c. Bila baik siswa kelompok atas maaupun kelompok bawah dpat menjawab dengan benar maka DB
akan 0,00.

DB =

= 0,00

d. Bila baik siswa kelompok atas maupun kelompok bawah menjawab salah maka DB akan 0,00.

DB =

= 0,00

5
5

Berdasar nilai rentang DB diatas dapat ditarik kesimpulan sebagai berikut:

a. Bila semua siswa baik kelompok atas maupun kelompok bawah sama-sama menjawab benar atau
sama-sama menjawab salah maka butir soal tidak mempunyai kemampuan membedakan yang
ditunjukkan oleh DB=0,00.

b. Bila siwa kelompok atas yang dapat menjawab benar lebih banyak dari pada kelompok bawah yang
menjawab benar maka DB akan positif.

c. Bila siwa kelompok atas yang dapat menjawab benar lebih sedikit dari pada kelompok bawah yang
menjawab benar maka DB akan negative.

d. Butir soal mempunyai DB tinggi apabila siswa kelompok atas yang dapat menjawab benar lebih
banyak dibandingkan siswa kelompok bwah yang dapat menjawab benar dengan perbandingan tertentu
hingga DB minimal +0,30.

Anda mungkin juga menyukai