Anda di halaman 1dari 20

TUGAS KELOMPOK

“Analisis Butir Soal”

DOSEN MATA KULIAH EVALUASI PEMBELAJARAN :

Dr. Zirmansyah, M. Pd

NAMA PENYUSUN :

Rizkha Umami (0604513016)

Okti Syafitri (0604513017)

PENDIDIKAN GURU PENDIDIKAN ANAK USIA DINI

FAKULTAS PSIKOLOGI DAN PENDIDIKAN

UNIVERSITAS AL-AZHAR INDONESIA

JAKARTA SELATAN

2015
BAB I
PENDAHULUAN

1.1 Latar Belakang

Sebagai calon pendidik, keterampilan yang harus kita kuasai adalah sistem penilaian hasil
belajar peserta didik. Dalam penilaian proses dan hasil belajar siswa di sekolah, aspek-aspek
yang berkenaan dengan pemilihan alat penilaian, penyusunan soal, pengolahan dan
interpretasi data hasil penilaian, analisis butir soal untuk memperoleh kualitas soal yang
memadai, serta pemanfaatan data hasil penilaian sangat berpengaruh terhadap kualitas
lulusan. Evaluasi (Penilaian) sangat berguna untuk mempertinggi hasil pelajaran. Oleh sebab
itu evaluasi (Penilaian) tak dapat di pisahkan dari belajar mengajar. Dalam pelaksanaannya
ada evaluasi yang baik, ada pula evaluasi yang yang kurang baik. Hal ini bergantung pada
pendidik yang melaksanakannya.
Jika kita ingin menghendaki hasil evaluasi yang baik, maka kita harus tahu tentang unsur-
unsur penting dalam situasi belajar mengajar. Evaluasi yang baik harus membantu anak
mencapai tujuan sebagai inti proses belajar mengajar. Untuk mendapat hasil evaluasi yang
baik, maka alat evaluasi yang di gunakan juga harus baik.
Baik buruknya suatu tes atau alat evaluasi dapat di tinjau dari beberapa segi, yaitu:
1. Validitas, suatu alat pengukur di katakan valid apabila alat pengukur tersebut dapat
mengukur apa yang hendak di ukur.
2. Reliabilitas, suatu tes dapat di katakan reliabel apabila tes tersebut menunjukkan hasil-hasil
yang mantab (konsisten).
3. Tingkat kesukaran, soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu
sulit.
4. Daya pembeda, suatu tes harus dapat membedakan antara murid yang pandai dengan murid
yang kurang pandai

Melihat begitu pentingnya evaluasi dalam meningkatkan kualitas proses dan hasil
belajar, maka seorang guru sebagai bagian dari pelaksana proses belajar mengajar di tuntut
kemampuannya dalam melaksanakan evaluasi yang baik, dan secara otomatis dituntut untuk
membuat tes atau alat evaluasi yang baik pula.

1.2 Rumusan masalah

1. Apa pengertian analisis butir soal?


2. Bagaimana membuat soal yang baik?
3. Bagaimana teknik mengalisis soal (daya pembeda dan tingkat kesukaran ) ?

1.3 Tujuan

1. Untuk mengetahui analisis butir soal


2. Untuk mengdeskripsikan cara membuat soal yang baik
3. Untuk mengetahui teknik analisis soal yang di dalamnya menghitung daya pembeda dan
tingkat kesukaran soal?
BAB II
PEMBAHASAN

A. Pengertian Analisis Tes Soal

Evaluasi adalah segala upaya sistematis dan cermat untuk memahami kemampuan dan
kemajuan siswa baik sebelum,selama, maupun setelah proses pembelajaran, melalui
pengumpulan data, serta membandingkannya dengan norma atau criteria tertentu.
Analisis dapat diartikan sebagai penyelidikan terhadap suatu peristiwa (karangan, perbuatan,
dsb.) untuk mengetahui keadaan yang sebenarnya (sebab musabab, duduk perkaranya, dsb).
Sedangkan soal adalah instrument (alat) penilaian yang di gunakan untuk mengukur
keberhasilan proses belajar mengajar dan kualitas hasil belajar siswa.
Tes adalah kegiatan atau proses sistematis mengukur kemampuan/kondisi seseorang.
Kegiatan tes { testing ) selalu menggunakan alat yang juga disebut tes ( test ). Dalam tulisan
ini pengertian tes lebih mengacu kepada “alat” dari pada “kegiatan”. Oleh sebab itu tes
diartikan: sejumlah pertanyaan yang oleh subyek dijawab benar atau salah, atau sejumlah
tugas yang yang oleh subyek dilaksanakan dengan berhasil atau gagal, sehingga kemampuan
subyek dapat dinyatakan dengan skor atau dinilai berdasarkan skala tertentu.
Ada 2 macam tes, THB dan psikotes THB (tes hasil belajar) digunakan untuk
mengetahui sejauh mana siswa menguasai bahan / keterampilan yang telah dipelajari di
waktu yang lalu. Psikotes (tes psikologis) digunakan untuk mengetahui potensi individu yang
dapat dikembangkan/diwujudkan pada masa yang akan datang.
Khusus pada THB, ada dua bentuk soal yakni: tes bentuk uraian dan tes bentuk pilihan ganda
( dulu lebih dikenal dengan nama tes obyektif Penggunaan nama tes obyektif kini diganti
dengan nama „Tes Pilihan Ganda) Tes sebagai alat seleksi maupun evaluasi diharapkan
menghasilkan nilai atau skor yang obyektif dan akurat. Bila tes yang digunakan dosen/guru
kurang baik, maka nilai yang diperoleh siswa tidak obyektif dan berarti siswa diperlakukan
tidak adil. Oleh sebab itu perlu diusahakan agar tes yang diberikan kepada siswa cukup baik
dan bermutu dilihat dari berbagai segi. Kualitas tes mempengaruhi proses pembelajaran dan
motivasi siswa dalam belajar.
Sejak awal tes hendaknya disusun sesuai dengan prosedur dan prinsip penyusunan tes.
Dan pada akhirnya, setelah digunakan, perlu diketahui apakah tes itu cukup obyektif dan
efektif atau tergolong buruk. Tes yang baik mungkin dapat digunakan berulang-ulang dengan
sedikit perubahan, Sebaliknya tes yang buruk hendaknya dibuang, bahkan kalau terlalu buruk
sebaiknya tidak digunakan untuk member nilai kepada siswa (dibatalkan).
Analisis tes adalah salah satu kegiatan dalam rangka mengkonstruksi tes untuk
mendapatkan gambaran tentang mutu tes, baik mutu keseluruhan tes maupun mutu tiap buutir
soal/tugas. Analisis dilakukan setelah tes disusun dan dicobakan kepada sejumlah subyek dan
hasilnya menjadi umpan balik untuk perbaikan/peningkatan mutu tes bersangkutan. Oleh
karena itu kegiatan analisis tes merupakan keharusan dalam keseluruhan proses
mengkonstruksi tes.
Analisis item soal merupakan suatu prosedur yang sistematis, yang akan memberikan
informasi-informasi yang sangat khusus terhadap butir tes yang akan kita susun. Analisis
item soal pada dasarnya bertujuan untuk mengetahui apakah setiap item soal benar-benar
baik, sehingga diperlukan analisis terhadapnya.

B. Soal yang baik

Sebagai pendidik , kita dihadapkan pada persoalan bagaimana kita mengajar,


bagaimana kita menguji dan bagaimana kita mengevaluasi/menilai kemampuan siswa.
Namun ada satu hal lagi yang harus diingat, yaitu merenung. Dalam perenungan tersebut ada
beberapa pertanyaan, misalnya:
Berapa banyak siswa yang lulus?
Soal nomor berapa yang semuanya dapat menjawab dengan benar?
Soal nomor berapa yang semuanya tidak dapat menjawab dengan benar?
Apakah dua hal diatas terjadi karena soal terlalu mudah atau soal terlalu sulit?

Pertanyaan-pertanyaan tersebut berkaitan erat dengan aspek penilaian yang menjadi salah
satu bagian penting dalam tugas keseharian seorang pengajar. Penilaian adalah memberikan
nilai tentang kualitas sesuatu. Tidak hanya sekedar mencari jawaban terhadap pertanyaan
tentang apa, tetapi lebih diarahkan pada menjawab pertanyaan tentang bagaimana atau
seberapa jauh sesuatu proses atau hasil yang diperoleh seseorang atau suatu program. Dengan
demikan penilaian juga diartikan sepadan dengan evaluasi. Penilaian hasil belajar baru dapat
dilakukan dengan baik dan benar bia menggunakan informasi yang diperoleh melalui
pengukuran hasil belajar yang menggunakan tes sebagai alat ukurnya. Tentu saja tes hanya
merupakan salah satu alat yang dapat digunakan. Dapat saja informasi tentang hasil belajar
itu diperoleh tanpa menggunakan tes sebagai instrumen ukurnya. Misalnya dapat digunakan
alat ukur non tes, seperti observasi, skala rating, dan lain-lain.

a. Perencanaan Tes
Tes akan menjadi berarti apabila tes tersebut terdiri dari butir-butir soal yang menguji
tujuan yang penting dan mewakili ranah pengetahuan, kemampuan, dan ketrampilan secara
representatif. Oleh karenanya, perencanaan dalam pengujian memegang peranan yang
penting. Tanpa perencanaan yang jelas dan dapat dipertanggungjawabkan tes tersebut dapat
menjadi sia-sia, bahkan mungkin akan mengganggu proses pencapaian tujuan. Setidaknya
ada 6 (enam) hal yang harus diperhatikan dalam perencanaan tes:

1. Pengambilan sampel dan pemilihan butir soal


Pemilihan butir soal dilakukan berdasarkan pentingnya konsep, generalisasi, dalil,
atau teori yang diuji dalam hubungannya dengan perannya dalam bidang studi tersebut secara
keseluruhan. Biasanya bidang studi dibagi menjadi beberapa pokok bahasan dan sub pokok
bahasan. Tidak ada batasan jumlah butir soal untuk satu pokok bahasan/sub pokok bahasan,
namun hendaknya jumlah butir soal sebanding dengan luas dan pentingnya pokok bahsan/sub
pokok bahasan tersebut.

2. Tipe tes yang akan digunakan


Ada 3 macam tes yang biasa digunakan, yaitu: (1) esai, (2) objektif, dan (3) problem
matematik. Anggapan yang muncul terkait bahwa suatu tipe tes lebih baik daripada tipe tes
lainnya dalam mengukur ranah kognitif tertentu adalah sutau kesalahpahaman. Soal esei yang
baik akan dapat mengukur ranah kognitif yang manapun seperti yang dapat diukur oleh soal
obyektif yang baik, demikian juga sebaliknya. Pemilihan tipe tes yang akan digunakan lebih
banyak ditentukan oleh kemampuan dan waktu yang tersedia pada penyusun tes daripada
kemampuan peserta tes atau aspek yang ingin diukur.

3. Aspek yang akan diuji


Ada enam tingkatan kemampuan yang ingin diuji, yaitu pengetahuan, pemahaman,
aplikasi, analisis, sintesis, dan evaluasi, atau yang lazim diberi simbol C1, C2, C3, C4, C5,
dan C6. Mengingat bahwa hasil tes saat ini lebih berorientasi pada pengetahuan, pemahaman
dan aplikasi, maka jumlah soal yang mewakili tiga level pertama diharapkan lebih banyak
dibandingkan jumlah soal untuk tiga level berikutnya yang bersifat pengembangan lebih
lanjut.

4. Format butir soal


Ada berbagai format untuk tes objektif maupun esai.
a. Tes objektif: (1) benar salah (true false), (2) menjodohkan (matching), dan (3) pilihan
ganda (multiple choice)
b. Tes esei: (1) pertanyaan uraian terbuka dan uraian tertutup, (2) jawaban singkat (short
answer), dan (3) isian (completion/fill in)
Perbedaan antara format butir soal tersebut tidak terletak pada efektivitasnya mengukur level
kemampuan, tetapi lebih banyak pada aspek penerkaannya (dalam hal peserta tes kurang
menguasai materi yang diteskan).

5. Jumlah butir soal


Jumlah butir soal berhubungan dengan reliabilitas tes dan representasi isi bidang studi
yang diteskan; semakin besar jumlah butir soal yang digunakan maka kemungkinan semakin
tinggi reliabilitasnya. Dari segi jumlah, tes objektif memiliki kekuatan lebih dibanding tes
esei karena waktu yang diperlukan untuk mengerjakan tes objektif lebih singkat sehingga
memungkinkan jumlah butir soal yang lebih banyak. Jumlah butir soal harus direncanakan:
(a) jumlah keseluruhan, (b) jumlah untuk setiap pokok bahasan/topik, (c) jumlah untuk setiap
format, (d) jumlah untuk setiap kategori tingkat kesulitan, (e) jumlah untuk setiap aspek pada
ranah kognitif. Pertimbangan lain dalam penetuan jumlah soal adalah waktu yang tersedia,
biaya yang ada, kompleksitas yang dituntut dalam tes, serta waktu ujian diadakan.

6. Distribusi tingkat kesukaran butir soal


Tes yang terbaik adalah tes yang mampu membedakan antara kelompok yang baik
dan kelompok yang kurang belajar. Salah satunya diindikasikan dengan tingkat kesukaran di
titik sekitar 0,50. Selain itu, tingkat kesukaran soal ditentukan oleh tujuan tes (untuk seleksi,
diagnostik,formatif, sumatif). Perlu diperhatikan bahwa soal yang memiliki tingkat kesukaran
rendah hendaknya diletakkan di awal tes, sedangkan soal dengan tingkat kesukaran tinggi
pada akhir tes. Hal ini dimaksudkan untuk memberikan notivasi agar peserta tes lebih
terdorong untuk mengerjakan seluruh butir soal.
b. Pengembangan Tes Objektif
Soal objektif adalah butir soal yang telah mengandung kemungkinan jawaban yang
harus dipilih atau dikerjakan oleh peserta tes. Peserta hanya tinggal memilih jawaban dari
kemungkinan jawaban yang telah disediakan sehingga pemeriksaan dan penskoran jawaban
dapat dilakukan secara objektif oleh pemeriksa. Pemeriksaan ini dapat dilakukan, baik oleh
secara langsung oleh manusia maupun dengan memanfaatkan teknologi terbaru, yaitu mesin
scanner.
Secara umum, soal tes objektif dibedakan menjadi:

1. Tipe benar-salah (true false item)


2. Tipe menjodohkan (matching)
3. Tipe pilihan ganda (multiple choice)
Pilihan ganda biasa
Pilihan ganda analisis hubungan antar hal
Pilihan ganda analisis kasus
Pilihan ganda kompleks
Pilihan ganda yang menggunakan diagram, grafik, tabel dan gambar.

c. Pengembangan Tes Pilihan Ganda (Multiple Choice Item)


a) Pengertian
Butir soal pilihan ganda adalah butir soal yang alternatif jawabannya lebih dari dua,
biasanya berkisar antara 4 atau 5 alternatif jawaban. Ada dua bagian dalam tiap butir soal,
yaitu bagian pernyataan/pertanyaan dan bagian pilihan/alternatif jawaban.
b) Tes model ini cocok untuk :
Level aplikasi, sintesis, analisis, dan evaluasi
c) Jenis pertanyaan atau pernyataan :
Jawablah dengan benar
Lengkapilah kalimat
Pilihlah jawaban paling tepat

d) Keunggulan
Dapat dikonstruksi dan digunakan untuk mengukur setiap level tujuan
instruksional, mulai yang paling sederhana sampai paling kompleks.
Dapat menggunakan jumlah butir soal yang lebih banyak sehingga penarikan
sampel pokok bahasan yang akan diujikan dapat lebih luas dan dapat mencakup hampir
seluruh cakupan bidang studi.
Penskoran hasil kerja peserta tes dapat dilakukan secara objektif.
Tipe butir soal dapat dikonstruksi sehingga menuntut kemampuan peserta tes untuk
membedakan berbagai tingkatan kebenaran secara sekaligus.
Jumlah opsi jawaban yang disediakan lebih dari dua (empat atau lima) sehingga
mengurangi kesempatan bagi peserta tes untuk menebak.
Memungkinkan dilakukannya analisis butir soal secara baik dengan melakukan uji
coba terlebih dahulu.
Tingkat kesukaran butir soal dapat dikendalikan dengan hanya mengubah tingkat
homogenitas alternatif jawaban.
Informasi yang diberikan lebih bervariasi terutama bila butir soal memiliki
homogenitas yang tinggi.
Lebih fleksibel digunakan untuk menilai hasil belajar: kemampuan, aplikasi,
analisis, síntesis, dan evaluasi.
Siswa minimum menulis.

e) Keterbatasan
Sulit mengkonstruk item tes yang baik.
Terdapat kecenderungan butir soal hanya menguji/mengukur aspek ingatan.
Sulit membuat pengecoh atau alternative jawaban yang baik.
Waktu lebih banyak dibutuhkan apabila opsi semakin banyak
Membutuhkan waktu yang lebih lama untuk membuat soal pilihan ganda
Opsi yang ditampilkan secara otomatis dapat mengurangi jumlah soal yang dapat
dibuat.
Semakin terbiasa seseorang dengan tes tipe pilihan ganda semakin besar
kemungkinan ia akan memperoleh skor yang lebih baik.

f) Tips menulis tes pilihan ganda


Setiap item memiliki satu aspek kemampuan yang akan diukur
Inti permasalahan harus dicantumkan dalam rumusan pokok soal.
Hindari pengulangan kata-kata yang sama dalam pilihan.
Hindari rumusan kata yang berlebihan
Jika pokok soal merupakan pernyataan yang belum lengkap, maka kata atau kata-
kata yang melengkapi harus diletakkan pada ujung pernyataan, bukan di tengah-
tengah kalimat.
Susunan alternatif jawaban dibuat teratur dan sederhana.
Hindari penggunaan kata-kata teknis atau ilmiah atau istilah yang aneh atau
berlebihan.
Semua pilihan jawaban harus homogen dan dimungkinkan sebagai jawaban yang
benar. Usahakan jawaban yang benar dan pengecoh dibuat mirip baik dari sisi
gramatikal maupun konsep teorinya.
Hindari keadaan dimana jawaban yang benar selalu ditulis lebih panjang dari
jawaban yang salah.
Hindari adanya petunjuk/indikator pada jawaban yang benar.
Hindari menggunakan pilihan yang berbunyi ”semua yang benar di atas benar” atau
”tidak satupun yang di atas benar”
Gunakan tiga atau lebih alternatif pilihan.
Pokok soal diusahakan tidak menggunakan ungkapan atau kata-kata yang
bermakna tidak tentu.
Pokok soal sedapat mungkin dalam pernyataan atau pertanyaan positif. Jika
terpaksa menggunakan pernyataan negatif, maka kata negatif tersebut sebaiknya
digarisbawahi/ditulis tebal.
Hindari menggunakan pernyataan atau pertanyaan double negatives. Misalnya
“tidak tidak setuju”
Tempatkan pilihan jawaban benar secara random. (hindari jawaban A yang
biasanya lebih sering daripada jawaban lain)
Usahakan setiap item tes tidak saling tergantung atau berhubungan dengan item tes
lain.
Buatlah setiap alternatif jawaban pada baris berbeda, dengan spasi atau gunakan
huruf atau angka untuk memilah setiap alternatif jawaban.
Konsultasikan dengan pakar bahasa dan ilmu yang terkait untuk meyakinkan
bahwa bahasa yang digunakan, soal, dan jawaban benar-benar meyakinkan.
C. Teknik analisis soal
Kegiatan analisis tes meliputi empat hal yakni :
1. Analisis validitas tes
2. Analisis reliabilitas tes
3. Analisis butir soal yang meliputi :
a. Analisis daya pembeda tiap butir soal,
b. Analisis tingkat kesukaran tiap butir soal ,
c. Analisis pengecoh (distraktor) pada setiap butir soal,
d. Analisis homogenitas tiap butir soal.

1. Analisis Validitas tes

Validitas tes adalah tingkat keabsahan atau ketepatan suatu tes. Tes yang valid ( absah
= sah ) adalah tes benar-benar mengukur apa yang hendak diukur. Tes matematika kelas dua
SMP, hendaknya benar-benar mengukur hasil belajar matematika siswa SMP kelas dua ;
bukan siswa SMP kelas tiga atau siswa SD kelas enam. Dan bukan mengukur hasil belajar
dalam bidang studi lainnya. Tes yang disusun untuk mengukur hasil belajar mata pelajaran
kimia pada kelas tertentu, hendaknya tidak menyimpang sehingga mengukur hasil belajar
matematika atau bahasa, atau kimia untuk kelas lainnya. Dengan kata lain, validitas tes
menunjukkan tingkat ketepatan tes dalam mengukur sasaran yang hendak diukur.
Ada empat macam validitas tes hasil belajar, yakni:
1. Validitas permukaan ( face validity )
Tingkat validitas permukaan diketahui dengan melakukan analisis atau telaah rasional (
semata-mata berdasarkan pertimbangan logis, bukan pada hitungan angka-angka empirik.
Analisis permukaan meliputi berbagai aspek berikut ini:
a. Apakah bahasa dan susunan kalimat (redaksi ) tiap butir soal cukup jelas dan sesuai dengan
kemampuan siswa?
b. Apakah isi jawaban yang diminta tidak membingungkan?
c. Apakah cara menjawab sudah dipahami siswa?
d. Jangan sampai siswa tahu isi jawabannya tetapi tidak tahu bagaimana cara menjawab soal
bersangkutan.
e. Apakah tes itu telah disusun berdasar kaidah/prinsip penulisan butir soal?
Tes yang tidak mengikuti kaidah penulisan butir soal akan tampak semerawut sehingga
membingungkan.
Setiap tes paling sedikit harus diperiksa melalui analisis permukaan. Walaupun analisis ini
tergolong paling lemah, namun lebih baik daripada tidak ada analisis sama sekali. Tentu saja
akan lebih baik bila suatu tes dianalisis lebih lanjut.
2. Validitas isi ( content validity )
Tingkat validitas isi juga diketahui dengan analisis rasional. Pada prinsipnya dilakukan
pemeriksaan terhadap tiap butir soal, apakah soal sudah sesuai dengan Tujuan Pembelajaran
Khusus atau dengan kompetensi yang hendak diukur atau dengan indikator keberhasilan
siswa. Cara yang lazim ialah mencocokkan tiap butir soal dengan kisi-kisi yang disusun
berdasarkan GBPP ( Garis Besar Program Pengajaran ). Pengujian validitas isi dilakukan
dengan menjawab pertanyaan berikut.

a. Apakah keseluruhan tes telah sesuai dengan kisi-kisi?


Kisi-kisi adalah suatu bagian atau matrik yang menggambarkan penyebaran soal-soal
sesuai dengan aspek atau pokok bahasan yang hendak diukur, tingkat kesukaran dan jenis
soal. Kisi-kisi itu harus disusun sedemikian rupa sehingga mencakup seluruh bahan pelajaran
yang akan diteskan. Tingkat kesesuaian seluruh butir soal dengan kisi-kisi ( dengan bahan
yang akan diteskan ) menunjukkan tingkat validitas isi.
b. Apakah terdapat butir soal yang menyimpang, atau menuntut jawaban di luar bahan
pelajaran bersangkutan?
Misalnya soal dalam mata pelajaran fisika menjurus/menyimpang ke hitungan
matematika atau kemampuan di luar pokok bahasan yang diajarkan. Penyimpangan yang
tidak kentara itu perlu dihilangkan. Semakin banyak soal yang menyimpang, semakin rendah
tingkat validitas isi. Untuk melakukan analisis validitas isi diperlukan adanya kisi-kisi tes
yang disusun sebelum soal-soal ditulis.
3. Validitas kriteria ( criterion validity )
Validitas ini diketahui dengan cara empirik, yakni menghitung koefisien korelasi
antara tes bersangkutan dengan tes lain sebagai kriterianya. Yang dapat digunakan sebagai
kriteria adalah tes yang sudah dianggap valid, atau nilai mata pelajaran yang sama yang
dipandang cukup obyektif. Sebagai contoh, skor tes Bahasa Inggris buatan guru dikorelasikan
dengan skor tes Bahasa Inggris yang telah dibakukan. Skor tes Matematika kelas I SMA
dikorelasikan dengan nilai rata-rata Matematika. Dengan rumus korelasi Pearson‟s Product
Moment dan menggunakan kalkulator, perhitungan validitas criteria tersebut tidak terlalu
sulit, apalagi bila menggunakan computer.
Kesulitan utama dalam menentukan validitas criteria ialah mencari skor tes yang akan
dijadikan kriteria. Bila kriterianya buruk atau tidak valid, maka validitas tes yang diperoleh
akan percuma saja.
4. Validitas ramalan (predictive validity )
Validitas ini menunjukkan sejauh mana skor tes bersangkutan dapat digunakan
meramal keberhasilan siswa dimasa mendatang dalam bidang tertentu. Cara menghitungnya
sama seperti validitas kriteria, dalam hal ini skor tes dikorelasikan dengan keberhasilan siswa
di masa dating. Misalnya antara nilai UAN ( Ujian Akhir Nasional ) di SMA, dengan prestasi
belajar di perguruan tinggi dalam mata pelajaran yang sama. Suatu tes yang baik biasanya
memiliki angka validitas 0,50 atau lebih; tentu saja angka itu makin tinggi makin baik. Suatu
tes dengan angka validitas kurang dari 0,50 belum tentu buruk. Mungkin kriterianya yang
buruk atau keliru menentukan kriteria.

2. Reliabilitas
Reliabilitas diartikan dengan keajekan (konsistensi) bila mana tes tersebut diuji
berkali-kali hasilnya relatif sama, artinya setelah hasil tes yang pertama dengan tes yang
berikutnya dikorelasikan terdapa hasil korelasi yang signifikan.
Ada juga yang mengartikan dengan keandalan (reliability) artinya ketetapan/ketelitian suatu
alat evaluasi. Suatu tes/alat evaluasi dikatakan andal jika ia dapat dipercaya, konsisten, atau
stabil dan produktif. Jadi yang dipentingakan disini adalah ketelitian sejauh mana tes/alat
tersebut dapat dipercaya kebenarannya.Reliabilitas alat penilaian adalah ketetapan atau
keajegan alat tersebut dalam menilai apa yang dinilainya. Artinya, kapanpun alat penilaian
tersebut digunakan akan memberikan hasil yang relatif sama.
Tes hasil belajar dikatakan ajeg apabila hasil pengukuran saat ini menunjukkan
kesamaan hasil pada saat yang berlainan waktunya terhadap siswa yang sama. Misalnya
siswa kelas V pada hari ini di tes kemampuan matematikanya. Minggu berikutnya siswa
tersebut di tes kembali. Hasil dari ke dua tes relatif sama. Sungguhpun demikian, masih
mungkin terjadi ada perbedaan hasil untuk hal-hal tertentu akibat faktor kebetulan, selang
waktu, atau terjadinya perubahan pandangan siswa terhadap soal yang sama. Jika itu terjadi,
kelamahan terletak pada tes itu, yang tidak memiliki kepastian jawaban atau meragukan
siswa. Dengan kata lain, derajat reliabilitasnya masih rendah.
Ada tiga cara mengetahui reliabilitas tes:

1. Test-retest method (metoda tes ulang)


Suatu tes (yakni tes yang akan dihitung reliabilitasnya), diteskan terhadap kelompok
siswa tertentu dua kali dengan jangka waktu tertentu (misalnya satu semester atau satu
caturwulan). Skor hasil pengetesan pertama dikorelasikan dengan skor hasil pengetesan
kedua. koefisien korelasi yang diperoleh menunjukkan koefisien reliabilitas tes tersebut.

2. Paralel test method (metoda tes paralel)


Cara ini mengharuskan adanya dua tes yang paralel, yakni dua tes yang disusun
dengan tujuan yang sama (hanya sedikit perbedaan redaksi, isi, atau susunan kalimatnya).
Dua tes tersebut diadministrasikan pada satu kelompok siswa dengan perbedaan waktu
beberapa hari saja. Skor dari kedua macam tes tersebut dikorelasikan dengan teknik yang
sama seperti pada metode test-retest. Koefisien korelasi yang diperoleh menunjukkan tingkat
realibilitas tes.

3. Split-half method (metoda belah dua)


Cara ini paling mudah dan seyogyanya diterapkan oleh para guru pada semua tes yang
diberikan kepada siswanya. Tidak perlu mengulangi pelaksanaan tes atau menyusun tes yang
paralel. cukup satu tes dan diadministrasikan satu kali kepada sekelompok siswa (minimal 30
siswa).
Tingkat reliabilitas suatu instrumen atau tes dipengaruhi oleh banyak hal antara lain:
1) Jumlah butir soal, banyaknya soal pada suatu instrumen ikut mempengaruhi derajat
reliabilitasnya, dengan semakin banyaknya soal-soal maka tes yang bersangkutan cenderung
untuk menjadi semakin reliabel, sebagaimana yang dinyatakan dalam rumus spearmen-
brown.
2) Homogenitas soal test, soal yang memiliki homogenitas yang tinggi cenderung mengarah
kepada tingginya tingkat reliabilitas. Dua buah test yang sama butirnya akan tetapi berbeda
isinya, misalnya yang satu mengukur pengetahuan kebahasaan dan yang lainya mengukur
kemampuan fisika akan menghasilkan tingkat reliabilitas berbeda. Test fisika cederung
menghasilka tingkat reliabilitas yang lebih tinggi daripada test kebahasaan karena dari segi isi
kemampuan menyelesaikan soal fisika lebih homogen daripada pengetahuan kebahasaan.
3) Waktu yang diperlukan untuk menyelesaikan test, semakin terbatasnya waktu dalam
pengejaan test maka akan mendorong test untuk cenderung memiliki reliabilitas yang tinggi,
hl ini terutama apabila realiabilitas diperoleh dengan cara splithalf (belah dua).
4) Keseragaman kondisi pada saat test diberikan, kondisi pelaksanaan test yanhg semakin
seragam akan memunculkan reliabilitas yang semakin tinggi.
5) Kecocokan tingkat kesukaran terhadap peserta test
6) Heteroginitas kelompok, bahwa semakin hiterogen suatu kelompok dalam pengerjaan
suatu test maka test terebut semakin cenderung untuk menunjukan tingkat reliabilitas yang
tinggi.
7) Variabel skors instrumen yang mengahasilkan rentangan skor yang lebih luas atau lebih
tinggi variabilitasnya akan memiliki tingkat reliabilitas yang lebih tinggi daripada yang
menghaslkan menghsilkan rentang skor yang lebih sempit. Seperti test bentuk pilihan ganda
cenderung menghasilakan tingkat reliabilitas lebih tinggi dari pada test bentuk benar salah.
8) Motivasi individu.

Faktor-faktor yang dapat mempengaruhi keadaan suatu tes:


1. Luas tidaknya sampling yang diambil
2. Perbedaan bakat kemampuan murid yang dites.
3. Suasana atau kondisi testing
4. Kandalan tes

3. Analisis Butir Soal


Baik buruknya tes tergantung pada butir-butir soal yang ada di dalamnya. Oleh sebab
itu untuk mendapatkan tes yang baik perlu dipilih butir-butir yang baik.Butir yang buruk
harus dibuang, yang kurang baik perlu direvisi. Untuk mengetahui kualitas tiap butir soal
perlu analisis satu persatu. Analisis meliputi perhitungan daya pembeda, tingkat kesukaran,
homogenitas tes serta analisis distraktor/pengecoh pada tes pilihan ganda.
Butir soal akan dianalisis mutunya berdasarkan karakteristik butir soal yaitu :

Daya beda butir soal


Daya pembeda menunjukkan sejauh mana tiap butir soal mampu membedakan siswa
yang menguasai bahan dan siswa yang tidak menguasai bahan. Butir soal yang daya
pembedanya rendah, tidak ada manfaatnya, malahan dapat merugikan siswa yang belajar
sungguh-sungguh.
Menghitung daya pembeda
a. berdasarkan skor total, menyusun nama atau nomor peserta didik dari yang tertinggi hingga
terendah. Kemudian ambil 27 % peserta didik yang skor totalnya tinggi (Kelompok Atas),
dan 27 % peserta didik yang skor totalnya rendah (Kelompok Bawah).
b. Buatlah tabel, khusus untuk peserta didik yang ada di Kelompok Atas dan Kelompok
Bawah. Jumlah kolom dalam tabel minimal sama dengan jumlah butir soal, sehinggga
memuat seluruh jawaban peserta didik.
c. Tabel 1 artinya jawaban betul dan 0 artinya jawaban salah.
d. Tabel ini digunakan untuk daya pembeda maupun tingkat kesukaran butir soal.
e. Hitung jumlah jawaban yang benar (bertanda 1), baik pada Kelompok Atas maupun pada
Kelompok Bawah.

Daya pembeda dihitung dengan rumus :


BA- Σ BB) x 100%
NA
Keterangan :
DP = Indeks Daya Pembeda butir soal tertentu (satu butir)
BA = jumlah jawaban benar pada kelompok Atas
BB = jumlah jawaban benar pada kelompok Bawah
NA = jumlah siswa pada salah satu kelompok A atau B
Kriteria Daya Pembeda
Negatif - 9% = sangat buruk, dibuang
10% - 19 % = buruk, dibuang
20 % - 29 % = agak baik, direvisi
30 % - 49 % = baik
50 % - keatas = sangat baik

Tingkat kesukaran butir soal


Tingkat kesukaran butir soal adalah tingkat kesukaran item (difficulty index), yaitu
pengukuran seberapa besar derajat kesukaran suatu item atau tes.
Tabel yang digunakan untuk menghitung tingkat kesukaran sama dengan tabel skor untuk
menghitung daya pembeda. rumus yanga digunakan adalah sebagai berikut:
TK = BA + BB x100%
NA+ NB
Keterangan :
TK = Indeks tingkat kesukaran butir soal tertentu (satu butir)
BA = jumlah siswa yang menjawab benar pada kelompok Atas
BB = jumlah jawaban benar pada kelompok Bawah
NA = jumlah siswa pada kelompok Atas
NB = jumlah siswa pada kelompok Bawah
Kriteria Tingkat Kesukaran Soal
0 % - 15 % = sangat sukar, sebaiknya dibuang
16 % - 30 % = sukar
31 % - 70 % = sedang
71 % - 85 % = mudah
86 % - 100 % = sangat mudah, sebaiknya dibuang.

Berfungsi tidaknya pilihan

Analisis distraktor ( pengecoh/penyesat/option ) diperlukan hanya pada tes bentuk pilihan


ganda dimana siswa harus memilih satu dari beberapa alternatif jawaban. Tiap
pengecoh/distraktor hendaknya bermanfaat, yakni ada sejumlah siswa yang memilihnya.
Pengecoh yang tidak dipilih sama sekali berarti tidak bermanfaat, sedang pengecoh yang
dipilih oleh hamper semua siswa berarti terlalu mirip dengan jawaban yang benar.
Pengecoh dianggap baik bila jumlah peserta didik yang memilih pengecoh itu sama atau
mendekati jumlah ideal.
Indeks pengecoh dihitung dengan rumus :
Ipc = nPc x 100%
(N-nB) / (Alt-1)
Keterangan :
Ipc = Indeks pengecoh/Distraktor
nPc = Jumlah peserta didik yang memilih pengecoh itu
N = Jumlah seluruh subyek yang ikut tes
nB = Jumlah subyek yang menjawab benar pada butir soal itu
Alt = Banyak alternatif jawaban/option (3,4, atau 5)
Catatan :
bila semua subyek menjawab benar pada butir soal tertentu (semua sesuai kunci), maka Ipc =
0 artinya buruk.
Klasifikasi pengecoh berdasarkan Indeks Pengecoh sebagai berikut:
Sangat baik : 76% - 125% (mendekati 100%)
Baik : 51%- 75% atau 126% - 150%
Kurang baik : 26% - 50% atau 151% - 175%
Buruk : 0%-25% atau 176% - 200%
Sangat buruk : lebih dari 200%
BAB IV
PENUTUP

Kesimpulan

Kegiatan menganalisis butir soal merupakan suatu kegiatan yang harus dilakukan
guru untuk meningkatkan mutu soal yang telah ditulis. Kegiatan ini merupakan proses
pengumpulan, peringkasan, dan penggunaan informasi dari jawaban siswa untuk membuat
keputusan tentang setiap penilaian. Soal yang bermutu adalah soal yang dapat memberikan
informasi setepat-tepatnya sesuai dengan tujuannya di antaranya dapat menentukan peserta
didik mana yang sudah atau belum menguasai materi yang diajarkan oleh pendidik.
Tujuan menganalisis butir soal adalah :
1. Untuk mengkaji dan menelaah setiap butir soal agar diperoleh soal yang bermutu sebelum
soal digunakan.

2. Untuk membantu meningkatkan tes melalui revisi atau membuang soal yang tidak efektif,
serta untuk mengetahui informasi diagnostik pada siswa apakah mereka sudah/belum
memahami materi yang telah diajarkan

Menganalisis butir soal dapat dilakukan secara kualitatif maupun kuantitatif. Analisis
secara kualitatif biasanya yang ditelaah antara lain dari segi materi, konstruksi,
bahasa/budaya, kebenaran kunci jawaban atau pedoman penskorannya. Sedangkan analisis
secara kuantitatif, yang ditelaah adalah tingkat kesukaran butir soal, daya pembeda butir soal,
dan penyebaran pilihan jawaban (untuk soal bentuk obyektif) atau frekuensi jawaban pada
setiap pilihan jawaban.
DAFTAR PUSTAKA

___________. 2010. Analisis Butir item. [Online]. Tersedia:


http://ribuanilmu.blogspot.com/2010/12/analisis-butir-item.html
Vyda , Dida. 2010. Analisis Kualitas Tes dan Butir Soal [Online]. Tersedia:
http://fidanurlaeli.wordpress.com/2010/11/28/analisis-kualitas-tes-dan-butir-soal/.
_________- . 2011. mengenal analisis tes [Online]. Tersedia:
http://biomatectona.blogspot.com/2011/04/mengenal-analisis-tes.html.
Bagus. 2012. Cara Analisis butir soal pilihan ganda. [Online]. Tersedia:
http://goosum.blogspot.com/2012/04/cara-analisis-butir-soal-pilihan-ganda.html
Mihwanuddin. 2011. Makalah Reliabilitas [Online]. Tersedia:
http://mihwanuddin.wordpress.com/2011/01/13/makalah-reliabilitas/

Anda mungkin juga menyukai