DOSEN PENGAJAR
DISUSUN OLEH
Puji dan Syukur kami Panjatkan ke Hadirat Tuhan Yang Maha Esa karena berkat
limpahan Rahmat dan Karunia-Nya sehingga penulis dapat menyusun makalah ini tepat
pada waktunya. Makalah ini dibuat serapi mungkin dengan tujuan untuk memberi
pengetahuan dan pemahaman mengenai “Analisis Butir Soal”.
Dalam penyusunan makalah ini, kami banyak mendapat tantangan dan hambatan
akan tetapi dengan bantuan dari berbagai pihak tantangan itu bisa teratasi. Olehnya itu, tidak
lupa kami mengucapkan banyak terimakasih atas bantuan dari pihak yang telah
berkontribusi dengan memberikan sumbangan baik materi maupun pikirannya.
Harapan penulis adalah setelah pembuatan makalah ini adalah pembaca dapat
menjadikannya sebagai bahan referensi maupun bahan acuan dalam pembuatan laporan.
Penyusun
i
DAFTAR ISI
BAB I. PENDAHULUAN
1.1 Latar Belakang............................................................................................................................... 1
DAFTAR PUSTAKA
ii
BAB I
PENDAHULUAN
1.3 Tujuan
1. Memahami apa dan bagaimana itu analisis tingkat kesulitan.
2. Memahami apa dan bagaimana itu analisis daya pembeda.
3. Memahami apa dan bagaimana itu analisis validitas.
4. Memahami apa dan bagaimana itu analisis reliabilitas.
1
BAB II
PEMBAHASAN
2
tidak pula terlalu mudah. Maka, apabila seluruh testee tidak dapat menjawab soal dengan
betul, (karena terlalu sukar) tidak dapat disebut sebagai item yang baik. pun apabila
seluruh siwa dapat menjawab dengan betul (karena soal terlalu mudah) juga tidak dapat
dimasukkan dalam kategori yang baik. Untuk menghitung tingkat kesukaran tiap butir
soal digunakan persamaan :
Keterangan:
P = indeks kesukaran,
B = banyaknya siswa yang menjawab soal dengan benar, dan
Jx = jumlah seluruh siswa peserta tes.
3
umumnya, para pakar di bidang evaluasi menggunakan persentase 27% dari testee yang
termasuk kelompok atas dan 27% dari testee yang termasuk kelompok bawah karena
dianggap cukup mampu diandalkan.
Indeks dikriminasi item umumnya diberi lambang D (singkatan ari Discriminatory
Power) yang besarnya berkisar antara 0 sampai dengan 1,00. Akan tetapi indeks
diskriminasi ini dapat bertanda minus (-). Jika sebutir item angka indeks diskriminasinya
= 0,00, maka item tersebut tidak memiliki daya pembeda sama sekali. Jika indeks
diiskriminasi itemnya bertanda negative (minus) maka butir item tersebut lebih banyak
dijawab benar oleh testee dari kelompok bawah daripada testee kelompok atas atau
testee yang sebenarnya termasuk dalam kelompok atas lebih banyak yang menjawab
salah sedangkan testee yang termasuk kelompok bawah lebih banyak yang menjawab
benar. Manfaat daya pembeda butir soal adalah seperti berikut ini.
1) Untuk meningkatkan mutu setiap butir soal melalui data empiriknya. Berdasarkan
indeks daya pembeda, setiap butir soal dapat diketahui apakah butir soal itu baik,
direvisi, atau ditolak.
2) Untuk mengetahui seberapa jauh setiap butir soal dapat mendeteksi/membedakan
kemampuan siswa, yaitu siswa yang telah memahami atau belum memahami materi
yang diajarkan guru.
Daya pembeda butir soal dihitung dengan menggunakan persamaan :
Keterangan :
DP: Indeks daya pembeda,
BA : banyaknya peserta tes kelompok atas yang menjawab soal dengan benar,
BB : banyaknya peserta tes kelompok bawah yang menjawab soal dengan benar,
JA : banyaknya peserta tes kelompok atas, dan
JB : banyaknya peserta tes kelompok bawah
4
Untuk menguji validitas setiap butir soal maka skor-skor yang ada pada butir yang
dimaksud dikorelasikan dengan skor totalnya. Skor tiap butir soal dinyatakan skor X dan
skor total dinyatakan sebagai skor Y, dengan diperolehnya indeks validitas setiap butir
soal, dapat diketahui butir-butir soal manakah yang memenuhi syarat dilihat dari indeks
validitasnya. Validitas butir secara statistik dianalisis berdasakan jenis data yang
terkumpul. Data diskrit (misalnya hasil tes obyektif) dihitung dengan korelasi point
biserial sedangkan data kontinu (misalnya hasil tes uraian atau skala sikap) digunakan
korelasi Pearson product – moment. aliditas berasal dari kata validity yang mempunyai
arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi
ukurnya. Suatu skala atau instrumen pengukur dapat dikatakan mempunyai validitas
yang tinggi apabila instrumen tersebut menjalankan fungsi ukurnya, atau memberikan
hasil ukur yang sesuai dengan maksud dilakukannya pengukuran tersebut. Sedangkan tes
yang memiliki validitas rendah akan menghasilkan data yang tidak relevan dengan
tujuan pengukuran.
Validitas tes biasa juga disebut sebagai kesahihan suatu tes adalah mengacu pada
kemampuan suatu tes untuk mengukur karakteristik atau dimensi yang dimaksudkan
untuk diukur. Sedangkan reliabilitas atau biasa juga disebut sebagai kehandalan suatu tes
mengacu pada derajat suatu tes yang mampu mengukur berbagai atribut secara konsisten
(Brennan, 2006). Valid berarti cocok atau sesuai. Suatu tes dikatakan valid, apabila tes
tersebut benar-benar manyasar keapada apa yang dituju. Tes tersebut benar-benar dapat
memberikan keterangan atau gambaran tentang apa yang diinginkan. Jika tes itu bahasa,
maka tes tersebut harus diberikan gambaran tentang kemampuan dan kacakapan anak
dalam hal bahasa, dan bukan manunjukkan gambaran kecakapan anak dalam hal
ekonomi, ilmu bumi dan sebagainya.
Sifat valid diperlihatkan oleh tingginya validitas hasil ukur suatu tes. Suatu alat ukur
yang tidak valid akan memberikan informasi yang keliru mengenai keadaan subjek atau
individu yang dikenai tes itu. Apabila informasi yang keliru itu dengan sadar atau tidak
dengan sadar digunakan sebagai dasar pertimbangan dalam pengambilan suatu
keputusan, maka keputusan itu tentu bukan merupakan suatu keputusan yang tepat.
5
tersebut reliabel. Analisis reliabilitas mengkaji keajegan (stability) atau ketetapan hasil
tes manakala tes tersebut diujikan kepada siswa yang sama lebih dari satu kali, atau dari
dua perangkat tes yang setara kepada objek yang sama.Tes yang memiliki konsistensi
reliabilitas tinggi adalah akurat, reprodusibel, dan generalized terhadap kesempatan
testing dan instrumen tes lainnya. Berikut ini merupakan empat factor yang
mempengaruhi reliabilitas, yaitu:
1. Panjang tes (Length of Test)
2. Sebaran skor (spread of scores)
3. Tingkat kesukaran (Difficulties Index)
4. Obyektifitas
Menurut perhitungan product Moment ada 3 macam reliabilitas, yaitu:
a). Koefisien stabilitas
Koefisien stabilitas merupakan jenis reliabilitas yang menggunakan teknik test
and retest yaitu memberikan tes kepada sekelompok individu kemudian mengulang
tes yang sama pada kelompok yang sama di waktuyangn berbeda.
6
BAB III
PENUTUP
3.1 Kesimpulan
Dalam suatu evaluasi pembelajaran dibutuhkan juga evaluasi proses penilaian dan
pengukuran siswa. Salah satunya dengan menganalisis kesukaran soal, daya pembeda
dan fungsi distraktor atau pengecoh. Yang mana dalam analisis kesukaran soal sangat
dibutuhkan sekali. Karena untuk mengetahui apakah testee bisa mengerjakan soal yang
diberikan atau justru soal yang diberikan terlalu mudah bahkan terlalu sukar. Karena
proprsi dalam kesukaran soal paling tidak terdiri dari 25% sukar, 50% sedang dan 25%
mudah. Yang mana dengan porsi yang sudah diatur bagi testee pandai maupun tidak
pandai mudah mengerjakan soal atau tidak merasa kesulitan. Begitupula dibutuhkannya
daya pembeda khususnya dalam soal multiple choice, sangat berarti yang mana dari sini
bisa diketahui mana anak yang pandai dan tidak. Dan ditambah dengan distaktor atau
pengecoh jawaban pada soal multiple choice. Yang berfungsi sebagai alat yang dapat
menggambarkan apakah butir soal yang dibuat baik atau gagal. Dalam keseluruhannya,
analisis soal-soal pada sebuah tes sangat diperlukan guna untuk mengadakan identifikasi
soal-soal yang baik, kurang baik dan soal yang jelek. Dengan menganalisis soal akan
diperoleh informasi tentang kejelakan sebuah soal dan petunjuk untuk mengadakan
perbaikan dalam pembelajaran. Dan sebagai acuan para pendidik untuk terus menilai dan
mengukur hasil belajar para siswa dengan baik dan adil.
3.2 Saran
Ketika kita menjadi pengajar dan pendidik, sebaiknya dalam penyusunaninstrument
tes, seperti soal tes hendaknya disesuaikan dengan kriteria penyusunan soal yang baik dan
benar. Dimana, tingkat kesukarannyadiperhatikan, daya pembeda disesuaikan, pengecoh
soal berfungsi dengan baik.Dan juga ketika diuji dengan validitas maupun realibilitas
sesuai dengankualitas dan metode pembelajaran yang menjunjung tinggi cita-cita
guruIndonesia untuk mencerdaskan kehidupan bangsa.
7
DAFTAR PUSTAKA