Latar belakang
(rangkuman) Salah satu tugas penting dari staf pengajar (guru, dosen dan lain-lain) adalah
melaksanakan evaluasi. Dalam konteks peserta didik di sekolahan jenis-jenis soal sering
diujiakan dengan harapan dapat mengukur kemampuan peserta didik, apakah terdapat kemajuan
dalam belajar di sekolah atau tidak. Alat pengukuran dimaksud adalah tes hasil belajar, yang
sebagaimana telah kita ketahui berupa butir-butir soal. Sehingga evaluasi pembelajaran ini
menjadi penting untuk dilakukan oleh staf pengajar tersebut. (makalah)
(rangkuman)Kenyataan sering kali menunjukkan bahwa, apabila dalam tes hasil belajar,
dimana hampir seluruh peserta tes mengalami kemerosotan (nilai jatuh) dalam arti nilai hasil
belajarnya sangat rendah maka tester (guru, dosen dll) sering kali menganggap bahwa testee
(murid, mahasiswa dll) bodoh dan seolah-oleh melimpahkan kesalahan sepenuhnya kepada
testee. Begitupun sebaliknya jika testee memperoleh nilai yang memuaskan dalam arti mendapat
nilai yang tinggi.[1] Sehingga klaim yang dikeluarkan adalah peserta didik itu pintar semua.
(makalah)
(rangkuman)Salah satu cara untuk mengantisipasi keadaan yang tidak normal seperti di
atas sebenarnya dapat dilakukan dengan cara menganalisis tes dari hasil belajar yang telah
dijadikan alat mengukur keberhasilan belajar dari para peserta tes tersebut. Disini tester perlu
melakukan penelusuran dan pelacakan dengan secara cermat terhadap butir-butir soal atau item
yang merupakan bagian tak terpisahkan dari tes hasil belajar sebagai suatu totalitas. (makalah)
(rangkuman)Analisis tes dan butir soal merupakan suatu tahap yang harus ditempuh untuk
mengetahui derajat kualitas suatu tes, baik tes secara keseluruhan maupun butir soal yang
menjadi bagian dari tes tersebut. sebab itu, tes digunakan guru harus memiliki kualitas yang baik.
Analisis tes berkaitan dengan pertanyaan apakah tes itu mampu dijadikan sebagai alat ukur
benar-banar mampu mengukur apa yang hendak diukur?, dan sampaimana tes tersebut dapat
diandalkan dan berguna?.[2] (makalah)
(rangkuman)Kedua pertanyaan ini sebenarnya menunjuk pada dua hal pokok, yaitu validitas dan
reliabilitas. Kedua hal ini sekaligus merupakan karakteristik alat ukur yang baik. Namun dalam
tulisan ini penulis menambahi satu hal yang tidak kalah penting yaitu kepraktisan dengan
maksud untuk menunjang kualitas tes. (makalah)
a. Validitas
(rangkuman)Instrument evaluasi yang kurang baik akan menghasilkan hasil evaluasi yang
kurang baik pula. Untuk itu, dalam mengembangkan instrument evaluasi, seorang evaluator
harus memperhatikan hal-hal yang mempengaruhi validitas instrument dan berkaitan dengan
prosedur penyusunan instrument. Seperti silabus, kisi-kisi soal, petunjuk mengerjakan soal dan
pengisian lembar jawaban, kunci jawaban, penggunaan kalimat efektif, bentuk alternative
jawaban, tingkat kesukaran, daya pembeda, dan sebagiannya. (makalah)
2. Faktor Administrasi Evaluasi dan Penskoran
(rangkuman)Banyak hal yang mempengaruhi hasil evaluasi yang berkaitan dengan administrasi
dan penskoran, antara lain, alokasi waktu pengerjaan tes atau soal, kedisplinan guru pengawas,
kedisplinan peserta tes, kesalahan penskoran, serta kondisi fisik dan psikis peserta tes. Dalam hal
ini, banyak sekali terjadi penyimpangan atau kekeliruan, sehingga perlu diantisipasi. (makalah)
(rangkuman)Dalam praktiknya, factor jawaban peserta didik justru lebih banyak berpengaruh
terhadap validitas hasil tes dibandingkan dengan kedua factor di atas. Factor ini meliputi
kecenderungan peserta didik untuk mengjawab dengan cepat namun kurang tepat, keinginan
untuk coba-coba dan menggunakan gaya bahasa tertentu dalam menjawab soal bentuk uraian.[3]
Dalam literature modern tentang evaluasi, banyak dikemukakan tentang jenis-jenis validitas,
yaitu: (makalah)
(rangkuman)Validitas ini menggunakan kriteria yang sangat sederhana, karena hanya melihat
dari sisi muka atau tampang dari instrument itu sendiri. Artinya, jika suatu tes secara sepintas
telah dianggap baik maka tes tersebut dapat dikatakan telah memenuhi syarat validitas
permukaan dan tidak membutuhkan judgement yang mendalam. (makalah)
(rangkuman)Validitas isi sering digunakan dalam penilaian hasil belajar atau untuk mengetahui
sejauh mana peserta didik menguasai materi pelajaran yang telah disampaikan dan perubahan
psikologis yang terjadi setelah mengalami proses pembelajaran. Validitas isi disebut pula
validitas kurikuler berkenan dengan relevansi materi tes dengan kurikulum yang ditentukan atau
validitas perumusan berkenaan dengan apakah apek dalam soal tercakup dalam apa yang hendak
diukur. Validitas kurikuler ini dapat dilakukan dengan dengan beberapa cara, antara lain
mencocokkan materi tes dengan silabus dan kisi-kisi, melakukan diskusi dengan sesame
pendidik, atau mencermati kembali subtansi dari konsep yang akan diukur. (makalah)
1.) Validitas prediktif (Predictive validity) yang digunakan untuk meramalkan prestasi belajar
peserta didik pada masa depan. Validitas ini bermaksud untuk melihat, sampai mana suatu tes
dapat mempraktikkan perilaku peserta didik pada masa yang akan datang.
2.) Validitas kongkuren (concurrent validity) digunakan untuk criteria standar yang berlainan.
Misalnya, skor tes dalam mata pelajaran bahasa Indonesia dikorelasikan dengan skor tes bahasa
inggris.
3.) Validitas sejenis (congruent validity) untuk criteria yang sejenis. Misalnya, bahasa
Indonesia dengan bahasa Indonesia. (makalah)
(rangkuman)Dalam mengukur, validitas suatu tes hendaknya yang menjadi kriteria sudah betul-
betul valid sehingga dapat diandalkan keampuhannya dan dapat dianggap sebagai test standar.
Sebaliknya, bila kriterianyatidak valid, maka tes-tes lain yang akan divalidasi menjadi kurang
atau tidak meyakinkan. Suatu tes akan mempunyai koefisien validitas yang tinggi jika tes itu
betul-betul dapat mengukur apa yang hendak diukur dari peserta didik tertentu. (makalah)
5.) Penilaian
(rangkuman)Untuk menguji validitas empiric dapat digunakan jenis statistic korelasi product-
moment,korelasi perbedaan peringkat, atau korelasi diagram pencar. (makalah)
r = koefisien korelasi
Langkah-langkah penyelesaian:
X Y x Y x2 y2 Xy
– Isi kolom x dengan nilai tiap peserta pada mata pelajaran X dikurangi dengan nilai rata-
rata mata pelajaran X
– Isi kolom x dengan nilai tiap peserta pada mata pelajaran Y dikurangi dengan nilai rata-
rata mata pelajaran Y
Korelasi product-moment juga dapat dilakukan dengan menggunakan angka kasar, dengan
rumus:
keterangan:
r = koefisien korelasi
n = jumlah sampel
Langkah-langkah:
– Cari peringkat dari tiap-tiapmata pelajaran dengan mengurutkan nilai-nilai dari yang
terbesar sampai yang terkecil.
– Jika terdapat nilai yang sama, maka jumlahkan nilai peringkat pertama dengan kedua lalu
bagi dua, maka kedua orang tersebut memiliki peringkat yang sama.
Dalam statistika koefisien korelasi dinotasikan dengan “r” dimana -1,00 ≤ r ≥ 1,00, r = +1,00
artinya korelasi sempurna positif dan r = -1,00 artinya korelasi sempurna negative. Untuk
menafsirkan koefisien korelasi dapat menggunakan criteria berikut:
(rangkuman)Valditas konstruk merupakan konsep yang dapar diobservasi dan dapat diukur,
validitas konstruk dikenal juga dengan istilah validitas logis dan digunakan dalam tes-tes
psikologi untuk mengukur gejala perilaku yang abstrak. Validitas konstruk digunakan untuk
mengetahui sejauh mana tes dapat mengobservasi dan mengukur fungsi psikologis. Seperti
kesetia kawanan, kematangan emosi, sikap, motivasi, minat dan sebagainya. (makalah)
e). Validitas Faktor
(rangkuman)Penilaian hasil belajar kerap menggunakan pengukuran atas suatu variable yang
terdiri dari beberapa factor yang diperoleh dari indicator. Validitas factor dapat dihitung dengan
menghitung homogenitas skor setiap factor dengan total skor dan antara skor factor satu dengan
lainnya.[7] (makalah)
Reliabilitas
(rangkuman)Reliabilitas merupakan derajat konsistensi suatu instrument. Suatu tes dapat dikatan
reliable apabila selalu memberikan hasil yang sama bila diteskan pada kelompok yang sama pada
kesempatan yang berbeda. Berikut ini merupakan empat factor yang mempengaruhi reliabilitas,
yaitu: (makalah)
4. Obyektifitas
Keterangan
P = proporsi peserta didik yang menjawab betul dari suatu butir soal
Q = 1-p
Kepraktisan
1. Kemudahan mengadministrasi
3. Kemudahan menskor
a. Tingkat Kesukaran
(rangkuman)Perhitungan tingkat kesukaran soal adalah pengukuran seberapa besar derajat
kesukaran suatu soal. Jika suatu soal memiliki tingkat kesukaran seimbang (proporsional), maka
dapat dikatakanbahwa soal tersebut baik. Suatu soal hendaknya tidak terlalu sukar dan tidak
terlalu mudah. (makalah)
Keterangan:
Langkah-langkah
– ≤ 27% = mudah
– ≥ 72% = sukar[10]
b. Daya Pembeda
(rangkuman)Perhitungan daya pembeda adalah peengukuran sejauh mana suatu butir soal
mampu membedakan peserta didik yang belum atau kurang mengasaui kompetensi. (makalah)
Keterangan:
DP = daya pembeda
n = 27% x N
– Menguranngkan WL dengan WH
– Menambahkan WL dengan WH
(rangkuman)Tekhnik yang digunakan untuk menghitung daya pembeda soal bentuk uraian
adalah menghitung perbedaan dua rata-rata (mean), yaitu antara rata-rata dari kelompok atas
dengan rata-rata dari kelompok bawah untuk tiap-tiap soal.[11](makalah)
D. Analisis Pengecoh
Indeks pengecoh:
Keterangan:
IP = Indeks pengecoh
n = jumlah opsi
1 = bilangan tetap
(rangkuman)Homogentias diketahui dengan menghitung koefisien korelasi antara skor tiap butir
dengan skor total. Salah satu teknik korelasi yang dapat digunakan adalah korelasi product
moment atau korelasi point biserial.[13] (makalah)
Langkah-langkah:
Keterangan:
– Jumlah pemilih kelompok atas harus lebih banyak dari jumlah pemilih kelompok bawah
Keterangan:
Kb = kelompok bawah
– Jumlah pemilih kelompok bawah harus lebih besar daripada kelompok atas.[14]
G. Kesimpulan
(rangkuman)Analisis tes dan butir soal merupakan suatu tahap yang harus ditempuh untuk
mengetahui derajat kualitas suatu tes, baik tes secara keseluruhan maupun butir soal yang
menjadi bagian dari tes tersebut. Suatu instrument dapat dikatakan valid apabila benar-benar
mampu mengukur apa yang hendak diukur dengan tepat. Validitas dapat dihitung dengan
beberapa metode, antara lain metode korelasi product moment angka simpangan,korelasi
perbedaan peringkat peringkat dan diagram pencar. Reliabilitas merupakan derajat konsistensi
suatu instrument. Suatu tes dapat dikatan reliable apabila selalu memberikan hasil yang sama bila
diteskan pada kelompok yang sama pada kesempatan yang berbeda.Ada beberapa rumus yang
dapat digunakan untuk menghitung reliabilitas, yaitu rumus spearman brown, rumus kuder
richarson dan rumus koefisien alpha. Hal lain yang perlu diperhatikan dalam menganalisis tes
adalak kepraktisan tes terrsebut, dimana kepraktisan berarti kemudahan baik dalam hal
persiapan, penggunaan, mengolahan, penafsiran maupun pengadminitrasian. (makalah)
(rangkuman)Analisis butir soal dilakukan dengan melakukan perhitungan tingkat kesukaran dan
daya pembeda. Analisis lain yang dibutuhkan untuk memastikan kualitas tes dan butir soal
adalah analisis pengecoh, analisis homogenitas dan analisis efektivitas fungsi opsi. (makalah)
*Ma’af dalam makalah ini terdapat kata kunci rangkuman dan makalah dengan maksud untuk
memudahkan pencarian anda ke situs: www.rangkumanmakalah.com