BAB I
PENDAHULUAN
A. Latar Belakang Penulisan
Analisis kualitas tes merupakan suatu tahap yang harus ditempuh untuk mengetahui
derajat kualitas suatu tes, baik tes secara keseluruhan maupun butir soal yang menjadi bagian
dari tes tersebut. Dalam peneliaian hasil belajar, tes diharapkan dapat menggambarkan sampel
perilaku dan menghasilkan nilai yang obyektif serta akurat. Jika tes yang digunakan guru kurang
baik, maka hasil yang diperoleh pun tentunya kurang baik. Hal ini dapat merugikan peserta didik
itu sendiri. Artinya, hasil yang diperoleh peserta didik menjadi tidak obyektif dan tidak adil.
oleh karena itu, tes yang digunakan guru harus memiliki kualitas yang lebih baik dilihat dari
berbagai segi. Tes hendaknya disusun sesuai dengan prinsip dan prosedur penyusunan tes.
Setelah digunakan perlu diketahui apakah suatu tes tersebut berkualitas baik atau kurang baik.
Untuk mengetahui apakah suatu tes yang digunakan termasuk baik atau kurang baik, maka perlu
dilakukan analisis kualitas.
Dalam hal pengukuran, Weitzenhoffer dalam Mohamad Nur menyatakan bahwa
pengukuran sebagai suatu operasi yang dilakukan terhadap alam fisik oleh pengamat. Misalnya,
ingin mengukur hasil belajar,intelegensi, sikap, motivasi berprestasi, dan sebagainya. Sekarang
muncul suatu pertanyaan, yaitu apakah suatu alat ukur benar-benar mengukur apa yang hendak
dan seharusnya diukur serta sejauh mana alat ukur tersebut dapat diandalkan dan berguna,
sebenarnya menunjuk pada dua hal yang pokok, yaitu validitas dan reliabilitas.[1] Namun dalam
makalah ini hanya akan dibahas tentang reliabilitas sebuah tes.
Nurkancana dalam bukunya menyatakan bahwa suatu alat pengukur dapat dikatakan alat
pengukur yang valid apabila alat pengukur tersebut dapat mengukur apa yang hendak diukur
secara tepat. Dalam hal validitas dan reliabilitas, tentunya dipengaruhi oleh(1) instrumen, (2)
subjek yang diukur, dan (3) petugas yangmelakukan pengukuran. Dalam hal pengukuran,
khususnya dalampendidikan tentunya yang terpenting adalah informasi hasil ukur yangbenar.
Sebab dengan hasil ukur yang tidak atau kurang tepat makaakan memberikan informasi yang
tidak benar, sehingga kesimpulanyang diambil juga tidak benar.[2]
Oleh karena keberhasilan mengungkap hasil dan proses dari suatu objek penelitian sangat
bergantung pada kualitas alat penilainya, di samping itu juga yang tidak kalah pentingnya
tergantung pada cara pelaksanaannya. Suatu alat penilaian dikatakan mempunyai kualitas yang
baik apabila alat tersebut memiliki atau memenuhi dua hal, yaitu validitas (ketepatan) dan
reliabilitas (ketetapan atau keajegan) alat tes terjamin kualitasnya.
Validitas dan Reliabilitas suatu data merupakan ciri yang menandai bahwa penelitian
memiliki alat ukur yang baik. Untuk dapat menentukan apakah suatu alat ukur telah memiliki
validitas atau daya ketepatan mengukur, dapat dilakukan dari dua segi; yaitu dari segi alat ukur
data itu sendiri sebagai suatu totalitas dan dari segi itemnya sebagai bagian yang tidak
terpisahkan dari tes tersebut. Sedangkan Reliabilitas adalah ketetapan suatu alat ukur apabila
diberikankan kepada subjek yang sama.
Berdasar latar belakang itu, maka dalam makalah ini akan dibahas tentang bagaimana
“Menentukan Reliabilitas serta Karakteristik Lain yang Diharapkan” dalam membuat
sebuah tes ataupun evaluasi.
B. Rumusan Masalah
1. Bagaimanakah cara menentukan reliabilitas instrumen dengan baik dan benar?
2. Karakteristik lain apakah yang diharapkan dalam evaluasi?
C. Tujuan penulisan
1. Mengetahui cara menentukan reliabilitas instrumen dengan baik dan benar.
2. Mengetahui karakteristik lain yang diharapkan dalam evaluasi
BAB II
PEMBAHASAN
A. Reliabilitas
1. Pengertian Reliabelitas
Reliabilitas adalah karakter lain dari hasil evaluasi. Realibilitas adalah tingkat atau derajat
konsistensi dari suatu instrument. Reliabilitas juga dapat diartikan sama dengan konsistensi atau
keajegan. Suatu instrumen evaluasi, dikatakan mempunyai nilai reliabilitas yang tinggi apabila
tes yang dibuat mempunyai hasil yang konsisten dalam mengukur yang hendak diukur. Ini
berarti semakin reliabel suatu tes, semakin yakin kita dapat menyatakan bahwa dalam hasil
suatu tes mempunyai hasil yang sama dan bisa dipakai di suatu tempat sekolah, ketika dilakukan
tes tersebut.
Reliabilitas soal merupakan ukuran yang menyatakan tingkat keajegan atau kekonsistenan
suatu tes soal. Untuk mengukur tingkat keajegan soal ini digunakan perhitungan Alpha
Cronbach. Rumus yang digunakan dinyatakan dengan:
Keterangan
: reliabilitas instrument
n : banyaknya butir soal
Si2 : jumlah varians tiap skor
St2 : varians skor total
Rumus untuk mencari varians adalah:
Interpretasi nilai r11 mengacu pada pendapat Guilford (Ruseffendi, 1991b: 191):
rii < 0,20 reliabilitas sangat rendah
0,20 < rii 0,40 reliabilitas rendah
0,420 < rii 0,70 reliabilitas sedang
0,70 < rii 0,90 reliabilitas tinggi
0,90 < rii 1,00 reliabilitas sangat tinggi.[3]
Rumus KR21:
Dimana
r11 : koefisien reliabilitas tes
n : banyaknya butir item
1 : bilangan konstan
Mt = : mean total (rata-rata hitung dari skor total)
: varian total
c) Alternate Form
Dalam pelaksanaan pengujian reabilitas tes dengan menggunakan pendekatan alternate form
atau bentuk paralel ini, skor-skor yang diperoleh dari kedua seri tes tadi dicari korelasinya.
Apabila terdapat korelasi positif yang signifikan maka dapat dikatakan bahwa tes hasil belajar
tersebut dapat dikatakan reliabel. Teknik korelasi yang dipergunakan bisa dipilih antara teknik
korelasi product moment dari Pearson atau teknik korelasi rank order dari Spearman (khusus
untuk N kurang dari 30).
Rumus prodect moment Pearson:[7]
=
Keterangan
: angka indeks korelasi “r” product moment
N : banyaknya pasangan skor X dan skor Y (banyaknya subjek)
: penjumlahan hasil perkalian antara skor X dan skor Y
: jumlah seliruh skor X
: jumlah seluruh skor Y
Contoh: 10 orang peserta didik dites dalam mata pelajaran PKn dan PAI. Jumlah masing-masing
lima buah. Dua buah nomor genap diambil dari hasi tes PKn dan tiga buah nomor ganjil diambil
dari hasil tes PAI. Data diambil sebagai berikut:
Nama Skor PKn Skor PAI
No. Genap (2 dan 4) No. Ganjil (1,3 dan 5)
A 8 6 8 7 10
B 7 7 6 7 5
C 5 6 6 6 6
D 8 6 7 6 9
E 5 6 5 5 5
F 4 7 4 6 6
G 5 9 7 5 5
H 7 5 8 5 4
I 7 8 4 9 7
J 9 5 9 9 4
130 190 22 90 29
X=13 X=19
= = = = = = 0,65
Penelitian ditandai oleh sikap dan pendekatan empiris yang kuat.Secara umum empiris
berarti berdasarkan pengalaman praktis. Dalampenelitianempiris kesimpulan didasarkan atas
kenyataan-kenyataan yangdiperoleh dengan menggunakan metode penelitianyang sistematik,
bukanberdasarkan pendapat atau kekuasaan. Sikap empiris umumnya menuntutpenghilangan
pengalaman dan sikap pribadi. Kritis dalam penelitianberartimembuat interpretasi berdasarkan
pada kenyataan dan nalar yang didasarkanatas kenyataan-kenyataan (evidensi). Evidensi adalah
data yang diperolehdari evaluasi, berdasarkan hasil analisis data tersebut interpretasi
dibuat.Angka, print out, catatan lapangan, rekaman wawancara artifak dandokumen sejarah
adalah sejumlah contoh data dalam penelitian.
f) Penalaran Logis.
Valid artinya suatu alat ukur dapat dikatakan valid jika betul-betul mengukur apa yang
hendak diukur secara tepat. Misalnya, alat ukur matapelajaran Ilmu Fiqih, maka alat ukur
tersebut harus betul-betul dan hanya mengukur kemampuan peserta didik dalam mempelajari
Ilmu Fiqih, tidak boleh dicampuradukkan dengan materi pelajaran yang lain. Validitas suatu alat
ukur dapat ditinjau dari berbagai segi, antara lain validitas ramalan (predictive validity), validitas
bandingan (concurent validity), dan validitas isi (content validity), validitas konstruk (construct
validity), dan lain-lain.
2) Realible
Reliabel artinya suatu alat ukur dapat dikatakan reliabel atau handal jika ia mempunyai
hasil yang taat asas (consistent). Misalnya, suatu alat ukur diberikan kepada sekelompok peserta
didik saat ini, kemudian diberikan lagi kepada sekelompok peserta didik yang sama pada saat
yang akan datang, dan ternyata hasilnya sama atau mendekati sama, maka dapat dikatakan alat
ukur tersebut mempunyai tingkat reliabilitas yang tinggi.
3) Relevan
Relevan artinya alat ukur yang digunakan harus sesuai dengan standar kompetensi,
kompetensi dasar, dan indikator yang telah ditetapkan. Alat ukur juga harus sesuai dengan
domain hasil belajar, seperti domain kognitif, afektif, dan psikomotor. Jangan sampai ingin
mengukur domain kognitif menggunakan alat ukur non-tes. Hal ini tentu tidak relevan.
4) Representatif
Representatif artinya materi alat ukur harus betul-betul mewakili dari seluruh materi yang
disampaikan. Hal ini dapat dilakukan bila guru menggunakan silabus sebagai acuan pemilihan
materi tes. Guru juga harus memperhatikan proses seleksi materi, mana materi yang bersifat
aplikatif dan mana yang tidak, mana yang penting dan mana yang tidak.
5) Praktis
Praktis artinya mudah digunakan. Jika alat ukur itu sudah memenuhi syarat tetapi sukar
digunakan, berarti tidak praktis. Kepraktisan ini bukan hanya dilihat dari pembuat alat ukur
(guru), tetapi juga bagi orang lain yang ingin menggunakan alat ukur tersebut.
6) Deskriminatif
Deskriminatif artinya adalah alat ukur itu harus disusun sedemikian rupa, sehingga dapat
menunjukkan perbedaan-perbedaan yang sekecil apapun. Semakin baik suatu alat ukur, maka
semakin mampu alat ukur tersebut menunjukkan perbedaan secara teliti. Untuk mengetahui
apakah suatu alat ukur cukup deskriminatif atau tidak, biasanya didasarkan atas uji daya
pembeda alat ukur tersebut.
1. Spesifik
Spesifik artinya suatu alat ukur disusun dan digunakan khusus untuk objek yang diukur. Jika alat
ukur tersebut menggunakan tes, maka jawaban tes jangan menimbulkan ambivalensi atau
spekulasi.
2. Proporsional
Proporsional artinya suatu alat ukur harus memiliki tingkat kesulitan yang proporsional antara
sulit, sedang dan mudah. Begitu juga ketika menentukan jenis alat ukur, baik tes maupun non-
tes.
BAB III
PENUTUP
A. Kesimpulan
Reliabilitas mempermasalahkan sejauh mana hasil suatu pengukuran dapat dipercaya. Suatu
hasil pengukuran hanya dapat dipercaya apabila dalam beberapa kali pelaksanaan pengukuran
terhadap kelompok subyek yang sama, diperoleh hasil pengukuran yang relatif sama. Penentukan
koefisien reliabilitas instrumen untuk skor butir dikotomi dapat menggunakan cara Single test-
single trial, test-retest, alternate form. Interpretasi terhadap koefisien reliabilitas merupakan
intrepretasi relatif, artinya tidak ada batasan mutlak yang menunjukkan berapa angka koefisien
minimal yang harus dicapai agar suatu pengukuran dapat disebut reliabel. Namun, memberikan
informasi tentang hubungan varians skor teramati dengan varians skor sejati kelompok individu.
Ada tujuh karakteristik evaluasi pendidikan menurut McMillan dan
Schumacher yaitu: 1) Objectivity (objektivitas); 2) Precision (ketepatan); 3) Verification (verifik
asi); 4) Parsimonious explanation (Penjelasan ringkas); 5) Empiricism (empiris);6) Logical
reasoning (pendapatlogis); dan 7) Conditional conclutions (kesimpulan kondisional). Sedangkan
Zainal Arifin secara sederhana, mengemukakan karakteristik evaluasi yang baik adalah valid,
reliabel, relevan, representatif, praktis, deskriminatif, spesifik dan proporsional.
DAFTAR PUSTAKA
Arifin, Zainal. 2011. Evaluasi Pembelajaran. Bandung: Remaja Rosdakarya
Bungin, M. Burhan. 2005.Metodologi Penelitian Kuantitatif : Komunikasi, ekonomi, dan kebijakan
publik serta ilmu-ilmu sosial lainnya. Jakarta: Prenada Media
Djaali., dkk. 2000. Pengukuran Dalam Pendidikan. Jakarta: Program Pascasarjana
Hadjar, Ibnu. 1996.Dasar-dasar Metodologi Penelitian Kwantitatif dalam Pendidikan. Jakarta:
RajaGrafindo Persada
Jihad, Asep dan Haris, Abdul. 2008. Evaluasi Pembelajaran. Yogyakarta: Multi Pressindo
McMillan, J.H dan Schumacher, S. (2001). Research in Education: A ConceptualIntro-duction(5th
ed.), US, Longman.Inc
Nur, Mohamad. 1987. Teori Tes. Surabaya: IKIP Surabaya
Nurkancana, Wayan., PPN. Sunartana. 1992. Evaluasi Hasil Belajar. Surabaya: Usaha Nasional
Purwanto, Ngalim. 1997. Prinsip-Prinsip dan Teknik Evaluasi Pengajaran. Bandung: Remaja
Rosdakarya
Sudijono, Anas. 2009. Pengantar Evaluasi Pendidikan. Jakarta: Raja Grafindo Persada
Suharsimi Arikunto. 2000. Manajemen Penelitian. Jakarta: Rineka Cipta
Sukardi. 2009. Evaluasi pendidikan Prinsip dan Operasionalnya. Jakarta: Bumi Aksara
Sumadi Suryabrata. 2008.Metodologi Penelitian. Jakarta: RajaGrafindo Persada
Uno, Hamzah B.2011. Perencanaan Pembelajaran. Jakarta: Bumi Aksara
Wiraatmadja, Rochiat. 2008. Metode Penelitian Tindakan Kelas. Bandung: Remaja Rosdakarya