Anda di halaman 1dari 7

EVALUASI PENDIDIKAN

ALIEF ABDUL HARIS


http://www.thoriqul-ulum.com
2010

BAB I
PENDAHULUAN
Secara formal, pendidikan diselenggarakan disekolah. Hal itu sering dikenal dengan
pengajaran dimana proses belajar mengajar yang melibatkan banyak faktor baik pengajar,
pelajar, bahan/materi, fasilitas maupun lingkungan. Pengajaran dilaksanakan tidak hanya
untuk kesenangan atau bersifat mekanis saja tetapi mempunyai misi atau tujuan bersama.
Dalam usaha untuk mencapai misi dan tujuan itu perlu diketahui apakah usaha yang
dilakukan sudah sesuai dengan tujuan? Untuk mengetahui apakah tujuan pendidikan sudah
tercapai perlu diadakan tes. Sebuah tes yang dapat dikatakan baik sebagai alat pengukur
harus memenuhi persyaratan tes, yaitu : validitas, reliabilitas, objektivitas, praktibilitas dan
ekonomis.
Ketika mengkontruksi sebuah tes, maka pertanyaan yang muncul adalah apakah
interpretasi skor yang dihasilkan dari penggunaan instrument sebagai alat ukur tepat,
bermanfaat dan dapat digunakan pada keadaan sekolah yang ada? Ada banyak macam tes
dan bervariasi pula kegunaannya tergantung dari tujuan yang hendak dicapai. Tes dan
instrument evaluasi dalam kategori paper dan pencil dapat digunakan untuk tes pencapaian
hasil belajar, yang didalamnya tercakup focus-fokus penting tujuan pilihan, penempatan,
diagnosis, dan sertifikasi profesi. Tes kecakapan digunakan untuk memprediksi
keberhasilan siswa dalam prospek belajar, atau dalam prospek bekerja. Tes penghargaan
digunakan untuk mengestimasi keberhasilan siswa, tes perkembangan social, dan juga
mengetahui problem siswa dan beberapa tes lainnya. Agar supaya instrument tersebut
memiliki kemampuan mengevaluasi secara baik maka perlu memenuhi beberapa
karakteristik penting dan perlu. Karakteristik penting tersebut adalah; validitas, reliabilitas
dan dapat digunakan (Usability).
Dalam makalah ini kami membahas reliabilitas sebagai salah satu Karakteristik tes
yang baik. Reliabilitas dapat diartikan sebagai keterpercayaan, keterandalan, keajegan,
konsistensi atau kestabilan.

http://www.thoriqul-ulum.com

BAB II
RELIABILITAS
A. Arti Reliabilitas Bagi Sebuah Tes.
Kata Realibilitas diambil dari bahasa Inggris Reliability dari kata asal Reliable yang
artinya dapat dipercaya. Reliabilitas sering dikacaukan oleh istilah Reliable.
Reliabilitas merupakan kata benda sedangkan Reliable merupakan kata sifat atau kata
keadaan. Reliabilitas merupakan salah satu persyaratan tes yang baik, reliabilitas
berhubungan dengan masalah kepercayaan. Suatu tes dapat dikatakan mempunyai taraf
kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang tetap. Maka
pengertian reliabilitas tes, berhubungan dengan masalah ketetapan hasil tes. Atau
seandainya hasilnya berubah-ubah perubahan yang terjadi dapat dikatakan tidak berarti1.
Suatu tes dapat dikatakan mempunyai taraf kepercayaan yang tinggi jika tes tersebut
dapat memberikan hasil yang tetap atau ajeg. Maka arti sebuah reliabilitas tes berhubungan
erat dengan masalah ketetapan hasil tes. Jika seandainya hasilnya berubah-ubah, perubahan
yang terjadi dapat dikatakan tidak berarti. Maksudnya Tidak reabelnya suatu tes evaluasi,
pada prinsipnya dapat dikatakan sia-sialah tes tersebut, karena jika dilakukan kembali
hasilnya akan berbeda.2 Reliabilitas suatu tes pada umumnya diekspresikan secara numerik
dalam bentuk koefisien yang besarnya -1>0>+1. Koefisien tinggi menunjukkan reliabilitas
tinggi. Sebaliknya, jika koefisien suatu tes rendah maka reliabilitas tes rendah. Jika suatu
reliabilitas sempurna, berarti tes tersebut mempunyai koefisien +1 atau -1.
Reabilitas tinggi menunjukkan kesalahan yang minim. Jika suatu tes mempunyai
reabilitas tinggi maka pengaruh kesalahan pengukuran telah terkurangi. Kesalahan
pengukuran dapat disebabkan oleh beberapa faktor, diantaranya karakteristik tes evaluasi itu
sendiri, semisal kondisi pelaksana tes yang tidak mengikuti aturan baku, tes item yang
meragukan dan mahasiswa langsung mengikuti, status peserta yang mengikuti tes, seperti
seorang yang sedang lelah, mempunyai problem pribadi, mahasiswa yang mempunyai
motifasi rendah, atau kombinasi dari segala permasalahan tersebut.3
Terkadang dalam pembicaraan evaluasi ajeg atau tetap diartikan sebagai sama,
padahal yang dimaksudkan tidak demikian. Ajeg atau tetap tidak selalu sama, tetapi
mengikuti perubahan secara ajeg. Semisal; jika keadaan si A dalam sebuah tes mula-mula
lebih rendah dibandingkan dengan si B, maka jika diadakan pengukuran ulang, si A juga
berada lebih rendah dari si B. itulah yang dikatakan ajeg atau tetap, yaitu sama dalam
kedudukan siswa diantara anggota kelompok yang lain. Tentu saja tidak dituntut semuanya
tetap. Besarnya ketetapan itulah menunjukkan tingginya reliabilitas instrument.

Suharsimi Arikunto, Dasar-Dasar Evaluasi Pendidikan Jakarta, Bumi Aksara, 2009, Hal: 86
Sukardi, Evaluasi Pendidikan, Jakarta, Bumi Aksara: 2009, Hal: 43
3
Ibid, Hal: 44
2

http://www.thoriqul-ulum.com

B. Cara Mencari Besarnya Reliabilitas


Beberapa metode yang dapat digunakan untuk mencari besarnya reliabilita antara
lain adalah :
1. Metode Tes Ulang (Test-Retest-Method)
Untuk mengetahui sampai dimana suatu pengukuran dapat diandalkan, pengukuran
ini dapat dilakukan dua kali, pengukuran pertama dan ulangnya. Kedua pengukuran ini
dapat dilakukan oleh orang yang sama atau berbeda. Dalam hal ini perlu diatur bahwa
proses pengukuran kedua, keadaan yang diukur itu harus benar-benar sama. Selanjutnya
hasil pengukuran yang pertama dan yang kedua dikorelasikan dan hasilnya menunjukkan
reliabilitas dari tes ini. Memang teknik ulangan ini akan dapat memenuhi sasaran bila
keadaan subjek yang diukur (dites) tetap bertahan dan tidak mengalami perubahan pada saat
pengukuran yang pertama maupun pada pengukuran yang kedua. Karena keadaan pribadi
anak itu selalu dalam keadaan berkembang, tidak statis, maka sebenarnya teknik ini kurang
tepat digunakan. Disamping itu pada pengukuran yang kedua akan dijumpai adanya testing
effect anak telah mendapat tambahan pengetahuan karena sudah mengalami tes yang
pertama.
Reliabilitas tes retes ini penting, khususnya ketika digunakan untuk menentukan
predictor misalnya tes kemampuan. Tes kemampuan tidak akan bermanfaat, jika ternyata
menunjukkan hasil yang berubah-ubah secara signifikan saat diberikan pada responden.
Penentuan pemakaian reliabilitas tes retes, juga tepat ketika bentuk tes alternative lainnya
tidak ada, dan ketika tampak bahwa orang yang mengambil tes kedua kalinya tidak ingat
atas jawaban tes yang pertama. Para pengambil tes pada umumnya akan terus mengingat
jawabanya, jika item-item yang ada banyak mengandung factor sejarah, dibanding bentuk
item ilmu pengetahuan aljabar misalnya.
2. Metode Bentuk Paralel (Equivalent)
Tes paralel atau tes equivalent adalah dua buah tes yang mempunyai kesamaan
tujuan, tingkat kesukaran dan susunan tetapi butir-butir soalnya berbeda, dalam istilah
bahasa Inggris disebut alternate-forms method (parallel forms).
Dengan metode bentuk paralel ini, dua buah tes yang paralel, misalnya tes PAI seri A
yang akan dicari reliabilitasnya dan tes Seri B diteskan kepada sekelompok siswa yang
sama, kemudian dikorelasikan. Koefisien korelasi dari kedua hasil tes inilah yang
menunjukkan koefisien reliabilitas tes seri A. jika koefisiennya tinggi maka tes tersebut
sudah reliable dan dapat digunakan sebagai alat dan pengetes yang terandalkan.
Dalam menggunakan metode tes paralel pengetes harus menyiapkan dua buah tes,
dan masing-masing dicobakan kepada sekelompok siswa yang sama. Penggunaan metode
ini baik karena siswa dihadapkan kepada dua macam tes sehingga tidak ada factor masih
ingat-ingat soalnya yang dalam evaluasi disebut adanya practice-effect- dan carry-over-

http://www.thoriqul-ulum.com

effect. Artinya ada factor yang dibawa oleh pengikut tes karena sudah mengerjakan soal
tersebut.
Kelemahan dari metode ini adalah bahwa pengetes pekerjaannya berat karena harus
menyusun dua seri tes. Lagipula harus tersedia waktu yang lama untuk mencobakan dua
kali tes
Mengenai pertanyaan bagaimana proses melaksanakan tes reliabilitas secara
ekivalen? Berikut ini akan ditunjukkan beberapa langkah-langkah tersebut diantaranya
adalah sebagai berikut:
1) Menentukan subjek sasaran yang hendak di tes
2) Melakukan tes yang dimaksud kepada sasaran subjek yang dimaksud
3) Diadministrasi dengan baik
4) Dalam waktu yang tidak begitu lama melakukan tes yang kedua pada
kelompok tersebut.
5) Mengkorelasikan antara kedua skor tes tersebut.
Jika hasil koefisien ekivalen tinggi, berarti tes memiliki reliabilitas ekivalen baik.
Sebaliknya, jika ternyata koefesien rendah maka reliabilitas ekivalen tes adalah rendah.
Reliabilitas ekivalen merupakn salah satu bentuk yang diterima dan umum dipakai
penelitian terutama penelitian pendidikan.
3. Metode Belah Dua Atau Split-Half Method
Dalam teknik belah dua ini, dalam pengetesan hanya menggunakan satu tes yang
dicobakan satu kali kepada sejumlah subjek (sample). Item-item pada tes dibagi dua. Skor
dari setengah item-item tes pada bagian yang pertama dikorelasikan dengan skor setengah
item-item tes pada bagian yang kedua.
Ada dua cara membelah butir soal ini yaitu :
1) Membelah atas item-item genap dan item-item ganjil yang selanjutnya disebut
belahan ganjil-genap. Dan
2) Membelah atas item-item awal dan item-item akhir yaitu separoh jumlah pada
nomor-nomor awal dan separo pada nomor-nomor akhir yang selanjutnya disebut
belahan awal-akhir.
Faktor-Faktor yang mempengaruhi Reliabilitas. Beberapa hal yang sedikit banyak
mempengaruhi hasil tes banyak sekali. Namun secara garis besar dapat dikelompokkan
menjadi 3 hal, yaitu :
1) Hal yang berhubungan dengan tes itu sendiri, yaitu panjang tes dan kualitas butirbutir soalnya. Tes yang terdiri dari banyak butir, tentu saja lebih valid
dibandingkan dengan tes yang hanya terdiri dari beberapa butir soal. Tinggi
rendahnya validitas merupakan tinggi rendahnya reliabilitas tes. Dengan
demikian maka semakin panjang tes maka reliabilitasnya semakin tinggi. Dalam
menghitung besarnya reliabilitas berhubungan dengan penambahan banyaknya
4

http://www.thoriqul-ulum.com

butir soal dalam tes ini ada sebuah rumus yang diberikan oleh Spearman dan
Brown sehingga terkenal dengan rumus Spearman-Brown.
r total tes = 2.r belah dua
1+r belah dua
Contoh penggunaan rumus tersebut misalnya dari hasil tes diketahui koefisien
reliabilitas yang terdiri atas 60 item adalah 0,80. Harga ini menjadi dasar korelasi
antara 30 item ganjil dan 30 item genap. Jika formula Spearman-Brown
digunakan maka;
r total tes = 2. (0,80) = 1,60 = 0,89
1+ 0, 80

1,80

Jadi, r table tes setelah korelasi adalah 0,89.4


2) Hal yang berhubungan dengan tercoba. Suatu tes dicobakan kepada kelompok
yang terdiri dari banyak siswa akan mencerminkan keragaman hasil yang
menggambarkan besar kecilnya reliabilitas tes-tes yangdicobakan bukan kepada
kelompok tidak terpilih, akan menunjukkan reliabilitas yang lebih besar daripada
yang dicobakan pada kelompok tertentu yang diambil secara dipilih.
3) Hal yang berhubungan dengan penyelenggaraan tes sudah di sebutkan bahwa
factor penyelenggaraan tes yang bersifat administratif, sangat menentukan hasil
tes. Contoh :
a. Petunjuk yang diberikan sebelum tes dimulai, maka memberikan
keterangan kepada para tes-tes dalam mengerjakan tes, dan dalam
penyelenggaraan tidak akan banyak terdapat pertanyaan. Ketenangan ini
tentu saja akan berpengaruh terhadap hasil tes.
b. Pengawas yang tertib akan mempengaruhi hasil yang diberikan oleh siswa
terhadap tes bagi siswa-siswa tertentu adalah pengawasan yang terlalu
ketat menyebabkan rasa jengkel dan tidak dapat dengan leluasa
mengerjakan tes.
c. Suasana lingkungan dan tempat tes (duduk tidak diatur, suasana
disekelilingnya ramai, dan sebagainya) akan mempengaruhi hasil tes.
Adanya hal-hal yang mempengaruhi hasil tes ini semua, secara tidak langsung akan
mempengaruhi reliabilitas tes. Koefisien reliabilitas dapat dipengaruhi diantaranya oleh
waktu penyelenggaraan tes-retes. Interval penyelenggaraan yang terlalu dekat atau terlalu
jauh, akan mempengaruhi koefisien reliabilitas. Faktor-faktor yang lain yang juga
mempengaruhi reliabilitas instrument evaluasi diantaranya sebagai berikut :
1) Panjang tes, semakin panjang suatu tes evaluasi, semakin banyak jumlah item
materi pembelajaran diukur. Ini menunjukkan dua kemungkinan yaitu:
a) Tes semakin mendekati kebenaran, dan

Sukardi, Evaluasi Pendidikan, Jakarta, Bumi Aksara: 2009, Hal: 48

http://www.thoriqul-ulum.com

b) Dalam mengikuti tes semakin kecil siswa menebak. Berarti akan semakin
tinggi nilai koefisien reliabilitasnya.
2) Penyebaran skor, koefisien reliabilitas secara langsung dipengaruhi oleh
bentuk sebaran skor dalam kelompok siswa yang diukur. Semakin tinggi sebaran,
semakin tinggi estimasi koefisien reliabilitas. Hal ini terjadi karena posisi skor
siswa secara individual mempunyai kedudukan sama pada tes-retes lain, sebagai
acuan.5
3) Kesulitan tes, tes normative yang terlalu mudah atau terlalu sulit untuk
siswa, cenderung menghasilkan skor reliabilitas rendah. Fenomena tersebut akan
menghasilkan sebaran skor yang cenderung terbatas pada salah satu sisi. Untuk
tes yang terlalu mudah skor jawaban siswa akan mengumpul pada sisi atas,
misalnya 9 atau 10. Untuk tes yang terlalu sulit, skor jawaban siswa akan
cenderung mengumpul pada ujung sebaliknya, atau rendah. Dua gejala tersebut
mempunyai kesamaan yaitu bahwa perbedaan diantara individu adalah kecil dan
cenderung tidak relevan
4) Objektivitas, yang dimaksud dengan objektif yaitu derajat dimana siswa dengan
kompetensi sama, mencapai hasil sama. Ketika prosedur tes evaluasi memiliki
objektifitas tinggi, maka reliabilitas hasil tes tidak dipengaruhi oleh prosedur
teknik penskoran. Item tes skor objektif yang dihasilkan tidak dipengaruhi
petimbangan atau opini dari seorang evaluator.6
C. Garis Besar Macam Macam Reliabilitas Dan Prosedur Pelaksanaan Pengukuran
Reliabilitas Yang Sering Ditemui Dalam Instrument Evaluasi Maupun Instrument
Penelitian.
Berikut ini table ringkasan yang menggambarkan secara garis besar macam-macam
reliabilitas dan prosedur pelaksanaan pengukuran reliabilitas yang sering ditemui dalam
instrumen penelitian.
Metode
Tes Retes

Tipe Reliabilitas Pengukuran


Mengukur Stabilitas

Prosedur
Memberikan tes yang sama, dua kali pada
grup sama dengan jeda waktu di antara dua
tes, misalnya 7 hari 1 bulan.

Bentuk

Mengukur Ekivalen

Ekivalen

Mengukur

Stabilitas

Memberi dua bentuk tes pada grup yang


dan sama dalam waktu yang berdekatan dua

Ekivalen

bentuk tes diberikan pada dua grup siswa


dengan menambah interval antara bentuk.

Belah Dua

Mengukur Kesulitan Internal

Diberikan tes sekali separuh skor tes;


diperoleh korelasi antara separuh untuk

5
6

Grounlund, et all Measurements And Evaluation In Teaching 6th Edition, New York, 1990, Hal: 94
Slameto, Evaluasi Pendidikan, Jakarta : Bumi Aksara, 2001, Hal: 56

http://www.thoriqul-ulum.com

menempatkan

semua

tes

dengan

formulanya Spearman Brown.7

D. Hubungan Reliabilitas Tes Dengan Validitas Tes


Hubungan antara validitas dengan realibilitas adalah jika suatu tes dinyatakan
mempunyai instrumen valid maka akan mempunyai reabilitas yang baik juga, sedangkan
jika suatu instrumen yang reliable belum tentu valid. Scarvia B. Anderson menyatakan
bahwa persyaratan bagi tes yaitu validitas dan reabilitas, dalam hal ini validitas lebih
penting dan reabilitas ini perlu karena menyokong terbentuknya validitas. Sebuah tes
mungkin reliabel tetapi tidak valid. Sedangkan sebuah tes yang valid biasanya reliabel.
Tuntutan bahwa instrumen evaluasi harus valid menyangkut harapan diperolehnya
data yang valid, sesuai dengan kenyataan. Dalam hal reabilitas ini tuntutannya tidak jauh
berbeda. Jika validitas terkait dengan ketepatan objek yang tidak lain adalah tidak
menyimpangnya data dari kenyataan, artinya bahwa data tersebut benar, maka konsep
reabilitasnya terkait dengan pemotretan berkali-kali. Instrument yang baik adalah
instrument yang dapat dengan ajeg memberikan data yang sesuai dengan kenyataan.

DAFTAR PUSTAKA
Arikunto, Suharsimi, Dasar-Dasar Evaluasi Pendidikan, Cet 9, Jakarta, Bumi Aksara, 2009.
Sukardi, Evaluasi Pendidikan: Prinsip Dan Operasionalnya, Cet 3, Jakarta, Bumi Aksara,
2009.
Slameto, Evaluasi Pendidikan, Jakarta : Bumi Aksara, 2001.
Grounlund, N.E dan Linn R.I Measurements And Evaluation In Teaching 6th Edition, New
York, Macmillan Publishing Company,1990.

Sukardi, Evaluasi Pendidikan, Jakarta, Bumi Aksara: 2009, Hal: 45

Anda mungkin juga menyukai