Anda di halaman 1dari 14

Pengertian Evaluasi (Penilaian), Pengukuran, Tes,dan Asesmen

Kali ini blog ptk (penelitian tindakan kelas) dan model-model pembelajaran kembali
mengangkat topik penilaian,setelah sebelum menulis tentang Prinsip-Prinsip Penilaian, kemudian
tentang Penilaian Afektif, dan juga Penilaian Psikomotor. Topik kali ini bersifat mendasar sekali,
yaitu tentang pengertian evaluasi, pengertia penilaian, pengertian pengukuran, pengertian tes,
dan pengertian asesmen. Topik ini tampaknya sangat menarik dan perlu untuk dibahas karena
begitu simpang siurnya definisi istilah-istilah tersebut di internet. Setelah melakukan kajian
terhadap berbagai definisi tentang evaluasi, penilaian, tes, pengukuran, hingga asesmen, maka
dapatlah dibuat artikel ini yang tujuannya untuk mendudukkan kembali semua istilah itu pada
tempatnya yang tepat. Pada tulisan ini kami hanya mengambil definisi-definisi dari para ahli
yang telah diakui kredibilitasnya di bidang pendidikan dan psikologi pendidikan.
Pengertian Evaluasi (Penilaian) Menurut Para Ahli

Sudiono, Anas (2005) mengemukakan bahwa secara harfiah kata evaluasi berasal dari
bahasa Inggris evaluation, dalam bahasa Indonesia berarti penilaian. Akar katanya adalah value
yang artinya nilai. Jadi istilah evaluasi menunjuk pada suatu tindakan atau suatu proses untuk
menentukan nilai dari sesuatu.
Frey, Barbara A., and Susan W. Alman. (2003): Evaluation The systematic process of
collecting, analyzing, and interpreting information to determine the extent to which pupils are
achieving instructional objectives. (Artinya: Evaluasi adalah proses sistematis pengumpulan,
analisis, dan interpretasi informasi untuk menentukan sejauh mana siswa yang mencapai tujuan
instruksional).
Mardapi, Djemari (2003), penilaian adalah kegiatan menafsirkan atau mendeskripsikan
hasil pengukuran.
Zainul, Asmawi dan Noehi Nasution (2001), mengartikan penilaian adalah suatu proses
untuk mengambil keputusan dengan menggunakan informasi yang diperoleh melalui pengukuran
hasil belajar baik yang menggunakan tes maupun nontes.
Kesimpulan Tentang Pengertian Evaluasi:

Evaluasi berasal dari akar kata bahasa Inggris value yang berarti nilai, jadi istilah
evaluasi sinonim dengan penilaian.
Evaluasi merupakan proses sistematis dari mengumpulkan, menganalisis, hingga
interpretasi (menafsirkan) data atau informasi yang diperoleh.
Data atau informasi diperoleh melalui pengukuran (measurement) hasil belajar.melalui
tes atau nontes.
Evaluasi bersifat kualitatif.
Pengertian Pengukuran (Measurement) Menurut Para Ahli

Alwasilah et al.(1996), measurement (pengukuran) merupakan proses yang


mendeskripsikan performa siswa dengan menggunakan suatu skala kuantitatif (sistem angka)
sedemikian rupa sehingga sifat kualitatif dari performa siswa tersebut dinyatakan dengan angkaangka

Arikunto dan Jabar (2004) menyatakan pengertian pengukuran (measurement) sebagai


kegiatan membandingkan suatu hal dengan satuan ukuran tertentu sehingga sifatnya menjadi
kuantitatif.
Cangelosi, James S. (1995), pengukuran adalah proses pengumpulan data secara empiris
yang digunakan untuk mengumpulkan informasi yang relevan dengan tujuan yang telah
ditentukan.
Sridadi (2007) pengukuran adalah suatu prose yang dilakukan secara sistematis untuk
memperoleh besaran kuantitatif dari suatu obyek tertentu dengan menggunakan alat ukur yang
baku.
Kesimpulan Tentang Pengertian Pengukuran:

Kegiatan pengukuran dilakukan dengan membandingkan hasil belajar dengan suatu


ukuran tertentu.
Dilakukan dengan proses sistematis.

Hasil pengukuran berupa besaran kuantitatif (sistem angka).

Pengukuran menggunakan alat ukur yang baku.


Pengertian Asesmen Menurut Para Ahli

Angelo T.A.(1991): Classroom Assessment is a simple method faculty can use to collect
feedback, early and often, on how well their students are learning what they are being
taught. (Artinya: asesmen Kelas adalah suatu metode yang sederhana dapat digunakan untuk
mengumpulkan umpan balik, baik di awal maupun setelah pembelajaran tentang seberapa baik
siswa mempelajari apa yang telah diajarkan kepada mereka.)
Kizlik, Bob (2009): Assessment is a process by which information is obtained relative to
some known objective or goal. Assessment is a broad term that includes testing. A test is a
special form of assessment. Tests are assessments made under contrived circumstances
especially so that they may be administered. In other words, all tests are assessments, but not all
assessments are tests. (Artinya : asesmen adalah suatu proses dimana informasi diperoleh
berkaitan dengan tujuan pembelajaran. Asesmen adalah istilah yang luas yang mencakup tes
(pengujian). Tes adalah bentuk khusus dari asesmen. Tes adalah salah satu bentuk asesmen.
Dengan kata lain, semua tes merupakan asesmen, namun tidak semua asesmen berupa tes)
Overton, Terry (2008): Assesment is a process of gathering information to monitor
progress and make educational decisions if necessary. As noted in my definition of test, an
assesment may include a test, but also include methods such as observations, interview, behavior
monitoring, etc. (Artinya: sesmen adalah suatu proses pengumpulan informasi untuk memonitor
kemajuan dan bila diperlukan pengambilan keputusan dalam bidang pendidikan. Sebagaimana
disebutkan dalam definisi saya tentang tes, suatu asesmen bisa saja terdiri dari tes, atau bisa juga
terdiri dari berbagai metode seperti observasi, wawancara, monitoring tingkah laku, dan
sebagainya).
Palomba and Banta(1999), Assessment is the systematic collection , review , and use of
information about educational programs undertaken for the purpose of improving student
learning and development (Artinya: asesmen adalah pengumpulan, reviu, dan penggunaan

informasi secara sistematik tentang program pendidikan dengan tujuan meningkatkan belajar dan
perkembangan siswa).
Kesimpulan Tentang Pengertian Asesmen:

Asesmen merupakan metode dan proses yang digunakan untuk mengumpulkan umpan
balik tentang seberapa baik siswa belajar.
Dapat dilakukan di awal, di akhir (sesudah), maupun saat pembelajaran sedang
berlangsung.
Asesmen dapat berupa tes atau nontes.

Asesmen berupa nontes misalnya penggunaan metode observasi, wawancara,


monitoring tingkah laku, dsb.
Hasilnya dapat digunakan untuk pengambilan keputusan.

Bertujuan meningkatkan belajar (pembelajaran) dan perkembangan siswa.


Pengertian Tes Menurut Para Ahli

Wayan Nurkencana (1993), tes adalah suatu cara untuk mengadakan penilaian yang
berbentuk suatu tugas yang harus dikerjakan anak atau sekelompok anak sehingga menghasilkan
suatu nilai tentang tingkah laku atau prestasi anak tersebut yang kemudian dapat dibandingkan
dengan nilai yang dicapai oleh anak-anak lain atau standar yang telah ditetapkan
Overton, Terry (2008): test is a method to determine a students ability to complete
certain tasks or demontstrate mastery of a skill or knowledge of content. Some types would be
multiple choice tests or a weekly spelling test. While it commonly used interchangeably with
assesment, or even evaluation, it can be distinguished by the fact that a test is one form of an
assesment. (Tes adalah suatu metode untuk menentukan kemampuan siswa menyelesaikan
sejumlah tugas tertentu atau mendemonstrasikan penguasaan suatu keterampilan atau
pengetahuan pada suatu materi pelajaran. Beberapa tipe tes misalnya tes pilihan ganda atau tes
mengeja mingguan. Seringkali penggunaannya tertukar dengan asesmen, atau bahkan evaluasi
(penilaian), yang mana sebenarnya tes dapat dengan mudah dibedakan berdasarkan kenyataan
bahwa tes adalah salah satu bentuk asesmen.)
Kesimpulan Tentang Pengertian Tes:

Tes adalah cara atau metode untuk menentukan kemampuan siswa menyelesaikan tugas
tertentu atau mendemonstrasikan penguasaan suatu keterampilan atau pengetahuan.
Beberapa tipe tes misalnya tes pilihan ganda atau tes mengeja mingguan.
Tes adalah salah satu bentuk asesmen
Diagram Kedudukan Istilah Evaluasi, Penilaian, Pengukuran, Asesmen, dan Tes.
Perhatikan Gambar berikut, yang merupakan diagram kedudukan istilah evaluasi, penilaian,
pengukuran, asesmen, dan tes yang seringkali membingungkan. Diagram dibuat berdasarkan
induksi dari pengertian evaluasi (penilaian), penegertian pengukuran, pengertian asesmen, dan
pengertian tesmenurut para ahli di atas.

Diagram yang menunjukkan kedudukan istilah-istilah "Evaluasi", "Penilaian", "Pengukuran",


"Asesmen", dan "Tes"

Referensi:
Alwasilah, et al. (1996). Glossary of educational Assessment Term. Jakarta: Ministry of
Education and Culture.
Anas sudiono, Pengantar Evaluasi Pendidikan, Jakarta:PT.Grafindo persada, 2001.

Angelo, T.A., (1991). Ten easy pieces: Assessing higher learning in four dimensions. In
Classroom research: Early lessons from success. New directions in teaching and learning (#46),
Summer, 17-31.
Arikunto, S & Jabar. 2004. Evaluasi Program Pendidikan. Jakarta: Bumi Aksara

Calongesi, James S. 1995. Merancang Tes untuk Menilai Prestasi Siswa. Bandung : ITB

Frey, Barbara A., and Susan W. Alman. (2003). Formative Evaluation Through Online
Focus Groups, in Developing Faculty to use Technology, David G. Brown (ed.), Anker
Publishing Company: Bolton, MA.
Kizlik, Bob. (2009). Measurement, Assessment, and Evaluation in Education. Online :
http://www.adprima.com/measurement.htm diakses tanggal 20-01-2013.
Mardapi, Djemari (2003). Desain Penilaian dan Pembelajaran Mahasiswa. Makalah
Disajikan dalam Lokakarya Sistem Penjaminan Mutu Proses Pembelajaran tanggal 19 Juni 2003
di Universitas Gadjah Mada Yogyakarta.
Overton, Terry. (2008). Assessing Learners with Special Needs: An Applied Approach
(7th Edition). University of Texas - Brownsville
Palomba, Catherine A. And Banta, Trudy W. (1999). Assessment Essentials: Planning,
Implementing, Improving. San Francisco: Jossey-Bass
Sridadi. (2007). Diktat Mata Kuliah Evaluasi Pembelajaran Penjas. Yogyakarta: FIK
UNY.
Wayan Nurkencana. (1993). Evaluasi Pendidikan. Surabaya : Usaha Nasional.

Zainul, Asmawi dan Noehi Nasution. 2001. Penilaian Hasil Belajar. Jakarta: Departemen
Pendidikan Nasional

A.
Pengertian
Evaluasi,
Pengukuran,
Tes
dan
Penilaian
(Assessment)
Banyak orang mencampuradukkan pengertian antara evaluasi, pengukuran (measurement), tes,
dan penilaian (assessment), padahal keempatnya memiliki pengertian yang berbeda. Evaluasi
adalah kegiatan identifikasi untuk melihat apakah suatu program yang telah direncanakan telah
tercapai atau belum, berharga atau tidak, dan dapat pula untuk melihat tingkat efisiensi
pelaksanaannya. Evaluasi berhubungan dengan keputusan nilai (value judgement). Stufflebeam
(Abin Syamsuddin Makmun, 1996) memengemukakan bahwa : educational evaluation is the

process of delineating, obtaining,and providing useful, information for judging decision alternatif
. Dari pandangan Stufflebeam, kita dapat melihat bahwa esensi dari evaluasi yakni memberikan
informasi bagi kepentingan pengambilan keputusan. Di bidang pendidikan, kita dapat melakukan
evaluasi terhadap kurikulum baru, suatu kebijakan pendidikan, sumber belajar tertentu, atau etos
kerja
guru.
Pengukuran (measurement) adalah proses pemberian angka atau usaha memperoleh deskripsi
numerik dari suatu tingkatan di mana seorang peserta didik telah mencapai karakteristik tertentu.
Penilaian (assessment) adalah penerapan berbagai cara dan penggunaan beragam alat penilaian
untuk memperoleh informasi tentang sejauh mana hasil belajar peserta didik atau ketercapaian
kompetensi (rangkaian kemampuan) peserta didik. Penilaian menjawab pertanyaan tentang
sebaik apa hasil atau prestasi belajar seorang peserta didik.Hasil penilaian dapat berupa nilai
kualitatif (pernyataan naratif dalam kata-kata) dan nilai kuantitatif (berupa angka). Pengukuran
berhubungan dengan proses pencarian atau penentuan nilai kuantitatif tersebut.
Tes adalah cara penilaian yang dirancang dan dilaksanakan kepada peserta didik pada waktu dan
tempat tertentu serta dalam kondisi yang memenuhi syarat-syarat tertentu yang jelas.
Secara khusus, dalam konteks pembelajaran di kelas, penilaian dilakukan untuk mengetahui
kemajuan dan hasil belajar peserta didik, mendiagnosa kesulitan belajar, memberikan umpan
balik/perbaikan proses belajar mengajar, dan penentuan kenaikan kelas. Melalui penilaian dapat
diperoleh informasi yang akurat tentang penyelenggaraan pembelajaran dan keberhasilan belajar
peserta didik, guru, serta proses pembelajaran itu sendiri. Berdasarkan informasi itu, dapat dibuat
keputusan tentang pembelajaran, kesulitan peserta didik dan upaya bimbingan yang diperlukan
serta
keberadaan
kurikukulum
itu
sendiri.
Fungsi
Evaluasi
Sejalan dengan tujuan evaluasi di atas, evaluasi yang dilakukan juga memiliki banyak fungsi,
diantaranya
adalah
fungsi:
1.
Selektif
2.
Diagnostik
3.
Penempatan
4.
Pengukur
keberhasilan
D.
Manfaat
Evaluasi
Secara umum manfaat yang dapat diambil dari kegiatan evaluasi dalam pembelajaran, yaitu :
1. Memahami sesuatu : mahasiswa (entry behavior, motivasi, dll), sarana dan prasarana, dan
kondisi
dosen
2.
Membuat
keputusan
:
kelanjutan
program,
penanganan
masalah,
dll
3.
Meningkatkan
kualitas
PBM
:
komponen-komponen
PBM
TUJUAN
DAN
FUNGSI
PENILAIAN
:
* Seberapa banyak indikator kompetensi dasar suatu mata pelajaran tercapai.
1.
Menilai
kebutuhan
individual
2.
Menentukan
kebutuhan
pembelajaran
3.
Membantu
dan
mendorong
siswa

4.
Membantu
dan
menolong
guru
ngajar
lebih
baik
5.
Menentukan
strategi
pembelajaran
6.
Akuntabilitas
lembaga
7.
Meningkatkan
kualitas
pendidikan
*
Selain
indikator
kamampuan
dasar,
juga
berfungsi
:
1.
Mengetahui
kemajuan
dan
kesulitan
beajar
siswa
2.
Memberikan
umpan
balik
3.
Melakukan
perbaikan
kegiatan
pembelajaran
4.
Memotivasi
guru
mengajar
lebih
baik
5.
Memotivasi
siswa
belajar
lebih
giat
Fungsi
Evaluasi:
1. Fungsi evaluasi pembelajaran bagi guru adalah mengungkapkan kelemahan proses kegiatan
mengajar meliputi bobot materi yang disajikan, metode yang diterapkan, media yang digunakan,
dan
strategi
yang
dilaksanakan.
2.
Fungsi
evaluasi
bagi
siswa
yaitu
-Mengungkapkan
penguasaan
materi
pembelajaran
- Mengungkapkan kemajuan individual maupun kelompok dalam mempelajari statu pelajaran.
ASAS
EVALUASI
Asas komprehensif : evaluasi harus meliputi keseluruhan pribadi siswa yang dievaluasi.(kognitif,
afektif,
psikomotor)
Asas Kontinuitas: evaluasi wajib dilaksanakan scr berkesinambungan mulai dari pra- saat prosesdan
pasca
pembelajaran.
Asas Obyektif : Evaluasi seharusnya menilai dan mengukur apa adanya / non subyektifAsesmen dalam pembelajaran adalah suatu proses atau upaya formal pengumpulan informasi
yang berkaitan dengan variabel-variabel penting pembelajaran sebagai bahan dalam pengambilan
keputusan oleh guru un-tuk memperbaiki proses dan hasil belajar siswa (Herman et al., 1992:95;
Po-pham, 1995:3). Variabel-variabel penting yang dimaksud sekurang-kurangya meliputi
pengetahuan, pemahaman, keterampilan dan sikap siswa dalam pembelajaran yang diperoleh
guru dengan berbagai metode dan prosedur baik formal maupun informal, sebagaimana
dikemukakan
oleh
Corner
(1991:2-3)
sebagai
berikut.
Pengertian asesmen dalam berbagai literatur asing tersebut di atas selaras dengan makna
penilaian yang digariskan dalam Buku Pedoman Penilaian pada kurikulum pendidikan dasar.
Dalam buku tersebut tertulis bahwa, penilaian adalah suatu kegiatan yang dilakukan oleh guru
untuk memberikan berbagai informasi secara berkesinambungan dan menyeluruh tentang proses
dan hasil belajar yang telah dicapai (Depdikbud, 1994:3). Ada pun yang dimaksud dengan
asesmen alternatif (alternative assessment) adalah segala jenis bentuk asesmen diluar asesmen
konvensional (selected respon test dan paper-pencil test) yang lebih autentik dan signifikan
mengungkap secara langsung proses dan hasil belajar siswa. Herman (1997) memberikan semboyan khusus bagi asesmen alternatif dengan ungkapan What You Get is What You Assess
(WYGWYA). Dalam beberapa literatur, asesmen alternatif ini kadang-kadang disebut juga

asesmen autentik (authentic assessment), as-esmen portofolio (portfolio assessment) atau


asesmen kinerja (performsnce as-sessment). (Herman,1997:197-198; Niemi,1997:243; Harlen,
1992:6; Marzano, et al.,1993:13; Popham, 1995:142)
Tujuan
dan
peran
asesmen
dalam
pembelajaran.
Tujuan utama penggunaan asesmen dalam pembelajaran (classroom assessment) adalah
membantu guru dan siswa dalam mengambil keputusan propesional untuk memperbaiki
pembelajaran. Menurut Popham (1995:4-13) asesmen bertujuan untuk antara lain untuk:
mendiagnosa
kelebihan
dan
kelemahan
siswa
dalam
belajar,
memonitor
kemajuan
siswa,menentukan
jenjang
kemampuan
siswa,
menentukan
efektivitas
pembelajaran,
mempengaruhi
persepsi
publik
tentang
efektivitas
pembelajaran,
mengevaluasi kinerja guru kelas,mengklarifikasi tujuan pembelajaran yang dirancang guru

Kata Realibilitas diambil dari bahasa Inggris Reliability dari kata asal Reliable
yang artinya dapat dipercaya. Reliabilitas sering dikacaukan oleh istilah Reliable.
Reliabilitas merupakan kata benda sedangkan Reliable merupakan kata sifat
atau kata keadaan. Reliabilitas merupakan salah satu persyaratan tes yang baik,
reliabilitas berhubungan dengan masalah kepercayaan. Suatu tes dapat dikatakan
mempunyai taraf kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil
yang

tetap.

Maka

pengertian

reliabilitas

tes,berhubungan

dengan

masalah

ketetapan hasil tes. Atau seandainya hasilnya berubah-ubah perubahan yang terjadi
dapat dikatakan tidak berarti. Suatu tes dapat dikatakan mempunyai taraf
kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang tetap atau
ajeg. Maka arti sebuah reliabilitas tes berhubungan erat dengan masalah ketetapan
hasil tes. Jika seandainya hasilnyaberubah-ubah, perubahan yang terjadi dapat
dikatakan tidak berarti. Maksudnya Tidak reabelnyasuatu tes evaluasi, pada
prinsipnya dapat dikatakan sia-sialah tes tersebut, karena jika dilakukan kembali
hasilnya akan berbeda.
Reliabilitas suatu tes pada umumnya diekspresikan secara numerik dalam
bentuk koefisien yang besarnya -1>0>+1. Koefisien tinggi menunjukkan reliabilitas
tinggi. Sebaliknya, jika koefisiensuatu tes rendah maka reliabilitas tes rendah. Jika

suatu reliabilitas sempurna, berarti tes tersebut mempunyai koefisien +1 atau -1.
Reabilitas tinggi menunjukkan kesalahan yang minim. Jika suatu tes mempunyai
reabilitas tinggi maka pengaruh kesalahan pengukuran telah terkurangi. Kesalahan
pengukuran dapat disebabkan oleh beberapa faktor, diantaranya karakteristik tes
evaluasi itu sendiri, semisal kondisi pelaksana tes yang tidak mengikuti aturan
baku, tes item yang meragukan dan mahasiswa langsung mengikuti, status peserta
yang mengikuti tes, seperti seorang yang sedang lelah, mempunyai problem
pribadi, mahasiswa yang mempunyai motifasi rendah, atau kombinasi dari segala
permasalahan tersebut.
Terkadang dalam pembicaraan evaluasi ajeg atau tetap diartikan sebagai
sama, padahal yang dimaksudkan tidak demikian. Ajeg atau tetap tidak selalu
sama, tetapi mengikuti perubahan secara ajeg. Semisal; jika keadaan si A dalam
sebuah tes mula-mula lebih rendah dibandingkan dengan si B, makajika diadakan
pengukuran ulang, si A juga berada lebih rendah darisi B. itulah yang dikatakan
ajegatau tetap, yaitu sama dalam kedudukan siswa diantara anggota kelompok
yang lain. Tentu saja tidak dituntut semuanya tetap. Besarnya ketetapan itulah
menunjukkan tingginya reliabilitas instrument.

1. Cara Mencari Besarnya Reliabilitas


Beberapa metode yang dapat digunakan untuk mencari besarnya reliabilita
antara lain adalah :
a. Metode Tes Ulang (Test-Retest-Method)
Untuk mengetahui sampai dimana suatu pengukuran dapat diandalkan,
pengukuran ini dapat dilakukan dua kali, pengukuran pertama dan ulangnya.
Kedua pengukuran ini dapat dilakukan oleh orang yang sama atau berbeda.
Dalam hal ini perlu diatur bahwa proses pengukuran kedua, keadaan yang
diukuritu harus benar-benarsama. Selanjutnya hasil pengukuran yang pertama
dan yang keduadikorelasikan dan hasilnya menunjukkan reliabilitas dari tes ini.
Memang teknik ulangan ini akan dapat memenuhi sasaran bila keadaan subjek
yang diukur (dites) tetap bertahan dan tidak mengalami perubahan pada saat

pengukuran yang pertama maupun pada pengukuranyang kedua. Karena


keadaan pribadi anak itu selalu dalam keadaan berkembang, tidakstatis, maka
sebenarnya teknik ini kurang tepat digunakan. Disamping itu pada pengukuran
yang kedua akandijumpai adanya testing effect anak telah mendapat
tambahan pengetahuan karena sudah mengalami tes yang pertama.
Reliabilitas tes retes ini penting, khususnya ketika digunakan

untuk

menentukan predictor misalnya tes kemampuan. Tes kemampuan tidak akan


bermanfaat, jika ternyata menunjukkan hasil yang berubah-ubah secara
signifikan saat diberikan pada responden. Penentuan pemakaian reliabilitas tes
retes, juga tepat ketika bentuk tes alternative lainnya tidak ada, dan ketika
tampak bahwa orang yang mengambil tes kedua kalinya tidak ingat atas
jawaban tes yang pertama. Para pengambil tes pada umumnya akan terus
mengingat jawabanya, jika item-item yang ada banyak mengandung factor
sejarah,dibanding bentuk item ilmu pengetahuan aljabar misalnya.
b. Metode Bentuk Paralel (Equivalent)
Tes paralel atau tes equivalent adalah dua buah tes yang mempunyai
kesamaan tujuan, tingkat kesukaran dan susunan tetapi butir-butir soalnya
berbeda, dalam istilah bahasa Inggris disebut alternate-forms method (parallel
forms). Dengan metode bentuk paralel ini, dua buah tes yang paralel, misalnya
tes PAI seri A yang akan dicari reliabilitasnya dan tes Seri B diteskan kepada
sekelompok siswa yang sama, kemudian dikorelasikan. Koefisien korelasi dari
kedua hasil tes inilah yang menunjukkan koefisien reliabilitas tes seri A. jika
koefisiennya tinggi maka tes tersebut sudah reliable dan dapat digunakan
sebagai alat dan pengetes yang terandalkan. Dalam menggunakan metode tes
paralel pengetes harus menyiapkan dua buah tes, dan masing-masing dicobakan
kepada sekelompok siswa yang sama. Penggunaan metode ini baik karena siswa
dihadapkan kepada dua macam tes sehingga tidak ada factor masih ingatingat soalnya yang dalam evaluasi disebut adanya practice-effect- dan carryover-effect. Artinya ada factor yang dibawa oleh pengikut tes karena sudah
mengerjakan soal tersebut.

Kelemahan dari metode ini adalah bahwa pengetes pekerjaannya berat


karena harus menyusun dua seri tes. Lagipula harus tersedia waktu yang lama
untuk mencobakan dua kali tes.
Beberapa langkah-langkah bagaimana proses melaksanakan tes reliabilitas
secara ekivalen tersebut diantaranya adalah sebagai berikut:

Menentukan subjek sasaran yang hendak di tes

Melakukan tes yang dimaksud kepada sasaran subjek yang dimaksud

Diadministrasi dengan baik

Dalam waktu yang tidak begitu lama melakukan tes yang kedua pada
kelompok tersebut.

Mengkorelasikan antara kedua skor tes tersebut.


Jika hasil koefisien ekivalen tinggi, berarti tes memiliki reliabilitas ekivalen
baik. Sebaliknya, jika ternyata koefesien rendah makareliabilitas ekivalentes
adalah rendah. Reliabilitas ekivalen merupakn salah satu bentuk yang
diterima dan umum dipakai penelitian terutama penelitian pendidikan.

Metode Belah Dua Atau Split-Half Method


Dalam teknik belah dua ini, dalam pengetesan hanya menggunakan satu tes
yang dicobakan satu kali kepada sejumlah subjek (sample). Item-item pada
tes dibagi dua. Skor dari setengah item-item tes pada bagian yang pertama
dikorelasikan dengan skor setengah item-item tes pada bagian yang kedua.
Ada dua cara membelah butir soal ini yaitu :
1) Membelah atas item-item genap dan item-item ganjil yang selanjutnya
disebut belahan ganjil-genap. Dan
2) Membelah atas item-item awal dan item-item akhir yaitu separoh jumlah
pada nomor-nomor awal dan separo pada nomor-nomor akhir yang
selanjutnya disebut belahan awal-akhir.

Faktor-Faktor yang mempengaruhi Reliabilitas. Beberapa hal yang sedikit


banyak mempengaruhi hasil tes banyak sekali. Namun secara garis besar dapat
dikelompokkan menjadi 3 hal, yaitu :

1. Hal yang berhubungan dengan tes itu sendiri, yaitu panjang tes dan kualitas
butirbutir soalnya. Tes yang terdiri dari banyak butir, tentu saja lebih valid
dibandingkan dengan tes yang hanya terdiri dari beberapa butir soal. Tinggi
rendahnya validitas merupakan tinggi

rendahnya reliabilitas tes. Dengan

demikian maka semakin panjang tes makareliabilitasnya semakin tinggi.


Dalam menghitung besarnya reliabilitas berhubungan dengan penambahan
banyaknya butir soal dalam tes ini ada sebuah rumus yang diberikan oleh
Spearman dan Brown sehingga terkenal dengan rumus Spearman-Brown.

Contoh penggunaan rumus tersebut misalnyadari hasil tes diketahui koefisien


reliabilitas yang terdiri atas 60 item adalah 0,80. Harga ini menjadi dasar
korelasi antara 30 item ganjil dan 30 item genap. Jika formula Spearman-Brown
digunakan maka;

Jadi, r table tes setelah korelasi adalah 0,89.


2. Hal yang berhubungan dengan tercoba. Suatu tes dicobakan kepada kelompok
yang terdiri dari banyak siswa akanmencerminkan keragaman hasil yang
menggambarkan besar kecilnya reliabilitas tes-tes yangdicobakan bukan
kepada kelompok tidak terpilih, akan menunjukkan reliabilitas yang lebih besar
daripada yang dicobakan pada kelompok tertentu yang diambil secara dipilih.
3. Hal yang berhubungan dengan penyelenggaraan tes sudah di sebutkan bahwa
factor penyelenggaraan tes yang bersifatadministratif, sangat menentukan
hasil tes.
Contoh :
a. Petunjuk yang diberikan sebelum tes dimulai, maka memberikan
keterangan kepada para tes-tes dalam mengerjakan tes, dan dalam
penyelenggaraan tidak akan banyak terdapat pertanyaan. Ketenangan ini
tentu saja akan berpengaruh terhadap hasil tes.

b. Pengawas yang tertib akan mempengaruhi hasil yang diberikan oleh siswa
terhadap tes bagi siswa-siswa tertentu adalah pengawasan yang terlalu
ketat menyebabkan rasa jengkel dan tidak dapat dengan leluasa
mengerjakan tes.
c. Suasana lingkungan dan tempat tes (duduk tidak diatur, suasana
disekelilingnya ramai, dan sebagainya) akan mempengaruhi hasil tes.
Adanya hal-hal yang mempengaruhi hasil tes ini semua, secara tidak langsung
akan mempengaruhi reliabilitas tes. Koefisien reliabilitas dapat dipengaruhi
diantaranya oleh waktu penyelenggaraan tes-retes. Interval penyelenggaraan yang
terlalu dekat atau terlalu jauh, akan mempengaruhi koefisien reliabilitas.
Faktor-faktor yang lain yang juga mempengaruhi reliabilitas instrument
evaluasi diantaranya sebagai berikut :
1. Panjang tes, semakin panjang suatu tes evaluasi, semakin banyak jumlah item
materi pembelajaran diukur. Ini menunjukkan dua kemungkinan yaitu:
a. Tes semakin mendekati kebenaran, dan
b. Dalam mengikuti tes semakin kecil siswa menebak. Berarti akan semakin
tinggi nilai koefisien reliabilitasnya.
2. Penyebaran skor, koefisien reliabilitas secara langsung dipengaruhi oleh bentuk
sebaran skor dalam kelompok siswa yang diukur. Semakin tinggi sebaran,
semakin tinggi estimasi koefisien reliabilitas. Hal ini terjadi karena posisi skor
siswa secara individual mempunyai kedudukan sama pada tes-retes lain,
sebagai acuan.
3. Kesulitan tes, tes normative yang terlalu mudah atau terlalu sulit untuk siswa,
cenderung menghasilkan skor reliabilitas rendah. Fenomena tersebut akan
menghasilkan sebaran skor yang cenderung terbatas pada salah satu sisi. Untuk
tes yang terlalu mudah skor jawaban siswa akan mengumpul pada sisi atas,
misalnya 9 atau 10. Untuk tes yang terlalu sulit, skor jawaban siswa akan
cenderung mengumpul pada ujung sebaliknya, atau rendah. Dua gejala tersebut
mempunyai kesamaan yaitu bahwa perbedaandiantara individu adalah kecil dan
cenderung tidak relevan
4. Objektivitas, yang dimaksud dengan objektif yaitu derajat dimana siswa dengan
kompetensi sama, mencapai hasil sama. Ketika prosedur tes evaluasi memiliki
objektifitas tinggi, maka reliabilitas hasil tes tidak dipengaruhi oleh prosedur

teknik penskoran. Item tes skor objektif yang dihasilkan tidak dipengaruhi
petimbangan atau opini dari seorang evaluator.

2. Garis Besar Macam Macam Reliabilitas Dan Prosedur Pelaksanaan


Pengukuran
Reliabilitas Yang Sering Ditemui Dalam Instrument Evaluasi Maupun Instrument
Penelitian. Berikut ini table ringkasan yang menggambarkan secara garis besar
macam-macam reliabilitas dan prosedur pelaksanaan pengukuran reliabilitas yang
sering ditemui dalam instrumen penelitian.

3. Hubungan Reliabilitas Tes Dengan Validitas Tes


Hubungan antara validitas dengan realibilitas adalah jika suatu tes dinyatakan
mempunyai instrumen valid maka akan mempunyai reabilitas yang baik juga,
sedangkan jika suatu instrumen yang reliable belum tentu valid. Scarvia B.
Anderson menyatakan bahwa persyaratan bagi tes yaitu validitas dan reabilitas,
dalam hal ini validitas lebih penting dan reabilitas ini perlu karenamenyokong
terbentuknya validitas. Sebuah tes mungkin reliabel tetapi tidak valid. Sedangkan
sebuah tes yangvalid biasanya reliabel. Tuntutan bahwa instrumen evaluasi harus
valid menyangkut harapan diperolehnya data yang valid, sesuai dengan kenyataan.

Dalam hal reabilitas ini tuntutannya tidak jauh berbeda. Jika validitas terkait dengan
ketepatan objek yang tidak lain adalah tidak menyimpangnya data dari kenyataan,
artinya bahwa data tersebut benar, maka konsep reabilitasnya terkait dengan
pemotretan berkali-kali. Instrument yang baik adalah instrument yang dapat
dengan ajeg memberikan data yang sesuai dengan kenyataan.