Anda di halaman 1dari 12

KATA PENGANTAR

Puji dan syukur kami panjatkan kehadirat Allah SWT, atas segala limpahan
rahmat dan hidayah-Nya sehingga kami dapat menyelesaikan penyusunan
makalah ini sebagai tugas mata kuliah Evaluasi Pembelajaran.
Kami telah menyusun makalah ini dengan sebaik-baiknya dan semaksimal
mungkin. Namun tentunya sebagai manusia biasa tidak luput dari kesalahan dan
kekurangan. Harapan kami, semoga bisa menjadi koreksi di masa mendatang agar
lebih baik lagi dari sebelumnya.
Tak lupa ucapan terimakasih kami sampaikan kepada Dosen Pembimbing
atas bimbingan, dorongan dan ilmu yang telah diberikan kepada kami. Sehingga
kami dapat menyusun dan menyelesaikan makalah ini tepat pada waktunya dan
insyaAllah sesuai yang kami harapkan. Dan kami ucapkan terimakasih pula
kepada rekan-rekan dan semua pihak yang terkait dalam penyusunan makalah ini.
Pada dasarnya makalah yang kami sajikan ini khusus mengupas tentang
Validitas dan Reliabilitas Penilaian Hasil Belajar. Untuk lebih jelas simak
pembahasannya dalam makalah ini. Mudah-mudahan makalah ini bisa
memberikan sumbang pemikiran sekaligus pengetahuan bagi kita semuanya.
Indralaya , Februari 2016

Penyusun

Daftar Isi

ii

BAB 1
PENDAHULUAN

1.1.

Latar Belakang
Evaluasi memiliki arti penting dalam kegiatan belajar mengajar yang

dilaksanakan oleh seorang guru. Diantara tujuan dari evaluasi adalah untuk
menilai ketercapaian tujuan pendidikan oleh anak didik, sarana untuk mengetahui
apa yang telah anak didik ketahui dalam kegiatan belajar mengajar, dan
memotivasi anak didik. Untuk mengevaluasi hasil belajar dan proses belajar
siswa, seorang guru menggunakan berbagai macam alat atau instrumen evaluasi
seperti

tes

tertulis,

tes

lisan,

ceklis-observasi,

angket-wawancara,

dan

dokumentasi. Keberhasilan mengungkap hasil dan proses belajar ini sebagaimana


adanya (objektivitas hasil penilaian) sangat bergantung pada kualitas alat
penilainya, di samping itu juga yang tidak kalah pentingnya tergantung pada cara
pelaksanaannya. Suatu alat penilaian dikatakan mempunyai kualitas yang baik
apabila alat tersebut memiliki atau memenuhi dua hal, yaitu validitas (ketepatan)
dan reliabilitas (ketetapan atau keajegan) alat tes terjamin kualitasnya. Alat tes
yang bagaimana dan seperti apa yang dikatakan memiliki validitas dan reliabilias
ini, selanjutnya akan kita bahas dalam makalah yan berjudul Validitas dan
Reliabilitas Tes Hasil Belajar ini.

1.2. Rumusan Masalah


1.2.1. Bagaimana Validitas Tes Hasil Belajar?
1.2.2. Bagaimana Reliabilitas Tes Hasil Belajar?

1.3.

Tujuan

1.3.1. Mahasiswa dapat memahami Validitas Tes Hasil Belajar


1.3.2. Mahasiswa dapat memahami Reliabilitas Tes Hasil Belajar

BAB II
PEMBAHASAN
2.1 Validitas Tes Hasil Belajar
2.1.1 Pengertian Validitas
Validitas sering diartikan dengan kesahihan. Suatu alat ukur disebut
memiliki validitas bilamana alat ukur tersebut isinya lanyak mengukur obyek
yang seharusnya diukur dan sesuai dengan kriteria tertentu (Thoha, 1990). Artinya
ada kesesuaian antara alat ukur dengan fungsi pengukuran dan sasaran
pengukuran. Menurut Grondlund (Ibrahim & Wahyuni, 2012) validitas mengarah
kepada ketepatan interpretasi hasil penggunan suatu prosedur evaluasi sesuai
dengan tujuan pengukurannya. Validitas merupakan suatu keadaan apabila suatu
instrument evaluasi dapat mengukur apa yang sebenarnya harus diukur secara
tepat. Suatu alat ukur hasil belajar matematika dikatakan valid apabila alat ukur
tersebut benar-benar mengukur hasil belajar matematika. Validitas alat ukur tidak
semata-mata berkaitan dengan kedudukan alat ukur sebagai alat, tetapi terutama
pada kesesuaian hasilny, sesuai dengan tujuan penyelanggaraan alat
ukur (Surapranata, 2004).
Validitas tes perlu ditentukan untuk mengetahui kualitas tes dalam
kaitannya dengan mengukur hal yang seharusnya diukur. Nunnaly (Surapranata,
2004) menyatakan bahwa pengertian validitas senantiasa dikaitkan dengan
penelitian empiris dan pembuktian-pembuktiannya bergantung kepada macam
validitas yang digunakannya. Anastasi (Surapranata, 2004) mengemukakan bahwa
validitas adalah suatu tingkatan yang menyatakan bahwa suatu alat ukur telah
sesuai dengan apa yang diukur. Para pengembang tes memiliki tanggung jawab
dalam memuat tes yang benar-benar valid dan reliabel. Oleh karena itu validitas
dapat digunakan dalam memeriksa secara langsung seberapa jauh suatu alat telah
berfungsi. Validitas merupakan derajat kemampuan suatu tes yang mengukur apa
yang hendak diukur. Secara tidak langsung itu meliputi tes dan skala yang terdiri
atas sejumlah tugas yang dipilih untuk berfungsi sebagai indikator hasil belajar.
Validitas berkenaan dengan ketetapan alat penilaian terhadap konsep yang dinilai

sehingga betul-betul menilai apa yang yang seharusnya dinilai. Sebagai contoh
menilai kemampuan siswa dalam matematika. Misalnya diberikan soal dengan
kalimat yang panjang dan berbelit-belit sehingga sukar ditangkap maknanya.
Akhirnya siswa tidak dapat menjawab karena tidak memahami pertanyaannya.
Validitas tidak berlaku universal sebab bergantung pada situasi dan tujuan
penilaian. Alat penilaian yang telah valid untuk suatu tujuan tertentu belum
otomatis akan valid untuk tujuan yang lain.
.
2. 1.2

Teknik-Teknik Validasi Tes

a. Validitas Tes Acuan Normatif


1) Validitas Isi
Merupakan derajat dimana suatu tes mengukur bidang-bidang isi pelajaran
yang hendak diukur. Hal ini sangat penting bagi tes hasil belajar. Validitas isi
mempersyaratkan adanya validitas butir soal dan sampel isi pelajaran. Esensi
validitas isi berkaitan dengan sampel. Dan menjadi penting apabila ingin
menggambarkan kinerja siswa terhadap suatu ranah tugas tertentu.
Validitas isi ditentukan oleh penilaian (judgement) para pakar. Tidak ada
rumus untuk menghitungnya dan tidak ada cara untuk mengungkapnya secara
kuantitatif. Para pakar mengkaji seluruh butir soal dan membuat penilaian tentang
seberapa baik butir soal itu mencerminkan bidang yang diujikan.
2) Validitas Konstrak
Merupakan derajat dimana suatu tes mampu mengukur konstruk hipotetik
yang hendak diukur. Tahapan validitas konstruk yaitu mengidentifikasi konstruk
yang diperkirakan untuk menghitung kinerja tes, menarik hipotesis berkenaan
dengan kinerja tes dari teori masing-masing konstruk, menguji hipotesis
berdasarkan logika dan data empirik.
3) Validitas Kongkaren
Merupakan derajat dimana skor suatu tes berkaitan dengan skor tes
lainnya, yakni tes yang telah sahih kemudian diujikan pada waktu yang bersamaan
dengan tes yang baru dibuat.
4) Validitas Peramalan

Merupakan derajat dimana suatu tes dapat meramalkan seberapa baik


siswa akan melaksanakan tugas di dalam situasi mendatang. Validitas peramalan
ditentukan dengan cara merumuskan hubungan antara skor tes dengan ukuran
keberhasilan pada situasi yang diinginkan.
b. Validitas Tes Acuan Patokan
Tujuan utama TAP untuk mengukur hasil belajar pada satu tujuan pembelajaran
atau lebih, sehingga validitas isi akan menjadi perhatian utama di dalam
menentukan reliabilitasnya.
1) Validitas Isi
Validitas isi pada TAP berkaitan dengan derajat kemampuan tes mengukur
pencapaian tujuan pembelajaran. Seperti halnya dengan TAN, pada TAP juga
berkaitan dengan validitas butir soal dan validitas sampel tujuan pembelajaran.
Validitas isi juga disebur sebagai validitas deskriptif.
2) Validitas Peramalan
Validitas peramalan pada TAP mempertanyakan kemampuan tes meramalkan
kinerja siswa di masa depan. Validitas ini juga disebut sebagai validitas
fungsional. Dengan demikian salah satu fungsi tes adalah untuk membuat
peramalan di masa depan. Apabila tes itu baik, maka dapat dikatakan bahwa tes
tersebut memiliki validitas fungsional.
2.1.3. Uji Validitas
a. Validitas eksternal
Merupakan teknik validitas yang mengkorelasikan antara skor hasil pengukuran
baru dengan skor hasil pengukuran lain yang memiliki tujuan sama.
b. Validitas Internal
Merupakan teknik validitas yang berusaha ingin mengetahui kesesuaian antara
satu butir dengan keseluruhan butir. Dua teknik yang digunakan yaitu analisis
bagian atau faktor dan analisis butir.
2.1.4. Faktor Yang Mempengaruhi Validitas
1. Ketidakjelasan petunjuk tes.
2. Kesulitan siswa dalam memahami padanan kata dan struktur kalimat.
3. Tingkat kesulitan butir soal.

4. Pembuatan butir soal.


5. Kedwimukaan (ambiguity).
6. Butir soal kurang baik.
7. Butir soal terlalu pendek.
8. Penyusunan butir soal dalam tes.
9. Pola-pola jawaban.
2.2. Reliabilitas Tes Hasil Belajar
2.2.1. Pengertian Reliabilitas
Menurut Gronlund dan Linn (1990) Reliabilitas adalah ketepatan hasil
yang diperoleh dari suatu pengukuran. Sedangkan menurut Sukadji (2000)
Reliabilitas suatu tes adalah seberapa besar derajat tes mengukur secara
konsisten sasaran yang diukur. Reliabilitas dinyatakan dalam bentuk angka,
biasanya sebagai koefesien. Koefesien tinggi berarti reliabilitas tinggi. Anastasia
dan Susana (1997) menyebutkan bahwa Reliabilitas adalah sesuatu yang merujuk
pada konsistensi skor yang dicapai oleh orang yang sama ketika mereka diuji
ulang dengan tes yang sama pada kesempatan yang berbeda, atau dengan
seperangkat butir-butir ekuivalen (equivalent items) yang berbeda, atau di bawah
kondisi pengujian yang berbeda . Lain halnya dengan Sugiono (2005) dalam
Suharto (2009) yang menyebutkan bahwa Reliabilitas adalah serangkaian
pengukuran atau serangkaian alat ukur yang memiliki konsistensi bila
pengukuran yang dilakukan dengan alat ukur itu dilakukan secara berulang.
Reliabilitas adalah indeks yang menunjukan sejauh mana suatu alat
ukur dipercaya atau dapat diandalkan. Reliabilitas mengacu pada keajegan hasil
evaluasi, yakni konsistensi skor tes (test score) dari masa ke masa.jika seorang
guru memperoleh skor yang sama pada tes yang sama pada kelompok siswa yang
sama pada waktu yang berbeda, maka dia dapat menyimpulkan bahwa hasil tes itu
memiliki derajat reliabilitas tes yang tinggi dari suatu masa ke masa.konsistensi
hasil evaluasi itu menjadi sangat berharga. Jika didasarkan pada data yang valid
dan ditetapkan secara objektif. Suatu hasil evaluasi pada umumnya tidak pernah
mencapaikonsistensi secara sempurna.
.

2.2.2

Teknik-teknik Reliabilitas
Penghitungan reliabilitas untuk tes acuan normative setidak - tidaknya

lebih mudah dibandingkan dengan pernghitungan validitasa. Ada banyak jenis


reliabilitas yang berbeda-beda, masing-masing ditentukan dengan cara-cara yang
bebeda dan massing-masing menjelaskan jenis konsistensi yang berbeda .teknik
reliabilitas tes ulang, bentuk satara, dan belah dua semua nya ditentukan melalui
korelasi.
a. Teknik Reliabilitas Untuk Tes Acuan Normatif
Skor tes dapat menjadi reliable atau konsisten secara berbeda.skor itu
dapat dikatagorisasikan sesuaikan dengan apakak sekor-sekor itu diperoleh dari
satu tes yang diujikan sekali, dua kali, ataukah dua tes diujukan dalam satu waktu
sekali.rliabelitas

ini

dapat

diestimasikan

dengan

menggunakan teknik

korelasi, dan diungkap dengan angka decimal antara 0,00 sampai dengan 1,00
1) Reliabilitas tes ulang (test-retest reliability)
Teknik reliabilitas tes ulang adalah derajat dimana skor tes tetap konsisten
sepanjang masa. Ia menunjukan sebaran skor yang terjadi dari bebrapa kegiatan
ujian sebagai hasil dari kesalahan pengukuran
2) Reliabilitas bentuk setara (Equivalent-form Reliability)
Teknik reliabilitas setara adalah dua tes yang identik kecuali untuk soal-soal
aktual. Dua bentuk tes itu mengukur bidang isi pelajaran yang sama, jumlah soal
sama, struktur soal sama, tingkat kesulitan sama, dan petunjukn ujian, penskoran
dan penafsiran sama.
3) Reliabilitas Belah Dua (Spil-Half Reliabiliy)
Reliabilitas belah dua merupakan jenis reliabilitas yang didasarkan pada
konsistensi internal dari suatu tes. Karena prosedur reliabilitas belah dua hanya
memerlukan satu kali ujian, maka sumber kesalahan pengukuran dapat dikurangi,
seperti perbedaan situasi dan kondisi ujian, yang dapat terjadi pada perhitungan
reliabilitas tes ulang.
4) Reliabilitas kesetaraan nasional (Retional Equivalence Reliability)
Reliabilitas kesataraan nasional tidak dihitung melalui korelasi, namun melalui
penetapan hubungan antara satu butir soal dengan seluruh butir lainnya dan total
butir soal dalam tes.
b. Reliabilitas Tes Acuan Patokan

Reliabilitas tes acuan patokan mengacu pada konsistensi tes mengukur apa
yang diukur. Perhatian tes acuan patokan adalah asesmen derajat stabilitas atau
kesetaraan, yakni reliabilitas bentuk tes ulamg dan kesetaraan.
1) Tes acuan patokan non-materi
Walaupun secara teoritik variabilitas skor yang dicapai siswa tidak ada
dalam tes acuan patokan, namun demikian variabilitas itu tetap ada. Oleh karena
itu apabila tes acuan patokan itu diterapkan dan tingkat kinerja setiap siswa
dicatat, maka hampir selalu terjadi variabilitas skor. Derajat variabilitas itu akan
bervariasi dari kelompok ke kelompok dan dari tes ke tes lainnya.
Apabila terdapat variabilitas skor, maka dapat digunakan pengukuran
tradisional untuk menghitung reliabilitas. Pendekatan yang digunakan untuk
menghitung koefisien reliabilitas pada tes acuan patokan hingga sekarang ini
belum ada yang diterima oleh semua pihak.
2) Tes acuan patokan materi
Livingston telah mengusulkan pendekatan untuk membuat estimasi
reliabilitas tes acuan patokan. Rumus yang digunakan pada dasarnya adalah
generalisasi dari teori reliabilitas klasik. Rumus yang digunakan itu menghitung
reliabilitas tes acuan patokan dengan cara pertama-tama menghitung reliabilitas
tradisional, seperti pada acuan tes normatif, kemudian menyesuaikan berdasrkan
pada kriteria skor tes acuan patokan. Rumus yang digunakan hanya cocok untuk
jenis tes materi.
2.2.3. Faktor faktor Yang Mempengaruhi Reliabilitas
Banyak faktor mempengaruhi reliabilitas, beberapa faktor dberkaitan
dengan tes itu sendiri, siswa yang mengikuti ujian, lingkungan dimana ujian itu
diselenggarakan, administrassi tes dan prossedur pensekoran. Faktor-faktor
tersebut akan dapat digunakan sebagai bahan untuk memperbaiki proseddur
pengembangan tes, pemakain tes, dan analisis informasi tes. Pertimabangan
tentang faktor-faktor yang mempengaruhi

realiabilitas tes ini buakn saja

membantu guru dalam menasirkan kofisien

reliabilitass tes standar seara lebih

baik,melainkan juga membantu kita didalam merumuskan tes yang lebih reliable.
Bebrapa faktor yang

dimaksud secara ringkas dijelaskan sebagai berikut:

1. Panjang Tes (length of test)


Kemunginan cara paling rasional untuk meningkatkan reliabilitas
menambah jumlah butiran soal.penambahan butiran soal akan

adalah

memperbaiki

sampel ranah perilaku yang diujikan, perbaikan sampel ranah perilaku itu akan
menghasilkan validitas lebih tinggi dan mengurangi faktor kebetulan seperti
tekanan. Walaupun sampel perilaku itu banyak dan dapat menjadikan butir soal
semakn banyak pula,namun perlu diperhatiakan adalah butiran soal itu jangan
terlalau banyak sehinnga waktu yang disediakan untuk ujian
siswa yang mengerjakannya. Pendeknya, semakin

tidak cukup untuk

banyak butir soal yang ada

pada suatu tes maka semakin baik sampel perilaku yang diukur didalam tes
tersebut.
2. Sebaran skor (spread of scores)
Metode korelasi untuk mmengestimasi reliabilitas memerlukan sebaran
sekor. Jika sebaran sekor itu sempit, maka koefisien reliabilitas akan menjadi
randah.begitu pula jika sebaran skor itu luas, maka koefisien reliabiltas akan
menjadi

tinggi.

adalah tergantung

Sebaran
pada

skor yang

diperoleh

tingkat kesulitan

butir

siswa pada
soal

suatu tes

yang

disajikan

dan kemampuan siswa dalam mengerjakan soal.


3. Keobjektivan skor (score objectivity)
Tes

objektif

merupakan

tes

yang

mampu

mengurangi

subjektivitas penskoran, artinya: setiap orang yang menskor hassil tes akan
menemukan skor

yang

meningkatkan objektivitas,

sama

pada

siswa

yang

sama. Untuk

prosespensekoran harus dilakuakan seobjektif

mungkin dan mengurangi pengaruh guru dalam menskor hassil ujian siswa.
2.2.4. Penafsiran Koefisien Validitas dan Reliabilitas
Penafsiran skor koefisien korelasi tergantung pada bagaimana tes itu akan
digunakan. Apabila skor koefisien korelasi digunakan untuk mengestimasikan
validitas atau reliabilitas instrumen pengukuran, maka kriteria yang harus diambil
harus lebih tinggi dibandingkan dengan apabila skor koefisien itu digunakan
untuk tujuan tertentu, sperti penelitian yang mencari hubungan antar variabel.
Koefisien korelasi 0,45 misalnya, dikatakan baik untuk penelitian korelasional,
namun tidak baik untuk dijadikan sebagai indeks validitas prediktif, dan sangat

buruk untuk dijadikan sebagai indeks reliabilitas. Demikian pula, koefisein 0,60
dapat dikatakan baik untuk penelitian prediktif, namun masih belum memuaskan
untuk mengestimasi reliabilitas.
Berkenaan dengan validitas, seringkali penyusunan tes menghitung
koefesien korelasi untuk menentukan validitas prediktif, yakni derajat hubungan
antara skor prediktor dengan kriterium. Koefesien 0,40, misalnya, akan memiliki
sedikit makna bagi tujuan prediksi, karena hal ini menunjukkan korelasi yang
rendah, dan menunjukkan variasi 16%, sehingga tidak mampu digunakan untuk
memprediksi skor kriterium. Oleh karena itu tes yang skor koefesien korelasi di
bawah 0,50 umumnya tidak memiliki manfaat untuk digunakan sebagai instrumen
untuk memprediksi kemampuan sekelompok atau individu siswa. Berkenaan
dengan reliabilitas, berapakah skor koefesien reliabilitas yang baik untuk sebuah
tes. Untuk tes kemampuan dan prestasi belajar yang standar, umumnya skor
koefesien korelasi yang dilipih adalah 0,90. Tes kepribadian umumnya
menetapkan skor koefesien korelasi minimal 0,80.

BAB III
PENUTUP
Kesimpulan

Daftar Pustaka

Anda mungkin juga menyukai