Anda di halaman 1dari 10

BAB I

A. Latar Belakang

Perkembangan konsep penilaian pendidikan yang ada pada saat ini menunjukkan arah yang
lebih luas. Penilaian program pendidikan menyangkut penilaian terhadap tujuan pendidikan, isi
program, strategi pelaksanaan program dan sarana pendidikan. Penilaian proses belajar mengajar
menyangkut penilaian terhadap kegiatan guru, kegiatan siswa, pola interaksi guru siswa dan
keterlaksanaan program belajar mengajar. Sedangkan penilaian hasil belajar menyangkut hasil
belajar jangka pendek dan hasil belajar jangka panjang.

Dengan demikian, inti penilaian adalah proses memberikan atau menentukan nilai kepada
objek tertentu berdasarkan suatu kriteria tertentu. Proses pemberian nilai tersebut berlangsung,
baik dalam bentuk validitas maupun reliabilitas. Keberhasilan mengungkapkan hasil dan proses
belajar siswa sebagaimana adanya (objektivitas hasil penilaian) sangat tergantung pada kualitas
alat penilaiannya di samping pada cara pelaksanaannya.

Standarisasi tes mengisyaratkan uji validitas dan reliabilitas tes . tes yang sudah standar
atau baku akan memiliki nilai manfaat praktis karena hasil yang diperoleh dari penerapan tes itu
akan diperoleh skor yang sahih dan konsisten. Oleh karena itu guru sebelum menerapkan tes
kepada siswa, sebaiknya terlebih dahulu menguji validitas dan reliabilitas tes yang telah dibuat.
Berdasarkan hal tersebut, maka penulisan makalah ini akan difokuskan pada pembahasan tentang
“Validitas dan Reliabilitas Tes” agar dapat lebih memahami apa itu sebenarnya validitas dan
reliabilitas serta lebih memahami bagaimana mengetahui suatu alat penilaian dikatakan
mempunyai kualitas yang baik.

B.     Rumusan Masalah

Adapun yang menjadi rumusan masalah dalam makalah ini, yaitu:


1.      Apa pengertian dari validitas dan realibilitas tes?
2.      Apa manfaat dari validitas dan realibilitas tes?
3.     Sebutkan macam-macam validitas dan realibilitas tes?
4.      Bagaimanakah tehnik dalam menentukan validitas dan realibilitas tes?

C.    Tujuan

Berdasarkan rumusan masalah di atas, maka penulis dapat menguraikan tujuan dari masalah
tersebut, yaitu:
1.      Untuk mengetahui pengertian dari validitas dan realibilitas tes
2.      Untuk mengetahui manfaat dari validitas dan realibilitas tes.
3.      Untuk mengetahui macam-macam validitas dan realibilitas tes.
4.      Untuk mengetahui yang dimaksud dengan reliabilitas tes hasil belajar.
5.      Untuk mengetahui tehnik dalam menentukan validitas dan realibilitas tes
BAB II
PEMBAHASAN

Karakteristik menggambarkan seluruh tes namun karakteristik itu lebih mungkin menjadi
penanda tes standar dari pada tes yang dikembangkan oleh guru. Tes standar merupakan tes yang
dikembangkan oleh para pakar dan dibuat secara hati-hati. Butir soal tes satu per satu dianalisis
dan direvisi sampai memenuhi standar kualitas tertentu.
Validitas berkaitan dengan apakah suatu tes mengukur dan untuk siapa tes itu layak
digunakan. Sedangkan reliabilitas mengacu pada konsistensi yang dapat diestimasikan dari data
(skor) dengan menggunakan teknik statistic yang diperoleh dari koefisien korelasi. Koefisien
korelasi menunjukkan angka desimal antara 0,00 sampai 1,00. Angka yang mendekati 0,00
menunjukkan validitas atau reliabilitas rendah. Sedangkan angka yang mendekati 1,00
menunjukkan validitas dan reliabilitas tinggi. Spesifikasi kondisi di dalam ujian juga menjadi
karakteristik penting bagi tes standar.

A. Pengertian Validitas dan Realibilitas Tes

1. Validitas Tes

Uji Validitas adalah Uji ketepatan atau ketelitian suatu alat ukur dalam mengukur apa
yang sedang ingin diukur. Dalam pengertian yang mudah dipahami, uji validitas adalah uji yang
bertujuan untuk menilai apakah seperangkat alat ukur sudah tepat mengukur apa yang
seharusnya diukur.

Saya ambil contoh mudahnya saja, jika anda ingin mengukur berat badan, maka harus
menggunakan timbangan. Sedangkan jika anda ingin mengukur tinggi badan, maka harus
menggunakan meteran. Nah, itulah yang dimaksud dengan validitas. Jadi validitas dapat
diartikan sebagai tingkat kesahihan alat ukur ukur dalam mengukur apa yang seharusnya diukur.
Validitas merupakan derajat kemampuan suatu tes yang mengukur apa yang hendak
diukur. Secara tidak langsung itu meliputi tes dan skala yang terdiri atas sejumlah tugas yang
dipilih untuk berfungsi sebagai indikator hasil belajar.

Validitas berkenaan dengan ketetapan alat penilaian terhadap konsep yang dinilai
sehingga betul-betul menilai apa yang yang seharusnya dinilai. Sebagai contoh menilai
kemampuan siswa dalam matematika. Misalnya diberikan soal dengan kalimat yang panjang dan
berbelit-belit sehingga sukar ditangkap maknanya. Akhirnya siswa tidak dapat menjawab karena
tidak memahami pertanyaannya.

Validitas tidak berlaku universal sebab bergantung pada situasi dan tujuan penilaian. Alat
penilaian yang telah valid untuk suatu tujuan tertentu belum otomatis akan valid untuk tujuan
yang lain.
2. Reliabilitas Tes

      Reliabilitas adalah indeks yang menunjukan sejauh mana suatu alat ukur            dipercaya
atau dapat diandalkan. Reliabilitas mengacu pada keajegan hasil evaluasi, yakni konsistensi skor
tes (test score) dari masa ke masa.jika seorang guru memperoleh skor yang sama pada tes yang
sama pada kelompok siswa yang sama pada waktu yang berbeda, maka dia dapat menyimpulkan
bahwa hasil tes itu memiliki derajat reliabilitas tes yang tinggi dari suatu masa ke
masa.konsistensi hasil evaluasi itu menjadi sangat berharga. Jika didasarkan pada data yang valid
dan ditetapkan secara objektif.
            Suatu hasil evaluasi pada umumnya tidak pernah mencapai konsistensi secara
sempurna. Beberapa jenis pengukuran tentu memiliki     berbagai jenis kesalahan ada bebrapa
faktor berkaitan dengan karakteristik yang bersifat temporer atau permanen. Sumber lain
berkaitan dengan       karakteristik tes itu atau cara melaksanakan ujian, pensekoran
dan           penafsiran hasil ujian.
Sebagian pembaca mungkin bertanya-tanya selama ini, apa sih perbedaan antara uji
validitas dan reliabilitas? keduanya adalah dua hal yang benar-benar berbeda, namun saling
melengkapi satu sama lain. Keduanya perlu dilakukan dengan tujuan agar alat ukur yang kita
gunakan dapat menghasilkan data yang benar-benar dapat digunakan untuk menjawab
permasalahan penelitian.

Alat ukur yang seperti itu, haruslah memenuhi kriteria, yaitu valid dan reliabel. Valid
berarti sahih atau tepat apa yang diukur sedangkan reliabel adalah handal, yaitu digunakan kapan
saja dan dimana saja maka hasilnya tetaplah sama.

Pada prakteknya, sebuah item soal dalam sebuah alat ukur haruslah valid terlebih dahulu,
baru kemudian diuji kehandalannnya. Jadi dapat dimaknai, bahwa: soal yang valid belum tentu
reliabel. Sedangkan soal yang reliabel, maka pastilah sudah valid. Demikian kiranya
perbedaan uji validitas dan reliabilitas.

B. Manfaat Validitas dan Realibilitas Tes

Validitas digunakan untuk mengukur ketepatan atau kecermatan suatu instrument dalam
pengukuran. sedangkan uji reliabilitas digunakan untuk mengetahui konsistensi alat ukur.
Tujuan pengujian validitas dan reliabilitas adalah untuk menyakinkan bahwa kuesioner yang kita
susun akan benar-benar baik dalam mengukur gejala dan menghasilkan data yang valid.

C. Macam-macam Validitas dan Realibilitas Tes

1. Validitas
Validitas suatu instrumen penelitian  dapat dilihat dari isi atau konsep maupun daya
ramal yang terdapat pada instrumen itu. Di samping itu dapat pula dilihat dengan memperhatikan
bentuknya atau hubungannya dengan tes/instrumen lain secara empirik dan statistik. Sehubungan
dengan itu validitas dapat dibedakan manjadi;

 validitas konstruk
 validitas isi, dan
 validitas empiris.

Validitas Isi (content validity)

Validitas isi terkait dengan seberapa jauh suatu instrumen penelitian mengukur tingkat
penguasaan terhadap isi suatu materi tertent yang seharusnya dikuasai sesuai dengan tujuan
pengajaran.

Hal ini mengindikasikan bahwa apabila suatu instrumen memiliki validitas isi yang baik,
maka instrumen tersebut dapat benar-benar mengukur penguasaan materi yang seharusnya
dikuasai sesuai dengan konten yang diukur.

Terkait dengan validitas isi ini, apabila peneliti ingin mengetahui tingkat validitas isi,
maka peneliti harus menelaah kisi-kisi instrumen untuk memastikan bahwa item kuesioner sudah
mewakili keseluruhan konten atau materi yang seharusnya dikuasai secara proporsional.

Selain itu pada tahap ini peneliti juga dapat melakukan justifikasi pakar untuk me-
review  apakah konsep yang diajukan sudah memadai atau belum. Jadi, pada intinya validitas isi
ini terkait dengan manifestasi sebuah instrumen dalam konten atau materi yang diujikan, selain
itu suatu validitas isi juga tidak mempunyai besaran tertentu yang dihitung secara statistik, tetapi
dipahami bahwa valid tidaknya sebuah instrumen itu dilihat kesesuainnya dengan kisi-kisi yang
ada, oleh karena itu validitas isi tidak terkait dengan analisis statistik atau data dalam bentuk
angka-angka.

Validitas konstruksi

Merupakan validitas yang mempermasalahkan seberapa jauh item-item instrumen mampu


mengukur apa yang benar-benar hendak diukur sesuai dengan konstruk atau konsep khusus yang
telah ditetapkan.

Langkah yang dapat dilakukan untuk mengetahui validitas konstruk adalah dengan
melakukan proses penelaahan teoretis terhadap suatu konsep dari variabel yang hendak diukur,
mulai dari perumusan konstruk, penentuan dimensi dan indikator sampai kepada merumuskan
item pertanyaan.
Selain itu dalam tahap ini, peneliti juga dapat melakukan justifikasi expert sama seperti
dalam pengujian validitas isi, bedanya dalam pengujian validitas konstruk ini bisa dilakukan
dengan meminta penilaian pakar justifikasi expert sama seperti dalam menilai validitas isi.

Bedanya dalam validitas konstruk ini, pakar hanya menilai dalam hal konstruksi.yang
menguasai substansi variabel yang hendak diukur atau bidang yang akan diteliti.

Validitas empiris (empiric validity)

Di dalam hal ini kriteria suatu instrumen ditentukan berdasarkan data hasil ukur
instrumen, baik melalui uji coba maupun pengukuran yang sesungguhnya. Di sini, validitas
empiris diartikan sebagai validitas yang ditentukan berdasarkan kriteria; baik kriteria internal
atau kriteria eksternal.

Kriteria internal adalah kriteria yang bersumber dari instrumen itu sendiri, sedangkan kriteria
eksternal adalah hasil ukur instrumen lain di luar instrumen itu yang menjadi kriteria.

Terkait dengan kriteria eksternal ini biasanya merujuk pada ukuran lain yang sudah dianggap
baku atau dapat dipercaya. Ada beberapa cara dalam menguji validitas empiris, di antaranya
sebagai berikut.

Validitas Ramalan (predictive validity)

Di dalam hal ini, sebuah instrumen dianggap memiliki validitas prediksi apabila mampu
memprediksi apa yang akan terjadi di masa yang akan datang berdasarkan bukti hubungan antara
nilai tes dan variabel yang diuji.

Kesukaran utama yang sering ditemui di lapangan adalah menentukan kriteria sebagai
patokan. Seandainya kriteria yang dirumuskan tentang sesuatu yang diharap kan tidak tuntas,
maka instrumen yang disusun dengan memperhatikan kriteria itu, hasil yang diharapkan akan
bergeser pula dari yang ditetapkan. Istilah lain yang sering digunakan untuk validitas prediktif
ialah “Criterion related validity” atau  “emperical validity”.

Validitas prediksi ini memiliki dua arti, yakni validitas ramalan jangka pendek dan
validitas ramalan jangka panjang. Validitas ramalan jangka pendek maksudnya validitas yang
daya prediksi alat ukur hanya berlaku dalam lama waktu tertentu.

Adapun validitas jangka panjang maksudnya meruoakan validitas instrumen yang tetap
mampu memprediksi kondisi di masa datang.

Validitas bandingan (comparative validity)

Validitas bandingan atau comparative validity merupakan ketepatan suatu tes ditinjau dari


korelasinya terhadap kecakapan yang sudah dimiliki masa sekarang secara nyata.
Perbedaan antara validitas bandingan dan validitas prediksi terletak pada masa waktunya. Jika
validitas ramalan fokus pada hubungannya dengan masa datang, maka  validitas bandingan fokus
pada hubungannya dengan masa sekarang.

Di dalam hal ini untuk menguji validitas bandingan, data yang merefeleksikan pengalaman yang
didapatkan di masa lalu itu, peneliti membandingkannya dengan data hasil tes di dapatkan di
masa kini.

Apabila hasil tes yang di dapat di masa kini memiliki hubungan searah dengan hasil tes
berlandaskan pengalama masa lampau, maka hal itu bisa dianggap bahwa instrumen memiliki
validitas bandingan yang baik.

2. Realibilitas

Ada tiga cara pelaksanaan untuk menguji reliabilitas suatu tes, yaitu:


(1) tes tunggal (single test),
(2) tes ulang (test retest), dan
(3) tes ekuivalen (alternate test).

Secara garis besar ada dua macam cara menentukan reliabilitas instrumen, yaitu reliabilitas
eksternal dan reliabilitas internal.

Uji Reliabilitas eksternal

Reliabilitas eksternal merupakan reliabilitas yang apabila ukuran atau kriterianya berada di luar
instrumen. Di dalam reliabilitas eksternal, terdapat beberapa tes reliabilitas yang dapat
digunakan, seperti:

 Metode tes ulang (Test-retest method)


 Metode paralel
 Metode belah dua

Metode Tes ulang (test-retest method)

Metode tes ulang dilakukan dengan mengujicobakan sebuah tes kepada sekelompok
peserta didik sebanyak dua kali pada waktu yang berbeda. Skor hasil uji coba pertama
dikorelasikan dengan skor hasil uji coba kedua dengan menggunakan teknik korelasi product
moment.

Di dalam hal ini, besar angka korelasi menunjukkan tingkat reliabilitas instrumen, adapun
rumusnya adalah sebagai berikut:
Metode Paralel

Metode paralel dilakukan dengan mengujicobakan dua buah instrumen yang dibuat hampir sama.
Uji coba dilakukan terhadap sekelompok responden. Setiap responden mengerjakan atau mengisi
kedua buah tes. Kemudian skor-skor kedua buah tes tersebut dikorelasikan dengan teknik
korelasi Product Moment. Angka korelasi ini menunjukkan tingkat reliabilitas instrumen.

Metode paralel ini digunakan untuk mengatasi kelemahan yang terjadi pada metode tes ulang.
Ketika dua tes yang digunakan ternyata berbeda, maka faktor carry-over effect tidak menjadi
masalah lagi, walaupun bisa saja faktor mengingat pada jawaban tes pertama sedikit berpengaruh
pada tes kedua, khususnya apabila ditemukan soal yang benar-benar mirip atau bahkan sama.

Metode Belah dua

Metode belah dua digunakan untuk mengatasi kelemahankelemahan yang terjadi pada metode
bentuk paralel dan metode tes ulang karena metode ini memungkinkan mengestimasi reliabilitas
tanpa harus menyelenggarakan tes dua kali.

Beberapa Formula yang termasuk ke dalam metode belah dua, adalah sebagai berikut:

 Formula Spearman-Brown

 Formula Flanagan
 Formula Rulon

CATATAN: dalam ketiga formula tersebut (Spearman-Brown, Flanagan, dan Rulon) teknik


belah dua dapat dilakukan dengan membagi secara ganjil genap atau pun pembelahan awal dan
akhir, adapun yang membedakan hanya rumus-rumusnya saja.

D. Tehnik dalam menentukan Validitas dan Realibilitas Tes

Teknik-Teknik Validasi Tes


a.      Validitas Tes Acuan Normatif
1. Validitas Isi

Merupakan derajad dimana suatu tes mengukur bidang-bidang isi pelajaran yang hendak diukur.
Hal ini sangat penting bagi tes hasil belajar. Validitas isi mempersyaratkan adanya validitas butir
soal dan sampel isi pelajaran. Esensi validitas isi berkaitan dengan sampel. Dan menjadi penting
apabila ingin menggambarkan kinerja siswa terhadap suatu ranah tugas tertentu.
     Validitas isi ditentukan oleh penilaian (judgement) para pakar. Tidak ada rumus untuk
menghitungnya dan tidak ada cara untuk mengungkapnya secara kuantitatif. Para pakar mengkaji
seluruh butir soal dan membuat penilaian tentang seberapa baik butir soal itu mencerminkan
bidang yang diujikan.

2. Validitas Konstrak

Merupakan derajat dimana suatu tes mampu mengukur konstruk hipotetik yang hendak
diukur. Tahapan validitas konstruk yaitu mengidentifikasi konstruk yang diperkirakan untuk
menghitung kinerja tes, menarik hipotesis berkenaan dengan kinerja tes dari teori masing-masing
konstruk, menguji hipotesis berdasarkan logika dan data empirik.

3. Validitas Kongkaren
Merupakan derajat dimana skor suatu tes berkaitan dengan skor tes lainnya, yakni tes
yang telah sahih kemudian diujikan pada waktu yang bersamaan dengan tes yang baru dibuat.
4. Validitas Peramalan

      Merupakan derajat dimana suatu tes dapat meramalkan seberapa baik siswa akan
melaksanakan tugas di dalam situasi mendatang. Validitas peramalan ditentukan dengan cara
merumuskan hubungan antara skor tes dengan ukuran keberhasilan pada situasi yang diinginkan.

b.      Validitas Tes Acuan Patokan


Tujuan utama TAP untuk mengukur hasil belajar pada satu tujuan pembelajaran atau
lebih, sehingga validitas isi akan menjadi perhatian utama di dalam menentukan reliabilitasnya.
1. Validitas Isi
Validitas isi pada TAP berkaitan dengan derajat kemampuan tes mengukur pencapaian
tujuan pembelajaran. Seperti halnya dengan TAN, pada TAP juga berkaitan dengan validitas
butir soal dan validitas sampel tujuan pembelajaran. Validitas isi juga disebur sebagai validitas
deskriptif.

2. Validitas Peramalan
Validitas peramalan pada TAP mempertanyakan kemampuan tes meramalkan kinerja
siswa di masa depan. Validitas ini juga disebut sebagai validitas fungsional. Dengan demikian
salah satu fungsi tes adalah untuk membuat peramalan di masa depan. Apabila tes itu baik, maka
dapat dikatakan bahwa tes tersebut memiliki validitas fungsional.

2.      Teknik-teknik reliabilitas

            Penghitungan reliabilitas untuk tes acuan normative setidak-            tidaknya


lebih             mudah dibandingkan dengan pernghitungan validitasa. Ada            banyak jenis
reliabilitas yang berbeda-beda, masing-masing ditentukan       dengan cara-cara yang bebeda dan
massing-masing menjelaskan jenis          konsistensi yang berbeda .teknik reliabilitas tes
ulang, bentuk satara, dan        belah dua semua nya ditentukan melalui korelasi.

a.      Teknik Reliabilitas Untuk Tes Acuan Normatif


            Skor tes dapat menjadi reliable atau konsisten secara berbeda.skor   itu dapat
dikatagorisasikan sesuaikan dengan apakak sekor-sekor itu            diperoleh dari satu tes yang
diujikan sekali, dua kali, ataukah dua tes      diujukan dalam satu waktu sekali.rliabelitas ini dapat
diestimasikan        dengan menggunakan             teknik korelasi, dan diungkap dengan angka
decimal           antara 0,00 sampai dengan 1,00

1. Reliabilitas tes ulang (test-retest reliability)

Teknik reliabilitas tes ulang adalah derajat dimana skor tes tetap konsisten sepanjang
masa. Ia menunjukan sebaran skor yang terjadi dari bebrapa kegiatan ujian sebagai hasil dari
kesalahan pengukuran

2. Reliabilitas bentuk setara (Equivalent-form Reliability)

Teknik reliabilitas setara adalah dua tes yang identik kecuali untuk soal-soal aktual. Dua
bentuk tes itu mengukur bidang isi pelajaran yang sama, jumlah soal sama, struktur soal sama,
tingkat kesulitan sama, dan petunjukn ujian, penskoran dan penafsiran sama.
3. Reliabilitas Belah Dua (Spil-Half Reliabiliy)

Reliabilitas belah dua merupakan jenis reliabilitas yang didasarkan pada konsistensi
internal dari suatu tes. Karena prosedur reliabilitas belah dua hanya memerlukan satu kali ujian,
maka sumber kesalahan pengukuran dapat dikurangi, seperti perbedaan situasi dan kondisi ujian,
yang dapat terjadi pada perhitungan reliabilitas tes ulang.

4. Reliabilitas kesetaraan nasional (Retional Equivalence Reliability)

Reliabilitas kesataraan nasional tidak dihitung melalui korelasi, namun melalui penetapan
hubungan antara satu butir soal dengan seluruh butir lainnya dan total butir soal dalam tes.

5. Reliabilitas Tes Acuan Patokan

Reliabilitas tes acuan patokan mengacu pada konsistensi tes mengukur apa yang diukur.
Perhatian tes acuan patokan adalah asesmen derajat stabilitas atau kesetaraan, yakni reliabilitas
bentuk tes ulamg dan kesetaraan.
1)      Tes acuan patokan non-materi
Walaupun secara teoritik variabilitas skor yang dicapai siswa tidak ada dalam tes acuan
patokan, namun demikian variabilitas itu tetap ada. Oleh karena itu apabila tes acuan patokan itu
diterapkan dan tingkat kinerja setiap siswa dicatat, maka hampir selalu terjadi variabilitas skor.
Derajat variabilitas itu akan bervariasi dari kelompok ke kelompok dan dari tes ke tes lainnya.
Apabila terdapat variabilitas skor, maka dapat digunakan pengukuran tradisional untuk
menghitung reliabilitas. Pendekatan yang digunakan untuk menghitung koefisien reliabilitas
pada tes acuan patokan hingga sekarang ini belum ada yang diterima oleh semua pihak.

2)      Tes acuan patokan materi


Livingston telah mengusulkan pendekatan untuk membuat estimasi reliabilitas tes acuan
patokan. Rumus yang digunakan pada dasarnya adalah generalisasi dari teori reliabilitas klasik.
Rumus yang digunakan itu menghitung reliabilitas tes acuan patokan dengan cara pertama-tama
menghitung reliabilitas tradisional, seperti pada acuan tes normatif, kemudian menyesuaikan
berdasrkan pada kriteria skor tes acuan patokan. Rumus yang digunakan hanya cocok untuk jenis
tes materi.

     

Anda mungkin juga menyukai