Anda di halaman 1dari 26

TUGAS MAKALAH

EVALUASI PROSES DAN HASIL PEMBELAJARAN KIMIA

“Validitas dan Reliabilitas”

DISUSUN OLEH

KELOMPOK 10

NAMA :

1. Jon Faizal (06101981722068)


2. M. Yudharsyah (06101181722003)
3. Multi Ermaika Islami (06101281722040
06101281722040)

DOSEN PENGAMPUH
PENGAMP : Dr. Effendi Nawawi, M.Si.

PROGRAM STUDI PENDIDIKAN KIMIA


FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN
UNIVERSITAS SRIWIJAYA
2020
KATA PENGANTAR

Puji syukur penulis panjatkan kehadirat Tuhan YME, berkat rahmat dan
karunia-Nyalah Penulis dapat menyelesaikan makalah ini dengan judul Tugas
Makalah Evaluasi Proses Dan Hasil Pembelajaran Kimia “Validitas dan
Reliabilitas”.

Pada kesempatan ini penulis menyampaikan ucapan terima kasih kepada


Dosen Pengampu yang telah bersedia memberikan waktunya, perhatiannya, serta
bimbingannya dalam penyelesaian makalah ini. Penulis juga mengucapkan terima
kasih kepada semua pihak yang telah memberikan bantuan dan dukungannya
hingga makalah ini dapat diselesaikan.

Penulis menyadari makalah ini masih banyak kekurangan, karena


terbatasnya ilmu yang dimiliki, untuk itu penulis mengharapkan kritik dan saran
yang bersifat membangun untuk lebih menyempurnakan makalah kami di masa
yang akan datang. Akhirnya, Penulis berharap semoga makalah ini dapat
memberikan sumbangsih serta manfaat bagi kita semua.

Indralaya, Februari 2020

Penulis
DAFTAR ISI
Halaman
KATA PENGANTAR ..................................................................................... ii
DAFTAR ISI .................................................................................................... iii
BAB I PENDAHULUAN
A. Latar Belakang ................................................................................. 1
B. Rumusan Masalah ........................................................................... 2
C. Tujuan............................................................................................... 2

BAB II PEMBAHASAN
A. Pengertian Validitas ….. ................................................................... 3
B. Pengertian Reliabilitas………………………................................... 5
C. Jenis Validitas Dan Reliabilitas……………………......................... 7
D. Fungsi Validitas Dan Reliabilitas………………………. ................ 14
E. Faktor Mempengaruhi Validitas dan Reliabilitas…………………. . 14
F. Uji Validitas Dan Reliabilitas………………………. ....................... 15

BAB III PENUTUP


A. Kesimpulan ...................................................................................... 22

DAFTAR PUSTAKA
BAB I
PENDAHULUAN

A. Latar Belakang
Persoalan alat ukur yang digunakan evaluator ketika melakukan kegiatan
evaluasi sering dihadapkan pada persoalan akurasi, konsisten dan stabilitas
sehingga hasil pengukuran yang diperoleh bisa mengukur dengan akurat sesuatu
yang sedang diukur. Instrumen ini memang harus memiliki akurasi ketika
digunakan. Konsisten dan stabil dalam arti tidak mengalami perubahan dari waktu
pengukuran satu ke pengukuran yang lain.

Perkembangan konsep penilaian pendidikan yang ada pada saat ini


menunjukkan arah yang lebih luas. Penilaian program pendidikan menyangkut
penilaian terhadap tujuan pendidikan, isi program, strategi pelaksanaan program
dan sarana pendidikan. Penilaian proses belajar mengajar menyangkut penilaian
terhadap kegiatan guru, kegiatan siswa, pola interaksi guru siswa dan
keterlaksanaan program belajar mengajar. Sedangkan penilaian hasil belajar
menyangkut hasil belajar jangka pendek dan hasil belajar jangka panjang.

Dengan demikian, inti penilaian adalah proses memberikan atau


menentukan nilai kepada objek tertentu berdasarkan suatu kriteria tertentu. Proses
pemberian nilai tersebut berlangsung, baik dalam bentuk validitas maupun
reliabilitas. Keberhasilan mengungkapkan hasil dan proses belajar siswa
sebagaimana adanya (objektivitas hasil penilaian) sangat tergantung pada kualitas
alat penilaiannya di samping pada cara pelaksanaannya.

Data yang kurang memiliki validitas, akan menghasilkan kesimpulan yang


bisa, kurang sesuai dengan yang seharusnya, dan bahkan bisa saja bertentangan
dengan kelaziman. Untuk membuat alat ukur instrumen itu, diperlukan kajian
teori, pendapat para ahli serta pengalaman-pengalaman yang kadangkala
diperlukan bila definisi operasional variabelnya tidak kita temukan dalam teori.
Alat ukur atau instrumen yang akan disusun itu tentu saja harus memiliki
validitas, agar data yang diperoleh dari alat ukur itu bisa reliabel, valid dan
disebut dengan validitas.
Pada makalah ini akan dibahas mengenai analisis soal berupa validitas dan
reliabilitas yang berguna sebagai pedoman bagi pendidikan dalam melakukan
analisis soal terutama untuk soal objektif.

B. Rumusan Masalah
1. Apa pengertian dari validitas dan reliabilitas?
2. Apa saja jenis validitas dan reliabilitas ?
3. Apa saja fungsi validitas dan reliabilitas?
4. Apa saja faktor mempengaruhi validitas dan reliabilitas?
5. Bagaimanakah uji validitas dan reliabilitas?

C. Tujuan
1. Mengetahui apa yang dimaksud dengan validitas dan reliabilitas.
2. Mengetahui pembagian validitas dan reliabilitas.
3. Mengetahui fungsi validitas dan reliabilitas.
4. Mengetahui faktor mempengaruhi validitas dan reliabilitas.
5. Mengetahui uji validitas dan reliabilitas.
BAB II
PEMBAHASAN

A. Pengertian Validitas
Menurut Azwar (1986), Validitas berasal dari kata validity yang
mempunyai arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam
melakukan fungsi ukurnya. Suatu skala atau instrumen pengukur dapat dikatakan
mempunyai validitas yang tinggi apabila instrumen tersebut menjalankan fungsi
ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya
pengukuran tersebut. Sedangkan tes yang memiliki validitas rendah akan
menghasilkan data yang tidak relevan dengan tujuan pengukuran.
Terkandung di sini pengertian bahwa ketepatan validitas pada suatu alat
ukur tergantung pada kemampuan alat ukur tersebut mencapai tujuan pengukuran
yang dikehendaki dengan tepat. Suatu tes yang dimaksudkan untuk mengukur
variabel A dan kemudian memberikan hasil pengukuran mengenai variabel A,
dikatakan sebagai alat ukur yang memiliki validitas tinggi. Suatu tes yang
dimaksudkan mengukur variabel A akan tetapi menghasilkan data mengenai
variabel A’ atau bahkan B, dikatakan sebagai alat ukur yang memiliki validitas
rendah untuk mengukur variabel A dan tinggi validitasnya untuk mengukur
variabel A’ atau B (Azwar 1986).
Sisi lain dari pengertian validitas adalah aspek kecermatan pengukuran.
Suatu alat ukur yang valid tidak hanya mampu menghasilkan data yang tepat akan
tetapi juga harus memberikan gambaran yang cermat mengenai data tersebut.
Cermat berarti bahwa pengukuran itu dapat memberikan gambran mengenai
perbedaan yang sekecil-kecilnya mengenai perbedaan yang satu dengan yang lain.
Sebagai contoh, dalam bidang pengukuran aspek fisik, bila kita hendak
mengetahui berat sebuah cincin emas maka kita harus menggunakan alat
penimbang berat emas agar hasil penimbangannya valid, yaitu tepat dan cermat.
Sebuah alat penimbang badan memang mengukur berat, akan tetapi tidaklah
cukup cermat guna menimbang berat cincin emas karena perbedaan berat yang
sangat kecil pada berat emas itu tidak akan terlihat pada alat ukur berat badan.
Menggunakan alat ukur yang dimaksudkan untuk mengukur suatu aspek
tertentu akan tetapi tidak dapat memberikan hasil ukur yang cermat dan teliti akan
menimbulkan kesalahan atau eror. Alat ukur yang valid akan memiliki tingkat
kesalahan yang kecil sehingga angka yang dihasilkannya dapat dipercaya sebagai
angka yang sebenarnya atau angka yang mendekati keadaan yang sebenarnya
(Azwar 1986).
Pengertian validitas juga sangat erat berkaitan dengan tujuan pengukuran.
Oleh karena itu, tidak ada validitas yang berlaku umum untuk semua tujuan
pengukuran. Suatu alat ukur biasanya hanya merupakan ukuran yang valid untuk
satu tujuan yang spesifik. Dengan demikian, anggapan valid seperti dinyatakan
dalam “alat ukur ini valid” adalah kurang lengkap. Pernyataan valid tersebut harus
diikuti oleh keterangan yang menunjuk kepada tujuan (yaitu valid untuk
mengukur apa), serta valid bagi kelompok subjek yang mana.
Pengertian validitas menurut Walizer (1987) adalah tingkaat kesesuaian
antara suatu batasan konseptual yang diberikan dengan bantuan operasional yang
telah dikembangkan. Menurut Aritonang R. (2007) validitas suatu instrumen
berkaitan dengan kemampuan instrument itu untuk mengukur atu mengungkap
karakteristik dari variabel yang dimaksudkan untuk diukur. Instrumen yang
dimaksudkan untuk mengukur sikap konsumen terhadap suatu iklan, misalnya,
harus dapat menghasilkan skor sikap yang memang menunjukkan sikap konsumen
terhadap iklan tersebut. Jadi, jangan sampai hasil yang diperoleh adalah skor yang
menunjukkan minat konsumen terhadap iklan itu.
Validitas suatu instrumen banyak dijelaskan dalam konteks penelitian
sosial yang variabelnya tidak dapat diamati secara langsung, seperti sikap, minat,
persepsi, motivasi, dan lain sebagainya. Untuk mengukur variabel yang demikian
sulit, untuk mengembangkan instrumen yang memiliki validitas yang tinggi
karena karakteristik yang akan diukur dari variabel yang demikian tidak dapat
diobservasi secara langsung, tetapi hanya melalui indikator (petunjuk tak
langsung) tertentu.
Menurut Masri Singarimbun, validitas menunjukkan sejauh mana suatu
alat pengukur itu mengukur apa yang ingin diukur. Bila seseorang ingin mengukur
berat suatu benda, maka dia harus menggunakan timbangan. Timbangan adalah
alat pengukur yang valid bila dipakai untuk mengukur berat, karena timbangan
memang mengukur berat. Bila panjang sesuatu benda yang ingin diukur, maka dia
harus menggunakan meteran. Meteran adalah alat pengukur yang valid bila
digunakan untuk mengukur panjang, karena memang meteran mengukur panjang.
Tetapi timbangan bukanlah alat pengukur yang valid bilamana digunakan untuk
mengukur panjang.
Sekiranya penelliti menggunakan kuesioner di dalam pengumpulan data
penelitian, maka kuesioner yang disusunnya harus mengukur apa yang ingin
diukurnya. Setelah kuesioner tersebut tersusun dan teruji validitasnya, dalam
praktek belum tentu data yang dikumpulkan adalah data yang valid. Banyak hal-
hal lain yang akan mengurangi validitas data; misalnya apakah si pewawancara
yang mengumpulkan data betul-betul mengikuti petunjuk yang telah ditetapkan
dalam kuesioner.
Menurut Suharsimi Arikunto, validitas adalah keadaan yang
menggambarkan tingkat instrumen bersangkutan yang mampu mengukur apa
yang akan diukur. Menurut Soetarlinah Sukadji, validitas adalah derajat yang
menyatakan suatu tes mengukur apa yang seharusnya diukur. Validitas suatu tes
tidak begitu saja melekat pada tes itu sendiri, tapi tergantung penggunaan dan
subyeknya.
Validitas adalah sutu ukuran yang menunjukkan tingkat ke validan atau
kesahihan suatu instrmen. Suatu instrumen yang valid itu mempunyai validitas
yang tinggi dan sebaliknya bila tingkat validitasnya rendah maka instrumen
tersebut kurang valid. Sebuah instrumen dikatakan valid apabla mampu mengukur
apa yang hendak diukur/ diinginkan. Sebuah instrumen dikatan valid apabila bisa
mengungkap data dari variabel yang diteliti. Validitas instrumen terbagi dalam
validitas internal,(validitas konstruk /constract validity dan validitas isi / contect
validity) dan validitas eksternal / empiris.

B. Pengertian Reliabilitas
Reliabilitas adalah indeks yang menunjukan sejauh mana suatu alat ukur
dipercaya atau dapat diandalkan. Reliabilitas mengacu pada keajegan hasil
evaluasi, yakni konsistensi skor tes (test score) dari masa ke masa.jika seorang
guru memperoleh skor yang sama pada tes yang sama pada kelompok siswa yang
sama pada waktu yang berbeda, maka dia dapat menyimpulkan bahwa hasil tes itu
memiliki derajat reliabilitas tes yang tinggi dari suatu masa ke masa. Konsistensi
hasil evaluasi itu menjadi sangat berharga. Jika didasarkan pada data yang valid
dan ditetapkan secara objektif.
Suatu hasil evaluasi pada umumnya tidak pernah mencapai konsistensi
secara sempurna. Beberapa jenis pengukuran tentu memiliki berbagai jenis
kesalahan ada bebrapa faktor berkaitan dengan karakteristik yang bersifat
temporer atau permanen. Sumber lain berkaitan dengan karakteristik tes itu atau
cara melaksanakan ujian, penskoran dan penafsiran hasil ujian.
Reliabilitas menunjuk pada sesuatu pengertian bahwa suatu instrumen
dapat dipercaya untuk digunakan sebagai alat pengumpul data karena instrumen
tersebut sudah dianggap baik. Intrumen yang baik tidak mungkin bersifat
tendenslus mengarahkan responden untuk memilih jawaban-jawaban
tertentu.reliabel artinya dapat dipercaya juga dapat diandalkan. Sehingga beberapa
kali diulang pun hasilnya akan tetap sama ( konsisten). Pengujian reabilitas dapat
dilakukan secara eksternal (staility/test pretest, equivalent atau gabungan
kedunya) dan secara inernal (analisis konsistensi butir-butir yang ada pada
instrumen).
Reliabilitas mengacu pada sejauh mana hasil pengukuran, perhitungan,
atau spesifikasi dapat bergantung pada akurat atau konsistensi hasil tes. Oleh
karena itu, kami dapat mengklaim bahwa tes dapat diandalkan jika hasil tes yang
dihasilkan konsisten tanpa berubah setiap waktu. Oleh karena itu, singkatnya,
reliabilitas adalah parameter yang dapat kita gunakan untuk mengukur stabilitas
atau konsistensi tes dari hasil tesnya. Jadi, jika kita mengambil contoh yang sama
yang kita ambil sebelumnya, jika hasil tesnya sama bahkan ketika kita melakukan
lain waktu, menggunakan subjek tes yang sama, maka kita dapat mengatakan
bahwa tes tersebut dapat diandalkan, atau reliabilitas tes tercapai .
Demikian pula, jika hasil penelitian penelitian direplikasi secara konsisten,
maka hasil atau temuan tes dapat diandalkan. Selain itu, koefisien korelasi dapat
digunakan untuk menilai tingkat reliabilitas. Dengan demikian, teorinya adalah
bahwa jika suatu tes dapat diandalkan, ia harus menunjukkan korelasi positif yang
tinggi.
C. Jenis Validitas dan Reliabilitas
Didalam buku Encyclopedia of Educational Evaluation yang ditulis oleh
Scarvia B. Anderson dan kawan-kawan disebutkan A test is valid if it measures
what it purpose to measure. Atau jika diartiakan lebih kurang demikian: sebuah
tes dikatakan valid apabila tes tersebut mengukur apa yang hendak
diukur.Sebenarnya pembicaraan validitas ini bukan ditekankan pada tes itu sendiri
tetapi pada hasil pengetesan atau skornya.
Contoh:
Skor yang diperoleh dari hasil mengukur kemampuan mekanik akan
menunjukkan kemampuan seseorang dalam memegang dan memperbaiki mobil,
bukan pengetahuan orang tersebut dalam hal yang berkaitan dengan mobil. Tes
yang mengukur pengetahuan tentang mobil bukanlah tes yang sahih untuk
mekanik.
Validitas sebuah tes dapat diketahui dari hasil pemikiran dan dari hasil
pengalaman. Hal yang pertama akan diperoleh validitas logis (logical validity)
dan hal yang kedua diperoleh validitas empiris (empirical validity). Dua hal inilah
yang dijadikan dasar pengelompokkan validitas tes.
1. Validitas tes
a. Validitas logis
Istilah “validitas logis” mengandung kat “logis” berasal dari kata
“logika”, yang berarti penalaran. Dengan makna demikian maka validitas
logis untuk sebuah instrument evaluasi menunjuk pada kondisi bagi sebuah
instrument yang memenuhi persyaratan valid berdasarkan hasil penalaran.
Kondisi valid tersebut dipandang ter[penuhi karena instrument yang
bersangkutan sudah dirancang secara baik, mengikuti teori dan ketentuan yang
ada. Sebagaimana pelaksanaan tugas lain misalnya membuat sebuah karangan,
jika penulis sudah mengikuti aturan mengarang, tentu secara logis
karangannya sudah baik. Berdasarkan penjelasan tersebut maka instrument
yang sudah disusun berdasarkan teori penyusunan instrument, secara logis
sudah valid. Dari penjelasan tersebut kita dapat memahami bahwa validitas
logis dapat dicapai apabilainstrumen disusun mengikuti ketentuan yang ada.
Dengan demikian, dapat disimpulkan bahwa validitas logis tidak perlu diuji
kondisinya tetapi langsung diperoleh sesudah instrument tersebut selesai
disusun.
Ada 2 macam validitas logis yang dapat dicapai oleh sebuah
instrument, yaitu: validitas isi dan validiats konstrak (construct validity).
Validitas isi bagi sebauh instrument menunjuk suatu kondisi sebuah
instrument yang disusun berdasarkan isi materi pelajaran yang di evaluasi.
Selanjtnya validitas konstrak sebuah instrument menunjuk suatu kondiusi
sebuah instrument yang disusun berdasarkan kontrak aspek-aspek kejiwaan
yang seharusnya dievaluasi. Penjelasan lebih jauh tentang kedua jenis validitas
logis ini akan diberikan berturut-turut dalam membahas jenis-jenis validitas
instrument mati.
b. Validitas empiris
Istilah “validitas empiris” memuat kata “empiris” yang artinya
“pengalaman”. Sebuah instrument dapat dikatakan memiliki validitas empiris
apabila sudah diuji dari pengalaman. Sebagai conyoh sehari-hari, seseorang
dapat diakui jujur oleh masyarakat apabila dalam pengalaman dibuktikan
bahwa seseorang tersebut memang jujur. Contoh lain, seseorang dapat
dikatakan kreatif apabila dari pengalaman dibuktikan bahwa orang tersebut
sudah banyak menghasikan ide-ide baru yang diakui berbeda dari hal-hal yang
sudah ada. Dari penjelasan dan contoh-contoh tersebut diketahui bahwa
validitas empiris tidak dapat diperoleh hanya dengan menyusun instrument
berdasarkan ketentuan seperti halnya validitas logis, tetapi harus dibuktikan
melalui pengalaman.
Ada 2 macam validiatas empiris, yakni ada dua cara yang dapat
dilakukan untuk menguji bahwa sebuah instrument memang valid. Pengujian
tersebut dilakukan dengan membandingkan kondisi instrument yang
bersangkutan dengan kriterium atau sebuah ukuran. Kriterium yang digunakan
sebagai pembanding kondisi instrument dimaksud ada dua, yaitu: yang sudah
tersedia dan yang belum ada tetapi akan terjadi di waktu yang akan datang.
Bagi instrument yang kondisinya sesuai dengan kriterium yang sudah tersedia,
yang sudah ada, disebut memiliki validitas “ada sekarang”, yang dalam istilah
bahasa Inggris disebut memiliki concurrent validity. Selanjutnya instrument
yang kondisinya sesuai dengan kriterium yang diramalkan akan terjadi,
disebut memiliki validitas ramalan atau validitas prediksi, yang dalam istilah
bahasa Inggris disebut memiliki predictive validity.
Dari uraian adanya 2 jenis validiats, yakni validitas logis yang ada dua
macam, dan validitas empiris, yang juga ada dua macam, maka secara
keseluruhan kita mengenal adanya empat validitas, yaitu:
1) Validitas isi
Sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan
khusus tertentu yang sejajar dengan materi atau isi pelajaran yang
diberikan. Oleh karena materi yang diajarkan tertera dalam kurikulum
maka validitas isi ini sering juga disebut validitas kurikuler.
Validitas isi dapat diusahakan tercapainya sejak saat penyusunan
dengan cara memerinci materi kurikulum atau materi buku pelajaran.
2) Vailiditas konstrak
Sebuah tes dikatakan memiliki validitas konstruksi apabila butir-butir
soal yang membangun tes tersebut mengukur setiap aspek berpikir seperti
yang disebutkan dalam Tujuan Instruksional Khusus. Dengan kata lain jika
butir-butir soal mengukur aspek berpikir tersebut sudah sesuai dengan
aspek berpikir yang menjadi tujuan instruksional.
Sebagai contoh jika rumusan Tujuan Instruksional Khusus (TIK):
“Siswa dapat membandingkan antara efek biologis dan efek psikologis”,
maka butir soal pada tes merupakan perintah agar siswa membedakan
antara dua efek tersebut.
“Konstruksi” dalam pengertian ini bukanlah “susunan” seperti yang
sering dijumpai dalam teknik, tetapi merupakan rekaan psikologis yaitu
suatu rekaan yang dibuat oleh para ahli Ilmu Jiwa yang dengan sutau cara
tertentu “memerinci’ isi jiwa atas beberapa aspek seperti: ingatan
(pengetahuan), pemahaman, aplikasiu, dan seterusnya. Dalam hal ini,
mereka menganggap seolah-olah jiwa dapat dibagi-bagi. Tetapi
sebenarnya tidak demikian. Pembagian ini hanya merupakan tindakan
sementara untuk mempermudah mempelajari.
Seperti halnya validitas isi, validitas konstruksi dapat diketahui dengan
cara memerinci dan memasangkan setiap butir soal dengan setiap aspek
dalam TIK. Pengerjaanya dilakukan berdasarkan logika, bukan
pengalaman. Dalam pembicaraan mengenai penyusunan tes hal ini akan
disinggung lagi.
3) Validitas “ada sekarang”,
Validitas ini lebih umum dikenal dengan validitas empiris. Sebuah tes
dikatakan memiliki validitas empiris jika hasilnya sesuai dengan
pengalaman. Jika ada istilah “sesuai” tentu ada dua hal yang dipasangkan.
Dalam hal ini hasil tes dipasangkan dengan hasil pengalaman. Pengalaman
selalu mengenai hal yang telah lampau sehingga data pengalaman tersebut
sekarang sudah ada (ada sekarang, concurrent).
Dalam membandingkan hasil sebuah tes maka diperlukan suatu
kriterium atau alat banding. Maka hasil tes merupakan sesuatu yang
dibandingkan.
Misalnya seorang guru ingin mengetahui apakah tes sumatif yang
disusun sudah valid atau belum. Untuk ini diperlukan sebuah kriterium
masa lalu yang sekarang datanya dimiliki. Masalnya nilai ulangan harian
atau nilai ulangan sumatif yang lalu.
4) Validitas predictive
Memprediksi artinya meramal, dengan meramal selalu mengenai hal
yang akan datang, jadi sekarang belum terjadi. Sebuah tes dikatakan
memilki validitas prediski atau validitas ramalan apabila mempunyai
kemampuan untuk meramalkan apa yang akan terjadi pada masa yang
akan dating.
Misalnya tes masuk Perguruan Tinggi adalah sebuah tes yang
diperkirakan mampu meramalkan keberhasilan peserta tes dalam
mengikuti kuliah di masa yang akan dating. Calon yang tersaring
berdasarkan hasil tes diharapkan mencerminkan tinggi tentu menjamin
keberhasilannya kelak. Sebaliknya seorang calon dikatakan tidak lulus tes
karena memilki nilai tes yang rendah jadi diperkirakan akan tidak mampu
mengikuti perkuliahan yang akan datang.
Sebagai alat pembanding validitas prediksi adalah nilai-nilai yang
diperoleh setelah peserta tes mengikuti pelajaran di Perguruan Tinggi. Jika
ternyata siapa yang memilki nilai tes lebih tinggi gagal dalam ujian
semester I dibandingkan dengan yang dahulu nilai tesnya lebih rendah
maka tes masuk yang dimaksud tidak memilki validitas prediksi.

2. Validitas butir
Jika seorang peneliti atau seorang guru mengetahui bahwa validitas soal
tes misalnya terlalu rendah atau rendah saja, maka selanjutnya ingin mengetahui
butir-butir tes mankah yang menyebabkan soal secara keseluruhan tersebut jelek
karena memiliki validitas rendah. Untuk keperluan inilah dicari butir soal.
Pengertian umum untuk validitas item adalah demikian sebuah item
dikatakan valid apabila mempunyai dukungan yang besar terhadap skor total.
Skor pada item menyebabkan skor total menjadi tinggi atau rendah. Dengan kata
lain dapat dikemukakan di sini bahwa ssebuah item memiliki validitas yang tinggi
jika skor pada item mempunyai kesejajaran dengan skor total. Kesejajaran ini
dapat diartikan dengan korelasi sehingga untuk mengetahui validitas item
digunakan rumus korelasi seperti sudah diterangkan di atas.
Untuk soal-soal bentuk objektif skor untuk item biasa diberikan dengan 1
(bagi item yang dijawab benar) dan 0 (item yang dijawab salah), sedangkan skor
total selanjutnya merupakan jumlah dari skor untuk semua item yang membangun
soal tersebut.
TABEL ANALISIS ITEM UNTUK PERHITUNGAN
VALIDITAS ITEM
Butir soal/item
No Nama Skor total
1 2 3 4 5 6 7 8 9 10
1 Hartati 1 0 1 0 1 1 1 1 1 1 8
2 Yoyok 0 0 1 0 1 0 0 1 1 1 5
3 Oktaf 0 1 0 0 0 1 0 1 0 1 4
4 Wendi 1 1 0 0 1 1 0 0 1 0 5
5 Diana 1 1 1 1 1 1 0 0 0 0 6
6 Paul 1 0 1 0 1 0 1 0 0 0 4
7 Susana 1 1 1 1 1 1 1 0 0 0 7
8 Helen 0 1 0 1 1 1 1 1 1 1 8
Misalnya akan dihitung validitas item nomor 6, maka skor item tersebut
disebut variabel X dan skor total disebut variabel Y. selanjutnya perhitungan
dilakukan dengan menggunakan rumus korelasi product moment baik dengan
rumus simpangan maupun angka kasar.
Penggunaan kedua rumus tersebut masing-masing ada keuntungannya.
Menggunakan rumus simpangan angkanya kecil-kecil, tetapi kadang-kadang
pecahannya rumit. Jika skor rata-rata (mean)-nya pecahan, simpangannya
cenderung banyak pecahan. Mengalikan pecahan persepuluhan ditambah dengan
tanda-tanda = (plus) dan – (minus) kadang-kadang bias menyesatkan. Penggunaan
rumus angka kasar bilangannya besar-besar tapi bulat. Jika ada kalkulator statistic
disarankan menggunakan rumus angka kasar saja. Yang dibutuhkan hanyalah :
∑X, ∑Y, ∑X2, ∑Y2, dan ∑XY, tidak perlu membuat table seutuhnya.
Salah satu syarat agar hasil suatu tes dapat dipercaya adalah tes tersebut
harus mempunyai reliabilitas yang memadai. Oleh karena itu Jaali dan Pudji
(2008) membedakan reliabilitas menjadi 2 macam, yaitu :
 Reliabilitas Konsistensi tanggapan, dan
 Reliabilitas konsistensi gabungan item
 Reliabilitas Konsistensi Tanggapan
Reliabilitas ini selalu mempersoalkan mengenai tanggapa responden atau
objek terhadap tes tersebut apakah sudah baik atau konsisten. Dalam artian
apabila tes yang telah di cobakan tersebut dilakukan pengukuran kembali terhadap
obyek yang sama, apakah hasilnya masih tetap sama dengan pengukuran
sebelumnya. Jika hasil pengukuran kedua menunjukkan ketidakonsistenan, maka
hasil pengukuran tersebut tidak mengambarkan keadaan obyek yang
sesungguhnya. Untuk mengetahui apakah suatu tes atau instrument tersebut sudah
mantap atau konsisten, maka tes/instrument tersebut harus diuji kepada obyek
ukur yang sama secara berulang-ulang.
Ada tiga mekanisme untuk memeriksa reliabilitas tanggapan responden
terhadap tes (Jaali ; 2008) yaitu :
 Teknik test-retest ialah pengetesan dua kali dengan menggunakan suatu
tes yang sama pada waktu yang berbeda.
 Teknik belah dua ialah pengetesan (pengukuran) yang dilakukan dengan
dua kelompok item yang setara pada saat yang sama.
 Bentuk ekivalen ialah pengetesan (pengukuran) yang dilakukan dengan
menggunakan dua tes yang dibuat setara kemudian diberikan kepada
responden atau obyek tes dalam waktu yang bersamaan.
 Reliabilitas Konsistensi Gabungan Item
Reabilitas ini terkait dengan konsistensi antara item-item suatu tes atau
instrument.. Apabila terhadap bagian obyek ukur yang sama, hasil pengukuran
melalui item yang satu kontradiksi atau tidak konsisten dengan hasil ukur melalui
item yang lain maka pengukuran dengan tes (alat ukur) sebagai suatu kesatuan itu
tidak dapat dipercaya. Untuk itu jika terjadi hal demikian maka kita tidak bisa
menyalahkan obyek ukur, melainkan alat ukur (tes) yang dipersalahkan, dengan
mengatakan bahwa tes tersebut tidak reliable atau memiliki reliabilitas yang
rendah.
Koefisien reliabilitas konsistensi gabungan item dapat dihitung dengan
menggunakan 3 rumus (Jaali 2008), yakni :
 Rumus Kuder-Richardson, yang dikenal dengan nama KR-20 dan KR-21.
 Rumus koefisien Alpha atau Alpha Cronbach.
 Rumus reliabilitas Hoyt, yang menggunakan analisis varian.
D. Fungsi Validitas dan Reliabilitas
Kegunaan Validitas :
1. Untuk menghindari pertanyaan yang kurang jelas.
2. Untuk meniadakan kata-kata yang terlalu asing atau kata-kata yang
menimbulkan kecurigaan.
3. Untuk memperbaiki pertanyaan-pertanyaan yang kurang jelas.
4. Untuk menambah item yang diperlukan atau meniadakan item yang
dianggap tidak relevan.
5. Untuk mengetahui validitas kuesioner tersebut.
Validitas dikatakan tinggi bila alat ukur dapat menjalankan fungsi ukurnya
yaitu :
1. Memberikan hasil ukur yang sesuai dengan maksud dilakukan pengukuran
tersebut.
2. Dapat memberikan gambaran perbedaan
Pernyataan valid harus diikuti dengan keterangan yang menunjuk kepada
tujuan pengukuran, yaitu :
1. Valid untuk mengukur apa
2. Valid untuk mengukur pada kelompok yang mana
Kegunaan dari reabilitas data adalah untuk mengetahui atau menunjukkan
keajekan suatu tes dalam mengukur gejala yang sama pada waktu dan kesempatan
yang berbeda.

E. Faktor Mempengaruhi Validitas dan Reliabilitas


Faktor Yang Mempengaruhi Validitas
1. Ketidakjelasan petunjuk tes.
2. Kesulitan siswa dalam memahami padanan kata dan struktur kalimat.
3. Tingkat kesulitan butir soal.
4. Pembuatan butir soal.
5. Kedwimukaan (ambiguity).
6. Butir soal kurang baik.
7. Butir soal terlalu pendek.
8. Penyusunan butir soal dalam tes.
9. Pola-pola jawaban.

Unreliability suatu tes dapat disebabkan oleh dua macam faktor yaitu:
 Situasi pada waktu testing berlagsung
Hal ini mencakup keadaan jasmaniah dan rohaniah dari anak. Misalnya
Anak tidak dalam kondisi tubuh yang baik atau kurang sehat, Menghadapi tes
dengan perasaan takut, Mengerjakan tes dengan gugup, atau terburu-buru, Tidak
mengerjakan tes dengan sepenuh hati, Dan lain sebagainya.
 Keadaan tes itu sendiri
Hal ini berhubungan dengan kualitas dari soal-soal tes tersebut. Mengenai
kualitas dari tes-item ini misalnya Pertanyaan-pertanyaan yang bersifat ambigous,
yaitu pertanyaan-pertanyaan yang memungkinkan banyak tafsiran dan banyak
jawaban. Pertanyaan-pertanyaan yang mungkin tidak dapat dijawab, sebab kurang
memberikan keterangan-keterangan yang lengkap.
Untuk mengatasi hal ini, pertama, seseorang yang akan menyusun tes
harus benar-benar menguasai bahan yang akan diteskan dengan mendalam,
dengan sempurna. Kedua, seseorang yang menyusun tes harus menguasai teknik-
teknik bagaimana cara membuat soal-soal atau pertanyaan-pertanyaan.

F. Uji Validitas dan Reliabilitas


Teknik yang digunakan untuk mengetahui kesejajaran adalah teknik
korelasi product moment yang dikemukakan oleh Pearson.
Rumus korelasi product moment ada dua macam, yaitu:
a. Korelasi product moment dengan simpangan, dan
b. Korelasi product moment dengan angka kasar.
Rumus korelasi product moment dengan simpangan;
rxy = ∑xy
√(∑x2) (∑y2)
Dimana:
rxy = koefisien korelasi antara variable X dan variable Y, dua variable yang
dikorelasikan 9x = X-X dan y = Y-Y)
∑xy = jumlah perkalian x dengan y
X2 = kuadrat dari x
Y2 = kuadrat dari y

Contoh perhitungan:
Misalnya akan menghitung validitas tes prestasi belajar matematika.
Sebagai kriterium diambil rata-rata ulangan yang akan dicari validitasnya diberi
kode X dan rata-rata nilai harian diberi kode Y. kemudian dibuat table persiapan
sebagai berikut:
TABEL PERSIAPAN UNTUK MENCARI VALIDITAS
TES PRESTASI MATEMATIKA
No Nama X Y x y x2 y2 xy
1. Nadia 6,5 6.3 0 -0,1 0,0 0,01 0,0
2. Susi 7 6,8 +0,5 +0,4 0,25 0,16 +0,2
3. Cecep 7,5 7,2 +1,0 +0,8 1,0 0,64 +0,8
4. Erna 7 6,8 +0,5 +0,4 0,25 0,16 +0,2
5. Dian 6 7 -0,5 +0,6 0,25 0,36 -0,3
6. Asmara 6 6,2 -0,5 -0,2 0,25 0,04 +0,1
7. Siswoyo 5,5 5,1 -0,1 -1,3 1,0 1,69 +1,3
8. Jihad 6,5 6 0 -0,4 0,0 0,16 0,0
9. Yanna 7 6,5 +0,5 +0,1 0,25 0,01 +0,05
10. Lina 6 5,9 -0,5 -0,6 0,25 0,36 +0,3
Jumlah 65,0 63,8 3,5 3,59 2,65

X = ∑X = 65,0 = 6,5
N
Y = ZY = 63,8 = 6,38 dibulatkan 6,4
N
x=X–X
y=Y–Y
dimasukkan ke rumus:
rxy = ∑xy
√(∑x2) (∑y2)
= 2,65 = 2,65
√ 3,5 x 3,59 √ 12,565
= 2,65 = 0,748
3,545
Indeks korelasi anrara X dan Y inilah validitas soal yang dicari.
Rumus korelasi product moment dengan angka kasar:
rxy = N∑XY – (∑X) (∑Y)
√{N∑X2 – (∑X)2} {N∑Y2 – (∑Y)2}

Dimana:
rXY = koefisien korelasi antara variabel X dan variabel Y, variabel yang
dikorelasikan.
Dengan menggunakan data hasil tes prestasi matematika diatas kini
dihitung dengan rumus korelasi product moment dengan angka kasar yang tabel
persiapanya sebagai berikut.

TABEL PERSIAPAN UNTUK MENCARI VALIDITAS


TES PRESTASI MATEMATIKA
No Nama X Y X2 Y2 XY
1 Nadia 6,5 6,3 42,25 39,69 40,95
2 Susi 7 6,8 49 46,24 47,6
3 Cecep 7,5 7,2 56,25 51,84 54,0
4 Erna 7 6,8 49 46,24 47,6
5 Dian 6 7 36 49 42
6 Asmara 6 6,2 36 38,44 37,2
7 Siswoyo 5,5 5,1 30,25 26,01 28,05
8 Jihad 6,5 6 42,25 45,5 39
9 Yanna 7 6,5 49 36 45,5
10 Lina 6 5,9 36 34,81 35,4
Jumlah 65,0 63,8 426,0 410,52 417,3

Dimasukkan kedalam rumus:


rxy = N∑XY – (∑X) (∑Y)
√{N∑X2 – (∑X)2} {N∑Y2 – (∑Y)2}

, – ( , )
rxy =
( – ) ( , – , )


=
( ) ( , – , )

=
√ ,

=
√ ,

= = 0,745
,

Jika, diperbandingkan dengan validitas soal yang dihitung dengan rumus


simpangan, ternyata terdapat perbedaan sebesar 0,33 lebih besar yang dihitung
dengan rumus simpangan. Hal ini wajar karena dalam mengerjakan perkalian atau
penjumlahan jika diperoleh 3 atau angka di belakang koma dilakukan pembulatan
ke atas. Perbedaan ini sangat kecil sehingga dapat diabaikan.
Untuk memperjelas pengertian tersebut dapat disampaikan keterangan
sebagai berikut.
- Korelasi positif menunjukkan adanya hubungan sejajar antara dua hal.
Misalnya hal pertama nilainya naik, hal kedua ikut naik. Sebaiknya jika
hal pertama turun.
Contih korelasi positif antara nilai IPA dan Matematika.
IPA : 2 3 5 7 4 3 2
Matematika : 4 5 6 8 5 4 3
Kondisi nilai matematika sejajar dengan IPA karena naik dan turunnya
nilai matematika mengikuti naik dan turunnya nilai IPA. Coba perhatikan.
- Korelasi negatif menunjukkan adanya hubungan kebalikan antara dua hal.
Misalnya hal pertama nilainya naik, justru yang kedua turun. Sebaliknya
jika yang pertama turun, yang kedua naik.
Contoh korelasi negatif antara nilai Bahasa Indonesia dengan Matematika.
Bahasa Indonesia : 5 6 8 4 3 2
Matematika : 8 7 5 1 2 3

Keadaan hubungan antara dua halyang kita jumpai dalam kehidupan


sehari-hari tidak selalu positif atau negatif saja, tetapi mungkin 0. Besarnya
korelasi pun tidak menentu. Coba cermatilah bagaimana hubungan antara dua
nilai mata pelajaran A dan B berikut ini.
Contoh korelasi tidak tertentu.
NIlai A : 5 6 4 7 3 8 7
Nilai B : 4 4 3 7 4 9 4
Keadaan kedua nilai tersebut jika dihitung dengan rumus korelasi mungkin
positif mungkin negatif. Coba hitunglah!
Koefisien korelasi selalu terdapat antara -1,00 sampai +1,00. Namun
karena dalam menghitung sering dilakukan pembulatan angka-angka, sangat
mungkin diperoleh koefisien lebih dari 1,00. Koefisien negative menunjukkan
hubungan kebalikan sedangkan koefisien positif menunjukkan adanya kesejajaran
untuk mengadakan interpretasi mengenai besarnya koefisien korelasi adalah
sebagai berikut:
» antara 0,800 samapi dengan 1,00 : sangat tinggi
» antara 0,600 sampai dengan 0,800 : tinggi
» antara 0,400 sampai dengan 0,600 : cukup
» antara 0,200 sampai dengan 0,400 : rendah
» antara 0,00 sampai dengan 0,200 : sangat rendah
Penafsiran harga koefisien korelasi ada dua cara yaitu:
 Dengan melihat harga r dan diinterpretasikan misalnya korelasi tinggi,
cukup, dan sebagainya.
 Dengan berkonsultasi ke table harga kritik r product moment sehingga
dapat diketahui signifikan tidaknya korelasi tersebut. Jika harga r lebih
kecil dari harga kritik dalam table, maka korelasi tersebut tidak signifikan.
Begitu juga arti sebaliknya
Tiga tehnik pengujian realibilitas instrument antara lain :
a. Teknik Paralel (Paralel Form atau Alternate Form)
Teknik paralel disebut juga tenik ”double test double trial”. Sejak awal
peneliti harus sudah menyusun dua perangkat instrument yang parallel
(ekuivalen), yaitu dua buah instrument yang disusun berdasarkan satu buah
kisi-kisi. Setiap butir soal dari instrument yang satu selalu harus dapat
dicarikan pasangannya dari instrumen kedua. Kedua instrumen tersebut
diujicobakan semua. Sesudah kedua uji coba terlaksana, maka hasil instrumen
tersebut dihitung korelasinya dengan menggunakan rumus product moment
(korelasi Pearson).
b. Teknik Ulang (Test Re-test)
Disebut juga teknik ”single test double trial”. Menggunakan sebuah
instrument, namun dites dua kali. Hasil atau skor pertama dan kedua
kemudian dikorelasikan untuk mengetahui besarnya indeks reliabilitas. Teknik
perhitungan yang digunakan sama dengan yang digunakan pada teknik
pertama yaitu rumus korelasi Pearson. Menurut Saifuddin Azwar, realibilitas
tes-retest adalah seberapa besat derajat skor tes konsisten dari waktu ke waktu.
Realibilitas diukur dengan menentukan hubungan antara skor hasil penyajian
tes yang sama kepada kelompok yang sama, pada waktu yang berbeda.
Metode pengujian reliabilitas stabilitas yang paling umum dipakai
adalah metode pengujian tes-kembali (test-retest). Metode test-retest
menggunakan ukuran atau “test” yang sama untuk variable tertentu pada satu
saat pengukuran yang diulang lagi pada saat yang lain. Cara lain untuk
menunjukkan reliabilitas stabilitas, bila kita menggunakan survai, adalah
memasukkan pertanyaan yang sama di dua bagian yang berbeda dari
kuesioner atau wawancara. Misalnya the Minnesota Multiphasic Personality
Inventory (MPPI) mengecek reliabilitas test-retest dalam satu kuesionernya
dengan mengulang pertanyaan tertentu di bagian-bagian yang berbeda dari
kuesioner yang panjang.
Kesulitan terbesar untuk menunjukkan reliabilitas stabilitas adalah
membuat asumsi bahwa sifat/ variable yang akan diukur memang benar-benar
bersifat stabil sepanjang waktu. Karena kemungkinan besar tidak ada ukuran
yang andal dan sahih yang tersedia. Satu-satunya faktor yang dapat membuat
asumsi-asumsi ini adalah pengalaman, teori dan/atau putusdan terbaik. Dalam
setiap kejadian, asumsi ini selalu ditantang dan sulit rasanya mempertahankan
asumsi tersebut atas dasar pijakan yang obyektif.
c. Teknik Belah Dua (Split Halve Method)
Disebut juga tenik “single test single trial”. Peneliti boleh hanya
memiliki seperangkat instrument saja dan hanya diujicobakan satu kali,
kemudian hasilnya dianalisis, yaitu dengan cara membelah seluruh instrument
menjadi dua sama besar. Cara yang diambil untuk membelah soal bisa dengan
membelah atas dasar nomor ganjil-genap, atas dasar nomor awal-akhir, dan
dengan cara undian. Menurut Saifuddin Azwar, realibilitas ini diukur dengan
menentukan hubungan antara skor dua paruh yang ekuivalen suatu tes, yang
disajikan kepada seluruh kelompok pada suatu saat. Karena reliabilitas belah
dua mewakili reliabilitas hanya separuh tes yang sebenarnya, rumus
Spearman-Brown dapat digunakan untuk mengoreksi koefisien yang didapat.
BAB III
PENUTUP
A. Kesimpulan
Validitas adalah sutu ukuran yang menunjukkan tingkat ke validan atau
kesahihan suatu instrmen. Suatu instrumen yang valid itu mempunyai validitas
yang tinggi dan sebaliknya bila tingkat validitasnya rendah maka instrumen
tersebut kurang valid. Sebuah instrumen dikatakan valid apabla mampu
mengukur apa yang hendak diukur/ diinginkan. Sebuah instrumen dikatan
valid apabila bisa mengungkap data dari variabel yang diteliti. Reliabilitas
adalah indeks yang menunjukan sejauh mana suatu alat ukur dipercaya atau
dapat diandalkan. Reliabilitas mengacu pada keajegan hasil evaluasi, yakni
konsistensi skor tes (test score) dari masa ke masa.jika seorang guru
memperoleh skor yang sama pada tes yang sama pada kelompok siswa yang
sama pada waktu yang berbeda, maka dia dapat menyimpulkan bahwa hasil
tes itu memiliki derajat reliabilitas tes yang tinggi dari suatu masa ke masa.
Validitas dan reliabilitas adalah parameter penelitian dan tes. Oleh
karena itu, agar penelitian dapat digunakan, kedua aspek ini harus ada di sana.
Perbedaan antara validitas dan reliabilitas adalah bahwa validitas mengacu
pada sejauh mana suatu langkah tes, dan apa yang diklaim untuk mengukur
sedangkan reliabilitas mengacu pada konsistensi hasil tes. Namun, ketika
penelitian atau tes valid, maka data tersebut dapat diandalkan. Namun, jika tes
itu bisa diandalkan, itu tidak bisa berarti bahwa tes itu valid.
DAFTAR PUSTAKA

Anonym. 2013. VALIDITAS DAN RELIABILITAS. (Online).


https://merlitafutriana0.blog spot.com/p/validitas-dan-reliabilitas.html.
(Diakses pada 15 Februari 2020).
Arikunto, Suharini. 2005. Dasar-dasar Evaluasi Pendidikan. Jakarta : Bumi
Aksara.
Hadi Sutrisno. 1998. Metodologi Research. Yogyakarta: BPFE.
Machomanid. 2015. VALIDITAS DAN RELIABILITAS TES. (Online). https://
pak-boedi.blogspot.com/2015/09/makalah-evaluasi-pembelajaran-validitas.
html. (Diakses pada 15 Februari 2020).
Oktaviandy, Navel. 2012. Reliabilitas, Kepraktisan, Dan Efek Potensial
Suatu Instrumen. (Online). https://navelmangelep.wordpress.com/2012/04/
03/reliabilitas-kepraktisan-dan-efek-potensial-suatu-instrumen/#more-709.
(Diakses pada 15 Februari 2020).
Sudijono, Anas. 1996. Pengantar Evaluasi Pendidikan. Jakarta: PT Raja Grafindo
Persada.
Thoha, M. Chabib. 2003. Teknik Evaluasi Pendidikan. Jakarta: PT Raja Grafindo
Persada.
Santoso, Singgih. 2003. Mengatasi Berbagai Masalah Statistik, Jakarta :
Gramedia.
Sugiyono. 2003. Statistik Untuk Penelitian, Bandung: Alfabeta.
Wahyuni, N. 2014. Uji Validitas dan Reliabilitas. (Online). https://qmc.binus.
ac.id/2014/11/01/u-j-i-v-a-l-i-d-i-t-a-s-d-a-n-u-j-i-r-e-l-i-a-b-i-l-i-t-a-s/.
(Diakses pada 15 Februari 2020).
Winarsunu, Tulus. 2004. Statistik Dalam Penelitian Psikologi dan Pendidikan,
Malang: UMM Press.
Voelker, David H, dkk. 2004. Seri Matematika Keterampilan Statistika, Bandung:
Pakar Raya.

Anda mungkin juga menyukai