Anda di halaman 1dari 19

MAKALAH EVALUASI PEMBELAJARAN FISIKA

Disusun untuk memenuhi Mata KuliahEvaluasi Pembelajaran Fisika

Dosen Pengampu : Dr. Nonoh Siti Aminah, M.Pd

Disusun oleh :

1. Agung Adi Nugroho (K2315006)


2. Hanung Vernanda P (K2315032)
3. Yuli Julaila (K2315060)

PROGRAM STUDI PENDIDIKAN FISIKA


FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN
UNIVERSITAS SEBELAS MARET
SURAKARTA
2017
VALIDITAS DAN RELIABILITAS
BAB I

PENDAHULUAN
Dalam penelitian pendidikan khususnya penelitian kuantitatif dikenal dengan nama
variabel, misalnya variabel laten, variabel manifes dan sebagainya. Variabel inilah yang pada
umumnya ingin diketahui karakteristik yang dimilikinya, misalnya rata-rata, median, modus,
standar deviasi dan lain-lain. Untuk mengukur suatu variabel diperlukan alat ukur yang biasa
disebut instrumen. Djaali (2000: 9) menyatakan bahwa secara umum yang dimaksud dengan
instrumen adalah suatu alat yang karena memenuhi persyaratan akademis maka dapat
dipergunakan sebagai alat untuk mengukur suatu obyek ukur atau mengumpulkan data
mengenai suatu variabel.
Nurkancana (1992: 141) menyatakan bahwa suatu alat pengukur dapat dikatakan alat
pengukur yang valid apabila alat pengukur tersebut dapat mengukur apa yang hendak diukur
secara tepat. Dalam hal validitas dan reliabilitas, tentunya dipengaruhi oleh (1) instrumen, (2)
subjek yang diukur, dan (3) petugas yang melakukan pengukuran. Dalam hal pengukuran,
khususnya dalam pendidikan tentunya yang terpenting adalah informasi hasil ukur yang
benar. Sebab dengan hasil ukur yang tidak atau kurang tepat maka akan memberikan
informasi yang tidak benar, sehingga kesimpulan yang diambil juga tidak benar.
BAB II
PEMBAHASAN

A. Validitas
1. Pengertian
Azwar (1987: 173) menyatakan bahwa validitas berasal dari kata validity
yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu instrumen
pengukur (tes) dalam melakukan fungsi ukurnya. Suatu tes dikatakan memiliki
validitas yang tinggi apabila alat tersebut menjalankan fungsi ukur secara tepat atau
memberikan hasil ukur yang sesuai dengan maksud dilakukannya pengukuran
tersebut. Artinya hasil ukur dari pengukuran tersebut merupakan besaran yang
mencerminkan secara tepat fakta atau keadaan sesungguhnya dari apa yang diukur.
Suryabrata (2000: 41) menyatakan bahwa validitas tes pada dasarnya
menunjuk kepada derajat fungsi pengukurnya suatu tes, atau derajat kecermatan
ukurnya sesuatu tes. Validitas suatu tes mempermasalahkan apakah tes tersebut
benar-benar mengukur apa yang hendak diukur. Maksudnya adalah seberapa jauh
suatu tes mampu mengungkapkan dengan tepat ciri atau keadaan yang sesungguhnya
dari obyek ukur, akan tergantung dari tingkat validitas tes yang bersangkutan.
Sudjana (2004: 12) menyatakan bahwa validitas berkenaan dengan ketepatan alat
penilaian terhadap konsep yang dinilai sehingga betul-betul menilai apa yang
seharusnya dinilai.
Validitas berkenaan dengan ketepatan alat ukur terhadap konsep yang
diukur, sehingga betul-betul mengukur apa yang seharusnya diukur. Validitas
merupakan suatu ukuran yang menunjukkan kevalidan atau kesahihan suatu
instrument. Jadi pengujian validitas itu mengacu pada sejauh mana suatu instrument
dalam menjalankan fungsi. Instrument dikatakan valid jika instrument tersebut dapat
digunakan untuk mengukur apa yang hendak diukur. Sebagai contoh, ingin
mengukur kemampuan siswa dalam matematika. Kemudian diberikan soal dengan
kalimat yang panjang dan yang berbelit-belit sehingga sukar ditangkap maknanya.
Akhimya siswa tidak dapat menjawab, akibat tidak memahami pertanyaannya.
Contoh lain, peneliti ingin mengukur kemampuan berbicara, tapi ditanya mengenai
tata bahasa atau kesusastraan seperti puisi atau sajak. Pengukur tersebut tidak tepat
(valid). Validitas tidak berlaku universal sebab bergantung pada situasi dan tujuan
penelitian. Instrumen yang telah valid untuk suatu tujuan tertentu belum otomatis
akan valid untuk tujuan yang lain.

Tiga ciri validitas, yaitu :

 Bersifat Relatif

 Bukan merupakan sifat yang menetap pada alat ukur

 Merupakan sejauh mana alat itu valid mengukur apa yang ingin diukur, bukan
masalah valid/tidak valid

2. Macam-macam Validitas
Konsep validitas tes dapat dibedakan atas tiga macam yaitu validitas isi
(content validity), validitas konstruk (construct validity), dan validitas empiris atau
validitas kriteria. Validitas isi suatu tes mempermasalahkan seberapa jauh suatu tes
mengukur tingkat penguasaan terhadap isi atau konten atau materi tertentu yang
seharusnya dikuasai sesuai dengan tujuan pengajaran. Dengan kata lain tes yang
mempunyai validitas isi yang baik ialah tes yang benar-benar mengukur penguasaan
materi yang seharusnya dikuasai sesuai dengan konten pengajaran yang tercantum
dalam Garis-garis Besar Program Pengajaran (GBPP).
1) Validitas Logis
Istilah ”validitas logis” mengandung kata ”logis” berasal dari kata
”logika”, yang berarti penalaran. Dengan demikian validitas logis menunjuk
pada kondisi instrumen valid berdasarkan hasil penalaran. Ada dua macam
validitas logis yang dapat dicapai oleh sebuah instrumen, yaitu: validitas isi
(content validity) dan validitas konstruk (construct validity).
a. Validitas Isi (Content Validity)
Validitas isi berkenaan dengan kesanggupan instrumen mengukur
isi yang harus diukur. Artinya, alat ukur tersebut mampu mengungkap isi
suatu konsep atau variabel yang hendak diukur. Misalnya tes hasil belajar
bidang studi IPS, harus bisa mengungkap isi bidang studi tersebut. Hal ini
bisa dilakukan dengan cara menyusun tes yang bersumber dari kurikulum
bidang studi yang hendak diukur. Validitas isi menunjukkan sejauhmana
pertanyaan, tugas atau butir dalam suatu tes atau instrumen mampu
mewakili secara keseluruhan dan proporsional perilaku sampel yang
dikenai tes tersebut. Artinva tes itu valid apabila butir-butir tes itu
mencerminkan keseluruhan konten atau materi yang diujikan atau yang
seharusnya dikuasai secara proporsional.
Untuk mengetahui apakah tes itu valid atau tidak, harus dilakukan
melalui penelaahan kisi-kisi tes untuk memastikan bahwa soal-soal tes itu
sudah mewakili atau mencerminkan keseluruhan konten atau materi yang
seharusnya dikuasai secara proporsional. Oleh karena itu validitas isi
suatu tes tidak mempunyai besaran tertentu yang dihitung secara statistika
tetapi dipahami bahwa tes itu sudah valid berdasarkan telaah kisi-kisi tes.
Oleh karena itu, validitas isi sebenarriya mendasarkan pada analisis
logika, tidak merupakan suatu koefisien validitas yang dihitung secara
statistika
Cara Yang ditempuh dalam menetapkan sampel tes adalah
memilih konsep-konsep yang esensial dari materi yang di dalamnya.
Misalnya menetapkan sejumlah konsep dari setiap pokok 2 bahasan yang
ada. Dari setiap konsep dikembangkan beberapa pertanyaan tes (lihat
bagan). Di sinilah pentingnya peranan kisi-kisi sebagai alat untuk
memenuhi validitas isi.
b. Validitas Bangun Pengertian / Konstruk (Construct Validity)
Validitas konstruk (construct validity) adalah validitas yang
mempermasalahkan seberapa jauh butir-butir tes mampu mengukur apa
yang benar-benar hendak diukur sesuai dengan konsep khusus atau
definisi konseptual yang telah ditetapkan. Validitas konstruk biasa
digunakan untuk instrumen yang dimaksudkan mengukur variabel konsep,
baik yang sifatnya performansi tipikal seperti instrumen untuk mengukur
sikap, minat konsep diri, lokus kontrol, gaya kepemimpinan, motivasi
berprestasi, dan lain-lain, maupun yang sifatnya performansi maksimum
seperti instrumen untuk mengukur bakat (tes bakat), inteligansi
(kecerdasan intelektual), kecerdasan, emosional dan lain-lain.
Setiap konsep harus dikembangkan indikator-indikatomya agar
mudah dipelajari. Dengan adanya indikator dari setiap konsep maka
bangun pengertian akan nampak dan memudahkan dalam menetapkan
cara pengukuran. Untuk variabel tertentu, dimungkinkan penggunaan alat
ukur yang beraneka ragam dengan cara mengukurnya yang berlainan.
Menetapkan indikator suatu konsep dapat dilakukan dalam dua cara, yakni
(a) menggunakan pemahaman atau logika berpikir atas dasar teori
pengetahuan ilmiah dan (b) menggunakan pengalaman empiris, yakni apa
yang terjadi dalam kehidupan nyata.
Contoh: Konsep mengenai “Hubungan Sosial”, dilihat dari
pengalaman, indikatornya empiris adalah keterkaitan dari :
 bisa bergaul dengan orang lain
 disenangi atau banyak teman-temannya
 menerima pendapat orang lain - tidak memaksakan pendapatnya
 bisa bekerja sama dengan siapa pun, dan lain-lain.
Mengukur indikator-indikator tersebut, berarti mengukur
bangun pengertian yang terdapat dalam konsep hubungan sosial. Contoh
lain: Konsep sikap dapat dilihat dari indikatornya secara teoretik
(deduksi teori) antara lain keterkaitan dari
 kesediaan menerima stimulus objek sikap
 kemauan mereaksi stimulus objek sikap
 menilai stimulus objek sikap
 menyusun/mengorganisasi objek sikap
 internalisasi nilai yang ada dalam objek sikap.
Apabila hasil tes menunjukkan indikator-indikator tes yang
tidak berhubungan secara positif satu sama lain, berarti ukuran tersebut
tidak memiliki validitas bangun pengertian. Atas dasar itu indikatornya
perlu ditinjau atau diperbaiki kembali. Cara lain untuk menetapkan
validitas bangun pengertian suatu alat ukur adalah menghubungkan
(korelasi) antara alat ukur yang dibuat dengan alat ukur yang sudah
baku/standardized, seandainya telah ada yang baku. Bila menunjukkan
koefisien korelasi yang tinggi maka alat ukur tersebut memenuhi
validitasnya.

2) Validitas Empiris
Istilah “validitas empiris” memuat kata “empiris” yang artinya
“pengalaman”. Sebuah instrumen dapat dikatakan memiliki validitas empiris
apabila sudah diuji secara empiris. Validitas empiris sama dengan validitas
kriteria yang berarti bahwa validitas ditentukan berdasarkan kriteria, baik
kriteria internal maupun kriteria eksternal. Kriteria internal berarti tes atau
instrumen itu sendiri yang menjadi kriteria, sedangkan kriteria eksternal adalah
hasil ukur instrumen atau tes lain diluar instrumen itu sendiri yang menjadi
kriteria.
a. Validitas Internal
Validitas internal disebut pula sebagai validitas butir. Validitas
internal memperlihatkan seberapa jauh hasil ukur butir tersebut konsisten
dengan hasil ukur instrumen secara keseluruhan. Oleh karena itu, validitas
butir tercermin pada besaran koefisien korelasi antara skor butir dan skor
total instrumen. Jika koefisien korelasi antara skor butir dengan skor total
instrumen positif dan signifikan, maka butir tersebut dapat dianggap valid
berdasarkan ukuran validitas internal. Bryman17 mengungkapkan bahwa
“internal validity is common to refer to the factor that has a causal impact
as the independent variable and the effect as the dependent variable.”
Validitas internal pada umumnya merujuk pada faktor yang
memiliki pengaruh sebab sebagai variabel bebas dan akibat sebagai
variabel terikat. Untuk menghitung koefisien korelasi validitas antara
skor butir dan skor total pada skor butir kontinum, maka rumus yang
digunakan adalah Pearson Product Moment sedangkan pada skor butir
dikotomi, maka rumus yang digunakan adalah koefisien korelasi biserial.
Untuk lebih memahami perhitungan validitas internal, maka dapat dilihat
pada subbab pengujian validitas.
b. Validitas Eksternal
Validitas eksternal dapat dibagi menjadi dua, yaitu validitas
bandingan (concurrent validity) dan validitas ramalan (predictive
validity).
1) Validitas Bandingan (concurrent validity)
Validitas bandingan artinya kejituan daripada suatu tes dapat
dilihat dari korelasinya terhadap kecakapan yang telah dimiliki saat
kini secara riil. Cara yang digunakan untuk menilai validitas
bandingan adalah dengan cara mengkorelasikan hasil-hasil yang
dicapai dalam tes tersebut dengan hasil-hasil yang dicapai dalam tes
yang sejenis yang diketahui mempunyai validitas tinggi (misalnya tes
standar). Tinggi rendahnya koefisien korelasi yang diperoleh
menunjukkan tinggi rendahnya validitas tes yang akan kita nilai
kualitasnya.
2) Validitas Ramalan (Predictive Validity)
Validitas ramalan artinya dikaitkan dengan kriteria tertentu.
Dalam validitas ini yang diutamakan bukan isi tes tapi kriterianya,
apakah alat ukur tersebut dapat digunakan untuk meramalkan suatu
ciri atau perilaku tertentu atau kriteria tertentu yang diinginkan.
Misalnya alat ukur motivasi belajar, apakah dapat digunakan untuk
meramal prestasi belajar yang dicapai. Artinya terdapat hubungan
yang positif antara motivasi dengan prestasi. Dengan kata lain dalam
validitas ini mengandung ciri adanya relevansi dan keajegan atau
ketetapan (reliability). Motivasi dapat digunakan meramal prestasi
bila skor-skor yang diperoleh dari ukuran motivasi berkorelasi
positif dengan skor prestasi.
Validitas ramalan ini mengandung dua makna. Pertama
validitas jangka pendek dan kedua jangka panjang. Validitas jangka
pendek, artinya daya ramal alat ukur tersebut hanya untuk masa
yang tidak lama. Artinya, skor tersebut berkorelasi pada waktu yang
sama. Misalnya, ketetapan (reliability) terjadi pada semester dua
artinya daya ramal berlaku pada semester dua, dan belum tentu
terjadi pada semester berikutnya. Sedangkan validitas jangka
panjang mengandung makna skor tersebut akan berkorelasi juga di
kemudian hari.

Supaya lebih memperjelas perbedaan antara validitas isi, konstruksi,


konkuren, dan prediktif di atas, maka berikut merupakan penjelasanpenjelasan
singkat yang berkenaan dengan empat validitas tersebut yang diuraikan di dalam
tabel:
3. Cara Menentukan Validitas
Pada dasarnya terdapat dua macam instrumen, yaitu instrumen yang
berbentuk test untuk mengukur hasil belajar dan instrumen non test untuk mengukur
sikap. Instrumen yang berupa test, opsi jawabannya bersifat “benar atau salah”,
sedangkan instrumen sikap jawabannya tidak ada yang “salah atau benar” tetapi
bersifat “positif dan negatif”.
Perhitungan validitas dari sebuah instrumen dapat menggunakan rumus
korelasi product moment atau dikenal juga dengan korelasi pearson. Menghitung
harga korelasi setiap butir dengan rumus Pearson Product Moment:
Dimana :
rxy = koefisien korelasi
N = jumlah responden uji coba
X = skor tiap item
Y = skor seluruh item responden uji coba

Setelah harga koefisien validitas tiap butir soal diperoleh, kemudian hasil
diatas dibandingkan dengan nilai r dari tabel pada taraf signifikansi 5% dan taraf
signifikansi 1% dengan df= N-2. Jika r hitung > r tabel maka koefisien validitas butir
soal pada taraf signifikansi yang dipakai (r hitung > r tabel taraf sig 1% > r tabel
taraf sig 5% ).
Instrumen tes yang telah dinyatakan valid, dipakai untuk uji reliabilitas
lebih lanjut, sedangkan instrumen tes yang tidak valid boleh dibuang atau diperbaiki
dan diuji kembali validitasnya. Oleh karena itu, instrumen tes yang dibuat harus
memenuhi ketercakupan variabel penelitian, bahkan dibuat harus melebihi kriteria
tersebut dalam rangka mengantisipasi adanya tes yang terbuang dan tidak terpakai
nantinya.

4. Kegunaan Validitas
a. Untuk menghindari pertanyaan yang kurang jelas
b. Untuk meniadakan kata-kata yang terlalu asing atau kata-kata yang
menimbulkan kecurigaan
c. Untuk memperbaiki pertanyaan-pertanyaan yang kurang jelas
d. Untuk menambah item yang diperlukan atau meniadakan item yang dianggap
tidak relevan
e. Untuk mengetahui validitas kuesioner tersebut
B. Reliabilitas
1. Pengertian
Kata reliabilitas dalam bahasa Indonesia diambil dari kata reliability dalam
bahasa Inggris, berasal dari asal kata reliabel yang artinya dapat dipercaya.
Instrumen tes dikatakan dapat dipercaya jika memberikan hasil yang tetap apabila
diteskan berkali-kali. Jika kepada siswa diberikan tes yang sama pada waktu yang
berlainan, maka setiap siswa akan tetap berada dalam urutan yang sama atau ajeg
dalam kelompoknya.
Reliabilitas merujuk pada ketetapan/keajegan alat tersebut dalam menilai
apa yang diinginkan, artinya kemampuan alat tersebut digunakan akan memberikan
hasil yang relatif sama. Dalam http://wapedia.mobi/id reliabilitas, keandalan adalah
konsistensi dari serangkaian pengukuran atau serangkaian alat ukur. Hal tersebut
bisa berupa pengukuran dari alat ukur yang sama (tes dengan tes ulang) akan
memberikan hasil yang sama, atau untuk pengukuran yang lebih subjektif, apakah
dua orang penilai memberikan skor yang mirip (reliabilitas antar penilai).
Jadi, Reliabilitas merupakan alat ukur yaitu ketetapan atau keajegan alat
tersebut dalam mengukur apa yang diukurnya. Artinya, kapan pun alat ukur tersebut
digunakan akan memberikan hasil ukur yang sama. Contoh paling nyata adalah
timbangan atau meteran. Hal yang sama terjadi untuk alat ukur suatu gejala, tingkah
laku, ciri atau sifat individu dan lain-lain. Misalnya alat ukur prestasi belajar seperti
tes hasil belajar, alat ukur sikap, kuesioner dan lain-lain, hendaknya meneliti sifat
keajegan tersebut.
Tes hasil belajar dikatakan ajeg apabila hasil pengukuran saat ini
menunjukkan kesamaan hasil pada saat yang berlainan waktunya, terhadap siswa
yang sama. Misalnya siswa kelas V pada hari ini di tes kemampuan matematik.
Minggu berikutnya siswa tersebut di tes kembali. Hasil dari kedua tes relatif sama.
Sehingga masih mungkin terjadi ada perbedaan hasil untuk hal-hal tertentu akibat
faktor kebetulan, selang waktu, terjadinya perubahan pandangan siswa terhadap soal
yang sama. Jika ini terjadi, kelemahan terletak dalam alat ukur itu, yang tidak
memiliki kepastian jawaban atau meragukan siswa. Dengan kata lain derajat
reliabilitasnya masih rendah.
Di lain pihak perbedaan hasil pengukuran bukan disebabkan oleh alat
ukurnya, melainkan kondisi yang terjadi pada diri siswa. Misalnya fisik siswa dalam
keadaan sakit pada waktu tes yang pertama, motivasi pada waktu tes pertama
berbeda dengan motivasi tes pada berikutnya.
2. Macam-Macam Reliabilitas
Salah satu syarat agar hasil ukur suatu tes dapat dipercaya ialah tes tersebut
harus mempunyai reliabilitas yang memadai. Reliabilitas dibedakan menjadi dua,
yaitu:
a. Reliabilitas Tanggapan
Ada tiga mekanisme untuk memeriksa reliabilitas tanggapan responden
terhadap tes, yaitu:
(1) Teknik test-retest
Test-retest ialah pengetesan dua kali menggunakan suatu tes yang
sama pada waktu yang berbeda.
(2) Teknik belah dua
Teknik belah dua adalah prosedur konsistensi yang paling sederhana,
Pembagian tes yang dibuat menjadi dua bagian dan mengkorelasikan skor
individu ke dalam dua bagian. Peneliti memberikan tes menjadi satu
kelompok dan kemudian membagi item-item menjadi dua bagian,
menghasilkan skor untuk masing-masing individu dalam dua bagian, dan
menghitung koefisien korelasinya.
(3) Bentuk Ekivalen
Pada bentuk ini peneliti menggunakan bentuk penaksiran reliabilitas
ekivalen ketika subjek akan ditarik tanggapan ke dalam item tes. Peneliti
mengkorelasikan hasil-hasil secara bergantian dari tes yang dilakukan pada
individu yang sama. Jika dua bentuk dilakukan pada waktu yang sama, hasil
koefisien reliabilitas disebut dengan koefisien ekivalen.
b. Reliabilitas konsistensi gabungan item
Reliabilitas konsistensi gabungan item berkaitan dengan kemantapan
atau konsistensi antara item-item suatu tes. Jika terhadap bagian objek ukur yang
sama, hasil ukur melalui item yang satu kontradiksi atau tidak konsisten dengan
hasil ukur melalui item yang lain maka pengukuran dengan tes (alat ukur sebagai
suatu kesatuan itu tidak dapat dipercaya).
Dengan kata lain tidak reliabel dan tidak dapat digunakan untuk
mengungkap ciri atau keadaan yang sesungguhnya dari objek ukur.26 Kalau hasil
pengkuran pada bagian objek ukur yang sama antara item yang satu dengan item
yang lain saling kontradiksi atau tidak konsisten maka kita jangan menyalahkan
objek ukur, melainkan alat ukur yang dipermasalahkan, dengan mengatakan
bahwa tes tersebut tidak reliabel terhadap objek ukur yang diukur. Koefisien
reliabilitas konsistensi gabungan item dapat dihitung menggunakan:
(1) Rumus Kuder-Richardson, yang dikenal dengan nama KR-20 dan KR-21
(2) Rumus koefisien Alpha Cronbach
(3) Rumus reliabilitas Hoyt.

3. Faktor-Faktor yang Mempengaruhi Reliabilitas


Dalam mengestimasi reliabilitas tes ada beberapa faktor yang dapat
mempengaruhi reliabilitas tes, sehingga tes tersebut tidak reliabel. Pada umumnya,
dalam pendidikan reliabilitas sebuah tes dipengaruhi oleh adanya perbedaan
individual.
Terkadang reliabilitas dipengaruhi oleh faktor yang permanen ataupun
faktor yang terjadi karena faktor sementara seperti karena kelelahan, menerka, atau
pengaruh latihan Selanjutnya, Donald28, dkk., menggambarkan faktor-faktor yang
turut mempengaruhi reliabilitas instrumen penelitian:

4. Uji Reliabilitas
Item intrumen yang valid sudah tentu reliabel. Namun reliabilitas instrumen
yang sudah diketahui harus terlebih dahulu diuji secara empiris, agar diketahui
besarnya koefisien reliabilitas. Berikut merupakan langkahlangkah uji reliabilitas 8
item pertanyaan dengan responden 10 orang menggunakan rumus Alpha Cronbach.
Ada tiga cara pelaksanaan untuk menguji reliabilitas suatu tes, yaitu: (1) tes
tunggal (single test), (2) tes ulang (test retest), dan (3) tes ekuivalen (alternate test).
Secara internal reliabilitas instrument dapat diuji dengan menganalisis konsistensi
butir-butir yang ada pada instrument dengan teknik tertentu. Adapun tolak ukur
untuk menginterpretasikan derajat reliabilitas instrument yang diperoleh sesuai
dengan tabel berikut:
Interpretasi Reliabilitas

a. Reliabilitas Tes Tunggal (Internal Consistency Reliability)


Tes tunggal adalah tes yang terdiri dari satu set yang diberikan
terhadap sekelompok subjek dalam satu kali pengetesan, sehingga dari hasil
pengetesan hanya diperoleh satu kelompok data. Ada dua teknik untuk
perhitungan reliabilitas tes, yaitu:
1) Teknik Belah Dua (Split-Half Technique).
Dilakukan dengan cara membagi tes menjadi dua bagian yang
relatif sama (banyaknya soal sama), sehingga masing-masing testi
mempunyai dua macam skor, yaitu skor belahan pertama (awal / soal
nomor ganjil) dan skor belahan kedua (akhir / soal nomor genap).
Koefisien reliabilitas belahan tes dinotasikan dengan 𝑟11 dan dapat
22

dihitung dengan menggunakan rumus korelasi angka kasar Pearson.


Selanjutnya koefisien reliabilitas keseluruhan tes dihitung menggunakan
formula Spearman-Brown, yaitu:
2𝑟11
22
𝑟11 =
1 + 𝑟11
22
Kategori koefisien reliabilitas (Guilford, 1956: 145) adalah
sebagai berikut: 0,80 < r11 1,00 reliabilitas sangat tinggi 0,60 < r11 0,80
reliabilitas tinggi 0,40 < r11 0,60 reliabilitas sedang 0,20 < r11 0,40
reliabilitas rendah -1,00 r11 0,20 reliabilitas sangat rendah (tidak
reliable).
2) Teknik Non Belah Dua (Non Split-Half Technique).
Salah satu kelemahan perhitungan koefisien reliabilitas dengan
menggunakan teknik belah dua adalah (1) banyaknya butir soal harus
genap, dan (2) dapat dilakukan dengan cara yang berbeda sehingga
menghasilkan nilai yang berbeda pula. Untuk mengatasi masalah tersebut
dapat dilakukan dengan menggunakan teknik non belah dua. Untuk
perhitungan koefisien reliabilitas dapat dilakukan dengan menggunakan
rumus Kuder-Richardson (KR-20) yaitu:

dengan
n adalah banyaknya butir soal
pi adalah proporsi banyak subjek yang menjawab benar pada butir soal ke-i
qi adalah proporsi banyak subjek yang menjawab salah pada butir soal ke-i
st2 adalah varians skor total.
Atau rumus Kuder-Richadson (KR-21), yaitu:

dengan
r11 adalah koefisien reliabilitas
n adalah banyaknya butir soal
𝑥̅𝑡 adalah rata-rata skor total
st2 adalah varians skor total.

3) Reliabilitas Tes Uraian


Untuk menghitung reliabilitas tes bentuk uraian dapat dilakukan
dengan menggunakan rumus Cronbach-Alpha, yaitu:
dengan:
r11 adalah koefisien reliabilitas n adalah banyaknya butir soal.
S12 adalah varians skor soal ke-i.
st2 adalah varians skor total.
BAB III
KESIMPULAN

Validitas dan reliabilitas merupakan syarat mutlak bagi alat ukur untuk mengukur
sikap beberapa orang responden dalam penelitian. Validitas digunakan untuk mengetahui
ketepatan dan kecermatan suatu instrumen tes/item pertanyaan yang diberikan. Item yang
valid adalah item yang dapat mengukur apa yang hendak diukur. Sedangkan reliabilitas
adalah keajekan (konsistensi) bila mana tes tersebut diuji berkali-kali hasilnya relatif sama,
artinya setelah hasil tes yang pertama dengan tes yang berikutnya dikorelasikan terdapat hasil
korelasi yang signifikan.
Validitas suatu tes dapat dilihat melalui penalaran (logis) maupun melalui fakta-
fakta empiris.
Validitas logis dapat ditinjau dari isi dan susunan tes, dimana instrumen tes harus
linier dengan isi/pelajaran dan sesuai dengan tujuan instruksional khusus yang telah
dirumuskan sebelumnya. Kemudian untuk membuat susunan butir-butir tes yang dikatakan
valid adalah mendasarkannya dengan susunan indikator-indikator yang telah dirumuskan.
Contoh dari validitas logis adalah validitas isi dan validitas konstruk. Kemudian validitas
empiris merupakan validitas yang dapat diuji secara empiris. Instrumen diuji melalui metode
statistika.
Validitas empiris dapat dibagi menjadi dua, yaitu validitas internal dan validitas
eksternal. Validitas internal memperlihatkan seberapa jauh hasil ukur setiap butir tes
konsisten dengan hasil ukur instrumen secara keseluruhan. Sedangkan validitas eksternal
adalah hasil ukur instrumen atau tes lain diluar instrumen itu sendiri yang menjadi kriteria.
Contoh dari validitas eksternal adalah validitas konkuren (bandingan) dan validitas prediktif.
Sedangkan reliabilitas dibagi menjadi dua, yaitu: reliabilitas tanggapan dan reliabilitas
konsistensi gabungan item.
Instrumen yang valid dan reliabel merupakan syarat untuk memperoleh data-data
yang valid. Data-data ini yang kemudian dianalisis dalam rangka mencari kesimpulan
penelitian. Kesimpulan yang akan menentukan ditolaknya hipotesis nol atau diterimanya
hipotesis nol
DAFTAR PUSTAKA

Azwar, Saifuddin. Sikap Manusia Teori dan Pengukurannya. Liberty: Yogyakarta, 1988.

Matondang, Zulkifli. 2009. Validitas Dan Reliabilitas Suatu Instrumen Penelitian. Medan:
Jurnal Tabularasa Pps Unimed. Vol.6 No.1: 88-90.

Suryabrata, Sumadi. 2000. Pengembangan Alat Ukur Psikologis. Yogyakarta: Andi.

Sujarwadi, Sri. 2011. Validitas Dan Reliabilitas Instrumen Penelitian. Jakarta: UNEJ.

Anda mungkin juga menyukai