Anda di halaman 1dari 35

VALIDITAS DAN RELIABILITAS

Validitas dan reliabilitas menjadi bahasan utama dalam setiap pengukuran


dalam penelitian. Keduanya berfokus bagaimana menciptakan pengukuran
yang terhubung dengan konstruk yang diukur. Reliabilitas dan validitas
menjadi hal yang sangat penting karena konstruk pada teori sosial seringkali
ambigu, membingungkan dan sering kali tidak dapat secara langsung
teramati. Semua peneliti sosial ingin pengukuran yang mereka lakukan
memiliki validitas dan reliabilitas yang baik, lantas apa yang
dimaksud validitas dan reliabilitas ? dan bagaimana, apa, kapan
mereka berfungsi dengan baik? Berikut ulasan beberapa pertanyaan
yang mungkin dapat sedikit membantu kita untuk dapat memahami validitas
dan reliabilitas.
1. Apakah fungsi Pengukuran Psikologi ?
Hasil-hasil yang diperoleh dalam pengukuran psikologis berfungsi sebagai
dasar dalam mengambil keputusan. Berdasarkan atas keputusan yang akan
diambil dalam pengukuran psikologis. Fungsi pengukuran psikologis antara
lain :
a)

Fungsi seleksi, yaitu untuk memutuskan individu-individu yang akan


dipilih. Misalnya tes masuk untuk suatu lembaga pendidikan atau tes seleksi

untuk suatu jenis jabatan tertentu.


b) Fungsi klasifikasi, yaitu mengelompok-mengelompokkan inidvidu dalam
kelompok sejenis. Misalnya mengelompokkan siswa yang mempunyai
masalah yang sejenis sehingga dapat diberikan bantuan yang sesuai
masalahnya.
c)

Atau

mengelompokkan

siswa

ke

program

yang

khusus

tertentu.
Fungsi deskripsi, yaitu menyuguhkan hasil pengukuran psikologis yang
telah dilkukan tanpa kalsifikasi tertentu. Misalnya melaporkan profile minat

seseorang yang telah dites dengan tes minat.


d) Mengevaluasi suatu treatment, yaitu untuk mengetahui apakah suatu
tindakan tertentu yang telah dilakukan terhadap seseorang atau kelompok
individu telah mencapai hasil atau belum. Misalnya seorang siswa yang

mengalami kesulitan belajar diberikan remidial tersebut lalu diadakan tes


untuk mengetahui apakah remidial yang diberikan sudah berhasil atau
belum.
e) Menguji suatu hipotesis, yaitu untuk mengetahui apakah hipotesis yang
dikemukakan itu betul atau salah. Misalnya seorang peniliti mengemukakan
hipotesis sebagai berikut : makin terang lampu yang digunakan untuk belajar
makin baik prestasi belajar yang akan dicapai.
2. Who?
Tokoh pertama yang mendefinisikan reliabilitas adalah Spearmen-Brown
(Setyawan, 2011)
3. Apa yang dimaksud dengan validitas dan reliabilitas?
Reliabilitas

Reliabilitas berarti keandalan atau konsistensi. Hal ini menunjukkan bahwa


pengukuran atribut yang sama diulang akan memberikan hasil kondisi yang
identik

atau

sangat

mirip.

Reliabilitas

dalam

penelitian

kuantitatif

menunjukkan bahwa hasil numerik yang dihasilkan oleh suatu indikator tidak
berbeda karena karakteristik dari proses pengukuran atau instrumen
pengukuran itu sendiri. Kebalikan dari reliabilitas adalah pengukuran yang
memberikan hasil yang tidak menentu, tidak stabil, atau tidak konsisten
(Neuman, 2007).

Menurut Anastasi dan Urbina (1998) reliabilitas merujuk pada konsistensi


skor yang dicapai oleh orang yang sama ketika mereka diuji-ulang dengan
tes yang sama pada kesempatan yang berbeda, atau dengan seperangkat
butir-butir ekuivalen yang berbeda, ataupun dibawah kondisi pengujian yang
berbeda.

Reliabilitas berasal dari kata reliability yang berarti sejauh mana hasil suatu
pengukuran memiliki keterpercayaan, keterandalan, keajegan, konsistensi,
kestabilan yang dapat dipercaya. Hasil ukur dapat dipercaya apabiladalam

beberapakali pengukuran terhadap kelompok subjek yang sama diperoleh


hasil yang relatif sama (Azwar, 2011).
Validitas

Validitas menunjukkan keadaan yang sebenarnya dan mengacu pada


kesesuaian

antara

konstruk,

atau

cara

seorang

peneliti

mengkonseptualisasikan ide dalam definisi konseptual dan suatu ukuran. Hal


ini mengacu pada seberapa baik ide tentang realitas "sesuai" dengan realitas
aktual. Dalam istilah sederhana, validitas membahas pertanyaan mengenai
seberapa baik realitas sosial yang diukur melalui penelitian sesuai dengan
konstruk yang peneliti gunakan untuk memahaminya (Neuman, 2007).

Validitas yaitu mengenai apa dan seberapa baik suatu alat tes dapat
mengukur, sedangkan reliabilitas merujuk pada konsistensi skor yang dicapai
oleh orang yang sama ketika diuji berulang kali dengan tes yang sama pada
kesempatan yang berbeda, atau dengan seperangkat butir-butir ekuivalen
(equivalent items) yang berbeda, atau dibawa kondisi pengujian yang
berbeda (Anastasi & Urbina, 1998).

Azwar (1987, dalam Widodo, 2006) menyatakan bahwa validitas berasal dari
kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan
suatu instrumen pengukur (tes) dalam melakukan fungsi ukurnya. Suatu tes
dikatakan memiliki validitas yang tinggi apabila alat tersebut menjalankan
fungsi ukur secara tepat atau memberikan hasil ukur yang sesuai dengan
maksud

dilakukannya

pengukuran

tersebut.

Artinya

hasil

ukur

dari

pengukuran tersebut merupakan besaran yang mencerminkan secara tepat


fakta atau keadaan sesungguhnya dari apa yang diukur.

Suryabrata (2000, dalam Widodo, 2006) menyatakan bahwa validitas tes


pada dasarnya menunjuk kepada derajat fungsi pengukurnya suatu tes, atau
derajat

kecermatan

ukurnya

sesuatu

tes.

Validitas

suatu

tes

mempermasalahkan apakah tes tersebut benar-benar mengukur apa yang


hendak diukur. Maksudnya adalah seberapa jauh suatu tes mampu

mengungkapkan dengan tepat ciri atau keadaan yang sesungguhnya dari


obyek ukur, akan tergantung dari tingkat validitas tes yang bersangkutan.

Sudjana (2004, dalam Widodo, 2006) menyatakan bahwa validitas


berkenaan dengan ketepatan alat penilaian terhadap konsep yang dinilai
sehingga betul-betul menilai apa yang seharusnya dinilai.

Validitas berasal dari kata validity yang berarti sejauhmana ketepatan dan
kecermatan pengukur (tes) dalam melakukan fungsi ukurnya (Azwar, 2011).

4. Mengapa kita perlu validitas dan reliabilitas?

Validitas digunakan sebagai pengembangan dan pengevaluasian suatu tes.


Reliabilitas digunakan sebagai indikator dalam mempercayai nilai dari suatu
tes karena memiliki konsistensi (Jacobs, 1991).

5. Berapa macam/jenis validitas dan reliabilitas dalam riset atau alat


ukur? Reliabilitas
Jenis-jenis reliabilitas antara lain (Sugiyono, 2004):
a.

Reliabilitas tes-retes; yaitu dengan mengulang tes yang sama pada


kesempatan kedua.

b.

Reliabilitas bentuk alternatif; yaitu melalui penggunaan bentuk-bentuk tes


lainnya.

c.

Reliabilitas belah-separuh (split-half reliability); dimana skor yang diperoleh


untuk tiap individu diperoleh dengan membagi tes melalui berbagai prosedur
belah-separuh.

d.

Reliabilitas

Kuder-Richardson

dan

Koefisien

Alpha;

yaitu

dengan

menggunakan administrasi tunggal dari suatu bentuk tunggal didasarkan


pada konsistensi respons terhadap semua butir soal dalam tes yang
dipengaruhi oleh dua sumber varian kesalahan.
Jenis reliabilitas terdiri dari 2, antara lain:
-

Reliabilitas konsistensi tanggapan: responden mempersoalkan apakah


tanggapan responden atau obyek ukur terhadap tes atau instrumen tersebut

sudah baik atau konsisten. Dalam hal ini apabila suatu tes atau instrumen
digunakan untuk melakukan pengukuran terhadap obyek ukur kemudian
dilakukan pengukuran kembali terhadap obyek ukur yang sama, apakah
-

hasilnya masih tetap sama dengan pengukuran sebelumnya.


Reliabilitas konsistensi gabungan butir: berkaitan dengan kemantapan
antara butir suatu tes. Dengan kata lain bahwa terhadap bagian obyek ukur
yang sama, apakah hasil ukur butir yang satu tidak kontradiksi dengan hasil
ukur butir yang lain (Djaali, 2000, dalam Matondang, 2009).
Validitas
Jenis-jenis validitas yaitu sebagai berikut (Sugiyono, 2004):

a. Validitas konstruksi (construct validity); dengan menggunakan pendapat


dari ahli (experts judgment)
b. Validitas isi (content validity); dilakukan dengan membandingkan antara isi
instrument dengan materi pelajaran yang telah diajarkan.
c.

Validitas

eksternal;

dengan

cara

membandingkanguna

mencari

kesamaan anatar criteria yang ada pada instrument dengan fakta-fakta


empiris yang terjadi di lapangan.
Menurut Neuman (2007), terdapat tiga jenis validitas pengukuran, antara
lain:
a.

Face validity. Ini merupakan validitas yang paling mudah untuk dicapai
dan sebagian besar jenis dasar dari validitas adalah face validity. Hal ini
memerlukan pertimbangan dari komunitas ilmiah bahwa indikator benarbenar dapat digunakan untuk mengukur suatu konstruk. Kesesuaian antara
definisi

dan

metode

pengukuran

yang

digunakan

merujuk

pada

pertimbangan dari suatu konsensus komunitas ilmiah atau penilaian dari


orang lain.
b.

Content vatidity. Validitas ini membahas mengenai definisi konseptual


yang berisi ide-ide dan konsep dapat direpresentasikan dalam suatu
pengukuran. Validitas isi melibatkan tiga langkah. Pertama, menentukan
definisi konstruk dari seluruh konten. Selanjutnya, ambil sampel dari semua

bidang definisi. Kemudian, mengembangkan indikator yang mewakili semua


bagian dari definisi.
c.

Validitas Kriteria. Validitas kriteria menggunakan beberapa standar atau


kriteria untuk mengindikasi konstruk secara akurat. Validitas dari indikator
diverifikasi dengan cara membandingkannya dengan ukuran lain dari
konstruk yang sama yang diterima secara luas. Ada dua subtipe dari jenis
validitas kriteria, yaitu:

(1) Validitas konkuren. Indikator harus dikaitkan dengan indikator yang


sudah ada sebelumnya dan dinilai sebagai valid (misalnya, telah memiliki
face validity).
(2)

Validitas prediktif. Validitas kriteria dimana indikator memprediksi


kejadian masa depan yang logis terkait dengan suatu konstruk. Hal ini tidak
dapat digunakan untuk semua ukuran. Ukuran dan tindakan yang diprediksi
harus berbeda, tetapi dapat menunjukkan konstruk yang sama. Validitas
pengukuran prediktif tidak perlu dibingungkan dengan prediksi dalam
pengujian hipotesis, di mana satu variabel memprediksi variabel yang
berbeda di masa depan.

Jenis validitas terdiri dari 3 yaitu:


Validitas isi: menunjukkan sejauh mana aitem-aitem dalam tes mencakup
-

keseluruhan kawasan isi yang hendak diukur oleh tes tersebut.


Validitas konstruk: menunjukkan sejauh mana suatu tes mengukur trait

atau konstruk teoretik yang hendak diukurnya.


Validitas kriteria: bukti validitasnya diperlihatkan dengan

adanya

hubungan skor pada tesyang bersangkutan dengan skor suatu kriteria


(contoh: analisis korelasional) (Azwar, 2011).
Validitas isi, kriteria dan konstrak. Ada lima sumber dasar teori dalam
validitas konstrak, yaitu isi, proses respon, struktur internal, hubungan
terhadap variabel lain, dan akibat. Berikut ini akan diuraikan satu per satu.
Konten: melihat hubungan antara isi pengukuran dengan konstrak ingin

diukur.

Disini

perlu

dilihat

definisi,

tujuan

alat

ukur,

proses

dalam

mengembangkan dan memilih aitem, kata-kata dari setiap aitem, dan


kualifikasi penulis. Bukti konten biasanya menyajikan langkah-langkah
terperinci untuk memastikan bahwa alat ukur tersebut telah mewakili
konstrak yang akan dikur (Cook&Beckman,2006). Proses respon yaitu
bagaimana pola pikir penulis terhadap pengukuran yang dilakukan, metode
dan keamanan data yang digunakan dalam pengukuran dan pelaporan juga
termasuk dalam kategori ini. Strutur internal melihat hubungan antara aitem
tes dengan tes yang digunakan untu mengukur konstrak, yaitu apakah
aitem-aitem yang penting mungkin dapat memiliki fungsi yang berbeda pada
sekelompo

responden.

Hal

ini

bermanfaat

apabila

responden

secara

kategorial memiliki kesamaan, sehingga aitem tes ini diharapkan dapat


menunjukkan perbedaannya dari masing-masing responden. Hubungannya
dengan

variabel

yang

lain:

melihat

hubungan

skor

tes

dengan

pengukuran lain dengan konstrak yang sama.


6. Bagaimana cara mengukur validitas dan reliabilitas?
Reliabilitas
Pengujian reliabilitas instrumen dapat dilakukan secara internal dan
eksternal (Sugiyono, 2010). Secara internal, reliabilitas dapat diuji dengan
menganalisis konsistensi butir-butir yang ada pada instrumen dengan teknik
internal

consistency.

Hal

ini

dilakukan

dengan

cara

mengujicobakan

instrumen sekali saja, kemudian data yang diperoleh dianalisis dengan teknik
belah dua dari Spearman Brown (Split Half), KR-20, KR-21, dan Anova Hyot
(Analisis Varians).
Secara eksternal, pengujian dapat dilakukan dengan cara berikut:
a.

Test-retest. Pengujian test-retest dilakukan dengan cara mencobakan


instrumen yang sama beberapa kali pada responden yang sama, namun
dilakukan dalam waktu yang berbeda. Reliabilitas diukur dari koefisien
korelasi antara percobaan pertama dengan yang berikutnya. Bila koefisien

korelasi positif dan signifikan maka instrumen tersebut sudah dinyatakan


reliabel.
b.

Equvalent. Pengujian dengan cara ini cukup dilakukan sekali, namun


menggunakan dua instrumen yang berbeda, pada responden yang sama,
dan waktu yang sama. Reliabilitas dihitung dengan cara mengkorelasikan
antara data instrumen yang satu dengan data instrumen yang dijadikan
equivalent.

c.

Gabungan. Pengujian dilakukan dengan cara mencobakan dua instrumen


yang equivalent beberapa kali kepada responden yang sama. Reliabilitas
diukur dengan mengkorelasikan dua instrumen, kemudian dikorelasikan pada
pengujian kedua, dan selanjutnya dikorelasikan secara silang.
Menurut Jacobs (1991), analisa reliabilitas dapat diukur dengan tiga cara
yaitu BEST digitek test scoring, Spearman Brown, dan Kuder-Richarson 20.
Spearman Brown mengukur konsistensi pengambilan aitem. Sedangkan
KR-20

mengukur

menunjukkan

dua

konsistensi
sumber

jawaban

kesalahan,

terhadap
yaitu:

semua

aitem

dan

pemilihan

aitem

dan

heterogenitas dari sampel. Reliabilitas juga dapat dijelaskan dengan standar


eror pengukuran, yaitu memperkirakan seberapa besar perubahan nilai
individu ketika dilakukan pengulangan tes. Apabila reliabilitas nilai tes tinggi,
maka standar eror pengukuran tersebut rendah.
Validitas
Cara pengujian validitas sebagai berikut (Sugiyono, 2010):
a. Pengujian validitas konstruk
Pengujian validitas konstruk dapat menggunakan pendapat para ahli
mengenai aspek yang akan diukur. Kemudian dilakukan ujicoba instrumen
pada sampel dari populasi yang akan digunakan. Setelah data ditabulasikan,
maka pengujian validitas konstruk dilakukan dengan analisis faktor, yaitu
dengan mengkorelasikan antar skor item instrumen dalam suatu faktor, dan
mengkorelasikan skor faktor dengan skor total. Pengujian validitas seluruh

butir instrumen dalam satu variabel dapat juga dilakukan dengan cara
mencari daya pembeda skor tiap aitem dari kelompok yang memberikan
jawaban tinggi dan jawaban rendah. Pengujian analisis daya pembeda dapat
menggunakan t-test.
b. Pengujian validitas isi
Untuk instrumen yang berbentuk tes, pengujian validitas isi dilakukan
dengan membandingkan antara isi instrumen dengan materi pelajaran yang
telah diajarkan. Di sisi lain, pengujian validitas isi dari instrumen yang akan
mengukur

efektivitas

pelaksanaan

program,

dapat

dilakukan

dengan

membandingkan antara isi instrumen dengan isi atau rancangan yang telah
ditetapkan. Untuk menguji validitas butir-butir instrumen lebih lanjut, maka
setelah dikonsultasikan kepada para ahli, selanjutnya diujicobakan, dan
dilakukan analisis aitem atau uji beda.
c. Pengujian validitas eksternal
Penngujian ini dilakukan dengan cara membandingkan (untuk mencari
kesamaan) antara kriteria yang ada pada instrumen dengan fakta-fakta
empiris yang terjadi di lapangan. Bila terdapat kesamaan, maka dapat
dinyatakan instrumen tersebut memiliki validitas eksternal yang tinggi.
7.

Bagaimana cara mengembangkan validitas dan reliabilitas sesuai


dengan kebutuhan?
Untuk menggunakan validitas yang diinginkan terlebih dahulu mencari
referensi mengenai teori pengukuran yang akan dipakai, dengan demikian
dapat

diketahui

pengukuran

yang

akan

digunakan

sehingga

dapat

menghasilkan suatu validitas nantinya (Cook&Beckman, 2006). Selain teknik


korelasi, pada reliabilitas juga berkembang analisis varians skor dan analisis
varians eror (Azwar, 2011).
8. Kapan validitas dan reliabilitas berfungsi/berlaku dan kapan tidak
berfungsi?
Reliabilitas

Jika terhadap bagian obyek ukur yang sama, hasil ukur melalui butir yang
satu tidak konsisten dengan hasil ukur melalui butir yang lain maka
pengukuran dengan tes (alat ukur) sebagai suatu kesatuan itu tidak dapat
dipercaya. Dengan kata lain, alat ukur tidak reliabel dan tidak dapat
digunakan untuk mengungkap ciri atau keadaan yang sesungguhnya dari
obyek ukur. Kalau hasil pengukuran pada bagian obyek ukur yang sama
antara butir yang satu dengan butir yang lain saling kontradiksi atau tidak
konsisten maka kita tidak bisa menyalahkan obyek ukur, melainkan alat ukur
(tes) yang dipersalahkan dengan mengatakan bahwa tes tersebut tidak
reliabel terhadap obyek yang diukur (Sugiyono, 2010).
Validitas
Ketika peneliti mengatakan bahwa suatu indikator itu valid, maka itu valid
untuk tujuan dan definisi tertentu. Indikator yang sama bisa valid untuk satu
tujuan (misal pertanyaan penelitian dengan unit analisis atau secara umum),
tetapi bisa kurang valid atau tidak valid untuk hal yang lainnya. Misalnya
dalam mengukur prejudice, bisa valid untuk mengukur prejudice para guru,
tapi bisa jadi tidak valid untuk digunakan dalam mengukur prejudice dari
para polisi. Tidak adanya validitas terjadi jika tidak terdapat kesesuaian atau
kesesuaian

yang

rendah

antara

konstruk

yang

digunakan

untuk

menggambarkan, membuat teori atau menganalisis dunia sosial dengan apa


yang sebenarnya terjadi dalam dunia sosial (Neuman, 2007).
9. Apabila butuh validitas dan reliabilitas, dinaikkan sampai berapa.
Kalau tidak butuh, diturunkan sampai berapa?
Reliabilitas: memperbanyak jumlah aitem, biasanya dalam soal pilihan
ganda

terdapat

memperjelas

40

maksud

soal,
dari

berhati-hati

dalam

pertanyaan,

menyusun

perencanaan

aitem
waktu

yaitu
dalam

pelaksanaan tes karena pengisian yang terburu-buru di akhir waktu bukanlah


tes yang reliabel, dan prosedur tes hendaknya ditulis dengan kalimat yang
jelas (Jacobs, 1991).

10. Apa perbedaan hasil penelitian yang valid dan reliabel dengan
instrumen yang valid dan reliabel?
Hasil penelitian yang valid bila terdapat kesamaan antara data yang
terkumpul dengan data yang sesungguhnya terjadi pada objek yang diteliti,
sedangkan hasil penelitian yang reliabel bila terdapat kesamaan data dalam
waktu yang berbeda.
Di sisi lain, instrumen yang valid berarti instrumen yang digunakan untuk
mendapatkan data bisa mengukur apa yang seharusnya diukur, sedangkan
instrumen yang reliabel adalah instrumen yang bila digunakan beberapa kali
untuk mengukur objek yang sama dapat menghasilkan data yang sama
(Sugiyono, 2010).
11. Bagaimana cara meningkatkan reliabilitas pengukuran?
Ada

empat

cara

untuk

meningkatkan

reliabilitas

pengukuran:

(1)

mengonseptualisasi semua konstruk secara jelas, (2) menggunakan level


pengukuran yang tepat, (3) menggunakan beberapa indikator dari suatu
variabel, dan (4) menggunakan pilot-tets (pretests, pilot studies, dan
replikasi) (Neuman, 2007).
12. Bagaimana cara meningkatkan validitas eksternal penelitian?
Dengan

cara

meningkatkan

validitas

eksternal

dari

instrumen

dan

memperbesar jumlah sampel (Sugiyono, 2010).


13. Bagaimana hubungan antara validitas dan reliabilitas?
Reliabilitas diperlukan untuk pengujian validitas dan lebih mudah untuk
dicapai daripada validitas. Meskipun reliabilitas diperlukan untuk memiliki
ukuran yang valid dari suatu konsep, hal itu tidak menjamin ukuran tersebut
bisa berlaku. Suatu ukuran yang reliabel atau dapat menghasilkan hasil yang
sama berulang-ulang, namun belum tentu valid atau mungkin hasil
pengukuran tidak cocok dengan definisi konstruk. Validitas dan reliabilitas
merupakan konsep yang saling melengkapi, namun dalam beberapa situasi
mereka bertentangan satu sama lain. Kadang-kadang, validitas meningkat

namun reliabilitas lebih sulit dicapai, atau sebaliknya. Hal ini terjadi ketika
memiliki definisi konstruk yang sangat abstrak dan tidak mudah diamati.
Reliabilitas paling mudah dicapai ketika ukuran secara tepat dan dapat
diamati. Dengan demikian, ada pertentangan antara esensi sebenarnya dari
konstruk yang sangat abstrak dan mengukurnya secara konkret (Neuman,
2007).
14. Faktor-faktor apa saja yang mempengaruhi reliabilitas?
a) Pemilihan aitem. Tes merupakan pemilihan aitem-aitem yang digunakan
untuk mengukur suatu konstrak, dengan demikian pemilihan aitem tersebut
dapat

menjadi

sumber

kesalahan

dalam

pelaksanaan

tes.

Untuk

meningkatkan konsistensi dapat memperbanyak pemilihan aitem yang


digunakan (Jacobs,1991). Dengan demikian akan mengurangi responden
untuk

asal

tebak

dalam

menjawab.

Namun

aitem

ini

juga

harus

dipertimbangkan kualitas pertanyaannya, karena apabila tidak dan aitem


yang diberikan banyak dapat membuat responden kelelahan.
b) Penyusunan aitem. Kalimat yang ambigu atau kurangnya kata dalam suatu
kalimat juga dapat mempengaruhi interpretasi responden sehingga dapat
mempengaruhi reliabilitas.
c) Pemberian administrasi tes. Kalimat instruksi yang kurang jelas atau suasana
yang bising dapat mempengaruhi responden ketika menjawab.
d) Penilaian (scoring), pada tes esai memiliki reliabilitas yang lebih rendah
dibandingkan dengan tes pilihan ganda. Karena pada tes esai, penilai
memiliki interpretasi yang berbeda-beda dalam menilai jawaban responden
sehingga lebih bersifat subyektif.
e) Tingkat kesulitan dari suatu tes. Nilai dari suatu tes menunjukkan reliabilitas
yang baik apabila nilai tersebut menyebar dari skala yang digunakan dengan
demikian dapat terlihat perbedaan antar siswa. Faktor yang terakhir adalah
siswa, dimana kelelahan, kecemasan, dan siswa sakit dapat menyebabkan
reliabilitas yang rendah karena mempengaruhi kinerja mereka dalam
mengerjakan tes (Jacobs,1991).

15. Faktor-faktor apa saja yang mempengaruhi validitas?


Definisi yang jelas mengenai suatu konstrak pengukuran (Cook & Beckman,
2006). Selain itu, faktor-faktor yang juga mempengaruhi yaitu: panjang alat
ukur,

variabilitas

kemampuan

kelompok,

instruksi

tes

yang

ambigu,

perbedaan sosio-kultural, penambahan item-item yang tidak tepat.


16. Bagaimana proses validasi?
Proses validasi melibatkan pengumpulan bukti-bukti untuk memberikan
dasar ilmiah pada interpretasi skor yang dimaksud (Standards, 1999).
17. Sebutkan sumber-sumber pembuktian validitas!
a) Pembuktian yang didasarkan pada konten pengujian (evidence based on test
content); mengacu pada tema, judul, format aitem-aitem, tugas, ataupun
pertanyaan pada suatu tes, serta pedoman untuk prosedur mengenai
administrasi dan skoring.
b) Pembuktian yang didasarkan pada proses-proses respon (evidence based on
response processes); berupa analisis teoritis dan empiris dari proses respon
pengambil tes.
c) Pembuktian yang didasarkan pada truktur internal (evidence based on
internal structure); hal ini dapat menunjukkan sejauh mana hubungan antar
item tes dan komponen yang diuji sesuai dengan dasar konstruk yang
digunakan untuk menginterpretasi skor tes.
d) Pembuktian yang didasarkan pada hubungannya terhadap variabel lain
(evidence based on relations to other variables); dengan menganalisa
hubungan antara skor tes dengan variabel eksternal tes.
e) Pembuktian yang didasarkan pada konsekuensi pemberian tes (evidence
based on consequences of testing); dengan menggabungkan konsekuensikoneskuensi baik yang diinginkan maupun tidak diinginkan dari kegunaan tes
kedalam konsep validitas, misal kebijakan sosial.
18. Bagaimana cara menguji validitas dan reliabilitas?
Menurut Sudijono (2009) terdapat berbagai jenis validitas, antara lain:

1. Pengujian Validitas Tes Secara Rasional


Validitas rasional adalah validitas yang diperoleh atas dasar hasil pemikiran,
validitas yang diperoleh dengan berpikir secara logis.
a. Validitas Isi (Content Validity)
Valditas isi berkaitan dengan kemampuan suatu instrumen mengukur isi
(konsep) yang harus diukur. Ini berarti bahwa suatu alat ukur mampu
mengungkap isi suatu konsep atau variabel yang hendak diukur.
Validitas isi dari suatu tes hasil belajar adalah validitas yang diperoleh
setelah dilakukan penganalisisan, penelususran atau pengujian terhadap isi
yang terkandung dalam tes hasil belajar tersebut. Validitas isi adalah yang
ditilik dari segi isi tes itu sendiri sebagai alat pengukur hasil belajar yaitu:
sejauh mana tes hasil belajar sebagai alat pengukur hasil belajar peserta
didik, isisnya telah dapat mewakili secara representatif terhadap keseluruhan
materi atau bahkan pelajaran yang seharusnya diteskan (diujikan).
Misalnya test bidang studi IPS, harus mampu mengungkap isi bidang studi
tersebut, pengukuran motivasi harus mampu mengukur seluruh aspek yang
berkaitan dengan konsep motivasi, dan demikian juga untuk hal-hal lainnya.
Menurut Kenneth Hopkin penentuan validitas isi terutama berkaitan dengan
proses analisis logis, dengan dasar ini Dia berpendapat bahwa validitas isi
berbeda dengan validitas rupa yang kurang menggunakan analisis logis yang
sistematis, lebih lanjut dia menyatakan bahwa sebuah instrumen yang punya
validitas isi biasanya juga mempunyai validitas rupa, sedang keadaan
sebaliknya belum tentu benar.
b.Validitas konstruksi (Construct Validity)
Konstruk adalah kerangka dari suatu konsep, validitas konstruk adalah
validitas yang berkaitan dengan kesanggupan suatu alat ukur dalam
mengukur pengertian suatu konsep yang diukurnya. Menurut Jack R. Fraenkel
validasi konstruk (penentuan validitas konstruk) merupakan yang terluas
cakupannya dibanding dengan validasi lainnya, karena melibatkan banyak
prosedur termasuk validasi isi dan validasi kriteria.

Validitas konstruksi juga dapat diartikan sebagai validitas yang ditilik dari
segi susunan, kerangka atau rekaannya. Adapun secara terminologis, suatu
tes hasil belajar dapat dinyatakan sebagai tes yang telah memiliki validitas
konstruksi, apabila tes hasil belajar tersebut telalh dapat dengan secara
tepat mencerminkan suatu konstruksi dalam teori psikologis.
2. Pengujian Validitas Tes Secara Empirik
Validitas empirik adalah ketepatan mengukur yang didasarkan pada hasil
analisis yang bersifat empirik. Dengan kata lain, validitas empirik adalah
validitas yang bersumber pada atau diperoleh atas dasar pengamatan di
lapangan.
a. Validitas ramalan (Predictive validity)
Validitas ramalan adalah suatu kondisi yang menunjukkan seberapa jauhkah
sebuah tes telah dapat dengan secara tepat menunjukkan kemampuannya
untuk meramalkan apa yang bakal terjadi pada masa mendatang.
Contohnya apakah test masuk sekolah mempunyai validitas ramalan atau
tidak ditentukan oleh kenyataan apakah terdapat korelasi yang signifikan
antara hasil test masuk dengan prestasi belajar sesudah menjadi siswa, bila
ada, berarti test tersebut mempunyai validitas ramalan.
b. Validitas bandingan (Concurrent Validity)
Tes

sebagai

alat

pengukur

dapat

dikatakan

telah

memiliki

validitas

bandingan apabila tes tersebut dalam kurun waktu yang sama dengan
secara tepat mampu menunjukkan adanya hubungan yang searah, antara
tes pertama dengan tes berikutnya.
Reliabilitas instrumen dapat diuji dengan dua cara, yaitu uji reliabilitas
eksternal

dan

internal.

Dengan

pengertian

bahwa

jika

ukuran

atau

kriterianya berada di luar instrumen, maka dari hasil pengujian ini diperoleh
reliabilitas eksternal, sedangkan reliabilitas internal diperoleh berdasarkan
data dari instrumen saja.Untuk menguji reliabilitas eksternal : teknik paralel
(double test double trial). Dengan menggunakan teknik ini peneliti menyusun
dua perangkat instrumen. Kedua instrumen tersebut sama-sama diuji
cobakan kepada sekelompok responden saja (responden mengerjakan dua

kali) kemudian hasil dua kali tes uji coba tersebut dikorelasikan dengan
korelasi Pearson.
19. Bagaimana cara pengujian reliabilitas hasil ukur skala psikologi?
Pengujian reliabilitas terhadap hasil ukur skala psikologi dapat dilakukan
bilamana item-item yang terpilih lewat prosedur analisis item telah
dikompilasikan menjadi satu (Azwar, 2008).
20. Bagaimana aplikasi dalam menyatakan reliabiltas?
Reliabilitas dinyatakan oleh koefisien reliabilitas (rxx) yang angkanya berada
dalam rentang dari 0 sampai dengan 1,00, dimana koefisien reliabiltas
semakin mendekati 1,00 maka semakin tinggi reliabilitasnya, begitu pun
sebaliknya (Azwar, 2008).
21. Apakah Koefiisien validitas dan koefisien reliabilitas
a. Validitas: hasil estimasi validitas suatu pengukuran yang dinyatakan secara
empirik biasanya dinyatakan dengan korelasi antara distribusi skor tes
dengan distribusi skor kriteria. Contoh apabila distribusi skor tes x dan skor
kriteria adalah y, sehingga koefisien validitasnya adalah rxy. Koefisien
validitas hanya memiliki makna apabila mempunyai nilai positif. Semakin
mendekati 1,00 maka hasil tes semakin valid.
b. Reliabilitas: Koefisien reliabilitas adalah tinggi-rendahnya reliabilitas yang
dapat dilihat melalui korelasi antara dua dsitribusi skor dari dua alat ukur
yang paralel yang dikenakan pada sekelompok individu yang sama. Semakin
tinggi korelasi antara hasil ukur dari dua tes yang paralel, maka akan
semakin konsisten dan dapat dikatakan sebagai alat ukur yang reliabel.
Lambang dari korelasi paralel tersebut adalah rxx, dimana skor x adalah tes
pertama dan x untuk tes yang kedua. (Azwar, 2011).
22. Jelaskan makna dari koefisien validitas dan reliabilitas!
a)

Interpretasi koefisien validitas dan reliabilitas keduanya bersifat relatif,


dalam hal ini pada umumnya estimasi validitas berkisar 0,50 dapat dianggap

memuaskan, sedangkan koefisien validitas kurang dari 0,30 biasanya


b)

dianggap tidak memuaskan.


Pada umumnya, reliabilitas

dapat

dianggap

memuaskan

apabila

koefisiennya minimal mencapai rxx = 0,900, namun terkadang suatu


koefisien tidak mencapai nilai tersebut dan masih dianggap cukup berarti
dalam suatu kasus tertentu terutama apabila skala yang bersangkutan
digunakan

bersama-sama

dengan

tes

lain

dalam

suatu

perangkat

pengukuran (battery test) (Azwar, 2008).


23. Sebutkan hal-hal yang perlu diperhatikan dalam menginterpretasi
koefisien reliabilitas!
Terdapat dua hal yang perlu diperhatikan dalam menginterpretasikan
koefisien reliabilitas, yaitu sebagai berikut (Azwar, 2008):
a. Interpretasi koefisien reliabilitas bernilai spesifik bagi hasil ukur pada
kelompok individu tertentu saja
b.

Koefisien reliabilitas hanya mengindikasi besarnya inkonsistensi skor hasil


pengukuran, bukan menyatakan secara langsung penyebab inkonsistensi
tersebut.

24. Jelaskan perbedaan validitas internal dan validitas eksternal?


Djaali (2000, dalam Matondang, 2009) validitas internal (validitas butir)
termasuk kelompok validitas kriteria yang merupakan validitas yang diukur
dengan

besaran

yang

menggunakan

tes

sebagai

suatu

kesatuan

(keseluruhan butir) sebagai kriteria untuk menentukan validitas butir dari tes
itu. Dengan demikian validitas internal mempermasalahkan validitas butir
dengan menggunakan hasil ukur tes tersebut sebagai suatu kesatuan
sebagai kriteria, sehingga biasa juga disebut validitas butir. Validitas internal
diperlihatkan oleh seberapa jauh hasil ukur butir tersebut konsisten dengan
hasil ukur tes secara keseluruhan. Oleh karena itu validitas butir tercermin
pada besaran koefisien korelasi antara skor butir dengan skor total tes. Jika
koefisien korelasi skor butir dengan skor total tes positif dan signifikan maka
butir tersebut valid berdasarkan ukuran validitas internal. Koefisien korelasi

yang tinggi antara skor butir dengan skor total mencerminkan tingginya
konsistensi antara hasil ukur keseluruhan tes dengan hasil ukur butir tes atau
dapat dikatakan bahwa butir tes tersebut konvergen dengan butir-butir lain
dalam mengukur suatu konsep atau konstruk yang hendak diukur. Validitas
internal untuk skor butir dikotomi digunakan koefisien korelasi biserial (rbis).
Validitas eksternal dapat berupa hasil ukur tes baku atau tes yang
dianggap baku dapat pula berupa hasil ukur lain yang sudah tersedia dan
dapat dipercaya sebagai ukuran dari suatu konsep atau variabel yang
hendak diukur. Validitas eksternal diperlihatkan oleh suatu besaran yang
merupakan hasil perhitungan statistika. Jika kita menggunakan basil ukur tes
yang sudah baku sebagai kriteria eksternal, maka besaran validitas eksternal
dari tes yang kita kembangkan didapat dengan jalan mengkorelasikan skor
hasil ukur tes yang dikembangkan dengan skor hasil ukur tes baku yang
dijadikan kriteria. Makin tinggi koefisien korelasi yang didapat, maka validitas
tes yang dikembangkan juga makin baik. Kriteria yang digunakan untuk
menguji validitas eksternal digunakan nilai r-tabel. Jika koefisien korelasi
antara skor hasil ukur tes yang dikembangkan dengan skor hasil ukur tes
baku lebih besar daripada r-tabel maka tes yang dikembangkan adalah valid
berdasarkan kriteria eksternal yang dipilih (hasil ukur instrumen baku). Jadi
keputusan uji- validitas dalam hal ini adalah mengenai valid atau tidaknya
tes sebagai suatu kesatuan, bukan valid atau tidaknya butir tes seperti pada
validitas internal.

25. Jelaskan perbedaan reliabilitas berdasarkan kosistensinya?


Djaali (2000, dalam Matondang, 2009) menyatakan bahwa reliabilitas
dibedakan atas dua macam, yaitu reliabilitas konsistensi tanggapan, dan
reliabilitas konsistensi gabungan butir. Reliabilitas konsistensi tanggapan
responden mempersoalkan apakah tanggapan responden atau obyek ukur
terhadap tes atau instrumen tersebut sudah baik atau konsisten. Dalam hal

ini apabila suatu tes atau instrumen digunakan untuk melakukan pengukuran
terhadap obyek ukur kemudian dilakukan pengukuran kembali terhadap
obyek ukur yang sama, apakah hasilnya masih tetap sama dengan
pengukuran

sebelumnya.

Jika

hasil

pengukuran

kedua

menunjukkan

ketidakkonsistenan maka jelas hasil pengukuran itu tidak mencerminkan


keadaan obyek ukur yang sesungguhnya.
26. Sejauhmana validitas dan reliabilitas dapat dipercaya?
Reliabilitas: dalam konsep reliabilitas hasil ukur dapat dipercaya apabila
dalam beberapa kali pengukuran terhadap kelompok subjek yang sama
diperoleh hasil yang sama, apabila aspek yang diukur dalam diri subjek
belum berubah (Azwar,2011).
27. Bilamana validitas dan reliabilias dikatakan tinggi atau rendah ?
a. Validitas: suatu tes dapat dikatakan memiliki validitas yang tinggi apabila
tes tersebut menjalankan fungsi ukurnya atau memberikan hasil ukur yang
tepat dan akurat sesuai dengan tujuan dari pengukuran. Sedangkan suatu
tes yang tidak menghasilan data yang relevan sesuai dengan tujuan dari tes
tersebut, maka validitas tes tersebut rendah (Azwar, 2011).
b. Reliabilitas: Namun dalam reliabilitas dikatakan tinggi apabila hasil
pengukuran yang dihasilkan dari tes tidak menunjukkan perbedaan yang
besar dari waktu ke waktu (Azwar, 2011).
28.

Bagaimana

menghasilkan

validitas

yang

baik

dan

dapat

digunakan ?
Validitas: apabila tes tersebut memiliki kecermatan yang tinggi, yaitu
mampu mendeteksi perbedaan-perbedaan kecil yang ada pada atribut yang
sedang diukur (Azwar, 2011).
29. Mengapa validitas dan reliabilitas terkadang berbeda antara di
lapangan dengan teori ?

Reliabilitas: Secara teori reliabilitas menunjukkan nilai tes yang bebas dari
kesalahan pengukuran (error measurement), namun dalam kenyataannya
tidak ada reliabilitas yang sempurna. Hal ini disebabkan adanya kesalahan
acak (random errors) dimana terdapat variasi nilai yang tidak konsisten dari
waktu ke waktu atau antar situasi (Jacobs, 1991).
30. Bagaimanakah

validitas

dan

reliabilitas

mempengaruhi

hasil

penelitian?
Instrumen yang valid dan reliabel merupakan syarat untuk memperoleh
data-data yang valid. Data-data inilah yang kemudian dianalisis dalam
rangka mencari kesimpulan penelitian. Apabila sebuah instrumen memiliki
validitas dan reliabilitas yang tinggi dan sudah teruji maka akan diperoleh
data-data yang mendukung hasil penelitian. Semakin valid dan reliabel
instrumen yang digunakan, maka hasil penelitian akan semakin valid dan
reliabel.
31. Bagaimana ketika validitas tinggi, reliabilitas rendah?
Validitas tinggi menandakan bahwa item atau alat ukur tersebut benar-benar
sudah mengukur konstruk yang ditetapkan untuk diukur. Sedangkan
reliabilitas rendah dalah ketika alat ukur tersebut tidak mampu menghasilkan
nilai yang konsisten (ajeg) ketika di ukur pada situasi yang berbeda dari
sebelumnya.
Pada tes-tes yang bermaksud memprediksi sebuah kriteria tertentu,
(predictive-criterion

related)

reliabilitas.

nilai

Ketika

validitas

validitas

menjadi

memuaskan,

lebih
maka

penting

daripada

rendahnya

nilai

reliabilitas tidak akan menjadi masalah. Contohnya : Tes-tes kreativitas.


32. Bagaimana ketika reliabilitas tinggi dan validitas rendah?
Reliabilitas tinggi menunjukkan bahwa sebuah instrumen atau alat ukur yang
ada dapat secara konsisten (ajeg) mengukur sebuah konstruk yang ingin
diukur dari waktu ke waktu atau apada berbagai situasi. Sedangkan nilai
validitas yang rendah memperlihatkan sebuah instrumen yang tidak bisa
menggambarkan atau tidak dapat benar-benar mengukur konstruk yang
ingin diukur.

Apabila reliabilitas tinggi dan validitas rendah, maka instrumen atau alat
ukur tersebut terbukti mampu menghasilkan nilai yang konsisten pada
berbagai situasi, namun belum dapat memperlihatkan ketajaman
pengukuran atas konstruk atau sesuatu yang ingin diukur
33. Bagaimana cara meningkatkan validitas?
Ada beberapa cara yang dapat ditempuh untuk meningkatkan validitas paras
suatu instrumen:
1. Pemanfaatan Soal
Naskah awal dari instrumen diperiksa oleh suatu kelompok evaluator,
misalnya pembimbing tesis, ahli pembuat tes, dan para tenaga profesional
yang berpengalaman dalam bidangnya.
2. Konsistensi Antarpenilai
Naskah awal yang telah diperiksa oleh para ahli tersebut diberi tanda, mana
yang layak dan tidak layak. Kemudian, dipilah dan diseleksi mana yang
paling cocok untuk dijadikan alat ukur atau instrumen. Tentu saja, layak atau
tidak layaknya instrumen tersebut dilihat dari hasil penilaian para ahli secara
konsisten dan objektif.
Selanjutnya, validitas dalam kaitannya dengan pengujian (testing) dan
penilaian (assessment), Linn dan Gronlund (1985: 49) menegaskan ada
sejumlah pertimbangan yang perlu diperhatikan: pertama, validitas mengacu
kepada ketepatan interpretasi hasil dari suatu prosedur penilaian terhadap
sekelompok individu; bukan kepada prosedur itu sendiri. Kedua, validitas
memiliki perihal derajat tertentu dengan kategori-kategori: validitas tinggi
(high validity), validitas sedang (moderate validity), dan validitas rendah
(low validity). Ketiga, validitas senantiasa mengacu kepada kegunaan atau
interpretasi yang spesifik; tidak ada penilaian yang valid untuk semua
kegunaan. Keempat, validitas adalah kesatuan konsep yang didasarkan atas
berbagai macam bukti yang muncul. Kelima, validitas merupakan sistem
evaluasi secara terpadu dan menyeluruh (overall evaluative judgement). Di
samping itu, Linn dan Gronlund menyarankan agar dalam membuat
interpretasi

dan

menggunakan

hasil

penilaian

memperhatikan

pertimbangan-pertimbangan mendasar, seperti isi (content), hubungan-

hubungan kriteria tes (test-criterion relationships), construct yaitu faktorfaktor

yang

mempengaruhi

hasil

atau

prestasi

(performance).

dan

konsekuensi atau akibat yang bakal terjadi (consequence).


34. Bagaimana cara meningkatkan reliabilitas?
Reliabilitas yang rendah dapat terjadi karena inkonsistensi pengamat,
ketidakstabilan atribut dari subjek yang diukur dan situasi pengukuran yang
tidak mendukung. Cara untuk meningkatkan reliabilitas adalah sebagai
berikut:
1. Memilih item-item pertanyaan untuk alat ukur, lalu menguji konsistensi
internal dan stabilitas alat ukur melalui suatu uji coba (pilot study).
2. Menghilangkan variasi pengukuran antar-pengamat, dengan menggunakan
orang-orang terlatih dan termotivasi
3. Menghilangkan variasi pengukuran intra-pengamat, dengan mengurangi
sumber variasi eksternal seperti kejemuan,kelelahan, lingkungan berisik,
yang berpengaruh kepada subjek penelitian maupun pengamat
4. Melakukan koreksi terhadap pengamat, berdasarkan kalibrasi alat ukur
dalam studi reliabilitas
5. Membakukan situasi/konteks/lingkungan penggunaan instrument
Disusun oleh :
Dilla Ima Wati (1114141530005) - Muhithah Ulin Nuha (111414153015) - I
Gusti Agung Komang Yulia Dewi (111414153018) - Rosita Permatasari
(111414153020) - Pratiwi Setiadi (111414153029) - Hielma Hasanah
(111414153030) - Nurdila Triastuti (111414153036) -Diyana Rochmawati
(111414153038)
Dibawah bimbingan : Dr.Cholichul Hadi, Drs., M.Si

DAFTAR PUSTAKA

_________. (1999). Standards: Educational and psychological testing. Washington:


American Educational Research Association.
Anastasi, A., & Urbina, S. (1998). Tes Psikologi (Edisi Terjemahan). Jakarta: PT.
Prenhallindo.
Azwar, S. (2008). Penyusunan Skala Psikologi. Yogyakarta: Pustaka Pelajar.
Azwar, S. (2011). Tes Prestasi: Fungsi dan pengembangan pengukuran prestasi
belajar. Yogyakarta: Pustaka Pelajar.
Cook, D. A. & Beckman, T. (2006). Current concept validity and reliability for
psychometric instrument: Theory and application. The American Journal of
Medicine.
Isaac, Stephen., Michael, William B., (1985), Handbook in Research and Evaluation,
California, Edits publishers
Jacobs, L. C. (1991). Test Reliability. IU Bloomington evaluation service & testing.
Diakses pada tanggal 7 November 2014 dari www.indiana.edu.
Matondang, Z. (2009). Validitas dan reliabilitas suatu instrumen penelitian. Jurnal
Tabularasa PPS Unimed, 6 (1), 87-97.
Neuman, W. L. (2007). Basic of social research: Qualitative and quantitative
qpproaches, second edition. Pearson Education, Inc.
Murti, Bhisma, Prof, dr, MPH, Msc, Phd. (2011) Validitas dan Reliabilitas
Pengukuran. Universitas Negeri Semarang: Tidak Dipublikasikan
Setyawan,

Imam.

(2011)

Diktat

Psikometri.

Universitas

Diponegoro:

Tidak

Dipublikasikan
Sujarwadi, Sri (2011). Valditas dan Reliabilitas Instrumen Penelitian. Universitas
Negeri Jakarta: Tidak dipublikasikan
Sugiyono. (2004). Statistika untuk Penelitian. Bandung: CV. Alfabeta.
Sugiyono. (2010). Metode penelitian pendidikan: Pendekatan kuantitatif, kualitatif,
dan R&D. Bandung: Alfabeta.
Widodo, P. B. (2006). Reliabilitas dan validitas konstruk skala konsep diri untuk
mahasiswa Indonesia. Jurnal Psikologi Universitas Diponegoro, 3 (1), 1-9.

Pertanyaan dan Pembahasan Seputar Validitas


dan Reliabilitas
Pertanyaan yang diajukan:
1. Apa yang dimaksud dengan validitas dan reliabilitas?
2. Jenis validitas dan reliabilitas? Validitas untuk proses riset dan alat ukurnya!
3. Bagaimana cara mengukur validitas dan reliabilitas?
4. How to develop? Bagaimana mengembangkan validitas dan reliabilitas?
5. Mengapa perlu ada validitas dan reliabilitas?
6. Kapan validitas dan reliabilitas tidak berlaku?
7. Apa beda validitas untuk alat tes dengan validitas untuk kegiatan observasi dan wawancara?
8. Bagaimana menentukan validitas untuk kegiatan observasi?
9. Kapan sebuah observasi membutuhkan validitas?
10. Kapan sebuah wawancara perlu ditentukan validasinya?
11. Teori apa yang mendasari penggunaan validitas untuk kegiatan observasi dan wawancara?
12. Bagaimana cara menggunakan validitas?
13. Apakah perlu mencari reliabilitas kegiatan observasi?
14. Apakah perlu mencari reliabilitas kegiatan wawancara?
15. Bagaimana menghitung reliabilitas dalam observasi?
16. Bagaimana meningkatkan reliabilitas observasi?
17. Kapan observasi perlu ditentukan reliabilitasnya?
18. Apa beda reliabilitas alat tes dengan reliabilitas untuk kegiatan observasi dan wawancara?
19. Bagaimana cara menggunakan reliabilitas?
20. Jika sebuah alat tes mencapai validitas namun tidak reliabel, bagaimana kualitas alat tes
tersebut? Dan bagaimana jika terjadi kebalikannya?
PEMBAHASAN
1. Apa yang dimaksud dengan validitas dan reliabilitas?
Validitas berasal dari kata validity yang mempunyai arti sejauhmana ketepatan dan kecermatan
suatu alat ukur dalam melakukan fungsi ukurnya. Suatu tes atau instrumen pengukur dapat
dikatakan mempunyai validitas yang tinggi apabila alat tersebut menjalankan fungsi ukurnya,
atau memberikan hasil ukur yang sesuai dengan maksud dilakukan pengukuran tersebut. Tes
yang menghasilkan data yang tidak relevan dengan tujuan pengukuran dikatakan sebagai tes
yang memiliki validitas rendah (Azwar, 1997).
Reliabilitas merupakan penerjemahan dari kata reliability yang mempunyai asal kata rely dan
ability. Pengukuran yang memiliki reliabilitas tinggi disebut sebagai pengukuran yang reliabel
(reliabele). Walaupun reliabilitas mempunyai berbagai nama lain seperti keterpercayaan,
keterandalan, keajegan, kestabilan, konsistensi, dan sebagainya, namun ide pokok yang
terkandung dalam konsep reliabilitas adalah sejauh mana hasil suatu pengukuran dapat
dipercaya.
2. Jenis validitas dan reliabilitas? Validitas untuk proses riset dan alat ukurnya!
a. Jenis Validitas

Menurut Sudijono (2009) terdapat berbagai jenis validitas, berikut ini jenis validitas ditinjau dari
pengujiannya validitasnya yaitu pengujian validitas secara rasional dan secara konten.
Penhelasan untuk masing masing validititas itu adalah sebagai berikut:
Pengujian Validitas Tes Secara Rasional
Validitas rasional adalah validitas yang diperoleh atas dasar hasil pemikiran, validitas yang
diperoleh dengan berpikir secara logis.
a. Validitas Isi (Content Validity)
Valditas isi berkaitan dengan kemampuan suatu instrumen mengukur isi (konsep) yang harus
diukur. Ini berarti bahwa suatu alat ukur mampu mengungkap isi suatu konsep atau variabel yang
hendak diukur.
Validitas isi dari suatu tes hasil belajar adalah validitas yang diperoleh setelah dilakukan
penganalisisan, penelususran atau pengujian terhadap isi yang terkandung dalam tes hasil belajar
tersebut. Validitas isi adalah yang ditilik dari segi isi tes itu sendiri sebagai alat pengukur hasil
belajar yaitu: sejauh mana tes hasil belajar sebagai alat pengukur hasil belajar peserta didik,
isisnya telah dapat mewakili secara representatif terhadap keseluruhan materi atau bahkan
pelajaran yang seharusnya diteskan (diujikan).
Misalnya test bidang studi IPS, harus mampu mengungkap isi bidang studi tersebut, pengukuran
motivasi harus mampu mengukur seluruh aspek yang berkaitan dengan konsep motivasi, dan
demikian juga untuk hal-hal lainnya. Menurut Kenneth Hopkin penentuan validitas isi terutama
berkaitan dengan proses analisis logis, dengan dasar ini Dia berpendapat bahwa validitas isi
berbeda dengan validitas rupa yang kurang menggunakan analisis logis yang sistematis, lebih
lanjut dia menyatakan bahwa sebuah instrumen yang punya validitas isi biasanya juga
mempunyai validitas rupa, sedang keadaan sebaliknya belum tentu benar.
b. Validitas konstruksi (Construct Validity)
Konstruk adalah kerangka dari suatu konsep, validitas konstruk adalah validitas yang berkaitan
dengan kesanggupan suatu alat ukur dalam mengukur pengertian suatu konsep yang diukurnya.
Menurut Jack R. Fraenkel validasi konstruk (penentuan validitas konstruk) merupakan yang
terluas cakupannya dibanding dengan validasi lainnya, karena melibatkan banyak prosedur
termasuk validasi isi dan validasi kriteria.
Validitas konstruksi juga dapat diartikan sebagai validitas yang ditilik dari segi susunan,
kerangka atau rekaannya. Adapun secara terminologis, suatu tes hasil belajar dapat dinyatakan
sebagai tes yang telah memiliki validitas konstruksi, apabila tes hasil belajar tersebut telah dapat
dengan secara tepat mencerminkan suatu konstruksi dalam teori psikologis.
Pengujian Validitas Tes Secara Empirik
Validitas empirik adalah ketepatan mengukur yang didasarkan pada hasil analisis yang bersifat
empirik. Dengan kata lain, validitas empirik adalah validitas yang bersumber pada atau diperoleh
atas dasar pengamatan di lapangan.
a. Validitas ramalan (Predictive validity)
Validitas ramalan adalah suatu kondisi yang menunjukkan seberapa jauhkah sebuah tes telah
dapat dengan secara tepat menunjukkan kemampuannya untuk meramalkan apa yang bakal
terjadi pada masa mendatang. Contohnya apakah test masuk sekolah mempunyai validitas
ramalan atau tidak ditentukan oleh kenyataan apakah terdapat korelasi yang signifikan antara
hasil test masuk dengan prestasi belajar sesudah menjadi siswa, bila ada, berarti test tersebut
mempunyai validitas ramalan.
b. Validitas bandingan (Concurrent Validity)
Tes sebagai alat pengukur dapat dikatakan telah memiliki validitas bandingan apabila tes tersebut

dalam kurun waktu yang sama dengan secara tepat mampu menunjukkan adanya hubungan yang
searah, antara tes pertama dengan tes berikutnya.
b. Jenis-jenis Reliabilitas
1. Reliabiltas Tes Berulang (Test-retest reliability) Reliabiltas tes berulang adalah ukuran
reliabilitas yang diperoleh dengan pemberian dua kali tes yang sama selama periode waktu
tertentu untuk sekelompok individu. Contoh: Sebuah tes bahasa diberikan kepada siswa. Satu
bulan kemudian tes yang sama diberikan pada siswa yang sama. Jika skor keduanya
menghasilkan koefisien korelasi tinggi maka tes tersebut memiliki reliabilitas tinggi.
2. Reliabilitas Antar Penilai (Inter-rater atau Inter-observer Reliability) Reliabilitas antar penilai
adalah ukuran reliabilitas berdasarkan konsistensi penilaian dua responden berbeda terhadap
suatu konstruk, karena belum tentu pengamat manusia menafsirkan jawaban dengan cara yang
sama. Contoh: Peneliti meminta tanggapan dua hakim berbeda untuk memutuskan kasus yang
sama. Jika kedua hakim memberi tanggapan yang seragam maka instrumen dinyatakan reliabel.
3. Reliabilitas Konsistensi Internal (Internal consistency reliability) Reliabilitas konsistensi
internal adalah ukuran reliabilitas berdasarkan evaluasi item-item tes terhadap konstruk yang
sama. Ada dua jenis untuk reliabilitas ini yaitu:
o Rata-rata Korelasi Antar Item (Average inter-item correlation) Rata-rata korelasi antar item
diperoleh dengan mengambil semua item pada tes dan akhirnya menggunakan rata -rata semua
koefisien korelasi tersebut. Dengan kata lain instrumen dibelah sebanyak jumlah item kemudian
hasil koefisien korelasi digabung untuk mendapatkan rata-rata. Teknik ini populer dengan Alpha
Cronbach.
o Reliabilitas Belah Setengah (Split-half reliability) Reliabilitas belah setengah adalah teknik
dengan membelah item tes menjadi dua bagian untuk membentuk dua set item, kemudian skor
total masing-masing set item dikorelasikan. Jika koefisien korelasi tinggi maka reliabilitas tinggi.
3. Bagaimana cara mengukurnya validitas dan reliabilitas?
Pekerjaan untuk mencari validitas suatu alat ukur disebut validation. Prinsip dari validation
adalah membandingkan hasil-hasil dari pengukuran faktor dengan suatu kriterium, )suatu ukuran
yang telah dipandang valid untuk menunjukkan faktor yang dimaksud). Jadi misalnya suatu alat
pengukur hendak menyelidiki faktor ketelitian kerja, maka harus diambil lebih dahulu suatu
kriterium yang telah dipandang mencerminkan suatu ketelitian kerja. Melalui kriterium itulah
kemudian hasil dari pengukuran faktor ketelitian kerja disoroti, Jika hasil pengukuran faktor
ketelitian kerja menunjukkan besarnya ketelitian kerja yang sesuai dengan kriterium, maka alat
pengukur itu dipandang valid.
Ada dua jenis kriterium yang digunakan untuk menguji kejituan alat pengukur, yaitu :
a. Kriterium luar (external criterion)
Yaitu suatu kriterium yang diambil dari luar (external) alat itu sendiri. Misalnya : suatu tes
tentang ketelitian kerja, diuji validitasnya dengan prestasi kerja yang sesungguhnya sebagaimana
ditunjukkan oleh catatan-catatan hasil kerja atau penilaian pimpinan unit.
b. Kriterium dalam alat (internal criterion)
Yaitu suatu kriterium yang diambil dari dalam (internal)alat itu sendiri. Biasanya diambil hasil
keseluruhan pengukuran atau total score sebagai kriteriumnya. Misalnya, kita ingin mengukur
intelegensi (yang terdiri dari faktor-faktorl; daya analisa, daya klarifikasi, daya ingatan, daya
pemahaman, daya kritik dan sebagainya), maka untuk menguji apakah sekelompk item benarbenar mengukur daya analisa, misalnya, jawaban-jawaban terhadap item daya analisa

dicocokkan dengan hasil tes secara keseluruhan atau total score-nya. Antara nilai total harus
terdapat korelasi yang positif (tinggi dan cukup meyakinkan). Kecocokkan antara hasil-hasil dari
item yang disangka mengukur suatu faktor dengan suatu kriterium yang dipandang telah valid
disebut factorial validity atau validitas faktor, di mana besar kecilnya validitas faktor tergantung
kepada besar kecilnya kecocokan itu.
Cara pengukuran reliabilitas
Tiga tehnik pengujian realibilitas instrument antara lain :
a. Teknik Paralel (Paralel Form atau Alternate Form)
Teknik paralel disebut juga tenik double test double trial. Sejak awal peneliti harus sudah
menyusun dua perangkat instrument yang parallel (ekuivalen), yaitu dua buah instrument yang
disusun berdasarkan satu buah kisi-kisi. Setiap butir soal dari instrument yang satu selalu harus
dapat dicarikan pasangannya dari instrumen kedua. Kedua instrumen tersebut diujicobakan
semua. Sesudah kedua uji coba terlaksana, maka hasil instrumen tersebut dihitung korelasinya
dengan menggunakan rumus product moment (korelasi Pearson).
b. Teknik Ulang (Test Re-test)
Disebut juga teknik single test double trial. Menggunakan sebuah instrument, namun dites dua
kali. Hasil atau skor pertama dan kedua kemudian dikorelasikan untuk mengetahui besarnya
indeks reliabilitas.Teknik perhitungan yang digunakan sama dengan yang digunakan pada teknik
pertama yaitu rumus korelasi Pearson. Menurut Saifuddin Azwar, realibilitas tes-retest adalah
seberapa besat derajat skor tes konsisten dari waktu ke waktu. Realibilitas diukur dengan
menentukan hubungan antara skor hasil penyajian tes yang sama kepada kelompok yang sama,
pada waktu yang berbeda.
4. How to develop? Bagaimana mengembangkan validitas dan reliabilitas?
Cara meningkatkan atau mengembangkan validitas dan reliabilitas
1. Mencatat bebas hal-hal penting serinci mungkin (setting,partisipan ataupun hal-hal terkait).
2. Mendokumentasikan secara lengkap dan rapi data yang terkumpul, proses pengumpulan data
maupun strategi analisisnya.
3. Menyertakan partner saat observasi untkmenghindari subyektifitas
4. Melakukan pengecekan dan pengecekan kembalidata,menguji kemungkinan dugaan-dugaan
yg berbeda.
Cara meningkatkan reliabilitas
1. Mengonsep satu variabel dengan jelas.
2. Setiap pengukuran harus merujuk pada satu dan hanya satu konsep/variabel. Sebuah variabel
harus spesifik agar dapat mengurangi intervensi informasi dari variabel lain.
3. Menggunakan level pengukuran yang tepat. Semakin tinggi atau semakin tepat suatu level
pengukuran, maka variabel yang dibuat akan semakin reliabel karena informasi yang dimiliki
semakin mendetail. Prinsip dasarnya adalah cobalah melakukan pengukuran pada level paling
tepat yang mungkin diperoleh.
4. Gunakan lebih dari satu indikator. Dengan adanya lebih dari satu indikator yang spesifik,
peneliti dapat melakukan pengukuran dari range yang lebih luas terhadap konten definisi
konseptual.
5. Gunakan Tes Pilot, yakni dengan membuat satu atau lebih draft atau dalam sebuah pengukuran
sebelum menuju ke tahap hipotesis (pretest). Dalam penggunaan Pilot Studies, prinsipnya adalah

mereplikasi pengukuran yang pernah dilakukan oleh peneliti terdahulu dari literatur-literatur
yang berkaitan. Selanjutnya , pengukuran terdahulu dapat dipergunakan sebagai patokan dari
pengukuran yang dilakukan peneliti saat ini. Kualitas pengukuran dapat ditingkatkan dengan
berbagai cara sejauh definisi dan pemahaman yang digunakan oleh peneliti kemudian tetap sama.
5. Mengapa perlu ada validitas dan reliabilitas?
Jika kita kembali ke definisi validitas, maka dapat disimpulkan bahwa validitas mutlak
diperlukan oleh sebuah alat ukur atau alat tes agar tujuan pengukuran relevan dengan data yang
diperlukan atau diperoleh. Sebagai contoh, sebuah timbangan badan, dikatakan memiliki
validitas jika dapat mengukur berat badan manusia secara akurat. Keakuratan timbangan badan
tersebut sebelumnya harus diuji terlebih dahulu, melalui proses terra timbangan oleh Badan
Metrologi. Uji validitas tersebut mutlak diperlukan oleh timbangan agar orang yang
menggunakan merasa yakin bahwa ukuran 1 kg pada timbangan benar-benar valid mengukur 1
kg berat benda.
Sedangkan reliabilitas diperlukan untuk mengetahui sejauhmana hasil suatu pengukuran dapat
dipercaya. Hasil pengukuran dapat dipercaya hanya apabila dalam beberapa kali pelaksanaan
pengukuran terhadap kelompok subjek yang sama diperoleh hasil yang relatif sama, selama
aspek yang diukur dalam diri subjek memang belum berubah. Relatif sama, berarti tetap adanya
toleransi terhadap perbedaan-perbedaan kecil diantara hasil beberapa kali pengukuran. Bila
perbedaan itu sangat besar dari waktu ke waktu maka hasil pengukuran tidak dapat dipercaya dan
dapat dikatakan tidak reliabel.(Azwar, 1997) Jika kita kembali menggunakan contoh timbangan
badan, maka reliabilitas timbangan dapat diketahui dengan cara menggunakan timbangan badan
tersebut pada beberapa orang dan beberapa kali percobaan untuk satu orang. Kalau hasil
timbangan tersebut sama atau hanya memiliki perbedaan kecil saat pengukuran, maka timbangan
tersebut dapat dinyatakan reliabel.
6. Kapan validitas dan reliabilitas tidak berlaku?
Validitas menjadi tidak berlaku ketika validitas sebuah alat ukur digunakan untuk melihat
validitas alat ukur lainnya, maka validitas tersebut menjadi tidak berlaku. Hal ini disebabkan
tidak ada validitas yang berlaku umum untuk semua tujuan pengukuran. Suatu alat ukur biasanya
hanya merupakan ukuran yang valid untuk satu tujuan yang spesifik. Sedangkan reliabilitas
menjadi tidak berlaku pada dua kondisi. Yang pertama, alat ukur tersebut digunakan untuk
mengukur populasi atau sampel yang berbeda dengan rancangan alat ukur itu. Ini disebut
sampling error, mengacu kepada inkonsistensi hasil ukur karena digunakan ulang pada kelompok
individu yang berbeda. Contoh timbangan badan tadi, menjadi tidak reliabel jika yang ditimbang
adalah monyet, bukan manusia. Sedangkan yang kedua, reliabilitas menjadi tidak berlaku jika
terjadi kesalahan pengukuran atau error of measurement. Alat ukur yang dipakai tidak konsisten
dalam mengukur. Timbangan badan, menjadi tidak reliabel ketika mengukur berat badan orang
yang sama beberapa kali namun menunjukkan hasil yang berbeda-beda dan perbedaan tersebut
cukup besar. Misalkan: hasil timbangan pertama pada si A, 60 kg. Timbangan kedua, 58 kg dan
timbangan ketiga 60,5 kg. Dari hasil timbangan tersebut, dapat kita simpulkan bahwa alat
timbangan badan itu tidak reliabel.

7. Apa beda validitas untuk alat tes dengan validitas untuk kegiatan observasi dan
wawancara?
Validitas untuk alat tes berkaitan dengan ketepatan dan kecermatan alat tes tersebut dalam
melakukan fungsi tes atau fungsi ukurnya. Menurut buku Standards, yang ditulis oleh Asosiasi
Psikolog Amerika (APA), validitas mengacu pada derajat dimana bukti dan teori menyokong
interpretasi dari skor tes dan mengacu pada tujuan tes. Validitas adalah hal yang paling mendasar
dalam pengembangan dan evaluasi tes. Proses validasi meliputi akumulasi, membuktikan tujuan
dari evaluasi tersebut, bukan terhadap test itu sendiri. Pada alat tes biasanya validitas akan
dihitung secara statistik dan dalam bentuk rumusan angka.
Sedangkan validitas untuk kegiatan observasi dan wawancara berkaitan dengan konsep yang
digunakan untuk mendasari tujuan observasi dan wawancara itu sendiri. Sebelum seseorang
melakukan kegiatan observasi dan wawancara, ia harus mendefinisikan konsep atau teori yang
akan dipakai sebagai acuan kerangka konsepnya sehingga kegiatan observasi dan wawancara
yang dilakukan memiliki acuan yang jelas. Hasil dari observasi dan wawancara dapat dijadikan
referensi yang akurat untuk membuat deskripsi tentang orang, situasi atau kejadian. Validitas
observasi dan wawancara tidak dihitung secara statistik, namun cukup dengan menguraikan
konsep atau teori menjadi beberapa indikator.
8. Bagaimana menentukan validitas untuk kegiatan observasi?
Ada 2 cara menentukan validitas observasi, yaitu: menggunakan dasar teori atau konsep
kemudian di turunkan menjadi beberapa aspek atau indikator konsep. Yang kedua, menggunakan
perbandingan antar perilaku. Pada cara pertama, observer harus menentukan teori atau konsep
apa yang akan digunakan sebagai acuan observasi. Konsep atau teori itu kemudian diturunkan
menjadi beberapa indikator yang dipakai untuk menjadi tolok ukur operasional konsep tersebut.
Sedangkan cara kedua adalah membandingkan perilaku subjek pada berbagai situasi. Apakah
perilaku inatensi, misalnya, muncul di kelas, apakah muncul juga saat ia berada di rumah, apakah
muncul juga saat ia sedang mengerjakan tugas di tempat les. Dengan membandingkan
kemunculan perilaku dari hasil observasi tersebut akan didapatkan validitas observasi yang
disebut concurrent validity.
9. Kapan sebuah observasi membutuhkan validitas?
Pada setiap kegiatan observasi atau pengamatan sangat perlu untuk memiliki instrumen observasi
yang valid. Hal ini dikarenakan indera yang digunakan dalam pengamatan yakni mata dan
telinga memiliki keterbatasan. Rahayu dan Ardani (2004) menyatakan bahwa keterbatasan indera
timbul terutama dari objek yang dihadapi. Kebanyakan objek-objek penyelidikan adalah objekobjek yang kompleks, memiliki unsur yang banyak, segi yang berliku-liku atau dimensi yang
majemuk. Oleh karena itu kegiatan observasi membutuhkan instrumen yang valid agar instrumen
tesebut benar-benar dapat mengukur target perilaku dalam kegiatan observasi. Sattler (2002)
menjelaskan bahwa dalam pelaksanaan observasi sering ditemui berbagai masalah. Pertama,
sulitnya untuk mendapatkan sampel dan representatif perilaku yang tepat dalam waktu singkat.
memperoleh sampel dan representatif perilaku yang tepat akan memerlukan pengambilan sampel
dalam berbagai jenis situasi, dan ini jarang dilakukan. Kriteria validasi meliputi penilaian dari
orang lain yang akrab dengan subjek penelitian dan observasi dalam situasi eksperimental. Tapi
kriteria ini tidak mutlak dan tidak menawarkan bukti keabsahan. kesulitan lebih lanjut muncul
ketika dua indeks yang dimaksudkan untuk mengukur perilaku yang sama bukanlah kesepakatan.

ukuran mana yang valid atau representatif? karena perilaku adalah variabel, sangat mungkin
kedua ukuran ini adalah akurat, meskipun langkah-langkah kriteria menunjukkan kesepakatan
yang buruk.
10. Kapan sebuah wawancara perlu ditentukan validasinya?
Instrumen yang digunakan dalam sebuah wawancara seharusnya memiliki validitas yang baik.
Rahayu dan Ardani (2004) mengungkapkan bahwa validitas yang baik merujuk pada
objektivitas. Artinya, variabel-variabel dalam wawancara yang telah ditetapkan oleh peneliti
harus berdasarkan teori-teori yang telah mapan. Namun objektivitas dalam kegiatan wawancara
bersifat objectivied subjectivities. Artinya subjektif menurut peneliti (teori yang ada), tetapi
objektif menurut subjek yang diteliti. Hal ini dimungkinkan karena realitas sosial dalam
penelitian naturalistik berada di alam imajinasi pikiran kebanyakan manusia yang merupakan
gugusan subjektivitas awam yang tidak pernah diuji kebenarannya, dan objektif menurut kaidahkaidah keilmuan atau logika. Namun betapapun subjektifnya, hal tersebut sesungguhnya adalah
subjektivitas unik yang justru harus ditempatkan sebagai objek kajian ilmu-ilmu sosial yang
utama.
11. Teori apa yang mendasari penggunaan validitas untuk kegiatan observasi dan
wawancara?
Validitas dalam kegiatan observasi dan wawancara pada pengukuran psikologi perlu untuk
dilakukan karena subjek pengukurannya adalah manusia. Untuk mengungkap aspek-aspek atau
variabel-variabel dari keadaan psikologis manusia, diperlukan instrumen observasi dan
wawancara yang reliabel dan valid agar kesimpulan penelitian tidak keliru dan dapat
memberikan gambaran yang tepat mengenai subjek penelitian (Azwar, 1992).
12. Bagaimana cara menggunakan validitas?
Rahayu dan Ardani (2004) menjelaskan bahwa validitas menunjukkan sejauh mana suatu alat
ukur dapat mengukur apa yang hendak diukur. Dalam kegiatan observasi ada beberapa jenis
validitas yang dapat digunakan, yaitu
a. Face validity adalah bagaimana kelihatannya suatu alat pengukur benar-benar menukur apa
yang hendak diukur. Misalnya untuk mengukur kemampuan sebagai seorang supir, seorang
observee harus disuruh mengendarai mobi. Tetapi, bila pengukuran kemampuan mengendarai
mobil dilakukan dengan ujian tertulis tentang teknik mengendarai mobil, maka alat pengukur
tesebut kurang memiliki face validity.
b. Content validity adalah sejauh mana isi alat ukur tersebut mewakili semua aspek yang
dianggap sebagai aspek kerangka konsep. Data harus mencerminkan cir-ciri yang telah
ditentukan yaitu apa saja yang akan diungkap/diukur. Contohnya bila seorang penelitia infin
mengukur keikutsertaan dalam program KB dengan menanyakan metode kontrasepsi yang
dipakai. Bila aspek yang diamati tidak mencakup semua metode kontrasepsi, maka alat ukur
tersebut tidak memiliki validitas isi.
c. Predicty validity adalah alat pengukur yang dibuat oleh peneliti seringkali dimaksudkan untuk
memprediksi apa yang akan terjadi di masa yang akan datang. Contonya ujian seleksi masuk
perguruan tinggi. Ujian tersebut merupakan upaya untuk memprediksi apa yang aan terjadi di
masa yang akan datang. Peserta yang lulus ujian dengan nilai baik diprediksikan akan mengikuti

pelajaran di perguruan tinggi dengan sukses. Soal ujian masuk tersebut dikatakan memiliki
validitas prediktif, apabila ada korelasi yang tinggi antara nilai ujian masuk dengan prestasi
belajar setelah menjadi mahasiswa.
d. Construct validity adalah kerangka suatu konsep. Misalnya, untuk mengukur status ekonomi
responen dengan menggunakan lima komponen status ekonomi, yakni penghasilan perbulan,
pengeluaran perbulan, pemilikan barang, porsi penghasilan yang digunakan untuk rekreasi, dan
kualitas rumah. Apabila ada konsistensi antara komponen-komponen konstruk yang satu dengan
yang lain maka konstruk tersebut memiliki validitas.
e. Concurrent validity dilakukan dengan mengobservasi perilaku dan membandingkannya
dengan perilaku lain. Misalnya perilaku di sekolah sama dengan perilaku di luar kelas
(menunjukkan agresivitas).
Selanjutnya validitas dalam kegiatan wawancara
a. Validitas konstruk. penelitian kualitatif dengan metode observasi dan wawancara tidak terlepas
dari aktivitas melakukan konstruksi sosial. Misalnya, orang yang selalu memakai peci dikonstruk
peneliti sebagai orang yang alim. Konstruksi semacam itu memiliki banyak kelemahan. Oleh
karena itu, perlu diperhatikan beberapa hal, yaitu:
Dalam pengumpulan data, peneliti harus menggunakan multi sumber bukti.
Peneliti harus membangun rangkaian bukti antara satu data dengan data lain.
Agar peneliti meminta orang yang diwawancarai meninjau ulang draft laporan yang disusun.
b. Validitas internal. Hal ini dilakukan pada tahap analisis data. Validitas internal ini meliputi halhal berikut:
Membuat pola penjodohan dengan analisis sebab-akibat atau aksi reaksi atau pengaruhmempengaruhi.
Peneliti hendaknya mengerjakan penyusunan kesplanasi; maksudnya apakah konstruksi yang
dibuat berdasarkan data yang diterima itu dapat dipertanggungjawabkan.
Peneliti hendaknya membuat analisis deret waktu dari peristiwa-peristiwa atau fenomenafenomena yang terjadi.
c. Validitas eksternal. Dalam melakukan validitas ini, hendaknya peneliti menggunakan logika
replikasi. Artinya seandainya penelitian yang sama dilakukan oleh orang lain dengan
menggunakan pendekatan yang sama, niscaya hasilnya akan sama atau hampir sama.
13. Apakah perlu mencari reliabilitas kegiatan observasi?
Mencari reliabilitas dalam kegiatan observasi itu perlu, dimana reliabilitas observasi adalah
keajegan apa yang diobservasi. Agar suatu pengukuran observasi dapat dipercaya, maka idealnya
hasil observasi bila diuji kembali oleh orang lain baik di lain waktu maupun sekarang maka
hasilnya relatif sama.
14. Apakah perlu mencari reliabilitas kegiatan wawancara?
Menurut Neuman (2007), metode wawancara menjadi ciri khas dari penelitan kualitatif.
reliabilitas dengan pendekatan kualitatif lebih menekankan kepada keajegan hasil jawaban yang
dimunculkan oleh subjek. Namun berbeda dengan pendekatan kuantitatif, reliabilitas pada
kualitatif lebih bersifat fleksibel dan berkembang. Sehingga jika pada pendekatan kualitatif
didapatkan data yang berbeda, tidak serta merta disimpulkan bahwa reliabilitasnya rendah tapi
justru menjadi salah satu bentuk memperoleh data yang kaya atau lengkap.

15. Bagaimana menghitung reliabilitas dalam observasi?


Cara mendapatkan reliabilitas observasi adalah berdasarkan kesepakatan observer, Reliabilitas
berarti, apabila dua observer sepakat dalam hasil observasi (Sukadji, 2000). Rumus
kesepakatan juga bisa untuk menghitung hasil dua kali observasi yang dilakukan oleh satu
orang observer (Sukadji, 2000).
Rumus Persentase Kesepakatan sebagai berikut :
Interval Recording
-Agreement of total observation (A tot) total ke dua observer sama-sama setuju baik X
maupun O
Agreement of occurence observation (A occ) sama-sama setuju ada peristiwa observasi
(X)
Agreement of nonoccurence observation (A non) sama-sama setuju tidak ada peristiwa
observasi (O)
Event Recording
Adalah kejadian yang tegas mulai dan berakhirnya kegiatan obesrvasi. Pencatatan bisa dengan
check list, mechanical devices, dan lain-lain. Dalam observasi kelas, rincian perilaku dapat
ditulis dalam bentuk daftar event yang dapat dihitung bila terjadi perilaku yang diinginkan.
Dalam observasi, reliabilitas dan validitas dipengaruhi oleh faktor-faktor antara lain :
a. Observer
Banyak sekali kesalahan yang bersumber dari kualitas pribadi observer yang dapat digolongkan
sebagai kecondongan (bias).
1) Kesalahan yang berkaitan dengan kualitas pribadi observer, antara lain :
a) Central tendency
Observer lebih sering menggunakan kategori yang di tengah dalam skala rating daripada kategori
tepi, sehingga dalam prosesnya cenderung underestimasi perilaku yang intens dan overestimasi
perilaku yang lemah.
b) Leniency (kemurahan)
Observer cenderung membuat penilain yang cenderung ke arah baik terhadap subjek.
c) Efek primacy (kesan pertama)
Observer membiarkan kesan pertama mendistorsikan kesan atau penilaiannya kemudian.
d) Halo effect
Observer membuat penilaian berdasar kesan umum subjek atau berdasar perilaku subjek yang
paling mencolok.
e) Teori pribadi
Observer menyesuaiakn observasi ke asumsi teori pribadi.
f) Nilai pribadi
Observer menyesuaikan observasi ke harapan, nilai, dan minat pribadi.
g) Overestimasi perilaku yang hampir-hampir tidak dikenali ada pada diri observer sendiri.
Misalnya, observer overestimasi volume suara subjek sebab observer sendiri tidak mengenali
bahwa suaranya terlalu rendah volumenya.
h) Kesalahan logika
Observer membuat penilaian yang serupa terhadap sifat-sifat subjek yang kelihatannya secara
logika saling terkait.
i) Kesalahan kontras
Pada sifat khusus, observer menilai subjek jauh lebih berbeda dengan diri observer sendiri
daripada kenyataannya.

j) Kesalahan proksimitas
Observer menilai serupa sifat-sifat tertentu karena bentuk penilaian membuat sifat-sifat itu
berdekatan dalam waktu atau letak.
k) Pengaruh pribadi
Tanpa diketahui oleh observer sendiri, karakteristik diri observer (usia, jenis, kelamin, ras, dan
status sosial) mempengaruhi penilaian perilaku subjek.
l) Ketidakstabilan penilaian observer
Kriteria penilaian yang dipakai oleh observer berubah bersama waktu, akibat ada dan tidaknya
perilaku karena kelelahan, atau belajar, atau penyebab lainnya.
m) Terlewat
Observer alpa mencatat perilaku yang muncul.
n) Commision
Observer keliru kode suatu perilaku.
o) Efek harapan
Harapan observer mempengaruhi pencatatan, atau observer mengharapkan sesuatu terjadi dan
mengkomunikasikan harapan ini kepada subjek.
p) Reaktivitas observer
Observer berubah pencatatan perilakunya karena ia sadar diamati.
q) Isyarat nonverbal
Observer dengan tidak sengaja memberi isyarat kepada subjek sehingga mendukung perilaku
tertentu pada subjek.
2) Ketidakstabilan Penilaian Observer
Bila observasi berlangsung lama, observer mungkin menunjukkan tanda-tanda kelelahan, lupa
dan motivasinya menurun. Misalnya, pada saat permulaan menggunakan standar tertentu untuk
menilai suara bisikan atau vokalisasi singkat, tetapi kemudian berubah standarnya,
ketidakstabilan hal ini mungkin saja terjadi, walaupun telah ada persetujuan mengenai definisi
oprasional perilaku yang diamati.
3) Kesulitan dalam Mengkodekan Perilaku
Kategori global, seperti perilaku off-task atau perilaku tidak patut (innappropriate behavior)
membutuhkan penyimpulan tingkat tinggi dibanding kategori spesifik, seperti memukul, atau
meninggalkan tempat duduk. Meskipun diusahakan sebaik-baiknya mendefinisikan perilaku
dengan cermat, beberapa perilaku memang sulit dikategorikan. Jadi, kode observasi menuntut
pertimbangan yang masak di pihak observer.
4) Memilih Waktu dan Saat yang Tepat
Menentukan waktu yang tepat munculnya suatu kejadian bukanlah semudah yang dibayangkan.
Misalnya, untuk mengobservasi perilaku menolak dan memulai makan pada anak. Sulit untuk
menentukan waktu kapan saat yang tepat anak mulai menolak memulai makan. Selain itu, unit
waktu yang dipilih oleh observer mungkin tidak dapat menggambarkan dengan tepat peta
kejadian perilaku.
16. Bagaimana meningkatkan reliabilitas Observasi?
Adanya kelemahan-kelemahan yang menyebabkan reliabilitas pengukuran menurun (sehingga
validitasnya juga menurun), membuat kita waspada untuk menghindarinya. Beberapa petunjuk
praktis, antara lain :
a. Observer hendaknya memahami benar-benar teknik-teknik pencatatan, manual maupun
instrumental. Pastikanlah dalam rancangannya perilaku-perilaku kritis didefinisikan dengan jelas,

tegas dan cermat.


b. Sebelum melaksanakan observasi, periksalah dulu peralatan-peralatan pengumpul data.
c. Observer perlu latihan sampai mahir sebelum turum ke lapangan.
d. Kumpulkan data dengan mengobservasi subjek dalam berbagai situasi dan waktu, terutama
bila yang diobersevasi kelompok, atau untuk mendapatkan norma.
e. Temukan kecondongan (bias), kelemahan-kelemahan, yang kita miliki sebagai observer, dan
kembangkan ketrampilan pemahaman diri dan evaluasi diri yang kritis.
f. Kembangkan skeptisisme yang sehat terhadap laporan yang telah ada mengenai perilaku
subjek, agar observasi yang kita lakukan dapat seobjektif mungkin.
g. Menunda asumsi dan spekulasi mengenai arti dan implikasi perilaku subjek yang diamati
selagi pengambilan data.
h. Bila pengamatan telah selesai, pertimbangkanlah faktor-faktor yang meyulut dan memelihara
perilaku subjek, serta tanggapan-tanggapan orang lain yang ada di dalam setting subjek atas
perilaku subjek tersebut.
i. Secara periodik bandingkan hasil pengamatan dengan pengamat lain yang menggunakan
sistem penyekoran yang sama.
j. Secara teratur pencatatan harus dikalibrasi yaitu dengan mencocokkan lagi dengan potokol
standar.
k. Ikuti teori-teori dan test-retest mutakhir dalam bidang observasi.
l. Hindari kekeliruan-kekeliruan umum berkenaan dengan observasi sebagaimana telah disebut
terlebih dahulu.
17. Kapan observasi perlu ditentukan reliabilitasnya?
Reliabilitas observasi perlu dilakukan bila data yang dihasilkan berbentuk data kuantitatif.
Pengukuran reliabilitas dapat dilakukan untuk melihat hasil observasi antar observer 1 dengan
observer yang lain (reliabilitas interrater). .
18. Apa beda reliabilitas alat tes dengan reliabilitas untuk kegiatan observasi dan
wawancara?
Perbedaan penerapan reliabilitas dalam alat tes dan obserasi/wawancara dapat dijelaskan dengan
perbedaan pendekatan kuantitatif (untuk alat tes) dan pendekatan kualitatif
(observasi/wawancara). Secara sederhana dapat dikatakan bahwa reliabilitas pada pendekatan
kuantitatif bersifat tetap dan statis sedangkan reliabilitas pengukuran dengan pendekatan
kualitatif bersifat berkembang dan tumbuh bersama kedekatan antara observer dengan observee
(Neuman, 2007).
19. Bagaimana cara menggunakan reliabilitas?
Kita dapat menggunakan nilai reliabilitas untuk menunjukkan tingkat kepercayaan terhadap alat
ukur yang sudah kita buat. Nilai reliabilitas berkisar pada nilai 0-1, dimana semakin mendekati 1
maka dapat dikatakan alat ukur tersebut semakin dapat dipercaya. Dipercaya disini dimaksudkan
bahwa suatu alat tes apabila dilakukan tes ulang atau diadministrasikan oleh tester lain maka
akan keluar nilai yang relatif tetap (ajeg).

20. Jika sebuah alat tes mencapai validitas namun tidak reliabel, bagaimana kualitas alat
tes tersebut? Dan bagaimana jika terjadi kebalikannya?
Validitas dan reliabilitas bersifat saling melengkapi namun terkadang juga dapat bersifat bertolak
belakang (Neuman, 2007). Dalam suatu contoh misalnya ada suatu alat ukur yang memiliki
validitas tinggi namun memiliki reliabilitas rendah, hal ini dapat terjadi dalam pengukuran
dengan pendekatan kualitatif. Misalnya konstrak yang diukur merupakan suatu konstrak yang
sangat abstrak yaitu alienasi yang digali melalui metode wawancara, hal ini mungkin dapat
dikatakan memiliki validitas yang tinggi namun reliabilitas yang rendah karena tergantung pada
bagaimana peneliti menggunakan instrumen penelitian.
Contoh lain misalnya suatu alat ukur yang memiliki reliabilitas yang tinggi namun validitasnya
rendah. Berdasarkan pernyataan tersebut dapat dikatan bahwa suatu alat ukur memiliki keajegan
dalam mengukur namun kurang tepat dalam mengukur apa yang hendak diukur. untuk
memudahkan pembahasan ini penulis mengutip gambar dari Neuman (2007) sebagai berikut:
Berdasarkan gambar diatas dapat dilihat bahwa ketika ketika suatu alat tes memiliki reliabilitas
yang tinggi namun validitas rendah tidak dapat mengenai sasaran terhadap apa yang ingin diukur.
Berdasarkan penjabaran tersebut maka dapat dikatakan bahwa ketika suatu alat tes memiliki
reliabilitas yang tinggi namun validitas yang rendah maka alat ukur itu memiliki kualitas yang
rendah. Namun sebaliknya, jika suatu alat ukur valid maka kemungkinan besar reliabilitasnya
akan dapat mengikuti menjadi baik juga. Secara sederhana dapat diakatakan bahwa suatu alat
ukur yang valid akan cenderung memiliki reliabilitas yang tinggi namun alat ukur yang memiliki
reliabilitas yang tinggi belum tentu valid.
DAFTAR PUSTAKA
Azwar, S. (1992). Reliabilitas dan Validitas. Yogyakarta: Penerbit Sigma Alpha.
Azwar, S. (1997). Reliabilitas dan Validitas(Ed. 3). Yogyakarta: Pustaka Pelajar.
Louis, J. (2011). Validitas dan reliabilitas. Diakses pada tanggal 11 November 2014 dari
http://jeffy-louis.blogspot.com/2011/02/validitas-dan-reliabilitas.html
Neuman, W. L., (2007). Basic Social Research Methods: Qualitative & Quantitative Approachs
(2ed). Boston: Allyn & Bacon.
Rahayu, I.T. dan Ardani, T.A. (2004). Observasi dan Wawancara. Malang: Bayumedia
publishing.
Sattler, J.M. (2002). Assessment of Children. California: Penerbit Sattler.
Sudijono, A. (2009). Pengantar Evaluasi Pendidikan. Jakarta: Rajawali Press.
Sukadji, S. (2000). Psikologi pendidikan dan psikologi sekolah (Direvisi dan Dilengkapi).
Depok: Universitas Indonesia.

Anda mungkin juga menyukai