Anda di halaman 1dari 60

VALIDITAS DAN

REALIBILITAS
INSTRUMEN
Yusuf Alam Romadhon

Validitas

Validitas berasal dari bahasa Latin


validus yang berarti kuat, strong,
robust
Perlu dibedakan dua buah konsep
validitas:
1. Validitas penelitian;
2. Validitas pengukuran

Validitas Penelitian
Validitas penelitian adalah derajat
kebenaran kesimpulan yang ditarik
dari sebuah penelitian, baik
penelitian yang bertujuan menguji
hipotesis atau mengestimasi
kekuatan hubungan variabel atau
efek intervensi, yang dinilai
berdasarkan metode penelitian yang
digunakan, keterwakilan sampel
penelitian, dan sifat populasi asal

Contoh Validitas Penelitian


Sebuah meta-analisis dari 18 studi
menyimpulkan bahwa penggunaan telepon
seluler 10 tahun meningkatkan risiko tumor
otak, yakni neuroma akustik dan glioma
(Hardell et al., 2007) merupakan validitas
penelitian
Andaikata sesungguhnya penggunaan telepon
seluler 10 tahun tidak meningkatkan risiko
tumor otak, maka kesimpulan penelitian
tersebut tidak valid (tidak benar)

Validitas Pengukuran
Validitas pengukuran merupakan
pernyataan tentang derajat kesesuaian
hasil pengukuran sebuah alat ukur
(instrumen) atau pengukuran dengan apa
yang seharusnya akan diukur oleh peneliti
Pengukuran variabel harus benar (valid)
agar diperoleh data yang valid
Validitas pengukuran menentukan
validitas penelitian

Hubungan Antara Reliabilitas dan Validitas


Konsistensi
praktis, penilaian
kuantitatif

Reliabilitas pengukuran
intra & antarpengamat
Konsistensi
internal item-total,
belah
Content
paroh,KR-20,
relevance
Cronbach

Face
validity
(outer look
validity)

Content validity

Criterion
validity
(bandingkan dgn
gold standard)

Construct
validity
(theoretical
validity)

Relevansi
teoretis,
penilaian
kualitatif

Contoh Validitas Pengukuran


Suatu prosedur diagnostik menentukan bahwa
seorang mengidap penyakit, padahal
sesungguhnya orang tersebut tidak mengalami
penyakit tersebut, maka pengukuran dengan
prosedur diagnostik tersebut tidak
menunjukkan validitas pengukuran disebut
False Positive
Sebaliknya jika seorang yang berpenyakit tidak
didiagnosis sebagai sakit oleh prosedur
diagnostik, maka pengukuran dengan prosedur
tersebut tidak menunjukkan validitas
pengukuran disebut False Negative

Dimensi Validitas
Pengukuran

Validitas
Validitas
Validitas
Validitas

Isi
Muka
Konstruk
Kriteria

Validitas Isi

Validitas isi (content validity) merujuk kepada


derajat kesesuaian hasil pengukuran variabel
yang diteliti oleh sebuah alat ukur dengan isi
(content) dari variabel tersebut sebagaimana
yang dimaksudkan oleh peneliti.
Validitas isi mencakup dua aspek:
1. Relevansi isi (content relevance),
2. Liputan isi (content coverage) (Messick,
1980, dikutip oleh Streiner dan Norman,
2000).

Relevansi Isi dan Liputan Isi


Relevansi isi (content relevance)
merujuk kepada kesesuaian antara
masing-masing item pengukuran
dengan isi variabel yang diukur.
Cakupan isi (content coverage)
merujuk kepada lingkup item
pengukuran dalam meliput segala
aspek isi variabel yang diukur.

Matriks untuk Menilai Validitas Isi


Modal Sosial
Content Area (Cakupan Isi)
Pertanyaan

Dimensi Struktural
Network

Trust

Norms of
reciprocity

2
3

Associations

Dimensi Kognitif

x
x
x

Validitas Muka
Validitas muka (face validity)
merujuk kepada derajat kesesuaian
antara penampilan luar alat ukur dan
atribut-atribut variabel yang ingin
diukur.
Contoh, jika alat ukur merupakan
kuesioner, maka item-item
pertanyaan dalam kuesioner harus
dapat dipahami oleh subjek
penelitian dengan benar.

Validitas Konstruk

Validitas konstruk (construct


validity) merujuk kepada
kesesuaian antara hasil pengukuran
alat ukur dengan konsep (konstruk)
teoretis tentang variabel yang
diteliti
Validitas konstruk:
1. Validitas Konvergen
2. Validitas Diskriminan

Validitas Konvergen
Validitas konvergen (convergent validity) merujuk
kepada derajat kesesuaian antara atribut hasil
pengukuran alat ukur dan konsep-konsep teoretis
yang menjelaskan keberadaan atribut-atribut dari
variabel tersebut.
Contoh, jika berdasarkan teori, kecemasan
ditandai oleh bukti-bukti adanya telapak tangan
berkeringat, takhikardia, gerakan mondar-mandir,
dan kesulitan memusatkan perhatian, maka
sebuah alat ukur kecemasan dikatakan memiliki
validitas konvergen apabila berkorelasi dengan
bukti-bukti tersebut

Validitas Diskriminan
Validitas diskriminan (discriminant validity)
merujuk kepada derajat ketidaksesuaian
antara atribut-atribut yang seharusnya tidak
diukur oleh alat ukur dan konsep-konsep
teoretis tentang variabel tersebut.
Contoh, jika teori patofisiologi menyatakan
bahwa kecemasan tidak dimanifestasikan
dalam bentuk tingkat kebotakan kepala
(alopecia), maka pengukuran yang memiliki
validitas diskriminan seharusnya tidak
berkorelasi dengan tingkat kebotakan kepala

Validitas Kriteria

Validitas kriteria (criterion validity)


merujuk kepada kesesuaian antara
hasil pengukuran sebuah alat ukur
dengan alat ukur ideal (standar
emas), tentang variabel yang diteliti
Validitas kriteria:
1. Validitas Sewaktu
2. Validitas Prediktif

Validitas Sewaktu
Validitas sewaktu (concurrent
validity, simultaneous validity)
merujuk kepada kesesuaian hasil
pengukuran antara suatu alat ukur
dan alat ukur ideal (standar emas)
pada waktu yang sama.

Contoh Validitas Sewaktu


Contoh, angiografi merupakan prosedur
diagnostik definitif untuk stroke, tetapi invasif
dan mengandung risiko kematian sebesar 1%
(Rosner, 1990).
Positron Emissions Tomography (PET) scanner
mendiagnosis stroke dengan mengukur aliran
darah otak secara non-invasif dan lebih aman.
Derajat kesesuaian antara hasil pengukuran
PET scanner dan pengukuran angiogram
merupakan validitas sewaktu.

Validitas Prediktif
Validitas prediktif (predictive validity,
prognostic validity) merujuk kepada
kesesuaian antara hasil pengukuran alat
ukur sekarang dan hasil pengukuran
standar emas di masa mendatang.
Berbeda dengan validitas sewaktu, hasil
pengukuran standar emas dalam validitas
prediktif belum tersedia saat ini,
melainkan baru diketahui beberapa waktu
mendatang

Penilaian Validitas
Pada umumnya validitas isi, validitas
muka, validitas konstruk dinilai
secara subjektif dan kualitatif oleh
pakar (validity by assumption)
Validitas kriteria dan pada sebagian
kecil kasus validitas konstruk bisa
dinilai secara kuantitatif

Format Tabel 2x2 untuk Menilai


Validitas Kriteria
Pengukuran standar emas
Positif

Negatif

Total

Pengukuran

Positif

TP

FP

TP+FP

alat ukur baru

Negatif

FN

TN

FN+TN

TP+FN

FP+TN

Total

Ukuran Validitas Sewaktu


TP
SensitivitasTP=
FN
TN
Spesififitas TN=
FP

Sensitivitas dan spesifisitas makin


mendekati 100% makin valid

Ukuran Validitas Prediktif


TP
Nilai Prediktif Positif (NPP)
=
TP FP

TN

Nilai Prediktif Negatif (NPN)


=
TN FN
NPP dan NPN makin mendekati 100%
makin valid

Reliabilitas

Alat ukur (instrumen) yang baik


harus mengukur dengan benar
(valid) dan konsisten (andal,
reliabel).
Terdapat dua aspek reliabilitas alat
ukur:
1. Konsistensi internal
2. Stabilitas.

Contoh Konsistensi Internal


Jika sebuah instrumen terdiri dari
sejumlah item pertanyaan (misalnya,
kuesioner untuk menilai depresi),
maka skor dari masing-masing item
pertanyaan seharusnya berkorelasi
dengan skor semua item

Contoh Stabilitas
Sebuah alat timbang berulang kali
mengukur 5kg 0kg dari bobot bayi,
sedang alat timbang lainnya mengukur
5kg 4kg dari bobot bayi yang sama
Bisa disimpulkan bahwa pengukuran
dengan alat timbang pertama lebih
stabil daripada alat timbang kedua.
Stabilitas bisa dipandang sebagai
konsistensi eksternal

Hubungan Antara Reliabilitas dan Validitas


Konsistensi
praktis, penilaian
kuantitatif

Reliabilitas pengukuran
intra & antarpengamat
Konsistensi
internal item-total,
belah
paroh,KR-20,
Content
Cronbach
relevance

Face
validity
(outer look
validity)

Content validity

Criterion
validity
(bandingkan dgn
gold standard)

Construct
validity
(theoretical
validity)

Relevansi
teoretis,
penilaian
kualitatif

Cara Penilaian Konsistensi


Internal

Konsistensi internal dapat dinilai


dengan dua cara:
1. Korelasi item-total;
2. Reliabilitas belah-paroh.

Korelasi Item-Total
Korelasi item-total (item-total
correlation) menilai konsistensi
internal alat ukur dengan
mengorelasikan masing-masing item
dan total pengukuran, minus item
yang bersangkutan.

Nilai Batas Korelasi ItemTotal


Prinsipnya, suatu item dapat digunakan
dalam alat ukur jika memiliki korelasi itemtotal > 0.20.
Item yang berkorelasi lebih rendah
hendaknya disingkirkan, atau ditulis ulang.
Tetapi item yang berkorelasi terlalu tinggi
(>0.90) perlu dicermati karena mungkin
merupakan akibat dari redundansi
(duplikasi) pengukuran, sehingga salah
satu item perlu disingkirkan.

Reliabilitas Belah Paroh


Reliabilitas belah-paroh (split-half
reliability) menilai konsistensi
internal (homogenitas) alat ukur
dengan cara membagi item-item
secara random ke dalam dua bagian
alat ukur, lalu mengorelasikan kedua
bagian tersebut.
Prinsipnya, jika alat ukur memiliki
konsistensi internal, maka kedua
bagian akan berkorelasi tinggi

Ukuran Reliabilitas Belah


Paroh
Korelasi Spearman Brown
Kuder-Richardson 20 (KR-20)
Alpha () Cronbach

Cutoff Alpha () Cronbach


Cutoff minimal alpha Cronbach untuk
sebuah alat ukur adalah 0.60.
Sejumlah penulis menggunakan
cutoff 0.70 untuk mengklasifikasi
konsistensi internal sebagai
memadai, dan 0.80 sebagai baik
(Streiner dan Norman, 2000; Garson,
2008).

Aspek Stabilitas

Stabilitas mencakup:
1. Stabilitas ketika digunakan pada
waktu berbeda (test-retest reliability)
2. Stabilitas ketika digunakan seorang
pengamat pada dua kesempatan
berbeda (intra-observer reliability)
3. Stabilitas ketika digunakan pengamat
berbeda pada kesempatan sama
dengan kondisi yang identik (interobserver reliability

Ukuran Stabilitas
Korelasi (r) Pearson
Intraclass Correlation (ICC)
Kesepakatan Kappa Cohen (K)

Nilai Batas Stabilitas


Pada umumnya para penulis
menyarankan agar alat ukur
menunjukkan stabilitas dengan
koefisien korelasi (r) >0.50.
Alat ukur memiliki stabilitas
memadai jika koefisien reliabilitas
antar pengukuran >0.5, dan
stabilitas tinggi jika koefisien
reliabilitas antar pengukuran 0.8
(Streiner dan Norman, 2000; Polgar

Interpretasi Nilai Kappa


Menurut Landis dan Koch (1977)

Nilai K

Kekuatan kesepakatan
0.40

Buruk

0.41 -

0.75

Sedang

0.76 -

1.00

Baik

Interpretasi Nilai Kappa


Menurut Altman (1991)
Nilai K

Kekuatan kesepakatan
0.20

Buruk

0.21 -

0.40

Kurang dari sedang

0.41 -

0.60

Sedang

0.61 -

0.80

Baik

0.81 -

1.00

Sangat baik

Contoh Menilai Konsistensi Internal


dengan SPSS

Alpha Cronbach

Masukkan Item-Item yang Akan


Dinilai Konsistensinya

Pilih Ukuran-Ukuran
Reliabilitas

Riset Empiris dan


Pengukuran
Hakikat pengumpulan data dalam
riset empiris adalah mengukur
variabel
Pengukuran (measurement) adalah
prosedur menentukan kualitas atau
kuantitas dari karakteristik subjek
penelitian yang disebut variabel

Kesalahan Pengukuran dan Validitas


Hasil Penelitian
Kesalahan pengukuran (measurement bias,
measurement error) menghasilkan data yang
tidak valid
Data yang tidak valid menyebabkan bias
informasi, dan hasil analisis penelitian tidak valid,
tidak benar, tidak sah
Kesalahan pengukuran merupakan persoalan
yang lebih serius daripada ukuran sampel
(sample size) yang tidak cukup besar
Kesalahan pengukuran mengancam validitas
kesimpulan penelitian; ukuran sampel tidak
mengancam validitas kesimpulan penelitian

Variabel

Variabel adalah karakteristik subjek


penelitian yang memiliki variasi
atribut atau nilai. Contoh:
Jenis kelamin adalah variabel yang
memiliki variasi atribut laki-laki dan
perempuan.
Umur adalah variabel yang memiliki
variasi nilai (tahun).
Depresi adalah variabel yang memiliki
variasi nilai (skor).

Tingkat Pengukuran
Variabel

Atribut

Nilai-nilai
Hubungan

Pendapatan

Rendah

Sedang

Tinggi

Data dan Informasi


Pengukuran variabel menghasilkan
sekumpulan nilai atau atribut dari individuindividu yang disebut data
Data dianalisis untuk menghasilkan
informasi.
Informasi diinterpretasikan dan digunakan
oleh pengguna hasil penelitian
Data merupakan bahan mentah, informasi
merupakan hasil analisis data

Jenis Variabel
Jenis variabel

Kategorikal

Nominal
(Seks, ras)

Ordinal
(Stadium kanker,
kelas sosial)

Kontinu

Interval
(Suhu skala C)

Dependen
(Ca rongga
mulut)

Rasio
(denyut nadi,
elektrolit serum)

Independen
(Merokok)

-------- = Area abuabu

Variabel Kategorikal
dan Kontinu
Variabel
kategorikal
(diskret)

(Terdapat
kesenjangan antar
nilai)

( Variabel kontinu

(Tidak terdapat
kesenjangan antar nilai)

Jenis Variabel
Menentukan Jenis Data
Pengukuran variabel kategorikal
menghasilkan data kategorikal
Pengukuran variabel kontinu
menghasilkan data kontinu

Dummy Variable
Dummy variable (=indicator variable, design
variable) adalah variabel rekaan yang memiliki
sebuah dari dua kemungkinan nilai kualitatif,
sebuah menunjukkan keberadaan suatu kondisi
(diberi kode 1), lainnya menunjukkan ketiadaan
kondisi itu (diberi kode 0).
Angka 1 dan 0 dalam dummy variable tidak
menunjukkan nilai kuantitatif (dummy artinya
kosong), melainkan kategori.
Angka 1 dan 0 berfungsi sebagai penunjuk,
sehingga disebut indicator variable.

Variabel Dependen
dan Independen
Variabel dependen adalah variabel yang
dihipotesiskan dipengaruhi (dependen)
oleh variabel lain.
Variabel independen adalah variabel
yang dihipotesiskan mempengaruhi
variabel lainnya.
Dapat ditulis sebagai berikut:
Y = a + b1X1

Variabel Dependen
dan Independen
Variabel dependen

Variabel independen

Variabel terikat (tergantung)

Variabel bebas

Variabel terpengaruh (efek)

Variabel yang mempengaruhi

Variabel yang dijelaskan (explained


variable)

Variabel yang menjelaskan


(explanatory variable)

Variabel hasil (outcome variable)

Faktor penelitian (study factor)

Regresan

Regresor

Prediktan

Prediktor

Respons

Stimulus

Endogen

Eksogen, variabel luar


(extraneous variable)

Contoh Dummy Variabel


untuk Variabel 5 Kategori
Indeks Massa Tubuh (BMI)

D1

D2

D3

D4

Berat badan kurang (< 18.5 kg/m2)

Normal (19-22.9 kg/m2)

Berisiko obesitas (23.-24.9 kg/m2)

Obese I (25-29.9 kg/m2)

Obese II ( 30 kg/m2)

Variabel Perancu

Faktor perancu (confounding factor)


merupakan faktor ketiga (third
factor) yang memenuhi syarat sbb:
1) Merupakan faktor risiko penyakit,
2) Berhubungan dengan paparan,
3) Bukan merupakan variabel antara
dalam mekanisme kausal
paparan-penyakit.

Variabel Perancu
Urutan kelahiran
(Paparan)

Down syndrome
(Penyakit)

Umur ibu
(Faktor perancu)

Pengubah Efek
(Effect Modifier)
Pengubah efek (effect modifier)
merupakan faktor ketiga yang
memodifikasi (= mengubah)
pengaruh paparan terhadap
penyakit.
Pengubahan efek (effect
modification) disebut juga interaksi
(interaction).

Modifikasi Pengaruh Umur terhadap


TDS oleh Gender
TDS

Laki-laki

TDS

Perempuan

Umur
(a) Tidak ada
interaksi

Laki-laki
Perempuan

Umur
(b) Ada interaksi

Jenis kelamin merupakan pengubah


efek umur terhadap tekanan darah
sistolik

Pengubah Efek dan Variabel


Perancu
Faktor perancu mengakibatkan distorsi
taksiran pengaruh paparan terhadap
penyakit
Pengubah efek tidak mengakibatkan
distorsi taksiran tersebut, melainkan
mengubah pengaruh paparan, sesuai
dengan level dari pengubah efek tersebut.
Perancuan perlu dikontrol; modifikasi efek
tidak perlu dikontrol melainkan
dideskripsikan.

Terima Kasih