Anda di halaman 1dari 76

INSTRUMEN PENELITIAN,

VALIDITAS & RELIABILITAS


Dr. dr. Titiek Hidayati M. Kes.
Dept. Epidemiologi, kesehatan masyarakat dan
kedokteran keluarga, FKIK UMY

1
Introduction

 Scientific method:
 Metode ilmiah:
 Sebuah pertukaran yang kompleks antara teori dan
observasi, sarana komunikasi mereka menjadi
pengukuran
 Mengukur adalah prosedur yang menyediakan sarana
yang berkaitan konsep untuk satu set pengamatan
terkontrol yang harus menyediakan memerintahkan
pengetahuan tentang konsep

2
Instrument

 A measuring device for determining the


present value of a quantity under observation

3
Data dan Instrument
 Data dapat kita peroleh dengan suatu alat ukur
(instrumen penelitian) sesuai dengan data yang
akan kita ambil, misalnya data yang kita ambil
adalah berat badan, maka alat ukur yang akan
kita gunakan adalah timbangan berat badan.
 Instrumen penelitian adalah alat-alat yang akan
digunakan untuk pengumpulan data. Instrumen
penelitian ini dapat berupa kuesioner (daftar
pertanyaan), formulir observasi, formulir-formulir
lain yang berkaitan dengan pencatatan data dan
sebagainya.
 Apabila data yang akan dikumpulkan itu
adalah data yang menyangkut pemeriksaan
fisik maka instrumen penelitian ini dapat
berupa stetoskop, tensimeter, timbangan,
meteran atau alat antropometrik lainnya
untuk mengukur status gizi, dan alat
laboratorium dan sebagainya.
Validitas dan Reabilitas

 Kuesioner baru dapat digunakan sebagai alat


ukur penelitian apabila telah dilakukan uji
validitas dan reliabilitas.
 Kuesioner tersebut harus diuji coba ”trial” di
lapangan. Responden yang digunakan untuk
uji coba memiliki ciri-ciri yang sama atau
hampir sama dengan responden dari tempat
di mana penelitian tersebut harus
dilaksanakan.
Measurement Principles

 Measurement terdiri dari :


 aturan untuk menempatkan nilai
(numerik atau nominal) ke objek atau
peristiwa dengan cara seperti untuk
mewakili kuantitas, kualitas, atau
kategori dari atribut.

7
Measurement Scales
(Stevens, 1951)

Type of Basic empirical operation


measurement
Nominal Determination of equality of categories

Ordinal Determination of greater than or less


than (ranking)

Interval Determination of equality of differences


between levels

Ratio Determination of equality of ratios of


levels

8
Measurement Scales
(Hulley et al., 2001)
Type of Characteristics Example Descriptive Information
Measurement of Variable Statistics Content
Categorical

Nominal Unordered Sex; blood Counts, Lower


categories type; vital proportions
status

Ordinal Ordered Degree of pain In addition to the Intermediate


categories with above: medians
intervals that are
not quantifiable
Continuous or Ranked spectrum Weight; In addition to the Higher
Ordered with quantifiable number of above: means,
discrete intervals cigarettes/day standard
deviations

9
Reliability
 Reliability = reproducibility, repeatability
 the extent to which the same measure will
consistently provide the same results
 concern mainly with chance or random errors
 Can be attributed to the subjects under study,
the observers, the situations, the instruments,
and/or the processing
 Basic ways to assess reliability:
 Inter-rater reliability
 Intra-rater reliability
 Split-half reliability
 Test-retest reliability 10
 Validity = accuracy
 the extent to which a particular measure reflects what is
supposed to measure
 concern mainly with systematic error

 The sources of error may be the same as for reliability, but


may also be due to:
 the inappropriate use of the instrument or
 erroneous underlying theory
 Types of validity:
 Face (consensual) validity
 Criterion validity:
 concurrent and predictive validity

 sensitivity and specificity

 Content validity
11
Validitas Pengukuran

1. Alat ukur
2. Metode ukur
3. Pengukur (peneliti)
Ketiga unsur inilah yang akan menentukan apakah hasil suatu
pengukuran valid atau tidak, walaupun alat dan metode
yang dipilih telah baku dan valid, tetapi kalau pelaksanaan
pengukurannya kurang tepat dan teliti, maka hasilnya
akan tidak valid.
Metode ukur yang dipakai menjadi acuan penelitian. Jika
dengan menggunakan metode ini, hasil penelitian valid,
maka secara umum metode ini sahih dan kita bisa
menggunakan metode ini untuk penelitian yang sama di
tempata dan waktu yang berbeda.
Validitas
 Kesahihan pengukuran dipengaruhi oleh bias
pengukuran (measurement bias); makin besar
bias, maka makin kurang sahih pengukuran.
Terdapat 3 bias pengukuran :
 Bias pengamat, distorsi yang konsisten, baik
disadari/tidak yang dilakukan oleh pelaksana
pengukuran dalam menilia atau melaaorkan hasil
penelitian. Misal : Pengamat akan cenderung
memperoleh tekanan darah lebih renndah pada
kelompok pasien yang diobati daripada kontrol
 Bias subyek, distorsi yang konsisten oleh
subyek penelitian. Bila seseorang tahu ia
sedang menjalani penelitian, ia akna cenderung
bekerja lebih baik.
 Bias instrument, kesalahn sistematik terjadi
akibat ketidakakuratan alat ukur. Sehingga
untuk menghindari kesalahan tersebut, kita perlu
melakukan standarisasi, pelatihan,
penyempurnaan alat ukur, dan automatisasi,
ditambah:melakukan pemeriksaan tanpa setahu
subyek, melakukan pemeriksaan tanpa identitas
subyek, kalibrasi alat .
 Ada 2 macam validitas penelitian yaitu: validitas
dalam dan validitas luar.
 Validitas dalam adalah kesahihan penelitian
yang menyangkut pertanyaan : sejauh mana
perubahan yang diamati dalam suatu penelitian
(terutama penelitian eksperimental) benar-benar
hanya terjadi karena perlakuan yang diberikan
(variabel perlakuan) dan bukan karena
pengaruh faktor lain (variabel luar).
 Validitas luar adalah kesahihan penelitian yang
menyangkut pertanyaan : sejauh mana hasil
suatu penelitian dapat digeneralisasikan pada
populasi induk (asal sampel penelitian diambil).
Faktor- - Faktor Yang Mempengaruhi
Validitas Penelitian

1. Validitas pengukuran
2. Adekuatitas rancangan penelitian
3. Analisis data
 Ketiga faktor tersebut akan mempengaruhi
baik validitas dalam maupun validitas luar
penelitian, dengan sendirinya juga
mempengaruhi konsekuensi dan medan
generalisasi hasil penelitian
Internal Validity
Type Subset Meaning
Face validity Measurement validity Extent to which a method
Internal consistency measure what it is intended to
measure
Content validity Extent to which questionnaire
items cover the research area of
interest
Criterion validity Predictive utility Agreement with a “gold
Concurrent validity standard”
Diagnostic utility
Construct validity Criterion-related validity Agreement with other tests
Convergent validity
Discriminant validity

17
Jenis Validitas Pengukuran

Dalam hal ini hanya akan diuraikan pembagian


validitas pengukuran paling sederhana yang
mempunyai manfaat praktis pada
pengukuran fenomena kedokteran yaitu
1. Validitas isi,
2. Validitas kriterium
3. Validitas konstruk
VALIDITAS ISI

 Validitas isi adalah tingkat representativitas isi atau


substansi pengukuran terhadap konsep (pengertian)
variabel sebagaimana dirumuskan dalam definisi
operasional.
 Pengukuran yang dilakukan oleh seorang peneliti
pada hakekatnya merupakan pengukuran terhadap
sebagian dari keseluruhan variabel, maka
pengukuran yang dilakukan adalah sampel dari
universum tersebut. Masalahnya adalah apakah
sampel tersebut representatif terhadap universum
yang dimaksud, atau hanya mencerminkan
sebagian saja, atau bahkan ada di luar universum
 Masalah yang menyangkut pengukuran di
bidang kedokteran klinik dan laboratorik
sebagian besar menyangkut validitas isi.
 Misalnya pengukuran suhu, jumlah sel darah,
visus, suara jantung, dsb. Semua
pengukuran tersebut sudah cukup jelas
validitasnya karena menyangkut fenomena
biologik yang lebih eksak sifatnya.
 Pengukuran suhu dengan termometer telah
cukup jelas memenuhi kriteria validitas isi,
suhu mempunyai sifat merambat dari suatu
benda (tubuh penderita) ke benda lain
(termometer, air raksa), perubahan suhu
mempengaruhi volume air raksa, sehingga
panjang kolom termometer yang terisi air
raksa representatif untuk menggambarkan
perubahan suhu.
 Pada bidang kedokteran yang mendalami fenomena
sosial
 Misalnya pengukuran tentang ”persepsi ibu terhadap
program makanan tambahan ”, ”perilaku keluarga terhadap
pemberantasan sarang nyamuk”.
 Pengukuran terhadap persepsi, perilaku dan sikap tersebut
tidak dapat dilakukan dengan menggunakan alat ukur yang
sesederhana termometer, tetapi dengan mengajukan
sejumlah pertanyaan melalui teknik wawancara atau
kuesioner. Masalahnya apakah jawaban atas pertanyaan
tersebut benar-benar menggambarkan persepsi, perilaku
atau sikap di atas ? Disinilah diperlukan uji validitas.
Glossary
Term Meaning
Items Individual questions in a questionnaire
Constructs Underlying factors that cannot be measured
directly, e.g. anxiety or depression, which are
measured indirectly by the expression of several
symptoms or behaviors
Domain A group of several questions that together estimate
a single subject characteristic, or construct
Instrument Questionnaire or piece of equipment used to collect
outcome or exposure measurements
Generalizability Extent to which the study results can be applied in
a wider community setting
23
Methods to increase content validity

 The presence and the severity of the disease


are both assessed
 All characteristics relevant to the disease of
interest are covered
 The questionnaire is comprehensive in that
no important areas are missed
 The questions measure the entire range of
circumstances of an exposure
 All known confounders are measured
24
Methods for assessing validity
Type of validity Sub-categories Type of measurement Analyses
External validity Categorical or continuous Sensitivity analyses
Subjective judgments
Internal validity Face and Categorical or continuous Judged by experts
content validity Factor analysis
Cronbach’s alpha
Criterion and Both categorical Sensitivity
construct validity Specificity
Predictive power
Likelihood ratio
Logistic regression
Continuous to predict categorical ROC curve
Both continuous and the units Measurement error
the same ICC
Mean-vs-differences plot
Both continuous and the units Linear or multiple regression
different

25
26
Scale

 Is an instrument to measure clinical


phenomena
 A score is a value on the scale in a given
patient

27
Scale anatomy

 Scales consist of one or more elements or


questions and their answers
 The answers may be either dichotomous,
yes/no, or ranked-ordered

28
Ranks for an individual scale
element or question

 Must assess a single type of qualitative


phenomena
 Have ranking that is clearly defined and
mutually exclusive
 Be arranged hierarchically

29
Three basic functions of a scale:

 Predictive (staging systems)


 Evaluation
 Description

30
Scale physiology

 Reproducibility
 Validity
 Responsiveness

31
Staging

 The definition of staging implies that a


disease has different grades of severity in
various patients or that the disease changes
over time

32
Clinical disagreement
 History taking  Wrong (inaccurate) in
the light of other,
 Physical examination
“harder” evidence (gold
 Interpreting results of standard)
diagnostic tests
 Inconsistent (imprecise)
 Making diagnosis and if simultaneous clinical
therapeutic examination of the same
recommendations patient by other
The failure to help patients clinicians or a second
who could be helped examination by the same
The violation of examiner leads to
Hippocrates’ admonition disagreement
“Above all, do no harm”  Inter-observer
33
Measure of agreement

 Kappa statistic: agreement beyond chance


 <0 very poor
 0 – 0.20 poor
 0.21 – 0.40 fair
 0.41 – 0.60 moderate
 0.61 – 0.80 good
 0.81 – 1 excellent

34
Etiology of clinical disagreement

 The examiner
 Biologic variation in the senses
 The tendency to record inference rather than
evidence
 Ensnarement by diagnostic classification
schemes
 Entrapment by prior expectation

35
Etiology of clinical disagreement

 The examined
 Biologic variation in the system being examined
 Effect of illness and medications
 Memory and rumination

36
Etiology of clinical disagreement

 The examination
 Disruptive environments for the examination
 Disruptive interactions between examiners and
examined
 Incorrect function or use of diagnostic tools

37
Definitions of normal

 Dichotomous: “normal” and “abnormal”


 No sharp dividing line between normal and
abnormal:
 Abnormal = unusual
 Gaussian
 Percentile
 Abnormal = associated with disease
 Abnormal = treatable

38
Contoh

39
Pengujian Validitas Isi
 Dilakukan dengan analisis teoritik apakah alat ukur (pertanyaan-
pertanyaan) tersebut secara logika mengeksplorasikan indikator-
indikator fenomena psikososial tersebut, seperti halnya analisis
terhadap kerja termometer sebagai alat pengukur suhu di atas.
 Pendekatan lain dengan cara uji coba alat ukur pada
sekelompok subyek. Pertama-tama sekelompok subyek diukur dulu
dengan alat ukur tersebut, kemudian terhadap mereka diberi
perlakuan yang jelas-jelas akan mempengaruhi variabel yang
diukur, kemudian dilakukan pengukuran lagi dengan alat dan
metode ukur yang sama. Perbedaan hasil uji awal dengan hasil uji
akhir itulah yang menunjukkan bahwa alat dan metode ukur yang
dicoba mempunyai validitas isi yang baik atau tidak.
 Sebagai contoh : untuk menilai perilaku ibu
terhadap pembuatan menu keluarga sehat
dilakukan tes awal dengan sejumlah pertanyaan
yang akan diuji validitasnya, kemudian kepada
mereka diberikan kursus dan praktek intensif
tentang menu keluarga sehat. Setelah itu
dilakukan tes akhir dengan alat dan metode
yang sama. Interpretasi : perbedaan hasil tes
awal dengan tes akhir menunjukkan validitas uji
tersebut.
 Validitas isi ini identik dengan validitas dalam
penelitian, yaitu mengenai sampel yang diambil
apakah representatif atu tidak.
VALIDITAS KRITERIUM
 Validitas kriterium (validitas prediksi) adalah sifat
yang menggambarkan tingkat keterandalan
instrumen pengukuran (prediktor) untuk
meramal keadaan atau kemampuan tertentu
(kriterium) subyek.
 Misalnya, suatu paket uji keseimbangan tubuh
(fungsi vestibuler) dijadikan sebagai alat seleksi
bagi para calon penerbang pesawat. Kalau
setelah diterima dan menjadi penerbang
pesawat ternyata ketrampilan pengemudi
pesawat yang berkaitan dengan fungsi
vestibuler tersebut jelek, berarti validitas
kriterium alat uji tersebut rendah.
 Pengujian terhadap validitas kriterium
dilakukan dengan membandingkan hasil uji
prediktor (yang akan diuji validitasnya)
dengan hasil uji kriterium (kemampuan yang
diramal). Dari contoh pertama, diuji korelasi
hasil tes vestibuler (tes prediksi) dengan hasil
atau nilai prestasi penguasaan pesawat yang
berkaitan dengan keseimbangan (kriterium),
kalau hasil analisis korelasi kuat berarti
validitas kriterium tinggi, dan sebaliknya
VALIDITAS KONSTRUK

 Validitas konstruk adalah ketepatan


pengukuran dalam menilai ciri atau keadaan
subyek yang diukur, sehubungan dengan
teori atau hipotesis yang
melatarbelakanginya.
 Validitas konstruk menggambarkan 2 hal
sekaligus yaitu validitas pengukuran sendiri
dan kebenaran teori atau hipotesis yang
melatarbelakangi penyusunan instrumen ukur
tersebut
 Contoh : dalam rangka menilai kelancaran
wanita menjalani partus kala II,
dikembangkan model pengukuran baru yaitu
mengukur kekuatan kontraksi otot perut
utama (m. rectus dan m. obliquus internus
dan eksternus). Pengukuran ini didasari oleh
beberapa teori atau hipotesis sebagai berikut
:
 Dalam keadaan normal (tidak ada
disproporsi, kedudukan dan presentasi janin
serta his normal), maka kala II persalinan
ditentukan oleh kekuatan hejan perut,
Kekuatan hejan perut ditentukan oleh
kekuatan kontraksi otot utama.
 Interpretasi : kalau dari hasil pengukuran
ternyata ada hubungan yang kuat antara
kekuatan kontraksi otot perut dengan lama kala
II persalinan, sementara faktor-faktor his,
kedudukan dan presentasi janin normal, dan
tidak ada disproporsi, maka pengukuran
tersebut mempunyai validitas konstruk yang
baik, tetapi bila hasilnya tidak ada
hubungan,maka baik pengukuran maupun dasar
teori yang dikemukakan di atas tidak valid.
Sumber Invaliditas

 Ada 3 faktor petunjuk tingkat validitas pengukuran,


yaitu :
1. Definisi operasional variabel yang secara logis
sesuai dengan landasan teoritik yang ada untuk
menggambarkan variabel yang dimaksud,
2. Kecocokan antara butir uji dari instrumen
pengukuran dengan definisi operasional (lihat
validitas isi),
3. Reliabilitas pengukuran.
 Ketiga sumber invaliditas tersebut harus benar-
benar dikendalikan oleh peneliti, oleh karena tidak
terpenuhinya salah satu saja dari ketiga hal tersebut
maka pengukuran menjadi tidak valid
Contoh Uji Validitas Kuesioner
1. Validasi isi kuesioner dengan melakukan
evaluasi isi kepada pakar yang terkait
2. Readble, apakah kuesioner mudah difahami
oleh calon responden, kemudian dilakukan
revisi beberapa kali
3. Terjemahan kuesioner asing, harus
diterjemahkan oleh penterjemah
bersertifikasi kemudian saling ditukarkan
dan direvisi
Contoh Uji Validitas

 Untuk mengetahui apakah kuesioner yang kita susun mampu


mengukur apa yang hendak kita ukur, maka perlu diuji dengan uji
korelasi antar skor (nilai) tiap-tiap item (pertanyaan) dengan skor total
kuesioner tersebut sehingga diperoleh korelasi yang bermakna
(construct validity). Apabila kuesioner tersebut telah memiliki validitas
konstruk, berarti semua item (pertanyaan) yang ada di dalam kuesioner
tersebut mengukur konsep yang kita ukur.
 Sebagai contoh kita akan mengukur tingkat pengetahuan imunisasi TT
bagi ibu hamil, maka kita susun pertanyaan-pertanyaan sebagai berikut
:
1. Apakah ibu pernah mendengar tentang imunisasi TT ?
2. Apabila pernah mendengar, untuk siapa imunisasi itu diberikan ?
3. Apa manfaat imunisasi itu diberikan ?
4. Berapa kali imunisasi tersebut harus diterima ?
5. Penyakit apa yang dapat dicegah dengan imunisasi TT ?
6. Di mana ibu dapat memperoleh imunisasi TT tersebut ?
7. dst...
 Pertanyaan-pertanyaan tersebut diberikan
kepada sekelompok responden sebagai
sarana uji coba, kemudian pertanyaan-
pertanyaan (kuesioner) tersebut diberi skor
atau nilai jawaban masing-masing sesuai
dengan sistem penilaian yang telah
ditetapkan, misalnya :
 skor 2 untuk jawaban yang paling benar,
 skor 1 untuk jawaban yang mendekati benar,
 skor 0 untuk jawaban yang salah.
distribusi skor untuk masing-masing pertanyaan
dari 10 responden adalah sebagai berikut :

Skor Nomor Pertanyaan Skor


Responden
1 2 3 4 5 6 7 8 9 10 Total
A 2 1 1 2 0 1 2 2 2 1 14
B 2 2 2 1 1 2 2 1 1 1 15
C 2 1 2 1 0 2 2 2 1 0 13
D 2 2 1 2 1 2 1 2 2 1 16
E 1 1 1 2 2 2 1 2 1 0 13
F 2 1 2 1 0 2 1 2 1 0 12
G 1 2 2 1 0 1 2 2 1 1 13
H 2 2 2 2 1 2 2 2 1 0 16
I 2 2 2 1 1 0 2 1 1 0 12
J 2 2 2 2 0 2 1 2 1 0 14
 Selanjutnya kita hitung korelasi antara skor
masing-masing pertanyaan dengan skor total,
sehingga ada 10 pertanyaan dalam kuesioner
dan akan ada 10 uji korelasi, yaitu skor
pertanyaan nomor 1 dengan total skor total
masing-masing responden, skor pertanyaan
nomor 2 dengan total skor total masing-masing
responden, skor pertanyaan nomor 3 dengan
total skor total masing-masing responden, dan
seterusnya.
 Teknik korelasi yang dipakai adalah teknik
korelasi ”product moment” yang rumusnya
adalah sebagai berikut :
 N ( XY) – (X. Y)
 R = -------------------------------------------------
  NX2 – (X) 2 } {NY2 – (Y) 2 }
Sebagai contoh perhitungan korelasi antara
pertanyaan nomor 1 dengan total skor total
masing-masing responden.

Responden X Y X2 Y2 XY
 Keterangan :
A 2 14 4 196 28  X = pertanyaan nomor
B 2 15 4 225 30 1
C 2 13 4 169 26
D 2 16 4 256 32  Y = skor total
E 1 13 1 169 13 responden
F 2 12 4 144 24
G 1 13 1 169 13
 XY = skor pertanyaan
H 2 16 4 256 32 nomo1 dikalikan
I 2 12 4 144 24 dengan skor total
J 2 14 4 196 28 responden
N = 10 18 138 36 1924 250
 Selanjutnya
dimasukkan angka-
angka tersebut ke
dalam rumus korelasi
”product moment”
 Selanjutnya dimasukkan angka-angka tersebut ke 6. R = 0,810
dalam rumus korelasi ”product moment” seperti
7.  R = 0,690
tertulis di atas, sebagai berikut :

8.  R = 0,720
 N ( XY) – (X. Y) 9.  R = 0,660
 R = ------------------------------------------------- 10.  R = 0,150
  NX2 – (X) 2 } {NY2 – (Y) 2 }  Untuk mengetahui apakah nilai korelasi
 tiap-tiap pertanyaan itu signifikan, maka
 (10 x 250) – (18 x 138) nilai korelasi tersebut dibandingkan dengan
 R = --------------------------------------------------- tabel nilai korelasi ”product moment” yang
  (10 x 36) – (18) 2 (10 x 1924) – (138) 2 ada dalam buku-buku statistik.
  Berdasarkan tabel nilai korelasi ”product
 moment” untuk jumlah responden 10,
 2500 -2484 16 16 memiliki taraf signifikansi 0,632.
 R = ------------------- = ------------ = --------- = 0,190  Oleh sebab itu, nilai korelasi dari
  36 x 196  7056 84 pertanyaan-pertanyaan dalam kuesioner
 tersebut yang memenuhi taraf signifikansi
 Setelah dihitung semua korelasi antara (di atas 0,632) adalah pertanyaan nomor 2,
masing-masing pertanyaan dengan skor totalnya, 3, 4, 6, 7, 8, 9
misalnya diperoleh hasil sebagai berikut :
 Sedangkan pertanyaan nomor 1, 5, dan 10
1. R = 0,190
tidak bermakna.
2.  R = 0,720
 Selanjutnya untuk memperoleh alat ukur
3.  R = 0,640
yang valid, maka pertanyaan nomor 1, 5,
4.  R = 0,710
dan 10 tersebut harus diganti atau direvisi,
5.  R = 0,550
atau didrop (dihilangkan).
RELIABILITAS
Tujuan Instruksional Khusus (TIK)

 Mahasiswa mampu mengetahui definisi


reliabilitas
 Mahasiswa mampu mengetahui ciri-ciri
reliabilitas
 Mahasiswa mampu mengetahui ciri konsistensi
reliabilitas
 Mahasiswa mampu mengetahui ciri konsistensi
dalam dan teknik-teknik pengujiannya
 Mahasiswa mampu mengetahui ciri konsistensi
luar dan teknik-teknik pengujiannya.
Reliabilitas

 Reliabilitas (ke-ajeg-an); adalah indeks yang


menunjukkan sejauh mana suatu alat ukur
dapat dipercaya atau dapat diandalkan. Hal
ini berarti menunjukkan sejauh mana hasil
pengukuran itu tetap konsisten atau tetap
ajeg apabila dilakukan pengukuran dua kali
atau lebih terhadap gejala yang sama
dengan menggunakan alat ukur yang sama.
 Apabila tinggi seorang anak diukur dengan meteran
kayu dan pengukuran dilakukan berulang-ulang
dengan meteran yang sama, maka hasilnya tinggi
anak tersebut tetap sama.
 Apabila meteran tersebut terbuat dari plastik maka
hasilnya tidak tetap tergantung bagaimana cara
memegang meteran plastik tersebut, apabila
memegangnya agak kendor, maka hasilnya lebih
rendah dan apabila memegangnya dengan tarikan
yang kuat, maka kemungkinan hasilnya akan lebih
tinggi.
 Oleh sebab itu meteran kayu menghasilkan
pengukuran yang lebih reliabel dibandingkan
dengan meteran plastik. Meteran kayu hasilnya
lebih konsisten (ajeg), sedangkan meteran plastik
hasilnya kurang konsisten.
 Demikian halnya dengan kuesioner sebagai alat
ukur untuk gejala-gejala sosial (non fisik) harus
mempunyai reliabilitas yang tinggi.
 sebelum digunakan untuk penelitian harus dites
(diuji coba) sekurang-kurangnya dua kali.
 uji coba tersebut kemudian diuji dengan tes
menggunakan rumus korelasi product moment.
 perhitungan reliabilitas dilakukan hanya pada
pertanyaan-pertanyaan yang sudah memiliki
validitas.
 menghitung validitas terlebih dahulu sebelum
menghitung reliabilitas.
 Untuk dapat lebih memahami maksud reliabilitas,
maka diajukan pertanyaan
 Apakah pengukuran yang kita lakukan berkali-kali
pada obyek yang sama menghasilkan skor yang
sama ? kalau jawabannya adalah ya, maka berarti
pengukuran yang dilakukan tersebut reliabel
(konsistensi atau stabilitas),
 Apakah skor yang diperoleh dengan pengukuran
tersebut merupakan skor yang sebenarnya ? kalau
jawabannya adalah ya, maka berarti pengukuran
yang dilakukan reliabel (akurasi atau ketepatan),
 seberapa banyak penyimpangan skor hasil
pengukuran dari skor yang sesungguhnya ? kalau
jawabannya sedikit sekali atau mendekati 0, berarti
reliabel (precicion, ketelitian).
 Dari pertanyaan di atas diketahui bahwa ada
3 ciri reliabilitas yaitu
 (a) konsistensi atau stabilitas
 (b) ketepatan
 (c) ketelitian
 Ciri kedua yaitu ketepatan dalam prakteknya
tidak pernah terpenuhi secara mutlak. Data
yang diperoleh dengan pengukuran tidak
pernah mencapai realitas (kebenaran) yang
sesungguhnya. Dengan demikian,
pendekatan terhadap reliabilitas pada
umumnya dilakukan dengan mempelajari
kaitan antara skor sebenarnya (Xb) dengan
skor yang diamati (Xa) dan kesalahan skor
(Xs). Secara matematis dapat dirumuskan :
Xb = Xa + Xs.
 Dari persamaan matematis tersebut dapat
dikembangkan pengertian bahwa dalam
praktek reliabilitas dapat diupayakan dengan
meminimasi kesalahan skor (Xs) agar skor
yang diamati (Xa) mendekati skor
sebenarnya.
 Xs diupayakan seminimal mungkin supaya
nilai , Xb = Xa (mendekati)
 Untuk pengukuran fenomena kedokteran sosial
yang sebagian berupa fenomena psiko-sosial,
pada umumnya digunakan instrumen
pengukuran yang berupa eksplorasi terhadap
subyek penelitian dengan sejumlah pertanyaan,
baik dengan teknik wawancara maupun dengan
teknik kuesioner, karena pengukuran terhadap
satu fenomena tertentu (misalnya terhadap
persepsi subyek) digunakan beberapa butir
pertanyaan, maka ciri konsistensi reliabilitas
dikenal ada 2 macam yaitu : konsistensi dalam
dan konsistensi luar.
 Ciri konsistensi dalam mempermasalahkan
kesesuaian antar butir-butir substansi
pertanyaan dalam satu kelompok yang
digunakan untuk mengeksplorasi satu
fenomena atau variabel.
 Konsistensi dalam : permasalahnanya
apakah alat ukur yang kita gunakan sudah
dapat mewakili fenomena penelitian. Jadi,
yang diuji Cuma 1 (alat ukur yang kita
gunakan)
 Ciri konsistensi luar mempermasalahkan
kesesuaian antara kelompok butir-butir substansi
pertanyaan tersebut dengan instrumen ukur lain
yang sudah baku atau reliabel, atau dengan
instrumen yang sama yang dilakukan pada
pengukuran lain.
 Konsistensi Luar : menilai kesesuaian alat ukur yang
kita buat dengan alat ukur standar yang biasa
digunakan. Sehingga terjadi 2 kali pengukuran. Bila
hasilnya sama, berart reliabilitas alat ukur kita baik,
jika tidak, alat ukur kita perlu ditinjau ulang atau
diganti
 Atas dasar ciri konsistensi
tersebut, dikenal 2 cara
pendekatan (pengujian)
terhadap reliabilitas pengukuran,
yaitu yang menguji konsistensi
dalam dan yang menguji
konsistensi luar.
PENGUJIAN KONSISTENSI
DALAM

 Pengujian konsistensi dalam dengan banyak


cara pengujian reliabilitas sehubungan dengan
konsistensi dalamnya.
 Prinsipnya adalah peneliti melakukan uji coba
instrumen pada sekelompok subyek dengan
satu alat ukur dan satu kali pengukuran. Skor
yang diperoleh dari uji coba tersebut kemudian
dianalisis dengan menggunakan berbagai
teknik, teknik yang sering digunakan antara lain
(1) teknik belah dua, (2) teknik Kuder-
Richardson, dan (3) teknik Hoyt.
 Ad 1. Teknik Belah Dua
 Alat ukur (kuesioner) yang telah disusun
dibagi menjadi dua. Oleh karena itu pertanyaan
dalam kuesioner ini harus cukup banyak
(memadai), sekitar 40-60 pertanyaan. Langkah-
langkah yang dilakukan antara lain :
 Kuesioner diajukan kepada sejumlah
responden, kemudian dihitung validitas masing-
masing pertanyaan. Pertanyaan-pertanyaan
yang valid dihitung, sedangkan yang tidak valid
dibuang,
 Pertanyaan-pertanyaan yang valid dibagi
menjadi dua kelompok secara acak (random),
belah tengah, ganjil-genap. Separo masuk ke
dalam belahan pertama, separonya lagi masuk
 Skor masing-masing item pada tiap belahan dijumlahkan
sehingga akan menghasilkan 2 kelompok skor total yakni
untuk belahan pertama dan belahan kedua,
 Dilakukan uji korelasi dengan rumus korelasi product
moment dengan formula Spearman Brown, formula
Flanagan, atau formula Rulon antara belahan pertama
dengan belahan kedua, hasil uji korelasi dibandingkan
dengan angka kritis seperti pada contoh pengukuran
validitas. Bila angka korelasinya sama atau lebih dari
angka kritis pada derajat kemaknaan p 0,05 (lihat tabel)
maka alat ukur atau kuesioner tersebut reliabel, tetapi bila
hasil yang diperoleh di bawah angka kritis, maka kuesioner
tersebut tidak reliabel sebagai alat ukur.
 Ad 2. Teknik Kuder-Richardson (KR)
 Teknik pengujian ini dipandang lebih baik daripada teknik
belah dua, namun ada persyaratan tambahan yaitu butir-butir tes
harus bersifat homogen. Homogenitas diperlukan karena teknik
KR ini bukan didasarkan pada analisis korelasi tapi pada analisis
butir (item analisis), dikenal ada 2 macam formula KR yaitu KR-
20 dan KR-21.

 Ad 3. Teknik Hoyt.
 Teknik ini didasarkan pada analisis varians, dengan
demikian nama lengkapnya adalah teknik analisis varians dari
Hoyt. Pada analisis Hoyt ini, data hasil uji coba dianggap sebagai
data dari suatu penelitian dengan rancangan faktorial yang faktor
pertamanya adalah subyek dan faktor keduanya adalah butir
(item).
PENGUJIAN KONSISTENSI LUAR

 Apabila pengujian terhadap konsistensi


dalam dilakukan hanya dengan satu kali
pengukuran, pengujian konsistensi luar,
pengujian reliabilitas ini dilakukan dengan
dua kali pengukuran pada sekelompok
subyek yang sama. Ada dua macam teknik
pengujian, yaitu teknik uji/tes ulang dan
teknik paralel
Hasil pengukuran ini dihitung korelasinya
dengan menggunakan rumus seperti pada
contoh pengukuran validitas. Bila angka  Ad 1. Teknik Tes/Uji Ulang
korelasinya sama atau lebih dari angka kritis  Dengan teknik ini satu alat ukur
pada derajat kemaknaan p 0,05 (lihat tabel) maka (kuesioner) diujikan kepada
alat ukur atau kuesioner tersebut reliabel, tetapi sekelompok responden yang
sama sebanyak dua kali
bila hasil yang diperoleh di bawah angka kritis, dengan interval waktu antara
maka kuesioner tersebut tidak reliabel sebagai uji pertama dengan uji kedua
alat ukur. tidak terlalu jauh dan juga tidak
terlalu dekat, misalnya 15-30
hari, karena apabila selang
waktu terlalu pendek
Pengukuran Pertama Pengukuran Kedua kemungkinan responden masih
(skor total tiap responden) (skor total tiap responden) ingat denga pertanyaan-
14 15 pertanyaan pada tes pertama,
15 15 sedangkan apabila selang
13 13 waktu terlalu jauh maka
16 15 kemungkinan pada responden
13 14 sudah terjadi perubahan dalam
12 14 variabel yang akan diukur.
13 13  Hasil pengukuran
16 16 pertama dikorelasikan dengan
12 13 hasil pengukuran kedua
14 13 dengan menggunakan teknik
14 13 korelasi product moment.
Sebagai contoh :
 Hasil pengukuran ini dihitung korelasinya
dengan menggunakan rumus seperti pada
contoh pengukuran validitas. Bila angka
korelasinya sama atau lebih dari angka kritis
pada derajat kemaknaan p 0,05 (lihat tabel)
maka alat ukur atau kuesioner tersebut
reliabel, tetapi bila hasil yang diperoleh di
bawah angka kritis, maka kuesioner tersebut
tidak reliabel sebagai alat ukur.
76

Anda mungkin juga menyukai