Anda di halaman 1dari 13

Program Magister Ilmu Kesehatan Masyarakat,

Program Pascasarjana,
Universitas Sebelas Maret
----------------------------------------

VARIABEL
The greatest of faults, I should say,
is to be conscious of none - Thomas Carlyle

Pengumpulan data dalam penelitian adalah mengukur variabel. Pengukuran


(measurement) adalah prosedur menentukan kuantitas atau kualitas dari karak-
teristik subjek penelitian yang disebut variabel. Secara etimologis, variabel atau
variable berasal dari kata vary dan able. Jadi variabel merupakan sesuatu yang
bisa bervariasi (beragam). Variabel merupakan entitas atau karakteristik, dari
individu, kasus, atau subjek penelitian, yang memiliki variasi nilai atau atribut, baik
variasi antar waktu atau antar individu. Contoh, tekanan darah merupakan variabel,
sebab bisa bervariasi antar individu, misalnya 110 mmHg, 120 mmHg, 125 mmHg.
Pengukuran (disebut juga pengamatan, observasi) variabel merupakan
elemen kunci metodologi riset epidemiologi. Pengukuran yang benar terhadap varia-
bel penelitian merupakan prinsip yang tidak dapat dikompromikan dari sebuah riset.
Pengukuran variabel menghasilkan sekumpulan nilai atau atribut dari individu-
individu yang disebut data. Data dianalisis untuk menghasilkan informasi. Informasi
diinterpretasikan dan digunakan oleh pengguna hasil penelitian. Kesalahan dalam
pengukuran, disebut measurement bias (measurement error), menghasilkan data
yang tidak valid, mengakibatkan hasil-hasil penelitian tidak valid, tidak benar, tidak
sah. Kesalahan dalam pengukuran merupakan kesalahan yang sangat serius, jauh
lebih serius daripada besar sampel (sample size) yang sering dipersoalkan oleh
orang-orang yang awam dalam metodologi riset, baik di dalam maupun di luar
kampus. Ibarat orang menembak ke sasaran tembak, laras senapan yang digunakan
hendaknya lurus, tidak lancung (bengkok). Senapan lancung (measurement error)
tidak akan mengenai sasaran dengan benar meski digunakan berkali-kali (ukuran
sampel besar).
Makalah ini menjelaskan berbagai aspek variabel, mencakup definisi dan
klasifikasi variabel berdasarkan level (tingkat pengukuran). Setiap penjelasan
umumnya disertai dengan contoh.

VARIABEL
Variabel adalah entitas, atau karakteristik dari individu, kasus, atau subjek
penelitian yang memiliki variasi nilai kuantitatif atau kategori kualitatif, baik variasi
antar waktu atau antar individu (Vogt, 1993; Streiner dan Norman, 2000). Contoh,
umur merupakan variabel, sebab umur bervariasi nilai antar individu, atau antar
waktu pada individu yang sama, misalnya 1 tahun, 5 tahun, 17 tahun, 22 tahun, 35
tahun, 50 tahun, 70 tahun. Tekanan darah merupakan variabel, karena memiliki
variasi nilai dalam satuan mmHg. Tetapi variabel tidak harus memiliki nilai
kuantitatif alias numerik, bisa juga nilai kualitatif alias atribut. Atribut adalah nilai
kualitatif spesifik dari suatu variabel. Contoh, variabel seks (gender, jenis kelamin)
memiliki dua atribut, yaitu laki-laki atau perempuan. Laki-laki dan perempuan
bukan variabel, melainkan atribut dari variabel seks atau gender.

1 | Prof Bhisma Murti


Program Magister Ilmu Kesehatan Masyarakat,
Program Pascasarjana,
Universitas Sebelas Maret
----------------------------------
Terdapat sejumlah cara membedakan variabel, tetapi yang terpenting adalah
pembagian ke dalam dua jenis: (1) variabel kategorikal/ kualitatif, dan (2) variabel
metrik/ numerik/ kuantitatif. Variabel metrik/ numerik/ kuantitatif bisa dibedakan
menjadi: (1) variabel diskret; dan (2) variabel kontinu. Contoh variabel diskret:
jumlahbayi yang diimunisasi per hari (tidak bisa 30.5 bayi per hari, melainkan 30
bayi per hari atau 31 bayi per hari). Contoh variabel kontinu: kadar hemoglobin (10.5
g/dL, 11,7 g/dL, 12.0 g/dl). Meskipun demikian variabel metrik/ numerik/
kuantitatif tersebut dalam jurnal internasional lazim disebut variabel kontinu,
dengan kata lain: variabel metrik= numerik= kuantitatif= kontinu.
Pembedaan jenis variabel antara variabel kategorikal versus kontinu sangat
penting untuk lima keperluan:

1. Memilih statistik deskriptif yang tepat


2. Memilih ukuran hubungan yang tepat
3. Memilih uji statistik yang tepat
4. Memilih model analisis statistik yang tepat
5. Memilih rumus besar sampel yang tepat

Contoh: jika data kontinu, berdistribusi normal, maka statistik deskriptif yang tepat
untuk menggambarkan (mendeskripsikan) data adalah mean dan standa deviasi
(SD). Uji statistik untuk dua kelompok data dengan karakteristik seperti itu, jika
berasal dari pengamatan yang independen, adalah uji t. Rumus yang tepat untuk
memperkirakan besar sampel dalam penelitian itu adalah rumus besar untuk
menguji hipotesis tentang perbedaan mean dari dua kelompok. Gambar 1
menyajikan diagram tentang klasifikasi variabel berdasarkan level pengukuran.
Variabel

Kategorikal Metrik (numerik,


(kualitatif) kontinu, kuantitatif)

Diskret Kontinu
Nominal (jumlah pasien
(Seks, ras) per hari)

Ordinal Interval Rasio


(Stadium (Suhu (BB, TB,
kanker, kelas Celcius) elektrolit
sosial) serum)

Gambar 1. Klasifikasi variabel


Variabel kategorikal, disebut juga variabel kualitatif, non-metrik, atau variabel
kualitatif, yaitu variabel yang terdiri atas kategori-kategori yang berbeda secara
kualitatif dan terpisah satu dengan lainnya (Kleinbaum et al., 1988).Vogt, 1993).
Variabel kategorikal tidak menunjukkan suatu kesinambungan (kontinuitas) variasi
nilai-nilai. Contoh, mortalitas (mati/ hidup), morbiditas (berpenyakit/ normal), ras
Program Magister Ilmu Kesehatan Masyarakat,
Program Pascasarjana,
Universitas Sebelas Maret
-------------------------------------------

(kaukasoid/ mongoloid/ negroid), merupakan variabel kategorikal, sebab terdiri dari


kategori-kategori. Demikian pula, mortalitas tidak memiliki variasi nilai-nilai
kontinu, misalnya 1/1000 mati, 2/1000 mati, 3/1000 mati, dan seterusnya, melain-
kan memiliki variasi kategori, yakni mati (= 1000/1000 mati) atau hidup (=0/1000
mati). Contoh lainnya, Physicians Health Study (Hennekens et al., 1996) merupakan
sebuah Randomized Controlled Trial (RCT) yang meneliti hubungan antara penggu-
naan aspirin dan pencegahan primer infark otot jantung. Penggunaan aspirin meru-
pakan variabel kategorikal terdiri dari kategori-kategori, misalnya menggunakan
aspirin, atau tidak menggunakan aspirin. Demikian pula, infark otot jantung meru-
pakan variabel, terdiri dari kategori-kategori, yaitu mengalami infark otot jantung,
atau tidak mengalami infark otot jantung.
Variabel metrik (numerik, kontinu, kuantitatif) adalah variabel yang terdiri
dari nilai-nilai yang berkesinambungan (kontinu) dengan variasi nilai yang secara
konseptual tak terbatas (Kleinbaum et al., 1988). Variabel metrik dapat dibedakan ke
dalam dua jenis: (1) Variabel diskret; dan (2) Variabel kontinu. Variabel diskret
merupakan variabel yang pengukurannya menghasilkan nilai kuantitatif yang bulat,
bukan nilai kuantitatif pecahan atau desimal. Contoh: jumlah bayi yang diimunisasi
per hari, jumlah pasien yang mengunjungi klinik per hari. Variabel kontinu
merupakan variabel yang pengukurannya menghasilkan nilai kuantitatif hingga
pecahan atau desimal. Contoh: tekanan darah (mmHg), kadar hemoglobin (g/dl),
kadar gula darah (mg/dl), tinggi badan (cm), berat badan (kg), body mass index
(kg/m2), dan berbagai keadaan subjektif, seperti nyeri, dan kualitas hidup terkait
kesehatan (HRQoL), merupakan variabel kontinu.
Variabel kategorikal merupakan variabel yang pengukurannya hanya
menghasilkan kategori. Variabel kategorikal dapat dibedakan menjadi dua jenis: (1)
Variabel nominal; dan (2) Variabel ordinal. Variabel nominal merupakan kategori
yang memiliki nama alias atribut. Contoh: mortalitas (mati/hidup), morbiditas
(sakit/ normal), jenis kelamin (lakilaki/perempuan), tekanan darah (hipertensi/
normotensi), ras (kaukasoid, mongoloid, negroid). Atribut dalam variabel nominal
tidak bisa diurutkan, dan jarak atribut (kategori) satu dengan lainnya tidak memiliki
interval yang sama, sehingga tidak bisa dihitung rata-rata (mean). Contoh, terhadap
variabel seks jelas tidak dapat dibuat rata-rata. Tetapi dalam analisis data peneliti
boleh saja menghitung mean dari variabel nominal, hanya saja harus ditafsirkan
sebagai proporsi. Contoh, jika laki-laki diberi kode 0, perempuan kode 1, maka
andaikata mean= 0.6 maka hal itu berarti proporsi perempuan adalah 0.6, sedang
laki-laki 0.4.
Variabel ordinal merupakan variabel yang pengukurannya menghasilkan
kategori yang bisa diurutkan atau dibuat peringkat (rank). Contoh: stadium kanker
(I/II/III/IV), status sosial ekonomi (tinggi/ menengah/ bawah). Tetapi antara satu
kategori dengan kategori lainnya tidak terdapat interval atau jarak yang sama,
sehingga terhadap variabel ordinal tidak bisa dihitung rata-rata. Demikian juga
pendapat subjek penelitian tentang suatu hal bisa didefinisikan terdiri dari sejumlah
atribut (lazimnya lima atribut) menghasilkan data berskala ordinal: (1) Sangat tidak
setuju; (2) Tidak setuju; (3) Netral; (4) Setuju; (5) Sangat setuju.
Variabel nominal maupun ordinal tidak memiliki interval yang sama antara
satu atribut dan atribut lainnya, sehingga tidak bisa dibuat histogram tentang
distribusi frekuensi, tidak mengenal distribusi normal teoretis Gauss, dan tidak

3 | Prof Bhisma Murti


Program Magister Ilmu Kesehatan Masyarakat,
Program Pascasarjana,
Universitas Sebelas Maret
----------------------------------
memiliki mean (sebuah ukuran tendensi sentral). Implikasinya, kelompok-kelompok
sampel tidak bisa dibedakan berdasarkan mean, dan tidak bisa diuji dengan statistik
uji parametrik seperti uji t dan uji F. Sebagai gantinya, beda atribut variabel tersebut
dideskripsikan dengan diagram balok, pie chart, dan sebagainya. Beda kelompok-
kelompok sampel diuji dengan metode statistik non-parametrik (tidak menggunakan
perbedaan mean), misalnya uji Chi Kuadrat, uji Proporsi, Wilcoxon, Mann-Whitney,
Friedman, Kruskall-Wallis, dan sebagainya (Murti, 1996).
Variabel kontinu dapat dibedakan menjadi dua jenis: (1) Variabel interval;
dan (2) Variabel rasio. Variabel interval merupakan variabel di mana interval atau
selisih antara nilai-nilai pengukuran memiliki arti kuantitatif. Contoh: suhu (derajat
Celcius), tekanan darah (mmHg). Interval 0-1 derajat C memiliki kalor (=panas)
yang sama dengan interval 2-3 derajat C, 14-15 derajat C, 19-20 derajat C, dan
sebagainya. Dengan demikian dapat dikatakan suhu 40 derajat C memiliki kalor 20
derajat lebih tinggi daripada suhu 20 derajat C. Tetapi karena suhu 0 derajat Celcius
bukan merupakan titik absolut ketiadaan panas, maka 40 derajat C tidak berarti
menunjukkan kalor 2 kali suhu 20 derajat C. Karena masing-masing nilai yang
berurutan memiliki perbedaan kuantitatif yang sama, maka terhadap data variabel
interval dapat dihitung mean.
Variabel rasio merupakan variabel di mana rasio (= perbandingan) antar nilai
pengukuran memiliki arti kuantitatif, karena memiliki nilai nol absolut. Contoh:
suhu (derajat Kelvin), berat badan (kg), tinggi badan (cm) adalah variabel rasio,
sebab memiliki nilai nol absolut sebagai titik referensi perbandingan. Jadi, ayah
berbobot 70 kg dapat diartikan 2 kali bobot anak 35 kg, sebab 0 kg merupakan 0
absolut dalam arti tanpa bobot sama sekali.
Variabel interval maupun variabel rasio memiliki interval, sehingga kedua
variabel kontinu itu memiliki distribusi frekuensi. Implikasinya, kedua variabel
kontinu mengenal distribusi normal teoretis Gauss, dan peneliti dapat
menggunakan metode statistik parametrik seperti uji t dan uji F yang berbasis dis-
tribusi normal untuk menguji perbedaan kelompok-kelompok sampel dalam hal
kedua variabel itu. Variabel interval dan rasio dalam ilmu ekonomi disebut juga
variabel kardinal.
Skor yang diperoleh dari pengukuran dengan skala Likert sejatinya merupa-
kan variabel ordinal. Tetapi jika nilai dari data ordinal tersebut banyak, maka data
variabel ordinal tersebut akan mendekati kontinu. Generally long ordinal scales, or
scales with a large number of discrete categories, are treated as continuous data for
the purpose of analysis (Alderson dan Green, 2002). Contoh, variabel depresi
diukur dengan menggunakan kuesioner yang terdiri atas 10 item pertanyaan, dengan
5 respons skala Likert. Pengukuran variabel dengan kuesioner dengan skala Likert
tersebut, dengan 5 respons bertingkat, menghasilkan data ordinal. Tetapi karena
variabel depresi tidak hanya diukur dengan sebuah pertanyaan, melainkan 10
pertanyaan, maka hasil pengukuran menghasilkan data terdiri atas 50 respons atau
nilai (10 pertanyaan x 5 respons). Karena skor yang dihasilkan cukup banyak, maka
skala ordinal mendekati sifat kontinu. Implikasinya, peneliti bisa menggunakan
mean dan uji statistik berbasis distribusi normal seperti uji t dan uji F untuk menguji
perbedaan kelompok-kelompok. Sebaliknya, makin sedikit skor ordinal, makin sulit
mengatakannya memiliki sifat kontinu, dan peneliti tidak boleh menggunakan mean
dan uji statistik berbasis distribusi normal untuk menguji perbedaan kelompok-
Program Magister Ilmu Kesehatan Masyarakat,
Program Pascasarjana,
Universitas Sebelas Maret
-------------------------------------------

kelompok. Penulis buku dan artikel pada jurnal internasional umumnya mengang-
gap data ordinal dengan rentang minimal 10 skor ordinal sebagai data kontinu
(Streiner dan Norman, 2000).
Sejumlah dosen dan mahasiswa gemar menggunakan istilah variabel
rasional, bukan variabel rasio. Benarkah pemakaian istilah itu? Salah. Kata rasio
dalam variabel rasio berasal dari kata Inggris ratio, yang berarti perbandingan, dan
tidak ada hubungannya dengan masalah rasionalitas maupun nalar. Penggunaan
istilah variabel rasional menyesatkan pemakainya, seolah hanya variabel rasio yang
rasional, dan semua variabel lainnya irasional, tidak masuk di akal, tidak nalar.
Kesalahan fatal lainnya adalah anggapan bahwa skala rasio lebih baik
daripada interval, interval lebih baik daripada ordinal, ordinal lebih baik daripada
nominal. Jika menuruti pemikiran sesat itu, maka pengukuran jenis kelamin
merupakan contoh pengukuran yang buruk tentang variabel, karena hanya
menghasilkan data dalam skala nominal, yakni laki-laki dan perempuan, bukan 1/8
laki-laki dan 7/8 perempuan, 1/5 laki-laki dan 4/5 perempuan, dan sebagainya.
Demikian pula andaikata skala rasio dan interval lebih baik daripada ordinal dan
nominal, maka setiap dokter yang mendiagnosis pasien berpenyakit X atau tidak
berpenyakit X, atau mendiagnosis pasien mengalami hipertensi atau normal sebelum
memutuskan untuk mengobati atau tidak mengobati tekanan darah pasien, telah
melakukan langkah keliru. Anggapan tersebut salah dan tersesat.
Variabel kontinu memiliki perbedaan esensial dengan variabel kategorikal.
Hasil pengukuran variabel kontinu dapat ditransformasi menjadi variabel
kategorikal, disebut data collapsing (Murti, 1996). Sebaliknya variabel kategori tidak
dapat diubah menjadi kontinu. Contoh, Indeks Massa Tubuh (= Body Mass Index)
mula-mula merupakan pengukuran kontinu (kg/m2). Menurut WHO (Weisell,
2002), untuk orang Asia, BMI dapat diubah menjadi kategori obese II (BMI 30
kg/m2), obese I (BMI 25-29.9 kg/m2), berisiko obesitas (23-24.9 kg/m2), normal
(BMI 19-22.9 kg/m2), dan berat badan kurang (18.9 kg/m2).
Sebaliknya variabel kategorikal seperti jenis kelamin tidak dapat diubah
menjadi kontinu. Implikasinya, peneliti hendaknya mengukur dan mencatat variabel
kontinu diukur dalam skala kontinu, bukan dalam skala kategorikal. Contoh,
tekanan darah sebaiknya diukur dan dicatat dalam unit mmHg, jangan dalam kate-
gori hipertensi versus normal. Dua alasan melatari anjuran tersebut. Pertama,
variabel yang terukur dalam kategori tidak mungkin dihitung rata-rata. Demikian
pula income sebaiknya diukur dan dicatat dalam unit Rupiah, bukan dalam kategori
Rupiah, karena jika diukur dalam kategori tidak mungkin dihitung rata-rata. Kedua,
bukti-bukti riset menunjukkan, tekanan darah memiliki hubungan dengan risiko
penyakit kardiovaskuler (CVD); hubungan tersebut bersifat langsung, bertingkat,
dan kontinu. Peningkatan risiko CVD sudah dimulai sejak tekanan darah sistolik
(TDS) 115 mmHg dan tekanan darah diastolik (TDD) 75 mmHg (Verdecchia dan
Angeli, 2005). Artinya, apabila peneliti hanya mencatat TDS dalam kategori
hipertensi sistolik (TDS 140 mmHg) dan kategori tidak hipertensi sistolik (TDS
<140 mmHg), maka ia tidak dapat lagi mengevaluasi peningkatan risiko CVD pada
individu dengan TDS di dalam kategori itu, misalnya peningkatan risiko CVD pada
individu dengan TDS 120 mmHg dibandingkan TDS <120 mmHg.
Semua skala pengukuran variabel penting, baik kategorikal maupun kontinu.
Tetapi variabel yang paling banyak dijumpai dalam literatur, dan sangat berguna

5 | Prof Bhisma Murti


Program Magister Ilmu Kesehatan Masyarakat,
Program Pascasarjana,
Universitas Sebelas Maret
----------------------------------
dalam pembuatan keputusan epidemiologis maupun klinis adalah variabel kategori-
kal dalam dua kategori, disebut variabel dikotomi. Variabel dikotomi lebih populer,
informatif, praktis, dan clinically useful daripada variabel kontinu (Kleinbaum et
al., 1982; Alderson dan Green, 2002). Contoh, klinisi umumnya mengambil
keputusan klinis secara dikotomi, yakni memberikan obat antihipertensi kepada
individu dengan TDS 140 mmHg dan tidak memberikan obat tersebut kepada
individu dengan TDS <140 mmHg, meski bukti-bukti riset menunjukkan
peningkatan risiko CVD sudah dimulai secara bertahap sejak TDS 115 mmHg.
Demikian pula terhadap pasien yang telah diperiksa, klinisi akan membuat
diagnosis secara dikotomi, bahwa pasien tersebut mengalami atau tidak mengalami
suatu penyakit, bukannya secara kontinu bahwa pasien tersebut mengalami 1/100,
2/100, ......, 99/100 penyakit tersebut.

DUMMY VARIABLE
Dummy variable, disebut juga indicator variable atau design variable, adalah sebuah
variabel kategorikal yang memiliki lebih dari dua kategori (k) yang diubah (direka)
menjadi beberapa variabel dikotomi, diberi kode 0 bila tidak menunjukkan suatu
kondisi, kode 1 bila menunjukkan kondisi tersebut (Kleinbaum et al., 1988 Hosmer
dan Lemeshow, 1989; Pagano dan Gauvreau, 2000; Last, 2001 ). Kode 0 dan 1 dalam
dummy variable tidak mengandung nilai kuantitatif yang sesungguhnya, karena itu
disebut kosong (dummy). Kondisi dengan kode 0 lazimnya berfungsi sebagai
rujukan (pembanding). Dummy variable berfungsi sebagai penunjuk, sehingga
disebut juga indicator variable (Pagano dan Gauvreau, 2000).
Dummy variable biasanya digunakan sebagai salah sebuah variabel
independen dalam analisis regresi, yaitu suatu model statistik yang dibuat untuk
menjelaskan dan memprediksi perubahan-perubahan pada variabel dependen (Y)
berdasarkan informasi sebuah atau lebih variabel independen (X1, X2,, Xk)
(Kleinbaum et al., 1988; Rosner, 1990). Dengan dummy variable dapat diketahui
seberapa besar perubahan dari satu kondisi (kode 0) ke kondisi lainnya (kode 1) dari
suatu variabel independen (Xi) membawa perubahan kepada variabel dependen (Y).
Jumlah dummy variable yang dapat dibuat dari sebuah variabel independen katego-
rikal yang memiliki k kategori adalah k 1. Contoh: Menurut WHO, Indeks Massa
Tubuh (BMI) untuk orang Asia dapat dibagi menjadi 5 kategori (Weisell, 2002).
Jumlah dummy variable adalah = 5 1 = 4, yakni D1, D2, D3, D4. Tabel 1
menyajikan dummy variable BMI.

Tabel 1 Dummy variabel untuk variabel 5 kategori


Indeks Massa Tubuh (BMI) D1 D2 D3 D4
Berat badan kurang ( 18.9 kg/m2) 0 0 0 0
Normal (19-22.9 kg/m2) 0 0 0 1
Berisiko obesitas (23.-24.9 kg/m2) 0 0 1 0
Obese I (25-29.9 kg/m2) 0 1 0 0
Obese II ( 30 kg/m2) 1 0 0 0

Perhatikan, kategori berat badan kurang (underweight) dipilih sebagai kategori


rujukan (pembanding), diwakili oleh D1=0, D2,=0, D3=0, dan D4=0. Jadi, subjek
Program Magister Ilmu Kesehatan Masyarakat,
Program Pascasarjana,
Universitas Sebelas Maret
-------------------------------------------

penelitian yang memiliki nilai dummy variable D1=0, D2=0, D3=0, dan D4=0
termasuk dalam kategori underweight.
Berdasarkan kerangka hubungan kausal, variabel dapat dibedakan menjadi
beberapa jenis: (1) Variabel Dependen; (2) Variabel Independen; (3) Kovariat; (4)
Faktor Perancu; (5) Pengubah efek.

1. VARIABEL DEPENDEN
Variabel dependen adalah variabel yang dihipotesiskan dipengaruhi atau tergantung
oleh variabel lain. Variabel dependen disebut juga variabel hasil (outcome variable),
variabel terpengaruh, variabel terikat, variabel respons, regresan, prediktan, variabel
endogen. Penggunaan padanan kata tergantung konteks analisis. Dalam studi epide-
miologi, variabel dependen adalah penyakit, atau indikator keadaan kesehatan
lainnya. Tabel 2 menyajikan terminologi variabel dalam studi analitik.

2. VARIABEL INDEPENDEN
Variabel independen adalah variabel yang dihipotesiskan mempengaruhi,
menentukan, atau menjelaskan terjadinya variabel lainnya. Variabel independen
dapat diubah sesuai keperluan, tetapi nilai-nilainya bukan merupakan masalah yang
ingin dijelaskan dalam analisis. Variabel independen disebut juga variabel bebas,
variabel pengaruh, variabel penjelas (explanatory variable), prediktor, regresor, dan
sebagainya. Dalam studi observasional, variabel independen adalah paparan
(exposure), disebut juga faktor penelitian (study factor). Dalam studi eksperimental,
faktor penelitian adalah perlakuan (treatment) atau intervensi, diberikan secara se-
ngaja kepada subjek penelitian. Contoh: Sebuah studi kohor meneliti dampak debu
radioaktif pabrik cat yang mengandung radium terhadap Ca paru pada pekerja.
Peneliti mengklasifikasikan subjek ke dalam kelompok terpapar dan tidak terpapar
debu radioaktif berdasarkan kategori ukuran rad (radiation absorbed dose). Paparan
dalam contoh ini merupakan variabel independen, diukur dalam skala dikotomi
(kategorikal dalam dua kategori). Lalu peneliti mengikuti kohor selama suatu peri-
ode waktu, mengamati apakah terjadi Ca paru atau tidak. Ca paru merupakan
variabel dependen, diukur dalam skala dikotomi.

Tabel 2. Terminologi variabel dalam studi analitik


Variabel dependen Variabel independen
Variabel terikat/ tergantung/ terpengaruh Variabel bebas
Variabel dijelaskan (explained variable) Variabel penjelas (explanatory variable)
Variabel hasil (outcome variable) Variabel input (input variable)
Penyakit (disease) Paparan (exposure)
Efek (effect) Penyebab, kausa (cause)
Regresan Regresor
Prediktan Prediktor
Variabel respons (response variable) Stimulus
Variabel endogen Variabel eksogen

7 | Prof Bhisma Murti


Program Magister Ilmu Kesehatan Masyarakat,
Program Pascasarjana,
Universitas Sebelas Maret
----------------------------------
Ketika peneliti menempatkan hubungan variabel-variabel dependen dan independen
dalam kerangka konseptual penelitian, maka ia sedang melakukan studi analitik.
Tetapi studi analitik tidak harus memiliki variabel-variabel dependen dan
independen. Studi korelasi (correlational study) tidak memiliki variabel-variabel
dependen dan independen. Korelasi merupakan model statistik yang menganalisis
hubungan dua variabel (X,Y) yang eksis bersama secara random (korelasi berasal
dari co-related), tanpa mengasumsikan variabel mana mempengaruhi
(independen) dan variabel mana dipengaruhi (dependen) (Rosner, 1990). Contoh,
tinggi badan berkorelasi dengan berat badan anak balita, tetapi tidak dihipotesiskan
tinggi badan mempengaruhi berat badan atau berat badan mempengaruhi tinggi
badan, sehingga problem ini lebih tepat dianalisis dengan model korelasi. Karakte-
ristik tersebut membedakan korelasi dengan regresi. Regresi merupakan teknik
statistik untuk menjelaskan atau memprediksi variabilitas sebuah variabel dependen
(Y) dengan menggunakan informasi dari sebuah atau lebih variabel independen (X1,
X2, .Xk) (Vogt, 1993; Rosner, 1990; Kleinbaum et al., 1988). Model regresi dengan
eksplisit mengindikasikan variabel dependen dan variabel independen.

3. KOVARIAT
Tujuan studi analitik adalah meneliti hubungan variabel X1 dan Y, atau pengaruh
variabel X1 terhadap variabel Y. Sesuai dengan namanya, kovariat (covariate) adalah
variabel X2, X3, ..., Xk, yang seperti halnya X1 diduga bisa mempengaruhi terjadinya
variabel Y, karena itu pengaruhnya ingin dikendalikan oleh peneliti (Vogt1993; Last,
2001). Kovariat juga disebut faktor ketiga (third factor), karena merupakan variabel
di luar variabel dependen dan variabel independen utama yang menjadi perhatian
peneliti. Kovariat bisa merupakan faktor perancu (confounding factor) atau pengu-
bah efek (effect modifier (Last, 2001). Kovariat disebut juga concomitant variable,
karena variabel itu menyertai variabel independen utama (Kothari, 1990). Kovariat
disebut juga variabel kontrol (control variable), karena pengaruhnya terhadap vari-
abel dependen akan dikendalikan.
Pengaruh kovariat dalam suatu eksperimen lazimnya dikontrol dengan teknik
randomisasi. Tetapi pengaruh kovariat bisa juga dikendalikan dalam analisis data
dengan teknik statistik tertentu, misalnya Analisis Kovarians. Analisis kovarians
(disingkat ANCOVA, atau ANACOVA, atau ANOCOVA) merupakan saudaranya
ANOVA, hanya saja terhadap model ANOVA kali ini ditambahi sebuah variabel
independen yang disebut kovariat. Baik ANOVA maupun ANCOVA merupakan
special case analisis regresi ganda. Dalam model ANCOVA, variabel dependen diu-
kur dalam skala kontinu, faktor penelitian terukur dalam skala kategorikal
(misalnya, kelompok eksperimen dan kelompok kontrol), dan kovariat terukur
dalam skala kontinu (Rosner, 1990; Kothari, 1990; Kleinbaum et al., 1988).
Contoh: sebuah eksperimen berminat meneliti efikasi obat antikolesterol.
Untuk mengetahui pengaruh obat dalam menurunkan kadar kolesterol, peneliti
mengukur kadar kolesterol sebelum dan sesudah pemberian obat, menggunakan
sebuah desain eksperimen kuasi yang disebut before and after with no comparison
design. Kadar kolesterol sebelum pemberian obat tentu mempengaruhi kadar
kolesterol sesudah pemberian obat. Salah satu cara mengontrol pengaruh itu adalah
memperhitungkannya dalam analisis data dengan model ANCOVA, dengan
persamaan sebagai beikut:
Program Magister Ilmu Kesehatan Masyarakat,
Program Pascasarjana,
Universitas Sebelas Maret
-------------------------------------------

Y a b1 X1 b2X2

Y = kadar kolesterol darah setelah pemberian obat (mg/dl).


X1 = obat antikolesterol (1 = Ya; 0 = Tidak) faktor penelitian.
X2 = kadar kolesterol sebelum pemberian obat (mg/dl) kovariat.

4. FAKTOR PERANCU
Sebuah konsep yang berperan sentral dalam studi epidemiologi analitik adalah
faktor perancu (confounding factor). Ketika seorang peneliti menganalisis hubung-
an/ pengaruh variabel independen (paparan) terhadap variabel dependen (penyakit),
ia harus sadar dan berupaya mengontrol variabel-variabel lain yang juga berpe-
ngaruh terhadap terjadinya variabel dependen yang diteliti, disebut faktor perancu.
Gagasan faktor perancu berasal dari disiplin epidemiologi, merupakan
faktor ketiga (third factor) yang memiliki sifat: (1) Faktor risiko (atau faktor
pencegah) penyakit, (2) Berhubungan dengan paparan, dan (3) Bukan merupakan
variabel antara dalam mekanisme kausal paparan-penyakit (Clayton dan Hills, 1998;
Hennekens dan Buring, 1987; Rothman, 2002; Last, 2001) (lihat Gambar 8.3).
Pengaruh faktor perancu harus dikendalikan. Jika peneliti tidak mengendalikan
(=mengontrol) pengaruh faktor perancu, maka pengaruh tersebut akan merancukan
(=mendistorsi, mencampuri) penilaian hubungan/ pengaruh variabel independen
terhadap variabel dependen yang sedang diteliti, sehingga kesimpulan peneliti
tentang hubungan variabel tersebut salah alias tidak valid dan hanya bernilai untuk
dimasukkan ke dalam keranjang sampah.
Faktor perancu merupakan special case dari kovariat, tetapi tidak semua kovariat
merupakan faktor perancu. Faktor perancu tidak sama dengan variabel luar
(extraneous variable), yaitu variabel di luar variabel dependen dan variabel
independen yang sedang diteliti. Semua faktor perancu adalah variabel luar, tetapi
tidak semua variabel luar adalah faktor perancu. Tidak semua variabel luar perlu
dikontrol. Contoh, Gambar 3 memeragakan hubungan antara paparan (paritas) dan
penyakit (sindroma Down) terancukan oleh faktor perancu (umur ibu). Hitungan
statistik dengan mudah dapat menunjukkan, ibu yang telah melahirkan beberapa
kali mempunyai risiko lebih besar untuk melahirkan anak dengan sindroma Down?
Benarkah kesimpulan bahwa paritas merupakan faktor risiko sindroma Down?
Salah. Bukan paritas merupakan faktor risiko sindroma Down, melainkan umur ibu.
Hubungan yang tampak antara paritas dan sindroma Down telah tercampur oleh
pengaruh umur ibu sebagai faktor perancu. Pengaruh faktor perancu harus
dikendalikan agar penilaian hubungan variabel independen dan dependen yang
diteliti benar.

Paritas Sindroma Down


3
(paparan) (penyakit)

2 1
Umur ibu
(faktor perancu)

Gambar 3 Umur ibu sebagai faktor perancu

9 | Prof Bhisma Murti


Program Magister Ilmu Kesehatan Masyarakat,
Program Pascasarjana,
Universitas Sebelas Maret
----------------------------------
Sejumlah pihak menggunakan istilah faktor pengganggu sebagai padanan
confounding factor. Penggunaan istilah faktor pengganggu adalah salah. Pertama,
confounding factor tidak sekedar mengganggu tetapi lebih fundamental lagi
merancukan (mencampur-adukkan) pengaruh confounding factor dengan pengaruh
paparan terhadap penyakit yang sedang diteliti. Dalam literatur epidemiologi
berbahasa Inggris percampuran pengaruh itu disebut masking, mixing atau
distortion of effects. Kedua, jika faktor pengganggu digunakan, maka confoun-
ding akan diterjemahkan sebagai gangguan. Kata gangguan akan menimbulkan
kejanggalan bagi peneliti, pembaca hasil penelitian, maupun penulis buku epide-
miologi. Sebab kata tersebut mengandung konotasi di luar domain metodologi pe-
nelitian, misalnya gangguan kamtibnas (gangguan keamanan dan ketertiban
nasional) sebuah istilah populer zaman orba. Ketiga, penggunaan istilah ganggu-
an secara konseptual akan disalahtafsirkan identik dengan sejumlah konsep
gangguan lain yang telah lama dikenal dalam literatur kedokteran, misalnya distur-
bance, disorder, dan impairment.

5. PENGUBAH EFEK
Konsep lainnya tentang faktor ketiga yang perlu diketahui adalah pengubah efek.
Pengubah efek (effect modifier) merupakan faktor ketiga yang memodifikasi (=
mengubah) pengaruh paparan terhadap penyakit (Clayton dan Hills, 1998; Last,
2001; Rothman, 2002). Pengubahan efek (effect modification) disebut juga interaksi
(interaction) (Kleinbaum et al., 1982; Clayton dan Hills, 1998). Meski sama-sama
faktor ketiga, pengubah efek berbeda dengan faktor perancu. Faktor perancu
mengakibatkan distorsi penaksiran pengaruh paparan terhadap penyakit, sedang
pengubah efek tidak mengakibatkan distorsi penaksiran tersebut, melainkan
mengubah pengaruh paparan terhadap penyakit sesuai dengan level dari pengubah
efek tersebut. Implikasinya, kerancuan perlu dikontrol, sedang modifikasi efek tidak
perlu dikontrol melainkan dideskripsikan.
Contoh, Merlo et al. (2005) melakukan studi di Swedia untuk mempelajari
pengaruh lingkungan tetangga terhadap tekanan darah sistolik pada 25000 subjek
penelitian yang bertempat tinggal di 39 lingkungan tetangga. Peneliti menggunakan
multilevel regression analysis (MLRA) untuk menganalisis hubungan antara tekanan
darah sistolik dan body mass index (BMI), serta pengaruh income lingkungan
tetangga terhadap hubungan tersebut. Gambar 8.4 menunjukkan hubungan positif
antara BMI dan tekanan darah sistolik. Makin tinggi BMI, makin meningkat rata-
rata tekanan darah sistolik.
Di samping itu Gambar 4 menunjukkan interaksi, bahwa peningkatan
tekanan darah sistolik yang berkaitan dengan meningkatnya body mass index diubah
(dimodifikasi) oleh income lingkungan tetangga. Peningkatan tekanan darah yang
berkaitan dengan meningkatnya BMI makin besar pada individu-individu yang
bertempat tinggal pada lingkungan tetangga ber-income rendah dibandingkan
income tinggi. Perbedaan daya ungkit pengaruh income lingkungan tetangga
terhadap pengaruh BMI terhadap tekanan darah sistolik antara income rendah dan
income tinggi ditunjukkan oleh garis regresi yang berpotongan antara kedua
kelompok tersebut. Koefisien regresi BMI lebih besar pada kelompok lingkungan
tetangga berincome rendah daripada income tinggi. Kalau saja garis tersebut sejajar,
maka income lingkungan tetangga tidak berinteraksi dengan BMI dalam mempenga-
Program Magister Ilmu Kesehatan Masyarakat,
Program Pascasarjana,
Universitas Sebelas Maret
-------------------------------------------

ruhi tekanan darah sistolik, dan koefisien regresi antara kedua kelompok lingkungan
tetangga akan sama.

Gambar 4 Interaksi income antara lingkungan tetangga


dan body mass index dalam mempengaruhi
tekanan darah sistolik (Sumber: Merlo et al., 2005)

REFERENSI

Alderson P, Green S (2002). Cochrane Collaboration open learning material for


reviewers Version 1.1 The Cochrane Collaboration. www.cochrane-
net.org/openlearning/PDF. Diakses Juli 2007.
Baum FE, Ziersch AM (2003). Social capital. J Epidemiol Community
Health;57:320323
Cohen, J. (1960). Coefficient of agreement for nominal scales. Educational and
Psychological Measurement, 20: 3746.
Clayton D, Hills M (1998). Statistical models in epidemiology. Oxford: Oxford
University Press.
Garson GD (2008). Reliability analysis. Statnotes. David_Garson@ncsu.edu. Diakses
Januari 2008.
Gay, L.R. (1976). Educational research: Competencies for analysis and application.
Columbus, OH: Bell & Howell Company.
Gerstman B.B. (1998). Epidemiology kept simple: An introduction to classic and
modern epidemiology. New York: Wiley-Liss.
Gordis, L (2000). Epidemiology. Philadelphia, PA: WB Saunders Co.
Grogan S, Conner M, Norman P, Willits D, Porter I (2000). Validation of a
questionnaire measuring patient satisfaction with general practitioner services.
Quality in Health Care 210 (9):210215
Hardell L, Carlberg M, Soderqvist F, Mild KH, Morgan L (2007). Long-term use of
cellular phones and brain tumours: increased risk associated with use for 10

11 | Prof Bhisma Murti


Program Magister Ilmu Kesehatan Masyarakat,
Program Pascasarjana,
Universitas Sebelas Maret
----------------------------------
years. Occup Environ Med, 64: 626-632.
Hennekens CH, Buring JE, Manson JE (1996). Lack of effect of long term
supplementation with beta-carotene on the incidence of malignant neoplasms
and cardiovascular disease. N Engl J Med, 334: 1145-1149.
Hennekens, C.H. dan Buring, J.E. (1987). Epidemiology in medicine. Boston: Little,
Brown and Company.
Hicks CR (1982). Fundamental concepts in the design of experiments. Forth Worth,
TX: Saunders College Publishing.
Hornby AS (2003). Oxford Advanced Learners Dictionary of Current English.
Oxford: Oxford University Press.
Hosmer DW, Lemeshow S (1989). Applied logistic regression. New York: John Wiley
& Sons.
Kleinbaum DG, Kupper LL, Muller KE (1988). Applied regression analysis and other
multivariable methods. Boston: PWS-Kent.
Kleinbaum, D.G., Kupper, L.L., dan Morgenstern, H. (1982). Epidemiologic research:
Principles and quantitative methods. New York: Van Nostrand Reinhold.
Kothari, C.R. (1990). Research methodology: Methods and techniques. New Delhi:
Wiley Eastern Limited.
Landis, J.R., dan Koch, G.G. (1977). The measurment of observer agreement for
categorical data. Biometrics 33: 15974
Last JM (2001). A dictionary of epidemiology. Oxford: Oxford University Press.
Lomas J (1998). Social capital and health: Implications for public health and
epidemiology. Soc. Sci. Med. 47(9): 1181-1188
MedCalc (2007). Inter-rater agreement. MedCalc Version 9.3.7.0 - 1993-2007.
Frank Schoonjans. Last modified: 15 August 2007.MedCalc Software,
Broekstraat 52, 9030 Mariakerke, Belgium
Mercer D (1991). Intermediate epidemiology (Coursework). New Orleans, LA: Tulane
School of Public Health and Tropical Medicine.
Merlo J, Chaix B, Yang M, Lynch J, Rstam L (2005). A brief conceptual tutorial on
multilevel analysis in social epidemiology: interpreting differences and the
effect of neighbourhood characteristics on individual health. J. Epidemiol.
Community Health; 59;1022-1029
Murti B (1996). Penerapan metode statistik non-parametrik dalam ilmu-ilmu
kesehatan. Jakarta: Gramedia Pustaka Utama.
OLoughlin J, Tarasuk J, Difranza J, Paradis G (2002). Reliability of selected
measures of nicotine dependence among adolescents. Ann Epidemiol, 12: 353-
362.
Pagano M, Gauvreau K (2000). Principles of biostatistics. Pacific Grove, CA:
Duxbury.
Polgar S, Thomas SA (2000). Introduction to research in the health sciences.
London: Churchill Livingstone/ Harcourt Publishers Ltd.
Program Magister Ilmu Kesehatan Masyarakat,
Program Pascasarjana,
Universitas Sebelas Maret
-------------------------------------------

Rosner, B. (1990). Fundamentals of biostatistics. Boston: PWS-Kent Publishing


Company.
Rothman, K.J. (2002). Epidemiology: An introduction. New York: Oxford University
Press.
Sackett DL, Haynes RB, Guyatt GH, Tugwell P (1991). Clinical epidemiology: A basic
science for clinical medicine. Boston: Little, Brown, and Company.
Streiner DL, Norman GR (2000). Health measurement scales: A practical guide to
their development and use. Oxford: Oxford University Press.
Streiner DL, Norman GR, Blum HM (1989). PDQ Epidemiology. Toronto: BC
Decker, Inc.
Verdecchia P, Angeli F (2005). Natural history of hypertension subtypes. Circulation,
111:1094-10
Vogt WP (1993). Dictionary of statistics and methodology. Newbury Park, CA: Sage
Publications, Inc.
Weisell RC (2002). Body mass index as an indicator of obesity. Asia Pacific J Clin
Nutr, 11(Suppl):S681-S684

13 | Prof Bhisma Murti

Anda mungkin juga menyukai