PDF

MODUL PRAKTIKUM STATA
BIOSTATISTIK DASAR DAN

INFERENSIAL – SKM BERSKS
BKN302
dr. I Ketut Tangking Widarsa, MPH.

Ni Made Dian Kurniasari, SKM.,MPH
Ketut Hari Mulyawan, S.Kom.,MPH
Program Studi Kesehatan Masyarakat

Fakultas Kedokteran Universita Udayana
Denpasar, 2017
Modul STATA Page 1

Modul 1
Managemen Data STATA
1.1 Pendahuluan
Pada model ini akan dipelajari cara memulai dan mengakhirkan sesi STATA,
cara membuat struktur data, cara merekam data, cara membuka file data STATA atau
file data dengan format bukan STATA, misalnya dalam format Excel, Dbase, dll. Juga
akan dipelajari cara membuat variabel baru dari data yang sudah ada dengan cara
recode atau compute. Selain itu, juga akan dipelajari cara memilih record tertentu dan
cara mengurut data.
1.2 Tujuan
Untuk meningkatkan kemampuan peserta pelatihan dalam pengelolaan data
dengan STATA sebagai persiapan analisis data selanjutnya.
1.3 Pokok Bahasan

Pada bagian ini akan dibahas dan dipraktekan cara:
1. Membuat struktur data format STATA
2. Merekam data
3. Menyimpan dan memuka file STATA
4. Cara tranformasi data
5. Cleaning data
1.4 Managemen Data Menggunakan Stata

1.4.1 Membuka dan Mengakhiri Program
1. Memulai program STATA dilakukan dengan meng-klik ikon STATA sehingga

muncul:
Modul STATA Page 2

Secara garis besar, tampilan utama Stata dibagi dalam 4 bagian, yaitu :
1) Command window, yang berfungsi sebagai tempat untuk memberikan perintah
kepada Stata, Command window dapat juga digunakan sebagai
kalkulator, dengan memasukan rumus-rumus yang kompleks dan fungsi-
fungsi internal Stata. Selain itu dapat juga diberikan perintah sistem operasi,
misalnya perintah Dos pada sistem operasi Windows atau perintah terminal
Unix/Linux pada sistem operasi Unix/Linux.
2) Review window, menampilkan semua perintah-perintah yang pernah di ketikan
pada Command window, berikut kolom _rc yang menampilkan kode error yang
muncul pada saat memproses perintah yang dijalankan.
3) Variable window, menampilkan seluruh variable yang ada pada dataset yang
kita buka, berikut variable tambahan yang dibuat pada saat proses (generate).
Pada window ini ditampilkan secara lengkap label, tipe dan format dari semua
variable yang ada, sehingga memudahkan kita mendapatkan informasi detail
tentang variable yang akan digunakan.
4) Result window, menampilkan semua output dari perintah yang diketikan pada
Command Window, kecuali output grafik yang ditampilkan pada window
tersendiri.
2. Format perintah stata

Format perintah stata adalah sebab gai berikut:
(command) [parameter] [if kondisi] [in] [,] [option]
1) Command adalah input perintah yang harus ada setiap memberikan perintah
2) Parameter adalah nilai yang diberikan untuk perintah, dapat berupa variable
dari dataset
3) if adalah formula yang bersifat opsional
4) in adalah kondisi yang mengacu pada observasi.
Modul STATA Page 3

5) Option, digunakan untuk menambahkan pilihan bentuk output dari command
Stata yang dibuat.
3. Operator Pada Stata

Seperti pada semua software statistik dan bahasa pemrograman, Stata juga
mempunyai operator untuk menunjang ekspresi matematika pada command dan
bahasa program, berikut adalah tabel operator yang digunakan pada Stata:
1.4.2 Membuat Struktur Data

1. Struktur Data
Setiap variabel dalam file data STATA memiliki struktur data sbb:
No Struktur Deskripsi
1 Name Nama menggunakan abjad, tidak ada spasi, tanda baca dan
tanda matematik
2 Label Penjelasan (nama lengkap) dari variabel name
3 Type Numerik (untuk data dalam bentuk angka), string (data dalam
bentuk abjad)
5 Format Format dari type. Untuk numerik bisa diformat jumlah digit,
decimal, date dll. Untuk string bisa diformat total karakter dan
justified.
6 Value Hanya untuk jenis data ketegori, misalnya SEX: 1=laki dan
Label 0=perempuan
2. Cara membuat struktur data
Modul STATA Page 4

1) Tampilkan data editor dengan membuat perintah edit, maka akan tampak
window data editor:
2) Klik bar untuk nama variabel 2 kali, sehingga tampak sbb:

3)
4) Kemudian tentukan variable type, isi variable name dan klik pilihan fill with
missing data, selanjutnya klik OK, maka pada variabel properties akan tampak
sbb:
Perlu diperhatikan bahwa setelah menekan OK maka variable type tidak bisa
diubah dari numerik ke string atau sebaliknya.
Selanjutnya bisa diisi Label, Type dari data numerik, Format dan Value Label.
Untuk Format bisa diklik option diujung kanan.
5) Membuat Value Label

Untuk data kategori seperti SEX dengan kategori 1=laki dan 0=perempuan dan
diare dengan kategori 1=diare dan 0=tidak, maka value dari kedua variabel
tersebut harus didefinisikan dalam struktur datanya. Cara membuatnya adalah
sbb:
a. Klik bagian sebelah kanan (browse) dari value label maka akan muncul
Modul STATA Page 5

b. Kemudian klik Create label maka akan tampak sbb:
c. Isi nama label pada Label name kemudian ketik: 1 pada kotak “Value”
untuk kategori pertama dan ketik: Laki pada kotak “Label”, dan klik “Add”
untuk memindahkan definisi tersebut ke kotak di bawahnya. Lanjutkan
ketik kode 0 dan labelnya perempuan, dan klik “Add” sehingga kedua
definisi kategori sudah ada di kotak seperti berikut. Klik “OK” untuk
kembali ke variabel properties kemudian klik tanda panah kebawah dan
pilih nama label yang sudah dibuat.
1.4.3 Merekam Data

Setelah struktur data dibuat, langkah selanjutnya adalah merekam data. Data
hanya dapat direkam pada Data Editor. Oleh karena itu sebelum memulai merekam
maka aktifkan lebih dulu Data Editor dengan mengetik perintah edit atau klik Data
pada menu bar kemudian pilih Data editor kemudian pilih Data Editor (edit). Setelah
muncul data editor buatlah struktur data untuk variabel: id, age, sex, weight, height dan
diare, kemudian rekam data seperti tampak sbb:
Modul STATA Page 6

Catatan:
Gunakanlah titik sebagai pemisah desimal
1.4.4 Menyimpan dan Membuka Data

Setelah data direkam, kemudian disimpan dengan mengklik File, Save As maka akan
tampak:
Kemudian isi File name setelah itu klik save.

Untuk membuka data klik file, open kemudian pilih file data yang ingin dibuka
kemudian klik open.
1.4.5 Transformasi Data

Tidak jarang dalam proses analisis data suatu penelitian diperlukan pembuatan
variabel baru dari data yang sudah ada, misalnya dalam analisis dibutuhkan variabel
anemi, tetapi variabel tersebut belum ada, sedangkan yang ada adalah variabel Hb.
Oleh karena itu perlu dibuat variabel anemia dari variabel Hb yang sudah ada. Contoh
lain, dalam analisis diperlukan variabel IMT, tetapi variabel tersebut belum ada,
Modul STATA Page 7

sedangkan yang ada adalah variabel tinggi dan berat. Oleh karena itu perlu dibuat
variabel IMT dari data tinggi dan berat. Kegiatan membuah variabel baru dari variabel
yang sudah ada dinamakan transformasi data. Ada dua prosedur yang paling banyak
dipakai mentransformasi data, yaitu Recode dan Compute.
1. Recode
Prosedur Recode dipakai membuat variabel baru dengan mengubah nilai variabel
lama, misalnya variabel age diubah menjadi variabel klp_umur sbb:
VARIABEL LAMA (OLD): RECODE VARIABEL BARU (NEW):

UMUR KLP_UMUR
0-4 1 = ”1-2”
0 = “3-4”
Cara membuat variabel dengan Recode adalah sbb:
1) Ketiklah perintah (syntax): generate klp_umur=age
2) Kemudian ketiklah perintah: recode klp_umur min/2=1 3/4=0
3) Untuk membuat value label dari variabel klp_umur tersebut maka ketiklah:
label define klp_umur 1 "1-2" 0 "3-4"
4) Untuk mengaktifkan label name yang sudah dibuat pada veriabel maka
ketiklah:
label values klp_umur klp_umur
2. Compute
Prosedur Compute dipakai bila variabel baru yang akan dibuat merupakan hasil
komputasi variabel lama, misalnya akan dibuat variabel imt dari variabel weight
dan height dengan rumus imt=weight/(Height/100)2. Maka cara computenya
adalah ketik:
gen imt=weigth/(height/100)^2
Teknik managemen data selebihnya dapat dilihat pada menu STATA “Help” è PDF
document.
Modul STATA Page 8

Modul 2
Uji Normalitas dan Uji Beda Mean (Compare Means)
2.1 Pendahuluan
Prosedure Compare Means dipakai untuk menganalisis perbedaan rerata satu sampel,
dua sampel berpasangan, dua sampel bebas, dan menganalisis perebdaan rerata
lebih dari dua sampel bebas. Pada modul ini akan dibahas indikasi, persyaratan,
langkah menjalanan prosedure compare mean dan cara interpretasi hasilnya.
Tujuan
Peserta latihan diharapkan dapat menggunakan SPSS sebagai alat bantu analisis
perbedaan rerata pada berbagai penelitian kesehatan dan dapat memberikan
interpretasi berbagai output analisis compare mean.
Pokok Bahasan
Pada modul ini akan dibahas prosedure:
• One Sample T Test
• Paired Sampels T Test
• Independent Samples t Test
2.2 One Sample T Test
2.2.1 Indikasi
One Sample T Test dipakai apabila akan menguji hipotesis perbedaan rerata satu
sampel dengan nilai test tertentu (nilai baku). Misalnya akan menguji apakah rerata
tekanan intraoculer (mmHg) dari orang tua berbeda dengan 14 mmHg? Tekanan intra
okuler sebesar 14 mmHg sebagai nilai test (test value).
2.2.2 Persyaratan
One Sample T Test adalah bagian dari uji parametrik yang memiliki asumsi data
bedistribusi normal.
2.2.3 Hipotesis:
Ho. µ = 14 (rerata tidak berbeda dengan 14)
Ha. µ ≠ 14 (rerata berbeda dengan 14)
2.2.4 Uji Statistik

Uji statistik yang dipakai adalah One Sample T Test dengan rumusa sbb:
Modul STATA Page 9

x − test.value
t=
sd / n
2.2.5 CI perbedaan
Nilai interval kepercayaan dihitung dengan rumus sbb;
CI (1-α) = beda ± tα x sd/√n
2.2.6 Cara membuat kesimpulan

Ho diterima:
bila nilai p > α, berarti tidak terdapat perbedaan rerata populasi dengan nilai
test.
Ho ditolak:
bila nilai p ≤ α, berarti terdapat perbedaan antara populasi dengan nilai test
Contoh Kasus
Untuk menguji hipotesis tersebut, sebanyak 21 sampel diukur tekanan intraocularnya
dan hasilnya adalah sbb:
14,5 12,9 14,0 16,1 12,0 17,5 14,1 12,9 17,9 12,0
16,4 24,2 12,2 14,4 17,0 10,0 18,5 20,8 16,2 14,9
19,6
Apakah dari data sampel ini dapat disimpulkan bahwa tekanan intraocular orang tua
lebih dari 14 mmHg? Cara analisisnya adalah sbb.
2.2.7 Procedure One sample T-Test dengan STATA

1) Rekam data di atas
Langkah mereka data:
• Aktifkan STATA dengan double klik ikon STATA
• Buat struktur Data
Lakukan langkah-langkah membuat struktur data, sehingga akan tampak
sbb:
• Rekam data
Modul STATA Page 10

Lakukan langkah rekam data, rekam sebanyak observasi (n =21). contoh
sbb:
2) Uji Normalitas Data dengan uji Shapiro-Wilk

Terdapat dua uji normalitas yang dipakai, yaitu uji Kolmogorov-Smirnov dan
Shapiro-Wilk. Uji Kolmogorov-Smirnov dipakai bila jumlah sampel besar (n>30),
sedangan uji Shapiro-Wilk dipakai bila sampel kecil (n<30). Yang akan dipakai
pada kasus ini adalah uji normalitas dengan uji Shapiro-Wilk
• Ketik syntax pada jendela command : swilk TIO
Seperti pada contoh sbb:
Lalu tekan enter maka akan tampil Output sbb:
. swilk TIO
Shapiro-Wilk W test for normal data
Variable Obs W V z Prob>z
TIO 21 0.96294 0.908 -0.195 0.57728
• Interpretasi Output
Untuk data Tekanan Intraoculer, uji normalitas yang dipakai adalah uji
Shapiro-Wilk dan data dinyatakan berdistribusi normal karena nilai Prob (p)
> 0,05. Oleh karena itu, perbedaan rerata tekanan intraocular dengan 14
dapat diuji dengan uji t (uji parametrik).
Modul STATA Page 11

3) Uji perbedaan mean satu sampel
Dalam kasus ini, sebagai nilai test (test value) adalah 14 dan langkah
analisisnya adalah sbb:
• Ketik syntax pada jendela command: ttest TIO == 14
Lalu tekan enter, maka akan tampil output sbb:
. ttest TIO==14
One-sample t test
Variable Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
TIO 21 15.62381 .7382058 3.382884 14.08394 17.16368
mean = mean(TIO) t= 2.1997

Ho: mean = 14 degrees of freedom = 20
Ha: mean < 14 Ha: mean != 14 Ha: mean > 14

Pr(T < t) = 0.9801 Pr(|T| > |t|) = 0.0398 Pr(T > t) = 0.0199
Penentuan tingkat kepercayaan

tingkat kepercayaan yang dipakai adalah 95% dan by default STATA
menggunakan 95% confidence interval.
2.2.4 Interpretasi
Ho diterima bila nilai p > 0,05 dan sebaliknya Ho ditolak bila nilai p ≤ 0,05. Nilai p pada
hasil diatas adalah 0.0398, sesuai dengan Ha dua sisi yaitu Ha= µ≠14
Berdasarkan hasil analisis dapat disimpulkan bahwa Ho ditolak, berartinya rerata
tekanan intraoculer 15,62 ± 3,38 mmHg berbeda dengan 14 mmHg. Sehingga dapat
disimpulkan bahwa rerata tekanan intraoculer orang tua lebih tinggi dari 14 mmHg.
95% CI yaitu 14.08 – 17.16.
2.3 Paired Samples T Test
2.3.1 Indikasi
Paired Samples T Test dipakai untuk menganalisis pebedaan rerata dua sampel
berpasangan. Misalnya akan diteliti efek intervensi ergonomi terhadap produktivitas
karyawan pabrik sepatu dengan rancangan pre-post.
2.3.2 Persyaratan
Paired Samples T Test adalah bagian dari uji parametrik yang memiliki asumsi data
bedistribusi normal.
2.3.3 Hipotesis:
Modul STATA Page 12

Untuk 2 sisi
Ho. µd = 0 (tidak berbeda antar pasangan)
Ha. µd ≠0 (berbeda antar pasangan)
Untuk 1 sisi
Ho. µd ≤ 0 atau Ho. µd ≥ 0
Ha. µd > 0 atau Ho. µd < 0
2.3.4 Uji Statistik

Perbedaan rereta dua sampel berpasangan diuji dengan dependent samples T Test
dengan rumus sbb:
d
t=
sd / n
Dimana:
d = rerata beda pasangan
n = jumlah sampel pasangan
2.3.5 CI perbedaan
Nilai interval kepercayaan beda rerata pasangan dapat dihitung dengan rumus sbb:
CI(1-α) = d ± t x sd/√n
α
Dimana:
d = rerata beda pasangan
n = jumlah sampel pasangan
t = nilai t tabel untuk α tertentu
α

Kesimpulan dapat dibuat dengan membandingkan nilai p dengan tingkat kemaknaan
α. Ho diterima bila nilai p > α dan sebaliknya, Ho ditolak bila nilai p ≤ α. Cara
pengambilan kesimpulan juga dapat dibuat berdasarkan nilai interval kepercayaan (CI)
dari nilai pebedaan rerata. Ho diterima bila angka nol berada di dalam CI dan
sebaliknya Ho ditolak bila angka nol di luar CI.
Contoh Kasus:
Ellen Davis Jones melakukan penelitian terhadap efek dari terapi reminiscence
untuk wanita lanjut usia dengan depresi. Sampel penelitian sejumlah 15 wanita
berumur 60 tahun atau lebih dan tinggal 3 bulan atau lebih di panti jompo. Untuk
kasus ini, depresi diukur dengan menggunakan Geriatric Depression Scale
(GDS). Skor yang tinggi menunjukkan gejala depresi berat. Peserta
mendapatkan terapi reminiscence dalam pelayanan jangka panjang, dengan
menggunakan foto keluarga, scrapbooks, and diary personal untuk menstimulasi
memori dan percapakan antar kelompok. Skor GDS sebelum dan sesudah
treatment diberikan sesuai dengan data berikut. Dapatkah kita simpulkan bahwa
Modul STATA Page 13

berdasarkan data tersebut, peserta terapi menunjukkan penurunan skor GDS ?.
Alpha = 0.01
Pre–GDS: 12 10 16 2 12 18 11 16 16 10 14 21 9 19 20
Post–GDS: 11 10 11 3 9 13 8 14 16 10 12 22 9 16 18
2.3.7 Procedure Paired Samples T Test

1) Buat Struktur dan Rekam Data
Lakukan langkah-langkah membuat struktur data dan rekam data sejumlah
observasi pada masing-masing variabel yaitu sebelum dan sesudah, contoh
sbb:
2) Uji Normalitas Data

Data Pretest dan Posttest diuji normalitasnya dengan langkah berikut:
Ketik syntax pada jendela command dengan format swilk variable_pre
variable_pro
Contoh pada kasus ini : swilk pregds postgds
Lalu tekan enter sehingga muncul output sbb:
Dari hasil diperoleh bahwa nilai p > 0.05 pada kedua kelompok, sehingga dapat
disimpulkan bahwa data berdistribusi normal. Sehingga dapat digunakan uji
paired-t test pada kasus tersebut.
Modul STATA Page 14

3) Uji Beda Mean
Langkah pertama adalah dengan menentukan tingkat kepercayaan yang
dipakai yaitu 99%.
Ketik syntax pada command yaitu : set level 99
Lalu enter,
Kemudian ketik syntax pada command dengan format yaitu : ttest var_pre
var_post
Contoh pada kasus ini : ttest pregds = postgds
Lalu enter, maka akan muncul output sebagai berikut :
2.3.8 Interpretasi
Hipotesis:
Ho. µd ≤ 0 (terapi reminiscence tidak efektif menurunkan depresi wanita
lansia)
Ha. µd > 0 (terapi reminiscence efektif menurunkan depresi wanita lansia)
Catatan : Hipotesis harus disesuaikan dengan perhitungan beda, pada kasus ini beda
diperoleh dari mean pre dikurangi mean post, maka hipotesis adalah seperti
diatas.
Bila beda diperoleh dari mean post dikurangi mean pre maka hipotesisnya
akan berbeda, kebalikan dari hipotesis diatas.
Kesimpulan
Ho diterima bila nilai p > α
Ho ditolak bila nilai p ≤ α
Berdasarkan hasil analisis didapatkan bahwa p = 0,0034 (p < 0.05) pada Ha µd
> 0 berarti Ho ditolak.
Dari hasil analisis dapat disimpulkan bahwa terapi reminiscence efektif untuk
menurunkan depresi pada wanita lanjut usia.
Modul STATA Page 15

2.4 Independent Samples T-Test
2.4.1 Indikasi
Independent Samples T-Test dipakai untuk menguji perbedaan rerata dua sampel
bebas (independent samples). Sebagai contoh, akan diuji efek ekstrak seredelai
terhadap serum feritin tikus. Sebanyak 20 tikus dijadikan binatang percobaan,
separunya diberi ekstrak seredelai dan seperuhnya diberikan aqua (kontrol).
2.4.2 Persyaratan
Independent Samples T Test adalah bagian dari uji parametrik yang memiliki asumsi
data bedistribusi normal dan kedua kelompok memiliki varian yang sama (homogen).
2.4.3 Hipotesis:
Ho. µ1 = µ2 (tidak terdapat perbedaan serum Fe antara perlakuan dengan
kontrol)
Ha. µ1 # µ2 (terdapat perbedaan rerata serum Fe antara perlakuan dengan
kontrol)
2.4.4 Uji Statistik Homogenitas Varian

Homogenitas varian kedua kelompok diuji dengan Levene’s Test dengan
menggunakan statistik F sbb:
F =SD12/SD22
Kedua sampel dinyatakan memiliki varian homogen bila uji Leven menunjukan nilai p >
α dan sebaliknya dinyatakan tidak homogen bila nilai p ≤ α.
2.4.5 Uji Statistik Perbedaan Rerata

Uji statitik yang dipakai menguji kebenaran hipotesis nol perbedaan rerata dua sampel
bebas adalah Independent Samples T Test. Cara penghitungan nilai Uji T pada
Independent Samples T Test dibedakan antara kedua sampel homogen dan kedua
sampel tidak homogen.
Cara penghitungan nilai statistik T untuk dua sampel homogen
x1 − x 2 Keterangan:
t=
2 2 SDp = SD gabungan
SD p SD p SD 1 = standar deviasi sampel 1
+
n1 n2 SD 2 = standar deviasi sampel 2
n1 = jumlah sampel 1
n2 = jumlah sampel 2
SDp2 = {(n1-1)SD12 + (n2-1)SD22}/(n1+n2-2)
Modul STATA Page 16

Cara penghitungan nilai statistik T untuk dua sampel tidak homogen
x1 − x 2
t=
2 2
SD1 SD2
+
n1 n2
2.4.6 CI perbedaan
Nilai interval kepercayaan beda rerata pasangan dapat dihitung dengan rumus sbb:
( )
CI(1-α) = x 1 − x 2 ± t x seα
Dimana:
(x 1 )
− x 2 = beda rerata
se = standar error beda rerata
t = nilai t tabel untuk α tertentu
α

Ho diterima bila nilai p > α atau nilai nol terletak di dalam CI perbedaan rerata,
sebaliknya Ho ditolak bila nilai p ≤ α atau nilai nol terletak di luar CI perbedaan
rerata kedua kelompok.
Contoh Kasus:
Hoekema dkk meneliti craniofacial morphology dari 26 pasien laki-laki dengan
obstructive sleep apnea syndrome (OSAS) dan 37 laki-laki sehat tanpa OSAS
(non–OSAS). Variabel yang diteliti adalah panjang dari hyoid bone pada tubuh
ke Frankfort horizontal (diukur dalam mm). Apakah dapat disimpulkan bahwa
ada perbedaan panjang hyoid bone-Frankfort horizontal pada kedua
kelompok? α = 0.05.
Modul STATA Page 17

2.4.8 Procedure Independent Samples T Test
1) Buat Struktur data Ada 2 variabel dalam kasus ini yaitu variabel kelompok
(nonOSAS = 1 dan OSAS = 2) dan variabel panjang hyoid bone-Frankfort
(panjang). Rekam data sejumlah observasi yang dilakukan pada kedua
kelompok. Contoh struktur data adalah
Dan seterusnya hingga jumlah total sampel 63. Anda dapat membuat label
untuk kelompok dengan langkah yang sudah diberikan pada pertemuan
sebelumnya, misal 1 = nonOSAS dan 2 = OSAS
2) Uji Normalitas
Ketik syntax pada command dengan format : bysort variabel_kelompok: swilk
variable_interest
Contoh pada kasus ini : bysort kelompok: swilk panjang
Lalu enter, dan muncul output sebagai berikut:
Modul STATA Page 18

Disimpulkan bahwa hanya variabel panjang pada kelompok nonOSAS yang
tidak berdistribusi normal (p < 0.05) sedangkan pada kelompok OSAS
berdistribusi normal (p > 0.05). Tetap dapat menggunakan uji independent
sample t-test.
3) Uji Equality of Variance dengan Robust Variance test

STATA command format adalah robvar variable_interest, by variable_kelompok
Kasus ini : robvar panjang, by (kelompok)
Lalu enter dan muncul output sebagai berikut:
Ho. S12 = S22 (kedua kelompok memiliki variance sama atau homogen)
Ha. S12 = S22 (kedua kelompok memiliki variance berbeda atau heterogen)
Kesimpulan:
Ho diterima bila nilai p > α (kedua kelompok homogen)
Ho ditolak bila nilai p ≤α (kedua kelompok heterogen)
Nilai Wo menunjukkan nilai F dari Levene test. P=0.248; p>0.05 maka variance
homogen.
4) Uji Beda Mean Independent sample t-test

Tingkat kepercayaan STATA by default adalah 95%.
Format command STATA untuk uji independent sample t-test :
Bila variance equal/homogen : ttest variable_interest, by (var_kelompok)
Bila variance unequal/tidak homogen maka : ttest variable_interest, by
(var_kelompok) unequal
Pada kasus ini ketik : ttest panjang, by (kelompok)
Lalu enter sehingga muncul output berikut :
Modul STATA Page 19

2.4.9 Interpretasi
Deskriptif:
Rerata panjang hyoid bone-Frankfort horizontal pada kelompok non OSAS lebih
pendek dari rerata di kelompok OSAS. Rerata panjang hyoid bone-Frankfort
horizontal pada kelompok non OSAS 95.85±5.59, sedangkan untuk kelompok
OSAS adalah 111.06±6.96.
Uji beda mean

Hipotesis perbedaan mean adalah sbb:
Ho. µ1 = µ2 (tidak berbeda)
Ha. µ1 # µ2 (berbeda)
Kesimpulan
Didapatkan beda mean = - 15.21 dengan CI 95% adalah -18.37 s/d -12.04 dan
nilai p < 0,000. Ini berarti bahwa ada perbedaan panjang Hyoid bone-Frankfort
pada kedua populasi, dimana OSAS lebih panjang dibandingkan nonOSAS.
Modul STATA Page 20

Modul 3
One-Way ANOVA
3.1 Pendahuluan
Prosedure One-Way ANOVA dipakai untuk menganalisis perbedaan rerata lebih dari
dua sampel bebas. Pada modul ini akan dibahas indikasi, persyaratan, langkah
menjalanan prosedure One-Way ANOVA dan cara interpretasi hasilnya.
Tujuan
Peserta latihan diharapkan dapat menggunakan SPSS sebagai alat bantu analisis
perbedaan rerata pada berbagai penelitian kesehatan dan dapat memberikan
interpretasi berbagai output analisis One-Way ANOVA.
Pokok Bahasan
Pada modul ini akan dibahas prosedure:
• Indikasi
• Persyaratan
• Hipotesis
• Uji One-Way ANOVA
• Uji Post Hoc
3.2 Indikasi
Uji One-way Anova dipakai menganalisis perbedaan rerata lebih dari dua kelompok
sampel bebas. Sebagai contoh, akan menganalisis efek ekstrak seredelai terhadap
serum Fe. Penelitian eksperimen dengan rancangan acak lengkap dimana terdapat
tiga kelompok percobaan, yaitu kelompok kontrol, ekstrak seredelai dosis 50% dan
seredelai dosis 75%. Untuk menganalisis perbedaan efek dilakukan dengan
membadingkan rerata serum Fe antara ke tiga kelompok. Analisis perbedaan rerata
serum Fe dari ketiga kelompok dilakukan dengan uji One-way Anova.
3.3 Persyaratan
Uji One-way ANOVA adalah bagian dari uji parametrik yang memiliki asumsi data
bedistribusi normal dan antar kelompok memiliki varian yang sama (homogen).
3.4 Hipotesis:
Ho. µ1 = µ2 = µ3 (tidak terdapat perbedaan serum Fe antara perlakuan
dengan kontrol)
Ha. Paling sedikt terdapat dua kelompok yang memiliki rerata serum Fe
berbeda
Modul STATA Page 21

3.5 Uji Statistik
Uji statistik pada analisis variance menggunakan uji Variance Ratio atau uji F dengan
rumus statistik sbb:
Varian antar kelompok
F = -------------------------------------
Varian dalam kelompok
Varian antar kelompok:

Varian kelompok menggambarkan variasi antar kelompok.
Varian antar kelompok = jumlah kwadrat antar kelompok/db
Kalau y1. , y 2. , y 3. adalah rerata Y kelompok eksperimen 1, 2 dan 3 dan y
adalah grand mean, n1, n2, n3 adalah jumlah sampel di setiap kelompok dan k
adalah jumlah kelompok, maka:
k
Jumlah kwadrat antar kelompok = ∑ nk y k − y
1
( )
2
Derajat bebas kelompok = k – 1, maka:

k
Varian antar kelompok = ∑n 1
k (y − y ) /(k − 1)
k
2
Varian dalam kelompok

Menggambarkan variasi individu di dalam kelompoknya terhadap rerata
kelompok.
Varian dalam kelompok = jumlah kwadrat dalam kelompok / db.
k n
2
Jumlah kwadrat dalam kelompok = ∑∑ (y
i j
i. j − y i. ) dimana i = 1 s/d k dan j =1
s/d n
Derajat bebas dalam kelompok = n – k, maka:
k n
2
Varian dalam kelompok = ∑∑ (y
i j
i. j )
− y i. / (n − k )
Berdasarkan uraian di atas, maka resume perhitungan analisis varian pada One-Way
Anova dapat disajikan sebagai berikut.
Sumber Jumlah Kwadrat Derajat Varian Varian Ratio

Variasi (Sum Square) Bebas (Mean Square)
Between k
(k −1) MSG = SSG/(k-1) F=
groups SSG= ∑ nk y k − y
1
( )
2
MSG/MSE
Within SSE= (n − k ) MSE = SSE/(n-k)

Groups k n
2
(Error) ∑∑ (y
i j
i. j − y i. )
3.6 Cara membuat kesimpulan uji Anova

Kesimpulan dibuat berdasarkan nilai p dari statistik F.
Ho diterima bila nilai p > α, berarti tidak ada kelompok yang berbeda
Modul STATA Page 22

Ho ditolak bila nilai p ≤ α, berarti ada kelompok yang berbeda
3.7 Uji Post Hoc

Uji Post Hoc merupakan analisis lanjutan dari analisis variance bila Ho pada analisis
varian ditolak. Uji post hoc dipakai untuk menguji kelompok mana yang berbeda
dengan cara melakukan perbandingan terhadap semua kelompok (multiple
comparasion). Uji uji statistik untuk Post Hoc Test dikelompokan menjadi dua
kelompok, yaitu jenis uji Post Hoc bila semua kelompok memiliki variance yang sama
(homogen) dan bila vararian tidak homogen. Jenis uji Post Hoc untuk variance
homogen antara lain LSD, Scheffe, Duncan, dll dan untuk variance tidak homogen
adalah Thamhane, Dunnet, dll.
Bila terdapat 3 kelompok yang dibadingkan, maka akan terdapat 3 perbandingan antar
kelompok, yaitu:
1) Antara kelompok 1 vs kelompok 2 dengan Ho: µ1 = µ2
Dari perbadingan antar kelompok ini akan dapat diketahui kelompok mana yang
berbeda dengan kelompok yang mana.
3.8 LATIHAN
Contoh Kasus
Satu penelitian eksperimen laboratorium akan menganalisis efek pemberian ekstrak
seredelai terhadap serum Fe pada tikus. Penelitian eksperimen dengan rancangan
acak lengkap dimana terdapat tiga kelompok percobaan, yaitu: kelompok kontrol,
ekstrak seredelai dosis 50% dan seredelai dosis 75%. Untuk menganalisis perbedaan
efek dilakukan dengan membadingkan rerata serum Fe antara ke tiga kelompok. Data
hasil pengukuran serum Fe setelah percobaan pada ke tiga kelompok adalah sbb.
Data serum Fe kelompok kontrol dan eksperimen
Kontrol Ekstrak Seredelai Ekstrak Seredelai
dosis 50% Dosis 75%
30,662 35,765 54,604
25,037 28,169 52,914
25,473 35,211 96,993
34,121 51,042 47,178
37,447 29,635 36,391
25,167 42,010 26,395
39,186 43,512 48,681
Prosedur STATA
Membuat struktur data dan Merekam Data
Jumlah variabel pada kasus di atas adalah 2, yaitu variabel bebas Perlakuan (kategori:
1=kontrol 2=dosis 50% dan 3=dosis 75%) dan Serum Fe (numerik), maka struktur data
file menjadi sbb:
Modul STATA Page 23

No. Name Type Width Decimal Label Value
1=kontrol
1 Dosis N 8 0 Dosis
2=dosis 50%
percobaan
3=dosis 75%
2 Serum_Fe N 8 3 Kadar serum
Fe
Contoh struktur data dan rekam data pada STATA
Analisis One-way ANOVA

1) Uji Normalitas Data
Stata command: bysort variabel_kelompok: swilk variable_bebas
Contoh ini yaitu bysort perlakuan: swilk serumFe
Kesimpulan semua kelompok berdistribusi normal karena nilai p masing-masing > 0.05
Modul STATA Page 24

2) Uji Homogenitas Variance
STATA command format adalah robvar variable_bebas, by variable_kelompok
Kasus ini : robvar serumFe, by (perlakuan)
Lalu enter dan muncul output sebagai berikut:
Nilai Wo menunjukkan nilai F dari Levene test. P=0.219; p>0.05 maka variance
homogen.
3) Deskriptif statistik
Format STATA Command : bysort variabel_kelompok: sum var_bebas
Contoh pada kasus ini: bysort perlakuan: sum serumFe
Lalu enter maka akan muncul output sbb:
4) Uji One Way Anova

Format STATA Command: anova variabel_bebas variabel_kelompok
Contoh pada kasus ini: anova serumFe perlakuan
Modul STATA Page 25

atau dengan command lainnya: oneway variabel_bebas variabel_kelompok
contoh ini : oneway serumFe perlakuan
Lalu enter sehingga muncul output sbb:
5) Uji Post Hoc

Uji Post Hoc dipakai menguji perbedaan rerata antara kelompok (multiple
comparisons). Uji Post Hoc dibedakan menjadi dua bagian, yaitu kelompok uji
Post Hoc untuk equal variance assumed dan uji Post Hoc untuk equal variance
not assumed.
Uji post hoc yang dipakai dalam kasus ini adalah Bonferroni. Uji ini dilakukan
bersamaan dengan melakukan uji anova, yaitu dengan menambahkan
command “bo” : oneway serumFe perlakuan, bo. Lalu enter maka akan muncul
output yang sama dengan sebelumnya namun ada tambahan output sbb:
Modul STATA Page 26

6) Interpretasi
Statistik Deskriptif
Rerata serum Fe pada kontrol adalah 31,01 dosis 50% adalah 37,91 dan dosis
75% adalah 51,88.
Uji One-Way ANOVA

Nilai p = 0,037 maka Ho ditolak. Berati paling sedikit ada dua kelompok
berbeda.
Uji Post Hoc

Uji Post Hoc yang dibaca adalah Bonferroni, angka pada baris ke dua.
Kelompok 3 vs kelompok 1 nilai p = 0.038 (p<0.05) yang artinya ada
perbedaan.
Kesimpulan: rerata serum Fe tikus yang diberikan dosis 75% berbeda dengan
rerata serum Fe tikus yang tidak diberikan seredele (kontrol). Dosis 75%
terbukti mempunyai efek meningkatkan serum Fe tikus, sedangkan dosis 50%
tidak memberikan efek peningkatan serum Fe.
Modul STATA Page 27

MODUL 4
Analisis Perbedaan Risk

4.1 Pendahuluan
Pada penelitian kesehatan sering dipelajari hubungan antara dua variabel kategori atau lebih,
seperti misalnya terjadinya suatu penyakit dikaitkan dengan keberadaan faktor risio tertentu.
Sebagai contoh, misalnya akan diteliti apakah kebiasaan merokok meningkatkan resiko
terjadinya penyakit jantung koroner. Dua jenis ratio yang sering dipakai untuk memperkirakan
besarnya resiko, yaitu: relatif risk (RR) dan odd ratio (OR). RR dan OR dikembagkan di bidang
epidemiologi, tetapi sekarang pengunaannya tidak hanya di bidang epidemiologi melainnya
dibanyak penelitian kesehatan. RR dan OR dipakai menentukan besarnya resiko pada
penelitian prospektif dan OR dipakai dalam penelitian retrospektif.

Uji Chi-square dipakai menguji hipotesis hubungan antara variabel kategorikal. Pada modul ini
akan dibahas uji hipotesis hubungan antara dua variabel kategori untuk rancangan random
dan rancangan berpasangan (matched design).

Tujuan
Mahasiswa diharapkan dapat menggunakan STATA sebagai alat bantu analisis perbedaan risk
pada berbagai penelitian kesehatan dan dapat memberikan interpretasi berbagai output
analisis korelasi.

Pokok Bahasan
Pada modul ini akan dibahas:
• Indikasi RR, OR, uji chi-square dan uji McNemar
• Hipotesis
• Kesimpulan
• Prosedur uji dengan STATA
• Interpretasi

4.2 Uji Perbedaan Risk pada Studi Cross-sectional dan Kohort

Relatif risk (RR) tepat dipakai sebagai ukuran resiko relatif antara kelompok ekspose dan
nonekspose pada penelitian prospektif (kohort), trial, dan penelitian cross-sectional. Nilai RR =
1, berarti resiko sakit antara kelompok yang memilki resiko sama dengan resiko sakit dari
kelompok yang tidak memiliki resiko. Bila RR = 1 menunjukan bahwa faktor tersebut tidak
meningkatkan resiko terjadinya penyakit tersebut. Nilai RR > 1 mengindikasikan bahwa
keberadaan faktor resiko tersebut meningkatkan resiko terjadinya penyakit pada kelompok
ekspose. Nilai RR < 1 mengindikasikan bahwa keberadaan faktor yang diteliti tersebut
memberikan efek pencegahan atau dapat menurunkan resiko terjadinya penyakit tersebut
pada yang memilki faktor tersebut. Untuk mengetahui apakah RR di populasi berbeda
dengan 1, maka nilai RR yang didapatkan dari sampel dihitung nilai confident intervalnya
atau diuji kemaknaannya dengan uji chi-square.
Modul STATA Page 28

Hipotesis :
Analisis Faktor risiko
Ho: RR=1 Ha: RR>1

Penarikan kesimpulan
Dari tabel Chi Square 2 x 2 didapatkan nilai Chi Square batas adalah 3,841.
Ho : tidak ditolak bila nilai chi square hitung < 3,841
Ho : ditolak bila nilai Chi Square hitung ≥ 3,841

Contoh Kasus : Faktor risiko asi ekslusif diteliti menggunakan rancangan cross-sectional dan
datanya disimpan dalam file Stata dengan nama “Faktor Risiko Asi eslusive.dta” dengan
struktur sbb:
asi Asi ekslusif 1=tidak, 0=ya
umur Klp umur 1= berisiko, 0=tidak
paritas paritas 1= berisiko, 0=tidak
pendidikan Pendidikan 1= berisiko, 0=tidak
pekerjaan pekerjaan 1= berisiko, 0=tidak
t4tinggal Tempat tinggal 1= berisiko, 0=tidak
persepsi Persepsi asi ekslusif 1= berisiko, 0=tidak
pengetahuan Pengetahuan asi ekslusif 1= berisiko, 0=tidak
d_keluarga Dukungan keluarga 1= berisiko, 0=tidak
d_nakes Dukungan nakes 1= berisiko, 0=tidak
Analisis apakah paritas, pendidikan, tempat tinggal, pengetahuan, persepsi, dukungan
keluarga, dan dukungan tenaga kesehatan merupakan faktor risiko pemberian asi ekslusif.

Prosedur STATA :
1. Buka Faktor Risiko Asi eslusive.dta
2. Ketik syntax dengan format : cs <vartergantung> <varbebas>
Contoh : hubungan tempattinggal dengan asi ekslusif è cs asi t4tinggal
Lalu tekan enter hingga muncul Output berikut:
Modul STATA Page 29

. cs asi t4tinggal
status tempat tinggal

Exposed Unexposed Total
Cases 35 29 64
Noncases 15 49 64
Total 50 78 128
Risk .7 .3717949 .5
Point estimate [95% Conf. Interval]
Risk difference .3282051 .1619613 .4944489

Risk ratio 1.882759 1.339026 2.647282
Attr. frac. ex. .4688645 .2531887 .622254
Attr. frac. pop .2564103
chi2(1) = 13.13 Pr>chi2 = 0.0003

3. Interpretasi
RR = 1.88, 95% CI 1.34 – 2.65, Chi-square (13.13) > 3.841, p < 0.05 è Ho ditolak
Sehingga dapat disimpulkan bahwa tempat tinggal berhubungan dengan pemberian
asi eksklusif, dimana tempat tinggal yang tidak kondusif 1.88 kali meningkatkan risiko
ibu untuk tidak memberikan asi eksklusif pada bayinya (95% CI 1.34 – 2.65).

4.3 Uji Perbedaan Risk pada Studi Case-Control

Odd Ratio tepat dipakai menentukan perbedaan resiko pada penelitian case-control
(retrospektif). Pada penelitian independent case-control, pemilihan kontrol tidak dipasangkan
dengan kasus. Pada rancangan matched case-control, setiap kasus dipilihkan kontrol yang
memiliki ciri yang sama dengan kasus. Nilai OR sama dengan 1 menunjukan bahwa odd terjadi
sakit antara kelompok ekspose dan nonekspose tidak berbeda. Nilai OR > 1 menunjukan
bahwa odd terjadinya sakit pada kelompok ekspose lebih tinggi dari nonekspose. Nilai OR < 1
mengindikasikan terjadinya penurunan odd sakit pada kelompok terekspose atau juga disebut
keberadaan faktor tersebut memberikan efek pencegahan. Pada penelitian independent case-
control Untuk mengetahui apakah OR di populasi berbeda dengan 1, maka nilai OR yang
didapatkan dari sampel dihitung nilai confident intervalnya atau diuji kemaknaannya dengan
uji chi-square, sedangkan pada penelitian matched case-control akan diuji dengan uji
McNemar.

Hipotesis : Analisis Faktor risiko
Ho: OR=1 Ha: OR>1

Penarikan kesimpulan
Dari tabel Chi Square 2 x 2 didapatkan nilai Chi Square batas adalah 3,841.
Ho : tidak ditolak bila nilai chi square hitung < 3,841
Ho : ditolak bila nilai Chi Square hitung ≥ 3,841

Modul STATA Page 30

Prosedur STATA :
1. Dengan menggunakan contoh kasus di atas, asumsi penelitian case-control untuk
mencari hubungan tempattinggal dengan asi ekslusif. Ketik syntax dengan format :
cc <vartergantung> <varbebas>
contoh ini = cc asi t4tinggal
maka akan muncul output sbb :
. cc asi t4tinggal
Proportion
Exposed Unexposed Total Exposed
Cases 35 29 64 0.5469
Controls 15 49 64 0.2344
Total 50 78 128 0.3906
Point estimate [95% Conf. Interval]
Odds ratio 3.942529 1.734441 9.096335 (exact)

Attr. frac. ex. .7463557 .4234453 .8900656 (exact)
Attr. frac. pop .4081633
chi2(1) = 13.13 Pr>chi2 = 0.0003

2. Interpretasi
OR = 3.94, 95% CI 1.73 – 9.09, Chi-square (13.13) > 3.841, p < 0.05 è Ho ditolak
Sehingga dapat disimpulkan bahwa tempat tinggal berhubungan dengan pemberian
asi eksklusif, dimana tempat tinggal yang tidak kondusif 3.9 kali meningkatkan peluang
ibu untuk tidak memberikan asi eksklusif pada bayinya (95% CI 1.34 – 2.65).

3. Jika contoh di atas menggunakan metode matched case control maka syntax STATA
adalah
mcc var_exposed_case var_exposed_control

Modul STATA Page 31

MODUL 4
KORELASI & REGRESI LINEAR
Correlation & Linear Regression
4.1 KORELASI
4.1.1 Pendahuluan
Korelasi dipakai untuk menganalisis hubungan dua variabel numerik atau ordinal,
misalnya hubungan antara berat badan (numerik) dengan tinggi badan (numerik) atau
antara skor kepuasan pasien (ordinal) dengan skor loyalitas pasien (ordinal). Pada
modul ini akan dibahas indikasi, persyaratan, langkah-langkah dalam prosedure
correlation dan cara interpretasi hasilnya.
Tujuan
Mahasiswa diharapkan dapat menggunakan STATA sebagai alat bantu analisis
korelasi pada berbagai penelitian kesehatan dan dapat memberikan interpretasi
berbagai output analisis korelasi.
Pokok Bahasan
Pada modul ini akan dibahas:
• Indikasi korrelation
• Asumsi
• Hipotesis
• Metode analisis
• Conclussion
• Prosedur Corelate
• Output & Interpretasi
4.1.2 Indikasi
Analisis korelasi dipakai untuk menganalisis hubungan variabel X dan Y dimana
variabel X dan y berskala pengukuran interval atau ordinal. Misalnya akan mempelajari
hubungan antara panjang tungkai kaki dengan jauh lompatan. Panjang tungkai bawah
(dalam cm) adalah variabel berskala interval dan jauh lompatan (dalam meter) juga
berskala interval.
4.1.3 Persyaratan
Uji korelasi terdiri dari tiga jenis yaitu: korelasi Pearson, Spearman Rank, dan Kendall.
1) Pearson Correlation
Variabel X dan Y merupakan variabel numerik atau interval dan berdistribus
normal.
Modul STATA Page 32

2) Spearman rank Correlation
Variabel X dan Y adalah variabel numerik akan tetapi data dari kedua atau salah
satu dari variabel tersebut tidak berdistribusi normal atau keduanya merupakan
variabel ordinal.
3) Kendall
Variabel X dan Y berskala pengukuran ordinal.
4.1.4 Scater Plot

Bila X dan Y adalah variabel yang akan dianalisis hubungannya, maka Scatter Plot
variabel X dan Y adalah grafik koordinat (X,Y) dari setiap sampel. Dari Scatter plot
tersebut akan dapat dilihat kuat dan arah hubungan dari kedua variabel tersebut. Bila
semua koordinat (X,Y) terletak pada satu garis lurus, maka hubungan kedua variabel
tersebut dinyatakan sempurna. Sebaliknya, bila koordinat (X,Y) menyebar disemua
area grafik dan tidak menunjukan bentuk tertentu, maka kedua variabel tersebut
dinyatakan tidak ada hubungan. Kalau koordinat (X,Y) menyebar dalam bentuk elip
maka kedua variabel tersebut dinyatakan memiliki hubungan yang tidak sempurna.
Arah hubungan kedua variabel X dan Y bisa positif atau searah dan bisa negatif atau
berlawanan arah. Kedua variabel dinyatakan memiliki hubungan serarah bila gambar
menunjukan jika nilai X bertambah, nilai Y juga bertambah. Sebaliknya kedua variabel
dikatakan memilki hubungan negatif bila scatter plot menunjukan bila nilai X
bertambah akan diukuti oleh penurunan dari nilai Y. Berikut adalah contoh beberapa
bentuk scatter plot.
17.50 14.00
12.00
15.00
10.00
12.50
8.00
Y
Y
6.00
10.00
4.00
7.50
2.00
5.00 0.00
0.00 2.00 4.00 6.00 8.00 10.00 12.00 14.00 0.00 2.00 4.00 6.00 8.00 10.00 12.00 14.00
X X
Korelasi sempurna positif Korelasi sempurna negatif
15.00 14.00
12.00
12.00
10.00
9.00
8.00
Y
6.00
6.00
4.00
3.00
2.00
0.00 0.00
0.00 2.00 4.00 6.00 8.00 10.00 12.00 14.00 0.00 2.00 4.00 6.00 8.00 10.00 12.00 14.00
X X
Korelasi positif Korelasi negatif
Modul STATA Page 33

15.00
10.00
Y
5.00
0.00
0.00 2.00 4.00 6.00 8.00 10.00 12.00 14.00
Tidak ada korelasi
4.1.5 Koefisien Korelasi

Apabila variabel X dan Y yang diteliti hubungannnya, maka kuat dan arah hubungan
dari kedua variabel tersebut, selain dapat dilihat secara kasar dari scatter plot, juga
dapat ditentukan dengan koefisien korelasi dari hubungan kedua variabel tersebut.
Koefisien korelasi diberi simbul ‘r’ memiliki rentang nilai absolutnya dari 0 sampai
dengan 1. Nilai r = 0, berarti kedua variabel tersebut sama sekali tidak berhubungan
atau nilai dari variabel yang satu sama sekali tidak berkaitan dengan nilai variabel
yang lainnya. Bila nilai r antara 0,1 – 0,39 dinyatakan ada hubungan yang ringan, nilai
r antara 0,4-0,69 disebut ada hubungan sedang, nilai r 0,7-0,99 dinyatakan ada
hubungan yang kuat dan bila nilai r = 1 menunjukkan adanya hubungan yang
sempurna antara kedua variabel tersebut. Hubungan sempurna artinya setiap
kenaikan satu unit dari variabel yang pertama akan diikuti pula oleh meningkatnya satu
unit dari variabel yang kedua dan scatter plotnya akan berbentuk sebuah garis lurus.
Arah hubungan dari kedua variabel tersebut ditentukan dari tanda +/- dari nilai r. Bila
nilai r bertanda negatif maka kedua variabel tersebut dinyatakan memiliki hubungan
negatif (berlawanan arah). Sebaliknya, bila nilai r bertanda positif maka kedua variabel
tersebut memiliki hubungan positif (searah). Hubungan positif artinya arah perubahan
kedua nilai variabel tersebut searah. Bila nilai dari variabel yang satunya naik akan
diikuti pula oleh naiknya nilai variabel yang satu lagi. Misalnya umur dan berat badan
mempunyai hubungan positif artinya bila umur bertambah, maka berat badan juga
bertambah. Sebaliknya, hubungan negatif berarti arah perubahan nilai kedua variabel
tersebut berlawanan. Bila nilai variabel yang satu naik, akan diikuti oleh menurunnya
nilai variabel yang lain. Misalnya hubungan antara bensin dalam tangki dengan jarak
yang ditempuh. Makin jauh jarak yang ditempuh, makin berkurang jumlah bensin di
dalam tangki.
4.1.6 Cara Menghitung Koefisien Korelasi (r)

Bila variabel yang akan dipelajari hubungannya adalah variabel X dan Y, maka
koefisien korelasi hubungan dari kedua variabel tersebut dapat dihitung sebagai
berikut:
Rumus:
r=
∑ XY − (∑ X ∑ Y )/ n
{∑ X 2
− (∑ X ) / n}{∑ Y − (∑ Y )
2 2 2
/n }
Modul STATA Page 34

Keterangan:
r = koefisien korelasi
ƩXY = jumlah hasil kali nilai var X dengan var Y
ƩX = jumlah nilai var X
ƩY = jumlah nilai var Y
ƩX2 = jumlah nilai var X kwadrat
ƩY2 = jumlah nilai var Y kwadrat
n = jumlah sampel
4.1.7 Uji Hipotesa Koefisien Korelasi

Sangatlah tidak mungkin menentukan korelasi variabel X dan Y di populasi, maka
pada banyak penelitian, penentuan korelasi X dan Y dilakukan pada sampel. Untuk
menentukan apakah korelasi yang ditentukan dari sampel benar menggambarkan
korelasi X dan Y di poluasi, maka perlu dilakukan uji hipotesis degan langkah berikut.
1) Menetapakan hipotesis untuk korelasi
Hipotesis statistik sbb:
Ho: ρ = 0 (tidak ada hubungan)
Ha: ρ # 0 (ada hubungan
2) Metode analisis
Koefisien korelasi mempunyai distribusi menyerupai distribusi t, oleh karena itu,
uji Hipotesa koefisien korelasi dilakukan dengan statistik uji “t” dengan derajat
bebas df = n-2 dengan rumus sbb.
r r
t= = ( n − 2)
2
(1 − r ) (1 − r 2 )
(n − 2)
Keterangan:
t = nilai statistik t
r = koefisien korelasi sampel
n = jumlah sampel
4.1.8 Cara pengambilan kesimpulan

Ho diterima bila nilai p > 0,05 dan Ho ditolak bila nilai p ≤ 0,05.
Nilai p dapat dilihat pada tabel distribusi t dan pada semua program paket statistik
akan mencantumkan nilai p dari hasil uji pada tabel luaran (output) hasil analisnya.
Modul STATA Page 35

Contoh Kasus
Sebagai bahan latihan, berikut adalah data sebuah penelitian cross-sectional
karakteristik faktor risiko penderita CHD di Rumah Sakit X.
Tabel 1. Karakteristik faktor risiko CHD di Rumah Sakit X
No. Age Chol BMI No. Age Chol BMI
1 56 292 31.85 16 56 329 20.30
2 48 339 31.06 17 44 349 25.96
3 60 303 30.17 18 29 419 25.40
4 59 269 27.94 19 45 278 26.08
5 58 312 21.43 20 44 354 28.62
6 64 185 32.44 21 34 317 22.67
7 59 303 24.96 22 40 334 24.66
8 47 304 33.05 23 34 345 31.47
9 47 334 23.02 24 39 330 39.54
10 28 328 27.12 25 45 347 25.10
11 54 363 28.46 26 41 339 22.05
12 38 399 26.63 27 57 353 28.59
13 35 321 25.90 28 57 220 25.84
14 64 244 30.83 29 38 385 26.83
15 34 314 24.55 30 45 240 32.73
4.1.9 Prosedur Korelasi

1) Merekam Data
Rekam data di atas dengan cara seperti yang sudah dilakukan pada modul
sebelumnya.
2) Membuat Scatter Plot

Scatter Plot adalah grafik pencar yang menggambarkan hubungan variabel X dan
Y.
Misalnya akan membuat Scatter plot antara variabel Umur dengan Kolesterol,
caranya adalah sbb:
Format command pada STATA : scatter variable_Y variable_X
Contoh dalam kasus ini : scatter chol age
Modul STATA Page 36

400
350
chol
300
250
200
30 40 50 60 70
age
Tampak hubungan negatif antara umur dengan kolesterol darah pada penderita
CHD
3) Analisis korelasi
Uji Pearson bila data normal atau Kendall bila data ordinal atau Spearman bila
data tidak normal seperti bagan berikut. Dalam kasus ini data berdistribusi
normal maka akan digunakan analisis Pearson Correlation. Misalnya ingin
melakukan analisis korelasi antara umur dengan kadar kolesterol.
Ketik syntax pada jendela command dengan format : pwcorr varY varX, sig obs
Pada contoh syntaxnya adalah : pwcorr age chol, sig obs
Lalu enter maka akan muncul output sebagai berikut :
Matriks korelasi variabel umur dan kolesterol
Bila ingin melakukan analisis korelasi antara umur dengan kadar kolesterol dan
BMI maka syntaxnya adalah : pwcorr age chol BMI , sig obs. Hasilnya adalah
sebagai berikut:
Matriks korelasi variabel umur, kolesterol dan BMI
Modul STATA Page 37

4.1.10 Interpretasi
Ø Interpretasi
Arah hubungan dilihat dari tanda koefisien korelasi. Bila sign negatif, berarti
hubungannnya negatif atau berlawanan arah. Sebaliknya, bila sign positif
berarti ada hubungan positif atau searah.
Kuat hubungan dilihat dari nilai absolut koefisien korelasi. Korelasi sempurna
bila r = 1, kuat bila 0,7<r< 1, sedang bila0,4 <r <0,7, ringan bila 0<r<0,4, dan
tidak ada hubungan bila r=0.
Signifikansi hubungan
Hubungan dinyatakan bermakna bila nilai p ≤ α dan sebaliknya dinyatakan
tidak bermakna bila p > α
Dari hasil analisis di atas dapat disimpulkan bahwa umur berkorelasi negatif
sedang (r = - 0.5510) dengan kolesterol (p = 0,0016), tetapi umur tidak
berkorealsi dengan BMI (p=0.5427). Kolesterol berhubungan negatif sedang
dengan umur (p = 0,0016), tetapi tidak berkorelasi dengan BMI (p=0,1152).
Modul STATA Page 38

5.2 Regresi Linier
5.2.1 Pendahuluan
Metode korelasi dipakai untuk mempelajari hubungan antara variabel numerik X
dengan numerik Y. Korelasi tidak menjelaskan hubungan sebab-akibat atau causal
relationship antara variabel terhadap Y. Berbeda dengan metode regresi, dimana
tujuan utamanya adalah mempelajari hubungan sebab-akibat antara variabel bebas X
terhadap variabel tergantung Y. Dalam regresi, variabel bebas juga disebut sebagai
variabel prediktor karena nilai variabel y dapat dipredikasi dari nilai variabel X
berdasarkan persamaan regresi antara variabel Y dengan X.
Dalam bidang kesehatan, metode regresi umumnya dipakai untuk memprediksi

variabel Y dari variabel X dan kegunaan lainnya adalah untuk mempelajari besar
pengaruh variabel prediktor X terhadap variabel outcome Y.
Tujuan
Mahasiswa diharapkan dapat menggunakan STATA sebagai alat bantu analisis regresi
pada berbagai penelitian kesehatan dan dapat memberikan interpretasi berbagai
output analisis korelasi.
Pokok Bahasan
Sehubungan dengan kegunaan tersebut, pada modul ini akan dibahas tentang:
• Indikasi
• Asumsi
• Metode seleksi variabel prediktor
• Parameter Regresi
• Prosedur STATA
• Interpretasi hasil
Indikasi
Prosedur Regresi Linear dipakai untuk menganalisis hubungan dan pengaruh satu
atau beberapa variabel prediktor atau Risk faktor terhadap satu variabel tergantung
yang berskala interval atau numerik. Regresi linier sederhana adalah untuk
menganalisis hubungan dan pengaruh satu variabel prediktor terhadap satu variabel
tergantung, sedangkan regresi linier berganda untuk menganalisis hubungan dari
beberapa variabel prediktor terhadap satu variabel tergantung. Sebagai contoh
misalnya akan dipelajari pengaruh merokok (ya/tidak), umur (th), kolesterol darah,
indek masa tubuh (IMT), tekanan darah sistole terhadap kadar gula penderita DM type
II.
5.2.2 Model
Dalam analisa regresi, pengaruh variabel bebas Xi terhadap variabel tergantung Y
diasumsikan linier, sehingga hubungan dari kedua variabel tersebut dapat dinyatakan
dalam suatu persamaan garis lurus yang disebut sebagai Model Regresi Linier
sederhana sebagai berikut:
Y = a + b iX i + ε
Modul STATA Page 39

Keterangan:
Y = variabel tergantung (dependent variable)
Xi = variabel bebas (independent variable) ke i
bi = koefisien regresi variabel bebas ke i
a = konstan atau intercept
ε = residu (eror)
Sedangkan untuk regresi linier berganda modelnya adalah sebagai berikut :
Y = a + biXi + biiXii + biiiXiii + dst.....+ ε
5.2.3 Persyaratan
Validitas hasil analisis regresi diragukan atau bias bila asumsi analisis regresi seperti
berikut tidak terpenuhi.
1. Homoskedastik
Data dari variabel outcome Y, untuk setiap nilai variabel prediktor X, harus
berdistribusi normal dan memiliki varian yang sama (homogen) serta memiliki
nilai rerata yang terletak dalam satu garis lurus atau disebut Homoskedastik
(untuk regresi linier sederhana dan berganda).
2. Tidak terdapat multikolinearitas
Tidak terdapat korelasi yag kuat antara variabel prediktor atau tidak tedapat
multikolinearitas (untuk regresi linier berganda).
3. Tidak terdapat otokorelasi
Tidak terdapat korelasi berseri antara variabel prediktor (untuk regresi linier
berganda).
4. Linearitas
Terdapat hubungan linear dari semua variabel prediktor Xi dengan variabel
outcome Y (untuk regresi linier sederhana dan berganda).
5.2.4 Koefisien regresi

Koefisien regresi menyatakan besarnya perubahan yang terjadi pada nilai variabel
tergantung Y sebagai pengaruh dari setiap perubahan satu unit nilai variabel bebas X
dan koefisien regresi diberi simbol “b”. Misalnya dari hasil analisis pengaruh variabel
bebas X terhadap variabel tergantung Y mempunyai nilai b = 3, maka ini berarti kalau
nilai nilai X berubah satu unit maka nilai Y akan berubah 3 unit. Besarnya koefisien
regresi dapat dihitung dengan rumus sebagai berikut:
b=
∑ XY − (∑ X )(∑ Y ) / n
2 2
∑ X − (∑ X ) / n
Keterangan:
b = koefisien regresi
∑XY = jumlah hasil kali nilai var bebas (X) dengan nilai var tak bebas (Y)
Modul STATA Page 40

∑X = jumlah nilai variabel bebas (X)
∑Y = jumlah nilai var tak bebas (Y)
2
∑X = jumlah kwadrat nilai var bebas (X)
n = jumlah sampel
5.2.5 Koefisien determinasi R2 (explanatory Power)

Besar pengaruh variabel bebas X terhadap variabel tergantung Y dinyatakan dengan
besarnya nilai koefisien determinan R2. Nilai R2 menyatakan proporsi variasi variabel
tergantung Y yang dapat dijelaskan oleh nilai variabel bebas X. Nilai R2 dapat
bervariasi antara 0 sampai 1. Bilai nilai R2 = 1, berarti semua variasi nilai variabel
tergantung Y dapat dijelaskan oleh variabel bebas X berarti tidak ada faktor lain yang
ikut mempengaruhi nilai variabel tergantung Y tersebut. Sebaliknya, bila nilai R2 = 0
menunjukkan bahwa variabel bebas X sama sekali tidak berpengaruh terhadap
variabel tergantung Y. Apabila persamaan regresi linear antara variabel bebas X dan
variabel tergantung Y adalah: Y’ = a + bX, maka besar nilai R2 dapat dihitung sebagai
berikut.
5.2.6 Metode seleksi variabel prediktor

Pada regresi linier berganda, dibutuhkan suatu metode seleksi variable prediktor untuk
mendapatkan model yang paling berpengaruh. Metode seleksi variabel prediktor terdiri
dari metode Enter, Backward, Forward, dan Stepwise. Berikut adalah penjelasan
singkat dari masing-masing metode.
Method Enter
Pada metode ini, semua variabel dipilih sekaligus sehingga hanya ada satu model.
Pada pilihan ini, hanya R2 gabungan yang dihitung sedangkan R2 dari masing-masing
prediktor tidak dihitung.
Method Backward
Pada metode ini seleksi dilakukan secara bertahap. Tahap pertama, semua variabel
dimasukan ke dalam model, kemudian variabel prediktor yang tidak berhubungan
dengan variabel outcome, satu-persatu dikeluarkan dari model. Pada model ini juga
tidak dihitung R2 dari masing-masing variabel yang berpengaruh.
Method Forward
Berlawanan dengan metode Backward, pada metode ini, variabel prediktor yang
berpengaruh akan dimasukan ke dalam model secara bertahap mulai dari yang
pengaruhnya paling besar sampai yang paling kecil. Pada model ini akan dihitung R2
dari masing-masing prediktor yang ada di dalam model.
Method Stepwise
Metode ini merupakan gabungan dari Forward dengan Backward. Pada metode ini,
semua prediktor yang ada di dalam model dapat dihitung R2nya.
Modul STATA Page 41

5.2.7 Prosedur STATA
Sebagai bahan latihan akan dipakai data hasil penelitian mengenai hubungan antara
kadar hb, intake kalori dan berat badan. Data disimpan dalam file: latihan korelasi dan
regresi.
Prosedure Regresi adalah sbb:

1) Buka file : latihan korelasi dan regresi.dta dengan cara:
Ø Open File
Klik menu “File”, “open”, “Data” atau klik icon OPEN
2) Analisis Regresi Linear Berganda (lebih dari 1 variabel bebas)
Ø Memilih prosedur regresi
Setelah data dibuka, maka langkah selanjutnya adalah menjalankan prosedur
regresi. Variabel Y adalah kadar hb dan variabel X adalah intake kalori dan
berat badan. Cara memilih prosedur regresi adalah sbb:
Dengan metode enter, ketik syntax dengan format: regress var_Y var_X1
var_X2
Pada contoh ini : regress hb intake_kal bb
Lalu enter maka muncul output sbb:
Catatan : bila ingin melakukan regresi linier sederhana, prosedur yang

dilakukan sama, hanya variabel bebas/prediktor berjumlah 1 è contoh :
hubungan antara kadar hb dengan intake kalori maka command STATA :
regress hb intake_kal
Ø Analisis Multikolinearitas
Sesudah melakukan command regress, lanjutkan dengan syntax : estat VIF
Modul STATA Page 42

Ø Analisis Homoskedastisitas
Sesudah melakukan command regress, lanjutkan dengan syntax : estat hettest
Atau dengan grafik. Sesudah melakukan command regress, lanjutkan dengan

syntax: rvfplot. Tekan enter dan berikut hasilnya
1
.5
Residuals
0
-.5
-1
9 10 11 12 13 14
Fitted values
5.2.8 Interpretasi
1) Goodness of Fit
Apakah data fit dengan model regresi linear dapat dilihat dari hasil Anova (F).
Data dikatakan fit dengan model regresi linear bila nilai P dari hasil ANOVA < α
dan sebaliknya dinyatakan tidak fit bila nilai p dari analisis ANOVA > α. Pada
hasil analisis anova dari kasus di atas menunjukan nilai p < α (p = 0.00120),
berarti data dari kasus di atas fit dengan model regresi linear.
2) Multikolinearitas
Adanya multikolinearitas antar variabel prediktor ditentukan dari nilai VIF
(Variance Inflating Factors). Dinyatakan terdapat multikoliearitas bila nilai VIF >
10. Pada output STATA di atas didapatkan nilai VIF < 10, maka dapat
disimpulkan bahwa tidak terdapat multikliearitas antara variabel prediktor.
3) Homoskedastisitas
Dapat dilakukan dengan menggunakan analisis estat hettest. Nilai p>0.05
artinya variance konstan/homogen (tidak ada heteroskedastisitas). Asumsi
homokedastisitas terpenuhi. Homoskedastisitas vari variabel Y juga dapat
dilihat dari plot antara ZPRED (nilai standar dari nilai prediksi) dengan SRESID
(nilai studentize dari nilai residu). Bila plot dari ZPRED dengan SRESID tidak
Modul STATA Page 43

memilki bentuk tertentu atau plotnya menyebar di semua area grafik, maka nilai
Y dikatakan memenuhi persyaratan homoskedastik. Sebaliknya, bila plotnya
memilki bentuk tertentu, dinyatakan asumsi homoskedastik tidak terpenuhi.
Hasil analisis di atas menunjukan plot antara ZPRED dengan SRESID tidak
memilki bentuk spesifik, maka asumsi homoskedastik terpenuhi.
4) Oto Korelasi
Otokorelasi dilihat dari statistik Durbin-Watson. Terjadi otokorelasi bila nilai
statistik Durbin-Watson < 2 atau > 4. Pada hasil analisis di atas didapatkan nilai
statistik Durbin-Watson > 2 dan < 4, berarti tidak terdapat otokorelasi.
5) Linearitas
Linearitas hubungan antara variabel prediktor terhadap variabel outcome Y
dapat dilihat dari hasil analisis Anova. Dinyatakan terdapat hubunga linear bila
nilai p dari analisis Anova < α. Linearitas juga dapat diuji dengan uji linearitas
pada prosedur “Compare mean”. Pada hasil Anova di atas didapatkan nilai p <
0,05, berarti terdapat hubungan yag linear antara prediktor dengan variabel
outcome.
6) Pengaruh variabel prediktor

Apakah variabel prediktor Xi berpengaruh terhadap variabel outcome Y, dilihat
dari hasil analisis Anova. Variabel prediktor dinyatakan ada yang berpengaruh
secara linear bila nilai p dari Anova < 0,05. Pada hasil analisis di atas
didapatkan nilai p dari hasil Anova < 0,05, berarti ada variabel prediktor Xi yang
berpengaruh terhadap Y. Kalau menggunakan metode ENTER dalam seleksi
variabel prediktor, dari hasil analisi Anova belum dapat diketahui variabel
prediktor mana saja yang berpengaruh. Untuk mengetahuinya dapat dilihat dari
koefisien regresinya. Sebaliknya, kalau metode seleksi menggunakan metode
Stepwise, forward atau backward, akan diketahui variabel prediktor mana yang
berpengaruh.
Besar pengaruh dari variabel yang terdapat di dalam model regresi dapat
dilihat dari nilai R2 yang terdapat pada model summary. Bila menggunakan
metode seleksi ENTER, nilai R2 yang diberikan merupakan nilai R2 gabungan
dari semua variabel prediktor. Bila menggunakan metode Stepwise atai
Forward, R2 dari masing-masing variabel prediktor yang berpengaruh dapat
dilihat dari nilai R2 change.
Coef _cons=a ; menunjukkan kadar hb bila BB=0 dan Intake kalori=0

Coef intake_kal=b1 ; menunjukkan penurunan HB bila intake kalori bertambah
1 (setelah dikontrol pengaruh umur) è namun hubungan ini tidak bermakna p
(0.075) > 0.05
Coef BB=b2; menunjukkan peningkatan kadar HB bila BB bertambah 1 kg
(setelah dikontrol pengaruh intake_kalori)
Dari hasil di atas diketahui bahwa hanya 1 prediktor yang berpengaruh terhadap kadar
HB yaitu berat badan. BB memberikan pengaruh sebesar 81% (adjusted R-square)
setelah dikontrol oleh pengaruh intake kalori.
Modul STATA Page 44

MODUL 6
ANALISIS STRATIFIKASI DAN REGRESI LOGISTIK
6.1 ANALISIS STRATIFIKASI
6.1.1 Pendahuluan
Pada penelitian kesehatan sering dipelajari hubungan antara dua variabel
kategori atau lebih, seperti misalnya terjadinya suatu penyakit dikaitkan dengan
keberadaan faktor risio tertentu. Sebagai contoh, misalnya akan diteliti apakah
kebiasaan merokok meningkatkan resiko terjadinya penyakit jantung koroner. Akan
tetapi, risiko penyakit jantung tidak semata-mata berkaitan dengan kebiasaan
merokok, ada faktor lain yang berkaitan dengan kebiasaan merokok dan penyakit
jantung tersebut misalnya jenis kelamin, yang dinamakan variabel perancu.
Hubungan antar variabel dapat dilihat pada bagan berikut :
Analisis stratifikasi digunakan untuk mengendalikan efek dari variabel perancu,

dengan cara mengelompokan sampel berdasarkan strata sesuai kategori variabel
perancu. Selain itu analisis stratifikasi digunakan untuk menilai apakah variabel ke tiga,
memberi pengaruh perancu, interaksi, atau independen terhadap hubungan eksposur
dengan outcome.
Tujuan
Mahasiswa diharapkan dapat menggunakan STATA sebagai alat bantu analisis
stratifikasi pada berbagai penelitian kesehatan dan dapat memberikan interpretasi
berbagai output analisis stratifikasi.
Modul STATA Page 45

6.1.2 Konsep Analisis Startifikasi
ai × d i
ORMH =
∑ (w × OR ) = ∑ n
i i i
∑w b ×c i i
∑ n
i
6.1.3 Uji Hipotesis

Uji yang digunakan dalam analisis stratifikasi adalah Mantel – Haenszel test.
Hipotesis : Ho: ORMH=1
Ha: ORMH≠1
Langkah Uji Stratifikasi:

– Perhitungan statistik
• Menentukan stratum spesifik OR
• Menentukan weight
• Menghitung OR MH, 95% CI OR MH
– Pengambilan keputusan
• Menentukan CV è Ho ditolak bila X2MH > CV
χ2 =
(∑ O − E ) ai ai
MH
∑V i
• nilai p è Ho ditolak bila p < α dan
6.1.4 Prosedur STATA

1. Gunakan data dari Oesophageal cancer (breaslow&Day data). Data penelitian
case-control, pada 975 sampel yang terdiri dari 200 kasus dan 775 kontrol.
2. Penelitian case-control kelompok kontrol harus dengan kode “0” dan kasus
dengan kode “1”,
3. Lakukan recode pada kasus diatas
4. Lakukan coding untuk variabel bebas :
Modul STATA Page 46

a. Kategori paparan rendah atau tidak terpapar dari suatu variabel bebas
harus diberikan kode 0. Kategori ini akan dilabel sebagai kategori “tidak
terpapar/paparan rendah”
b. Kategori paparan yang lebih tinggi atau terpapar dari suatu variabel
bebas harus diberikan kode 1. Kategori ini akan dilabel sebagai kategori
“terpapar/paparan tinggi”.
5. Data alcohol direcode dari 1,2,3,4 (rendah ke tinggi). Untuk tujuan latihan, kita
akan collapse menjadi binary variabel 0 (kategori awal 1, rendah) dan 1
(kategori awal 2,3,4 è tinggi).
Alcohol è binary alcohol

• recode alcohol 1 = 0 nonmiss = 1, gen(binalc)
• label variable binalc “alc above vs below 40 g/day”
• label define highlow 0 “low” 1 “high”
• label value binalc highlow
Tobacco è binary tobacco

• recode tobacco 1 = 0 nonmiss = 1, gen(bintob)
• label variable bintob “tobacco above vs below 10 g/day”
• label value bintob highlow
6. Lakukan analisis hubungan antara minum alcohol dengan kejadian kanker,

dimana merokok diduga sebagai variabel perancu. Analisis menggunakan Uji
Mantel-Haenszel
7. Syntax : cc <var_tergantung> <var_bebas>, by <var_perancu>

cc casecon binalc, by (bintob). Maka akan muncul hasil sebagai berikut:
8. Interpretasi :
a. Crude OR itu adalah OR untuk oesophageal cancer dengan konsumsi
alcohol. Interpretasinya adalah minum minuman keras 5.85 kali
berpeluang untuk menderita kanker oesophageal.
Modul STATA Page 47

b. M-H combined itu adalah OR untuk esophageal cancer dengan
konsumsi alcohol, yang sudah dikontrol dengan aktivitas merokok.
Interpretasinya minum minuman keras 5.3 kali meningkatkan odd
menderita kanker oesophageal setelah dikontrol oleh aktivitas
merokok.
c. Bagaimanakah meyakinkan bahwa variabel tersebut (rokok) adalah

variabel perancu? Lihat perbedaan antara Crude OR (COR) dan
Adjusted OR (AOR atau M-H OR). Bila perubahan > 10% maka disebut
perancu/counfounding lalu ini harus di adjust
∆ CRR-ARR = │((CRR – ARR)/CRR) x 100%│
Pada contoh diatas perbedaan = 9.4 maka variabel merokok bukan

perancu, maka perlu analisis lanjutan. Tidak bisa menarik kesimpulan
hanya dari uji M-H.
d. Apakah ada efek interaksi?

Dapat dilihat dari nilai hasil test of homogenity, bila < 0.05 maka ada
perbedaan yang bermakna nilai OR antar strata yang artinya ada efek
interaksi. Dari hasil di atas maka dapat dilihat bahwa test of homogenity
p = 0.024 yang artinya ada efek interaksi
e. Jadi untuk kasus diatas ada effect modifikasi (interaksi) dan ada
fenomena yang menarik dari kasus ini, oleh karena tidak bisa
sesederhana itu kita mengontrol/adjust untuk variabel merokok.
Modul STATA Page 48

5.2 REGRESI LOGISTIK
6.2.1 Pendahuluan
Berdasarkan skala pengukuran, variabel dibedakan menjadi variabel nominal,
ordinal, interval dan ratio. Variabel nominal adalah variabel yang hasil pengukurannya
atau unit nilai pengukurannya tidak memiliki rentang ukuran yang tetap dan hasil
pengukurannya tidak dapat diurut. Misalnya jenis kelamin, pekerjaan, dan lainnya.
Variabel nominal dibedakan menjadi variabel nominal binary dengan hanya dua
kategori dan multinomial dengan lebih dari dua kategori. Variabel skala ordinal juga
tidak memilki interval yang tetap, akan tetapi hasil pengkurannya dapat diurut.
Misalnya status gizi baliti dengan kategori hasil pengkurannya terdiri dari gizi lebih, gizi
baik, gizi kurang, dan gizi bukur. Variabel interval memiliki unit ukuran yanh memilki
ienterval tetap dan juga dapat diurut, akan tetapi tidak mempunyai nilai nol absolut.
Misalnya suhu udara dalam derajat Celcius dimana nilainya bisa –10o C. Variabel ratio
sama dengan variabel interval, tetapi dia memiliki nilai nol absolut artinga hasil
pengukuran dari variabel tersebut tidak ada kemungkinan nilainya < nol. Misalnya
tinggi badan, berat badan, gula darah, dsbnya.
Dalam penelitian kesehatan atau kedokteran, outcome variabel yang sering
diteliti merupakan variabel dengan dua kategori atau disebut binary outcome. Misalnya
pada penelitian faktor risiko penyakit jantung koroner (PJK), yang menjadi variabel
outcome (tergantung) adalah PJK dengan dua kategori, yaitu menderita PJK dan
bukan PJK. Pada contoh penelitian lain, diteliti pemberian ASI ekslusif terhadap risiko
diare, dimana variabel outcome-nya adalah diare dengan dua kategori yaitu: diare dan
tidak diare.
Pada umumnya masalah di bidang kesehatan/kedokteran sifatnya komplek dan
jarang terjadinya satu kejadian yang disebabkan oleh satu faktor tunggal. Sebagai
contoh, misalnya penyakit jantung koroner (PJK) disebabkan oleh banyak faktor
seperti faktor fisik, perilaku, lingkungan, dan akses terhadap pelayaan. Untuk
mempelajari hubungan satu masalah dengan berbagai faktor yang terkait tidak bisa
lagi dianalisis secara bivariate saja. Metode analisis mulivariate atau multivariabel
merupakan metode analisis yang memungkinkan kita mempelajari hubungan beberapa
variabel bebas dengan satu variabel tergantung. Misalnya pada penelitian faktor risiko
PJK, faktor determinan kematian bayi, dan lainnya. Metode analisis multivariate
dibedakan menurut jenis variabel outcomenya seperti pada matrik di bawah ini.
Tabel 1. Matrik jenis analisis Multivariate menurut jenis variabel tergatung
Variabel Contoh Jenis Analisis Jenis Analisis

Outcome Bivariate Multivariate
Interval Kadar gula darah, Uji t, Anova, ANOVA, ANCOVA,

kolesterol darah, Korelasi, regresi Multiple Regression
serum feritin, dll linear
Ordinal Stadium penyakit, Chi-square for trend, Proportional Odd

severitas penyakit, Mann-Whitney, Regression
status gizi Spearman Rank
Binary Kesembuhan, Chi-square, Fisher Binary Logistic

Exact, Mann- Regression, Poisson
Modul STATA Page 49

kematian, kesakitan Whitney Regression
Nominal Penyebab Chi-square Multinomial Logistic

kematian, lokasi Regression
kanker
Time to Waktu sampai mati, Log-rank Cox-Regression

outcome waktu sampai
kambuh kembali
Count Jml bakteri perlap. Poisson regression Poisson Regression

pandang, jml kasus
bunuh diri per bulan
Incedence Insiden penyakit Z-test Poisson Regression

Rate baru, insiden
Cox Regression
kecelakaan
Tujuan
Mahasiswa diharapkan dapat menggunakan STATA sebagai alat bantu analisis binary
outcome salah satunya dengan menggunakan analisis regresi logistik pada berbagai
penelitian kesehatan dan dapat memberikan interpretasi berbagai output analisis
regresi logistik.
Pokok Bahasan
Sehubungan dengan kegunaan tersebut, pada modul ini akan dibahas tentang:
• Indikasi
• Model
• Metode seleksi variabel prediktor
• Perhitungan Odd Ratio (OR)
• Uji Hipotesis Odd Ratio
• Prosedur STATA
• Interpretasi hasil
6.2.2 Indikasi
Regresi logistik adalah salah satu metode analisis multivariate untuk
menganalisis hubungan satu variabel binary outcome dengan satu atau lebih variabel
bebas dengan skala pengukuran nominal, ordinal atau interval dimana parameter yang
dipakai menilai hubungan tersebut adalah Odd Ratio (OR). Metode ini banyak dipakai
menganalisis faktor risiko suatu penyakit, misalnya faktor risiko penyakit jantung
koroner, faktor risiko penyakit diabetes militus type 2, dll. Metode ini banyak dipakai
pada penelitian faktor risiko dengan rancangan case-control dimana pada rancangan
ini angka insiden tidak memungkinkan untuk didapatkan. Metode ini juga dipakai untuk
menganalisis faktor risiko pada penelitian dengan rancangan cross-sectional dimana
pada rancangan ini juga tidak dimungkinkan untuk mendapatkan angka insiden.
Modul STATA Page 50

6.2.3 Model
Pada regresi logistik, binary outcome variabel ditranformasi dengan
menggunakan logit, sehingga hubungan antara variabel outcome (Y) dengan variabel
tergantung (Xi) dapat dinyatakan dalam model persamaan regresi sbb:
Logit (Py=1) = a + biXi
Diketahui bahwa:
Logit (Py=1) = log(P/(1-P)) dan
P/(1-P) = Odd
Maka persamaan model regresi logistik di atas dapat ditulis menjadi:
Log Odd = a + biXi atau dapat juga ditulis sbb Odd = exp (a + biXi)
6.2.4 Seleksi Variabel Prediktor

Metode seleksi variabel prediktor pada regresi logistik terdiri dati metode Enter,
Forward, dan Backward.
1. Metode Enter
Bila metode seleksi yang dipakai adalah metode Enter, maka akan terdapat satu
model saja yang berisikan semua variabel prediktor. Bila variabel prediktornya
adalah X1, X2, dan X3, maka model regresi logistik dari variabel tersebut adalah:
Odd(x1) = exp (a + b1X1 + b2X2 + b3X3)
Pada metode enter hanya dterdapat satu nilai koefsiien determinanasi (R2) yang
menyatakan besar pengaruh semua variabel prediktor yang ada di dalam model
terhadap variabel outcome. Misalnya dari analisis didapatkan nilai R2 = 0,30,
berarti semua variabel prediktor mempunyai pengaruh sebesar 30% terhadap nilai
variabel outcome. Apabila terdapat lebih dari satu variabel prediktor, maka kita
tidak bisa menentukan berapa pengaruh dari masing-masing variebel prediktor
terhadap variabel outcomenya.
2. Metode Forward
Pada metode Forward, variabel prediktor akan dipilih satu persatu secara
berjenjang (stepwise) mulai dari variabel prediktor yang nilai p dari hubungannya
terhadap outcome variabel paling kuat dan selanjutnya disusul oleh variabel yang
nilai pnya di bawah variabel yang terpilih sebelumnya, sampai semua variabel
yang memenuhi ktiteria terpilih masuk ke model. Kriteria terpilih disebut nilai p
enter yang umumnya besarnya 0,1 yang artinya variabel yang bisa dipilih adalah
variabel prediktor yang mempunyai hubungan dengan variabel outcome dengan
nilai p ≤ 0,1 saja yang akan dianalisis, sedangkan variabel prediktor yang lain
Modul STATA Page 51

tidak. Banyak peneliti menggunakan nilai P(enter) sebesar 0,2. Bila menggunakan
nilai p enter 0,2, maka hanya variabel prediktor yang mempunyai hubungan
dengan variabel outcome dengan nilai p ≤ 0,2 saja yang akan dianalisis,
sedangkan variabel prediktor yang lain tidak.
Misalnya dari analisis bivarite hubungan ketiga variabe tersebut dengan variabel
outcome memiliki nilai p untuk X1 adalah 0,01, X2 adalah 0,001 dan X3 adalah
0,25 dan nilai p(enter) = 0,2, maka proses seleksinya adalah sbb:
Step 1: Odd = exp (a + b2X2)
Step 2: Odd = exp (a + b2X2 + b1X1)
Model terakhir menjadi: Odd = exp (a + b2X2 + b1X1), dimana X3 tidak dipilih
karena nilai p > 0,2.
Pada metode seleksi Forward, nilai R2 dari setiap step dihitung, sehingga dari nilai
R2 tersebut dapat dihitung R2 dari masing-masing variabel.
3. Metode Backward
Metode Backward adalah kebalikan dari metode forward, dimana pada tahap
pertama, semua variabel prediktor dimasukkan ke model, kemudian akan dipilih
satu persatu secara bertingkat untuk dikeluarkan dari model bila variabel tersebut
mempunyai hubungan dengan nilai p yang lebih besar dari kriteria dikeluarkan.
Variabel prediktor yang pertama dipilih untuk dikeluarkan dari model adalah
variabel prediktor yang memiliki nilai p pada analisis bivariate paling besar dan
disusul oleh variabel dengan nilai p yang lebih kecil sampai semua variabel yang
mempunyai nilai p lebih besar dari kriteria removed dikeluarkan dari model.
Kriteria dikeluarkan biasanya ditentukan besarnya 0,1 atau 0,2.
Misalnya dari analisis bivariate dengan variabel outcome, ketiga variabe tersebut
memiliki nilai p untuk X1 adalah 0,01, X2 adalah 0,001 dan X3 adalah 0,25 dan
nilai p(enter) = 0,2, maka proses seleksinya adalah sbb:
Step 1: Odd = exp(a + b1X1 + b2X2 + b3X3)
Step 2: Odd = exp(a + b1X1 + b2X2)
Model terakhir menjadi: Odd = exp (a + b1X1 + b2X2), dimana X3 keluar dari
model karena nilai p > 0,2.
Metode seleksi backward tidak dapat memberikan nilai R2 dari masing-masing
variabel yang ada di dalam model.
6.2.5 Odd Ratio (OR)

Penghitungan OR dari salah satu variabel prediktor dilakukan dengan
menggunakan model regresi logistik seperti yang dijelaskan di atas, yaitu:
Odd = exp a + biXi
Misalnya ada tiga variabel prediktor, yaitu X1, X2, dan X3 dan yang akan dihitung
ORnya adalah variabel X1 dimana kelompok terpapar nilai X1=1 dan kontrol X1 = 0.
Dalam perhitungan OR dari variabel X1, variabel bebas lainnya seperti X2 dan X3
diberikan nilai 0 (tidak ada efek), maka OR dihitung sbb:
Modul STATA Page 52

Odd(X=1) Exp(a + bX1 + b2X2 + b3X3) Exp(a + b1)
OR = ------------- = ----------------------------------------- = ----------------- = Exp b1
Odd(X=0) Exp(a + bX1 + b2X2 + b3X3) Exp(a)
Jadi penentuan besarnya nilai OR dari variabel prediktor Xi adalah sama dengan
Exponentian dari bi. Nilai OR tersebut disebut adjusted OR.
Nilai OR dari satu variabel prediktor yang dihitung dengan model regresi
logistik adalah nilai OR dimana efek variabel lainnya dikendalikan. Oleh karena itu,
nilai OR tersebut merupakan Adjusted OR. Berbeda dengan nilai OR yang dihitung
dengan metode bivariate, dimana efek dari variabel lainnya tidak dikendalaikan. Oleh
karena itu, nilai OR yang dihitung secara bivariate disebut unadjusted OR.
Cara penghitungan Confidence Interval OR

Confidence Interval OR dihitung dengan rumus sbb:
Batas bawah = OR x exp(-1,96 x SE)
Batas atas = OR x exp(1,96 x SE)
6.2.6. Uji Hipotesis Odd Ratio

OR adalah rasio antara Odd kelompok terpapar dengan kelompok tidak
terpapar. Suatu vaiabel dinyatakan meningkatkan risiko bila nilai OR > 1, menurangi
risiko bila nilai OR < 1, dan tidak ada hubungan bila nilai OR = 1. Oleh karena itu
hipotesis statistik dari OR adalah:
Ho: OR =1 (tidak terdapat perbedaan risk)
Ha: OR # 1 (terdapat perbedaan risk)
Uji Statistik
Untuk menguji apakah Ho diterima atau ditolak, maka Ho tersebut harus diuji
kebenarannya dengan menggunakan data emperis yang dikumpulkan dari sampel.
Parameter yang diuji adalah koefisien regresi “b” dengan uji Wald.
Kesimpulan
1. Menggunakan nilai p
Nilai signifikansi dari uji Wald akan dipakai dasar pengambilan keputusan
dalam uji hipotesis tentang OR. Ho diterima atau tidak terdapat perbedaan risk
antara kelompok terpapar dengan kelompok tidak terpapar bila nilai p dari
statistik Wald > α (tingkat kemaknaan). Sebaiknya Ho ditolak atau terdapat
perbedaan risk antara kelompok terpapar dengan kelompok tidak terpapar
apabila nilai p ≤ α. Apabila Ho ditolak, perlu dilihat apakah nilai OR > 1 atau
nilai OR < 1. Bila nilai OR > 1 dan nilai p ≤ α, berarti faktor tersebut
Modul STATA Page 53

meningkatkan risiko. Sebaliknya, bila nilai OR < 1 dan nilai p ≤ α, berarti faktor
tersebut menurunkan risiko atau faktor tersebut memberikan efek pencegahan.
2. Menggunakan nilai CI
Kesimpulan hasil uji hipotesis juga dapat dibuat dengan menggunakan CI dari
OR. Ho diterima bila angka “1” berada di dalam rentangan nilai CI, mialnya CI
95% OR adalah 0,15 - 10,5. Sebaliknya, Ho ditolak bila angka “1” berada di
luar rentang nilai CI, misalnya CI 95% OR adalah 2,5 – 7,5.
6.2.7. Prosedur STATA

Analisis menggunakan Menu
Prosedur Logistic Regression sbb:
1. Aktifkan Stata
Double click Ikon Stata sbb:
2. Open file CHD.dta

Click menu: File dan Open, seperti gambar di bawah ini.
Cari file: “CHD DATA.dta di folder Anda

Click “CHD DATA.dta maka akan tampak seperti gambar berikut:
Modul STATA Page 54

Click “Open”, maka file data dibuka sehingga di layar akan tampak variabel
yang terdapat pada file seperti gambar berikut.
3. Procedure Logistic regression

Click menu: Statistics > Binary outcomes > Logistic regression (reporting odds
ratio), seperti gambar berikut.
Modul STATA Page 55

Maka akan tampak sbb:
4. Memilih variabel dependent

Click “ dari kotak Dependent variable:” dan selanjutnya pilih CHD, maka
variabel CHD akan berada di kotak “Dependent variabel” seperti contoh di
atas ini.
5. Memilih variabel Independent

Click “ dari kotak Independent variables:” dan selanjutnya pilih CHD, maka
variabel CHD akan berada di kotak “Dependent variabel” seperti contoh di
bawah ini.
Modul STATA Page 56

Click “OK” untuk menjalankan prosedur, maka akan tampak output sbb:
. logistic CHD obase klp_umur sex
Logistic regression Number of obs = 200

LR chi2(3) = 22.49
Prob > chi2 = 0.0001
Log likelihood = -111.7622 Pseudo R2 = 0.0914
CHD Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]
obase 3.288366 1.136157 3.45 0.001 1.67064 6.472577

klp_umur 1.746819 .4622327 2.11 0.035 1.039939 2.934186
sex 1.922431 .6364992 1.97 0.048 1.004676 3.678543
_cons .0506574 .033052 -4.57 0.000 .0141015 .1819783
6. Goodness of Fit
Click Menu: Statistics > Binary outcome > Postestimation > Goodness of Fit,
seperti gambar berikut.
Modul STATA Page 57

Selanjutnya akan tampak sbb:
Click: Pearson or Hosmer-Lemeshow goodness of Fit

Click: Pearson goodness of fit
Click: Use all observations in the data
Click: OK, maka akan keluar hasil sbb:
Modul STATA Page 58

. estat gof, all
Logistic model for CHD, goodness-of-fit test
number of observations = 200

number of covariate patterns = 12
Pearson chi2(7) = 10.32
Prob > chi2 = 0.1714
Analisis menggunakan Command
Command: logistic
Syntax : logistic <outcome> <exposure> <confounding>
Untuk kasus di atas:

Outcome variabe: CHD
Variabel bebas : obase
Confounding : sex dan klp_umur
Cara:
Ketik: logistic CHD obase sex klp_umur, pada kotak Command, maka hasilnya
adalah sbb:
. use "D:\ANALISIS BINARY OUTCOME\CHD DATA.dta", clear
. logistic CHD obase sex klp_umur
Logistic regression Number of obs = 200

LR chi2(3) = 22.49
Prob > chi2 = 0.0001
Log likelihood = -111.7622 Pseudo R2 = 0.0914
CHD Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]
obase 3.288366 1.136157 3.45 0.001 1.67064 6.472577

sex 1.922431 .6364992 1.97 0.048 1.004676 3.678543
klp_umur 1.746819 .4622327 2.11 0.035 1.039939 2.934186
Hasil:
OR(adjusted odd ratio) obase adalah 3,288 (CI 95%: 1,670 – 6,472)
Catatan:
1. Pada Logistic Regresi risk ratio ditetukan dengan OR
2. Nilai OR akan selalu lebih besar dari PR bila PR > 1 dan akan lebih kecil bila
PR < 1.
3. Nilai OR sulit diiterpretasi dibandingan PR untuk penelitian cross-sectional
Modul STATA Page 59

DAFTAR PUSTAKA
Barros AJD, Hirakata VN. 2003. Alternatives for logistic regression in cross-
sectional studies: an emperical comparasion of models that directly
estimate the prevalence ratio, BMC Medical Research Methodology.
Available from: http://www.biomedicalcentral.com/[471-2288/3/21]
Coutinho MS, Scazufca M, Menezez PR. 2008. Methods for estimating prevalence
ratio in cross-sectional studies, Rev Saude Publica; 42 (6).
Daniel W.W. 1999. Biostatistics: A Foundation for Analysis In The Health

Sciences. Seventh Edition, John Wiley & Sons, New Yrok.
Hamilton L.C. 2009. Statistic with Stata, Versi 10. Brooks/Cole, Canada.
Kirkwood B.R, Stern J.A.C. 2000. Medical Statistics, Snd Edition, Blackwell,
Melbourne.
Lee J, Tan CS, Chia KS. A Practical Guide for Multivariate Analysis of
Dichotomous Outcomes. Ann Acad Med Singapore 2009; 38:714-9
Nurminen M. 1995. To use or not to use the odd ratio in epidemiologic studies?,
European Journal of Epidemiology 1995; 11: 365-371.
Reichenheim ME, Coutinho ESF. 2010. Measures and models for causal inference
in cross-sectional studies: arguments for the appropiateness of the
prevalence odds ratio and related logistic regression. Available from:
http://www.biomedicalcentral.com/[471-2288/10/66]
StataCorp. 2013. Stata Glossary and Index: Release 13. Statistical Software.
College Station, TX: StataCorp LP.
Thompson M.L, Myers J.E, Kribel D. 1998. Prevalence odd ratio or prevalence
ratio in the analysiss of cross sectional data: what is to be done?, Occup
Environ Med 1998; 55: 272-277.
Modul STATA Page 60

PDF

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

PDF

Diunggah oleh

Hak Cipta:

Format Tersedia

MODUL PRAKTIKUM STATA

BIOSTATISTIK DASAR DAN

dr. I Ketut Tangking Widarsa, MPH.

Program Studi Kesehatan Masyarakat

Modul STATA Page 1

1.3 Pokok Bahasan

1.4 Managemen Data Menggunakan Stata

1. Memulai program STATA dilakukan dengan meng-klik ikon STATA sehingga

Modul STATA Page 2

2. Format perintah stata

Modul STATA Page 3

3. Operator Pada Stata

1.4.2 Membuat Struktur Data

2. Cara membuat struktur data

Modul STATA Page 4

2) Klik bar untuk nama variabel 2 kali, sehingga tampak sbb:

5) Membuat Value Label

Modul STATA Page 5

1.4.3 Merekam Data

Modul STATA Page 6

1.4.4 Menyimpan dan Membuka Data

Kemudian isi File name setelah itu klik save.

1.4.5 Transformasi Data

Modul STATA Page 7

VARIABEL LAMA (OLD): RECODE VARIABEL BARU (NEW):

Modul STATA Page 8

2.2 One Sample T Test

2.2.4 Uji Statistik

Modul STATA Page 9

CI (1-α) = beda ± tα x sd/√n

2.2.6 Cara membuat kesimpulan

2.2.7 Procedure One sample T-Test dengan STATA

Modul STATA Page 10

2) Uji Normalitas Data dengan uji Shapiro-Wilk

Lalu tekan enter maka akan tampil Output sbb:

Shapiro-Wilk W test for normal data

Variable Obs W V z Prob>z

TIO 21 0.96294 0.908 -0.195 0.57728

Modul STATA Page 11

TIO 21 15.62381 .7382058 3.382884 14.08394 17.16368

mean = mean(TIO) t= 2.1997

Ha: mean < 14 Ha: mean != 14 Ha: mean > 14

Penentuan tingkat kepercayaan

2.3 Paired Samples T Test

2.3.4 Uji Statistik

2.3.6 Cara membuat kesimpulan

Modul STATA Page 13

2.3.7 Procedure Paired Samples T Test

2) Uji Normalitas Data

Modul STATA Page 14

Modul STATA Page 15

2.4.4 Uji Statistik Homogenitas Varian

2.4.5 Uji Statistik Perbedaan Rerata

Cara penghitungan nilai statistik T untuk dua sampel homogen

Modul STATA Page 16

2.4.7 Cara membuat kesimpulan

Modul STATA Page 17

Modul STATA Page 18

3) Uji Equality of Variance dengan Robust Variance test

4) Uji Beda Mean Independent sample t-test

Modul STATA Page 19

Uji beda mean

Modul STATA Page 20