PEMODELAN

1520025051

PROGRAM STUDI KESEHATAN MASYARAKAT

FAKULTAS KEDOKTERAN
UNIVERSITAS UDAYANA
A. ONE WAY ANOVA
Indikasi
One Way Anova digunakan untuk membandingkan mean dari tiga kelompok atau lebih. Analisis
ini merupakan perpanjangan dari independent sample t-test. Contoh kasus yang dapat dianalisis
dengan One Way Anova yaitu jika seorang peneliti ingin membandingkan kekuatan tulang femur
dari 3 kelompok usia yang berbeda (Daniel, Exercise 3.2.5).

Asumsi
Analisis ini dapat dilakukan jika memenuhi asumsi berikut
1. Data dari masing-masing kelompok berdistribusi normal
2. Data dari masing-masing kelompok memiliki varian yang homogen

Model Matematik

xij =μ+τj +ϵij

μ = mean semua populasi/grand mean
τ = beda mean antara satu populasi dengan grand mean (treatment effect)
ϵ = error term (seberapa besar ukuran individu berbeda dengan mean populasinya)

Hipotesis Statistik
Pernyataan
H0 : Kekuatan tulang dari 3 kelompok usia tidak memiliki perbedaan
HA : Ada perbedaan kekuatan tulang di antara 3 kelompok usia tersebut
Notasi Statistik
Ho: µ1 = µ2 = µ3
Ha: tidak semua µ sama

Tahapan Analisis
Contoh Kasus
Sebuah penelitian yang dilakukan oleh Wang dkk bertujuan untuk menguji kekuatan tulang.
Mereka mengumpulkan tulang femur dari 3 kelompok umur: muda (19-49 tahun), paruh baya (50-
69 tahun), dan tua (70 tahun ke atas). Pengukuran outcome yang digunakan adalah gaya (dalam
satuan Newton) yang diperlukan untuk mematahkan tulang. Tabel berikut menunjukkan data untuk
3 kelompok umur.
Tahapan analisis One Way Anova dirangkum dalam tabel berikut
Sumber Variasi Jumlah Kuadrat df Varian Varian Ratio
SSG
Between Group k-1 MSG = SSG/(k-1)

V.R= MSG/MSW
SSW
Within Group N–k MSW = SSW/(N-k)

Total SSG + SSW N–1

Langkah Penyelesaian
1. Menentukan Sum Square (jumlah kuadrat) di antara grup/SSG
Proses penghitungan dapat dilakukan menggunakan Microsoft Excel dengan menginput rumus

SSG dengan contoh sebagai berikut

2. Menentukan Sum Square (Jumlah Kuadrat) di dalam grup/SSW
Proses penghitungan dapat dilakukan menggunakan Microsoft Excel dengan menginput rumus

SSW dengan contoh sebagai berikut

3. Menentukan Degrees of Freedom (df)
Nilai df untuk SSG ditentukan dengan rumus (k – 1). Dalam kasus tersebut ada 3 kelompok,
jadi nilai df untuk SSG adalah 3 – 1 = 2. Sedangkan nilai df untuk SSW ditentukan dengan
rumus (N – k). Dalam kasus tersebut ada 29 sampel dan 3 kelompok, jadi nilai df untuk SSG
adalah 29 – 3 = 26
4. Menentukan Varian
Di antara grup (MSG)
Proses penghitungan dapat dilakukan menggunakan Microsoft Excel dengan menginput rumus
MSG = SSG/(k-1) dengan contoh sebagai berikut

Di dalam grup (MSW)
Proses penghitungan dapat dilakukan menggunakan Microsoft Excel dengan menginput
rumus MSW = SSW/(N-k) dengan contoh sebagai berikut

5. Menentukan Varian Ratio
Proses penghitungan dapat dilakukan menggunakan Microsoft Excel dengan menginput rumus
V.R= MSG/MSW dengan contoh sebagai berikut

Penyajian Hasil Analisis

Tabel 1. Rata-rata dan persebaran nilai kekuatan tulang menurut kelompok umur
Kelompok Umur n Mean SD
Muda (19 – 49 tahun) 10 118.2 35.29
Paruh baya (50 – 69 tahun) 9 100.04 19.12
Tua (>70 tahun) 10 70.07 16.44

Berdasarkan hasil analisis deskriptif, dapat diketahui bahwa jumlah keseluruhan subyek adalah 29
orang. Rata-rata kekuatan tulang pada kelompok usia muda (19-49 tahun) adalah yang paling
tinggi di antara kelompok lainnya. Sedangkan sebaran data pada kelompok usia tua paling
homogen karena memiliki simpangan baku yang paling kecil di antara 2 kelompok lainnya.

Tabel 2. Hasil Analisis One Way Anova

Variabel Varian Ratio Nilai p
Kelompok Umur 9,26 0,0009

Analisis One Way Anova dilakukan untuk mengetahui ada atau tidaknya perbedaan kekuatan
tulang pada 3 kelompok umur yaitu muda (19-49 tahun), paruh baya (50-69 tahun), dan tua (70
tahun ke atas. Hasil analisis one way anova menunjukkan bahwa variabel kelompok umur
memiliki varian ratio dengan sebesar 9,26 dan nilai p sebesar 0,0009.
Dengan demikian, H0 ditolak karena nilai Varian Ratio ≥ Critical Value (9,26 ≥ 3,37) dan nilai p
≤ 0,05 (0,0009≤0,05). *nilai critical value dapat dicari dengan melihat df numerator = k – 1; df
denominator = N – k menggunakan tabel F

Simpulan Hasil Analisis

Simpulan yang dapat diambil adalah terdapat perbedaan rerata kekuatan tulang di antara kelompok
umur muda, paruh baya, dan tua.

Lampiran Print Out STATA

Analisis Deskriptif

Analisis One Way Anova

====================================================================
B. TWO WAY ANOVA (Rancangan Acak Kelompok)
Indikasi
Two Way Anova digunakan untuk menguji hipotesis komparatif rata-rata k sampel bila peneliti
melakukan kategorisasi terhadap sampel ke dalam beberapa blok, sehingga bila sumber variasi
pada uji One Way Anova berasal dari perlakuan dan error, maka pada Two Way Anova sumber
variasi tidak hanya berasal dari perlakuan dan error, tetapi juga berasal dari blok. Contoh
penggunaan analisis ini yaitu ketika seorang peneliti ingin mengetahui pengaruh waktu kunjungan
rumah (home visit) terhadap lamanya waktu kunjungan rumah yang dilakukan oleh perawat.
Peneliti memiliki dugaan bahwa perbedaan tiap individu perawat juga memiliki pengaruh terhadap
lamanya waktu kunjungan, sehingga perawat digunakan sebagai blocking faktor (Daniel exercise
8.3.4)

Asumsi
Analisis ini dapat dilakukan jika memenuhi asumsi berikut
Data dari masing-masing kelompok berdistribusi normal
Data dari masing-masing kelompok memiliki varian yang homogen

Model Matematik

xij =μ+𝛽𝑖 τj +ϵij

μ = konstanta
β = menunjukkan efek dari blok
ϵ = error term (seberapa besar ukuran individu berbeda dengan mean populasinya)

Hipotesis Statistik
Pernyataan
H0: Tidak ada perbedaan lama kunjungan di antara berbagai waktu kunjungan yang dilakukan
oleh perawat
HA: Ada perbedaan lama kunjungan di antara berbagai waktu kunjungan yang dilakukan oleh
perawat
Notasi Statistik

Ho: τj = 0 j = 1,2,3
Ha: tidak semua τj = 0

Tahapan Analisis
Contoh Kasus
Supervisor perawat di Departemen Kesehatan setempat ingin meneliti pengaruh waktu kunjungan
rumah (home visit) terhadap lamanya waktu kunjungan rumah yang dilakukan oleh perawat.
Peneliti memiliki dugaan bahwa perbedaan tiap individu perawat juga memiliki pengaruh terhadap
lamanya waktu kunjungan, sehingga perawat digunakan sebagai blocking faktor. Supervisor
perawat mengumpulkan data berikut

Apakah data tersebut memberikan bukti yang cukup untuk mengindikasikan adanya perbedaan
lama kunjungan di antara waktu kunjungan yang dilakukan perawat? α = 0,05

Tahapan analisis Two Way Anova (Rancangan Acak Kelompok) dirangkum dalam tabel berikut
Sumber Jumlah Kuadrat df Varian Varian Ratio
Variasi
Treatment
(Waktu SSTr= ∑ nj(x̅j - x̅..)2 k-1 MSTr = SSTr/(k-1)
V.R=
Kunjungan)
MSTr/MSE
Blocks
SSBl= ∑ ni(x̅i - x̅..)2 n–1 MSBl = SSBl/(n-1)
(Perawat)
Residual SSE=SST-SSBl-SSTr (n-1)(k-1) MSE =SSE/(n-1)(k-1)
Total SST= ∑ (x̅ij - x̅..)2 kn – 1

Langkah Penyelesaian
1. Menentukan Sum Square Total/SST
Proses penghitungan dapat dilakukan menggunakan Microsoft Excel dengan menginput rumus
SST= ∑ (x̅ij - x̅..)2 dengan contoh sebagai berikut

2. Menentukan Sum Square Treatment (SSTr)
Proses penghitungan dapat dilakukan menggunakan Microsoft Excel dengan menginput rumus
SSTr= ∑ nj(x̅j - x̅..)2 dengan contoh sebagai berikut

3. Menentukan Sum Square Blocks (SSBl)
Proses penghitungan dapat dilakukan menggunakan Microsoft Excel dengan menginput rumus
SSBl= ∑ ni(x̅i - x̅..)2 dengan contoh sebagai berikut

4. Menentukan Nilai Residual (SSE)
Nilai residual (SSE) ditentukan dengan rumus SSE=SST-SSBl-SSTr. SSE = 687,94 – 531,9 –
124,69 = 32,06
5. Menentukan degrees of freedom (df)
Total df adalah (4)(4) – 1 = 15, df block (nurse) adalah 4 – 1 = 3, df treatment (waktu
kunjungan) adalah 4 – 1 = 3, df residual adalah df total – df block – df treatment = 15 – 3 – 3
=9
6. Menentukan Varian
(MSTr)

Proses penghitungan dapat dilakukan menggunakan Microsoft Excel dengan menginput rumus
MSTr = SSTr/(k-1) dengan contoh sebagai berikut

MSBl
Proses penghitungan dapat dilakukan menggunakan Microsoft Excel dengan menginput rumus
MSBl = SSBl/(n-1) dengan contoh sebagai berikut

MSE
Proses penghitungan dapat dilakukan menggunakan Microsoft Excel dengan menginput rumus
MSE = SSE/(n-1)(k-1) dengan contoh sebagai berikut

7. Menentukan Varian Ratio
Proses penghitungan dapat dilakukan menggunakan Microsoft Excel dengan menginput rumus
V.R= MSTr/MSE dan V.R= MSBl/MSE dengan contoh sebagai berikut

Nilai Varian Ratio untuk Treatment (Waktu Kunjungan) adalah 11,67. Sedangkan nilai Varian
Ratio untuk Block (Perawat) adalah 49,7

Penyajian Hasil Analisis

Tabel B.1 Rata-rata dan persebaran lama kunjungan rumah menurut waktu kunjungan rumah
Waktu Kunjungan n Mean SD
Early Morning 4 28.25 6,4
Late Morning 4 28.5 8,23
Early Afternoon 4 27.75 5,91
Late Afternoon 4 21.75 6,65
Total 16 26.56 6,77

Berdasarkan hasil analisis deskriptif, dapat diketahui bahwa jumlah keseluruhan subyek adalah 16
orang. Rata-rata lama kunjungan yang dilakukan oleh perawat adalah 26,56 menit. Rerata lama
kunjungan terlama adalah 28,5 menit yang dilakukan saat pagi hari menjelang siang. Sedangkan
rerata lama kunjungan tersingkat adalah 21,75 menit yang dilakukan saat siang menjelang sore
hari.

Tabel B.2 Hasil Analisis Two Way Anova

Sumber Variasi JK d.f Varian Varian Ratio Nilai p
Treatment
(Waktu 124,69 3 41,56 11,67 0,0019
Kunjungan)
Block (Perawat) 531,19 3 177,06 49,7 0,0000
Residu 32,06 9 3,56
Total 687,94 15

Analisis Two Way Anova digunakan pada kasus ini untuk mengetahui ada atau tidaknya perbedaan
lamanya waktu kunjungan perawat berdasarkan waktu saat perawat tersebut mengunjungi
pasiennya. Hasil two way anova menunjukkan bahwa treatment(waktu kunjungan) memiliki
varian ratio sebesar 11,67 dengan nilai p sebesar 0,0019. Sedangkan block (perawat) memiliki
varian ratio sebesar 49,7 dengan nilai p sebesar 0,0000. Dengan demikian, H0 ditolak karena nilai
p ≤ 0,05 (0,0019≤0,05).

Simpulan Hasil Analisis

Simpulan yang dapat diambil adalah terdapat perbedaan rerata lama kunjungan perawat
berdasarkan waktu saat perawat tersebut mengunjungi pasien. Jika dibandingkan dengan faktor
perawat, maka faktor perawat lebih mempengaruhi lama kunjungan karena memiliki varian ratio
dan nilai p yang lebih signifikan daripada waktu kunjungan.

Lampiran Print Out STATA
Struktur data

Analisis Two Way Anova

C. TWO WAY ANOVA (Rancangan Faktorial)
Indikasi
Rancangan faktorial adalah salah satu rancangan eksperimen untuk mempelajari efek lebih dari
satu faktor terhadap outcome variabel tertentu. Rancangan faktorial dipakai apabila akan
mencobakan lebih dari satu faktor. Sebagai contoh, misalnya akan mencoba dua jenis pengobatan
seperti tablet besi (Faktor I) dan vitamin C (Faktor II) terhadap peningkatan kadar Hb.

Asumsi
Asumsi untuk Two-Way Anova adalah sampel dipilih secara random dan data dari masing-masing
kelompok percobaan berdistribusi normal

Model Matematik
Y =  +  +  +  + 
Variasi nilai variabel tergantung Y ditentukan oleh  (efek faktor 1: tablet besi),  (efek faktor II
: vitamin C) dan  (efek faktor lain) yang disebut error.

Hipotesis Statistik
Untuk contoh kasus di atas, hipotesisnya adalah:
Faktor I: jenis terapi
Ho: 1 = 2 = 3 (tidak ada efek) atau Ho: i=0
Ha: tidak semua sama Ha: tidak semua i=0
Ho: 1 = 2 = 3 = 4 (tidak ada efek) atau Ho: i=0
Ha: tidak semua sama Ha: tidak semua i=0
Interaksi Faktor I dan Faktor II
Ho: ij = 0 (tidak ada interaksi) atau Ho: ()i = 0
Ha: ij # 0 (ada interaksi) Ha: tidak semua ()i = 0
Tahapan Analisis
Contoh Kasus
Seorang peneliti ingin mengetahui pengaruh terapi (HAART dan IL2) dan kadar plasma (<50/ml
sel T CD4 di antara 2 terapi tersebut?. Apakah ada perbedaan perubahan kadar sel T CD4 di antara

kelompok yang memiliki kadar plasma kurang dari 50 dan lebih dari 50/ml? Apakah ada interaksi
antara plasma dan terapi tersebut. Alpha = 0,05

Sumber Jumlah Kuadrat df Varian Varian Ratio

Variasi
Terapi
(Pemberian
SSA= ∑ nj(x̅j - x̅..)2 a-1 MSA = SSA/(a-1) MSA/MSE
HAART dan
IL2)
Plasma
(<50/ml atau SSB= ∑ ni(x̅i - x̅..)2 b–1 MSB = SSB/(b-1) MSB/MSE
≥50/ml)
Interaksi
MSAB =SSAB/(a-
Terapi dan SSAB (a-1)(b-1) MSAB/MSE
1)(b-1)
Plasma
SSE = SST-SSA-SSB-
Error ab(n-1) MSE = SSE/ab(n-1)
SSAB
Total SST= ∑ (x̅ij - x̅..)2 n–1

Langkah Penyelesaian
1. Input data dengan struktur seperti gambar di bawah ke dalam Microsoft Excel

Simpan data tersebut dengan format xls, kemudian import data tersebut ke dalam aplikasi
STATA.
by Terapi, sort: sum CD4 dan by Plasma, sort: sum CD4

3. Melakukan analisis two way anova faktorial dengan menggunakan command anova CD4
Plasma Terapi Plasma#Terapi

Penyajian Hasil Analisis

Tabel C.1 Rata-rata dan persebaran persentase perubahan CD4 berdasarkan jenis terapi
Jenis Terapi n Mean SD
HAART 9 72,81 66,39
IL 2 4 37,08 42,02

Berdasarkan hasil analisis deskriptif diketahui bahwa jenis terapi HAART memberikan persentase
perubahan kadar sel T CD4 yang lebih besar dibandingkan dengan jenis terapi IL 2. Namun, data
pada jenis terapi IL2 lebih homogen karena memiliki nilai simpangan baku yang lebih kecil.

Tabel C.2 Rata-rata dan persebaran persentase perubahan CD4 berdasarkan kadar plasma
<50/ml 6 21,33 37,22
≥50/ml 7 96,51 56,12

Berdasarkan hasil analisis deskriptif diketahui bahwa jika kadar plasma di atas 50 copy/ml maka
persentase perubahan kadar sel T CD4 akan lebih besar dibandingkan dengan kadar plasmanya di
bawah 50 copy/mL.

Tabel C.3 Hasil Analisis Two Way Anova (Faktorial)

Sumber Variasi JK d.f Varian Varian Ratio Nilai p
Jenis terapi 2704,75 1 2704,75 1,07 0,33
Kadar Plasma 13544,92 1 13544,92 5,35 0,046
Interaksi jenis
terapi dengan 246,22 1 256,22 0,1 0,762
Residu 22819,38 9 2535,49
Total 44094,33 12 3674,52

Berdasarkan hasil analisis, dapat diketahui bahwa jenis terapi tidak berpengaruh secara signifikan
karena memiliki nilai p = 0,33 (>0,05). Selain itu, tidak ada efek interaksi antara jenis terapi dengan
persentase perubahan kadar sel T CD4 karena memiliki nilai p = 0,046 (<0,05)

Simpulan Hasil Analisis
Kesimpulan yang dapat diambil yaitu tidak ada perbedaan perubahan kadar sel T CD4 di antara
terapi HAART dan IL2. Sedangkan ada perbedaan perubahan kadar sel T CD4 di antara kelompok
yang memiliki kadar plasma kurang dari 50/ml dan lebih dari 50/ml. Tidak ada interaksi antara
kadar plasma dan jenis terapi yang diberikan.

Lampiran Print Out STATA

Analisis Deskriptif

Analisis Two Way Anova Faktorial

D. ANALISIS KOVARIAT (ANCOVA)
Indikasi
Analisis kovariat (ANCOVA) merupakan salah satu metode analisis statistik yang masih terkait
dengan ANOVA. Analisis ini menguji apakah terdapat perbedaan yang signifikan di antara
kelompok setelah mengontrol variabel kovariat. Variabel kovariat adalah variabel numerik yang
berpengaruh dengan variabel tergantung, namun tidak memiliki hubungan dengan variabel bebas.
Hubungan antara variabel bebas, tergantung, dan kovariat dapat digambarkan sebagai berikut.

Asumsi
Asumsi yang harus dipenuhi sebelum melakukan uji Ancova adalah sebagai berikut
a. Memenuhi seluruh asumsi ANOVA (varian berdistribusi normal, varian di antara kelompok
sama, semua pengukuran independen.
b. Hubungan antara variabel tergantung dan kovariat bersifat linear
c. Hubungan antara variabel tergantung dan kovariat adalah sama untuk semua kelompok

Model Matematik
Model matematik Ancova mengasumsikan hubungan linear antara variabel tergantung dengan
kovariat
yij = µ+ τi + B(xij - x̅ ) + ij

Dalam persamaan di atas, variabel tergantung yij merupakan nilai ke j di dalam kelompok i;
variabel kovariat xij merupakan nilai ke j di dalam kelompok i. Nilai µ menunjukkan mean
keseluruhan dan x̅ merupakan mean keseluruhan dari kovariat. Nilai B menunjukkan kemiringan
(slope) garis dan  menunjukkan error.

Hipotesis Statistik
H0: Tidak ada perbedaan rerata kadar kolesterol akhir antara kelompok perlakuan dan kontrol
setelah mengontrol kovariat
HA: Ada perbedaan rerata kadar kolesterol akhir antara kelompok perlakuan dan kontrol setelah
mengontrol kovariat

Tahapan Analisis
Contoh Kasus
orang yang diberikan perlakuan berupa obat dengan zat aktif X dan plasebo (obat tanpa zat
apapun). Sebelum memberikan perlakuan, peneliti tersebut menghitung kadar kolesterol
sekelompok orang tersebut. Kemudian, peneliti mengontrol kadar kolesterol awal sekelompok
orang tersebut karena peneliti menduga kadar kolesterol awal akan mempengaruhi kadar kolesterol
akhir dari sekelompok orang tersebut.

Langkah Penyelesaian
1. Menginput data dengan struktur seperti gambar di bawah ke dalam aplikasi STATA

command by kelompok, sort: sum pretest postest
3. Melakukan analisis covariat dengan menggunakan command anova posttest kelompok
c.pretest

19
Penyajian Hasil Analisis
Tabel D.1 Rata-rata dan persebaran kadar kolesterol awal (pretest) dan akhir (posttest) pada
kelompok yang diberi obat dengan zat aktif X

Kelompok Perlakuan n Mean SD

Pretest 10 161,8 14,11
Posttest 10 107,4 20,52

Berdasarkan hasil analisis deskriptif, dapat diketahui bahwa rerata kadar kolesterol awal pada
kelompok yang diberi obat dengan zat aktif X adalah 161,8. Sedangkan rerata kadar kolesterol

Tabel D.2 Rata-rata dan persebaran kadar kolesterol awal (pretest) dan akhir (posttest) pada
kelompok yang diberi plasebo (kontrol)

Kelompok Kontrol n Mean SD

Pretest 10 184,2 15,83
Posttest 10 141,9 21,23

Berdasarkan hasil analisis deskriptif, dapat diketahui bahwa rerata kadar kolesterol awal pada

Tabel D.3 Hasil Analisis of Covariate (Ancova)

Sumber Variasi JK d.f Varian Varian Ratio Nilai p
Kelompok (Obat
84,51 1 84,51 1,53 0,23
X & Plasebo)
6909,21 1 6909,21 125,21 0,000
Awal
Residu 938,09 17 55,18
Total 13798,55 19 3674,52

Berdasarkan hasil analisis, dapat diketahui bahwa pemberian obat X dan plasebo tidak
berpengaruh secara signifikan karena memiliki nilai p = 0,23 (>0,05). Dengan demikian H0 tidak
ditolak

Simpulan Hasil Analisis
Tidak ada perbedaan kadar kolesterol di antara sekelompok orang yang diberi obat X dan plasebo
setelah kadar kolesterol awal masing-masing orang (kovariat) dikontrol.

Lampiran Output STATA

E. REGRESI LINEAR BERGANDA
Indikasi
Regresi berganda digunakan untuk menganalisis beberapa variabel bebas numerik (x) dan sebuah
variabel tergantung numerik (y). Contohnya pengaruh variabel X1 (berat badan) X2 (jumlah
kalori) terhadap Y (kadar gula darah). Berbagai tujuan dilakukannya regresi berganda antara lain
untuk melihat variabel X yg paling berpengaruh terhadap variabel Y, untuk mengendalikan faktor
lain yang mengganggu pengaruh variabel bebas yang akan diteliti terhadap variabel tergantung
(control by design). Selain itu, analisis ini juga bisa dipakai untuk estimasi nilai variabel tergantung
(y) berdasarkan nilai dari variabel bebas (x).

Asumsi
Asumsi klasik regresi ganda meliputi linearitas, homoskedastisitas, tidak terjadi multikolinearitas
antar variabel bebas, dan tidak terjadi oto korelasi.
a. Linearitas
Untuk mengtahui apakah asumsi linearitas ini terpenuhi, dapat dilakukan dengan membuat
scatter plot antara variabel bebas Xk dengan variabel tergantung Y. Cara lain yang dapat
dilakukan adalah dengan menguji linearitas hubungan variabel Xk dengan variabel tergantung
Y seperti dengan analisis varian. Statistik F dan nilai p deviasi dari lineritas (deviation from
linearity) yang dipakai menentukan liniear atau tidaknya hubungan variabel Xk dengan Y. Bila
nilai p > , berarti hubungan X dengan Y linear, sebaliknya, bila nilai p  , berarti hubungan
X dengan Y tidak linear
b. Homoskedastisitas
Homoskedatik adalah kondisi dimana sub-grup variabel Y untuk setiap nilai Xk memiliki varian
yang sama dan rerata Y dari masing-masing sub-grup terletak dalam satu garis lurus. Untuk
mengetahui homoskedastisitas dapat dilakukan dengan mengetik command estat hettest pada
STATA setelah melakukan analisis regresi.
c. Multikolinearitas
Kolinier atau multikolinear terjadi bila terdapat korelasi yang kuat atara variabel bebas.
Kolinear dapat diktahui dari koefisien korelasi antara variabel bebas.Bila terjadi korelasi yang
kuat, dapat diduga terjadi kolinearitas antara variabel bebas tersebut. Di sisi lain, kolinearitas
antara beberapa variabel bebas bisa terjadi walupun koefisien korelasinya tidak terlalu kuat.

Oleh karena itu perlu metode uji yang formal yaitu dengan menghitung vaiance inflating factor
(VIF) dengan mengetik command estat vif pada STATA setelah melakukan analisis regresi
d. Oto korelasi
Oto-korelasi sering dikenal dengan istilah korelasi serial, yang sering ditemukan pada data
serial (Time Series Data). Terjadinya oto-korelasi antara variabel bebas pada regresi ganda akan
regresi b dan bias pada perhitungan nilai F dan t. Jika data yang digunakan tidak termasuk time
series data, maka cukup menggunakan 3 asumsi sebelumnya.

Model Matematik
y = a +b1x1 +b2x2 +.....bixi
y = variabel tergantung
a = konstanta
bi = koefisien regresi untuk variabel bebas x1
x = variabel bebas
Hipotesis Statistik
Uji Hipotesis R2
Untuk menguji apakah R2 di populasi bermakna, maka R2 yang didapatkan dari sampel harus diuji
tingkat kemaknaannya. Metode statistik yang dipakai menguji adalah metode analisis varian
dengan hipotesis statistik sebagai berikut:
Ho: R2 = k = 0
Ha: R2 = 0
Tabel resume analisis varian pada regresi ganda

Regresi JKR 1 RKR=JKR/1 RKR/RKE
Eror JKE n-2 RKE=JKE/(n-2)
Total JKT n-1

Bila nilai p   , maka dapat disimpulkan R2 bermakna, sebaliknya, bila p >  disimpulkan R2
tidak bermakna.

Tahapan Analisis
Contoh Kasus
hiperlipoproteinemia sesaat sebelum diberikan terapi.

Dari data tersebut, seorang peneliti ingin mengetahui model regresi dan pengaruh variabel bebas

Tahapan Penyelesaian
Data pada kasus di atas akan dianalisis menggunakan software STATA dan SPSS, adapun
command yang diinput adalah sebagai berikut
a. Input data pada tabel tersebut ke dalam STATA dan SPSS
b. Melakukan uji linearitas variabel bebas terhadap variabel tergantung
command sum Weight Cholesterol Triglyceride
d. Analisis regresi berganda antara variabel bebas (kolesterol dan trigliserida) terhadap variabel
tergantung (berat badan) menggunakan command regress Weight Cholesterol Triglyceride
e. Melakukan uji terhadap asumsi multikolinearitas dengan command estat vif
f. Melakukan uji terhadap asumsi homoskedastisitas dengan command estat hettest

Penyajian Hasil Analisis
Variabel n Mean SD
Kolesterol 15 337,27 53,92
Trigliserida 15 134,33 57,41

Berdasarkan hasil analisis deskriptif, rata-rata berat badan dalah 76,2 kg. Sedangkan rerata kadar
kolesterol dan trigliserida adalah 337,27 mg/100mL dan 134,33 mg/100 mL.

Interpretasi Output 1: Koefisien Determinasi (R2) dan Analisis Varian

Nilai R2 = 0,1632 yang ditunjukkan pada gambar di atas artinya sebesar 16,32% variasi berat badan
p = 0,3434. Oleh karena nilai p > 0,05, maka analisis regresi ini tidak dapat dipakai untuk

Interpretasi Output 2 : Koefisien Regresi

Dari kedua variabel bebas tersebut, kolesterol tidak mempengaruhi berat badan dimana nilai b
untuk kolesterol adalah -0,47 dengan nilai p = 0,417 (>0,05). Sedangkan trigliserida tidak
mempengaruhi berat badan dimana nilai b untuk trigliserida adalah 0,07 dengan nilai p = 0,189
(>0,05)

Interpretasi Output 3 : Uji heteroskedastisitas

Berdasarkan uji tersebut, data yang digunakan bersifat homoskedastik karena memiliki p > 0,05

Interpretasi Output 4 : Uji multikolinearitas

Dari gambar output 4 diketahui bahwa nilai VIF dari semua variabel bebas lebih kecil dari 10,
maka dapat disimpulkan bahwa tidak terjadi multikolinearitas diantara variabel bebas.

Interpretasi Output 5 : Uji Linearitas

Dari gambar output 5 tersebut menunjukkan bahwa nilai p dari kolesterol dan trigliserida lebih
besar dari 0,05. Sehingga, kedua variabel tersebut tidak linear dengan berat badan

Simpulan Hasil Analisis

Berdasarkan hasil analisis, dapat disimpulkan bahwa variabel tergantung (kadar kolesterol dan
trigliserida) tidak dapat digunakan untuk mengestimasi berat badan. Selain itu, variabel kadar
kolesterol dan trigliserida hanya memberikan pengaruh sebesar 16,32% terhadap variasi berat

F. REGRESI LOGISTIK
Indikasi
Regresi logistik adalah metode yang digunakan untuk analisis antar variabel dimana variabel
outcomenya nominal (bisa 2 kategori atau lebih), variabel bebasnya bisa nominal, ordinal, dan
interval. Jika variabel outcomenya memiliki 2 kategori maka regresi yang digunakan adalah binary
logistic regression. Regresi lain yang dapat digunakan adalah multinomial logistic regression
untuk menganalisis variabel outcome yang memiliki lebih dari 2 kategori. Kegunaan dari regresi
logistik yaitu untuk mempelajari pengaruh, perbedaan risiko atau faktor risiko. Ukuran risk yang
dipakai dalam analisis ini adalah odd ratio. Sedangkan kegunaan lainnya yaitu untuk
mengendalikan variabel perancu (control by analysis)

Asumsi
Uji asumsi yang sering digunakan adalah Goodness of Fit. Uji tersebut digunakan untuk
menentukan apakah data ini cocok dianalisis dengan regresi logistik. Bisa dilakukan bila minimal
jumlah variabel bebas dalam model ada 3. Data dikatakan fit bila nilai p> 0.05

Model Matematik
Logit . p  a  bi X i

Oleh karena:

 p 
Logit . p  ln   ,
1  p 
 p 
   Odd
1 p 
ln Odd   a  bi X i , maka

Odd  Expa biXi

Hipotesis Statistik
Untuk menguji kemaknaan nilai Odd Rasio dapat dilakukan dengan uji t dengan rumus sbb:

bi
t
SEbi

Bila nilai p > 0,05 berarti Ho yang menyatakan tidak ada perbedaan risk diterima, sebaliknya bila
nilai p < 0,05 berarti Ho. ditolak. Penerimaan dan penolakan Ho. OR = 1 juga dapat dilakukan
dengan menggunakan Confidence Interval (CI 95%) dari OR. Ho. OR = 1 diterima bila angka 1
berada di dalam CI dan sebaliknya, Ho OR = 1 ditolak bila angka 1 terletak di luar CI.

Tahapan Analisis
Contoh Kasus
Seorang peneliti telah mengumpulkan data berbagai faktor risiko yang berkaitan dengan status
penyakit jantung koroner dari 200 orang sampel. Kemudian dari data tersebut, peneliti ingin
mengetahui faktor risiko yang paling mempengaruhi kejadian penyakit jantung koroner. Tingkat
kepercayaan dalam penelitian ini adalah 95%.

Langkah Penyelesaian
1. Mengimport data yang sudah ada (CHD DATA.dta) ke dalam aplikasi STATA. Ketik
command edit untuk melihat struktur data seperti gambar di bawah.

2. Melakukan analisis deskriptif terhadap variabel variabel yang ada dengan command STATA
sebagai berikut:
tab CHD
tab obase
tab klp_umur
tab cholesterolemia

tab sex
3. Melakukan analisis regresi logistik untuk mengetahui faktor risiko yang paling berpengaruh
terhadap penyakit jantung koroner dengan command STATA sebagai berikut:
logistic CHD obase klp_umur cholesterolemia sex

Penyajian Hasil Analisis

Tabel F.1 Distribusi Frekuensi Berbagai Variabel
Variabel n Persentase
Penyakit Jantung Koroner (PJK)
PJK 61 30,5%
Non PJK 139 69,5%
Obesitas
Obesitas 109 54,5%
Non-obesitas 91 45,5%
Kelompok Umur
< 34 tahun 36 18%
35 – 54 tahun 116 58%
> 55 tahun 48 24%
Kolesterolemia
Kolesterolemia 108 54%
Non-kolesterolemia 92 46%
Jenis Kelamin
Laki-laki 75 37,5%
Perempuan 125 62,5%

Berdasarkan hasil analisis deskriptif, diketahui bahwa sebagian besar sampel (69,5%) tidak
menderita penyakit jantung koroner. Sebagian besar sampel menderita obesitas yaitu sebanyak 109
orang atau 54,5%. Sampel yang menjadi subyek penelitian sebagian besar berada di dalam
rentangan umur 35 – 54 tahun (58%). Ditinjau dari jenis kelamin, sampel yang menjadi subyek
penelitian didominasi oleh perempuan (62,5%) dibandingkan dengan laki-laki (37,5%).

Tabel F.2 Nilai Odds Ratio Masing-masing Faktor Risiko terhadap Penyakit Jantung Koroner
Confidence Interval
Faktor Risiko OR p value
(95% CI)
Obesitas 3,04 1,49 – 6,20 0,002
Kelompok Umur 1,89 1,09 – 3,29 0,023
Kolesterolemia 4,86 2,32 – 10,18 0,000
Jenis Kelamin 1,97 0.99 – 3,92 0,052

Berdasarkan hasil analisis regresi logistik, jenis kelamin bukan merupakan faktor risiko penyakit
jantung koroner karena terdapat nilai OR = 1 di dalam rentangan CI dan memiliki nilai p di atas
0,05 (0,052 > 0,05). Selain jenis kelamin, semua variabel bebas yang diuji dapat menjadi faktor
risiko penyakit jantung koroner karena tidak terdapat nilai OR = 1 di dalam rentangan CI dan
memiliki p value di bawah 0,05.

Simpulan Hasil Analisis

Obesitas, kelompok umur, dan kolesterolemia dapat menjadi faktor risiko jantung koroner. Dari
hasil analisis, dapat diketahui bahwa orang yang menderita kolesterolemia lebih berisiko
mengalami penyakit jantung koroner sebanyak 4,86 kali dibandingkan orang yang tidak menderita
kolesterolemia. Kolesterolemia menjadi faktor risiko yang paling berpengaruh karena memiliki
Odds Ratio yang paling besar di antara faktor risiko lainnya.

Lampiran Output STATA

Analisis Deskriptif

Analisis Regresi Logistik

G. CONFIRMATORY FACTOR ANALYSIS
Indikasi
Confirmatory factor analysis merupakan model persamaan struktural yang terdiri dari dua bagian
yaitu model pengukuran (measurement model) yang menghubungkan indikator/observed variabel
dengan variabel latent dan bagian yang kedua adalah model struktural yang menghubungan antar
variabel latent. Konsep yang sifatnya abstrak dan tidak dapat diukur secara langsung disebut
variabel latent atau variabel konstruk. Sebagai contoh misalnya kepuasan pasien dan loyalitas
pasien. Variabel yang dapat diukur tersebut dinamakan variabel indikator atau variabel observed
atau variabel manifest.

Analisis faktor konfirmatori dipakai menguji hipotesis validitas dan reliabilitas faktor yang disusun
berdasarkan teori dan konsep yang sudah ada. Dengan demikian, analisis ini ditujukan untuk
mengkonfirmasi model yang dibuat berdasarkan teori yang sudah ada sebelumnya dengan data
emperis.

Tahapan Pembuatan Model

1. Konseptualisasi Model: misal dari konsep pengetahuan akan diukur dari 10 indikator
2. Membuat diagram path yang menghubungkan antar variabel dilengkapi dengan garis
pengaruh. Berikut adalah sebuah contoh persamaan struktural model pengukuran untuk
analisis faktor konfirmatori.

1 2 3

X1 X1 X1

1 2 3

e1 e1 e1

Keterangan:
Xi: variabel manifest (kotak) i: besar eror pengukuran
Ei : eror pengukuran

32
3. Spesifikasi model diagram yang sudah dibuat tadi diberikan label (nama)
4. Identifikasi Model
5. Estimasi parameter
6. Uji model diuji apakah model tsb fit atau tidak (apakah indikator2 tadi bisa nguji konsep tsb
atau tidak

Validitas Item (Indikator)

Ditentukan dari loading faktor (β),Valid bila nilai β > 0,5 dan validitas baik bila β ≥ 0,70.
Validitas Konvergen (Konstruk)
Menentukan keunikan indikator suatu konstrak. Selain itu, validitas konstruk menyatakan semua
indikator solid untuk mengukur konstrak. Validitas ini dinilai dari nilai Average Variance
Extraction (AVE), bila AVE > 0,5 dinyatakan valid. Rumus untuk menentukan validitas konstruk

β2
AVE = --------------------
β2 + (1-β2)

Penentuan Reliabilitas Item dan Konstruk

Reliabilitas Item
Ditentukan dari besarnya residu () yang besarnya = 1 – R2 atau = 1 - β2. Dinyatakan reliabel bila
R2 > 0,50 atau  < 0,5.

Reliabilitas Konstruk
Ditentukan dari nilai Construct Reliability (CR). Reliabel bila CR > 0,70

(β)2
CR = -----------------------
{(β)2 + (1-β2)}

Tahapan Analisis
Contoh Kasus
Diketahui kepuasan pelanggan ditentukan dari harga, kelengkapan barang, peletakan barang, dan
pelayanan petugas. Apakah 4 indikator tersebut valid dan reliabel dalam menentukan tingkat
kepuasan pelanggan?

Langkah Penyelesaian
1. Membuka file dengan nama KEPUASAN.dta dalam aplikasi STATA

2. Membuat model persamaan struktural di dalam aplikasi STATA dengan langkah sebagai
berikut: Pilih menu Statistic – SEM – model building and estimation – kemudian pilih ikon

3. Setelah itu akan muncul kotak dialog, pada bagian Latent Variable Name diisi nama variabel
laten dalam hal ini Kepuasan. Pada bagian Measurement Variable diisi dengan nama variabel
observe dalam hal ini harga, lengkap, letak, layanan.

Diagram yang dihasilkan akan seperti gambar berikut.

Kita dapat menambahkan judul diagram dengan cara klik ikon berbentuk huruf “T” di sisi
kiri layar kemudian ketikkan judul yang sesuai.

35
4. Selanjutnya menambahkan nilai estimasi parameter pada diagram dengan cara klik menu
Estimation pada layar SEM Builder kemudian klik Estimate.

Setelah muncul kotak dialog di atas, klik tab Reporting kemudian beri checklist pada
pernyataan “Display standadized coefficients and values” lalu klik OK. Akan muncul nilai

36
“Standardized Estimate”

5. Menentukan validitas dan reliabilitas item. Validitas item dapat dilihat dari angka pada garis
yang menghubungkan variabel latent (kepuasan) dengan variabel-variabel observe (β). Jika
nilai β > 0,5 maka item tersebut dapat dinyatakan valid. Reliabilitas item dapat ditentukan
dengan rumus 1 - β2. Dinyatakan reliabel bila R2 > 0,50.

6. Menentukan validitas dan reliabilitas konstruk. Validitas ini dinilai dari nilai Average
Variance Extraction (AVE), bila AVE > 0,5 dinyatakan valid. Rumus untuk menentukan
β2
AVE = --------------------
β2 + (1-β2)
Sedangkan reliabilitas konstruk ditentukan dari nilai Construct Reliability (CR). Reliabel
bila CR > 0,70
(β)2
CR = -----------------------
{(β)2 + (1-β2)}

Simpulan Hasil Analisis
Dari model persamaan di atas dapat diketahui bahwa seluruh instrumen (harga, kelengkapan
barang, letak barang, dan layanan dari toko) valid untuk mengukur kepuasan pelanggan karena
memiliki nilai validitas konstruk di atas 0,5. Sedangkan seluruh instrumen dinyatakan reliabel
untuk mengukur kepuasan pelanggan karena memiliki nilai reliabilitas konstruk diatas 0,7.

H. PATH ANALYSIS (ANALISIS JALUR)
Indikasi
Analisis jalur dikembangkan oleh Sewal Wright, seorang ahli Genetika pada tahun 1921. Metode
analisis ini mulai dikenal setelah diperkenalkan oleh Duncan dalam literatur Sosiologi. Metode
analisis jalur ini banyak digunakan dalam memecahkan permasalahan-permasalahan di bidang
sosial. Analisis jalur merupakan suatu model persamaan struktural hubungan sebab-akibat dari
beberapa variabel bebas dengan beberapa variabel tergantung (semua variabelnya variabel
observe, beda dengan CFA). Analisis jalur dilakukan dengan tujuan untuk menguji hipotesis
hubungan sebab-akibat, menentukan jalur pengaruh, dan menentukan besar pengaruh (total,
langsung, dan tidak langsung).

Asumsi
Terdapat beberapa persyaratan yang harus dipenuhi dalam pemamakaian analisis jalur yaitu:
satu variabel merupakan fungsi linear dari variabel lainnya yang bersifat sebagai kausal.
2. Hubungan antar variabel bersifat aditif dan bukan multiflikatif atau exponential.
3. Variabel sisa (residu) tidak berkorelasi dengan variabel regresi.
4. Variabel berskala interval atau rasio.

Tahapan Pembuatan Model

1. Konseptualisasi Model: misal kualitas produk, layanan, dan harga mempengaruhi kepuasan
dan kepuasan mempengaruhi loyalitas
2. Membuat diagram path yang menghubungkan antar variabel dilengkapi dengan garis
pengaruh. Berikut adalah sebuah contoh persamaan struktural untuk analisis jalur

3. Spesifikasi model diagram yang sudah dibuat kemudian diberikan label (nama)

4. Identifikasi Model
 Dinilai dari: degrees of freedom (df)
df = ½ {p(p+1)} – k
p= jml variabel OBSERVED = 5
K = jml parameter (panah) dan varian variabel eksogen = 11
 Model teridentifikasi bila df > 0
 Model just identified bila df = 0
 Model tidak teridentifikasi bila df < 0
Bila model tidak teridentifikasi, maka tambahkan variabel dalam model atau ada efek yg
5. Test Goodness of Fit Model
Test Gooness of Fit dari model dapat dilakukan dengan beberapa cara:
a. Chi-square (cmin): model fit bila p > 0,05
b. RMSEA : model fit bila RMSEA < 0,08
c. AFGI: model fit bila AFGI > 0,9
6. Modifikasi Model (bila model tidak valid)
7. Uji Hipotesis dan Estimasi koefisien jalur (pengaruh langsung, tidak langsung dan total)
Kebermaknaan pengaruh dilihat dari uji ‘t’; pengaruh bermakna bila nilai p ≤ α
Lihat efek langsung, tidak langsung, dan total efek dari nilai standar yaitu: standardize total
effect, standardize direct effect dan standardize indirect effect.

Analisis Data
1. Membuka file dengan nama “data latihan path loyalitas.dta” pada STATA.
2. Membuat model persamaan struktural di dalam aplikasi STATA dengan langkah sebagai
berikut: Pilih menu Statistic – SEM – model building and estimation – kemudian gambar
model persamaan seperti gambar berikut.

Hubungkan kotak-kotak tersebut dengan menggunakan anak panah (searah) sehingga

tampilannya akan seperti gambar berikut

41
3. Melakukan spesifikasi model yaitu mengisi nama variabel observe di dalam kotak di atas.
Pengisian nama variabel dapat dilakukan dengan meng-klik setiap kotak dan memilih nama
variabel. Untuk lebih jelasnya dapat dilihat pada gambar di bawah.

Isi nama variabel disini, lakukan hal

yang sama untuk kotak lainnya

42
Setelah muncul kotak dialog di atas, klik tab Reporting kemudian beri checklist pada
pernyataan “Display standadized coefficients and values” lalu klik OK. Akan muncul nilai
estimasi parameter pada diagram. Selanjutnya, klik menu Estimation – Testing and Cis –
Direct and Indirect Effects – beri ceklist pada pernyataan “Report Standardized Effects”

43
Jika melihat pada model dan output STATA, harga tidak memiliki hubungan langsung yang
signifikan terhadap loyalitas karena memiliki nilai p > 0,05. Oleh karena itu, kita dapat
menghapus panah yang menghubungkan variabel harga dengan loyalitas pada model
persamaan.

Simpulan Hasil Analisis

Berdasarkan metode analisis jalur dapat diketahui bahwa produk dan layanan memiliki efek
langsung terhadap tingkat kepuasan dan loyalitas pelanggan. Sedangkan harga hanya memiliki
