PERSAMAAN STRUKTURAL:
I. ANALISIS JALUR
Johan Harlan
Pusat Studi Informatika Kedokteran
Universitas Gunadarma
Pemodelan Persamaan Struktural:
I. Analisis Jalur
Penulis : Johan Harlan
ISBN 978-602-9438-27-7
Penulis
v
DAFTAR ISI
Kata Pengantar v
Daftar Isi vii
Bab 1 Pendahuluan 1
Pengertian Dasar SEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
Struktur pada SEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Variabel Teramati dan Variabel Laten . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Variabel Endogen dan Eksogen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Beberapa Karakteristik Kekhususan SEM . . . . . . . . . . . . . . . . . . . . . . . . . 4
Program Komputer untuk SEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Lambang SEM dalam Kepustakaan dan Stata . . . . . . . . . . . . . . . . . . . . . . 6
vii
Uji Sobel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Notasi Jalur SEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
Estimasi Koefisien Jalur SEM dengan Stata . . . . . . . . . . . . . . . . . . . . . . . . 34
viii
Kepustakaan 89
Lampiran 1 Koefisien Korelasi 90
ix
Bab 1. Pendahuluan
BAB 1
PENDAHULUAN
1
Bab 1. Pendahuluan
3
Bab 1. Pendahuluan
eksogen ke suatu variabel endogen ataupun dari suatu variabel endogen ke variabel endogen
lain. Dalam pengertian ini variabel mediator (variabel perantara) dianggap sebagai variabel
endogen, sedangkan suku pengganggu (disturbance) adalah variabel eksogen. Tiap variabel
endogen memiliki suku pengganggu, yang selalu merupakan variabel laten. Variabel
endogen dalam SEM dapat berperan sebagai variabel dependen maupun independen. Dalam
contoh pada gambar 1.1, X 1 dan X 2 adalah variabel eksogen, sedangkan Y1 , Y2 , Y3 , dan Y4
4
Bab 1. Pendahuluan
- Dalam tahap analisis jika diperlukan untuk memenuhi persyaratan statistika, model boleh
direvisi, tetapi proses revisi model tidak boleh bertentangan dengan pengetahuan teoretis
di bidang substansi penelitian.
- SEM dapat mengkaji lebih daripada satu model dan model yang ternyata dapat
menjelaskan data dengan baik berdasarkan analisis SEM juga mungkin lebih daripada
satu.
- SEM dapat menganalisis variabel teramati maupun variabel laten. Sebagian besar teknik
statistika dibuat untuk menganalisis variabel teramati. Ada juga teknik statistika yang
dikhususkan untuk menganalisis variabel laten, tetapi SEM dapat menganalisis kedua
tipe variabel tersebut bersama-sama.
- SEM adalah teknik sampel besar. Untuk memperoleh hasil yang terpercaya, ukuran
sampel minimum ideal yang dianjurkan adalah 20 kali jumlah parameter, misalnya
model dengan 10 parameter dianjurkan menggunakan sampel berukuran 200.
- Estimasi pada SEM umumnya dilakukan dengan metode maximum likelihood (ML)
yang merupakan metode informasi-penuh (full-information method) yang menganalisis
seluruh persamaan dalam model sekaligus, berbeda misalnya dengan metode kuadrat
terkecil yang dapat dianggap sebagai metode informasi-parsial (partial-information
method) karena dalam tiap tahap hanya menganalisis satu persamaan.
- SEM kurang memberi penekanan pada uji statistik dalam pengertian sebagai uji
parameter dalam Statistika Umum. Didapatkan berbagai alasan yang menyebabkan uji
statistik demikian menjadi kurang penting dalam SEM, yang terutama yaitu karena SEM
dimaksudkan untuk meng-evaluasi keseluruhan model secara global, sedangkan uji
statistik sebagai uji parameter hanya menyangkut detil spesifik dalam model. Alasan
teknis lainnya yaitu karena SEM merupakan teknik sampel besar, sedangkan secara
teoretis sampel besar dapat mengakibatkan efek trivial dapat menjadi sangat bermakna
secara statistik. Uji statistik yang lazim dilakukan dalam SEM memiliki tujuan berbeda,
yaitu pengujian model antara lain dengan memperbandingkan matriks kovariansi data
dengan matriks kovariansi yang diprediksi oleh model yang diajukan peneliti, walaupun
ada juga uji statistik untuk pengujian parameter yang dianggap kurang penting.
5
Bab 1. Pendahuluan
Structural Relationships) yang dikembangkan oleh Jreskog & Srbom yang menggunakan
mode interaktif. Dalam perkembangan selanjutnya dikenal pula AMOS (Analysis of Moment
Structures) yang dikembangkan oleh SPSS Inc sebagai program aplikasi yang berdiri sendiri.
AMOS memiliki kemudahan karena dapat dijalankan dalam mode grafik dengan
menggunakan GUI (Graphical User Interface), walaupun dapat juga dijalankan dengan mode
batch.
Sekarang dikenal juga berbagai prosedur SEM yang merupakan bagian program
statistik komputer komprehensif, misalnya:
- Prosedur CALIS/TCALIS (Covariance Analysis and Linear Structural Equations) pada
SAS/STAT
- Prosedur RAMONA (Reticular Action Model or Near Approximation) pada SYSTAT.
- Prosedur SEPATH (Structural Equation Modeling and Path Analysis) pada
STATISTICA.
Berbagai prosedur ini umumnya harus dijalankan dalam mode batch (kecuali
SEPATH). Prosedur terbaru yang dibahas dalam buku ini yaitu prosedur sem (structural
equation modeling) yang didapatkan pada program statistik STATA. Prosedur sem ini baru
didapatkan pada STATA versi 12 yang diluncurkan pada tahun 2011. Prosedur sem pada
STATA 12 ini dapat dijalankan dengan mode grafik maupun interaktif.
6
Bab 1. Pendahuluan
Pada Stata, penulisan nama variabel laten diawali dengan huruf besar, kecuali
untuk suku pengganggu (butir 1.c)
c. Suku pengganggu:
Suku pengganggu ada untuk setiap variabel endogen, merupakan variabel laten
yang memiliki variansi, sedangkan variabel endogen itu sendiri tidak memiliki
variansi.
Pada Stata, variabel laten untuk sebuah variabel endogen dinamakan sebagai
e.nama_var_endogen, misalnya untuk variabel endogen sistolik, nama suku
pengganggunya adalah e.sistolik. Walaupun merupakan variabel laten, penulisan
nama suku pengganggu tidak diawali dengan huruf besar.
2. Efek antar-variabel:
a. Efek searah:
Efek searah suatu variabel terhadap variabel lainnya dinyatakan dengan lambang
anak panah searah (). Misalnya, efek searah variabel X terhadap variabel Y
dinyatakan sebagai X Y. Nilai yang dituliskan dekat anak panah pada model awal
menyatakan nilai kendala yang ditentukan peneliti pada penyusunan model ataupun
estimasi yang diperoleh dari data sampel sebagai koefisien regresi atau koefisien
jalur.
Pada pemodelan Stata, efek searah variabel X terhadap Y dituliskan sebagai sem (Y
< X) atau sem (X > Y).
b. Efek resiprokal:
Efek resiprokal antar dua variabel dinyatakan dengan lambang anak panah bolak-
balik ( ). Misalnya, efek resiprokal antar variabel Y1 dan Y2 dinyatakan sebagai
Y1 Y2 .
7
Bab 1. Pendahuluan
Pada pemodelan Stata dengan mode interaktif, keberadaan variansi tidak perlu
dicantumkan, walaupun diasumsikan semua variabel eksogen dan suku pengganggu
memiliki variansi.
4. Kovariansi dan korelasi:
Kovariansi atau korelasi dinyatakan dengan lambang anak panah berkepala-ganda,
yang berawal dan berakhir pada dua variabel berbeda ( ).
Kovariansi diasumsikan selalu ada antar variabel eksogen, walaupun tidak
digambarkan dalam model. Selain itu, kovariansi mungkin ada (tidak selalu, tergantung
model peneliti) antar suku pengganggu. Kovariansi tidak ditemukan antar variabel
endogen. Secara statistik, kovariansi dalam SEM disebut sebagai asosiasi tak-
teranalisis (unanalyzed association) atas dasar asumsi bahwa pada kovariansi antar dua
variabel terdapat variabel ketiga yang tak diketahui dan tak dianalisis yang menimbulkan
efek terhadap kedua variabel yang berkovariansi sekaligus.
Pada Stata, kovariansi dituliskan sebagai cov(var1*var2), misalnya kovariansi antar
variabel eksogen usia dan pendidikan dituliskan sebagai cov(usia*pendidikan),
sedangkan kovariansi antar suku pengganggu e.sistolik dan e.kolesterol dituliskan
sebagai cov(e.sistolik*e.kolesterol).
8
Bab 2. Telaah Ulang Analisis Regresi
BAB 2
TELAAH ULANG ANALISIS REGRESI
dan y = 0 + 1 x (2.2)
dan y = b0 + b1 x (2.2.a)
b .
1 1
Model dan persamaan garis regresi ganda (dengan 2 variabel independen X 1 dan X 2 )
masing-masing dinyatakan sebagai:
yi = 0 + 1 x1i + 2 x2i + i (2.3)
dan y = 0 + 1 x1 + 2 x2 (2.4)
9
Bab 2. Telaah Ulang Analisis Regresi
dan y = b0 + b1 x1 + b2 x2 (2.4.a)
Estimasi koefisien regresi pada regresi sederhana maupun ganda dilakukan dengan
metode kuadrat terkecil (ordinary least square; OLS). Salah satu asumsi yang penting bagi
OLS ialah tidak adanya korelasi antara variabel independen dengan suku residual variabel
dependen.
Contoh 2.1:
Misalkan dimiliki data hipotetis seperti terlihat pada tabel 2.1. Hasil regresi y terhadap
x1 diperlihatkan pada tabel 2.2.a, sedangkan hasil regresi y terhadap x1 dan x2 diperlihatkan
pada tabel 2.2.b.
No y x1 x2
1 116 49 240
2 152 48 209
3 134 55 210
4 132 49 171
5 130 50 255
6 118 52 232
7 136 48 147
8 108 59 268
9 108 59 231
10 128 52 199
Rerata y = 126.2 x1 = 52.1 x2 = 216.2
SD s y = 13.77 s1 = 4.23 s2 = 37.18
Tabel 2.2 Hasil analisis regresi untuk data hipotetis tabel 2.1
b SE(b) B t Nilai-p
Konstante 245.42 42.84 5.73 < 0.001
x1 2.29 0.82 0.70 2.79 0.024
2
n = 10; R = 0.49
10
Bab 2. Telaah Ulang Analisis Regresi
b SE(b) B t Nilai-p
Konstante 242.97 43.15 5.63 0.001
x1 1.81 0.97 0.55 1.87 0.104
x2 0.11 0.11 0.28 0.96 0.371
2
n = 10; R = 0.55
dan z y = B1 x1 (2.7)
dan estimasinya bk dalam analisis regresi dinamakan koefisien regresi, sedangkan nilai Bk
(beta) dalam analisis jalur disebut koefisien jalur (ada yang menyebutnya hanya sebagai path
/ jalur). Perhatikan bahwa ada kepustakaan yang menamakan k juga sebagai koefisien jalur,
11
Bab 2. Telaah Ulang Analisis Regresi
s1 : standar deviasi x1
s2 : standar deviasi x2
Contoh 2.2:
y y x x
Lihat kembali data hipotetis pada tabel 2.1. Dengan transformasi z y = ; z1 = 1 1
sy s1
x2 x2
; dan z2 = diperoleh data terstandardisasi seperti terlihat pada tabel 2.3.
s2
Berdasarkan hasil analisis regresi pada tabel 2.2, diperoleh model regresi tak-
standardisasi dan terstandardisasi seperti yang ditampilkan pada tabel 2.4.
Tabel 2.3 Contoh data dalam bentuk tak-terstandardisasi dan bentuk terstandardisasi
No y x1 x2 zy z1 z2
1 116 49 240 0.74 0.73 0.64
2 152 48 209 1.87 0.97 0.19
3 134 55 210 0.57 0.69 0.17
4 132 49 171 0.42 0.73 1.22
5 130 50 255 0.28 0.50 1.04
6 118 52 232 0.60 0.02 0.42
7 136 48 147 0.71 0.97 1.86
8 108 59 268 1.32 1.63 1.39
9 108 59 231 1.32 1.63 0.40
10 128 52 199 0.13 0.02 0.46
Rerata 126.2 52.1 216.2 0.00 0.00 0.00
SD 13.77 4.23 37.18 1.00 1.00 1.00
Tak-terstandardisasi Terstandardisasi
Regresi Model y = 0 + 1 x1 + z y = B1 z1 + z
sederhana
Estimasi y = 245.42 2.29 x1 + e z y = 0.70 z1 + ze
Regresi Model y = 0 + 1 x1 + 2 x2 + z y = B1 z1 + B2 z2 + z
ganda
Estimasi y = 242.97 1.81 x1 0.11 x2 + e z y = 0.55 z1 0.28 z2 + ze
12
Bab 2. Telaah Ulang Analisis Regresi
Var x = E x x
2
(2.8)
Cov x ; y = E x x y y (2.9)
i xi x
2
x =
Var (2.8.a)
n 1
i xi x yi y
x ; y=
Cov (2.9.a)
n 1
Jika variabel random x dan y masing-masing dikonversi menjadi bentuk terstandardisasi
z x dan z y , maka korelasi antara x dan y sama dengan kovariansi antara z x dan z y :
Corr x ; y = Cov z x ; z y (2.10)
Contoh 2.3:
Lihat data hipotetis pada tabel 2.1 dan bentuk terstandardisasinya pada tabel 2.3.
Matriks kovariansi dan korelasinya untuk data tak-standardisasi diperlihatkan pada tabel 2.5,
sedangkan matriks kovariansi dan korelasi untuk data terstandardisasi disajikan pada tabel
2.6. Perhatikan bahwa untuk data terstandardisasi, matriks kovariansinya identik dengan
matriks korelasi.
13
Bab 2. Telaah Ulang Analisis Regresi
Masukkan data hipotetis hubungan antara tekanan darah sistolik (y), usia (x1), dan
kadar kolesterol serum (x2) yang ada pada tabel 2.1 pada lembar isian (spreadsheet) Excel.
Simpan data pada folder D:\SEM\Data dengan nama sistolik.xls.
Perintah Stata:
Ambil file Excel sistolik.xls untuk dibuka dalam format Stata, selanjutnya simpan data
dalam format data Stata:
14
Bab 2. Telaah Ulang Analisis Regresi
Perintah import adalah perintah Stata untuk mengambil file data dalam format
non-Stata (umumnya file Excel) dan dibuka dalam format Stata. Perintah label adalah
perintah untuk memberi label bagi variabel tertentu. Setelah itu file masih harus disimpan
dalam format Stata dengan perintah save untuk memudahkan penggunaannya pada sesi
lebih lanjut.
Perintah regress adalah perintah Stata untuk melaksanakan analisis regresi linear,
baik sederhana maupun ganda. Perintah regress diikuti oleh nama variabel dependen,
dan selanjutnya disusul oleh nama variabel independen.
. regress y x1 x2
15
Bab 2. Telaah Ulang Analisis Regresi
Perintah use adalah perintah Stata untuk membuka file data Stata (file dengan
ekstensi *.dta). Opsi ,clear pada perintah use setelah nama dan jalur (path) file
yang akan dibuka merupakan perintah untuk menghapus semua isi file data Stata terakhir
yang masih terbuka dan ada dalam memori komputer. Opsi , beta pada perintah
regress setelah nama variabel independen merupakan perintah untuk menampilkan
koefisien beta, yaitu koefisien regresi terstandardisasi.
. regress y x1 x2, beta
16
Bab 2. Telaah Ulang Analisis Regresi
Model:
Persamaan:
mpg = + 1weight + 2weight2 + 3foreign + 1
. sysuse auto
. regress mpg weight c.weight#c.weight foreign
. regress, beta
Perintah sysuse adalah perintah untuk membuka file data Stata yang dipasok oleh
provider Stata dan disimpan dalam basis-data Stata pada saat meng-install program Stata.
Dengan perintah sysuse cukup dituliskan nama file yang akan dibuka tanpa perlu
menuliskan jalurnya. Pada perintah regress pertama di atas nama variabel dependen
dan independennya harus ditulis lengkap, namun dalam perintah regress kedua yang
17
Bab 2. Telaah Ulang Analisis Regresi
disertai opsi , beta nama-nama variabel tidak usah dituliskan lagi, asal perintah
regress kedua langsung diberikan setelah perintah regress pertama tanpa
diselingi perintah Stata lainnya.
Pembahasan lebih rinci tentang perintah-perintah Stata untuk analisis regresi linear
dapat dilihat pada Lampiran 2.
18
Bab 3. Konsep-konsep Dasar Analisis Jalur
BAB 3
KONSEP-KONSEP DASAR ANALISIS JALUR
1. Asumsi teoretis:
Asumsi kausalitas yang tergantung pada terpenuhinya persyaratan berikut:
a. Model dispesifikasikan dengan benar.
b. Ada hubungan teramati dan dapat diukur (observed and measurable relationship)
antara variabel independen X dan variabel dependen Y (ada korelasi antara X dan Y).
c. Ada urutan temporal: variabel independen X secara temporal harus terjadi
mendahului variabel dependen Y.
d. Tidak ada hubungan palsu (nonspurious relationship) antara variabel independen X
dan variabel dependen Y (hubungan teramati, dapat diukur, dan temporal antara X
dan Y tidak hilang dengan pengendalian terhadap efek variabel-variabel lain).
2. Asumsi statistika:
a. Asumsi yang terkait dengan regresi ganda: asumsi normalitas, homoskedastisitas,
dan linearitas.
19
Bab 3. Konsep-konsep Dasar Analisis Jalur
b. Besar hubungan antara dua variabel independen yang berkorelasi satu sama lain dan
tak-teranalisis direpresentasikan oleh koefisien korelasinya.
c. Pengukuran variabel endogen sekurang-kurangnya berskala interval.
d. Pengukuran variabel eksogen bersifat bebas-galat.
e. Arah hubungan kausal terspesifikasi dengan benar: apakah X menyebabkan Y (X
Y), Y menyebabkan X (Y X), atau terdapat hubungan resiprokal (X Y).
f. Bentuk distribusi diketahui: Bentuk distribusi probabilitas parameter
dispesifikasikan.
Pada model struktur kovariansi (SEM tanpa analisis rerata), parameter-nya adalah efek
langsung terhadap variabel endogen serta variansi dan kovariansi variabel eksogen. Efek
langsung yang dimaksud adalah efek yang besarnya yaitu nilai parameternya harus
diestimasi. Dengan demikian maka jumlah parameter q dapat ditentukan dengan
menghitung jumlah lambang , , dan dalam diagram SEM, yaitu jumlah efek langsung
searah (koefisien regresi), variansi, dan kovariansi.
Parameter model dapat bersifat bebas, terfiksasi, ataupun terkendala. Parameter bebas
(free parameter) harus diestimasi berdasarkan data yang ada. Parameter terfiksasi (fixed
parameter) dispesifikasikan nilainya sama dengan konstante tertentu. Parameter terkendala
(constrained parameter) harus diestimasi dalam batasan tertentu, namun nilainya tidak
terfiksasi sama dengan konstante tertentu. Dalam perhitungan jumlah parameter di atas,
parameter terfiksasi tidak diikutsertakan. Dua parameter yang dikendalakan memiliki nilai
yang sama tetapi tidak difiksasikan besar nilainya, diperhitungkan sebagai satu parameter
dalam menghitung jumlah parameter. Dalam pembahasan selanjutnya, istilah terfiksasi dan
terkendala ini akan seringkali saling dipertukarkan dengan pengertian yang sama.
Jika menyatakan jumlah variabel teramati dalam model, maka banyak nilai pada
diagonal matriks kovariansi dan di bawahnya, yang menyatakan banyak nilai variansi dan
kovariansi tak-berulang (nonredundant covariances; kovariansi unik) adalah:
+ ( 1) + ( 2) + . . . + 1
Banyak nilai ini dinamakan juga sebagai jumlah titik data (number of data points) untuk
model struktur kovariansi, yaitu:
1
p= (3.1)
2
20
Bab 3. Konsep-konsep Dasar Analisis Jalur
p : jumlah pengamatan
: jumlah variabel teramati dalam model
Selisih antara jumlah titik data dengan jumlah parameter merupakan derajat bebas
model, yaitu:
df M = p q (3.2)
Didapatkan dua tipe dasar model jalur yaitu model rekursif dan model non-rekursif.
Model rekursif adalah model jalur dengan seluruh hubungan antar-variabelnya bersifat
searah (efek searah) yang tidak membentuk loop tertutup dan seluruh suku pengganggunya
tak saling berkorelasi. Contoh model rekursif diperlihatkan pada gambar 3.1.a.
Model non-rekursif adalah model jalur yang memiliki sekurang-kurangnya satu loop
tertutup atau hubungan antar-variabel dua-arah (efek resiprokal) dan/atau suku pengganggu
yang saling berkorelasi. Contoh model non-rekursif diperlihatkan pada gambar 3.1.b. Selain
itu masih didapatkan model jalur yang bersifat rekursif parsial (gambar 3.2).
21
Bab 3. Konsep-konsep Dasar Analisis Jalur
Gambar 3.1 (a) Contoh model rekursif (kiri); (b) Contoh model non-rekursif (kanan)
Gambar 3.2 Contoh model rekursif parsial: (a) Pola bebas-busur (dianggap rekursif;
kiri) dan (b) Pola busur (dianggap non-rekursif; kanan)
Pola bebas-busur (bow-free pattern) seperti pada gambar 3.2 kiri adalah pola dengan
korelasi antara dua suku pengganggu tanpa adanya jalur antara variabel endogennya. Dalam
estimasi parameter, pola ini dapat diperlakukan seperti model rekursif. Pada pola busur (bow
pattern; gambar 3.2 kanan), korelasi antara dua suku pengganggu disertai dengan jalur antara
kedua variabel endogennya.
Identifikasi Model
22
Bab 3. Konsep-konsep Dasar Analisis Jalur
2. Tepat-teridentifikasi (just-identified): df M = 0
Ukuran Sampel
Perhatikan bahwa pada sebagian literatur tentang SEM, istilah ukuran sampel (jumlah
anggota sampel) memiliki pengertian yang berbeda dengan istilah jumlah pengamatan
(Kline, 2005). Seperti halnya dengan teknik statistika lainnya, sampel besar akan
menghasilkan estimasi dengan galat sampling (sampling error) lebih kecil daripada yang
dihasilkan oleh sampel kecil. Perhitungan ukuran sampel minimum yang dibutuhkan dapat
dilakukan berdasarkan analisis kekuatan (power analysis) yang diinginkan, namun secara
kasar ukuran sampel dapat dibedakan menjadi:
- Sampel kecil: N < 100
- Sampel sedang: 100 < N < 200
- Sampel besar: N > 200
23
Bab 3. Konsep-konsep Dasar Analisis Jalur
Ukuran sampel minimum yang dibutuhkan juga dapat dihitung secara kasar dengan
rasio 10 : 1 terhadap jumlah parameter yang diestimasi, misalnya model jalur dengan 20
parameter akan membutuhkan ukuran sampel minimum sebesar 200 kasus. Jackson (2003)
menganjurkan rasio ukuran sampel minimum ideal : parameter model sebesar 20 : 1 untuk
estimasi maximum likelihood.
Hubungan Antar-Variabel
Hubungan antara variabel terdiri atas efek kausal dan asosiasi non-kausal. Efek kausal
adalah efek yang diasumsikan menyatakan kausalitas (hubungan sebab-akibat) antar dua
variabel, dapat berupa efek langsung ataupun efek tak-langsung.
Efek langsung (direct effect) adalah efek kausal hipotetis suatu variabel terhadap
variabel kedua yang terjadi secara langsung tanpa melalui variabel ketiga. Efek searah suatu
variabel terhadap variabel lainnya dinyatakan dengan lambang anak panah (). Misalnya,
efek langsung variabel X terhadap variabel Y dinyatakan sebagai X Y. Besarnya efek
searah dinyatakan sebagai koefisien regresi (tak-terstandardisasi) atau koefisien jalur
(terstandardisasi).
Efek tak-langsung (indirect effect) adalah efek kausal hipotetis suatu variabel terhadap
variabel kedua yang terjadi melalui satu atau lebih variabel mediator (intervening variables).
Misalnya, efek tak langsung variabel X terhadap variabel Y2 yang terjadi melalui variabel
terhadap Y1 dan b12 menyatakan koefisien regresi Y1 terhadap Y2 , maka besar efek tak-
jika p X 1 menyatakan koefisien jalur X terhadap Y1 dan p12 menyatakan koefisien jalur Y1
24
BAB 4
ESTIMASI PARAMETER
Dengan teknik statistika regresi ganda, model di atas dapat diuraikan menjadi tiga
model regresi ganda:
Fit = A3 + B13 Exe + B23 Hard + D3 (4.1)
Ill = A5 + B15 Exe + B25 Hard + B35 Fit + B45 Str + D5 (4.3)
Keterangan:
1-Exe: Exercise; 2-Hard: Hardiness; 3-Fit: Fitness; 4-Str: Stress; 5-Ill: Illness.
Dalam notasi SEM, gambaran model jalur di atas biasanya disajikan lebih lengkap
seperti terlihat pada gambar 4.2, dengan beberapa tambahan:
a. Variansi untuk tiap variabel eksogen (Exe dan Hard)
b. Korelasi antar variabel eksogen (antara Exe dengan Hard)
c. Suku pengganggu (disturbance) untuk tiap variabel endogen ( DFi , DSt , dan DIl ).
d. Variansi untuk tiap suku pengganggu (variansi DFi , DSt , dan DIl ).
25
e. Koefisien jalur tiap suku pengganggu ke variabel endogennya yang terfiksasi menjadi
bernilai sama dengan 1 ( DFi Fit, DSt Str, dan DIl Ill).
Anak panah yang terputus-putus dimaksudkan untuk menyatakan perkiraan bahwa
koefisien regresi atau koefisien jalurnya bernilai sama dengan nol.
Estimasi matriks kovariansi dan korelasi data Illness yang diperoleh dengan metode
ML (maximum likelihood) dari sampel yang terdiri atas 373 orang mahasiswa diperlihatkan
pada tabel 4.1. Perhatikan bahwa dengan teknik statistika standar, variansi populasi 2
xi x
2
2
diestimasikan dengan variansi sampel s = , tetapi dengan metode ML variansi
n 1
xi x
2
cov( x1 ; x2 ) =
x1i x1 x2i x2 , namun dengan metode ML kovariansi populasi
n 1
26
xi x
2
2
Akibat penggunaan S = sebagai estimasi variansi populasi yaitu:
n
- Nilai estimasi rerata variabel terstandardisasi tidak sama dengan nol.
- Untuk model regresi terstandardisasi, nilai estimasi intersep tidak sama dengan nol.
b. Matriks korelasi
Variabel Exe Hard Fit Str Ill
1. Exe 1.00
2. Hard 0.03 1.00
3. Fit 0.39 0.07 1.00
4. Str 0.05 0.23 0.13 1.00
5. Ill 0.08 0.16 0.29 0.34 1.00
SD 66.50 38.00 36.80 67.00 62.48
Perhatikan bahwa kedua matriks ini saling berkaitan, dari matriks kovariansi dapat
diperoleh matriks korelasi, sebaliknya dari matrik korelasi dan nilai-nilai standar deviasi
dapat dihitung matriks kovariansi.
Contoh 4.1:
Dari nilai Cov (Exe ; Fit) = 954.41, Var (Exe) = 4422.25, dan Var (Fit) = 1354.24 dapat
dihitung nilai Corr (Exe ; Fit):
Cov Exe ; Fit
Corr (Exe ; Fit) =
SD Exe SD Fit
954.41
= = 0.39
4422.25 1354.24
Atau nilai Cov (Hard ; Str) dapat dihitung dari Corr (Hard ; Str) = 0.23, SD (Hard) =
38.00, dan SD (Str) = 67.00:
27
Cov (Hard ; Str) = Corr (Hard ; Str) . SD (Hard) . SD (Str)
= (0.23)(38.00)(67.00) = 585.58
Gambar 4.3 Model jalur Illness dengan nilai-nilai estimasi koefisien regresi (atas)
dan koefisien jalurnya (bawah)
28
Sebagai contoh, untuk data Illness di atas menghasilkan estimasi nilai-nilai koefisien
regresi (tak-terstandardisasi; atas) dan koefisien korelasi (terstandardisasi; bawah) seperti
terlihat pada gambar 4.3, sedangkan hasil penilaian kemaknaannya diperlihatkan pada tabel
4.2.
Parameter bij
SE bij pij
Exe Fit .217** .026 .392
Hard Fit .079 .046 .082
Exe Str .014 .055 .014
Hard Str .393** .089 .223
Fit Str .198 .099 .109
Exe Ill .032 .048 .034
Hard Ill .121 .079 .074
Fit Ill .442** .087 .260
Str Ill .271** .045 .291
Interpretasi terhadap nilai-nilai estimasi pada model jalur Illness tersebut ialah:
1. Besar efek langsung adalah sama dengan koefisien regresi pada model tak-
terstandardisasi dan koefisien jalur (nilai beta) pada model terstandardisasi.
Untuk contoh di atas, efek langsung b13 = 0.217 pada gambar 4.3 atas adalah estimasi
koefisien regresi Exe ke Fit (Exe Fit), sedangkan efek langsung p13 = 0.392 pada
gambar 3 bawah adalah estimasi koefisien jalur Exe ke Fit.
29
2. Variansi suku pengganggu pada model tak terstandardisasi merupakan estimasi bagi
variansi variabel endogen yang berkaitan yang tak dijelaskan oleh variabel eksogen yang
merupakan prediktornya.
Untuk contoh pada gambar 4.3 atas, variansi suku pengganggu DFi sebesar 1136.16
adalah estimasi variansi Fit yang tak dijelaskan oleh Exe dan Hard. Estimasi variansi Fit
seluruhnya, termasuk yang dijelaskan oleh Exe dan Hard, adalah 1354.24 (matriks 1.a).
3. Untuk model terstandardisasi, variansi variabel eksogen selalu sama bernilai 1,
sedangkan variansi suku pengganggu merupakan estimasi proporsi variansi variabel
endogen yang berkaitan yang tak dijelaskan oleh variabel eksogen prediktornya.
Untuk contoh pada gambar 4.3 bawah, variansi suku pengganggu DFi sebesar 0.841
adalah estimasi proporsi variansi Fit yang tak dijelaskan oleh Exe dan Hard. Nilai ini
sama besarnya dengan 1 RFi
2 2
, RFi adalah koefisien determinasi Fit pada regresinya
terhadap Exe dan Hard.
Dekomposisi Efek
Koefisien korelasi adalah ukuran kekuatan hubungan terstandardisasi antara dua
variabel kontinu. Pada SEM, hubungan antara variabel dapat dibedakan menjadi efek kausal
dan asosiasi non-kausal. Efek kausal adalah efek yang diasumsikan menyatakan kausalitas
(hubungan sebab-akibat) antar dua variabel, dapat berupa efek langsung ataupun efek tak-
langsung.
Efek langsung (direct effect) adalah efek kausal hipotetis suatu variabel terhadap
variabel kedua yang terjadi secara langsung tanpa melalui variabel ketiga. Efek searah suatu
variabel terhadap variabel lainnya dinyatakan dengan lambang anak panah (). Misalnya,
efek langsung variabel x terhadap variabel y digambarkan sebagai x y. Besarnya efek
searah dinyatakan sebagai koefisien regresi (tak-terstandardisasi) atau koefisien jalur
(terstandardisasi).
Efek tak-langsung (indirect effect) adalah efek kausal hipotetis suatu variabel terhadap
variabel kedua yang terjadi melalui satu atau lebih variabel mediator (intervening variables).
Efek tak langsung variabel x terhadap variabel y2 yang terjadi melalui variabel mediator y1
30
bx 2 : efek tak-langsung (tak-terstandardisasi) x terhadap y2
a1 y = r12 . p2 y (4.6)
Contoh 4.2:
Hubungan antara Exe dengan Ill (terstandardisasi) dapat dijabarkan sebagai berikut:
1. Efek kausal langsung (Exe Ill): 0.0340
2. Efek kausal tak-langsung:
- Exe Fit Ill : (0.392)(0.260) = 0.1019
- Exe Str Ill : (0.014)(0.291) = 0.0041
- Exe Fit Str Ill : (0.392)(0.109)(0.291) = 0.0124
31
3. Asosiasi non-kausal:
- Exe Hard Ill : (0.030)(0.074) = 0.0022
- Exe Hard Fit Ill : (0.030)(0.082)(0.260) = 0.0006
- Exe Hard Str Ill : (0.030)(0.223)(0.291) = 0.0019
- Exe Hard Fit Str Ill : (0.030)(0.082)(0.109)(0.291) = 0.0001
Uji Sobel
Uji Sobel adalah uji statistik untuk efek tak-langsung tak terstandardisasi antar dua
variabel yang terjadi melalui satu variabel mediator. Misalkan dalam hubungan x y1
koefisien regresi y1 ke y2 dengan standard error SE2 , maka statistik penguji untuk uji
hipotesis H 0 : 12 = 0 adalah:
b12
Z uji = (4.7)
SE12
yang berdistribusi Z (normal standar) dengan:
b2 SE1 b1 SE2
2 2 2 2
SE12 = (4.8)
Contoh 4.3:
Lihat kembali model jalur Illness pada gambar 4.3. Misalkan hendak diuji hipotesis H 0
melalui Exe Fit Ill dalam populasi. Estimasinya dari data sampel adalah b12 yang
nilainya diperoleh sebagai hasil perkalian b1 b2 , b1 menyatakan koefisien regresi Fit terhadap
32
b1 = 0.217 b2 = 0.442
(Nilai SE1 dan SE2 diperoleh dari keluaran program statistik komputer)
b12 = ( b1 )( b2 )
= (0.217)(0.442) = 0.096
b2 SE1 b1 SE2
2 2 2 2
SE12 =
b12
Z uji =
SE12
0.096
= = 4.34
0.022
33
Jalur untuk regresi ganda dituliskan sebagai:
(vardep< varind1) (vardep< varind2) (vardep< varind3)
atau: (varind1 >vardep) (varind2 >vardep)(varind3 >vardep)
atau: (vardep >varind1 varind2 varind3)
atau: (varind1 varind2 varind3 >vardep)
Misalnya:
(y < x1 ) (y < x 2 ) (y < x 3 )
Penulisan suku galat bersifat opsional, sehingga (y < x) dapat dibaca atau boleh
dituliskan sebagai:
(y < x e.y)
e.y : suku pengganggu (disturbance)
Jika koefisien jalur suku galat difiksasikan bernilai sama dengan satu, maka keadaan ini
dituliskan sebagai:
(y < x e.y@1)
Fiksasi juga dapat diberlakukan terhadap koefisien jalur salah satu prediktor, misalnya
p2Y = 2:
(y < x1 x 2 @2 x 3 )
Kendala dapat diberikan sedemikian hingga koefisien jalur prediktor X 2 bernilai sama
(y < x1 x 2 @b x 3 @b)
34
Contoh 4.4 (Membuat file data statistik ringkasan):
. clear all
. ssd init exe hard fit stress ill
Status:
observations: set
means: unset
variances or sd: unset
covariances or correlations: unset (required to be set)
Status:
observations: set
means: unset
variances or sd: set
covariances or correlations: unset (required to be set)
. ssd set correlations 1.00 \ .03 1.00 \ .39 .07 1.00 \ .05 .23 .13 1.00 \ .08 .16 .29 .34
1.00
(values set)
Status:
observations: set
means: unset
variances or sd: set
covariances or correlations: set
35
. label variable fit "fitness"
. save "D:\SEM\Data\illness.dta"
Perintah ssd init adalah perintah Stata untuk memulai pembuatan file ssd
(summary statistics data), yaitu file Stata yang tidak berisikan data lengkap, melainkan hanya
memuat jumlah anggota sampel dan matriks kovariansi atau korelasi. File ssd juga dapat diisi
dengan nilai-nilai rerata dan/atau variansi atau standar deviasi yang bersifat opsional.
Perintah ssd init disertai dengan nama-nama variabel dalam file ssd yang akan dibuat.
Pembuatan file ssd dilanjutkan dengan perintah ssd set observations yang
bersifat wajib untuk memasukkan data jumlah anggota sampel, perintah ssd set
means yang bersifat opsional untuk memasukkan nilai-nilai rerata, perintah ssd set
variances atau ssd set sd yang bersifat opsional untuk memasukkan nilai-nilai
variansi atau standar deviasi, serta perintah ssd set covariances atau ssd set
correlations yang bersifat wajib untuk memasukkan nilai-nilai matriks kovariansi atau
korelasi.
Berikutnya dengan Data Editor dapat dilihat isi file sebagaimana tersaji di bawah ini.
Tampak bahwa file tidak memuat data individu anggota sampel, melainkan data
ringkasannya. Baris pertama (_type 1) seharusnya menampilkan nilai-nilai rerata variabel,
tetapi di sini kosong karena memang tidak dimasukkan. Baris kedua (_type 2) memuat nilai-
nilai standar deviasi, sedangkan baris ketiga sampai dengan ketujuh menampilkan matriks
korelasi.
36
Contoh 4.5 (Membuat file ssd dari file data individual):
File ssd dapat diperoleh sebagai konversi file data individual. Pembuatan file ssd ini
terbagi atas 2 tahap, yaitu tahap persiapan dan tahap konversi data.
Tahap persiapan dimaksudkan untuk mempersiapkan data yang ada dalam file data
individual sebelum pelaksanaan konversi. Langkah-langkah untuk tahap persiapan terdiri
atas:
1. Buang variabel pada file data individual yang tak dibutuhkan untuk menganalisis file ssd.
3. Pastikan tidak ada nilai hilang (missing values) dalam data tersisa.
4. Pastikan semua variabel ada dalam skala yang wajar. Dianjurkan rasio rerata variabel
terbesar dengan variabel terkecil tidak melebihi 1000 atau 10,000. Jika ditemukan
keadaan demikian, dilakukan penskalaan untuk memperkecil nilai-nilai variabel terbesar.
5. Variabel baru yang mungkin akan dibutuhkan sebagai hasil transformasi variabel lama
harus dibuat pada tahap ini. Setelah dilakukan konversi menjadi file ssd tidak dapat lagi
dilakukan penambahan variabel baru.
6. Susun kembali variabel dalam urutan logis untuk mempermudah pengguna file ssd
memahami data.
7. Simpan data yang sudah siap untuk dikonversi ini dalam bentuk file data individual
biasa. File ini mungkin masih dibutuhkan suatu waktu kelak.
37
Pelaksanaannya diperlihatkan pada contoh berikut:
. use D:\SEM\Data\honolulu.dta
. keep bb tb usia glukosa kolest sistolik
. summarize
. ssd list
Observations = 100
38
Means:
usia bb tb bmi glukosa kolest sistolik
53.67 64.22 161.75 24.548406 152.14 216.96 130.1
Variances implicitly defined; they are the diagonal of the covariance matrix.
Covariances:
usia bb tb bmi glukosa kolest sistolik
26.021313
10.138788 74.132929
7.2247475 18.520202 31.320707
1.5991521 22.384707 2.6120988 9.3197763
60.470909 25.110303 33.186869 19.655521 2998.2024
21.552323 9.6957576 61.414141 22.584735 717.3996 1509.9782
23.992929 5.2949495 4.9646465 .54070781 307.4404 155.17576 449.72727
. save D:\SEM\Data\honolulu_ss.dta
file D:\SEM\Data\honolulu_ss.dta saved
Contoh 4.6 (Regresi linear ganda dengan SEM, contoh pada manual Stata):
Regresi linear ganda (multiple linear regression) adalah analisis regresi linear dengan
variabel independen lebih daripada satu.
Variabel:
variable name variable label
weight Weight (lbs.)
foreign Cartype
mpg Miliage (mpg)
Model:
Persamaan:
mpg = + 1weight + 2weight2 + 3foreign + 1
39
. sem (mpg < weight weight2 foreign)
Endogenous variables
Observed: mpg
Exogenous variables
Observed: weight weight2 foreign
Fitting target model:
Iteration 0: log likelihood = 1909.8206
Iteration 1: log likelihood = 1909.8206
Structural equation model
Estimation method = ml Number of obs = 74
Log likelihood = 1909.8206
OIM
Coef. Std. Err. z P>|z| [95% Conf. Interval]
Structural
mpg <
weight .0165729 .0038604 4.29 0.000 .0241392 .0090067
weight2 1.59e-06 6.08e-07 2.62 0.009 4.00e-07 2.78e.-06
foreign 2.2035 1.03022 2.14 0.032 4.222695 .1843056
_cons 56.53884 6.027559 9.38 0.000 44.72504 68.35264
Variance
e.mpg 10.19332 1.675772 7.385485 14.06865
LR test of model vs. Saturated: chi2(1) = 0.00, Prob > chi2 = 1.000
. sem, standardized
Structural equation model
Estimation method = ml Number of obs = 74
Log likelihood = 1909.8206
OIM
Coef. Std. Err. z P>|z| [95% Conf. Interval]
Structural
mpg <
weight 2.226321 .4950378 4.50 0.000 3.196577 1.256064
weight2 1.32654 .498261 2.66 0.008 .3499662 2.303113
foreign .17527 .0810378 2.16 0.031 .3341011 .0164389
_cons 9.839209 .9686872 10.16 0.000 7.940617 11.7378
Variance
e.mpg .308704 .0482719 .2272168 .4194152
LR test of model vs. saturated: chi2(1) = 0.00, Prob > chi2 = 1.000
Catatan:
- Nilai estimasi koefisien analisis regresi (regress) tepat sama dengan hasil
structural equation modeling (sem).
- Nilai estimasi standard error analisis regresi sedikit berbeda dengan hasil structural
equation modeling. Pada regress digunakan pembagi N k 1 = 74 3 1 = 70,
sedangkan pada sem digunakan pembagi N = 74, sehingga pada regress
40
diperoleh SE foreign sebesar 1.06, sedangkan pada sem SE foreign adalah 1.03.
Dengan demikian hasil perhitungan interval konfidensinya juga sedikit berbeda.
- Pada regress yang dilaporkan adalah statistik t, sedangkan pada sem dilaporkan
statistik z.
Variabel:
variable name variable label
mpg Miliage (mpg)
displacement Displacement (cu. in)
foreign Cartype
length Length (in.)
price Price
weight Weight (lbs.)
Model:
Persamaan:
price = 1 + 11foreign + 12mpg + 13displacement + 1
weight = 2 + 21foreign + 22length + 2
41
Endogenous variables
Observed: price weight
Exogenous variables
Observed: foreign mpg displacement length
Fitting target model:
Iteration 0: log likelihood = 2150.9983
Iteration 1: log likelihood = 2138.5739
Iteration 2: log likelihood = 2133.3461
Iteration 3: log likelihood = 2133.1979
Iteration 4: log likelihood = 2133.1956
Iteration 5: log likelihood = 2133.1956
Structural equation model
Estimation method = ml Number of obs = 74
Log likelihood = 2133.1956
OIM
Standardized Coef. Std. Err. z P>|z| [95% Conf. Interval]
Structural
price <
foreign 2940.929 724.7311 4.06 0.000 1520.482 4361.376
mpg 105.0163 57.93461 1.81 0.070 218.566 8.53347
displace~t 17.22083 4.5941 3.75 0.000 8.216558 26.2251
_cons 4129.866 1984.253 2.08 0.037 240.8022 8018.931
Structural
weight <
foreign 153.2515 76.21732 2.01 0.044 .302.6347 3.868275
length 30.73507 1.584743 19.39 0.000 27.62903 33.84111
_cons 2711.096 312.6813 8.67 0.000 3323.94 2098.252
Variance
e.price 4732491 801783.1 3395302 6596312
e.weight 60253.09 9933.316 43616.45 83235.44
Covariance
e.price
e.weight 209268 73909.54 2.83 0.005 64407.92 354128
LR test of model vs. saturated: chi2(3) = 38.86, Prob > chi2 = 0.0000
Tabel 4.3 Matriks korelasi model jalur pemulihan pasca bedah jantung
Variabel 1 2 3 4 5
1. Low Morale 1.00
2. Illness Symptoms .53 1.00
3. Neurological Dysfunction .15 .18 1.00
4. Poor Relationships .52 .29 .05 1.00
5. Diminished SES .30 .34 .23 .09 1.00
Sumber: Romney et al (1992); N = 469
42
Gambar 4.4 Model jalur alternatif non-hirarkis untuk
model pemulihan pasca bedah jantung.
Atas: Model psikosomatik; Bawah: Model medik konvensional
(Kline, 2005)
Status:
observations: set
means: unset
43
variances or sd: unset
covariances or correlations: unset (required to be set)
. ssd set correlations 1.00 \ .53 1.00 \ .15 .18 1.00 \ .52 .29 -.05 1.00 \ .30 .34 .23 .09 1.00
(values set)
Status:
observations: set
means: unset
variances or sd: unset
covariances or correlations: set
. save "D:\SEM\Data\cardiac_surgery.dta"
file D:\SEM\SEM\Data\cardiac_surgery.dta saved
. ssd describe
Summary statistics data from D:\SEM\Data\cardiac_surgery.dta
obs: 469
vars: 5 19 April 2012 19:02
variable name variable label
morale Low Morale
illness Illness Symptoms
neuro Neurological Dysfunctions
relation Poor Relationships
ses Dimisnished SES
. ssd list
Observations = 469
Means undefined; assumed to be 0
Variances undefined; assumed to be 1
Correlations:
morale illness neuro relation ses
1
.53 1
.15 .18 1
.52 .29 .05 1
.3 .34 .23 .09 1
44
Perbandingan kedua model, yaitu model psikosomatik dan model medik konvensional
dapat dilakukan dengan uji rasio likelihood (lihat petunjuk pada lampiran 4). Dua model jalur
ekivalen lainnya untuk data pemulihan pasca bedah jantung ini diperlihatkan pada gambar
4.5.
Gambar 4.5 Dua model jalur ekivalen untuk data pemulihan pasca bedah jantung
(Kline, 2005)
Pada contoh ini diperlihatkan pengestimasian efek langsung, efek tak langsung, dan
efek total sebuah prediktor terhadap outcome-nya. Perhatikan bahwa dalam kepustakaan cara
ini juga disebutkan sebagai pengestimasian efek variabel mediator, karena efek tak langsung
dengan sendirinya terjadi melalui variabel mediator (variabel perantara).
File data yang digunakan adalah cardiac_surgery.dta dengan model medik
konvensional (gambar 4.4 bawah).
. sem (ses < illness neuro) (morale < illness ses) (relation < neuro morale)
Endogenous variables
Observed: ses morale relation
Exogenous variables
Observed: illness neuro
Fitting target model:
Iteration 0: log likelihood = 3118.3779
Iteration 1: log likelihood = 3118.3779
Structural equation model
45
Estimation method = ml Number of obs = 469
Log likelihood = 3118.3779
OIM
Coef. Std. Err. z P>|z| [95% Conf. Interval]
Structural
ses <
illness .3085986 .0434047 7.11 0.000 .223527 .3936702
neuro .1744523 .0434047 4.02 0.000 .0893806 .2595239
morale <
ses .1354591 .0411649 3.29 0.001 .0547773 .2161408
illness .4839439 0411649 11.76 0.000 .4032621 .5646257
relation <
morale .5396419 .0394322 13.69 0.009 .4623563 .6169276
neuro .1309463 .0394322 3.32 0.001 .208232 .0536606
Variance
e.ses .8531295 .0557113 .7506363 .9696174
e.morale .7013733 .0458013 .6171118 .7971402
e.relation .711319 .0464508 .6258625 .8084438
LR test of model vs. saturated: chi2(3) = 3.25, Prob > chi2 = 0.3553
Tampak pada model medik konvensional terdapat dua variabel mediator, yaitu ses
sebagai mediator dalam efek ill terhadap morale [ill ses morale], serta ses
dan morale dalam efek neuro terhadap relation [neuro ses morale
relation].
Perintah sem dilanjutkan dengan perintah estat teffect untuk memperoleh estimasi efek
langsung dan tak langsung.
. estat teffects
Direct effects
OIM
Coef. Std. Err. z P>|z| [95% Conf. Interval]
Structural
ses <
illness .3085986 .0434047 7.11 0.000 .223527 .3936702
neuro .1744523 .0434047 4.02 0.000 .0893806 .2595239
morale <
ses .1354591 .0411649 3.29 0.001 .0547773 .2161408
illness .4839439 .0411649 11.76 0.000 .4032621 .5646257
neuro 0 (no path)
relation <
ses 0 (no path)
morale .5396419 .0394322 13.69 0.000 .4623563 .6169276
illness 0 (no path)
neuro .1309463 .0394322 3.32 0.001 .208232 .0536606
46
Indirect effects
OIM
Coef. Std. Err. z P>|z| [95% Conf. Interval]
Structural
ses <
illness 0 (no path)
neuro 0 (no path)
morale <
ses 0 (no path)
illness .0418025 .0139981 2.99 0.003 .0143667 .0692382
neuro .0236311 .0092812 2.55 0.011 .0054403 .0418219
relation <
ses .0730994 .0222143 3.29 0.001 .0295601 .1166387
morale 0 (no path)
illness .2837148 .0296103 9.58 0.000 .2256796 .34175
neuro .0127524 .0050945 2.50 0.012 .0027674 .0227373
Total effects
OIM
Coef. Std. Err. z P>|z| [95% Conf. Interval]
Structural
ses <
illness .3085986 .0434047 7.11 0.000 .223527 .3936702
neuro .1744523 .0434047 4.02 0.000 .0893806 .2595239
morale <
ses .1354591 .0411649 3.29 0.001 .0547773 .2161408
illness .5257464 .0391778 13.42 0.000 .4489593 .6025335
neuro .0236311 .0092812 2.55 0.011 .0054403 .0418219
relation <
ses .0730994 .0222143 3.29 0.001 .0295601 .1166387
morale .5396419 .0394322 13.69 0.000 .4623563 .6169276
illness .2837148 .0296103 9.58 0.000 .2256796 .34175
neuro .1181939 .0396211 2.98 0.003 .1958498 .0405381
Diperoleh efek total ill terhadap morale adalah .5257464, terdiri atas efek langsung
.4839439 dan efek tak langsung .0418025, sehingga proporsi efek total yang termediasi
adalah (.0418025)/(.5257464) = 0.08. Efek total neuro terhadap relation adalah
.1181939, terdiri atas efek langsung .1309463 dan efek tak langsung .0127524; proporsi
efek total yang termediasi adalah (.0127524)/( .1181939) = 0.11.
Jika hasil-hasil di atas terlalu panjang dan yang hendak diketahui hanya besar efek
langsung, efek tak langsung, dan efek total antar variabel, dapat digunakan perintah matrix
list seperti di bawah ini:
. sem (ses < illness neuro) (morale < illness ses) (relation < neuro morale)
47
. matrix list r(indirect)
r (indirect) [1, 9]
r (direct) [1, 9]
ses: ses: morale: morale: morale: relation: relation: relation: relation:
o. o. o.
illness neuro ses illness neuro ses morale illness neuro
r1 .30859859 .17445225 .13545907 .48394392 0 0 .53964194 0 .13094629
r (total) [1, 9]
ses: ses: morale: morale: morale: relation: relation: relation: relation:
illness neuro ses illness neuro ses morale illness neuro
r1 .30859859 .17445225 .13545907 .52574639 .02363114 .07309939 .53964194 .28371481 .11819394
48
BAB 5
UJI HIPOTESIS DAN PENILAIAN MODEL
ms
2
= 2 log Ls log L (5.1)
log L : log likelihood model peneliti
50
2. Akar rerata kuadrat galat aproksimasi (root mean square error of approximation;
RMSEA):
ms df ms
2
RMSEA = (5.2)
Ndf ms
yang secara aproksimasi berdistribusi khi-kuadrat non-sentral dengan parameter non-
ms = ms
2
df ms (5.3)
Jika data terbagi atas G subkelompok dengan nilai parameter yang berbeda antar
subkelompok, maka RMSEA adalah:
ms df ms G
2
RMSEA = (5.2.a)
Ndf ms
Interpretasi kasar bagi RMSEA yaitu:
- RMSEA < 0.05: Aproksimasi kesesuaian baik (close approximate fit)
- 0.05 < RMSEA < 0.08: Galat aproksimasi masih dapat diterima (reasonable error of
approximation)
- RMSEA > 0.10: Kesesuaian buruk (poor fit).
RMSEA juga merupakan indeks keburukan-suai seperti halnya ms
2
.
Interpretasi terhadap interval konfidensi 90% untuk RMSEA adalah sebagai berikut:
- Jika batas bawah interval kurang daripada 0.05, maka hipotesis H 0 : RMSEA <
0.05yang menyatakan bahwa model peneliti memiliki aproksimasi kesesuaian yang
baik dalam populasitidak ditolak.
- Jika batas atas interval tidak lebih daripada 0.10, maka hipotesis H 0 : RMSEA >
0.10yang menyatakan bahwa kesesuaian model dalam populasi burukditolak.
- Jika batas bawah interval kurang daripada 0.05 dan batas atas interval lebih daripada
0.10, maka diperoleh hasil yang kontroversial, sehingga dibutuhkan ukuran sampel
yang lebih besar untuk mendapatkan hasil yang lebih akurat.
3. Akar rerata kuadrat residual terstandardisasi (standardized root mean square
residual; SRMR):
Akar rerata kuadrat residual (root mean square residual; RMR) adalah ukuran rerata
nilai mutlak residual kovariansi. Residual kovariansi adalah selisih antara matriks
kovariansi teramati dengan matriks kovariansi yang diprediksikan. RMR merupakan
51
indeks keburukan-suai, RMR = 0 mengindikasikan kesesuaian model yang sempurna,
selanjutnya semakin besar nilai RMR semakin buruk kesesuaiannya.
Pada akar rerata kuadrat residual terstandardisasi (SRMR), residual adalah selisih antara
matriks korelasi teramati dengan matriks korelasi prediksi. Nilai SRMR yang kurang
daripada 0.10 umumnya dianggap cukup baik.
4. Indeks suai komparatif (comparative fit index; CFI):
Indeks suai komparatif merupakan salah satu indeks-suai inkremental (incremental fit
index), yaitu ukuran untuk menilai perbaikan relatif kesesuaian model peneliti
dibandingkan dengan model dasar (baseline model). Model dasar (model independen;
model nol) adalah model dengan asumsi bahwa kovariansi populasi antar variabel
teramati bernilai sama dengan nol. Berdasarkan asumsi ini, maka:
bs2 > ms
2
(5.4)
bs2 : khi-kuadrat rasio-likelihood model dasar vs model jenuh; bs2 = 2 log Ls log Lb
AIC = 2 log L + 2 df m (5.6)
52
AIC dan BIC adalah indeks-suai prediktif, digunakan dalam seleksi antar model non-
hirarkis yang diestimasi dari data yang sama. Model yang dipilih adalah model dengan
nilai AIC dan BIC terkecil, yang relatif memiliki kesesuaian lebih baik dan parameter
lebih sedikit. AIC adalah indeks-suai prediktif yang lebih baru dibandingkan dengan
BIC.
6. Indeks Tucker-Lewis (TLI):
Indeks Tucker-Lewis adalah:
TLI =
bs2 dfbs ms
2
df ms (5.8)
bs2
dfbs 1
Indeks Tucker-Lewis adalah indeks-suai inkremental seperti halnya CFI, namun CFI
merupakan indeks-suai inkremental yang lebih baru dibandingkan dengan TLI.
7. Koefisien determinasi (CD) dan koefisien korelasi-ganda kuadrat Bentler-Raykov
(mc2):
Kedua ukuran ini merupakan ukuran kebaikan-suai pada tingkat persamaan (equation-
level goodness-of-fit). Untuk model rekursif, koefisien determinasi dan koefisien
korelasi-ganda kuadrat Bentler-Raykov keduanya bernilai sama, yaitu kuadrat nilai
koefisien korelasi ganda (multiple-correlation coefficient; mc) dan diinterpretasikan
sebagai proporsi variansi variabel dependen yang dijelaskan oleh prediktornya:
CD = mc2 = mc2 (5.9)
Pada model non-rekursif, CD dan mc2 memiliki nilai berbeda, bahkan CD dapat bernilai
negatif. Untuk model non-rekursif dianjurkan untuk menggunakan mc2 = mc2 sebagai
ukuran kebaikan-suai pada tingkat persamaan.
Pada tabel 5.1 diperlihatkan beberapa nilai statistik suai hasil analisis SEM terhadap
kedua model jalur alternatif non-hirarkis pemulihan pasca bedah jantung (gambar 4.4 pada
bab 4). Nilai-nilai statistik suai ini digunakan untuk memilih yang terbaik di antara kedua
model. Tampak bahwa kesesuaian menyeluruh (overall fit) model medik konvensional lebih
baik daripada model psikosomatik, walaupun model psikosomatik bersifat lebih parsimoni.
Selain itu, nilai AIC model medik konvensional juga lebih kecil daripada nilai AIC model
psikosomatik.
53
Tabel 5.1 Beberapa nilai statistik suai untuk perbandingan
model jalur alternatif non-hirarkis pemulihan pasca bedah jantung
df ms 5 3
p 0.000 0.355
RMSEA (90% CI) 0.123 (0.090-0.159) 0.013 (0.000-0.080)
AIC 6293.999 6260.756
CFI 0.907 0.999
SRMR 0.065 0.016
Perintah sem:
. sysuse auto
. estat gof, stats (all)
54
Information criteria
AIC 3827.641 Akaikes information criterion
BIC 3836.858 Bayesian information criterion
Baseline comparison
CFI 1.000 Comparative fit index
TLI 1.036 Tucker-Lewis index
Size of residuals
SRMR 0.000 Standardized root mean squared residuals
CD 0.691 Coefficient of determination
. estat eqgof
Variance
depvars fitted predicted residuals R-squared mc mc2
observed
mpg 33.01972 22.8264 10.19332 .691296 .8314421 .691296
overall .691296
Perintah estat gof adalah perintah Stata untuk melakukan uji kebaikan-suai
(goodness-of-fit). Dengan perintah estat gof akan disajikan hasil uji rasio likelihood.
Opsi , stats(all) menambahkan tampilan dengan nilai RMSEA berikut interval
konfidensi 90% dan nilai p-nya, kriteria informasi Akaike dan Bayes (AIC dan BIC), kedua
indeks-suai komparatif (CFI) dan indeks Tucker-Lewis (TLI), serta SRMR dan CD (koefisien
determinasi).
OIM
Coef. Std. Err. z P>|z| [95% Conf. Interval]
Structural
fit <
exe .2158195 .0260036 8.30 0.000 .1648535 .2667856
stress <
hard .4055263 .0875636 4.63 0.000 .5771478 .2339049
ill <
fit .4244997 .0792709 5.36 0.009 .5798678 .2691316
stress .2867521 .0435398 6.59 0.000 .2014156 .3720887
Variance
e.fit 1145.27 82.65273 994.2089 1319.283
e.stress 4240.46 306.0289 3681.144 4884.759
e.ill 3204.201 231.2433 2781.567 3691.05
LR test of model vs. saturated: chi2(5) = 11.44, Prob > chi2 = 0.0434
56
. estat gof
Fit statistic Value Description
Likelihood ratio
chi2_ms (5) 11.435 model vs. saturated
p > chi2 0.043
chi2_bs (9) 170.492 baseline vs. saturated
p > chi2 0.000
Pada kolom Description tampak adanya istilah model (model peneliti), saturated
(model jenuh), dan baseline (model dasar). Jumlah parameter pada model peneliti adalah
10, terdiri atas 4 efek langsung, 5 variansi, dan 1 kovariansi. Dengan 5 variabel teramati,
jumlah titik data adalah (5)(6)/2 = 15, sehingga derajat bebas model peneliti di atas adalah 15
10 = 5 (lebih-teridentifikasi). Log likelihhood model peneliti adalah 10237.61.
Model jenuh adalah model mereproduksikan secara sempurna seluruh nilai variansi dan
kovariansi. Perintah untuk menghasilkan model jenuh pada Stata adalah sebagai berikut:
OIM
Standardized Coef. Std. Err. z P>|z| [95% Conf. Interval]
Variance
exe 4410.734 318.3173 3828.959 5080.904
hard 1440.24 103.9403 1250.272 1659.071
fit 1350.713 97.47934 1172.554 1555.942
stress 4477.31 323.122 3886.753 5157.596
ill 3893.584 280.9952 3380.021 4485.179
Covariance
exe
hard 75.61258 128.6775 0.59 0.557 327.8158 176.5906
fit 951.9226 133.6954 7.12 0.000 689.8844 1213.961
stress 222.1949 227.06 0.98 0.328 667.2242 222.8345
ill 331.528 212.1534 1.56 0.118 747.3409 84.28496
57
Covariance
hard
fit 97.63308 71.35013 1.37 0.171 42.2106 237.4768
stress 584.0551 132.9701 4.39 0.000 844.6716 323.4385
ill 378.8891 122.3814 3.10 0.002 618.7523 139.0259
Covariance
fit
stress 319.6933 126.5504 2.53 0.012 567.7276 71.65897
ill 665.0501 121.85 5.46 0.000 903.8717 426.2286
Covariance
stress
ill 1419.588 225.0464 6.31 0.000 978.5051 1860.671
Pada model jenuh, dengan 5 variabel teramati jumlah titik data tetap 15. Jumlah
parameter juga 15, terdiri atas 5 variansi dan 10 kovariansi, sehingga derajat bebas pada
model jenuh selalu sama dengan nol (tepat teridentifikasi). Model jenuh ini akan
mereproduksi seluruh nilai-nilai variansi dan kovariansi secara sempurna, dalam arti kata
matriks kovariansi yang dihasilkan model jenuh akan tepat sama dengan matriks kovariansi
data sampel. Log likelihood model jenuh adalah 10231.893.
Untuk menguji seberapa baik model peneliti dibandingkan dengan model jenuh,
ukurannya adalah minus dua kali selisih log likehood kedua model; 2*(10237.61
10231.893) = 11.435 yang berdistribusi khi-kuadrat dengan derajat bebas 5 0 = 5 (p =
0.043).
Model dasar (baseline model) pada Stata adalah model yang mencakup variansi
seluruh variabel teramati beserta kovariansi antar variabel eksogen teramati (menurut model
peneliti). Perhatikan bahwa dalam versi Stata ini model dasar tidak sama dengan model nol.
Dalam model peneliti, variabel eksogen adalah Exercise dan Hardiness, sehingga
kovariansi pada model dasar hanya kovariansi antara kedua variabel ini. Dengan analisis sem
diperoleh:
. sem (< exe hard fit stress ill), covstr (exe fit stress ill, diagonal) covstr (hard fit stress ill, diagonal)
Exogenous variables
Observed: exe hard fit stress ill
58
Fitting target model:
Iteration 0: log likelihood = 10317.139
Iteration 1: log likelihood = 10317.139
Structural equation model
Estimation method = ml Number of obs = 384
Log likelihood = 10317.139
( 1) [cov(exe,fit)]_cons = 0
( 2) [cov(exe,stress)]_cons = 0
( 3) [cov(exe,ill)]_cons = 0
( 4) [cov(hard,fit)]_cons = 0
( 5) [cov(hard,stress)]_cons = 0
( 6) [cov(hard,ill)]_cons = 0
( 7) [cov(fit,stress)]_cons = 0
( 8) [cov(fit,ill)]_cons = 0
( 9) [cov(stress,ill)]_cons = 0
OIM
Standardized Coef. Std. Err. z P>|z| [95% Conf. Interval]
Variance
exe 4410.734 318.3173 3828.959 5080.904
hard 1440.24 103.9403 1250.272 1659.071
fit 1350.713 97.47934 1172.554 1555.942
stress 4477.31 323.122 3886.753 5157.596
ill 3893.584 280.9952 3380.021 4485.179
Covariance
exe
hard 75.61258 128.6775 0.59 0.557 327.8158 176.5906
fit 0 (constrained)
stress 0 (constrained)
ill 0 (constrained)
Covariance
hard
fit 0 (constrained)
stress 0 (constrained)
ill 0 (constrained)
Covariance
fit
stress 0 (constrained)
ill 0 (constrained)
Covariance
stress
ill 0 (constrained)
59
LR test of model vs. saturated: chi2(9) = 170.49, Prob > chi2 = 0.0000
Pada model dasar, jumlah titik data adalah 15, sedangkan jumlah parameter 6, yaitu
lima variansi dan satu kovariansi. Derajat bebas model adalah 15 6 = 9. Log likelihood
model dasar adalah 10317.139.
Untuk menguji seberapa baik model dasar dibandingkan dengan model jenuh, dihitung
minus dua kali selisih log likelihood kedua model, yaitu 2*(10317.139 10231.893) =
170.492 yang berdistribusi khi-kuadrat dengan derajat bebas 9 0 = 9 (p < 0.001).
Walaupun model peneliti tidak sesuai sepenuhnya dengan model jenuh ( 2 = 11.435; p
= 0.043), kesesuaiannya ini masih jauh lebih baik daripada kesesuaian model dasar dengan
model jenuh ( 2 = 170.492; p < 0.001).
Perintah sem:
. estat gof, stats (all)
60
CFI 0.860 Comparative fit index
TLI 0.579 Tucker-Lewis index
Size of residuals
SRMR 0.046 Standardized root mean squared residuals
CD 0.932 Coefficient of determination
. estat eqgof
Variance
depvars fitted predicted residuals R-squared mc mc2
observed
price 7478595 2746103 4732491 .3671951 .6059663 .3671951
weight 581472.1 521219 60253.09 .8963784 .9467726 .8963784
overall .931919
61
Gambar 5.1 Contoh empat model jalur ekivalen (Romney et al, 1992)
Perhatikan bahwa substitusi dengan efek resiprokal akan membuat suatu model rekursif
menjadi non-rekursif, sehingga substitusi ini hanya boleh dilakukan jika model baru yang
dihasilkan oleh substitusi tetap teridentifikasi. Substitusi juga tidak boleh mengakibatkan
dihasilkannya suatu model baru yang non-plausibel. Model jalur sederhana mungkin hanya
memiliki beberapa versi ekivalen, namun model yang kompleks mungkin memiliki ratusan
atau bahkan ribuan versi ekivalennya. Walaupun demikian, yang perlu dipertimbangkan oleh
peneliti hanyalah beberapa versi ekivalen yang secara substantif dinilai bermakna.
Contoh suatu model original dengan tiga versi ekivalennya yang dibentuk menurut
aturan pergantian Lee-Hersberger tanpa disertai suku pengganggunya diperlihatkan pada
gambar 5.1 (Romney et al, 1992).
62
BAB 6
PEMODELAN SEM DALAM MODE GRAFIK
PADA STATA
Selain Standard Toolbar seperti yang didapatkan pada semua program berbasis
Windows, di atas kanvas dan di bawah Standard Toolbar terdapat Contextual
Toolbar, sedangkan di sisi kiri kanvas terdapat Tools Toolbar (lihat gambar 6.2).
63
Tools Toolbar akan langsung muncul pada saat kanvas SEM Builder terbuka,
sedangkan Contextual Toolbar baru tampak Tools Toolbar mulai digunakan
dalam pemodelan.
64
Undo dapat dihapus/dibatalkan perintah terakhir yang pernah diberikan terhadap
area tersebut.
65
5. Penggambaran model dengan 1 variabel dependen tanpa adanya efek tak-langsung
seperti pada model jalur auto di atas (model regresi ganda) dapat juga dilakukan
66
- Intersep untuk model regresi ganda, tercantum dalam lambang untuk variabel
endogen (dependen).
intersep model regresi ganda 57
- Variansi suku pengganggu untuk variabel endogen, tercantum di samping lambang
suku pengganggu .
Variansi 1 10
8. Untuk mengganti hasil dalam bentuk tak-terstandardisasi menjadi bentuk
terstandardisasi, klik View > Standardized Estimates pada Standard
Toolbar.
9. Hasil dalam bentuk penyajian yang lebih rinci dapat dilihat pada jendela Result pada
Stata.
67
BAB 7
MODEL STRUKTURAL NON-REKURSIF
68
Sebaliknya, model non-rekursif mungkin tak teridentifikasi walaupun jumlah observasi lebih
besar daripada jumlah parameter bebas dan seluruh variabel laten berskala interval.
Persyaratan identifikasi pada model struktural non-rekursif dibedakan menjadi syarat
perlu (necessary condition) dan syarat cukup (sufficient condition). Syarat perlu pada model
non-rekursif dinamakan kondisi order (order condition) dan syarat cukup dinamakan
kondisi rank (rank condition).
Kondisi Order
Kondisi order terpenuhi, jika untuk setiap variabel endogen, jumlah variabel
eksklusinya sama dengan atau lebih besar daripada jumlah seluruh variabel endogen
dikurangi satu:
nexc > nend 1 (7.1)
Variabel eksklusi (excluded variable) suatu variabel endogen adalah variabel dalam
model yang tidak memiliki efek langsung (direct effect) terhadap variabel endogen tersebut
(bukan merupakan prediktornya).
Kondisi order (order condition) merupakan syarat perlu (necessary condition) bagi
identifikasi suatu model, namun bukan merupakan syarat cukup (sufficient condition).
Dengan demikian maka untuk seluruh variabel endogen dipenuhi syarat nexc > nend 1,
sehingga kondisi order untuk model ini terpenuhi.
69
Kondisi Rank
Kondisi rank terpenuhi untuk suatu variabel endogen, jika rank matriks reduksinya
sama dengan atau lebih besar daripada jumlah seluruh variabel endogen dikurangi satu:
rk > nend 1 (7.2)
70
1. Matriks sistem adalah:
X1 X2 X3 Y1 Y2 Y3
Y1 1 0 0 1 0 1
Y2 0 1 0 1 1 0
Y3 0 0 1 0 1 1
2. Coret semua entri pada baris pertama serta entri pada kolom setiap nilai 1.
X1 X2 X3 Y1 Y2 Y3
Y1 1 0 0 1 0 1
Y2 0 1 0 1 1 0
Y3 0 0 1 0 1 1
Matriks pada No. 3 di atas yang merupakan matriks reduksi bagi variabel endogen Y1
memiliki dua baris, sehingga rank-nya adalah rk = 2. Karena nend 1 = 2, maka persyaratan
rk > nend 1 terpenuhi bagi variabel endogen Y1 . Selanjutnya prosedur yang sama masih
Misalkan pula efek terstandardisasi Y1 terhadap Y2 adalah p12 = 0.40 dan efek
secara teoretis. Besar efeknya adalah p12 . p21 + p12 . p21 . p12 . p21 + p12 . p21 . p12 . p21 . p12 . p21 + .
. . , dan seterusnya, yang nilainya adalah (0.40)(0.20) + (0.40)(0.20)(0.40)(0.20) +
(0.40)(0.20) (0.40)(0.20)(0.40)(0.20) + . . . dengan kelanjutan yang dengan cepat akan
mendekati nol, sehingga diasumsikan mencapai keseimbangan.
71
Korelasi Ganda Kuadrat
Pada model rekursif, koefisien determinasi dan koefisien korelasi-ganda kuadrat
Bentler-Raykov memiliki nilai yang sama dan keduanya dapat dipakai sebagai ukuran
proporsi variansi variabel dependen yang dijelaskan oleh prediktornya. Sebaliknya, pada
model non-rekursif keduanya memiliki nilai yang berbeda, sebagai ukuran proporsi variansi
variabel dependen yang dijelaskan oleh prediktornya dianjurkan hanya menggunakan
koefisien korelasi-ganda kuadrat Bentler-Raykov.
Contoh 7.3:
Misalkan dimiliki data longitudinal karakteristik 84 orang ibu di masa muda mereka,
yaitu agression, withdrawal, education, dan maternal age, serta karakteristik anak mereka
10-15 tahun sesudahnya, yaitu internalization dan externalization (Cooperman, 1996). Data
diberikan dalam matriks korelasi beserta standar deviasi untuk tiap variabel (tabel 7.1).
Model jalur non-rekursif untuk data ini diperlihatkan pada gambar 7.2.
Variabel 1 2 3 4 5 6
Karakteristik ibu
1. aggression 1.00
2. withdrawal .19 1.00
3. education .16 .20 1.00
4. maternal age .37 .06 .36 1.00
Karakteristik anak
5. internalization .06 .05 .03 .25 1.00
6. externalization .13 .06 .09 .28 .41 1.00
SD 1.09 1.03 2.17 2.33 .28 .36
Sumber: Cooperman (1996); N = 84
= 21 19 = 2. Walaupun derajat bebas model df M > 0, untuk model non-rekursif masih harus
diperiksa kondisi order dan rank yang ternyata terpenuhi, sehingga model ini dapat
dinyatakan teridentifikasi (atau tepatnya, lebih-teridentifikasi).
72
Gambar 7.2 Model jalur non-rekursif hubungan transgenerasi
pada permasalahan penyesuaian diri
Hasil analisis SEM dengan program komputer diperlihatkan pada tabel 7.2.
Interpretasinya antara lain yaitu, wanita yang sifat agresinya (aggression) satu SD di atas
rerata cenderung melahirkan anak pertama pada usia (age) kurang-lebih sepertiga SD (.380)
di bawah rerata. Ibu yang melahirkan anak pertama pada usia (age) satu SD di atas rerata
diasosiasikan memiliki tingkat pendidikan (education) kurang-lebih sepertiga SD (.340) di
atas rerata. Tingkat pendidikan (education) juga dipengaruhi oleh sifat menutup diri
(withdrawal), wanita yang nilai withdrawal-nya satu SD di atas rerata memiliki tingkat
education kurang-lebih dua persepuluh (.180) di bawah rerata. Kemaknaan statistik di sini
tidak terlalu diperhatikan karena kekuatan analisis statistik (statistical power) yang dapat
diperkirakan rendah dengan ukuran sampel yang kecil (N = 84).
a. Efek langsung
Parameter bij
SE bij pij
aggr age .812** .304 .380
educ age .065 .648 .061
with educ .378 .215 .180
age educ .317 .256 .340
aggr ext .032 .035 .097
educ ext .003 .019 .015
age ext .039* .018 .248
with int .005 .027 .018
educ int .008 .015 .065
age int .033* .014 .275
73
b. Variansi dan kovariansi pengganggu
Parameter Var (D) SE (D) Var (Z)
Dage 4.904* 2.480 .457
Deduc 3.949** .613 .839
Dage Deduc .304 2.874 .069
Dext .120** .019 .923
Dint .073** .011 .936
Dext Dint .035** .011 .379
*: p < .05; **: p < .01
Model:
74
Persamaan:
f_occasp = 1 + 11r_ses + 12f_ses + 13f_intel + 14r_occasp + 1
r_occasp = 2 + 21r_intel + 22r_ses + 23f_ses + 24f_occasp + 2
Perintah sem:
. use http://www.stata-press.com/data/r12/sem_sm1
. sem (r_occasp < f_occasp r_intel r_ses f_ses)
> (f_occasp < r_occasp f_intel f_ses r_ses),
> cov (e.r_occasp*e.f_occasp) standardized
Endogenous variables
Observed: r_occasp f_occasp
Exogenous variables
Observed: r_intel r_ses f_ses f_intel
Fitting target model:
Iteration 0: log likelihood = 2617.0489
Iteration 1: log likelihood = 2617.0489
Structural equation model
Estimation method = ml Number of obs = 329
Log likelihood = 2617.0489
OIM
Standardized Coef. Std. Err. z P>|z| [95% Conf. Interval]
Structural
r_occ~p <
f_occasp .2773441 .1281904 2.16 0.031 .0260956 .5285926
r_intel .2854766 .05 5.71 0.000 .1874783 .3834748
r_ses .1570082 .0520841 3.01 0.003 .0549252 .2590912
f_ses .0973327 .060153 1.62 0.106 .020565 .2152304
Structural
f_occ~p <
r_occasp .2118102 .156297 1.36 0.175 .0945264 .5181467
r_ses .0794194 .0587732 1.35 0.177 .0357739 .1946127
f_ses .1681772 .0537199 3.13 0.002 .062888 .2734663
f_intel .3693682 .0525924 7.02 0.000 .2662891 .4724474
Variance
e.r_occasp .6889244 .0399973 .6148268 .7719519
e.f_occasp .6378539 .039965 .5641425 .7211964
Covariance
e.r_occasp
e.f_occasp .2325666 .2180087 1.07 0.286 .6598558 .1947227
75
Contoh 7.5 (Estimasi statistik-suai dan kebaikan-suai, manual Stata):
Population error
RMSEA 0.402 Root mean squared error of approximation
90% CI, lower bound 0.295
upper bound 0.519
pclose 0.000 Probability RMSEA <= 0.05
Information criteria
AIC 4286.391 Akaikes information criterion
BIC 4309.432 Bayesian information criterion
Baseline comparison
CFI 0.860 Comparative fit index
TLI 0.579 Tucker-Lewis index
Size of residuals
SRMR 0.046 Standardized root mean squared residuals
CD 0.932 Coefficient of determination
. estat eqgof
Variance
depvars fitted predicted residuals R-squared mc mc2
observed
price 7478595 2746103 4732491 .3671951 .6059663 .3671951
weight 581472.1 521219 60253.09 .8963784 .9467726 .8963784
overall .931919
76
Contoh 7.6 (Input data korelasi):
Perintah sem:
. clear all
. ssd init aggression withdrawal education age internal external
Status:
observations: set
means: unset
variances or sd: unset
covariances or correlations: unset (required to be set)
Status:
observations: set
means: set
variances or sd: unset
covariances or correlations: unset (required to be set)
Status:
observations: set
means: set
variances or sd: set
covariances or correlations: unset (required to be set)
. ssd set correlations 1.00 \ .19 1.00 \ -.16 -.20 1.00 \ -.37 -.06 .36 1.00 \ -.06 -.05 -.03 -.25 1.00 \ .13 -
.06 -.09 -.28 .41 1.00
(values set)
77
Status:
observations: set
means: set
variances or sd: set
covariances or correlations: set
. save "D:\SEM\Data\transgenerational_relation.dta"
Contoh 7.7:
Pada contoh ini diperlihatkan hasil estimasi parameter untuk data pada contoh 7.6.
Perintah sem:
. clear all
. use "D:\SEM\Data\transgenerational_relation.dta"
. sem (age < aggression education) (education < withdrawal age) (external < aggression age
education) (internal < withdrawal age education), cov(aggression*withdrawal e.age*e.education
e.external*e.internal)
Endogenous variables
Exogenous variables
78
OIM
Coef. Std. Err. z P>|z| [95% Conf. Interval]
Structural
age <
education .065209 .6445339 0.10 0.919 1.328472 1.198054
aggression .8116886 .3021317 2.69 0.007 1.403856 .2195214
_cons 21.69278 7.115742 3.05 0.002 7.746185 35.63938
education <
age .3168497 .2547603 1.24 0.214 .1824713 .8161708
withdrawal .3783538 .2133176 1.77 0.076 .7964486 .039741
_cons 4.530227 5.262017 0.86 0.389 5.783138 14.84359
external <
age .0386485 .0183447 2.11 0.035 .0746035 .0026935
education .002547 .0186604 0.14 0.891 .0340266 .0391206
aggression .0315864 .035112 0.90 0.368 .0372318 .1004046
_cons .9012039 .3729462 2.42 0.016 .1702429 1.632165
internal <
age .0329934 .0135667 2.43 0.015 .0595835 .0064032
education .008388 .0148052 0.57 0.571 .0206297 .0374056
aggression .0052084 .0272522 0.19 0.848 .0586217 .0482049
_cons .6699444 .2710048 2.47 0.013 .1387848 1.201104
Mean
aggression .51 .1182187 4.31 0.000 .2782956 .7417044
withdrawal .47 .1117113 4.21 0.000 .2510499 .6889501
Variance
e.age 4.845168 2.435842 1.808752 12.97893
e.education 3.901594 .602466 2.882727 5.280568
e.external .1183555 .0183256 .0873761 .1603187
e.internal .0721754 .0111497 .0533207 .0976974
aggression 1.173956 .1811453 .867578 1.588529
withdrawal 1.04827 .1617516 .7746937 1.418458
Covariance
e.age
e.education .3003766 2.82262 0.11 0.915 5.231856 5.832609
e.external
e.internal .0350529 .0109452 3.20 0.001 .0136006 .0565052
aggression
withdrawal .2107736 .1232037 1.71 0.087 .0307012 .4522484
LR test of model vs. saturated: chi2(2) = 2.99, Prob > chi2 = 0.2237
79
BAB 8
STRUKTUR RERATA
b. Struktur rerata
Exe Hard Fit Str Ill
Rerata 40.90 0.00 67.10 4.80 716.70
Variansi 4422.25 1444.00 1354.24 4489.00 3903.75
1. Exe 1.00 0.03 0.39 0.05 0.08
2. Hard 0.03 1.00 0.07 0.23 0.16
3. Fit 0.39 0.07 1.00 0.13 0.29
4. Str 0.05 0.23 0.13 1.00 0.34
5. Ill 0.08 0.16 0.29 0.34 1.00
80
Dengan analisis rerata pada SEM dapat dilakukan uji hipotesis terhadap nilai rerata,
tetapi pembahasan mengenai struktur rerata di sini sangat terbatas karena analisis rerata pada
SEM terutama ditujukan untuk menguji hipotesis tentang variabel laten pada analisis faktor
konfirmatorik dan model regresi struktural.
Nilai rerata variabel eksogen pada program Stata dapat diperoleh dengan perintah sem
path, means(var_exo). Misalkan X adalah variabel eksogen, Y adalah variabel endogen, dan
hubungan antara X dan Y dinyatakan dengan model regresi:
Y = b0 + b1 X + DY
maka rerata variabel endogen Y adalah:
Y = b0 + b1 X (8.1)
81
Estimasi Struktur Rerata
Estimasi parameter, uji hipotesis, dan penilaian model pada struktur rerata dapat
dilakukan dengan metode yang sama seperti untuk struktur kovariansi. Walaupun demikian,
tidak semua indeks suai terstandardisasi untuk struktur kovariansi dapat dihitung untuk
struktur rerata. Contohnya yaitu indeks suai inkremental CFI (comparative fit index) yang
mengukur perbaikan relatif kesesuaian model peneliti dengan model dasar. Pada struktur
rerata, pada model dasar diasumsikan seluruh kovariansi dan rerata terkendala dengan nilai
nol, asumsi yang sangat tak realistis.
Karena estimasi rerata pada SEM hanya dapat dilakukan untuk variabel endogen,
penggunaan struktur rerata pada analisis jalur sangat terbatas. Analisis struktur rerata
terutama digunakan dan akan dibahas lebih lanjut pada analisis faktor konfirmatorik.
Contoh 8.1:
. use D:\SEM\Data\rokok.dta
. sem (sistolik < usia kolesterol), cov(usia*kolesterol) var(e.sistolik usia kolesterol)
> means(usia kolesterol)
Endogenous variables
Observed: sistolik
Exogenous variables
Observed: usia kolesterol
Fitting target model:
Iteration 0: log likelihood = 618.89285
Iteration 1: log likelihood = 618.89285
Structural equation model
Estimation method = ml Number of obs = 50
Log likelihood = 618.89285
OIM
Coef. Std. Err. z P>|z| [95% Conf. Interval]
Structural
sistolik <
usia .0922103 .7810589 0.12 0.906 1.623058 1.438637
kolesterol .0652989 .0686759 0.95 0.342 .0693033 .1999011
_cons 118.1628 41.05388 2.88 0.004 37.69871 198.627
Mean
usia 52.34 .5385982 97.18 0.000 51.28437 53.39563
kolesterol 212.92 6.125543 34.76 0.000 200.9142 224.9258
Variance
e.sistolik 429.0054 85.80107 289.8828 634.8967
usia 14.5044 2.90088 9.800753 21.46545
kolesterol 1876.114 375.2227 1267.707 2776.511
Covariance
usia
kolesterol 28.7272 23.68001 1.21 0.225 17.68478 75.13918
LR test of model vs. saturated: chi2(0) = 0.00, Prob > chi2 = .
82
Kovariansi antar variabel eksogen pada sem diasumsikan selalu ada, nilai kovariansi
antara usia dengan kolesterol akan tetap ditampilkan, walaupun opsi ,
cov(usia*kolesterol tak dituliskan, demikian pula halnya variansi suku pengganggu
e.sistolik akan selalu tercantum walaupun opsi var(e.sistolik) tak diberikan.
Sebalik rerata usia dan kolesterol hanya akan ditampilkan jika ada opsi , means(usia
kolesterol). Variansi usia dan kolesterol hanya akan ditampilkan jika ada opsi ,
means(usia kolesterol) dan/atau , var(usia kolesterol). Perhatikan bahwa
variabel endogen tak memiliki variansi, selain itu opsi , means(nama_var) hanya dapat
digunakan untuk variabel eksogen.
83
BAB 9
SAMPLING GANDA
84
Analisis Sampel Ganda pada Stata
Analisis data pada tabel 9.1 diperlihatkan pada contoh 9.1 berikut.
Contoh 9.1:
. use rokok_ssd.dta
. sem (sistolik < usia kolesterol), group(group)
Endogenous variables
Observed: sistolik
Exogenous variables
Observed: usia kolesterol
Fitting target model:
Iteration 0: log likelihood = 611.30609
Iteration 1: log likelihood = 611.30609
Structural equation model
Grouping variable = group Number of obs = 50
Estimation method = ml Number of groups = 2
Log likelihood = 611.30609
OIM
Coef. Std. Err. z P>|z| [95% Conf. Interval]
Structural
sistolik <
usia
1 .0002977 1.177281 0.00 1.000 2.307131 2.307726
2 .3219241 1.000138 0.32 0.748 2.282158 1.63831
kolesterol
1 .0654202 .0926163 0.71 0.480 .1161044 .2469448
2 .0871804 .1112774 0.78 0.433 .1309194 .3052802
_cons
1 115.5392 63.23401 1.83 0.068 8.397133 239.4756
2 123.1957 49.005 2.51 0.012 27.1477 219.2438
Variance
e.sistolik
1 591.5876 167.3262 339.8309 1029.853
2 255.4763 72.25962 146.7556 444.7407
LR test of model vs. saturated: chi2(0) = 0.00, Prob > chi2 = .
. estat ggof
85
. estat ginvariant
Contoh 9.2:
. use rokok_ssd.dta
. sem (sistolik < usia kolesterol), group(group) ginvariant(all)
Endogenous variables
Observed: sistolik
Exogenous variables
Observed: usia kolesterol
Fitting target model:
Iteration 0: log likelihood = 613.78589
Iteration 1: log likelihood = 613.76882
Iteration 2: log likelihood = 613.76881
Structural equation model Number of obs = 50
Grouping variable = group Number of groups = 2
Estimation method = ml
Log likelihood = 613.76881
( 1) [sistolik]1bn.group#c.usia [sistolik]2.group#c.usia = 0
( 2) [sistolik]1bn.group#c.kolesterol [sistolik]2.group#c.kolesterol = 0
( 3) [var(e.sistolik)]1bn.group [var(e.sistolik)]2.group = 0
( 4) [sistolik]1bn.group [sistolik]2.group = 0
OIM
Coef. Std. Err. z P>|z| [95% Conf. Interval]
Structural
sistolik <
usia
[*] .0920975 .7810625 0.12 0.906 1.622952 1.438757
kolesterol
[*] .0652956 .068762 0.95 0.342 .0693072 .1998984
_cons
[*] 118.1576 41.054 2.88 0.004 37.69328 198.622
86
Variance
e.sistolik
[*] 429.0085 85.80156 289.8851 634.9009
Note: [*] identifies parameter estimates constrained to be equal across groups.
LR test of model vs. saturated: chi2(4) = 4.93, Prob > chi2 = 0.2950
Opsi [group(groupname)] pada perintah sem path akan menghasilkan estimasi parameter
per kelompok, selanjutnya pengujian kesamaan parameter antar kelompok (between groups)
dilakukan dengan melanjutkan perintah sem path, group(groupname) tersebut dengan perintah
estat ginvariant.
87
Jika variabel moderator W berskala kategorik, baik dikotomi ataupun ordinal, kategori
W dapat dijadikan dasar pengelompokan sampel dalam Stata, selanjutnya analisis SEM
hubungan antara prediktor X dengan kedua kriterionnya M dan Y dilakukan per kelompok
dengan memperlakukannya sebagai sampel ganda, tanpa perlu membentuk variabel hasil
perkalian antara X dangan W. Estimasi parameter hubungan antara X dengan M dan Y berikut
pengujian efek interaksi antara X dengan W dilakukan dengan perintah sem path,
group(groupname) yang disusul dengan perintah estat ginvariant seperti pada contoh 9.1.
OIM
Standardized Coef. Std. Err. z P>|z| [95% Conf. Interval]
Structural
income <
age .0980292 .1936215 0.51 0.613 .4775203 .2814619
employ 2.774291 .7536995 3.68 0.000 4.251515 1.297067
age_emp .1438937 .0183936 7.82 0.000 .1078429 .1799445
_cons 26.35535 6.531747 4.03 0.000 13.55336 39.15734
Variance
e.income 809.6697 39.27475 736.2385 890.4247
LR test of model vs. Saturated: chi2(0) = 0.00, Prob > chi2 = .
88
KEPUSTAKAAN
Hershberger SL, 1994, The specification of equivalent models before the collection of data, in
Latent variables analysis, eds A von Eye, CC Clogg, Sage, Thousand Oaks, CA, pp 68-105.
Jackson JL, Dezee K, Douglas K, Shimeall W, 2005, Introduction to Structural Equation Modeling
(Path Analysis), SGIM Precourse PA08, viewed 8 May 2012, <http://
www.sgim.org/userfiles/file/AMHandouts/AM05/handouts/pa08.pdf>
Kenny DA, 2011, Path Analysis, viewed 10 May 2012, <http://davidakenny.net/cm/ pathanal.htm>
_______, 2011, Measuring Model Fit, viewed 10 May 2012, <http://davidakenny.net/cm/ fit.htm>
Kline RB, 2005, Principles and Practice of Structural Equation Modeling, 2nd edn, The Guildford
Press, New York.
_______, 2011, Principles and Practice of Structural Equation Modeling, 3 rd edn, The Guildford
Press, New York.
Kupek E, 2006, Beyond logistic regression: structural equation modelling for binary variables and its
application to investigating unobserved confounders, BMC Medical Research Methodology, vol 6,
no 13.
MacCallum RC, Austin JT, 2000, Applications of Structural Equation Modeling in Psychological
Research, Annu Rev Psychol, no 51, pp 201-226.
Moss S, 2009, Fit indices for structural equation modeling, Psychlopedia, viewed 6 May 2012,
viewed 8 May 2012, <http://www.psych-it.com.au/Psychlopedia/article.asp? id=277>
Norris AE, 2005a, Path Analysis, in Statistical Methods for Health Care Research, 5th edn, ed BA
Munro, Lippincott Williams & Wilkins, Philadelphia, pp 377-403
_______, 2005b, Structural Equation Modeling, in Statistical Methods for Health Care Research,
5th edn, ed BA Munro, Lippincott Williams & Wilkins, Philadelphia, pp 405-434.
Newsom J, 2012, Some Clarifications and Recommendations on Fit Indices, USP 655, SEM Jason
Newsom's SEM Class, viewed 12 May 2012, <http://www.upa.pdx.edu/IOA/
newsom/semclass/ho_fit.pdf>
Romney DM, Jenkins CD, Bynner JM, 1992, A structural analysis of health-related quality of life
dimensions, Human Relations, no 45, pp 165-176.
StataCorp LP, 2011, Stata Structural Equation Modeling: Reference Manual Release 12, Stata Press,
Lakeway Drive, College Station, Texas.
Suhr D, nd, Step your way through Path Analysis, viewed 12 May 2012,
<http://www.wuss.org/proceedings08/08WUSS%20Proceedings/papers/pos/pos04.pdf>
Wuensch KL, 2009, An introduction to Structural Equation Modeling (SEM), Dept of Psychology,
East Carolina University, Greenville, NC USA.
89
Lampiran 1
KOEFISIEN KORELASI
Data masukan (input data) yang lazim digunakan untuk analisis SEM adalah matriks
kovariansi atau korelasi. Korelasi yang dimaksud adalah korefisien korelasi Pearson yang
merepresentasikan korelasi antara dua variabel kontinu. Dalam keadaan tertentu dapat juga
digunakan beberapa bentuk korelasi lain, yaitu:
y1 : rerata Y untuk X = 1
y0 : rerata Y untuk X = 0
y : standar deviasi (populasi) Y; jika y tak diketahui diganti dengan estimasi sampelnya
n : ukuran sampel
n1 : ukuran sampel kelompok untuk X = 1
Contoh I.1:
Berikut ini diperlihatkan perhitungan korelasi biserial-titik antara variabel default
yang berskala dikotomi dengan variabel income yang berskala kontinu pada file bankloan.dta.
90
Np= 183 p= 0.26
Nq= 517 q= 0.74
perintah untuk koefisien korelasi Pearson, diperoleh hasil yang hampir sama:
default income
default 1.0000
income 0.0710 1.0000
91
ad bc
= (I.3)
n1n0 m1m0
Perintah Stata: phi catvar1 catvar2 [if exp] [in range] [, options]
Contoh I.2:
Contoh ini memperlihatkan koefisien korelasi phi antara variabel sex dan nktt, keduanya
berskala kategorik, dari file tension-type.dta.
(obs=218)
sex nktt
sex 1.0000
nktt -0.0762 1.0000
Walaupun nilai korelasi phi praktis sama atau hampir sama dengan korelasi Pearson,
perhitungannya dengan perintah phi selalu menghasilkan nilai positif, sehingga tandanya
dianjurkan untuk diberikan berdasarkan koefisien Pearson.
92
6 di2
rs = 1 (I.4)
n n2 1
dengan di = R xi R yi (I.4.a)
R xi : ranking xi
R yi : ranking yi
n : ukuran sampel
Perintah Stata: spearman varlist [if] [in] [, options]
Contoh I.3:
Perintah spearman yang akan diperlihatkan di sini adalah untuk menghitung korelasi
antara variabel mpg dengan rep78 pada file auto.dta.
Number of obs = 69
Dengan perintah corr, didapatkan nilai korelasi Pearson yang agak berbeda:
(obs=69)
mpg rep78
mpg 1.0000
rep78 0.4023 1.0000
93
y1 y0 pq
rb = . (I.5)
y Z
rb : koefisien biserial
y : standar deviasi (populasi) Y; jika y tak diketahui diganti dengan estimasi sampelnya
p : proporsi Y untuk X = 1
q : proporsi Y untuk X = 0
Z : Nilai Z pada titik pisah (cut-off point) kategorisasi dikotomi variabel X
Contoh I.4:
Perintah tetrachoric di sini adalah untuk menghitung korelasi tetrakorik antara variabel
RS074 dengan RS075 pada file familyvalues.dta.
94
Dengan perintah corr untuk korelasi Pearson diperoleh:
(obs=3300)
RS074 RS075
RS074 1.0000
RS075 0.0390 1.0000
Contoh I.5:
Dalam contoh ini digunakan kembali file auto.dta untuk menghitung korelasi polikorik
antara variabel rep78 dengan foreign.
. use D:\SEM\Data\auto.dta
. polychoric rep78 foreign
Variables : rep78 foreign
Type : polychoric
Rho = .80668063
S.e. = .07631278
Goodness of fit tests:
Pearson G2 = .43127118, Prob( >chi2(3)) = .93370947
LR X2 = .38898869, Prob( >chi2(3)) = .94250766
95
Dengan perintah corr diperoleh nilai korelasi Pearson yang agak jauh berbeda:
. corr rep78 foreign
(obs=69)
rep78 foreign
rep78 1.0000
foreign 0.5922 1.0000
Skema penggunaan koefisien korelasi untuk berbagai skala variabel diperlihatkan pada
tabel I. Pada tabel I.A variabel kategoriknya berskala kategorik murni dalam arti kata bukan
hasil kategorisasi suatu variabel kontinu, sedangkan tabel I.2 adalah skema jika untuk tiap
variabel kategorik ada variabel kontinu berdistribusi normal yang melatarbelakanginya,
dengan kata lain variabel kategoriknya adalah hasil kategorisasi suatu variabel kontinu.
96
Lampiran 2
ANALISIS REGRESI LINEAR DENGAN STATA
Perintah: regress
regress depvar [indepvars] [if] [in] [, options]
options Description
noconstant suppress constant term
level (#) set confidence level; default is level (95)
beta report standardized beta coefficients
robust tipe standard error yang dianjurkan untuk dipilih jika ada
heteroskedastisitas
Variabel indikator
Variabel indikator adalah variabel yang bernilai biner (0 dan 1), digunakan untuk
merepresentasikan variabel katagorik dalam model regresi. Variabel indikator diperoleh
sebagai hasil operasi i. (lihat bawah) terhadap suatu variabel kategorik, dinyatakan sebagai
i.varname.
Operator i. dan c.
Operator i. bagi suatu variabel, yaitu i.varname, menyatakan bahwa data pada variabel
tersebut adalah data kategorik, dan i.varname adalah variabel indikatornya. Operator c. bagi
suatu variabel, yaitu c.varname, menyatakan bahwa suatu variabel berskala kontinu.
Operator # dan ##
Operator # (palang; cross) dan ## (palang faktorial; factorial cross) digunakan terhadap
pasangan variabel. Operator # menyatakan interaksi dan mengimplikasikan semua variabel
dalam suku interaksi sebagai variabel indikator, kecuali mendapat operator c. Operasi ##
menyatakan interaksi faktorial.
97
Contoh II.1:
grup : variabel grup (nilai grup lebih daripada 2) diperlakukan sebagai variabel kontinu
(walaupun data sebenarnya kategorik)
i.grup : variabel indikator untuk variabel grup
seks : variabel seks diperlakukan sebagai variabel kategorik karena sudah bernilai biner.
i.seks : operator i. tak diperlukan, i.seks pengertiannya sama dengan seks.
usia : variabel usia diperlakukan sebagai variabel kontinu
c.usia : operator c. tak diperlukan, c.usia pengertiannya sama dengan usia.
grup#seks : menyatakan interaksi antara 2 variabel kategorik, grup dan seks
i.grup#i.seks : operator i. tak diperlukan, semua variabel dalam suku interaksi diperlakukan
sebagai variabel kategorik
grup#c.usia : menyatakan interaksi antara variabel kategorik grup dengan variabel kontinu
usia. Operator c. bagi usia harus ada supaya usia diperlakukan sebagai
variabel kontinu.
i.grup#c.usia : operator i. bagi variabel grup tak diperlukan, pengertiannya sama dengan
grup#c.usia.
grup##seks : menyatakan interaksi antara variabel kategorik grup dan seks disertai
pemasukan variabel i.grup dan seks (di luar suku interaksi) dalam model
grup##c.usia : menyatakan interaksi antara variabel kategorik grup dan variabel kontinu usia
disertai pemasukan variabel i.grup dan usia dalam model.
Contoh II.2:
- Buka file honolulu.dta:
. use D:\SEM\Data\honolulu.dta
- Regresikan sistolik terhadap usia dan kolesterol:
. regress sistolik usia kolesterol
- Masukkan suku interaksi antara usia dengan kolesterol:
. regress sistolik usia kolesterol c.usia#c.kolesterol
- Perhatikan bahwa tanpa operator c. pada interaksi, usia dan kolesterol akan diperlakukan
sebagai variabel kategorik dengan kategori yang sangat banyak, sehingga analisis regresi
tak dapat dilakukan.
- Regresikan sistolik terhadap usia dan seks:
. regress sistolik usia seks
98
- Variabel seks tidak memerlukan operator i. karena bernilai biner (0 dan 1), sehingga
dengan sendirinya sudah dianggap sebagai variabel kategorik.
- Masukkan suku interaksi antara usia dengan seks:
. regress sistolik usia seks c.usia#seks
- Variabel usia memerlukan operator c. pada suku interaksi, sedangkan variabel seks tidak
memerlukan operator i.
- Regresikan sistolik terhadap usia dan tk_pend:
. regress sistolik usia i.tk_pend
- Variabel tk_pend adalah variabel kategorik, sehingga memerlukan operator i.
- Masukkan suku interaksi antara usia dan tk_pend:
. regress sistolik usia i.tk_pend c.usia#tk_pend
- Perhatikan bahwa pada suku interaksi, usia memerlukan operator c., sebaliknya tk_pend
tidak lagi memerlukan operator i.
- Regresikan kembali sistolik terhadap usia, kolesterol, dan interaksinya:
. regress sistolik usia kolesterol usia#kolesterol
- Regresi terakhir ini menggunakan rancangan faktorial, sehingga perintahnya dapat juga
dituliskan sebagai:
. regress usia##kolesterol
Contoh II.3:
Misalkan hendak diregresikan variabel mpg terhadap variabel rep78 pada file
auto.dta. Variabel mpg sebagai variabel dependen merupakan variabel kontinu, sedangkan
variabel rep78 sebagai variabel independen juga akan diperlakukan sebagai variabel kontinu,
kecuali jika diberikan operator i.
. use D:\SEM\Data\auto.dta
. regress mpg i.rep78
99
Tampak bahwa operator i menghasilkan pembentukan 4 (5 1) variabel indikator untuk
variabel semula rep78 yang memiliki 5 taraf, yang diberi nama variabel nomor 2 s.d. 5 di
bawah nama rep78. Perintah lama xi memberi hasil yang sama, hanya dengan penamaan yang
berbeda:
100
Contoh II.4:
- Buka kembali file honolulu.dta:
. use D:\SEM\Data\honolulu.dta
- Tampilkan grafik diagram tebar kolesterol (sumbu X) dan sistolik (sumbu Y):
. twoway (scatter sistolik kolesterol)
200
180
Tekanan Darah Sistolik
160
140
120
100
130
120
101
160
140
120
100
102
Uji Normalitas
Secara kasar normalitas suatu variabel dapat dinilai dengan menggunakan grafik
univariat variabel tersebut, dengan perintah
. stem varname Diagram batang-dan-daun (stem-and-leaf)
. graph box varname Diagram kotak-dan-titik (box-and-whisker plot)
. histogram varname Grafik histogram
. pnorm varname Diagram probabilitas normal terstandardisasi
Uji statistik normalitas suatu variabel dapat dilakukan dengan uji Shapiro Wilk, dengan
perintah:
. swilk varname
Contoh II.5:
3* | 1111
3t | 3333
3f | 55
3s | 66777
3. | 899999
4* | 0001111111111
4t | 223
4f | 4444444444445
4s | 66666666677
4. | 99999999999
5* | 00
5t | 2222222222222223
5f | 44444444444444444555
5s | 777777777777
5. | 9999999999999999999999999
6* | 00001111
6t | 2222222222222222223333
6f | 5555555555555555
6s | 7777777
103
80
70
60
reading score
50
40
30
. histogram race
4
3
Density
2
1
0
1 2 3 4
race
. pnorm math
1.00
0.75
Normal F[(math-m)/s]
0.50
0.25
0.00
. swilk math
Shapiro-Wilk W test for normal data
104
Uji Heteroskedastisitas
Asumsi homoskedastisitas mempersyaratkan variansi distribusi variabel dependen
adalah sama untuk setiap nilai variabel independen. Uji keberadaan heteroskedastisitas dapat
dilakukan dengan dua perintah Stata:
. estat hettest [varlist]
atau:
. estat imtest
yang dilakukan segera setelah perintah pemodelan regress depvar [indepvars].
Contoh II.6:
Buka file auto.dta dengan model regresi linear dan hasil seperti pada contoh 2.7.
. sysuse auto
. regress mpg weight c.weight#c.weight foreign
. estat hettest weight c.weight#c.weight foreign
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
Ho: Constant variance
Variables: weight c.weight#c.weight foreign
chi2(3) = 29.17
Prob > chi2 = 0.0000
. estat imtest
Cameron & Trivedi's decomposition of IM-test
Source chi2 df p
Heteroskedasticity 11.95 7 0.1023
Skewness 7.54 3 0.0566
Kurtosis 1.71 1 0.1915
Total 21.19 11 0.0315
Uji Multikolinearitas
Salah satu ukuran untuk menilai keberadaan multikolineritas adalah perhitungan nilai
VIF (variance inflation factor). Multikolinearitas dianggap ada jika VIF terbesar lebih
daripada 10 (ada juga mengambil batas atas 30).
Perintah Stata untuk menghitung VIF adalah:
. estat vif
yang dilakukan segera setelah perintah regress depvar [indepvars], atau cukup
dengan:
. vif
105
Jika intersep hendak diperlakukan sebagai salah satu variabel independen dan ikut
dihitung nilai VIF-nya, perintah Stata adalah:
. estat vif, uncentered
Contoh II.7:
Buka file bodyfat.dta, regresikan variabel bodyfat terhadap tricep, thigh, dan midarm.
. use D:\SEM\Data\bodyfat.dta
. regress bodyfat tricep thigh midarm
. estat vif
Variable VIF 1/VIF
triceps 708.84 0.001411
thigh 564.34 0.001772
midarm 104.61 0.009560
Mean VIF 459.26
Residual
Residual (galat) adalah selisih suatu nilai prediktor dengan nilai prediksinya
berdasarkan model regresi:
ei = Yi Yi
106
si : akar rerata galat kuadrat jika pengamatan ke-i dihilangkan
Leverage
Titik prediktor yang nilainya menyimpang jauh dari reratanya dinyatakan sebagai titik
pengamatan dengan leverage tinggi atau titik leverage. lvr2plot adalah grafik yang
menggambarkan leverage (sumbu Y) terhadap kuadrat residual (sumbu X). Pada sisi kiri atas
grafik akan didapatkan titik-titik dengan leverage yang tinggi, sedangkan di sisi kanan bawah
grafik adalah titik-titik dengan residual absolut yang besar.
Perintah lvr2plot diberikan segera setelah perintah regress:
. regress depvar [indepvar1, indepvar2, . . .]
. lvr2plot
Jika untuk titik yang ada pada grafik ingin disertakan nilai variabel independennya,
perintahnya adalah:
. lvr2plot, ml (indepvar)
Informasi pada plot leverage vs residual-kuadrat ini dapat diringkas menjadi satu
statistik, antara lain berupa DFITS dan Cooks Distance.
DFITs ke-i adalah:
hi
DFITsi = ri
1 hi
ri : residual Studentized
hi : leverage
Cooks Distance untuk pengamatan ke-i adalah:
2
1 s(i ) 2 1 ei2 hi
Di = DFITs =
p s 1 hi 2
2 i 2
p s
Ukuran yang paling langsung menunjukkan pengaruh suatu titik terhadap model regresi
adalah DFBETAs. DFBETAs dihitung untuk pengamatan ke-i setiap variabel independen.
Rumus untuk leverage dan DFBETAs dinyatakan dalam bentuk operasi matriks, tak
dilampirkan di sini.
107
Perintah predict
Perintah predict adalah perintah memprediksi nilai-nilai tertentu berdasarkan model
yang ada pada perintah regress. Perintah ini diberikan segera setelah perintah regress, hasilnya
prediksinya akan langsung berada pada basis-data. Beberapa di antaranya yaitu:
. predict depvar_hat Prediksi nilai variabel dependen berdasarkan model
regresi
. predict e if e(sample) Prediksi nilai-nilai residual
. predict l, leverage Prediksi nilai-nilai leverage, yang mengukur pengaruh
pengamatan ke-i terhadap koefisien regresi
. predict c, cooksd Prediksi nilai Cooks D, yang mengukur pengaruh
pengamatan ke-i terhadap model regresi secara
keseluruhan atau nilai-nilai prediksi.
. predict rstu, rstu Prediksi nilai residual Studentized
. predict dfits, dfits Prediksi nilai DFITs, yang mengukur pengaruh
pengamatan ke-i terhadap model regresi secara
keseluruhan
. predict dfbeta, dfbeta Prediksi nilai DFBETAs, yang mengukur pengaruh
pengamatan ke-i terhadap koefisien regresi suatu variabel
independen tertentu
108
. cprplot varind plot component-plus-residual, yaitu grafik antara
Ridge Regression
Ridge regression adalah tipe pengestimasian model regresi yang dianjurkan jika terdapat
multikolinearitas. Perintah Stata adalah:
. ridgereg depvar indvars [if] [in], model(orr|grr1|grr2|grr3)
Opsi model adalah sebagai berikut, yang harus dipilih salah satu:
model(orr) Ordinary Ridge Regression
model(grr1) Generalized Ridge Regression
model(grr2) Iterative Generalized Ridge Regression
model(grr3) Adaptive Generalized Ridge Regression
Jika opsi model tidak dispesifikasi, perintah ridgereg akan menghasilkan estimasi OLS
(Ordinary Least Square) biasa.
Contoh II.8:
Lihat kembali file bodyfat.dta pada contoh II.7. Pada contoh II.7 terlihat adanya
multikolinearitas antar ketiga variabel independen tricep, thigh, dan midarm dengan nilai VIF
yang sangat tinggi. Dengan ridge regression diperoleh hasil estimasi sebagai berikut.
. use D:\SEM\Data\bodyfat.dta
. ridgereg bodyfat tricep thigh midarm, model(grr1)
Variable Obs Mean Std. Dev. Min Max
__00005F 20 1 0 1 1
* Generalized Ridge Regression
bodyfat = triceps + thigh + midarm
109
110
LAMPIRAN 3
BEBERAPA NILAI-NILAI STATISTIK SUAI
PADA ANALISIS SEM
Statistik suai (fit statistics) yang ada dalam kepustakaan serta dilaporkan pada berbagai
program statistik komputer sangat beragam. Beberapa yang lazim digunakan dan dilaporkan
pada estimasi parameter SEM dengan Stata disajikan pada tabel berikut.
Statistik Interpretasi
RMSEA Indeks berbasis-non-sentralitas, merupakan indeks keburukan-suai dengan
interpretasi sebagai berikut:
- RMSEA < 0.05: Aproksimasi kesesuaian baik
- 0.05 < RMSEA < 0.08: Galat aproksimasi masih dapat diterima
- RMSEA > 0.10: Kesesuaian buruk
Interval konfidensi 90% untuk RMSEA adalah
- Batas bawah interval < 0.05: H 0 : RMSEA < 0.05 (aproksimasi
kesesuaian model baik) tidak ditolak.
- Batas atas interval tidak > 0.10: H 0 : RMSEA > 0.10 (kesesuaian model
buruk) ditolak.
- Batas bawah interval < 0.05 & batas atas interval > 0.10 hasil
kontroversial
pclose pclose (p of close fit) adalah nilai p satu-sisi untuk uji H 0 : RMSEA = 0.05
111
Statistik Interpretasi
BIC Indeks suai mutlak / indeks presiktif-suai seperti AIC, namun BIC sangat
menekankan parsimoni.
CFI Merupakan indeks berbasis-non-sentralitas, menilai perbaikan relatif
kesesuaian model peneliti dibandingkan dengan model dasar, yaitu model
dengan asumsi semua kovariansi bernilai sama dengan nol.
Nilai CFI berkisar antara 0 s.d. 1. Kesesuaian dianggap baik jika CFI >
0.95.
TLI Indeks suai-relatif: Memperbanding model peneliti dengan model nol, yang
menyatakan semua korelasi bernilai nol.
Nilai TLI dapat berkisar antara sedikit lebih kecil daripada 1 s.d. lebih besar
daripada 1. Kesesuaian dianggap baik jika TLI > 0.95.
SRMR Ukuran kesuaian mutlak, merupakan selisih terstandardisasi antara matriks
korelasi data dengan matriks korelasi prediksi.
- SRMR = 0 menyatakan kesesuaian sempurna
- SRMR < 0.8 dianggap menunjukkan kesesuaian baik
112
Lampiran 4
UJI HIPOTESIS PADA SEM
Pada estimasi parameter SEM, secara otomatis dilaporkan hasil uji Z untuk menilai
kemaknaan efek langsung setiap prediktor terhadap kriterionnya. Dalam bab 4 juga telah
dibahas uji Sobel untuk menilai signifikansi efek tak langsung antara dua variabel yang
terjadi melalui satu variabel mediator. Beberapa uji hipotesis lainnya adalah:
1. Uji rasio likelihood untuk memperbandingkan nilai-nilai (kovariansi) prediksi model
peneliti dengan nilai-nilai (kovariansi) data sampel (disebut juga model jenuh). Hasil uji
ini secara otomatis dilaporkan pada pemodelan dan estimasi parameter [perintah sem
(vardep < varindep1, varindep 2, . . .)].
2. Uji rasio likelihood untuk memperbandingkan dua model. Hasil estimasi kedua model
harus terlebih dahulu disimpan sebelum dapat diperbandingkan, dengan perintah:
. sem path1
. estimates store A
. sem path2
. estimates store B
. lrtest A B
3. Uji Wald untuk memperbandingkan nilai parameter antar kelompok (between groups)
pada sampel ganda, dengan perintah:
. sem path
. estat ginvariant
113