Anda di halaman 1dari 121

PEMODELAN

PERSAMAAN STRUKTURAL:
I. ANALISIS JALUR

Johan Harlan
Pusat Studi Informatika Kedokteran
Universitas Gunadarma
Pemodelan Persamaan Struktural:
I. Analisis Jalur
Penulis : Johan Harlan
ISBN 978-602-9438-27-7

Cetakan Pertama, Juli 2013

Disain cover : Joko Slameto

Diterbitkan pertama kali oleh Gunadarma


Jl. Margonda Raya No. 100, Pondokcina, Depok 16424
Telp. +62-21-78881112, 7863819 Faks. +62-21-7872829
e-mail : sektor@gunadarma.ac.id

Hak Cipta dilindungi undang-undang. Dilarang mengutip atau


memperbanyak dalam bentuk apapun sebagian atau seluruh isi buku tanpa
ijin tertulis dari penerbit.
KATA PENGANTAR

Pemodelan persamaan struktural (structural equation modeling; SEM) adalah suatu


teknik analisis statistika yang terutama menekankan penilaian model, dapat dianggap sebagai
perluasan General Linear Model, disebut juga sebagai second generation multivariate
analysis. Analisis SEM dapat dibedakan atas tiga tipe, analisis jalur, analisis faktor
konfirmatorik, dan model regresi struktural.
Buku ini merupakan buku pertama dalam seri SEM, yang akan membahas mengenai
analisis jalur. Pembahasan analisis jalur di sini mencakup pembahasan tentang teori analisis
jalur, praktek analisis jalur dengan program komputer statistik Stata, dan interpretasi
hasilnya. Pembahasan teori analisis jalur bersifat mendasar, yaitu menyangkut pengetahuan
teoretis minimum dari segi Statistika yang dibutuhkan seorang peneliti untuk melakukan
analisis PA. Pengetahuan teoretis ini juga sangat penting dan diperlukan sebagai dasar bagi
mereka yang ingin mempelajari kedua tipe SEM berikutnya, yaitu analisis faktor
konfirmatorik dan model regresi struktural.
Praktek analisis jalur yang akan dibahas adalah analisis SEM dengan Stata, suatu paket
komputer statistik. Analisis SEM dengan paket komputer statistik Stata ini dapat
dilaksanakan dalam mode interaktif maupun mode grafik. Interpretasi hasil analisis jalur
dengan Stata yang akan dibahas adalah pemahaman menurut aspek Statistika, sedangkan
aspek substantif tetap harus dikaji oleh peneliti sendiri berdasarkan bidang keilmuannya
masing-masing.
Sebagai prasyarat untuk mempelajari SEM, pembaca diharapkan telah memiliki
pengetahuan dasar mengenai analisis regresi (untuk PA) dan analisis faktor (untuk CFA),
walaupun dalam buku-buku seri SEM ini akan dibahas juga telaah ulang secara singkat
mengenai konsep-konsep tersebut.

Jakarta, Juli 2012

Penulis

v
DAFTAR ISI

Kata Pengantar v
Daftar Isi vii

Bab 1 Pendahuluan 1
Pengertian Dasar SEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
Struktur pada SEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Variabel Teramati dan Variabel Laten . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Variabel Endogen dan Eksogen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Beberapa Karakteristik Kekhususan SEM . . . . . . . . . . . . . . . . . . . . . . . . . 4
Program Komputer untuk SEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Lambang SEM dalam Kepustakaan dan Stata . . . . . . . . . . . . . . . . . . . . . . 6

Bab 2 Telaah Ulang Analisis Regresi 9


Model dan Persamaan Regresi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
Data Tak-terstandardisasi dan Terstandardisasi . . . . . . . . . . . . . . . . . . . . . 11
Matriks Kovariansi dan Korelasi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
Analisis Regresi dangan Stata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

Bab 3 Konsep-konsep Dasar Analisis Jalur 19


Analisis Jalur dan Model Struktural . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
Asumsi dalam Analisis Jalur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
Parameter dan Derajat Bebas Model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
Tipe Model Jalur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Identifikasi Model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
Ukuran Sampel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Hubungan Antar-Variabel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

Bab 4 Estimasi Parameter 25


Parameter Model Jalur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Estimasi Efek pada Model Jalur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
Dekomposisi Efek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

vii
Uji Sobel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Notasi Jalur SEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
Estimasi Koefisien Jalur SEM dengan Stata . . . . . . . . . . . . . . . . . . . . . . . . 34

Bab 5 Uji Hipotesis dan Penilaian Model 49


Uji Hipotesis pada SEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
Klasifikasi Statistik Suai . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
Macam Statistik Suai . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
Estimasi Statistik Suai SEM dengan Stata . . . . . . . . . . . . . . . . . . . . . . . . . 54
Model Ekivalen pada Analisis Jalur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

Bab 6 Pemodelan SEM dalam Mode Grafik pada Stata 63


Graphical User Interface pada Stata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
Analisis SEM dengan Mode Grafik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

Bab 7 Model Struktural Non-Rekursif 68


Tipe Model Struktural Non-Rekursif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
Identifikasi pada Mode Non-Rekursif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
Kondisi Order . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
Kondisi Rank . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
Efek Tak Langsung pada Model Non-Rekursif . . . . . . . . . . . . . . . . . . . . . 71
Korelasi Ganda Kuadrat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
Analisis Model Non-Rekursif dengan Stata . . . . . . . . . . . . . . . . . . . . . . . . 74

Bab 8 Struktur Rerata 80


Analisis Nilai Rerata pada SEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
Identifikasi Struktur Rerata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
Estimasi Struktur Rerata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

Bab 9 Sampling Ganda 84


Penggunaan Sampling Ganda pada SEM . . . . . . . . . . . . . . . . . . . . . . . . . . 84
Analisis Sampel Ganda pada Stata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
Variabel Moderator dan Efek Interaksi . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

viii
Kepustakaan 89
Lampiran 1 Koefisien Korelasi 90

Lampiran 2 Analisis Regresi Linear dengan Stata 97

Lampiran 3 Beberapa Nilai-Nilai Statistik Suai pada Analisis SEM 111

Lampiran 4 Uji Hipotesis pada SEM 113

ix
Bab 1. Pendahuluan

BAB 1
PENDAHULUAN

Pengertian Dasar SEM


Pemodelan persamaan struktural (structural equation modeling; SEM) bukan
merupakan suatu teknik statistika tunggal seperti analisis variansi, analisis regresi, dan
sebagainya, melainkan mengacu kepada suatu kelompok prosedur yang saling berkaitan (a
family of related procedures). SEM dikenal pula sebagai analisis multivariat generasi kedua
(second generation multivariate analysis). Istilah lain untuk SEM ialah pemodelan kausal
(causal modeling). Dalam kenyataannya SEM hanyalah berguna untuk menunjang dugaan
keberadaan hubungan kausal, karena tidak ada teknik statistika yang dapat membuktikan
kausalitas dalam rancangan studi observasional. SEM umumnya digunakan untuk rancangan
studi observasional, namun jika diperlukan dapat pula digunakan dalam rancangan studi
eksperimental.
Dikenal dua tipe model dalam SEM yaitu model struktural dan model pengukuran.
Model struktural mengkaji struktur hubungan antara variabel teramati, sedangkan model
pengukuran menekankan pengukuran variabel laten dengan menggunakan indikator.
Berdasarkan tipe pemodelan tersebut SEM dapat dibagi menjadi tiga bagian, yaitu analisis
jalur, analisis faktor konfirmatorik, dan model regresi struktural. Analisis jalur (path
analysis; PA) merupakan model struktural untuk variabel teramati (lihat contoh pada diagram
1.1), sedang analisis faktor konfirmatorik (confirmatory factor analysis; CFA) adalah
model pengukuran untuk variabel laten (contoh pada diagram 1.2). Model regresi struktural
(structural regression model; model SR) adalah sintesis antara model struktural dengan
model pengukuran, merupakan gabungan antara analisis jalur dengan CFA (contoh pada
diagram 1.3).
Dalam buku ini pembahasan selanjutnya adalah mengenai analisis jalur. Walaupun
analisis jalur hanya merupakan sebagian dari keseluruhan metode statistika yang ada dalam
SEM dan juga merupakan teknik statistika yang tertua dalam SEM, pemahaman mengenai
analisis jalur sangat penting dan merupakan dasar utama untuk mempelajari SEM secara
keseluruhan.

1
Bab 1. Pendahuluan

Gambar 1.1 Contoh model jalur

Gambar 1.2 Contoh model analisis faktor konfirmatorik

Gambar 1.3 Contoh model regresi struktural


2
Bab 1. Pendahuluan

Struktur pada SEM


Bagian model persamaan struktural yang merepresentasikan hipotesis tentang variansi
dan kovariansi adalah struktur kovariansi, sedangkan jika rerata juga dianalisis bersama
dengan kovariansi, maka model persamaan struktural memiliki baik struktur kovariansi
maupun struktur rerata, dengan struktur rerata merepresentasikan estimasi rerata faktor.
Salah satu kelebihan SEM ialah dapat diestimasinya rerata variabel laten, yang tak
dapat dilakukan pada teknik analisis statistik lainnya. Misalnya dalam ANOVA (analisis
variansi), estimasi hanya dapat dilakukan untuk rerata variabel teramati. Walaupun demikian,
dalam kebanyakan analisis SEM struktur rerata tak dibutuhkan dan rerata tak dianalisis.

Variabel Teramati dan Variabel Laten


Variabel dalam SEM dibedakan menjadi variabel teramati dan variabel laten. Variabel
teramati (observed variable) adalah variabel yang nilai datanya dapat diukur secara langsung
oleh peneliti dan nilainya ada pada basis-data penelitian. Contohnya antara lain yaitu tinggi
badan, berat badan, dan sebagainya. Variabel teramati dapat berupa variabel kategorik
nominal, kategorik ordinal, ataupun kontinu. Dalam contoh pada gambar 1.1, X 1 , X 2 , Y1 , Y2

, Y3 , dan Y4 adalah variabel-variabel teramati.


Variabel laten (variabel tak-teramati; unobserved variable) yang adakalanya disebut
juga sebagai konstruk (construct) atau faktor, adalah variabelnya yang nilai datanya tidak
diperoleh melalui pengukuran langsung oleh peneliti, tetapi diukur secara tidak langsung
melalui beberapa variabel teramati yang disebut juga sebagai indikator. Misalnya untuk
variabel laten prestasi belajar (achievement) siswa SD, indikatornya adalah (hasil tes)
kemampuan membaca, kemampuan menulis, dan kemampuan berhitung. Variabel laten
dalam SEM selalu merupakan variabel kontinu. Dalam contoh pada gambar 1.2, A dan B
adalah variabel-variabel laten. Variabel laten tak digunakan dalam analisis jalur yang akan
dibahas di sini. Konstruk dapat menjadi variabel teramati jika nilai-nilainya diperoleh dari
indikator-tunggal (single-indicator).

Variabel Endogen dan Eksogen


Variabel eksogen (variabel independen) adalah variabel yang sama sekali tidak
menerima efek variabel lain, sedangkan variabel endogen adalah variabel yang menerima
efek satu atau lebih variabel lain. Efek antar variabel ini dapat terjadi dari suatu variabel

3
Bab 1. Pendahuluan

eksogen ke suatu variabel endogen ataupun dari suatu variabel endogen ke variabel endogen
lain. Dalam pengertian ini variabel mediator (variabel perantara) dianggap sebagai variabel
endogen, sedangkan suku pengganggu (disturbance) adalah variabel eksogen. Tiap variabel
endogen memiliki suku pengganggu, yang selalu merupakan variabel laten. Variabel
endogen dalam SEM dapat berperan sebagai variabel dependen maupun independen. Dalam
contoh pada gambar 1.1, X 1 dan X 2 adalah variabel eksogen, sedangkan Y1 , Y2 , Y3 , dan Y4

adalah variabel endogen. Y1 dan Y2 merupakan variabel mediator.


Istilah variabel eksogen (independen) menyatakan bahwa nilai-nilai variabel ini dapat
bervariasi dengan bebas sehingga memiliki nilai variansi tertentu, sedangkan variabel
endogen tidak dapat bervariasi dengan bebas sehingga tidak memiliki variansi. Dalam contoh
pada gambar 1.1 tampak bahwa hanya variabel eksogen X 1 dan X 2 yang memiliki

variansi. Variabel endogen Y1 , Y2 , Y3 , dan Y4 tidak memiliki variansi, yang memiliki


variansi adalah suku pengganggu (disturbances) untuk keempat variabel endogen tersebut.
Suku pengganggu pada model struktural SEM merepresentasikan galat pengukuran
(measurement error) variabel endogennya beserta variabel independen yang tak
diperhitungkan (omitted causes) dalam model.
Dua variabel eksogen yang memiliki asosiasi tak-teranalisis (unanalyzed association)
dapat bervariasi bersama (ber-kovariansi), sehingga pasangan variabel eksogen demikian
memiliki nilai kovariansi tertentu. Pada contoh gambar 1.1 diperlihatkan adanya korelasi
antara variabel eksogen X 1 dan X 2 . Perhatikan bahwa dalam SEM semua variabel eksogen
dianggap saling berkorelasi walaupun tak digambarkan dalam model.

Beberapa Karakteristik Kekhususan SEM


SEM memiliki beberapa karakteristik khusus yang membedakannya dari teknik
statistika lainnya, yaitu:
- SEM bukan merupakan teknik statistika tunggal, namun merupakan kumpulan
sejumlah teknik statistika yang berkaitan, terutama analisis regresi dan analisis faktor.
- SEM mengkaji model a priori, yaitu model yang sudah harus ada dan dibuat peneliti
sebelum dimulainya pengumpulan dan analisis data. Model boleh diperbaiki dalam tahap
analisis, tetapi tidak boleh baru dibuat setelah data ada dan sepenuhnya dikembangkan
hanya berdasarkan data yang diperoleh peneliti. Implikasinya yaitu peneliti harus
memiliki dasar yang kokoh dalam bidang substansi keilmuannya.

4
Bab 1. Pendahuluan

- Dalam tahap analisis jika diperlukan untuk memenuhi persyaratan statistika, model boleh
direvisi, tetapi proses revisi model tidak boleh bertentangan dengan pengetahuan teoretis
di bidang substansi penelitian.
- SEM dapat mengkaji lebih daripada satu model dan model yang ternyata dapat
menjelaskan data dengan baik berdasarkan analisis SEM juga mungkin lebih daripada
satu.
- SEM dapat menganalisis variabel teramati maupun variabel laten. Sebagian besar teknik
statistika dibuat untuk menganalisis variabel teramati. Ada juga teknik statistika yang
dikhususkan untuk menganalisis variabel laten, tetapi SEM dapat menganalisis kedua
tipe variabel tersebut bersama-sama.
- SEM adalah teknik sampel besar. Untuk memperoleh hasil yang terpercaya, ukuran
sampel minimum ideal yang dianjurkan adalah 20 kali jumlah parameter, misalnya
model dengan 10 parameter dianjurkan menggunakan sampel berukuran 200.
- Estimasi pada SEM umumnya dilakukan dengan metode maximum likelihood (ML)
yang merupakan metode informasi-penuh (full-information method) yang menganalisis
seluruh persamaan dalam model sekaligus, berbeda misalnya dengan metode kuadrat
terkecil yang dapat dianggap sebagai metode informasi-parsial (partial-information
method) karena dalam tiap tahap hanya menganalisis satu persamaan.
- SEM kurang memberi penekanan pada uji statistik dalam pengertian sebagai uji
parameter dalam Statistika Umum. Didapatkan berbagai alasan yang menyebabkan uji
statistik demikian menjadi kurang penting dalam SEM, yang terutama yaitu karena SEM
dimaksudkan untuk meng-evaluasi keseluruhan model secara global, sedangkan uji
statistik sebagai uji parameter hanya menyangkut detil spesifik dalam model. Alasan
teknis lainnya yaitu karena SEM merupakan teknik sampel besar, sedangkan secara
teoretis sampel besar dapat mengakibatkan efek trivial dapat menjadi sangat bermakna
secara statistik. Uji statistik yang lazim dilakukan dalam SEM memiliki tujuan berbeda,
yaitu pengujian model antara lain dengan memperbandingkan matriks kovariansi data
dengan matriks kovariansi yang diprediksi oleh model yang diajukan peneliti, walaupun
ada juga uji statistik untuk pengujian parameter yang dianggap kurang penting.

Program Komputer untuk SEM


Program statistik komputer untuk SEM telah dikenal sejak paruh kedua 1970-an,
walaupun pada waktu itu program SEM yang dikenal secara luas hanyalah LISREL (Linear

5
Bab 1. Pendahuluan

Structural Relationships) yang dikembangkan oleh Jreskog & Srbom yang menggunakan
mode interaktif. Dalam perkembangan selanjutnya dikenal pula AMOS (Analysis of Moment
Structures) yang dikembangkan oleh SPSS Inc sebagai program aplikasi yang berdiri sendiri.
AMOS memiliki kemudahan karena dapat dijalankan dalam mode grafik dengan
menggunakan GUI (Graphical User Interface), walaupun dapat juga dijalankan dengan mode
batch.
Sekarang dikenal juga berbagai prosedur SEM yang merupakan bagian program
statistik komputer komprehensif, misalnya:
- Prosedur CALIS/TCALIS (Covariance Analysis and Linear Structural Equations) pada
SAS/STAT
- Prosedur RAMONA (Reticular Action Model or Near Approximation) pada SYSTAT.
- Prosedur SEPATH (Structural Equation Modeling and Path Analysis) pada
STATISTICA.
Berbagai prosedur ini umumnya harus dijalankan dalam mode batch (kecuali
SEPATH). Prosedur terbaru yang dibahas dalam buku ini yaitu prosedur sem (structural
equation modeling) yang didapatkan pada program statistik STATA. Prosedur sem ini baru
didapatkan pada STATA versi 12 yang diluncurkan pada tahun 2011. Prosedur sem pada
STATA 12 ini dapat dijalankan dengan mode grafik maupun interaktif.

Lambang SEM dalam Kepustakaan dan Stata


Berikut ini diperlihatkan beberapa lambang yang lazim dipergunakan untuk notasi SEM
dalam kepustakaan dan dipergunakan pula dalam Stata:
1. Variabel:
a. Variabel teramati:
Variabel teramati dinyatakan dengan lambang empat persegi panjang ( ) atau
bujur sangkar ( ). Nama variabel dituliskan dalam empat persegi panjang atau
bujur sangkar itu. Seluruh variabel yang ada pada basis-data adalah variabel
teramati.
Pada Stata, nama variabel teramati seluruhnya ditulis dengan huruf kecil.
b. Variabel laten:
Variabel laten digambarkan dengan lambang elips ( ) atau lingkaran ( ).
Nama variabel dituliskan dalam elips atau lingkaran itu. Pada model jalur, hanya
suku pengganggu yang merupakan variabel laten.

6
Bab 1. Pendahuluan

Pada Stata, penulisan nama variabel laten diawali dengan huruf besar, kecuali
untuk suku pengganggu (butir 1.c)
c. Suku pengganggu:
Suku pengganggu ada untuk setiap variabel endogen, merupakan variabel laten
yang memiliki variansi, sedangkan variabel endogen itu sendiri tidak memiliki
variansi.
Pada Stata, variabel laten untuk sebuah variabel endogen dinamakan sebagai
e.nama_var_endogen, misalnya untuk variabel endogen sistolik, nama suku
pengganggunya adalah e.sistolik. Walaupun merupakan variabel laten, penulisan
nama suku pengganggu tidak diawali dengan huruf besar.
2. Efek antar-variabel:
a. Efek searah:
Efek searah suatu variabel terhadap variabel lainnya dinyatakan dengan lambang
anak panah searah (). Misalnya, efek searah variabel X terhadap variabel Y
dinyatakan sebagai X Y. Nilai yang dituliskan dekat anak panah pada model awal
menyatakan nilai kendala yang ditentukan peneliti pada penyusunan model ataupun
estimasi yang diperoleh dari data sampel sebagai koefisien regresi atau koefisien
jalur.
Pada pemodelan Stata, efek searah variabel X terhadap Y dituliskan sebagai sem (Y
< X) atau sem (X > Y).
b. Efek resiprokal:
Efek resiprokal antar dua variabel dinyatakan dengan lambang anak panah bolak-
balik ( ). Misalnya, efek resiprokal antar variabel Y1 dan Y2 dinyatakan sebagai

Y1 Y2 .

Pada pemodelan Stata, hubungan resiprokal antar variabel Y1 dan Y2 dituliskan


sebagai sem (Y2 < Y1) (Y1 < Y2)
3. Variansi:
Variansi suatu variabel eksogen dinyatakan dengan lambang anak panah berkepala-
ganda, yang berawal dan berakhir pada variabel yang sama ( ).
Dalam SEM, semua variabel eksogen dan suku pengganggu memiliki variansi,
sedangkan variabel endogen tidak memiliki variansi.

7
Bab 1. Pendahuluan

Pada pemodelan Stata dengan mode interaktif, keberadaan variansi tidak perlu
dicantumkan, walaupun diasumsikan semua variabel eksogen dan suku pengganggu
memiliki variansi.
4. Kovariansi dan korelasi:
Kovariansi atau korelasi dinyatakan dengan lambang anak panah berkepala-ganda,
yang berawal dan berakhir pada dua variabel berbeda ( ).
Kovariansi diasumsikan selalu ada antar variabel eksogen, walaupun tidak
digambarkan dalam model. Selain itu, kovariansi mungkin ada (tidak selalu, tergantung
model peneliti) antar suku pengganggu. Kovariansi tidak ditemukan antar variabel
endogen. Secara statistik, kovariansi dalam SEM disebut sebagai asosiasi tak-
teranalisis (unanalyzed association) atas dasar asumsi bahwa pada kovariansi antar dua
variabel terdapat variabel ketiga yang tak diketahui dan tak dianalisis yang menimbulkan
efek terhadap kedua variabel yang berkovariansi sekaligus.
Pada Stata, kovariansi dituliskan sebagai cov(var1*var2), misalnya kovariansi antar
variabel eksogen usia dan pendidikan dituliskan sebagai cov(usia*pendidikan),
sedangkan kovariansi antar suku pengganggu e.sistolik dan e.kolesterol dituliskan
sebagai cov(e.sistolik*e.kolesterol).

8
Bab 2. Telaah Ulang Analisis Regresi

BAB 2
TELAAH ULANG ANALISIS REGRESI

Model dan Persamaan Regresi


Pemahaman tentang analisis regresi merupakan prasyarat untuk mempelajari analisis
jalur (path analysis; PA). Analisis regresi adalah suatu teknik statistika untuk mengkaji
hubungan antara satu atau lebih variabel independen kontinu dengan satu variabel dependen
kontinu. Analisis regresi dapat berupa regresi sederhana (simple regression) jika hanya ada
satu variabel independen atau regresi ganda (multiple regression) jika didapatkan lebih
daripada satu variabel independen. Kadang-kadang analisis regresi juga digunakan untuk
variabel independen yang berskala kategorik, yang dinyatakan dalam bentuk variabel
indikator yang hanya bernilai nol atau satu.
Model dan persamaan garis regresi sederhana masing-masing dinyatakan sebagai:
yi = 0 + 1 xi + i (2.1)

dan y = 0 + 1 x (2.2)

0 : intersep (intercept); konstante


1 : kemiringan (slope); koefisien regresi
xi : variabel independen; regresor; prediktor

yi : variabel dependen; outcome; kriterion

i : suku galat (error); residual


Estimasinya yang diperoleh dari data sampel masing-masing adalah:
yi = b0 + b1 xi + ei (2.1.a)

dan y = b0 + b1 x (2.2.a)

dengan b0 sebagai estimator untuk 0 ( 0 = b0 ) dan b1 sebagai estimator untuk 1

b .
1 1

Model dan persamaan garis regresi ganda (dengan 2 variabel independen X 1 dan X 2 )
masing-masing dinyatakan sebagai:
yi = 0 + 1 x1i + 2 x2i + i (2.3)

dan y = 0 + 1 x1 + 2 x2 (2.4)

9
Bab 2. Telaah Ulang Analisis Regresi

Estimasinya masing-masing adalah:


yi = b0 + b1 x1i + b2 x2i + ei (2.3.a)

dan y = b0 + b1 x1 + b2 x2 (2.4.a)
Estimasi koefisien regresi pada regresi sederhana maupun ganda dilakukan dengan
metode kuadrat terkecil (ordinary least square; OLS). Salah satu asumsi yang penting bagi
OLS ialah tidak adanya korelasi antara variabel independen dengan suku residual variabel
dependen.

Contoh 2.1:
Misalkan dimiliki data hipotetis seperti terlihat pada tabel 2.1. Hasil regresi y terhadap
x1 diperlihatkan pada tabel 2.2.a, sedangkan hasil regresi y terhadap x1 dan x2 diperlihatkan
pada tabel 2.2.b.

Tabel 2.1 Contoh data hipotetis untuk analisis regresi

No y x1 x2
1 116 49 240
2 152 48 209
3 134 55 210
4 132 49 171
5 130 50 255
6 118 52 232
7 136 48 147
8 108 59 268
9 108 59 231
10 128 52 199
Rerata y = 126.2 x1 = 52.1 x2 = 216.2
SD s y = 13.77 s1 = 4.23 s2 = 37.18

Tabel 2.2 Hasil analisis regresi untuk data hipotetis tabel 2.1

a. Model regresi sederhana: y = 0 + 1 x1 +

b SE(b) B t Nilai-p
Konstante 245.42 42.84 5.73 < 0.001
x1 2.29 0.82 0.70 2.79 0.024
2
n = 10; R = 0.49

10
Bab 2. Telaah Ulang Analisis Regresi

b. Model regresi ganda: y = 0 + 1 x1 + 2 x2 +

b SE(b) B t Nilai-p
Konstante 242.97 43.15 5.63 0.001
x1 1.81 0.97 0.55 1.87 0.104
x2 0.11 0.11 0.28 0.96 0.371
2
n = 10; R = 0.55

Data Tak-terstandardisasi dan Terstandardisasi


Data seperti pada tabel 2.1 dinyatakan sebagai sebagai data dalam bentuk tak-
terstandardisasi (unstandardized). Data tak-standardisasi x dapat diubah menjadi data
terstandardisasi (standardized) z yang memiliki rerata nol dan standar deviasi satu dengan
rumus transformasi:
x
z= (2.5)

Misalkan z y adalah bentuk terstandardisasi untuk variabel y dan z1 adalah bentuk

terstandardisasi untuk variabel x1 , maka regresi z y terhadap z1 akan menghasilkan model

dan persamaan garis regresi:


z yi = B1 z1i + zei (2.6)

dan z y = B1 x1 (2.7)

B (beta) : Koefisien regresi untuk bentuk terstandardisasi


Garis regresi untuk bentuk terstandardisasi ini selalu melalui titik pangkal [0 ; 0],
sehingga suku konstante selalu bernilai sama dengan nol (tidak ada suku konstante). Nilai k

dan estimasinya bk dalam analisis regresi dinamakan koefisien regresi, sedangkan nilai Bk
(beta) dalam analisis jalur disebut koefisien jalur (ada yang menyebutnya hanya sebagai path
/ jalur). Perhatikan bahwa ada kepustakaan yang menamakan k juga sebagai koefisien jalur,

namun di sini istilah koefisien jalur hanya digunakan untuk Bk (beta).


Untuk model regresi ganda dengan 2 prediktor seperti pada tabel 2.2.b, beta dapat
diperoleh dari persamaan:
s s
B1 = b1 1 dan B2 = b2 2 (2.8)
sy sy

11
Bab 2. Telaah Ulang Analisis Regresi

s1 : standar deviasi x1

s2 : standar deviasi x2

Contoh 2.2:
y y x x
Lihat kembali data hipotetis pada tabel 2.1. Dengan transformasi z y = ; z1 = 1 1
sy s1

x2 x2
; dan z2 = diperoleh data terstandardisasi seperti terlihat pada tabel 2.3.
s2
Berdasarkan hasil analisis regresi pada tabel 2.2, diperoleh model regresi tak-
standardisasi dan terstandardisasi seperti yang ditampilkan pada tabel 2.4.

Tabel 2.3 Contoh data dalam bentuk tak-terstandardisasi dan bentuk terstandardisasi

No y x1 x2 zy z1 z2
1 116 49 240 0.74 0.73 0.64
2 152 48 209 1.87 0.97 0.19
3 134 55 210 0.57 0.69 0.17
4 132 49 171 0.42 0.73 1.22
5 130 50 255 0.28 0.50 1.04
6 118 52 232 0.60 0.02 0.42
7 136 48 147 0.71 0.97 1.86
8 108 59 268 1.32 1.63 1.39
9 108 59 231 1.32 1.63 0.40
10 128 52 199 0.13 0.02 0.46
Rerata 126.2 52.1 216.2 0.00 0.00 0.00
SD 13.77 4.23 37.18 1.00 1.00 1.00

Tabel 2.4 Model regresi untuk data tak-terstandardisasi dan terstandardisasi


beserta estimasinya

Tak-terstandardisasi Terstandardisasi
Regresi Model y = 0 + 1 x1 + z y = B1 z1 + z
sederhana
Estimasi y = 245.42 2.29 x1 + e z y = 0.70 z1 + ze
Regresi Model y = 0 + 1 x1 + 2 x2 + z y = B1 z1 + B2 z2 + z
ganda
Estimasi y = 242.97 1.81 x1 0.11 x2 + e z y = 0.55 z1 0.28 z2 + ze

12
Bab 2. Telaah Ulang Analisis Regresi

Matriks Kovariansi dan Korelasi


Variansi variabel random x dan kovariansi antara variabel random x dan y masing-
masing adalah:

Var x = E x x
2
(2.8)

Cov x ; y = E x x y y (2.9)

Estimasi dari data sampel adalah:

i xi x
2

x =
Var (2.8.a)
n 1

i xi x yi y
x ; y=
Cov (2.9.a)
n 1
Jika variabel random x dan y masing-masing dikonversi menjadi bentuk terstandardisasi
z x dan z y , maka korelasi antara x dan y sama dengan kovariansi antara z x dan z y :


Corr x ; y = Cov z x ; z y (2.10)

Korelasi antara x dan y dapat juga diperoleh dari persamaan:


Cov x ; y
Corr x ; y = (2.11)
x y
Estimasi dari data sampel adalah:
x ; y
Cov
x ; y =
Corr (2.11.a)
sx s y

Contoh 2.3:
Lihat data hipotetis pada tabel 2.1 dan bentuk terstandardisasinya pada tabel 2.3.
Matriks kovariansi dan korelasinya untuk data tak-standardisasi diperlihatkan pada tabel 2.5,
sedangkan matriks kovariansi dan korelasi untuk data terstandardisasi disajikan pada tabel
2.6. Perhatikan bahwa untuk data terstandardisasi, matriks kovariansinya identik dengan
matriks korelasi.

13
Bab 2. Telaah Ulang Analisis Regresi

Tabel 2.5 Matriks kovariansi dan korelasi untuk data tak-terstandardisasi

Matriks kovariansi Matriks korelasi


y x1 x2 y x1 x2
y 189.73 y 1.00
x1 40.91 17.88 x1 0.70 1.00
x2 293.60 82.20 1382.40 x2 0.57 0.52 1.00

Tabel 2.6 Matriks kovariansi dan korelasi untuk data terstandardisasi

Matriks kovariansi Matriks korelasi


zy z1 z2 zy z1 z2
zy 1.00 zy 1.00
z1 0.70 1.00 z1 0.70 1.00
z2 0.57 0.52 1.00 z2 0.57 0.52 1.00

Analisis Regresi dengan Stata


Terdapat beberapa cara untuk membuat file data Stata, cara yang termudah ialah
dengan membuat file basis-data dalam Excel, yang kemudian di-import ke dalam Stata.
Selanjutnya akan diperlihatkan prosedur analisis regresi dalam Stata dengan perintah regress.

Contoh 2.4 (Membuat file data Stata):

Masukkan data hipotetis hubungan antara tekanan darah sistolik (y), usia (x1), dan
kadar kolesterol serum (x2) yang ada pada tabel 2.1 pada lembar isian (spreadsheet) Excel.
Simpan data pada folder D:\SEM\Data dengan nama sistolik.xls.

Perintah Stata:
Ambil file Excel sistolik.xls untuk dibuka dalam format Stata, selanjutnya simpan data
dalam format data Stata:

. import excel using D:\SEM\Data\sistolik.xls, firstrow


. label variable y "tekanan darah sistolik"
. label variable x1 "usia"
. label variable x2 "kadar kolesterol serum"
. save D:\SEM\Data\sistolik.dta

file D:\SEM\Data\sistolik.dta saved

14
Bab 2. Telaah Ulang Analisis Regresi

Perintah import adalah perintah Stata untuk mengambil file data dalam format
non-Stata (umumnya file Excel) dan dibuka dalam format Stata. Perintah label adalah
perintah untuk memberi label bagi variabel tertentu. Setelah itu file masih harus disimpan
dalam format Stata dengan perintah save untuk memudahkan penggunaannya pada sesi
lebih lanjut.

Contoh 2.5 (Analisis regresi dengan Stata):


Perintah Stata:
. use D:\SEM\Data\sistolik.dta, clear
. regress y x1

y Coef. Std. Err. t P>| t| [ 95% Conf. Interval]


x1 2.288378 .8197659 2.79 0.024 4.178762 .3979942
_cons 245.4245 42.8362 5.73 0.000 146.644 344.2049

Perintah regress adalah perintah Stata untuk melaksanakan analisis regresi linear,
baik sederhana maupun ganda. Perintah regress diikuti oleh nama variabel dependen,
dan selanjutnya disusul oleh nama variabel independen.

. regress y x1 x2

y Coef. Std. Err. t P>| t| [ 95% Conf. Interval]


x1 1.805473 .9670317 1.87 0.104 4.09214 .4811937
x2 .1050276 .1099716 0.96 0.371 .3650691 .155014
_cons 242.9721 43.14995 5.63 0.001 140.9387 345.0055

15
Bab 2. Telaah Ulang Analisis Regresi

Contoh 2.6 (Analisis regresi terstandardisasi dengan Stata):


Perintah Stata:
. use D:\SEM\Data\sistolik.dta, clear
. regress y x1, beta

y Coef. Std. Err. t P>| t| Beta


x1 2.288378 .8197659 2.79 0.024 .7024456
_cons 245.4245 42.8362 5.73 0.000 .

Perintah use adalah perintah Stata untuk membuka file data Stata (file dengan
ekstensi *.dta). Opsi ,clear pada perintah use setelah nama dan jalur (path) file
yang akan dibuka merupakan perintah untuk menghapus semua isi file data Stata terakhir
yang masih terbuka dan ada dalam memori komputer. Opsi , beta pada perintah
regress setelah nama variabel independen merupakan perintah untuk menampilkan
koefisien beta, yaitu koefisien regresi terstandardisasi.
. regress y x1 x2, beta

y Coef. Std. Err. t P>| t| Beta


x1 1.805473 .9670317 1.87 0.104 .554212
x2 .1050276 .1099716 0.96 0.371 .283497
_cons 242.9721 43.14995 5.63 0.001 .

Contoh 2.7 (Regresi linear, contoh pada manual Stata):

File data: auto.dta


Variabel:
variable name variable label
weight Weight (lbs.)
foreign Cartype
mpg Miliage (mpg)

16
Bab 2. Telaah Ulang Analisis Regresi

Model:

Persamaan:
mpg = + 1weight + 2weight2 + 3foreign + 1

Perintah regress (analisis regresi linear):

. sysuse auto
. regress mpg weight c.weight#c.weight foreign

Source SS df MS Number of obs = 74


F(3,70) = 52.25
Model 1689.15372 3 563.05124 Prob > F = 0.0000
Residual 754.30574 70 10.7757963 R-squared = 0.6913
Adj R-squared = 0.6781
Total 2443.45946 73 33.4720474 Root MSE = 3.2827

mpg Coef. Std. Err. t P>|t| [95% Conf. Interval]


weight .0165729 .0039692 4.18 0.000 .0244892 .0086567

c.weight#c.weight 1.59e-06 6.25e-07 2.55 0.013 3.45e-07 2.84e-06

foreign 2.2035 1.059246 2.08 0.041 4.3161 .0909002


_cons 56.53884 6.197383 9.12 0.000 44.17855 68.89913

. regress, beta

mpg Coef. Std. Err. t P>|t| Beta


weight .0165729 .0039692 4.18 0.000 2.226321

c.weight#c.weight 1.59e-06 6.25e-07 2.55 0.013 1.32654

foreign 2.2035 1.059246 2.08 0.041 .17527


_cons 56.53884 6.197383 9.12 0.000 .

Perintah sysuse adalah perintah untuk membuka file data Stata yang dipasok oleh
provider Stata dan disimpan dalam basis-data Stata pada saat meng-install program Stata.
Dengan perintah sysuse cukup dituliskan nama file yang akan dibuka tanpa perlu
menuliskan jalurnya. Pada perintah regress pertama di atas nama variabel dependen
dan independennya harus ditulis lengkap, namun dalam perintah regress kedua yang

17
Bab 2. Telaah Ulang Analisis Regresi

disertai opsi , beta nama-nama variabel tidak usah dituliskan lagi, asal perintah
regress kedua langsung diberikan setelah perintah regress pertama tanpa
diselingi perintah Stata lainnya.
Pembahasan lebih rinci tentang perintah-perintah Stata untuk analisis regresi linear
dapat dilihat pada Lampiran 2.

18
Bab 3. Konsep-konsep Dasar Analisis Jalur

BAB 3
KONSEP-KONSEP DASAR ANALISIS JALUR

Analisis Jalur dan Model Struktural


Model struktural dalam SEM adalah model yang menggambarkan struktur hubungan
antara sejumlah variabel teramati. Variabel teramati (observed variables) adalah variabel
yang nilainya ada dalam himpunan-data (dataset). Dalam model ini tidak dipentingkan cara
pengukuran yang dilakukan untuk memperoleh nilai-nilai untuk variabel tersebut.
Berdasarkan arahnya, efek antar-variabel dibedakan menjadi efek searah dan efek
resiprokal. Efek searah adalah efek yang terjadi secara searah antara variabel kausal (sebab)
dengan variabel efek (akibat), misalnya efek searah variabel X terhadap variabel Y (X Y).
Efek resiprokal adalah efek yang terjadi secara dua-arah antar dua variabel, misalnya efek
resiprokal antara variabel Y1 dan Y2 ( Y1 Y2 ). Pada efek resiprokal ini tidak dapat dibedakan

variabel mana yang merupakan variabel kausal atau variabel efek.

Asumsi dalam Analisis Jalur

Asumsi-asumsi dalam analisis jalur dapat dibagi menjadi dua kelompok:

1. Asumsi teoretis:
Asumsi kausalitas yang tergantung pada terpenuhinya persyaratan berikut:
a. Model dispesifikasikan dengan benar.
b. Ada hubungan teramati dan dapat diukur (observed and measurable relationship)
antara variabel independen X dan variabel dependen Y (ada korelasi antara X dan Y).
c. Ada urutan temporal: variabel independen X secara temporal harus terjadi
mendahului variabel dependen Y.
d. Tidak ada hubungan palsu (nonspurious relationship) antara variabel independen X
dan variabel dependen Y (hubungan teramati, dapat diukur, dan temporal antara X
dan Y tidak hilang dengan pengendalian terhadap efek variabel-variabel lain).

2. Asumsi statistika:
a. Asumsi yang terkait dengan regresi ganda: asumsi normalitas, homoskedastisitas,
dan linearitas.

19
Bab 3. Konsep-konsep Dasar Analisis Jalur

b. Besar hubungan antara dua variabel independen yang berkorelasi satu sama lain dan
tak-teranalisis direpresentasikan oleh koefisien korelasinya.
c. Pengukuran variabel endogen sekurang-kurangnya berskala interval.
d. Pengukuran variabel eksogen bersifat bebas-galat.
e. Arah hubungan kausal terspesifikasi dengan benar: apakah X menyebabkan Y (X
Y), Y menyebabkan X (Y X), atau terdapat hubungan resiprokal (X Y).
f. Bentuk distribusi diketahui: Bentuk distribusi probabilitas parameter
dispesifikasikan.

Parameter dan Derajat Bebas Model

Pada model struktur kovariansi (SEM tanpa analisis rerata), parameter-nya adalah efek
langsung terhadap variabel endogen serta variansi dan kovariansi variabel eksogen. Efek
langsung yang dimaksud adalah efek yang besarnya yaitu nilai parameternya harus
diestimasi. Dengan demikian maka jumlah parameter q dapat ditentukan dengan
menghitung jumlah lambang , , dan dalam diagram SEM, yaitu jumlah efek langsung
searah (koefisien regresi), variansi, dan kovariansi.
Parameter model dapat bersifat bebas, terfiksasi, ataupun terkendala. Parameter bebas
(free parameter) harus diestimasi berdasarkan data yang ada. Parameter terfiksasi (fixed
parameter) dispesifikasikan nilainya sama dengan konstante tertentu. Parameter terkendala
(constrained parameter) harus diestimasi dalam batasan tertentu, namun nilainya tidak
terfiksasi sama dengan konstante tertentu. Dalam perhitungan jumlah parameter di atas,
parameter terfiksasi tidak diikutsertakan. Dua parameter yang dikendalakan memiliki nilai
yang sama tetapi tidak difiksasikan besar nilainya, diperhitungkan sebagai satu parameter
dalam menghitung jumlah parameter. Dalam pembahasan selanjutnya, istilah terfiksasi dan
terkendala ini akan seringkali saling dipertukarkan dengan pengertian yang sama.
Jika menyatakan jumlah variabel teramati dalam model, maka banyak nilai pada
diagonal matriks kovariansi dan di bawahnya, yang menyatakan banyak nilai variansi dan
kovariansi tak-berulang (nonredundant covariances; kovariansi unik) adalah:
+ ( 1) + ( 2) + . . . + 1
Banyak nilai ini dinamakan juga sebagai jumlah titik data (number of data points) untuk
model struktur kovariansi, yaitu:
1
p= (3.1)
2

20
Bab 3. Konsep-konsep Dasar Analisis Jalur

p : jumlah pengamatan
: jumlah variabel teramati dalam model
Selisih antara jumlah titik data dengan jumlah parameter merupakan derajat bebas
model, yaitu:
df M = p q (3.2)

df M : derajat bebas model

q : jumlah parameter yang diestimasi


Jumlah titik data p merupakan jumlah parameter maksimal yang dapat diestimasi dalam
suatu model persamaan struktural. Kline (2005) menamakan jumlah titik data ini sebagai
jumlah pengamatan (number of observations) bagi struktur kovariansi yang berbeda dengan
ukuran sampel n. Ada pula yang menyebutkannya sebagai jumlah moment sampel
(number of sample moments). Pada program Stata istilah jumlah pengamatan memiliki
pengertian yang sama dengan ukuran sampel N (lambang ukuran sampel pada Stata),
sedangkan jumlah titik data dinamakan sebagai momen derajat-dua (second-order moments).

Tipe Model Jalur

Didapatkan dua tipe dasar model jalur yaitu model rekursif dan model non-rekursif.
Model rekursif adalah model jalur dengan seluruh hubungan antar-variabelnya bersifat
searah (efek searah) yang tidak membentuk loop tertutup dan seluruh suku pengganggunya
tak saling berkorelasi. Contoh model rekursif diperlihatkan pada gambar 3.1.a.
Model non-rekursif adalah model jalur yang memiliki sekurang-kurangnya satu loop
tertutup atau hubungan antar-variabel dua-arah (efek resiprokal) dan/atau suku pengganggu
yang saling berkorelasi. Contoh model non-rekursif diperlihatkan pada gambar 3.1.b. Selain
itu masih didapatkan model jalur yang bersifat rekursif parsial (gambar 3.2).

21
Bab 3. Konsep-konsep Dasar Analisis Jalur

Gambar 3.1 (a) Contoh model rekursif (kiri); (b) Contoh model non-rekursif (kanan)

Gambar 3.2 Contoh model rekursif parsial: (a) Pola bebas-busur (dianggap rekursif;
kiri) dan (b) Pola busur (dianggap non-rekursif; kanan)

Pola bebas-busur (bow-free pattern) seperti pada gambar 3.2 kiri adalah pola dengan
korelasi antara dua suku pengganggu tanpa adanya jalur antara variabel endogennya. Dalam
estimasi parameter, pola ini dapat diperlakukan seperti model rekursif. Pada pola busur (bow
pattern; gambar 3.2 kanan), korelasi antara dua suku pengganggu disertai dengan jalur antara
kedua variabel endogennya.

Identifikasi Model

Sebuah model jalur dikatakan teridentifikasi (identified) jika secara teoretis


dimungkinkan untuk memperoleh estimasi yang unik bagi setiap parameter.
Persyaratan untuk identifikasi model SEM ialah: (1) Jumlah titik data lebih besar atau sama
dengan jumlah parameter yang diestimasi ( df M > 0), dan (2) Variabel laten (tidak ada yang

22
Bab 3. Konsep-konsep Dasar Analisis Jalur

dianalisis pada model jalur) sekurang-kurangnya berskala interval. Berdasarkan status


identifikasinya, model jalur dibedakan menjadi:
1. Kurang-teridentifikasi (under-identified): df M < 0

2. Tepat-teridentifikasi (just-identified): df M = 0

3. Lebih-teridentifikasi (over-identified): df M > 0


Model yang tepat-teridentifikasi, yang disebut juga sebagai model jenuh hanya
memiliki sedikit kegunaan, walaupun sesuai sempurna dengan data. Kegunaannya yaitu
hanya untuk mengestimasi koefisien regresi dan koefisien jalur. Jika model kurang-
teridentifikasi, estimasi parameter tak dapat dilakukan dan peneliti dianjurkan untuk
memperbaiki model dengan mengurangi jumlah parameter yang hendak diestimasi. Hanya
pada model yang lebih-teridentifikasi analisis SEM disarankan diteruskan.
Model rekursif secara teoretis akan selalu teridentifikasi, namun dapat menjadi
kurang teridentifikasi secara empirik (empirical under-identified) karena adanya
multikolinearitas. Estimasi parameter untuk model kurang-teridentifikasi dengan program
statistik komputer akan menyebabkan berlangsungnya proses iteratif secara terus menerus
tanpa konvergensi. Cara mengatasinya adalah menghentikan program dan mengulangi proses
estimasi dengan terlebih dahulu menentukan batasan jumlah iterasi.
Adakalanya tidak mudah untuk menentukan status identifikasi bagi model yang rumit.
Dalam hal ini Brown (2006) menganjurkan untuk menjalankan program statistik komputer
dan membiarkan program komputer yang menentukan status identifikasi model.

Ukuran Sampel
Perhatikan bahwa pada sebagian literatur tentang SEM, istilah ukuran sampel (jumlah
anggota sampel) memiliki pengertian yang berbeda dengan istilah jumlah pengamatan
(Kline, 2005). Seperti halnya dengan teknik statistika lainnya, sampel besar akan
menghasilkan estimasi dengan galat sampling (sampling error) lebih kecil daripada yang
dihasilkan oleh sampel kecil. Perhitungan ukuran sampel minimum yang dibutuhkan dapat
dilakukan berdasarkan analisis kekuatan (power analysis) yang diinginkan, namun secara
kasar ukuran sampel dapat dibedakan menjadi:
- Sampel kecil: N < 100
- Sampel sedang: 100 < N < 200
- Sampel besar: N > 200

23
Bab 3. Konsep-konsep Dasar Analisis Jalur

Ukuran sampel minimum yang dibutuhkan juga dapat dihitung secara kasar dengan
rasio 10 : 1 terhadap jumlah parameter yang diestimasi, misalnya model jalur dengan 20
parameter akan membutuhkan ukuran sampel minimum sebesar 200 kasus. Jackson (2003)
menganjurkan rasio ukuran sampel minimum ideal : parameter model sebesar 20 : 1 untuk
estimasi maximum likelihood.

Hubungan Antar-Variabel
Hubungan antara variabel terdiri atas efek kausal dan asosiasi non-kausal. Efek kausal
adalah efek yang diasumsikan menyatakan kausalitas (hubungan sebab-akibat) antar dua
variabel, dapat berupa efek langsung ataupun efek tak-langsung.
Efek langsung (direct effect) adalah efek kausal hipotetis suatu variabel terhadap
variabel kedua yang terjadi secara langsung tanpa melalui variabel ketiga. Efek searah suatu
variabel terhadap variabel lainnya dinyatakan dengan lambang anak panah (). Misalnya,
efek langsung variabel X terhadap variabel Y dinyatakan sebagai X Y. Besarnya efek
searah dinyatakan sebagai koefisien regresi (tak-terstandardisasi) atau koefisien jalur
(terstandardisasi).
Efek tak-langsung (indirect effect) adalah efek kausal hipotetis suatu variabel terhadap
variabel kedua yang terjadi melalui satu atau lebih variabel mediator (intervening variables).
Misalnya, efek tak langsung variabel X terhadap variabel Y2 yang terjadi melalui variabel

mediator Y1 dinyatakan sebagai X Y1 Y2 . Jika bX 1 menyatakan koefisien regresi X

terhadap Y1 dan b12 menyatakan koefisien regresi Y1 terhadap Y2 , maka besar efek tak-

langsung (tak-terstandardisasi) X terhadap Y2 adalah bX 1 . b12 . Dalam bentuk terstandardisasi

jika p X 1 menyatakan koefisien jalur X terhadap Y1 dan p12 menyatakan koefisien jalur Y1

terhadap Y2 , maka besar efek tak-langsung terstandardisasi X terhadap Y2 adalah p X 1 . p12 .


Asosiasi non-kausal adalah hubungan suatu variabel dengan variabel kedua yang
terjadi melalui variabel ketiga yang berkorelasi namun asosiasinya tak-teranalisis dengan
variabel pertama, dinyatakan sebagai X 1 X 2 Y atau X 1 X 2 Y1 . . . Yk

24
BAB 4
ESTIMASI PARAMETER

Parameter Model Jalur


Untuk menjelaskan dasar-dasar perhitungan estimasi pada SEM, digunakan contoh
model jalur Illness oleh Roth et al (1989) yang dalam bentuk penyederhanaan dapat
diperlihatkan seperti pada gambar 4.1.

Gambar 4.1 Contoh model jalur Illness (Roth et al, 1989)

Dengan teknik statistika regresi ganda, model di atas dapat diuraikan menjadi tiga
model regresi ganda:
Fit = A3 + B13 Exe + B23 Hard + D3 (4.1)

Str = A4 + B14 Exe + B24 Hard + B34 Fit + D4 (4.2)

Ill = A5 + B15 Exe + B25 Hard + B35 Fit + B45 Str + D5 (4.3)
Keterangan:
1-Exe: Exercise; 2-Hard: Hardiness; 3-Fit: Fitness; 4-Str: Stress; 5-Ill: Illness.
Dalam notasi SEM, gambaran model jalur di atas biasanya disajikan lebih lengkap
seperti terlihat pada gambar 4.2, dengan beberapa tambahan:
a. Variansi untuk tiap variabel eksogen (Exe dan Hard)
b. Korelasi antar variabel eksogen (antara Exe dengan Hard)
c. Suku pengganggu (disturbance) untuk tiap variabel endogen ( DFi , DSt , dan DIl ).

d. Variansi untuk tiap suku pengganggu (variansi DFi , DSt , dan DIl ).

25
e. Koefisien jalur tiap suku pengganggu ke variabel endogennya yang terfiksasi menjadi
bernilai sama dengan 1 ( DFi Fit, DSt Str, dan DIl Ill).
Anak panah yang terputus-putus dimaksudkan untuk menyatakan perkiraan bahwa
koefisien regresi atau koefisien jalurnya bernilai sama dengan nol.

Gambar 4.2 Contoh model jalur Illness dalam notasi SEM

Estimasi matriks kovariansi dan korelasi data Illness yang diperoleh dengan metode
ML (maximum likelihood) dari sampel yang terdiri atas 373 orang mahasiswa diperlihatkan
pada tabel 4.1. Perhatikan bahwa dengan teknik statistika standar, variansi populasi 2

xi x
2
2
diestimasikan dengan variansi sampel s = , tetapi dengan metode ML variansi
n 1

xi x
2

populasi diestimasikan sebagai S


2 2
= . Untuk sampel besar, nilai s 2 dan S 2
n
dapat dianggap sama, namun untuk sampel kecil S 2 merupakan estimator yang bias negatif
bagi variansi populasi 2 . Juga untuk kovariansi sampel, estimasi tak biasnya adalah

cov( x1 ; x2 ) =
x1i x1 x2i x2 , namun dengan metode ML kovariansi populasi
n 1

diestimasikan sebagai Cov ( x1 ; x2 ) =


x1i x1 x2i x2
n

26
xi x
2
2
Akibat penggunaan S = sebagai estimasi variansi populasi yaitu:
n
- Nilai estimasi rerata variabel terstandardisasi tidak sama dengan nol.
- Untuk model regresi terstandardisasi, nilai estimasi intersep tidak sama dengan nol.

Tabel 4.1 Estimasi matriks kovariansi dan korelasi data Illness


a. Matriks kovariansi
Variabel Exe Hard Fit Str Ill
1. Exe 4422.25
2. Hard 75.81 1444.00
3. Fit 954.41 97.89 1354.24
4. Str 222.78 585.58 320.53 4489.00
5. Ill 332.39 379.88 666.79 1423.29 3903.75

b. Matriks korelasi
Variabel Exe Hard Fit Str Ill
1. Exe 1.00
2. Hard 0.03 1.00
3. Fit 0.39 0.07 1.00
4. Str 0.05 0.23 0.13 1.00
5. Ill 0.08 0.16 0.29 0.34 1.00
SD 66.50 38.00 36.80 67.00 62.48

Perhatikan bahwa kedua matriks ini saling berkaitan, dari matriks kovariansi dapat
diperoleh matriks korelasi, sebaliknya dari matrik korelasi dan nilai-nilai standar deviasi
dapat dihitung matriks kovariansi.

Contoh 4.1:
Dari nilai Cov (Exe ; Fit) = 954.41, Var (Exe) = 4422.25, dan Var (Fit) = 1354.24 dapat
dihitung nilai Corr (Exe ; Fit):
Cov Exe ; Fit
Corr (Exe ; Fit) =
SD Exe SD Fit

954.41
= = 0.39
4422.25 1354.24
Atau nilai Cov (Hard ; Str) dapat dihitung dari Corr (Hard ; Str) = 0.23, SD (Hard) =
38.00, dan SD (Str) = 67.00:

27
Cov (Hard ; Str) = Corr (Hard ; Str) . SD (Hard) . SD (Str)
= (0.23)(38.00)(67.00) = 585.58

Estimasi Efek pada Model Jalur


Estimasi nilai-nilai koefisien jalur yang dilakukan dengan metode maximum likelihood
memerlukan proses iteratif, sehingga umumnya tak dapat dilakukan secara manual, tetapi
membutuhkan program komputer untuk menyelesaikannya. Pada program statistik komputer
demikian, sebagai masukan (input) dapat diisikan nilai-nilai tiap variabel teramati yang ada
pada dataset, namun dapat juga diberikan matriks kovariansi atau korelasi (disertai standar
deviasi tiap variabel).

Gambar 4.3 Model jalur Illness dengan nilai-nilai estimasi koefisien regresi (atas)
dan koefisien jalurnya (bawah)
28
Sebagai contoh, untuk data Illness di atas menghasilkan estimasi nilai-nilai koefisien
regresi (tak-terstandardisasi; atas) dan koefisien korelasi (terstandardisasi; bawah) seperti
terlihat pada gambar 4.3, sedangkan hasil penilaian kemaknaannya diperlihatkan pada tabel
4.2.

Tabel 4.2 Estimasi parameter tak-terstandardisasi dan terstandardisasi


model jalur Illness
a. Efek langsung

Parameter bij
SE bij pij
Exe Fit .217** .026 .392
Hard Fit .079 .046 .082
Exe Str .014 .055 .014
Hard Str .393** .089 .223
Fit Str .198 .099 .109
Exe Ill .032 .048 .034
Hard Ill .121 .079 .074
Fit Ill .442** .087 .260
Str Ill .271** .045 .291

b. Variansi dan kovariansi


Parameter Var (X) SE (X) Var (Z)
Exe 4410.39** 323.39 1.000
Hard 1440.13** 105.60 1.000
Exe Hard 75.607 130.73 .030
DFit 1136.16** 83.31 .841
DStr 4181.00** 306.57 .934
DIll 3178.98** 233.09 .817
*: p < .05; **: p < .01
Sumber: Roth et al (1989); N = 373

Interpretasi terhadap nilai-nilai estimasi pada model jalur Illness tersebut ialah:
1. Besar efek langsung adalah sama dengan koefisien regresi pada model tak-
terstandardisasi dan koefisien jalur (nilai beta) pada model terstandardisasi.
Untuk contoh di atas, efek langsung b13 = 0.217 pada gambar 4.3 atas adalah estimasi

koefisien regresi Exe ke Fit (Exe Fit), sedangkan efek langsung p13 = 0.392 pada
gambar 3 bawah adalah estimasi koefisien jalur Exe ke Fit.

29
2. Variansi suku pengganggu pada model tak terstandardisasi merupakan estimasi bagi
variansi variabel endogen yang berkaitan yang tak dijelaskan oleh variabel eksogen yang
merupakan prediktornya.
Untuk contoh pada gambar 4.3 atas, variansi suku pengganggu DFi sebesar 1136.16
adalah estimasi variansi Fit yang tak dijelaskan oleh Exe dan Hard. Estimasi variansi Fit
seluruhnya, termasuk yang dijelaskan oleh Exe dan Hard, adalah 1354.24 (matriks 1.a).
3. Untuk model terstandardisasi, variansi variabel eksogen selalu sama bernilai 1,
sedangkan variansi suku pengganggu merupakan estimasi proporsi variansi variabel
endogen yang berkaitan yang tak dijelaskan oleh variabel eksogen prediktornya.
Untuk contoh pada gambar 4.3 bawah, variansi suku pengganggu DFi sebesar 0.841
adalah estimasi proporsi variansi Fit yang tak dijelaskan oleh Exe dan Hard. Nilai ini
sama besarnya dengan 1 RFi
2 2
, RFi adalah koefisien determinasi Fit pada regresinya
terhadap Exe dan Hard.

Dekomposisi Efek
Koefisien korelasi adalah ukuran kekuatan hubungan terstandardisasi antara dua
variabel kontinu. Pada SEM, hubungan antara variabel dapat dibedakan menjadi efek kausal
dan asosiasi non-kausal. Efek kausal adalah efek yang diasumsikan menyatakan kausalitas
(hubungan sebab-akibat) antar dua variabel, dapat berupa efek langsung ataupun efek tak-
langsung.
Efek langsung (direct effect) adalah efek kausal hipotetis suatu variabel terhadap
variabel kedua yang terjadi secara langsung tanpa melalui variabel ketiga. Efek searah suatu
variabel terhadap variabel lainnya dinyatakan dengan lambang anak panah (). Misalnya,
efek langsung variabel x terhadap variabel y digambarkan sebagai x y. Besarnya efek
searah dinyatakan sebagai koefisien regresi (tak-terstandardisasi) atau koefisien jalur
(terstandardisasi).
Efek tak-langsung (indirect effect) adalah efek kausal hipotetis suatu variabel terhadap
variabel kedua yang terjadi melalui satu atau lebih variabel mediator (intervening variables).
Efek tak langsung variabel x terhadap variabel y2 yang terjadi melalui variabel mediator y1

dalam hubungan x y1 y2 adalah:

bx 2 = bx1 . b12 (4.4)

30
bx 2 : efek tak-langsung (tak-terstandardisasi) x terhadap y2

bx1 : efek langsung (tak-terstandardisasi) x terhadap y1 (koefisien regresi x ke y1 )

b12 : efek langsung (tak-terstandardisasi) y1 terhadap y2 (koefisien regresi y1 ke y2 )


Dengan kondisi yang sama, untuk bentuk terstandardisasi diperoleh:
p x 2 = p x1 . p12 (4.5)

p x 2 : efek tak-langsung (terstandardisasi) x terhadap y2

p x1 : efek langsung (terstandardisasi) x terhadap y1 (koefisien jalur x ke y1 )

p12 : efek langsung (terstandardisasi) y1 terhadap y2 (koefisien jalur y1 ke y2 )


Asosiasi non-kausal adalah hubungan suatu variabel dengan variabel kedua yang
terjadi melalui variabel ketiga yang berkorelasi namun asosiasinya tak-teranalisis dengan
variabel pertama, digambarkan sebagai atau x1 x2 y1 . . . yk . Dalam hubungan x1

x2 y, asosiasi non kausal antara x1 dengan y adalah:

a1 y = r12 . p2 y (4.6)

a1 y : asosiasi non-kausal antara x1 dengan y

r12 : korelasi (asosiasi tak-teranalisis) antara x1 dengan x2

p2 y : efek langsung (terstandardisasi) x2 terhadap y (koefisien jalur x2 ke y )

Contoh 4.2:
Hubungan antara Exe dengan Ill (terstandardisasi) dapat dijabarkan sebagai berikut:
1. Efek kausal langsung (Exe Ill): 0.0340
2. Efek kausal tak-langsung:
- Exe Fit Ill : (0.392)(0.260) = 0.1019
- Exe Str Ill : (0.014)(0.291) = 0.0041
- Exe Fit Str Ill : (0.392)(0.109)(0.291) = 0.0124

Jumlah efek kausal tak-langsung 0.1184


Jumlah efek kausal adalah 0.0844

31
3. Asosiasi non-kausal:
- Exe Hard Ill : (0.030)(0.074) = 0.0022
- Exe Hard Fit Ill : (0.030)(0.082)(0.260) = 0.0006
- Exe Hard Str Ill : (0.030)(0.223)(0.291) = 0.0019
- Exe Hard Fit Str Ill : (0.030)(0.082)(0.109)(0.291) = 0.0001

Jumlah asosiasi non-kausal 0.0049

Besar hubungan seluruhnya antara Exe dengan Ill adalah: 0.0795


Hubungan antara Exe dengan Ill sebesar 0.0795 ini adalah sama dengan koefisien
korelasi antara Exe dengan Ill, yaitu 0.08 (dengan pembulatan, tabel 4.1.b).

Uji Sobel
Uji Sobel adalah uji statistik untuk efek tak-langsung tak terstandardisasi antar dua
variabel yang terjadi melalui satu variabel mediator. Misalkan dalam hubungan x y1

y2 , b1 menyatakan koefisien regresi x ke y1 dengan standard error SE1 dan b2 menyatakan

koefisien regresi y1 ke y2 dengan standard error SE2 , maka statistik penguji untuk uji

hipotesis H 0 : 12 = 0 adalah:

b12
Z uji = (4.7)
SE12
yang berdistribusi Z (normal standar) dengan:

b2 SE1 b1 SE2
2 2 2 2
SE12 = (4.8)

b12 = b1. b2 : Efek tak-langsung (tak-terstandardisasi) x terhadap y2

SE12 : Standard error ( b1. b2 )


Uji Sobel ini memiliki akurasi yang memadai untuk sampel berukuran besar.

Contoh 4.3:
Lihat kembali model jalur Illness pada gambar 4.3. Misalkan hendak diuji hipotesis H 0

: 12 = 0 dengan 12 menyatakan efek tak-langsung (tak-terstandardisasi) Exe terhadap Ill

melalui Exe Fit Ill dalam populasi. Estimasinya dari data sampel adalah b12 yang

nilainya diperoleh sebagai hasil perkalian b1 b2 , b1 menyatakan koefisien regresi Fit terhadap

Exe dan b2 menyatakan koefisien regresi Ill terhadap Fit.

32
b1 = 0.217 b2 = 0.442

SE1 = 0.026 SE2 = 0.087

(Nilai SE1 dan SE2 diperoleh dari keluaran program statistik komputer)

b12 = ( b1 )( b2 )

= (0.217)(0.442) = 0.096

b2 SE1 b1 SE2
2 2 2 2
SE12 =

0.442 0.026 0.217 0.087 = 0.022


2 2 2 2
=

b12
Z uji =
SE12
0.096
= = 4.34
0.022

Notasi Jalur SEM


sem path notation merupakan sintaks perintah untuk diagram jalur (command syntax
for path diagrams). Sintaks-nya adalah:
sem paths . . . [, covariance() variance() means() [group()]]

Jalur (paths) menspesifikasikan arah jalur antar variabel model peneliti.

Model yang akan disesuaikan sepenuhnya dideskripsikan oleh


paths, covariance(), variance(), and means().
Sintaks unsur-unsur ini dimodifikasikan (digeneralisasikan) apabila opsi group()
dispesifikasikan.

Jalur untuk regresi sederhana dituliskan sebagai:


(vardep < varind) atau (varind >vardep)
vardep : variabel dependen
varind : variabel independen
Misalnya:
(y < x) atau (x > y)
Perhatikan bahwa:
- Variabel laten dinamai dengan huruf besar untuk huruf pertamanya
- Variabel teramati dinamai dengan huruf kecil untuk huruf pertamanya

33
Jalur untuk regresi ganda dituliskan sebagai:
(vardep< varind1) (vardep< varind2) (vardep< varind3)
atau: (varind1 >vardep) (varind2 >vardep)(varind3 >vardep)
atau: (vardep >varind1 varind2 varind3)
atau: (varind1 varind2 varind3 >vardep)
Misalnya:
(y < x1 ) (y < x 2 ) (y < x 3 )

Penulisan suku galat bersifat opsional, sehingga (y < x) dapat dibaca atau boleh
dituliskan sebagai:

(y < x e.y)
e.y : suku pengganggu (disturbance)

Jika koefisien jalur suku galat difiksasikan bernilai sama dengan satu, maka keadaan ini
dituliskan sebagai:
(y < x e.y@1)

Fiksasi juga dapat diberlakukan terhadap koefisien jalur salah satu prediktor, misalnya
p2Y = 2:
(y < x1 x 2 @2 x 3 )

Kendala dapat diberikan sedemikian hingga koefisien jalur prediktor X 2 bernilai sama

dengan koefisien jalur prediktor X 3 (tanpa menspesifikasi nilainya):

(y < x1 x 2 @b x 3 @b)

Estimasi Koefisien Jalur SEM dengan Stata


Pada analisis sem dapat digunakan file data Stata yang memuat nilai-nilai invididual
variabel teramati bagi tiap anggota sampel, namun dapat pula digunakan file data statistik
ringkasan (summary statistics data; ssd) yang hanya memuat statistik ringkasan seperti
rerata, standar deviasi, kovariansi, atau korelasi. Dalam contoh berikut akan diperlihatkan
prosedur pembuatan file data statistik ringkasan untuk model illness (gambar 4.1) dengan
menggunakan data tabel korelasi 4.1.b.

34
Contoh 4.4 (Membuat file data statistik ringkasan):

Perintah ssd (summary statistics data):

. clear all
. ssd init exe hard fit stress ill

Summary statistics data initialized. Next use, in any order,

ssd set observations (required)


It is best to do this first.

ssd set means (optional)


Default setting is 0.

ssd set variances or ssd set sd (optional)


Use this only if you have set or will set correlations and, even then, this is optional but highly
recommended. Default setting is 1.

ssd set covariances or ssd set correlations (required)

. ssd set observations 384


(value set)

Status:
observations: set
means: unset
variances or sd: unset
covariances or correlations: unset (required to be set)

. ssd set sd 66.50 38.00 36.80 67.00 62.48


(values set)

Status:
observations: set
means: unset
variances or sd: set
covariances or correlations: unset (required to be set)

. ssd set correlations 1.00 \ .03 1.00 \ .39 .07 1.00 \ .05 .23 .13 1.00 \ .08 .16 .29 .34
1.00
(values set)

Status:
observations: set
means: unset
variances or sd: set
covariances or correlations: set

. label variable exe "exercise"

. label variable hard "hardiness"

35
. label variable fit "fitness"

. label variable stress stress

. label variable ill "illness"

. save "D:\SEM\Data\illness.dta"

Perintah ssd init adalah perintah Stata untuk memulai pembuatan file ssd
(summary statistics data), yaitu file Stata yang tidak berisikan data lengkap, melainkan hanya
memuat jumlah anggota sampel dan matriks kovariansi atau korelasi. File ssd juga dapat diisi
dengan nilai-nilai rerata dan/atau variansi atau standar deviasi yang bersifat opsional.
Perintah ssd init disertai dengan nama-nama variabel dalam file ssd yang akan dibuat.

Pembuatan file ssd dilanjutkan dengan perintah ssd set observations yang
bersifat wajib untuk memasukkan data jumlah anggota sampel, perintah ssd set
means yang bersifat opsional untuk memasukkan nilai-nilai rerata, perintah ssd set
variances atau ssd set sd yang bersifat opsional untuk memasukkan nilai-nilai
variansi atau standar deviasi, serta perintah ssd set covariances atau ssd set
correlations yang bersifat wajib untuk memasukkan nilai-nilai matriks kovariansi atau
korelasi.

Berikutnya dengan Data Editor dapat dilihat isi file sebagaimana tersaji di bawah ini.
Tampak bahwa file tidak memuat data individu anggota sampel, melainkan data
ringkasannya. Baris pertama (_type 1) seharusnya menampilkan nilai-nilai rerata variabel,
tetapi di sini kosong karena memang tidak dimasukkan. Baris kedua (_type 2) memuat nilai-
nilai standar deviasi, sedangkan baris ketiga sampai dengan ketujuh menampilkan matriks
korelasi.

36
Contoh 4.5 (Membuat file ssd dari file data individual):
File ssd dapat diperoleh sebagai konversi file data individual. Pembuatan file ssd ini
terbagi atas 2 tahap, yaitu tahap persiapan dan tahap konversi data.

Tahap persiapan dimaksudkan untuk mempersiapkan data yang ada dalam file data
individual sebelum pelaksanaan konversi. Langkah-langkah untuk tahap persiapan terdiri
atas:

1. Buang variabel pada file data individual yang tak dibutuhkan untuk menganalisis file ssd.

2. Pastikan tidak ada variabel string dalam data tersisa.

3. Pastikan tidak ada nilai hilang (missing values) dalam data tersisa.

4. Pastikan semua variabel ada dalam skala yang wajar. Dianjurkan rasio rerata variabel
terbesar dengan variabel terkecil tidak melebihi 1000 atau 10,000. Jika ditemukan
keadaan demikian, dilakukan penskalaan untuk memperkecil nilai-nilai variabel terbesar.

5. Variabel baru yang mungkin akan dibutuhkan sebagai hasil transformasi variabel lama
harus dibuat pada tahap ini. Setelah dilakukan konversi menjadi file ssd tidak dapat lagi
dilakukan penambahan variabel baru.

6. Susun kembali variabel dalam urutan logis untuk mempermudah pengguna file ssd
memahami data.

7. Simpan data yang sudah siap untuk dikonversi ini dalam bentuk file data individual
biasa. File ini mungkin masih dibutuhkan suatu waktu kelak.

37
Pelaksanaannya diperlihatkan pada contoh berikut:
. use D:\SEM\Data\honolulu.dta
. keep bb tb usia glukosa kolest sistolik
. summarize

Variable Obs Mean Std.Dev. Min Max


bb 100 64.22 8.610048 47 91
tb 100 161.75 5.596491 150 175
usia 100 53.67 5.101109 46 67
glukosa 100 152.14 54.75584 58 442
kolest 100 216.96 38.85844 134 382
sistolik 100 130.1 21.20677 92 208

. gen bmi = bb/((tb/100)^2)


. label var bmi indeks massa tubuh
. order usia bb tb bmi
. save D:\SEM\Data\honolulu_raw.dta
file D:\SEM\Data\honolulu_raw.dta saved

Tahap berikutnya adalah konversi data dengan langkah-langkah sebagai berikut:


1. Konversi file data individual yang telah dipersiapkan menjadi file ssd.
2. Lihat dan periksa file ssd yang dihasikan.
3. Simpan file ssd.

Pelaksanaannya diperlihatkan sebagai lanjutan contoh di atas:


. use D:\SEM\Data\honolulu_raw.dta
. ssd build _all
(data in memory now summary statistics data; you can use ssd describe and ssd list to describe and list results.)
. ssd describe
Summary statistics data
obs: 100
vars: 7
(_dta has notes)

variable name variable label


usia Usia
bb Berat Badan
tb Tinggi Badan
bmi Indeks Massa Tubuh
glukosa Kadar Glukosa
kolest Kadar Kolesterol
sistolik Tekanan Darah Sistolik

. ssd list

Observations = 100

38
Means:
usia bb tb bmi glukosa kolest sistolik
53.67 64.22 161.75 24.548406 152.14 216.96 130.1

Variances implicitly defined; they are the diagonal of the covariance matrix.
Covariances:
usia bb tb bmi glukosa kolest sistolik
26.021313
10.138788 74.132929
7.2247475 18.520202 31.320707
1.5991521 22.384707 2.6120988 9.3197763
60.470909 25.110303 33.186869 19.655521 2998.2024
21.552323 9.6957576 61.414141 22.584735 717.3996 1509.9782
23.992929 5.2949495 4.9646465 .54070781 307.4404 155.17576 449.72727

. save D:\SEM\Data\honolulu_ss.dta
file D:\SEM\Data\honolulu_ss.dta saved

Contoh 4.6 (Regresi linear ganda dengan SEM, contoh pada manual Stata):
Regresi linear ganda (multiple linear regression) adalah analisis regresi linear dengan
variabel independen lebih daripada satu.

File data: auto.dta (lihat kembali contoh 2.7)

Variabel:
variable name variable label
weight Weight (lbs.)
foreign Cartype
mpg Miliage (mpg)

Model:

Persamaan:
mpg = + 1weight + 2weight2 + 3foreign + 1

Perintah sem (structural equation modeling):

. generate weight2 = weight^2

39
. sem (mpg < weight weight2 foreign)
Endogenous variables
Observed: mpg

Exogenous variables
Observed: weight weight2 foreign
Fitting target model:
Iteration 0: log likelihood = 1909.8206
Iteration 1: log likelihood = 1909.8206
Structural equation model
Estimation method = ml Number of obs = 74
Log likelihood = 1909.8206

OIM
Coef. Std. Err. z P>|z| [95% Conf. Interval]
Structural
mpg <
weight .0165729 .0038604 4.29 0.000 .0241392 .0090067
weight2 1.59e-06 6.08e-07 2.62 0.009 4.00e-07 2.78e.-06
foreign 2.2035 1.03022 2.14 0.032 4.222695 .1843056
_cons 56.53884 6.027559 9.38 0.000 44.72504 68.35264
Variance
e.mpg 10.19332 1.675772 7.385485 14.06865
LR test of model vs. Saturated: chi2(1) = 0.00, Prob > chi2 = 1.000

. sem, standardized
Structural equation model
Estimation method = ml Number of obs = 74
Log likelihood = 1909.8206

OIM
Coef. Std. Err. z P>|z| [95% Conf. Interval]
Structural
mpg <
weight 2.226321 .4950378 4.50 0.000 3.196577 1.256064
weight2 1.32654 .498261 2.66 0.008 .3499662 2.303113
foreign .17527 .0810378 2.16 0.031 .3341011 .0164389
_cons 9.839209 .9686872 10.16 0.000 7.940617 11.7378
Variance
e.mpg .308704 .0482719 .2272168 .4194152
LR test of model vs. saturated: chi2(1) = 0.00, Prob > chi2 = 1.000

Catatan:

- Nilai estimasi koefisien analisis regresi (regress) tepat sama dengan hasil
structural equation modeling (sem).
- Nilai estimasi standard error analisis regresi sedikit berbeda dengan hasil structural
equation modeling. Pada regress digunakan pembagi N k 1 = 74 3 1 = 70,
sedangkan pada sem digunakan pembagi N = 74, sehingga pada regress

40
diperoleh SE foreign sebesar 1.06, sedangkan pada sem SE foreign adalah 1.03.
Dengan demikian hasil perhitungan interval konfidensinya juga sedikit berbeda.
- Pada regress yang dilaporkan adalah statistik t, sedangkan pada sem dilaporkan
statistik z.

Contoh 4.7 (Regresi yang seolah tak-berkaitan, manual Stata):


Regresi yang seolah tak berkaitan (seemingly unrelated regression; SUR) adalah dua
atau lebih regresi linear terpisah, tetapi suku pengganggunya berkorelasi. Dua atau lebih
regresi mungkin, namun tak selalu harus, memiliki variabel eksogen bersama.

File data: auto.dta

Variabel:
variable name variable label
mpg Miliage (mpg)
displacement Displacement (cu. in)
foreign Cartype
length Length (in.)
price Price
weight Weight (lbs.)

Model:

Persamaan:
price = 1 + 11foreign + 12mpg + 13displacement + 1
weight = 2 + 21foreign + 22length + 2

Perintah sem (structural equation modeling):

. sem (price < foreign mpg displacement)


> (weight < foreign length),
> cov (e.price*e.weight)

41
Endogenous variables
Observed: price weight
Exogenous variables
Observed: foreign mpg displacement length
Fitting target model:
Iteration 0: log likelihood = 2150.9983
Iteration 1: log likelihood = 2138.5739
Iteration 2: log likelihood = 2133.3461
Iteration 3: log likelihood = 2133.1979
Iteration 4: log likelihood = 2133.1956
Iteration 5: log likelihood = 2133.1956
Structural equation model
Estimation method = ml Number of obs = 74
Log likelihood = 2133.1956
OIM
Standardized Coef. Std. Err. z P>|z| [95% Conf. Interval]
Structural
price <
foreign 2940.929 724.7311 4.06 0.000 1520.482 4361.376
mpg 105.0163 57.93461 1.81 0.070 218.566 8.53347
displace~t 17.22083 4.5941 3.75 0.000 8.216558 26.2251
_cons 4129.866 1984.253 2.08 0.037 240.8022 8018.931
Structural
weight <
foreign 153.2515 76.21732 2.01 0.044 .302.6347 3.868275
length 30.73507 1.584743 19.39 0.000 27.62903 33.84111
_cons 2711.096 312.6813 8.67 0.000 3323.94 2098.252
Variance
e.price 4732491 801783.1 3395302 6596312
e.weight 60253.09 9933.316 43616.45 83235.44
Covariance
e.price
e.weight 209268 73909.54 2.83 0.005 64407.92 354128
LR test of model vs. saturated: chi2(3) = 38.86, Prob > chi2 = 0.0000

Contoh 4.8 (Data masukan dengan matriks korelasi):


Pada contoh diperlihatkan pemasukan data statistik ringkasan untuk analisis SEM
dalam bentuk matriks korelasi menurut Romney et al (1992) seperti terlihat pada tabel 4.3,
yang dapat dianalisis dalam bentuk model psikosomatik ataupun model medik konvensional
(gambar 4.4)

Tabel 4.3 Matriks korelasi model jalur pemulihan pasca bedah jantung
Variabel 1 2 3 4 5
1. Low Morale 1.00
2. Illness Symptoms .53 1.00
3. Neurological Dysfunction .15 .18 1.00
4. Poor Relationships .52 .29 .05 1.00
5. Diminished SES .30 .34 .23 .09 1.00
Sumber: Romney et al (1992); N = 469

42
Gambar 4.4 Model jalur alternatif non-hirarkis untuk
model pemulihan pasca bedah jantung.
Atas: Model psikosomatik; Bawah: Model medik konvensional
(Kline, 2005)

Perintah sem (input data korelasi):


. clear all
. ssd init morale illness neuro relation ses

Summary statistics data initialized. Next use, in any order,

ssd set observations (required)


It is best to do this first.

ssd set means (optional)


Default setting is 0.

ssd set variances or ssd set sd (optional)


Use this only if you have set or will set correlations and, even then, this is optional but highly
recommended. Default setting is 1.

ssd set covariances or ssd set correlations (required)

. ssd set observations 469


(value set)

Status:
observations: set
means: unset

43
variances or sd: unset
covariances or correlations: unset (required to be set)

. ssd set correlations 1.00 \ .53 1.00 \ .15 .18 1.00 \ .52 .29 -.05 1.00 \ .30 .34 .23 .09 1.00
(values set)

Status:
observations: set
means: unset
variances or sd: unset
covariances or correlations: set

. label variable morale "Low Morale"

. label variable illness "Illness Symptoms"

. label variable neuro "Neurological Dysfunction"

. label variable relation "Poor Relationships"

. label variable ses "Diminished SES"

. save "D:\SEM\Data\cardiac_surgery.dta"
file D:\SEM\SEM\Data\cardiac_surgery.dta saved

. ssd describe
Summary statistics data from D:\SEM\Data\cardiac_surgery.dta
obs: 469
vars: 5 19 April 2012 19:02
variable name variable label
morale Low Morale
illness Illness Symptoms
neuro Neurological Dysfunctions
relation Poor Relationships
ses Dimisnished SES

. ssd list
Observations = 469
Means undefined; assumed to be 0
Variances undefined; assumed to be 1
Correlations:
morale illness neuro relation ses
1
.53 1
.15 .18 1
.52 .29 .05 1
.3 .34 .23 .09 1

44
Perbandingan kedua model, yaitu model psikosomatik dan model medik konvensional
dapat dilakukan dengan uji rasio likelihood (lihat petunjuk pada lampiran 4). Dua model jalur
ekivalen lainnya untuk data pemulihan pasca bedah jantung ini diperlihatkan pada gambar
4.5.

Gambar 4.5 Dua model jalur ekivalen untuk data pemulihan pasca bedah jantung
(Kline, 2005)

Contoh 4.9 (Dekomposisi efek):

Pada contoh ini diperlihatkan pengestimasian efek langsung, efek tak langsung, dan
efek total sebuah prediktor terhadap outcome-nya. Perhatikan bahwa dalam kepustakaan cara
ini juga disebutkan sebagai pengestimasian efek variabel mediator, karena efek tak langsung
dengan sendirinya terjadi melalui variabel mediator (variabel perantara).
File data yang digunakan adalah cardiac_surgery.dta dengan model medik
konvensional (gambar 4.4 bawah).

. use "D:\SEM\Data\cardiac_surgery.dta", clear

. sem (ses < illness neuro) (morale < illness ses) (relation < neuro morale)

Endogenous variables
Observed: ses morale relation
Exogenous variables
Observed: illness neuro
Fitting target model:
Iteration 0: log likelihood = 3118.3779
Iteration 1: log likelihood = 3118.3779
Structural equation model

45
Estimation method = ml Number of obs = 469
Log likelihood = 3118.3779

OIM
Coef. Std. Err. z P>|z| [95% Conf. Interval]
Structural
ses <
illness .3085986 .0434047 7.11 0.000 .223527 .3936702
neuro .1744523 .0434047 4.02 0.000 .0893806 .2595239
morale <
ses .1354591 .0411649 3.29 0.001 .0547773 .2161408
illness .4839439 0411649 11.76 0.000 .4032621 .5646257
relation <
morale .5396419 .0394322 13.69 0.009 .4623563 .6169276
neuro .1309463 .0394322 3.32 0.001 .208232 .0536606
Variance
e.ses .8531295 .0557113 .7506363 .9696174
e.morale .7013733 .0458013 .6171118 .7971402
e.relation .711319 .0464508 .6258625 .8084438
LR test of model vs. saturated: chi2(3) = 3.25, Prob > chi2 = 0.3553

Tampak pada model medik konvensional terdapat dua variabel mediator, yaitu ses
sebagai mediator dalam efek ill terhadap morale [ill ses morale], serta ses
dan morale dalam efek neuro terhadap relation [neuro ses morale
relation].
Perintah sem dilanjutkan dengan perintah estat teffect untuk memperoleh estimasi efek
langsung dan tak langsung.

. estat teffects

Direct effects
OIM
Coef. Std. Err. z P>|z| [95% Conf. Interval]
Structural
ses <
illness .3085986 .0434047 7.11 0.000 .223527 .3936702
neuro .1744523 .0434047 4.02 0.000 .0893806 .2595239
morale <
ses .1354591 .0411649 3.29 0.001 .0547773 .2161408
illness .4839439 .0411649 11.76 0.000 .4032621 .5646257
neuro 0 (no path)
relation <
ses 0 (no path)
morale .5396419 .0394322 13.69 0.000 .4623563 .6169276
illness 0 (no path)
neuro .1309463 .0394322 3.32 0.001 .208232 .0536606

46
Indirect effects
OIM
Coef. Std. Err. z P>|z| [95% Conf. Interval]
Structural
ses <
illness 0 (no path)
neuro 0 (no path)
morale <
ses 0 (no path)
illness .0418025 .0139981 2.99 0.003 .0143667 .0692382
neuro .0236311 .0092812 2.55 0.011 .0054403 .0418219
relation <
ses .0730994 .0222143 3.29 0.001 .0295601 .1166387
morale 0 (no path)
illness .2837148 .0296103 9.58 0.000 .2256796 .34175
neuro .0127524 .0050945 2.50 0.012 .0027674 .0227373

Total effects
OIM
Coef. Std. Err. z P>|z| [95% Conf. Interval]
Structural
ses <
illness .3085986 .0434047 7.11 0.000 .223527 .3936702
neuro .1744523 .0434047 4.02 0.000 .0893806 .2595239
morale <
ses .1354591 .0411649 3.29 0.001 .0547773 .2161408
illness .5257464 .0391778 13.42 0.000 .4489593 .6025335
neuro .0236311 .0092812 2.55 0.011 .0054403 .0418219
relation <
ses .0730994 .0222143 3.29 0.001 .0295601 .1166387
morale .5396419 .0394322 13.69 0.000 .4623563 .6169276
illness .2837148 .0296103 9.58 0.000 .2256796 .34175
neuro .1181939 .0396211 2.98 0.003 .1958498 .0405381

Diperoleh efek total ill terhadap morale adalah .5257464, terdiri atas efek langsung
.4839439 dan efek tak langsung .0418025, sehingga proporsi efek total yang termediasi
adalah (.0418025)/(.5257464) = 0.08. Efek total neuro terhadap relation adalah
.1181939, terdiri atas efek langsung .1309463 dan efek tak langsung .0127524; proporsi
efek total yang termediasi adalah (.0127524)/( .1181939) = 0.11.
Jika hasil-hasil di atas terlalu panjang dan yang hendak diketahui hanya besar efek
langsung, efek tak langsung, dan efek total antar variabel, dapat digunakan perintah matrix
list seperti di bawah ini:

. sem (ses < illness neuro) (morale < illness ses) (relation < neuro morale)

. quietly estat teffects

47
. matrix list r(indirect)

r (indirect) [1, 9]

ses: ses: morale: morale: morale: relation: relation: relation: relation:


o. o. o. o.
illness neuro ses illness neuro ses morale illness neuro
r1 0 0 0 .04180248 .02363114 .07309939 0 .28371481 .01275235

. matrix list r(direct)

r (direct) [1, 9]
ses: ses: morale: morale: morale: relation: relation: relation: relation:
o. o. o.
illness neuro ses illness neuro ses morale illness neuro
r1 .30859859 .17445225 .13545907 .48394392 0 0 .53964194 0 .13094629

. matrix list r(total)

r (total) [1, 9]
ses: ses: morale: morale: morale: relation: relation: relation: relation:
illness neuro ses illness neuro ses morale illness neuro
r1 .30859859 .17445225 .13545907 .52574639 .02363114 .07309939 .53964194 .28371481 .11819394

48
BAB 5
UJI HIPOTESIS DAN PENILAIAN MODEL

Uji Hipotesis pada SEM


Uji hipotesis pada SEM tidak bertujuan untuk menguji kemaknaan statistik hubungan
antar variabel seperti pada analisis regresi. Tujuan uji hipotesis pada SEM adalah untuk
mengevaluasi konsistensi model peneliti dengan data sampel. Permasalahan dalam uji
hipotesis pada SEM ialah:
1 Terdapat berbagai statistik-suai (fit statistics) yang ditampilkan oleh program komputer
pada analisis SEM, dan jumlah statistik-suai ini semakin bertambah serta bervariasi
dalam perjalanan waktu, namun:
- Tidak ada satu ukuran tunggal yang dapat digunakan untuk mengevaluasi
konsistensi model dengan data sampel secara menyeluruh, tiap jenis statistik hanya
menilai aspek suai tertentu.
- Nilai statistik-suai menyatakan rata-rata kesesuaian model dengan data. Mungkin
terjadi bahwa sebagian model memiliki kesuaian baik dan ada bagian model yang
tak sesuai dengan data.
- Statistik-suai tidak menginformasikan apakah model peneliti bermakna secara
teoretis.
2. Model harus dikembangkan peneliti secara a-priori berdasarkan pengetahuan teoretisnya.
Model jenuh pasti akan sesuai secara sempurna dengan data, namun model demikian tak
bernilai secara ilmiah. Di sisi lain, dapat dikembangkan lebih daripada satu model yang
sama baiknya kesesuaiannya dengan data (model ekivalen), dan pengetahuan substantif
penelitilah yang akan menentukan model mana yang lebih bermakna secara teoretis.

Klasifikasi Statistik Suai


Statistik suai (fit statistics) adalah statistik yang mengindikasikan kesesuaian rata-rata
ataupun menyeluruh (average or overall fit) sebuah model. Statistik suai dibedakan dalam
dua kelompok, yaitu statistik penguji model dan indeks-suai aproksimasi. Statistik penguji
model (model test statistics) adalah statistik untuk menguji ada tidaknya perbedaan yang
bermakna secara statistik antara matriks kovariansi model peneliti dengan matriks kovariansi
sampel. Statistik penguji model umumnya adalah statistik keburukan-suai, yaitu semakin
49
besar nilai statistik, semakin buruk kesesuaian model dengan data. Hasil uji yang bermakna
secara statistik (p < 0.05) menunjukkan ketidaksesuaian model dengan data. Model peneliti
dapat diterima jika hipotesis nol tidak ditolak, yang mengindikasikan tidak ditemukannya
perbedaan yang bermakna secara statistik antara matriks kovariansi model peneliti dengan
matriks kovariansi sampel. Hanya satu statistik penguji model yang akan dibahas di bawah
ini, yaitu khi-kuadrat model (model chi-square).
Indeks suai aproksimasi (approximate fit indexes) adalah ukuran kontinu untuk
menilai keterkaitan antara model peneliti dengan data yang ada.

Macam Statistik Suai


1. Khi-kuadrat model (model chi-square):
Khi-kuadrat model adalah khi-kuadrat rasio-likelihood model peneliti vs model jenuh:

ms
2

= 2 log Ls log L (5.1)

yang berdistribusi khi-kuadrat dengan derajat bebas sama dengan df ms ; df ms = df s df m

log Ls : log likelihood model jenuh dengan metode maximum likelihood


log L : log likelihood model peneliti

df s : derajat bebas model jenuh

df m : derajat bebas model peneliti


Khi-kuadrat model dinamakan juga khi-kuadrat rasio likelihood atau rasio likelihood
umum. Jika ms
2
= 0, maka model sesuai sempurna dengan data (perfectly fits the data),
yaitu matriks korelasi dan kovariansi prediksi sama dengan yang diamati. Di bawah
hipotesis nol yang menyatakan model peneliti sesuai sempurna dalam populasi, ms
2

secara aproksimasi berdistribusi khi-kuadrat sentral.


Khi-kuadrat model adalah statistik suai (fit statistic), sehingga penerimaan hipotesis nol
akan mendukung model yang diajukan peneliti, namun ms
2
lebih tepat disebut sebagai

indeks keburukan-suai (badness-of-fit) karena semakin besar nilai ms


2
, semakin buruk
kesesuaian model dengan data.

50
2. Akar rerata kuadrat galat aproksimasi (root mean square error of approximation;
RMSEA):


ms df ms
2

RMSEA = (5.2)
Ndf ms

yang secara aproksimasi berdistribusi khi-kuadrat non-sentral dengan parameter non-

sentralitas . ms adalah estimator bagi parameter non-sentralitas :

ms = ms
2
df ms (5.3)
Jika data terbagi atas G subkelompok dengan nilai parameter yang berbeda antar
subkelompok, maka RMSEA adalah:


ms df ms G
2

RMSEA = (5.2.a)
Ndf ms

Interpretasi kasar bagi RMSEA yaitu:
- RMSEA < 0.05: Aproksimasi kesesuaian baik (close approximate fit)
- 0.05 < RMSEA < 0.08: Galat aproksimasi masih dapat diterima (reasonable error of
approximation)
- RMSEA > 0.10: Kesesuaian buruk (poor fit).
RMSEA juga merupakan indeks keburukan-suai seperti halnya ms
2
.
Interpretasi terhadap interval konfidensi 90% untuk RMSEA adalah sebagai berikut:
- Jika batas bawah interval kurang daripada 0.05, maka hipotesis H 0 : RMSEA <
0.05yang menyatakan bahwa model peneliti memiliki aproksimasi kesesuaian yang
baik dalam populasitidak ditolak.
- Jika batas atas interval tidak lebih daripada 0.10, maka hipotesis H 0 : RMSEA >
0.10yang menyatakan bahwa kesesuaian model dalam populasi burukditolak.
- Jika batas bawah interval kurang daripada 0.05 dan batas atas interval lebih daripada
0.10, maka diperoleh hasil yang kontroversial, sehingga dibutuhkan ukuran sampel
yang lebih besar untuk mendapatkan hasil yang lebih akurat.
3. Akar rerata kuadrat residual terstandardisasi (standardized root mean square
residual; SRMR):
Akar rerata kuadrat residual (root mean square residual; RMR) adalah ukuran rerata
nilai mutlak residual kovariansi. Residual kovariansi adalah selisih antara matriks
kovariansi teramati dengan matriks kovariansi yang diprediksikan. RMR merupakan
51
indeks keburukan-suai, RMR = 0 mengindikasikan kesesuaian model yang sempurna,
selanjutnya semakin besar nilai RMR semakin buruk kesesuaiannya.
Pada akar rerata kuadrat residual terstandardisasi (SRMR), residual adalah selisih antara
matriks korelasi teramati dengan matriks korelasi prediksi. Nilai SRMR yang kurang
daripada 0.10 umumnya dianggap cukup baik.
4. Indeks suai komparatif (comparative fit index; CFI):
Indeks suai komparatif merupakan salah satu indeks-suai inkremental (incremental fit
index), yaitu ukuran untuk menilai perbaikan relatif kesesuaian model peneliti
dibandingkan dengan model dasar (baseline model). Model dasar (model independen;
model nol) adalah model dengan asumsi bahwa kovariansi populasi antar variabel
teramati bernilai sama dengan nol. Berdasarkan asumsi ini, maka:
bs2 > ms
2
(5.4)

bs2 : khi-kuadrat rasio-likelihood model dasar vs model jenuh; bs2 = 2 log Ls log Lb

Semakin besar nilai selisih ( bs


2
ms
2
), semakin baik model peneliti dibandingkan
dengan model dasar.
Rumus indeks suai komparatif yang digunakan Stata 12 adalah:

CFI = 1
2

ms df ms
(5.5)

max bs2 dfbs , ms2

df ms

Nilai CFI yang lebih daripada 0.90 mengindikasikan model peneliti memiliki kesesuaian
yang cukup baik. Walaupun demikian, CFI = 1 tidak menyatakan kesesuaian model yang
sempurna, melainkan hanya menunjukkan bahwa ms
2
< df ms .
Dalam kenyataannya, pada kebanyakan bidang aplikasi SEM asumsi kovariansi nol
secara ilmiah tak plausibel, sehingga model peneliti seperti apapun selalu menunjukkan
kesesuaian yang lebih baik dibandingkan dengan model nol.
5. Kriteria informasi Akaike (Akaike information criterion; AIC) dan kriteria informasi
Bayes (Bayesian information criterion; BIC):
Dalam kepustakaan ditemukan beberapa rumus yang berbeda untuk menghitung AIC.
Rumus yang digunakan Stata 12 untuk AIC dan BIC masing-masing adalah:


AIC = 2 log L + 2 df m (5.6)

BIC = 2 log L + N df m (5.7)

52
AIC dan BIC adalah indeks-suai prediktif, digunakan dalam seleksi antar model non-
hirarkis yang diestimasi dari data yang sama. Model yang dipilih adalah model dengan
nilai AIC dan BIC terkecil, yang relatif memiliki kesesuaian lebih baik dan parameter
lebih sedikit. AIC adalah indeks-suai prediktif yang lebih baru dibandingkan dengan
BIC.
6. Indeks Tucker-Lewis (TLI):
Indeks Tucker-Lewis adalah:

TLI =
bs2 dfbs ms
2

df ms (5.8)
bs2
dfbs 1

Indeks Tucker-Lewis adalah indeks-suai inkremental seperti halnya CFI, namun CFI
merupakan indeks-suai inkremental yang lebih baru dibandingkan dengan TLI.
7. Koefisien determinasi (CD) dan koefisien korelasi-ganda kuadrat Bentler-Raykov
(mc2):
Kedua ukuran ini merupakan ukuran kebaikan-suai pada tingkat persamaan (equation-
level goodness-of-fit). Untuk model rekursif, koefisien determinasi dan koefisien
korelasi-ganda kuadrat Bentler-Raykov keduanya bernilai sama, yaitu kuadrat nilai
koefisien korelasi ganda (multiple-correlation coefficient; mc) dan diinterpretasikan
sebagai proporsi variansi variabel dependen yang dijelaskan oleh prediktornya:
CD = mc2 = mc2 (5.9)
Pada model non-rekursif, CD dan mc2 memiliki nilai berbeda, bahkan CD dapat bernilai
negatif. Untuk model non-rekursif dianjurkan untuk menggunakan mc2 = mc2 sebagai
ukuran kebaikan-suai pada tingkat persamaan.

Pada tabel 5.1 diperlihatkan beberapa nilai statistik suai hasil analisis SEM terhadap
kedua model jalur alternatif non-hirarkis pemulihan pasca bedah jantung (gambar 4.4 pada
bab 4). Nilai-nilai statistik suai ini digunakan untuk memilih yang terbaik di antara kedua
model. Tampak bahwa kesesuaian menyeluruh (overall fit) model medik konvensional lebih
baik daripada model psikosomatik, walaupun model psikosomatik bersifat lebih parsimoni.
Selain itu, nilai AIC model medik konvensional juga lebih kecil daripada nilai AIC model
psikosomatik.

53
Tabel 5.1 Beberapa nilai statistik suai untuk perbandingan
model jalur alternatif non-hirarkis pemulihan pasca bedah jantung

Indeks Model Psikosomatik Model Medik Konvensional


ms
2 40.488 3.245

df ms 5 3

p 0.000 0.355
RMSEA (90% CI) 0.123 (0.090-0.159) 0.013 (0.000-0.080)
AIC 6293.999 6260.756
CFI 0.907 0.999
SRMR 0.065 0.016

Estimasi Statistik Suai SEM dengan Stata


Pada contoh-contoh di bawah ini akan diperlihatkan prosedur perolehan beberapa
statistik suai pada Stata.

Contoh 5.1 (Estimasi statistik-suai dan kebaikan-suai, manual Stata):

File data: auto.dta (lihat kembali contoh 4.6)

Model: Lihat contoh 4.6.

Perintah sem:
. sysuse auto
. estat gof, stats (all)

Fit statistic Value Description


Likelihood ratio
chi2_ms (0) 0.000 model vs. saturated
p > chi2 .
chi2_bs (9) 248.985 baseline vs. saturated
p > chi2 0.000
Population error
RMSEA 0.000 Root mean squared error of approximation
90% CI, lower bound 0.000
upper bound .
pclose 1.000 Probability RMSEA <= 0.05

54
Information criteria
AIC 3827.641 Akaikes information criterion
BIC 3836.858 Bayesian information criterion
Baseline comparison
CFI 1.000 Comparative fit index
TLI 1.036 Tucker-Lewis index
Size of residuals
SRMR 0.000 Standardized root mean squared residuals
CD 0.691 Coefficient of determination

. estat eqgof

Equation-level goodness of fit

Variance
depvars fitted predicted residuals R-squared mc mc2
observed
mpg 33.01972 22.8264 10.19332 .691296 .8314421 .691296
overall .691296

mc = correlation between depvar and its prediction


mc2 = mc^2 is the Bentler-Raykov squared multiple correlation coefficient

Perintah estat (postestimation statistics) mencakup beberapa perintah Stata untuk


melakukan sejumlah perhitungan tertentu setelah melakukan proses estimasi.

Perintah estat gof adalah perintah Stata untuk melakukan uji kebaikan-suai
(goodness-of-fit). Dengan perintah estat gof akan disajikan hasil uji rasio likelihood.
Opsi , stats(all) menambahkan tampilan dengan nilai RMSEA berikut interval
konfidensi 90% dan nilai p-nya, kriteria informasi Akaike dan Bayes (AIC dan BIC), kedua
indeks-suai komparatif (CFI) dan indeks Tucker-Lewis (TLI), serta SRMR dan CD (koefisien
determinasi).

Perintah estat eqgof (equation level goodness-of-fit statistics) adalah perintah


Stata untuk membandingkan nilai-nilai variansi yang diprediksi oleh model peneliti dengan
variansi sesungguhnya, serta memperoleh proporsi variabel endogen yang dijelaskan oleh
prediktornya. Pada perintah estat eqgof akan dinyatakan nilai-nilai variansi sesungguhnya,
variansi prediksi, dan residualnya. Selanjutnya ditampilkan pula nilai-nilai koefisien
determinasi (R-squared), koefisien korelasi (mc), dan koefisien korelasi ganda kuadrat
55
Bentler-Raykov (mc2), yang nilainya digunakan sebagai pengganti R-squared pada model
jalur non-rekursif.

Contoh 5.2 (Model jenuh dan model dasar):


Lihat kembali model Illness pada gambar 4.1. Pada model jalur ini terdapat 4 variabel
teramati, Exercise, Hardiness, Fitness, Stress, dan Illness, dua di antaranya merupakan
variabel endogen yaitu Exercise dan Hardiness. Dengan model peneliti pada gambar 4.2,
diperoleh hasil analisis sem sebagai berikut:

. use "D:\SEM\Data\illness.dta", clear


. sem (fit < exe) (stress < hard) (ill < fit stress)
Endogenous variables
Observed: fit stress ill
Exogenous variables
Observed: exe hard
Fitting target model:
Iteration 0: log likelihood = 10237.61
Iteration 1: log likelihood = 10237.61
Structural equation model
Estimation method = ml Number of obs = 384
Log likelihood = 10237.61

OIM
Coef. Std. Err. z P>|z| [95% Conf. Interval]
Structural
fit <
exe .2158195 .0260036 8.30 0.000 .1648535 .2667856
stress <
hard .4055263 .0875636 4.63 0.000 .5771478 .2339049
ill <
fit .4244997 .0792709 5.36 0.009 .5798678 .2691316
stress .2867521 .0435398 6.59 0.000 .2014156 .3720887
Variance
e.fit 1145.27 82.65273 994.2089 1319.283
e.stress 4240.46 306.0289 3681.144 4884.759
e.ill 3204.201 231.2433 2781.567 3691.05

LR test of model vs. saturated: chi2(5) = 11.44, Prob > chi2 = 0.0434

56
. estat gof
Fit statistic Value Description
Likelihood ratio
chi2_ms (5) 11.435 model vs. saturated
p > chi2 0.043
chi2_bs (9) 170.492 baseline vs. saturated
p > chi2 0.000

Pada kolom Description tampak adanya istilah model (model peneliti), saturated
(model jenuh), dan baseline (model dasar). Jumlah parameter pada model peneliti adalah
10, terdiri atas 4 efek langsung, 5 variansi, dan 1 kovariansi. Dengan 5 variabel teramati,
jumlah titik data adalah (5)(6)/2 = 15, sehingga derajat bebas model peneliti di atas adalah 15
10 = 5 (lebih-teridentifikasi). Log likelihhood model peneliti adalah 10237.61.
Model jenuh adalah model mereproduksikan secara sempurna seluruh nilai variansi dan
kovariansi. Perintah untuk menghasilkan model jenuh pada Stata adalah sebagai berikut:

. sem (< exe hard fit stress ill)


Exogenous variables
Observed: exe hard fit stress ill
Fitting target model:
Iteration 0: log likelihood = 10231.893
Iteration 1: log likelihood = 10231.893
Structural equation model
Estimation method = ml Number of obs = 384
Log likelihood = 10231.893

OIM
Standardized Coef. Std. Err. z P>|z| [95% Conf. Interval]
Variance
exe 4410.734 318.3173 3828.959 5080.904
hard 1440.24 103.9403 1250.272 1659.071
fit 1350.713 97.47934 1172.554 1555.942
stress 4477.31 323.122 3886.753 5157.596
ill 3893.584 280.9952 3380.021 4485.179
Covariance
exe
hard 75.61258 128.6775 0.59 0.557 327.8158 176.5906
fit 951.9226 133.6954 7.12 0.000 689.8844 1213.961
stress 222.1949 227.06 0.98 0.328 667.2242 222.8345
ill 331.528 212.1534 1.56 0.118 747.3409 84.28496

57
Covariance
hard
fit 97.63308 71.35013 1.37 0.171 42.2106 237.4768
stress 584.0551 132.9701 4.39 0.000 844.6716 323.4385
ill 378.8891 122.3814 3.10 0.002 618.7523 139.0259
Covariance
fit
stress 319.6933 126.5504 2.53 0.012 567.7276 71.65897
ill 665.0501 121.85 5.46 0.000 903.8717 426.2286
Covariance
stress
ill 1419.588 225.0464 6.31 0.000 978.5051 1860.671

LR test of model vs. saturated: chi2(0) = 0.00, Prob > chi2 = .

Pada model jenuh, dengan 5 variabel teramati jumlah titik data tetap 15. Jumlah
parameter juga 15, terdiri atas 5 variansi dan 10 kovariansi, sehingga derajat bebas pada
model jenuh selalu sama dengan nol (tepat teridentifikasi). Model jenuh ini akan
mereproduksi seluruh nilai-nilai variansi dan kovariansi secara sempurna, dalam arti kata
matriks kovariansi yang dihasilkan model jenuh akan tepat sama dengan matriks kovariansi
data sampel. Log likelihood model jenuh adalah 10231.893.

Untuk menguji seberapa baik model peneliti dibandingkan dengan model jenuh,
ukurannya adalah minus dua kali selisih log likehood kedua model; 2*(10237.61
10231.893) = 11.435 yang berdistribusi khi-kuadrat dengan derajat bebas 5 0 = 5 (p =
0.043).

Model dasar (baseline model) pada Stata adalah model yang mencakup variansi
seluruh variabel teramati beserta kovariansi antar variabel eksogen teramati (menurut model
peneliti). Perhatikan bahwa dalam versi Stata ini model dasar tidak sama dengan model nol.
Dalam model peneliti, variabel eksogen adalah Exercise dan Hardiness, sehingga
kovariansi pada model dasar hanya kovariansi antara kedua variabel ini. Dengan analisis sem
diperoleh:

. sem (< exe hard fit stress ill), covstr (exe fit stress ill, diagonal) covstr (hard fit stress ill, diagonal)

Exogenous variables
Observed: exe hard fit stress ill

58
Fitting target model:
Iteration 0: log likelihood = 10317.139
Iteration 1: log likelihood = 10317.139
Structural equation model
Estimation method = ml Number of obs = 384
Log likelihood = 10317.139

( 1) [cov(exe,fit)]_cons = 0
( 2) [cov(exe,stress)]_cons = 0
( 3) [cov(exe,ill)]_cons = 0
( 4) [cov(hard,fit)]_cons = 0
( 5) [cov(hard,stress)]_cons = 0
( 6) [cov(hard,ill)]_cons = 0
( 7) [cov(fit,stress)]_cons = 0
( 8) [cov(fit,ill)]_cons = 0
( 9) [cov(stress,ill)]_cons = 0

OIM
Standardized Coef. Std. Err. z P>|z| [95% Conf. Interval]
Variance
exe 4410.734 318.3173 3828.959 5080.904
hard 1440.24 103.9403 1250.272 1659.071
fit 1350.713 97.47934 1172.554 1555.942
stress 4477.31 323.122 3886.753 5157.596
ill 3893.584 280.9952 3380.021 4485.179
Covariance
exe
hard 75.61258 128.6775 0.59 0.557 327.8158 176.5906
fit 0 (constrained)
stress 0 (constrained)
ill 0 (constrained)
Covariance
hard
fit 0 (constrained)
stress 0 (constrained)
ill 0 (constrained)
Covariance
fit
stress 0 (constrained)
ill 0 (constrained)
Covariance
stress
ill 0 (constrained)

59
LR test of model vs. saturated: chi2(9) = 170.49, Prob > chi2 = 0.0000

Pada model dasar, jumlah titik data adalah 15, sedangkan jumlah parameter 6, yaitu
lima variansi dan satu kovariansi. Derajat bebas model adalah 15 6 = 9. Log likelihood
model dasar adalah 10317.139.

Untuk menguji seberapa baik model dasar dibandingkan dengan model jenuh, dihitung
minus dua kali selisih log likelihood kedua model, yaitu 2*(10317.139 10231.893) =
170.492 yang berdistribusi khi-kuadrat dengan derajat bebas 9 0 = 9 (p < 0.001).

Walaupun model peneliti tidak sesuai sepenuhnya dengan model jenuh ( 2 = 11.435; p
= 0.043), kesesuaiannya ini masih jauh lebih baik daripada kesesuaian model dasar dengan
model jenuh ( 2 = 170.492; p < 0.001).

Contoh 5.3 (Estimasi statistik-suai dan kebaikan-suai, manual Stata):

File data: auto.dta (lihat kembali contoh 4.7)

Model: Lihat model pada contoh 4.7

Perintah sem:
. estat gof, stats (all)

Fit statistic Value Description


Likelihood ratio
chi2_ms (3) 38.864 model vs. saturated
p > chi2 0.000
chi2_bs (9) 264.817 baseline vs. saturated
p > chi2 0.000
Population error
RMSEA 0.402 Root mean squared error of approximation
90% CI, lower bound 0.295
upper bound 0.519
pclose 0.000 Probability RMSEA <= 0.05
Information criteria
AIC 4286.391 Akaikes information criterion
BIC 4309.432 Bayesian information criterion
Baseline comparison

60
CFI 0.860 Comparative fit index
TLI 0.579 Tucker-Lewis index
Size of residuals
SRMR 0.046 Standardized root mean squared residuals
CD 0.932 Coefficient of determination

. estat eqgof

Equation-level goodness of fit

Variance
depvars fitted predicted residuals R-squared mc mc2
observed
price 7478595 2746103 4732491 .3671951 .6059663 .3671951
weight 581472.1 521219 60253.09 .8963784 .9467726 .8963784
overall .931919

mc = correlation between depvar and its prediction


mc2 = mc^2 is the Bentler-Raykov squared multiple correlation coefficient

Model Ekivalen pada Analisis Jalur


Di bagian awal bab ini telah disinggung mengenai model ekivalen, yang harus
dipertimbangkan oleh peneliti setelah peneliti membuktikan bahwa model yang diajukannya
memiliki kesesuaian yang cukup dengan data sampel. Model ekivalen adalah model yang
dibangun sebagai hasil perombakan terhadap model peneliti, memiliki matriks korelasi atau
kovariansi prediksi yang tepat sama dengan model peneliti, namun dengan konfigurasi
jalur berbeda antar variabel yang sama. Model ekivalen dapat diperoleh berdasarkan
aturan pergantian Lee-Hershberger melalui saling substitusi antara Y1 Y2, Y2 Y1,
D1 D2, atau efek resiprokal terkendali-sama (equality-constrained resiprocal effect) Y1
Y2 (Hersberger, 1994). Pada efek resiprokal terkendali-sama Y1 Y2, besar efek Y1
Y2 terkendali sama besarnya dengan efek Y2 Y1.

61
Gambar 5.1 Contoh empat model jalur ekivalen (Romney et al, 1992)

Perhatikan bahwa substitusi dengan efek resiprokal akan membuat suatu model rekursif
menjadi non-rekursif, sehingga substitusi ini hanya boleh dilakukan jika model baru yang
dihasilkan oleh substitusi tetap teridentifikasi. Substitusi juga tidak boleh mengakibatkan
dihasilkannya suatu model baru yang non-plausibel. Model jalur sederhana mungkin hanya
memiliki beberapa versi ekivalen, namun model yang kompleks mungkin memiliki ratusan
atau bahkan ribuan versi ekivalennya. Walaupun demikian, yang perlu dipertimbangkan oleh
peneliti hanyalah beberapa versi ekivalen yang secara substantif dinilai bermakna.
Contoh suatu model original dengan tiga versi ekivalennya yang dibentuk menurut
aturan pergantian Lee-Hersberger tanpa disertai suku pengganggunya diperlihatkan pada
gambar 5.1 (Romney et al, 1992).

62
BAB 6
PEMODELAN SEM DALAM MODE GRAFIK
PADA STATA

Graphical User Interface pada Stata


Pemodelan SEM yang dilakukan pada Stata dalam pembahasan terdahulu dilakukan
dalam mode interaktif. Selain dalam mode interaktif, pemodelan SEM pada Stata dapat pula
dilakukan dalam mode grafik seperti halnya pada AMOS. Pemodelan SEM dalam mode
grafik pada Stata dimulai dengan membuka jendela SEM Builder dengan mengklik perintah
pada menu: Statistics > SEM (structural equation modeling) > Model
building and estimation, maka akan diperoleh jendela (kanvas) sebagai berikut:

Gambar 6.1. Jendela SEM Builder

Selain Standard Toolbar seperti yang didapatkan pada semua program berbasis
Windows, di atas kanvas dan di bawah Standard Toolbar terdapat Contextual
Toolbar, sedangkan di sisi kiri kanvas terdapat Tools Toolbar (lihat gambar 6.2).

63
Tools Toolbar akan langsung muncul pada saat kanvas SEM Builder terbuka,
sedangkan Contextual Toolbar baru tampak Tools Toolbar mulai digunakan
dalam pemodelan.

Gambar 6.2. Contextual Toolbar (atas) dan Tools Toolbar (kiri)

Pada Tools Toolbar terdapat beberapa lambang, beberapa di antaranya yang


digunakan dalam analisis jalur SEM yaitu:
: Observed Variable Tool, digunakan untuk melambangkan variabel
teramati (Lambang yang digunakan untuk variabel laten tidak digunakan pada
analisis jalur).
: Path Tool, digunakan untuk menyatakan jalur (efek langsung)
: Covariance Tool, digunakan untuk menyatakan kovariansi (asosiasi tak-
teramati)

: Regression Component Tool, digunakan untuk menyatakan himpunan


variabel teramati yang terdiri atas 1 variabel dependen dan sekumpulan variabel
independen yang masing-masing hanya memiliki efek langsung ke variabel
dependen

: Select Tool, digunakan untuk menghentikan (deselect) efek klik kiri


sebelumnya terhadap salah satu Tool pada Tools Toolbar ataupun memilih
(men-select) area yang diinginkan pada kanvas. Selanjutnya dengan Edit >

64
Undo dapat dihapus/dibatalkan perintah terakhir yang pernah diberikan terhadap
area tersebut.

: Text Tool, digunakan untuk menuliskan label/teks lainnya pada kanvas.

: Merupakan Tool untuk memiliki salah satu di antara daftar


nama variabel teramati untuk ditempatkan dalam lambang .
, , dan lain : Merupakan Tools yang digunakan untuk menspesifikasikan fiksasi
nilai atau kendala bagi , 2, ataupun parameter lainnya.
: Merupakan Tools untuk memutar arah lambang suku pengganggu.

Analisis SEM dengan Mode Grafik


Berikut akan diperlihatkan kembali contoh analisis jalur dengan SEM yang sebelumnya
dalam bab terdahulu telah dikerjakan dengan mode interaktif, namun sekarang akan
dikerjakan dengan mode grafik.

Contoh 6.1 (Model jalur auto):


Lihat kembali contoh 4.6. Buka file auto.dta dan generate variabel
weight2=weight^2, lalu buka kanvas SEM Builder dengan mengklik Statistics >
SEM (Structural Equation Modeling) pada menu Standard Toolbar.
Langkah-langkah selanjutnya adalah:
1. Klik lambang pada Tools Toolbar, klik kiri pada kanvas untuk meletakkan
lambang empat persegi panjang tersebut pada tempat yang dikehendaki dalam kanvas.

Klik pada Contextual Toolbar dan pilih nama variabel


weight, yang akan muncul dalam lambang .
2. Ulangi langkah 1 untuk variabel weight2, foreign, dan mpg dengan mengacu
kepada model dalam contoh 4.6.
3. Klik lambang (Path Tool), gambarkan efek langsung tersebut dari variabel
weight menuju ke mpg. Penggambaran jalur ini menetapkan status weight sebagai
variabel eksogen dan mpg sebagai variabel endogen, sehingga secara otomatis akan

memunculkan suku pengganggu (error) untuk variabel endogen mpg.


4. Ulangi langkah 3 untuk penggambaran efek langsung weight2 dan foreign ke mpg.

65
5. Penggambaran model dengan 1 variabel dependen tanpa adanya efek tak-langsung
seperti pada model jalur auto di atas (model regresi ganda) dapat juga dilakukan

sekaligus dengan mengklik lambang . Dengan mengklik lambang akan muncul


menu untuk mengisi nama-nama variabel dependen dan independen dalam model.
Setelah menu selesai diisi, klik OK untuk kembali ke kanvas SEM Builder.

6. Jika penggambaran model telah selesai, klik lambang estimate pada


Contextual Toolbar atau Estimation pada Standard Toolbar.
7. Hasil estimasi dalam bentuk tak terstandardisasi yang dapat dilihat langsung pada kanvas
adalah (gambar 6.3):

Gambar 6.3 Model jalur auto pada kanvas SEM Builder

- Rerata dan variansi masing-masing variabel eksogen (independen), tercantum dalam


masing-masing lambang untuk variabel eksogen tersebut.
weight: rerata 3.0e+03 dan variansi 6.0e+05
weight2: rerata 9.7e+06 dan variansi 2.3e+13
foreign: rerata .3 dan variansi .21
- Efek langsung tak terstandardisasi masing-masing variabel eksogen terhadap
variabel endogen, tercantum di atas masing-masing lambang jalur .
efek weight mpg -1.7e-02
efek weight2 mpg 1.6e-06
efek foreign mpg -2.2

66
- Intersep untuk model regresi ganda, tercantum dalam lambang untuk variabel
endogen (dependen).
intersep model regresi ganda 57
- Variansi suku pengganggu untuk variabel endogen, tercantum di samping lambang

suku pengganggu .
Variansi 1 10
8. Untuk mengganti hasil dalam bentuk tak-terstandardisasi menjadi bentuk
terstandardisasi, klik View > Standardized Estimates pada Standard
Toolbar.
9. Hasil dalam bentuk penyajian yang lebih rinci dapat dilihat pada jendela Result pada
Stata.

67
BAB 7
MODEL STRUKTURAL NON-REKURSIF

Tipe Model Struktural Non-Rekursif


Dua tipe model struktural non-rekursif yang lazim ditemukan ialah model dengan
lingkar umpan-balik dan model dengan semua kemungkinan korelasi pengganggu. Pada
model dengan lingkar umpan-balik (feedback loop) selalu didapatkan lingkar umpan-balik,
baik berupa lingkar umpan-balik langsung (direct feedback loop) seperti Y1 Y2 , maupun

lingkar umpan-balik tak-langsung (indirect feedback loop), misalnya Y1 Y2 Y3 Y1 .


Model dengan semua kemungkinan korelasi pengganggu (all possible disturbance
correlations) adalah model dengan semua korelasi yang mungkin antar suku pengganggu.
Pada sebuah model struktural non-rekursif, lingkar umpan-balik mungkin didapatkan
bersama-sama dengan semua kemungkinan korelasi pengganggu. Dalam contoh pada gambar
7.1, didapatkan baik lingkar umpan-balik tak-langsung Y1 Y2 Y3 Y1 , maupun semua

kemungkinan korelasi pengganggu, Corr ( D1 ; D2 ), Corr ( D2 ; D3 ), serta Corr ( D1 ; D3 ).

Gambar 7.1 Contoh model non-rekursif dengan lingkar umpan-balik


dan semua kemungkinan korelasi pengganggu

Identifikasi pada Model Non-Rekursif


Model rekursif akan selalu teridentifikasi, jika jumlah titik data lebih besar daripada
jumlah parameter bebas dan seluruh variabel laten sekurang-kurangnya berskala interval.

68
Sebaliknya, model non-rekursif mungkin tak teridentifikasi walaupun jumlah observasi lebih
besar daripada jumlah parameter bebas dan seluruh variabel laten berskala interval.
Persyaratan identifikasi pada model struktural non-rekursif dibedakan menjadi syarat
perlu (necessary condition) dan syarat cukup (sufficient condition). Syarat perlu pada model
non-rekursif dinamakan kondisi order (order condition) dan syarat cukup dinamakan
kondisi rank (rank condition).

Kondisi Order
Kondisi order terpenuhi, jika untuk setiap variabel endogen, jumlah variabel
eksklusinya sama dengan atau lebih besar daripada jumlah seluruh variabel endogen
dikurangi satu:
nexc > nend 1 (7.1)

nexc : jumlah variabel eksklusi suatu variabel endogen tertentu

nend : jumlah seluruh variabel endogen

Variabel eksklusi (excluded variable) suatu variabel endogen adalah variabel dalam
model yang tidak memiliki efek langsung (direct effect) terhadap variabel endogen tersebut
(bukan merupakan prediktornya).
Kondisi order (order condition) merupakan syarat perlu (necessary condition) bagi
identifikasi suatu model, namun bukan merupakan syarat cukup (sufficient condition).

Contoh 7.1 (Kondisi order):


Lihat contoh model non-rekursif pada gambar 7.1. Pada model tersebut jumlah variabel
endogen nend = 3, yaitu Y1 , Y2 , dan Y3 ; sehingga nend 1 = 2. Selanjutnya diperoleh:

- Untuk variabel endogen Y1 terdapat nexc = 3 variabel eksklusi, yaitu X 2 , X 3 , dan Y2 ,

sehingga nexc > 2.

- Untuk variabel endogen Y2 terdapat nexc = 3 variabel eksklusi, yaitu X 1 , X 3 , dan Y3 ,

sehingga nexc > 2.

- Untuk variabel endogen Y3 terdapat nexc = 3 variabel eksklusi, yaitu X 1 , X 2 , dan Y1 ,

sehingga nexc > 2.

Dengan demikian maka untuk seluruh variabel endogen dipenuhi syarat nexc > nend 1,
sehingga kondisi order untuk model ini terpenuhi.

69
Kondisi Rank
Kondisi rank terpenuhi untuk suatu variabel endogen, jika rank matriks reduksinya
sama dengan atau lebih besar daripada jumlah seluruh variabel endogen dikurangi satu:
rk > nend 1 (7.2)

rk : rank matriks reduksi variabel endogen ke-k


Model dinyatakan teridentifikasi jika kondisi rank terpenuhi untuk seluruh variabel
endogen dalam model.

Prosedur penentuan rank matriks reduksi variabel endogen:


1. Buat matriks sistem, yaitu matriks yang menyajikan variabel endogen sebagai variabel
baris dan prediktor (termasuk variabel endogen) sebagai variabel kolom. Nilai 1
menyatakan adanya efek langsung prediktor terhadap variabel endogen, sedangkan entri
lain seluruhnya diberi nilai 0. Nilai 1 juga diberikan untuk entri suatu variabel
endogen terhadap variabel endogen itu sendiri.
2. Untuk variabel endogen pertama pada baris teratas, coret semua entri pada baris pertama
serta entri pada kolom setiap nilai 1.
3. Pada matriks sisanya, hapus baris yang:
- seluruh entrinya bernilai 0
- tepat sama dengan salah satu baris lainnya
- sama dengan hasil penjumlahan dua baris lainnya
4. Matriks tersisa adalah matriks reduksi untuk variabel endogen pertama. Rank matriks
sistem sama dengan jumlah baris tersisa pada matriks reduksi.
5. Ulangi prosedur untuk variabel kedua, ketiga, dan seterusnya.

Contoh 7.2 (Kondisi rank):


Lihat contoh kembali model non-rekursif pada gambar 7.1. Pada contoh ini hanya akan
diperlihatkan penentuan rank matriks reduksi untuk variabel endogen Y1 dengan langkah-
langkah berikut:

70
1. Matriks sistem adalah:
X1 X2 X3 Y1 Y2 Y3
Y1 1 0 0 1 0 1
Y2 0 1 0 1 1 0
Y3 0 0 1 0 1 1

2. Coret semua entri pada baris pertama serta entri pada kolom setiap nilai 1.
X1 X2 X3 Y1 Y2 Y3
Y1 1 0 0 1 0 1
Y2 0 1 0 1 1 0
Y3 0 0 1 0 1 1

3. Pada matriks sisanya, tidak ada baris yang perlu dihapus:


X2 X3 Y2
Y2 1 0 1
Y3 0 1 1

Matriks pada No. 3 di atas yang merupakan matriks reduksi bagi variabel endogen Y1

memiliki dua baris, sehingga rank-nya adalah rk = 2. Karena nend 1 = 2, maka persyaratan

rk > nend 1 terpenuhi bagi variabel endogen Y1 . Selanjutnya prosedur yang sama masih

harus diulangi untuk variabel endogen Y2 dan Y3 .

Efek Tak-langsung pada Model Non-Rekursif


Misalkan dimiliki model rekursif dengan lingkar umpan-balik langsung Y1 Y2 .

Misalkan pula efek terstandardisasi Y1 terhadap Y2 adalah p12 = 0.40 dan efek

terstandardisasi Y2 terhadap Y1 adalah p21 = 0.20. Maka lingkar umpan-balik Y1 Y2 maka

menghasilkan efek tak-langsung Y1 Y2 Y1 , Y1 Y2 Y1 Y2 Y1 , Y1 Y2 Y1

Y2 Y1 Y2 Y1 , dan seterusnya yang akan merupakan siklus berulang tak berhingga

secara teoretis. Besar efeknya adalah p12 . p21 + p12 . p21 . p12 . p21 + p12 . p21 . p12 . p21 . p12 . p21 + .
. . , dan seterusnya, yang nilainya adalah (0.40)(0.20) + (0.40)(0.20)(0.40)(0.20) +
(0.40)(0.20) (0.40)(0.20)(0.40)(0.20) + . . . dengan kelanjutan yang dengan cepat akan
mendekati nol, sehingga diasumsikan mencapai keseimbangan.

71
Korelasi Ganda Kuadrat
Pada model rekursif, koefisien determinasi dan koefisien korelasi-ganda kuadrat
Bentler-Raykov memiliki nilai yang sama dan keduanya dapat dipakai sebagai ukuran
proporsi variansi variabel dependen yang dijelaskan oleh prediktornya. Sebaliknya, pada
model non-rekursif keduanya memiliki nilai yang berbeda, sebagai ukuran proporsi variansi
variabel dependen yang dijelaskan oleh prediktornya dianjurkan hanya menggunakan
koefisien korelasi-ganda kuadrat Bentler-Raykov.

Contoh 7.3:
Misalkan dimiliki data longitudinal karakteristik 84 orang ibu di masa muda mereka,
yaitu agression, withdrawal, education, dan maternal age, serta karakteristik anak mereka
10-15 tahun sesudahnya, yaitu internalization dan externalization (Cooperman, 1996). Data
diberikan dalam matriks korelasi beserta standar deviasi untuk tiap variabel (tabel 7.1).
Model jalur non-rekursif untuk data ini diperlihatkan pada gambar 7.2.

Tabel 7.1 Data korelasi model jalur non-rekursif hubungan transgenerasi


pada permasalahan penyesuaian diri

Variabel 1 2 3 4 5 6
Karakteristik ibu
1. aggression 1.00
2. withdrawal .19 1.00
3. education .16 .20 1.00
4. maternal age .37 .06 .36 1.00
Karakteristik anak
5. internalization .06 .05 .03 .25 1.00
6. externalization .13 .06 .09 .28 .41 1.00
SD 1.09 1.03 2.17 2.33 .28 .36
Sumber: Cooperman (1996); N = 84

Dengan adanya 6 variabel (4 karakteristik ibu dan 2 karakteristik anak), didapatkan


jumlah titik data p = (6)(7)/2 = 21. Jumlah parameter bebas yang diestimasi q = 19, terdiri
atas 2 variansi variabel eksogen, 4 variansi suku pengganggu, 3 kovariansi antar variabel
eksogen dan antar suku pengganggu, serta 10 efek langsung. Derajat bebas model adalah df M

= 21 19 = 2. Walaupun derajat bebas model df M > 0, untuk model non-rekursif masih harus
diperiksa kondisi order dan rank yang ternyata terpenuhi, sehingga model ini dapat
dinyatakan teridentifikasi (atau tepatnya, lebih-teridentifikasi).

72
Gambar 7.2 Model jalur non-rekursif hubungan transgenerasi
pada permasalahan penyesuaian diri

Hasil analisis SEM dengan program komputer diperlihatkan pada tabel 7.2.
Interpretasinya antara lain yaitu, wanita yang sifat agresinya (aggression) satu SD di atas
rerata cenderung melahirkan anak pertama pada usia (age) kurang-lebih sepertiga SD (.380)
di bawah rerata. Ibu yang melahirkan anak pertama pada usia (age) satu SD di atas rerata
diasosiasikan memiliki tingkat pendidikan (education) kurang-lebih sepertiga SD (.340) di
atas rerata. Tingkat pendidikan (education) juga dipengaruhi oleh sifat menutup diri
(withdrawal), wanita yang nilai withdrawal-nya satu SD di atas rerata memiliki tingkat
education kurang-lebih dua persepuluh (.180) di bawah rerata. Kemaknaan statistik di sini
tidak terlalu diperhatikan karena kekuatan analisis statistik (statistical power) yang dapat
diperkirakan rendah dengan ukuran sampel yang kecil (N = 84).

Tabel 7.2 Estimasi parameter model jalur non-rekursif


hubungan transgenerasi pada permasalahan penyesuaian diri

a. Efek langsung

Parameter bij
SE bij pij
aggr age .812** .304 .380
educ age .065 .648 .061
with educ .378 .215 .180
age educ .317 .256 .340
aggr ext .032 .035 .097
educ ext .003 .019 .015
age ext .039* .018 .248
with int .005 .027 .018
educ int .008 .015 .065
age int .033* .014 .275

73
b. Variansi dan kovariansi pengganggu
Parameter Var (D) SE (D) Var (Z)
Dage 4.904* 2.480 .457
Deduc 3.949** .613 .839
Dage Deduc .304 2.874 .069
Dext .120** .019 .923
Dint .073** .011 .936
Dext Dint .035** .011 .379
*: p < .05; **: p < .01

Analisis Model Non-Rekursif dengan Stata


Seperti telah dijelaskan di atas, analisis model non-rekursif pada SEM hanya boleh
dilakukan setelah kondisi order dan rank terpenuhi, serta model teridentifikasi.

Contoh 7.4 (Model struktural non-rekursif, manual Stata):


File data: sem_sm1.dta
Variabel:
variable name variable label
r_intel respondent's intelligence
r_parasp respondent's parental aspiration
r_ses respondent's family socioeconomic status
r_occasp respondent's occupational aspiration
r_educasp respondent's educational aspiration
f_intel friend's intelligence
f_parasp friend's parental aspiration
f_ses friend's family socioeconomic status
f_occasp friend's occupational aspiration
f_educasp friend's educational aspiration
The data contain 329 boys with information on five variables and the same information for each boys best
friend.

Model:

74
Persamaan:
f_occasp = 1 + 11r_ses + 12f_ses + 13f_intel + 14r_occasp + 1
r_occasp = 2 + 21r_intel + 22r_ses + 23f_ses + 24f_occasp + 2

Perintah sem:
. use http://www.stata-press.com/data/r12/sem_sm1
. sem (r_occasp < f_occasp r_intel r_ses f_ses)
> (f_occasp < r_occasp f_intel f_ses r_ses),
> cov (e.r_occasp*e.f_occasp) standardized
Endogenous variables
Observed: r_occasp f_occasp
Exogenous variables
Observed: r_intel r_ses f_ses f_intel
Fitting target model:
Iteration 0: log likelihood = 2617.0489
Iteration 1: log likelihood = 2617.0489
Structural equation model
Estimation method = ml Number of obs = 329
Log likelihood = 2617.0489

OIM
Standardized Coef. Std. Err. z P>|z| [95% Conf. Interval]
Structural
r_occ~p <
f_occasp .2773441 .1281904 2.16 0.031 .0260956 .5285926
r_intel .2854766 .05 5.71 0.000 .1874783 .3834748
r_ses .1570082 .0520841 3.01 0.003 .0549252 .2590912
f_ses .0973327 .060153 1.62 0.106 .020565 .2152304
Structural
f_occ~p <
r_occasp .2118102 .156297 1.36 0.175 .0945264 .5181467
r_ses .0794194 .0587732 1.35 0.177 .0357739 .1946127
f_ses .1681772 .0537199 3.13 0.002 .062888 .2734663
f_intel .3693682 .0525924 7.02 0.000 .2662891 .4724474
Variance
e.r_occasp .6889244 .0399973 .6148268 .7719519
e.f_occasp .6378539 .039965 .5641425 .7211964
Covariance
e.r_occasp
e.f_occasp .2325666 .2180087 1.07 0.286 .6598558 .1947227

LR test of model vs. saturated: chi2(1) = 0.00, Prob > chi2 = .

75
Contoh 7.5 (Estimasi statistik-suai dan kebaikan-suai, manual Stata):

File data: sem_sm1.dta (lihat kembali contoh 7.4)


Model: Lihat model pada contoh 7.4
Perintah sem:
. estat gof, stats (all)
Fit statistic Value Description
Likelihood ratio
chi2_ms (3) 38.864 model vs. saturated
p > chi2 0.000
chi2_bs (9) 264.817 baseline vs. saturated
p > chi2 0.000

Population error
RMSEA 0.402 Root mean squared error of approximation
90% CI, lower bound 0.295
upper bound 0.519
pclose 0.000 Probability RMSEA <= 0.05

Information criteria
AIC 4286.391 Akaikes information criterion
BIC 4309.432 Bayesian information criterion

Baseline comparison
CFI 0.860 Comparative fit index
TLI 0.579 Tucker-Lewis index

Size of residuals
SRMR 0.046 Standardized root mean squared residuals
CD 0.932 Coefficient of determination

. estat eqgof

Equation-level goodness of fit

Variance
depvars fitted predicted residuals R-squared mc mc2

observed
price 7478595 2746103 4732491 .3671951 .6059663 .3671951
weight 581472.1 521219 60253.09 .8963784 .9467726 .8963784

overall .931919

mc = correlation between depvar and its prediction


mc2 = mc^2 is the Bentler-Raykov squared multiple correlation coefficient

76
Contoh 7.6 (Input data korelasi):
Perintah sem:
. clear all
. ssd init aggression withdrawal education age internal external

Summary statistics data initialized. Next use, in any order,

ssd set observations (required)


It is best to do this first.

ssd set means (optional)


Default setting is 0.

ssd set variances or ssd set sd (optional)


Use this only if you have set or will set correlations and, even then, this is optional but highly
recommended. Default setting is 1.

ssd set covariances or ssd set correlations (required)

. ssd set observations 84


(value set)

Status:
observations: set
means: unset
variances or sd: unset
covariances or correlations: unset (required to be set)

. ssd set means .51 .47 10.87 20.57 .08 .15


(values set)

Status:
observations: set
means: set
variances or sd: unset
covariances or correlations: unset (required to be set)

. ssd set sd 1.09 1.03 2.17 2.33 .28 .36


(values set)

Status:
observations: set
means: set
variances or sd: set
covariances or correlations: unset (required to be set)

. ssd set correlations 1.00 \ .19 1.00 \ -.16 -.20 1.00 \ -.37 -.06 .36 1.00 \ -.06 -.05 -.03 -.25 1.00 \ .13 -
.06 -.09 -.28 .41 1.00
(values set)

77
Status:
observations: set
means: set
variances or sd: set
covariances or correlations: set

. label variable aggression "maternal aggression"

. label variable withdrawal "maternal withdrawal"

. label variable education "maternal education"

. label variable age "maternal age"

. label variable internal "child internalization"

. label variable external "child externalization"

. save "D:\SEM\Data\transgenerational_relation.dta"

file D:\SEM\Data\transgenerational_relation.dta saved

Contoh 7.7:
Pada contoh ini diperlihatkan hasil estimasi parameter untuk data pada contoh 7.6.
Perintah sem:
. clear all

. use "D:\SEM\Data\transgenerational_relation.dta"

. sem (age < aggression education) (education < withdrawal age) (external < aggression age
education) (internal < withdrawal age education), cov(aggression*withdrawal e.age*e.education
e.external*e.internal)

Endogenous variables

Observed: age education external internal

Exogenous variables

Observed: aggression withdrawal

Fitting target model:

Iteration 0: log likelihood = -637.52633


Iteration 1: log likelihood = -637.2952
Iteration 2: log likelihood = -637.29471
Iteration 3: log likelihood = -637.29471

Structural equation model Number of obs = 84


Estimation method = ml
Log likelihood = -637.29471

78
OIM
Coef. Std. Err. z P>|z| [95% Conf. Interval]
Structural
age <
education .065209 .6445339 0.10 0.919 1.328472 1.198054
aggression .8116886 .3021317 2.69 0.007 1.403856 .2195214
_cons 21.69278 7.115742 3.05 0.002 7.746185 35.63938
education <
age .3168497 .2547603 1.24 0.214 .1824713 .8161708
withdrawal .3783538 .2133176 1.77 0.076 .7964486 .039741
_cons 4.530227 5.262017 0.86 0.389 5.783138 14.84359
external <
age .0386485 .0183447 2.11 0.035 .0746035 .0026935
education .002547 .0186604 0.14 0.891 .0340266 .0391206
aggression .0315864 .035112 0.90 0.368 .0372318 .1004046
_cons .9012039 .3729462 2.42 0.016 .1702429 1.632165
internal <
age .0329934 .0135667 2.43 0.015 .0595835 .0064032
education .008388 .0148052 0.57 0.571 .0206297 .0374056
aggression .0052084 .0272522 0.19 0.848 .0586217 .0482049
_cons .6699444 .2710048 2.47 0.013 .1387848 1.201104
Mean
aggression .51 .1182187 4.31 0.000 .2782956 .7417044
withdrawal .47 .1117113 4.21 0.000 .2510499 .6889501
Variance
e.age 4.845168 2.435842 1.808752 12.97893
e.education 3.901594 .602466 2.882727 5.280568
e.external .1183555 .0183256 .0873761 .1603187
e.internal .0721754 .0111497 .0533207 .0976974
aggression 1.173956 .1811453 .867578 1.588529
withdrawal 1.04827 .1617516 .7746937 1.418458
Covariance
e.age
e.education .3003766 2.82262 0.11 0.915 5.231856 5.832609
e.external
e.internal .0350529 .0109452 3.20 0.001 .0136006 .0565052
aggression
withdrawal .2107736 .1232037 1.71 0.087 .0307012 .4522484
LR test of model vs. saturated: chi2(2) = 2.99, Prob > chi2 = 0.2237

79
BAB 8
STRUKTUR RERATA

Analisis Nilai Rerata pada SEM


Dalam SEM pada umumnya yang dianalisis adalah kovariansi dan bukan rerata. Jika
masukan data untuk analisis SEM adalah file data individual, maka nilai-nilai rerata sampel
dapat diperoleh dengan menambahkan opsi [, means(nama_vars)] pada jalur SEM
(perintah sem paths; lihat kembali pembahasan Notasi Jalur SEM pada bab 4).
Pada umumnya sebagai masukan data untuk analisis SEM tidak digunakan file data
individual, melainkan file ssd (summary statistics data; data statistik ringkasan) dengan
struktur kovariansi yang memuat nilai-nilai matriks kovariansi (atau korelasi) variabel
teramati. Untuk analisis rerata dengan SEM digunakan struktur rerata dengan menambahkan
1 baris rerata dan 1 baris variansi sebagai dua baris pertama pada matriks kovariansi (atau
korelasi) semula.
Sebagai contoh, pada tabel 8.1.a dapat dilihat matriks korelasi yang ada pada file ssd
untuk struktur kovariansi data Illness (lihat kembali tabel 4.1), sedangkan tabel 8.1.b
menunjukkan isi file ssd untuk struktur reratanya.

Tabel 8.1 Matriks korelasi data Illness


a. Struktur kovariansi
Variabel Exe Hard Fit Str Ill
1. Exe 1.00 0.03 0.39 0.05 0.08
2. Hard 0.03 1.00 0.07 0.23 0.16
3. Fit 0.39 0.07 1.00 0.13 0.29
4. Str 0.05 0.23 0.13 1.00 0.34
5. Ill 0.08 0.16 0.29 0.34 1.00

b. Struktur rerata
Exe Hard Fit Str Ill
Rerata 40.90 0.00 67.10 4.80 716.70
Variansi 4422.25 1444.00 1354.24 4489.00 3903.75
1. Exe 1.00 0.03 0.39 0.05 0.08
2. Hard 0.03 1.00 0.07 0.23 0.16
3. Fit 0.39 0.07 1.00 0.13 0.29
4. Str 0.05 0.23 0.13 1.00 0.34
5. Ill 0.08 0.16 0.29 0.34 1.00

80
Dengan analisis rerata pada SEM dapat dilakukan uji hipotesis terhadap nilai rerata,
tetapi pembahasan mengenai struktur rerata di sini sangat terbatas karena analisis rerata pada
SEM terutama ditujukan untuk menguji hipotesis tentang variabel laten pada analisis faktor
konfirmatorik dan model regresi struktural.
Nilai rerata variabel eksogen pada program Stata dapat diperoleh dengan perintah sem
path, means(var_exo). Misalkan X adalah variabel eksogen, Y adalah variabel endogen, dan
hubungan antara X dan Y dinyatakan dengan model regresi:
Y = b0 + b1 X + DY
maka rerata variabel endogen Y adalah:
Y = b0 + b1 X (8.1)

Identifikasi Struktur Rerata


Analisis struktur rerata pada SEM berbeda dengan analisis struktur kovariansinya,
sehingga penilaian identifikasi struktur rerata harus dilakukan sendiri, terpisah dari penilaian
identifikasi struktur kovariansinya. Sebuah dataset dapat memiliki struktur kovariansi yang
lebih-teridentifikasi dengan struktur rerata yang kurang-teridentifikasi, ataupun sebaliknya.
Jika sebuah file ssd memiliki variabel teramati, matriks struktur kovariansinya
memiliki jumlah titik data ( + 1)/2. Penambahan baris rerata dan baris variansi pada
struktur rerata akan menambahkan sebanyak nilai informasi sesuai dengan banyak nilai
rerata (lihat contoh pada tabel 8.1.b), sedangkan baris variansi tak menambah informasi
karena nilai-nilainya sudah tercakup dalam matriks kovariansi semula.
Maka diperoleh banyak nilai rerata, nilai variansi, dan nilai kovariansi tak-berulang
yang dinamakan sebagai jumlah titik data p untuk struktur rerata yaitu:
3
p= (8.2)
2
Jumlah parameter q pada struktur rerata sama dengan jumlah parameter pada struktur
kovariansinya (jumlah efek langsung, variansi, dan kovariansi), ditambah dengan jumlah
rerata variabel eksogen dan jumlah intersep efek langsung. Jumlah intersep efek langsung ini
sama banyaknya dengan jumlah efek langsung (jalur; paths).
Seperti halnya dengan identifikasi struktur kovariansi, sebuah struktur rerata dinyatakan
lebih-teridentifikasi jika p > q; tepat-teridenfikasi jika p = q; dan kurang-teridentifikasi jika p
< q.

81
Estimasi Struktur Rerata
Estimasi parameter, uji hipotesis, dan penilaian model pada struktur rerata dapat
dilakukan dengan metode yang sama seperti untuk struktur kovariansi. Walaupun demikian,
tidak semua indeks suai terstandardisasi untuk struktur kovariansi dapat dihitung untuk
struktur rerata. Contohnya yaitu indeks suai inkremental CFI (comparative fit index) yang
mengukur perbaikan relatif kesesuaian model peneliti dengan model dasar. Pada struktur
rerata, pada model dasar diasumsikan seluruh kovariansi dan rerata terkendala dengan nilai
nol, asumsi yang sangat tak realistis.
Karena estimasi rerata pada SEM hanya dapat dilakukan untuk variabel endogen,
penggunaan struktur rerata pada analisis jalur sangat terbatas. Analisis struktur rerata
terutama digunakan dan akan dibahas lebih lanjut pada analisis faktor konfirmatorik.

Contoh 8.1:
. use D:\SEM\Data\rokok.dta
. sem (sistolik < usia kolesterol), cov(usia*kolesterol) var(e.sistolik usia kolesterol)
> means(usia kolesterol)
Endogenous variables
Observed: sistolik
Exogenous variables
Observed: usia kolesterol
Fitting target model:
Iteration 0: log likelihood = 618.89285
Iteration 1: log likelihood = 618.89285
Structural equation model
Estimation method = ml Number of obs = 50
Log likelihood = 618.89285
OIM
Coef. Std. Err. z P>|z| [95% Conf. Interval]
Structural
sistolik <
usia .0922103 .7810589 0.12 0.906 1.623058 1.438637
kolesterol .0652989 .0686759 0.95 0.342 .0693033 .1999011
_cons 118.1628 41.05388 2.88 0.004 37.69871 198.627
Mean
usia 52.34 .5385982 97.18 0.000 51.28437 53.39563
kolesterol 212.92 6.125543 34.76 0.000 200.9142 224.9258
Variance
e.sistolik 429.0054 85.80107 289.8828 634.8967
usia 14.5044 2.90088 9.800753 21.46545
kolesterol 1876.114 375.2227 1267.707 2776.511
Covariance
usia
kolesterol 28.7272 23.68001 1.21 0.225 17.68478 75.13918
LR test of model vs. saturated: chi2(0) = 0.00, Prob > chi2 = .

82
Kovariansi antar variabel eksogen pada sem diasumsikan selalu ada, nilai kovariansi
antara usia dengan kolesterol akan tetap ditampilkan, walaupun opsi ,
cov(usia*kolesterol tak dituliskan, demikian pula halnya variansi suku pengganggu
e.sistolik akan selalu tercantum walaupun opsi var(e.sistolik) tak diberikan.
Sebalik rerata usia dan kolesterol hanya akan ditampilkan jika ada opsi , means(usia
kolesterol). Variansi usia dan kolesterol hanya akan ditampilkan jika ada opsi ,
means(usia kolesterol) dan/atau , var(usia kolesterol). Perhatikan bahwa
variabel endogen tak memiliki variansi, selain itu opsi , means(nama_var) hanya dapat
digunakan untuk variabel eksogen.

83
BAB 9
SAMPLING GANDA

Penggunaan Sampling Ganda pada SEM


Sampling ganda praktis selalu digunakan pada rancangan studi eksperimental, yang
memperbandingkan kelompok-kelompok perlakuan. Sampling ganda digunakan pada studi
observasional jika anggota sampel diperoleh dari dua atau lebih subpopulasi yang berbeda.
Yang menjadi pertanyaan di sini ialah:
1. Ada tidaknya perbedaan parameter model antar kelompok.
2. Ada tidaknya moderasi kelompok terhadap hubungan dalam model, atau dengan kata lain
ada tidaknya interaksi antara kelompok dengan prediktor.
Sebagai contoh data, diperlihatkan matriks kovariansi 50 responden yang terbagi atas 2
kelompok, grup 1 (perokok, tabel 8.1 atas) dan grup 2 (non-perokok, tabel 8.1 bawah).

Tabel 9.1 Matriks kovariansi 50 responden Studi Jantung Honolulu


A. Grup 1: Perokok (N = 25)
Variabel sistolik usia kolesterol
sistolik 628.63
usia 1.3 17.92
kolesterol 189.43 19.79 2895.5
Means 129.28 52.4 209.8
SD 25.07 4.23 53.81

B. Grup 2: Non-perokok (N = 25)


Variabel sistolik usia kolesterol
sistolik 272.67
usia .43 12.29
kolesterol 73.53 40.45 992.79
Means 125.2 52.28 216.04
SD 16.51 3.51 31.51

84
Analisis Sampel Ganda pada Stata
Analisis data pada tabel 9.1 diperlihatkan pada contoh 9.1 berikut.

Contoh 9.1:
. use rokok_ssd.dta
. sem (sistolik < usia kolesterol), group(group)

Endogenous variables
Observed: sistolik
Exogenous variables
Observed: usia kolesterol
Fitting target model:
Iteration 0: log likelihood = 611.30609
Iteration 1: log likelihood = 611.30609
Structural equation model
Grouping variable = group Number of obs = 50
Estimation method = ml Number of groups = 2
Log likelihood = 611.30609

OIM
Coef. Std. Err. z P>|z| [95% Conf. Interval]
Structural
sistolik <
usia
1 .0002977 1.177281 0.00 1.000 2.307131 2.307726
2 .3219241 1.000138 0.32 0.748 2.282158 1.63831
kolesterol
1 .0654202 .0926163 0.71 0.480 .1161044 .2469448
2 .0871804 .1112774 0.78 0.433 .1309194 .3052802
_cons
1 115.5392 63.23401 1.83 0.068 8.397133 239.4756
2 123.1957 49.005 2.51 0.012 27.1477 219.2438
Variance
e.sistolik
1 591.5876 167.3262 339.8309 1029.853
2 255.4763 72.25962 146.7556 444.7407
LR test of model vs. saturated: chi2(0) = 0.00, Prob > chi2 = .

. estat ggof

Group-level fit statistics


N SRMR CD chi2 df p>chi2
group
1 25 0.000 0.020 0.000 0 .
2 25 0.000 0.024 0.000 0 .

85
. estat ginvariant

Tests for group invariance of parameters


Wald Test Score Test
chi2 df p>chi2 chi2 df p>chi2
Structural
sistolik <
usia 0.044 1 0.8348 . . .
kolesterol 0.023 1 0.8805 . . .
_cons 0.009 1 0.9238 . . .
Variance
e.sistolik 3.401 1 0.0652 . . .

Contoh 9.2:
. use rokok_ssd.dta
. sem (sistolik < usia kolesterol), group(group) ginvariant(all)

Endogenous variables
Observed: sistolik
Exogenous variables
Observed: usia kolesterol
Fitting target model:
Iteration 0: log likelihood = 613.78589
Iteration 1: log likelihood = 613.76882
Iteration 2: log likelihood = 613.76881
Structural equation model Number of obs = 50
Grouping variable = group Number of groups = 2
Estimation method = ml
Log likelihood = 613.76881

( 1) [sistolik]1bn.group#c.usia [sistolik]2.group#c.usia = 0
( 2) [sistolik]1bn.group#c.kolesterol [sistolik]2.group#c.kolesterol = 0
( 3) [var(e.sistolik)]1bn.group [var(e.sistolik)]2.group = 0
( 4) [sistolik]1bn.group [sistolik]2.group = 0

OIM
Coef. Std. Err. z P>|z| [95% Conf. Interval]
Structural
sistolik <
usia
[*] .0920975 .7810625 0.12 0.906 1.622952 1.438757
kolesterol
[*] .0652956 .068762 0.95 0.342 .0693072 .1998984
_cons
[*] 118.1576 41.054 2.88 0.004 37.69328 198.622

86
Variance
e.sistolik
[*] 429.0085 85.80156 289.8851 634.9009
Note: [*] identifies parameter estimates constrained to be equal across groups.
LR test of model vs. saturated: chi2(4) = 4.93, Prob > chi2 = 0.2950

Opsi [group(groupname)] pada perintah sem path akan menghasilkan estimasi parameter
per kelompok, selanjutnya pengujian kesamaan parameter antar kelompok (between groups)
dilakukan dengan melanjutkan perintah sem path, group(groupname) tersebut dengan perintah
estat ginvariant.

Sebaliknya jika model dijadikan terkendala dengan kesamaan parameter lintas


kelompok (across group), estimasi parameter serta pengujiannya dilakukan sekaligus dengan
perintah sem path, group(groupname) ginvariant(all).

Variabel Moderator dan Efek Interaksi


Efek interaksi didasarkan atas keberadaan variabel moderator, yaitu variabel yang
mempengaruhi arah dan/atau kekuatan hubungan antara suatu prediktor dengan kriterion.
Kemaknaan variabel moderator kontinu dapat diuji dengan memasukkannya dalam model.
Sebagai contoh, pada model jalur dalam gambar 9.1 dapat dilihat bahwa variabel W
merupakan variabel moderator, baik dalam hubungan antara prediktor X dengan kriterion M
maupun hubungan antara prediktor X dengan kriterion Y. Pengendalian efek interaksi
sekaligus pengujian kemaknaannya dilakukan dengan memasukkan variabel W serta variabel
hasil perkalian X dengan W sebagai prediktor tambahan dalam hubungan antara prediktor X
dengan kriterionnya.

Gambar 9.1 Contoh model jalur dengan variabel moderator kontinu

87
Jika variabel moderator W berskala kategorik, baik dikotomi ataupun ordinal, kategori
W dapat dijadikan dasar pengelompokan sampel dalam Stata, selanjutnya analisis SEM
hubungan antara prediktor X dengan kedua kriterionnya M dan Y dilakukan per kelompok
dengan memperlakukannya sebagai sampel ganda, tanpa perlu membentuk variabel hasil
perkalian antara X dangan W. Estimasi parameter hubungan antara X dengan M dan Y berikut
pengujian efek interaksi antara X dengan W dilakukan dengan perintah sem path,
group(groupname) yang disusul dengan perintah estat ginvariant seperti pada contoh 9.1.

Contoh 9.3 (Interaksi dengan variabel moderator kontinu):


. use D:\SEM\Data\bankloan.dta
. gen age_emp=age*employ
. sem (income < age employ age_emp)
Endogenous variables
Observed: income
Exogenous variables
Observed: age employ age_emp
Fitting target model:
Iteration 0: log likelihood = 14287.748
Iteration 1: log likelihood = 14287.748
Structural equation model
Estimation method = ml Number of obs = 850
Log likelihood = 14287.748

OIM
Standardized Coef. Std. Err. z P>|z| [95% Conf. Interval]
Structural
income <
age .0980292 .1936215 0.51 0.613 .4775203 .2814619
employ 2.774291 .7536995 3.68 0.000 4.251515 1.297067
age_emp .1438937 .0183936 7.82 0.000 .1078429 .1799445
_cons 26.35535 6.531747 4.03 0.000 13.55336 39.15734
Variance
e.income 809.6697 39.27475 736.2385 890.4247
LR test of model vs. Saturated: chi2(0) = 0.00, Prob > chi2 = .

88
KEPUSTAKAAN

Hershberger SL, 1994, The specification of equivalent models before the collection of data, in
Latent variables analysis, eds A von Eye, CC Clogg, Sage, Thousand Oaks, CA, pp 68-105.
Jackson JL, Dezee K, Douglas K, Shimeall W, 2005, Introduction to Structural Equation Modeling
(Path Analysis), SGIM Precourse PA08, viewed 8 May 2012, <http://
www.sgim.org/userfiles/file/AMHandouts/AM05/handouts/pa08.pdf>
Kenny DA, 2011, Path Analysis, viewed 10 May 2012, <http://davidakenny.net/cm/ pathanal.htm>
_______, 2011, Measuring Model Fit, viewed 10 May 2012, <http://davidakenny.net/cm/ fit.htm>
Kline RB, 2005, Principles and Practice of Structural Equation Modeling, 2nd edn, The Guildford
Press, New York.
_______, 2011, Principles and Practice of Structural Equation Modeling, 3 rd edn, The Guildford
Press, New York.
Kupek E, 2006, Beyond logistic regression: structural equation modelling for binary variables and its
application to investigating unobserved confounders, BMC Medical Research Methodology, vol 6,
no 13.
MacCallum RC, Austin JT, 2000, Applications of Structural Equation Modeling in Psychological
Research, Annu Rev Psychol, no 51, pp 201-226.
Moss S, 2009, Fit indices for structural equation modeling, Psychlopedia, viewed 6 May 2012,
viewed 8 May 2012, <http://www.psych-it.com.au/Psychlopedia/article.asp? id=277>
Norris AE, 2005a, Path Analysis, in Statistical Methods for Health Care Research, 5th edn, ed BA
Munro, Lippincott Williams & Wilkins, Philadelphia, pp 377-403
_______, 2005b, Structural Equation Modeling, in Statistical Methods for Health Care Research,
5th edn, ed BA Munro, Lippincott Williams & Wilkins, Philadelphia, pp 405-434.
Newsom J, 2012, Some Clarifications and Recommendations on Fit Indices, USP 655, SEM Jason
Newsom's SEM Class, viewed 12 May 2012, <http://www.upa.pdx.edu/IOA/
newsom/semclass/ho_fit.pdf>
Romney DM, Jenkins CD, Bynner JM, 1992, A structural analysis of health-related quality of life
dimensions, Human Relations, no 45, pp 165-176.
StataCorp LP, 2011, Stata Structural Equation Modeling: Reference Manual Release 12, Stata Press,
Lakeway Drive, College Station, Texas.
Suhr D, nd, Step your way through Path Analysis, viewed 12 May 2012,
<http://www.wuss.org/proceedings08/08WUSS%20Proceedings/papers/pos/pos04.pdf>
Wuensch KL, 2009, An introduction to Structural Equation Modeling (SEM), Dept of Psychology,
East Carolina University, Greenville, NC USA.

89
Lampiran 1
KOEFISIEN KORELASI

Data masukan (input data) yang lazim digunakan untuk analisis SEM adalah matriks
kovariansi atau korelasi. Korelasi yang dimaksud adalah korefisien korelasi Pearson yang
merepresentasikan korelasi antara dua variabel kontinu. Dalam keadaan tertentu dapat juga
digunakan beberapa bentuk korelasi lain, yaitu:

1. Korelasi biserial-titik (point-biserial correlation):


Misalkan dimiliki variabel random X yang berskala dikotomi (X = 0, 1), dan variabel
random Y yang berskala kontinu, maka korelasi biserial-titik (point-biserial correlation)
antara X dan Y adalah:
y1 y0 n1n0 y1 y0
rpb = = pq (I.1)
y n2 y

rpb : koefisien korelasi biserial-titik

y1 : rerata Y untuk X = 1

y0 : rerata Y untuk X = 0

y : standar deviasi (populasi) Y; jika y tak diketahui diganti dengan estimasi sampelnya

n : ukuran sampel
n1 : ukuran sampel kelompok untuk X = 1

n0 : ukuran sampel kelompok untuk X = 0

p : proporsi anggota sampel untuk X = 1; p = n1 /n

q : proporsi anggota sampel untuk X = 0; q = n0 /n


Perintah Stata: pbis bvar cvar [if] [in]

Contoh I.1:
Berikut ini diperlihatkan perhitungan korelasi biserial-titik antara variabel default
yang berskala dikotomi dengan variabel income yang berskala kontinu pada file bankloan.dta.

. use D:\SEM\Data\bankloan.dta, clear


. pbis default income
(obs= 700)

90
Np= 183 p= 0.26
Nq= 517 q= 0.74

Coef.= 0.0709 t= 1.8784 P>|t| = 0.0607 df = 698

Diperoleh koefisien korelasi biserial titik rpb = 0.0709. Seandainya digunakan

perintah untuk koefisien korelasi Pearson, diperoleh hasil yang hampir sama:

. corr default income


(obs=700)

default income
default 1.0000
income 0.0710 1.0000

2. Korelasi biserial rank (rank biserial correlation):


Korelasi biserial rank adalah korelasi antara variabel dikotomi dengan variabel ordinal.
Misalkan dimiliki variabel random X yang berskala dikotomi dan variabel random Y yang
berskala ordinal, maka korelasi biserial rank antara X dan Y adalah:
2 y1 y0
rrb = (I.2)
n
rrb : korelasi biserial rank

y1 : rerata ranking Y untuk X = 1

y0 : rerata ranking Y untuk X = 0

n : jumlah pasangan data

3. Koefisien phi (phi coefficient)


Koefisien phi adalah ukuran asosiasi antara dua variabel dikotomi. Lihat tabel 22 di
bawah ini:
Y=1 Y=0 Jumlah
X=1 a b n1
X=0 c d n0
Jumlah m1 m0

Koefisien korelasi phi antara X dan Y adalah:

91
ad bc
= (I.3)
n1n0 m1m0

Perintah Stata: phi catvar1 catvar2 [if exp] [in range] [, options]

Contoh I.2:

Contoh ini memperlihatkan koefisien korelasi phi antara variabel sex dan nktt, keduanya
berskala kategorik, dari file tension-type.dta.

. use D:\SEM\Data\tension-type.dta, clear

. phi sex nktt

Jenis Nyeri Kepala


kelamin Tipe-Tegang
responden 0 1 Total
0 29 36 65
1 81 72 153
Total 110 108 218
Pearson chi2(1) = 1.2650 Pr = 0.261

phi = Cohen's w = fourfold point correlation = 0.0762 phi-squared = 0.0058

Dengan perintah corr untuk menghitung koefisien korelasi Pearson diperoleh:

. corr sex nktt

(obs=218)

sex nktt
sex 1.0000
nktt -0.0762 1.0000

Walaupun nilai korelasi phi praktis sama atau hampir sama dengan korelasi Pearson,
perhitungannya dengan perintah phi selalu menghasilkan nilai positif, sehingga tandanya
dianjurkan untuk diberikan berdasarkan koefisien Pearson.

4. Korelasi order rank Spearman (Spearmans rank order correlation):


Korelasi order rank Spearman adalah korelasi antara dua variabel yang berskala
ordinal. Jika tidak ada ties, koefisien korelasi Spearman adalah:

92
6 di2
rs = 1 (I.4)

n n2 1
dengan di = R xi R yi (I.4.a)

: koefisien korelasi Spearman

R xi : ranking xi

R yi : ranking yi

n : ukuran sampel
Perintah Stata: spearman varlist [if] [in] [, options]

Contoh I.3:

Perintah spearman yang akan diperlihatkan di sini adalah untuk menghitung korelasi
antara variabel mpg dengan rep78 pada file auto.dta.

. use D:\SEM\Data\auto.dta, clear

. spearman mpg rep78

Number of obs = 69

Spearman's rho = 0.3098

Test of Ho: mpg and rep78 are independent

Prob > |t| = 0.0096

Dengan perintah corr, didapatkan nilai korelasi Pearson yang agak berbeda:

. corr mpg rep78

(obs=69)

mpg rep78
mpg 1.0000
rep78 0.4023 1.0000

5. Korelasi biserial (biserial correlation)


Korelasi biserial adalah korelasi antara variabel random kontinu X dan variabel random
dikotomi Y, variabel Y merupakan hasil kategorisasi dikotomi dari sebuah variabel kontinu.
Diasumsikan X dan Y yang melatarbelakangi Y dikotomi keduanya kontinu dan berdistribusi
normal.

93
y1 y0 pq
rb = . (I.5)
y Z

rb : koefisien biserial

y1 : rerata Y untuk kelompok X = 1

y0 : rerata Y untuk kelompok X = 0

y : standar deviasi (populasi) Y; jika y tak diketahui diganti dengan estimasi sampelnya

p : proporsi Y untuk X = 1
q : proporsi Y untuk X = 0
Z : Nilai Z pada titik pisah (cut-off point) kategorisasi dikotomi variabel X

6. Korelasi tetrakorik (tetrachoric correlation):


Korelasi tetrakorik adalah korelasi antara dua variabel dikotomi X dan Y, keduanya
merupakan hasil kategorisasi dari dua variabel kontinu yang berdistribusi normal. Korelasi
tetrakorik antara X dan Y adalah:

rtet = cos ( I.6)
1 bc ad

Perintah Stata: tetrachoric varlist [if] [in] [, options]

Contoh I.4:

Perintah tetrachoric di sini adalah untuk menghitung korelasi tetrakorik antara variabel
RS074 dengan RS075 pada file familyvalues.dta.

. use D:\SEM\Data\familyvalues.dta, clear

. tetrachoric RS074 RS075

Number of obs = 3300

Tetrachoric rho = 0.0679

Std error = 0.0302

Test of Ho: RS074 and RS075 are independent

2-sided exact P = 0.0278

94
Dengan perintah corr untuk korelasi Pearson diperoleh:

. corr RS074 RS075

(obs=3300)

RS074 RS075
RS074 1.0000
RS075 0.0390 1.0000

7. Korelasi poliserial (polyserial correlation):


Merupakan generalisasi korelasi biserial, yaitu korelasi antara variabel random kontinu
X dan variabel kategorik Y yang berskala ordinal sebagai hasil kategorisasi sebuah variabel
kontinu. Diasumsikan X dan Y yang melatarbelakangi Y ordinal keduanya kontinu dan
berdistribusi normal.
Perintah Stata (sama dengan No. 8): polychoric varlist [if exp] [in range] [, options]

8. Korelasi polikorik (polychoric correlation):


Merupakan generalisasi korelasi tetrakorik, yaitu korelasi variabel random X dan
variabel random Y, keduanya berskala ordinal sebagai hasil kategorisasi dua variabel kontinu
yang berdistribusi normal.
Perhitungan korelasi poliserial dan polikorik relatif rumit, sehingga biasanya dilakukan
dengan menggunakan program komputer.
Perintah Stata (sama dengan No. 7): polychoric varlist [if exp] [in range] [, options]

Contoh I.5:
Dalam contoh ini digunakan kembali file auto.dta untuk menghitung korelasi polikorik
antara variabel rep78 dengan foreign.

. use D:\SEM\Data\auto.dta
. polychoric rep78 foreign
Variables : rep78 foreign
Type : polychoric
Rho = .80668063
S.e. = .07631278
Goodness of fit tests:
Pearson G2 = .43127118, Prob( >chi2(3)) = .93370947
LR X2 = .38898869, Prob( >chi2(3)) = .94250766

95
Dengan perintah corr diperoleh nilai korelasi Pearson yang agak jauh berbeda:
. corr rep78 foreign
(obs=69)

rep78 foreign
rep78 1.0000
foreign 0.5922 1.0000

Skema penggunaan koefisien korelasi untuk berbagai skala variabel diperlihatkan pada
tabel I. Pada tabel I.A variabel kategoriknya berskala kategorik murni dalam arti kata bukan
hasil kategorisasi suatu variabel kontinu, sedangkan tabel I.2 adalah skema jika untuk tiap
variabel kategorik ada variabel kontinu berdistribusi normal yang melatarbelakanginya,
dengan kata lain variabel kategoriknya adalah hasil kategorisasi suatu variabel kontinu.

Tabel I. Skema korelasi untuk berbagai skala pengukuran variabel


A. Variabel kategorik tidak dilatarbelakangi oleh variabel kontinu
Y
X
Dikotomi Ordinal Kontinu
Dikotomi Koefisien phi Korelasi biserial rank Korelasi biserial titik
Ordinal Korelasi biserial rank Korelasi Spearman Korelasi Spearman
Kontinu Korelasi biserial titik Korelasi Spearman Korelasi Pearson

B. Variabel kategorik dilatarbelakangi oleh variabel kontinu


Y
X
Dikotomi Ordinal Kontinu
Dikotomi Korelasi tetrakorik Korelasi polikorik Korelasi biserial
Ordinal Korelasi polikorik Korelasi polikorik Korelasi poliserial
Kontinu Korelasi biserial Korelasi poliserial Korelasi Pearson

96
Lampiran 2
ANALISIS REGRESI LINEAR DENGAN STATA

Perintah: regress
regress depvar [indepvars] [if] [in] [, options]
options Description
noconstant suppress constant term
level (#) set confidence level; default is level (95)
beta report standardized beta coefficients
robust tipe standard error yang dianjurkan untuk dipilih jika ada
heteroskedastisitas

Variabel indikator
Variabel indikator adalah variabel yang bernilai biner (0 dan 1), digunakan untuk
merepresentasikan variabel katagorik dalam model regresi. Variabel indikator diperoleh
sebagai hasil operasi i. (lihat bawah) terhadap suatu variabel kategorik, dinyatakan sebagai
i.varname.

Variabel kategorik dan kontinu


Semua variabel yang tidak bernilai biner (0 dan 1) dan tidak berada dalam suku
interaksi dalam model akan diperlakukan sebagai variabel kontinu, kecuali mendapatkan
operator i. (lihat bawah). Semua variabel yang berada dalam suku interaksi akan diperlakukan
sebagai variabel kategorik, kecuali mendapat operator c. (lihat bawah).

Operator i. dan c.
Operator i. bagi suatu variabel, yaitu i.varname, menyatakan bahwa data pada variabel
tersebut adalah data kategorik, dan i.varname adalah variabel indikatornya. Operator c. bagi
suatu variabel, yaitu c.varname, menyatakan bahwa suatu variabel berskala kontinu.

Operator # dan ##
Operator # (palang; cross) dan ## (palang faktorial; factorial cross) digunakan terhadap
pasangan variabel. Operator # menyatakan interaksi dan mengimplikasikan semua variabel
dalam suku interaksi sebagai variabel indikator, kecuali mendapat operator c. Operasi ##
menyatakan interaksi faktorial.

97
Contoh II.1:
grup : variabel grup (nilai grup lebih daripada 2) diperlakukan sebagai variabel kontinu
(walaupun data sebenarnya kategorik)
i.grup : variabel indikator untuk variabel grup
seks : variabel seks diperlakukan sebagai variabel kategorik karena sudah bernilai biner.
i.seks : operator i. tak diperlukan, i.seks pengertiannya sama dengan seks.
usia : variabel usia diperlakukan sebagai variabel kontinu
c.usia : operator c. tak diperlukan, c.usia pengertiannya sama dengan usia.
grup#seks : menyatakan interaksi antara 2 variabel kategorik, grup dan seks
i.grup#i.seks : operator i. tak diperlukan, semua variabel dalam suku interaksi diperlakukan
sebagai variabel kategorik
grup#c.usia : menyatakan interaksi antara variabel kategorik grup dengan variabel kontinu
usia. Operator c. bagi usia harus ada supaya usia diperlakukan sebagai
variabel kontinu.
i.grup#c.usia : operator i. bagi variabel grup tak diperlukan, pengertiannya sama dengan
grup#c.usia.

grup##seks : menyatakan interaksi antara variabel kategorik grup dan seks disertai
pemasukan variabel i.grup dan seks (di luar suku interaksi) dalam model
grup##c.usia : menyatakan interaksi antara variabel kategorik grup dan variabel kontinu usia
disertai pemasukan variabel i.grup dan usia dalam model.

Contoh II.2:
- Buka file honolulu.dta:
. use D:\SEM\Data\honolulu.dta
- Regresikan sistolik terhadap usia dan kolesterol:
. regress sistolik usia kolesterol
- Masukkan suku interaksi antara usia dengan kolesterol:
. regress sistolik usia kolesterol c.usia#c.kolesterol
- Perhatikan bahwa tanpa operator c. pada interaksi, usia dan kolesterol akan diperlakukan
sebagai variabel kategorik dengan kategori yang sangat banyak, sehingga analisis regresi
tak dapat dilakukan.
- Regresikan sistolik terhadap usia dan seks:
. regress sistolik usia seks

98
- Variabel seks tidak memerlukan operator i. karena bernilai biner (0 dan 1), sehingga
dengan sendirinya sudah dianggap sebagai variabel kategorik.
- Masukkan suku interaksi antara usia dengan seks:
. regress sistolik usia seks c.usia#seks
- Variabel usia memerlukan operator c. pada suku interaksi, sedangkan variabel seks tidak
memerlukan operator i.
- Regresikan sistolik terhadap usia dan tk_pend:
. regress sistolik usia i.tk_pend
- Variabel tk_pend adalah variabel kategorik, sehingga memerlukan operator i.
- Masukkan suku interaksi antara usia dan tk_pend:
. regress sistolik usia i.tk_pend c.usia#tk_pend
- Perhatikan bahwa pada suku interaksi, usia memerlukan operator c., sebaliknya tk_pend
tidak lagi memerlukan operator i.
- Regresikan kembali sistolik terhadap usia, kolesterol, dan interaksinya:
. regress sistolik usia kolesterol usia#kolesterol
- Regresi terakhir ini menggunakan rancangan faktorial, sehingga perintahnya dapat juga
dituliskan sebagai:
. regress usia##kolesterol

Contoh II.3:
Misalkan hendak diregresikan variabel mpg terhadap variabel rep78 pada file
auto.dta. Variabel mpg sebagai variabel dependen merupakan variabel kontinu, sedangkan
variabel rep78 sebagai variabel independen juga akan diperlakukan sebagai variabel kontinu,
kecuali jika diberikan operator i.
. use D:\SEM\Data\auto.dta
. regress mpg i.rep78

99
Tampak bahwa operator i menghasilkan pembentukan 4 (5 1) variabel indikator untuk
variabel semula rep78 yang memiliki 5 taraf, yang diberi nama variabel nomor 2 s.d. 5 di
bawah nama rep78. Perintah lama xi memberi hasil yang sama, hanya dengan penamaan yang
berbeda:

. xi: regress mpg i.rep78


i.rep78 _I.rep78_1-5 (naturally coded; _I.rep78_1 omitted)

Grafik Model Regresi


Diagram tebar (scatter diagram) variabel dependen dengan satu variabel independen
dapat dituliskan dengan perintah twoway (scatter depvar indepvar); garis regresi ditampilkan
dengan perintah twoway (lfit depvar indepvar); sedangkan diagram tebar dapat ditampilkan
bersama-sama dengan perintah twoway (scatter depvar indepvar) (lfit depvar indepvar).
Garis regresi dapat juga digambarkan bersama pita interval konfidensinya dengan
mengganti perintah lfit menjadi lfitci.

100
Contoh II.4:
- Buka kembali file honolulu.dta:
. use D:\SEM\Data\honolulu.dta
- Tampilkan grafik diagram tebar kolesterol (sumbu X) dan sistolik (sumbu Y):
. twoway (scatter sistolik kolesterol)
200
180
Tekanan Darah Sistolik

160
140
120
100

150 200 250 300 350 400


Kadar Kolesterol

- Perlihatkan diagram garis regresi sistolik terhadap kolesterol:


. twoway (lfit sistolik kolesterol)
150
140
Fitted values

130
120

150 200 250 300 350 400


Kadar Kolesterol

- Garis regresinya disertai pita interval konfidensi 95%:


. twoway (lfitci sistolik kolesterol)

101
160
140
120
100

150 200 250 300 350 400


Kadar Kolesterol

95% CI Fitted values

- Diagram tebar kolesterol dan sistolik digambarkan bersama garis regresinya:


. twoway (scatter sistolik kolesterol) (lfit sistolik kolesterol)
200
180
160
140
120
100

150 200 250 300 350 400


Kadar Kolesterol

Tekanan Darah Sistolik Fitted values

- Gambaran garis regresi disertai pita interval konfidensi 95%:


. twoway (scatter sistolik kolesterol) (lfitci sistolik kolesterol)
200
180
160
140
120
100

150 200 250 300 350 400


Kadar Kolesterol

Tekanan Darah Sistolik 95% CI


Fitted values

102
Uji Normalitas
Secara kasar normalitas suatu variabel dapat dinilai dengan menggunakan grafik
univariat variabel tersebut, dengan perintah
. stem varname Diagram batang-dan-daun (stem-and-leaf)
. graph box varname Diagram kotak-dan-titik (box-and-whisker plot)
. histogram varname Grafik histogram
. pnorm varname Diagram probabilitas normal terstandardisasi
Uji statistik normalitas suatu variabel dapat dilakukan dengan uji Shapiro Wilk, dengan
perintah:
. swilk varname

Contoh II.5:

Buka file highschool.dta.


. use D:\SEM\Data\highschool.dta
. stem write
Stem-and-leaf plot for write (writing score)

3* | 1111
3t | 3333
3f | 55
3s | 66777
3. | 899999
4* | 0001111111111
4t | 223
4f | 4444444444445
4s | 66666666677
4. | 99999999999
5* | 00
5t | 2222222222222223
5f | 44444444444444444555
5s | 777777777777
5. | 9999999999999999999999999
6* | 00001111
6t | 2222222222222222223333
6f | 5555555555555555
6s | 7777777

. graph box read

103
80
70
60
reading score

50
40
30

. histogram race
4
3
Density

2
1
0

1 2 3 4
race

. pnorm math
1.00
0.75
Normal F[(math-m)/s]

0.50
0.25
0.00

0.00 0.25 0.50 0.75 1.00


Empirical P[i] = i/(N+1)

. swilk math
Shapiro-Wilk W test for normal data

Variable Obs W V z Prob>z


math 200 0.98024 2.947 2.487 0.00644

104
Uji Heteroskedastisitas
Asumsi homoskedastisitas mempersyaratkan variansi distribusi variabel dependen
adalah sama untuk setiap nilai variabel independen. Uji keberadaan heteroskedastisitas dapat
dilakukan dengan dua perintah Stata:
. estat hettest [varlist]
atau:
. estat imtest
yang dilakukan segera setelah perintah pemodelan regress depvar [indepvars].

Contoh II.6:
Buka file auto.dta dengan model regresi linear dan hasil seperti pada contoh 2.7.
. sysuse auto
. regress mpg weight c.weight#c.weight foreign
. estat hettest weight c.weight#c.weight foreign
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
Ho: Constant variance
Variables: weight c.weight#c.weight foreign

chi2(3) = 29.17
Prob > chi2 = 0.0000
. estat imtest
Cameron & Trivedi's decomposition of IM-test

Source chi2 df p
Heteroskedasticity 11.95 7 0.1023
Skewness 7.54 3 0.0566
Kurtosis 1.71 1 0.1915
Total 21.19 11 0.0315

Uji Multikolinearitas
Salah satu ukuran untuk menilai keberadaan multikolineritas adalah perhitungan nilai
VIF (variance inflation factor). Multikolinearitas dianggap ada jika VIF terbesar lebih
daripada 10 (ada juga mengambil batas atas 30).
Perintah Stata untuk menghitung VIF adalah:
. estat vif
yang dilakukan segera setelah perintah regress depvar [indepvars], atau cukup
dengan:
. vif
105
Jika intersep hendak diperlakukan sebagai salah satu variabel independen dan ikut
dihitung nilai VIF-nya, perintah Stata adalah:
. estat vif, uncentered

Contoh II.7:
Buka file bodyfat.dta, regresikan variabel bodyfat terhadap tricep, thigh, dan midarm.
. use D:\SEM\Data\bodyfat.dta
. regress bodyfat tricep thigh midarm

. estat vif
Variable VIF 1/VIF
triceps 708.84 0.001411
thigh 564.34 0.001772
midarm 104.61 0.009560
Mean VIF 459.26

Residual
Residual (galat) adalah selisih suatu nilai prediktor dengan nilai prediksinya
berdasarkan model regresi:
ei = Yi Yi

Residual terstandardisasi (standardized residuals; rstandard) adalah


ei
es i =

s 1 hi
s : akar rerata galat kuadrat (the root of MSE)
hi : leverage untuk titik ke-i (lihat bawah)
Residual Studentized (jacknifed residuals; rstudent) adalah:
ei
s
ri =
i 1 hi

106
si : akar rerata galat kuadrat jika pengamatan ke-i dihilangkan

Leverage
Titik prediktor yang nilainya menyimpang jauh dari reratanya dinyatakan sebagai titik
pengamatan dengan leverage tinggi atau titik leverage. lvr2plot adalah grafik yang
menggambarkan leverage (sumbu Y) terhadap kuadrat residual (sumbu X). Pada sisi kiri atas
grafik akan didapatkan titik-titik dengan leverage yang tinggi, sedangkan di sisi kanan bawah
grafik adalah titik-titik dengan residual absolut yang besar.
Perintah lvr2plot diberikan segera setelah perintah regress:
. regress depvar [indepvar1, indepvar2, . . .]
. lvr2plot
Jika untuk titik yang ada pada grafik ingin disertakan nilai variabel independennya,
perintahnya adalah:
. lvr2plot, ml (indepvar)
Informasi pada plot leverage vs residual-kuadrat ini dapat diringkas menjadi satu
statistik, antara lain berupa DFITS dan Cooks Distance.
DFITs ke-i adalah:

hi
DFITsi = ri
1 hi

ri : residual Studentized

hi : leverage
Cooks Distance untuk pengamatan ke-i adalah:
2
1 s(i ) 2 1 ei2 hi
Di = DFITs =
p s 1 hi 2
2 i 2
p s

p : jumlah variabel independen (termasuk konstante)


s 2 : rerata galat kuadrat (mean square error; MSE)
s(2i ) : rerata galat kuadrat jika pengamatan ke-i dihilangkan

Ukuran yang paling langsung menunjukkan pengaruh suatu titik terhadap model regresi
adalah DFBETAs. DFBETAs dihitung untuk pengamatan ke-i setiap variabel independen.
Rumus untuk leverage dan DFBETAs dinyatakan dalam bentuk operasi matriks, tak
dilampirkan di sini.

107
Perintah predict
Perintah predict adalah perintah memprediksi nilai-nilai tertentu berdasarkan model
yang ada pada perintah regress. Perintah ini diberikan segera setelah perintah regress, hasilnya
prediksinya akan langsung berada pada basis-data. Beberapa di antaranya yaitu:
. predict depvar_hat Prediksi nilai variabel dependen berdasarkan model
regresi
. predict e if e(sample) Prediksi nilai-nilai residual
. predict l, leverage Prediksi nilai-nilai leverage, yang mengukur pengaruh
pengamatan ke-i terhadap koefisien regresi
. predict c, cooksd Prediksi nilai Cooks D, yang mengukur pengaruh
pengamatan ke-i terhadap model regresi secara
keseluruhan atau nilai-nilai prediksi.
. predict rstu, rstu Prediksi nilai residual Studentized
. predict dfits, dfits Prediksi nilai DFITs, yang mengukur pengaruh
pengamatan ke-i terhadap model regresi secara
keseluruhan
. predict dfbeta, dfbeta Prediksi nilai DFBETAs, yang mengukur pengaruh
pengamatan ke-i terhadap koefisien regresi suatu variabel
independen tertentu

Beberapa perintah plot lain


Selain perintah lvr2plot, beberapa perintah plot lain untuk menilai kesesuaian model
dengan data adalah:
. acprplot varind plot augmented component-plus-residual, seperti cprplot,
tetapi dalam model penuh (dan residual parsial)
ditambahkan variabel X 2j beserta koefisien regresinya,

digunakan untuk mengecek asumsi normalitas.


. avplot varind plot added variable X, yaitu grafik residual variabel
dependen diregresikan terhadap seluruh variabel
independen kecuali X dengan residual X diregresikan
terhadap seluruh variabel independen lain, digunakan
untuk mengecek asumsi linearitas.
. avplots plot added variabel untuk seluruh p variabel independen
(p buah grafik).

108
. cprplot varind plot component-plus-residual, yaitu grafik antara

ei b j X ji yang diperoleh dari model penuh (full model)

diregresikan terhadap variabel independen X j , digunakan

untuk mengecek asumsi linearitas.


. rvfplot plot residual-versus-fitted, yaitu grafik residual terhadap
nilai-nilai prediksi variabel dependen, digunakan untuk
mengecek asumsi homoskedastisitas.
. rvpplot plot residual-versus-predictor, yaitu grafik residual
terhadap nilai-nilai salah satu variabel independen.

Ridge Regression
Ridge regression adalah tipe pengestimasian model regresi yang dianjurkan jika terdapat
multikolinearitas. Perintah Stata adalah:
. ridgereg depvar indvars [if] [in], model(orr|grr1|grr2|grr3)
Opsi model adalah sebagai berikut, yang harus dipilih salah satu:
model(orr) Ordinary Ridge Regression
model(grr1) Generalized Ridge Regression
model(grr2) Iterative Generalized Ridge Regression
model(grr3) Adaptive Generalized Ridge Regression
Jika opsi model tidak dispesifikasi, perintah ridgereg akan menghasilkan estimasi OLS
(Ordinary Least Square) biasa.

Contoh II.8:
Lihat kembali file bodyfat.dta pada contoh II.7. Pada contoh II.7 terlihat adanya
multikolinearitas antar ketiga variabel independen tricep, thigh, dan midarm dengan nilai VIF
yang sangat tinggi. Dengan ridge regression diperoleh hasil estimasi sebagai berikut.

. use D:\SEM\Data\bodyfat.dta
. ridgereg bodyfat tricep thigh midarm, model(grr1)
Variable Obs Mean Std. Dev. Min Max
__00005F 20 1 0 1 1
* Generalized Ridge Regression
bodyfat = triceps + thigh + midarm

109
110
LAMPIRAN 3
BEBERAPA NILAI-NILAI STATISTIK SUAI
PADA ANALISIS SEM

Statistik suai (fit statistics) yang ada dalam kepustakaan serta dilaporkan pada berbagai
program statistik komputer sangat beragam. Beberapa yang lazim digunakan dan dilaporkan
pada estimasi parameter SEM dengan Stata disajikan pada tabel berikut.

Statistik Interpretasi
RMSEA Indeks berbasis-non-sentralitas, merupakan indeks keburukan-suai dengan
interpretasi sebagai berikut:
- RMSEA < 0.05: Aproksimasi kesesuaian baik
- 0.05 < RMSEA < 0.08: Galat aproksimasi masih dapat diterima
- RMSEA > 0.10: Kesesuaian buruk
Interval konfidensi 90% untuk RMSEA adalah
- Batas bawah interval < 0.05: H 0 : RMSEA < 0.05 (aproksimasi
kesesuaian model baik) tidak ditolak.
- Batas atas interval tidak > 0.10: H 0 : RMSEA > 0.10 (kesesuaian model
buruk) ditolak.
- Batas bawah interval < 0.05 & batas atas interval > 0.10 hasil
kontroversial
pclose pclose (p of close fit) adalah nilai p satu-sisi untuk uji H 0 : RMSEA = 0.05

vs H A : RMSEA > 0.05.


- Jika p > 0.05, disimpulkan kesesuaian model mendekati (close)
- Jika p < 0.05, disimpulkan kesesuaian model lebih buruk daripada close
fitting
AIC Indeks suai mutlak / indeks prediktif-suai: Memperbandingkan matriks
kovariansi model peneliti dengan matrik kovariansi data. Nilai AIC yang
lebih kecil mengindikasikan kesesuaian yang lebih baik, model sesuai
terbaik adalah model dengan AIC terkecil

111
Statistik Interpretasi
BIC Indeks suai mutlak / indeks presiktif-suai seperti AIC, namun BIC sangat
menekankan parsimoni.
CFI Merupakan indeks berbasis-non-sentralitas, menilai perbaikan relatif
kesesuaian model peneliti dibandingkan dengan model dasar, yaitu model
dengan asumsi semua kovariansi bernilai sama dengan nol.
Nilai CFI berkisar antara 0 s.d. 1. Kesesuaian dianggap baik jika CFI >
0.95.
TLI Indeks suai-relatif: Memperbanding model peneliti dengan model nol, yang
menyatakan semua korelasi bernilai nol.
Nilai TLI dapat berkisar antara sedikit lebih kecil daripada 1 s.d. lebih besar
daripada 1. Kesesuaian dianggap baik jika TLI > 0.95.
SRMR Ukuran kesuaian mutlak, merupakan selisih terstandardisasi antara matriks
korelasi data dengan matriks korelasi prediksi.
- SRMR = 0 menyatakan kesesuaian sempurna
- SRMR < 0.8 dianggap menunjukkan kesesuaian baik

112
Lampiran 4
UJI HIPOTESIS PADA SEM

Pada estimasi parameter SEM, secara otomatis dilaporkan hasil uji Z untuk menilai
kemaknaan efek langsung setiap prediktor terhadap kriterionnya. Dalam bab 4 juga telah
dibahas uji Sobel untuk menilai signifikansi efek tak langsung antara dua variabel yang
terjadi melalui satu variabel mediator. Beberapa uji hipotesis lainnya adalah:
1. Uji rasio likelihood untuk memperbandingkan nilai-nilai (kovariansi) prediksi model
peneliti dengan nilai-nilai (kovariansi) data sampel (disebut juga model jenuh). Hasil uji
ini secara otomatis dilaporkan pada pemodelan dan estimasi parameter [perintah sem
(vardep < varindep1, varindep 2, . . .)].

2. Uji rasio likelihood untuk memperbandingkan dua model. Hasil estimasi kedua model
harus terlebih dahulu disimpan sebelum dapat diperbandingkan, dengan perintah:
. sem path1
. estimates store A
. sem path2
. estimates store B
. lrtest A B
3. Uji Wald untuk memperbandingkan nilai parameter antar kelompok (between groups)
pada sampel ganda, dengan perintah:
. sem path
. estat ginvariant

113

Anda mungkin juga menyukai