DATA LONGITUDINAL
Johan Harlan
Analisis Data Longitudinal
Penulis : Johan Harlan
Cetakan Pertama, Mei 2018
Analisis statistik pada tingkat dasar bermula pada analisis data cross-
sectional. Analisis data longitudinal, yang dikenal juga sebagai analisis data
panel, dapat dianggap sebagai salah satu pembahasan analisis untuk tingkat
lanjut. Studi longitudinal memiliki banyak kelebihan dibandingkan dengan
studi cross-sectional, walaupun demikian buku-buku tentang analisis data
longitudinal seringkali kurang diminati karena umumnya dipenuhi dengan
rumus dan pembahasan statistika matematik yang rumit.
v
Penulis sangat mengharapkan saran-saran yang berguna dari pembaca
untuk memperbaiki kesalahan-kesalahan yang mungkin terjadi dalam
penulisan isi buku ini serta meningkatkan kualitas pembahasannya.
Penulis
vi
DAFTAR ISI
Kata Pengantar v
Bab 1 Pendahuluan 1
Pengertian Data Longitudinal 1
Format Data Longitudinal 2
vii
Bab 6 Analisis Koefisien Random 79
Pengertian Analisis Koefisien Random 79
Analisis Koefisien Random dengan Stata 82
Kepustakaan 105
viii
BAB 1
PENDAHULUAN
1
ada adalah korelasi intra-kluster, sedangkan pada data longitudinal
didapatkan korelasi dalam-subjek.
Beberapa kelebihan studi longitudinal jika dibandingkan dengan studi
potong-lintang (cross-sectional study) yaitu:
1. Perkembangan terjadinya variabel respons dapat diamati dalam
perjalanan waktu.
2. Perkembangan terjadinya variabel respons dapat dikaitkan dengan
perkembangan terjadinya variabel lain.
Studi longitudinal juga memiliki kekurangan dibandingkan dengan
studi potong lintang, antara lain yaitu:
1. Studi longitudinal umumnya membutuhkan biaya yang relatif besar.
2. Studi longitudinal membutuhkan waktu yang lebih lama.
3 Data longitudinal lebih sulit untuk dianalisis.
Pengetahuan dasar yang dibutuhkan untuk mempelajari analisis data
longitudinal adalah pemahaman tentang beberapa teknik statistika pada studi
potong-lintang, seperti analisis regresi linear, analisis regresi logistik, dan
analisis variansi. Selama lebih daripada setengah abad, analisis data
longitudinal terpaku pada metode tradisional ANOVA untuk pengukuran
berulang yang diperkenalkan oleh Fisher pada tahun 1918. Kemajuan di
bidang Statistika dan Ilmu Komputer memungkinkan pengembangan
program statistik seperti GEE (Generalized Estimating Equations) dan
analisis koefisien random (random coefficient analysis) sebagai bentuk
modifikasi Generalized Linear Model untuk data berkorelasi.
2
long
+------------+ wide
| i j stub | +----------------+
|------------| | i stub1 stub2 |
| 1 1 4.1 | reshape |----------------|
| 1 2 4.5 | <---------> | 1 4.1 4.5 |
| 2 1 3.3 | | 2 3.3 3.0 |
| 2 2 3.0 | +----------------+
+------------+
3
Contoh 1.1:
. use “D:\Analisis Data Longitudinal\Data\repeat1.dta”, clear
. list
+----------------------------------+
| id trt y1 y2 y3 y4 |
|----------------------------------|
1. | 1 1 3.5 4.5 7.5 7.5 |
2. | 2 1 6.5 5.5 8.5 8.5 |
3. | 3 1 3.5 4.5 7.5 9.5 |
4. | 4 1 3.5 3.5 6.5 8.5 |
5. | 5 2 1 2 5 10 |
|----------------------------------|
6. | 6 2 2 3 6 10 |
7. | 7 2 2 4 5 9 |
8. | 8 2 2 3 6 11 |
+----------------------------------+
Contoh 1.2:
. use “D:/Analisis Data Longitudinal/Data/reshape1.dta”
. list
5
+-------------------------------------------------------+
| id sex inc80 inc81 inc82 ue80 ue81 ue82 |
|-------------------------------------------------------|
1. | 1 0 5000 5500 6000 0 1 0 |
2. | 2 1 2000 2200 3300 1 0 0 |
3. | 3 0 3000 2000 1000 0 0 1 |
+-------------------------------------------------------+
Di sini terdapat 2 variabel yang perlu diubah formatnya, yaitu inc dan ue.
Perintah untuk mengubah data dari format melebar menjadi format
memanjang adalah:
. list, sepby(id)
+-----------------------------+
| id year sex inc ue |
|-----------------------------|
1. | 1 80 0 5000 0 |
2. | 1 81 0 5500 1 |
3. | 1 82 0 6000 0 |
|-----------------------------|
4. | 2 80 1 2000 1 |
6
5. | 2 81 1 2200 0 |
6. | 2 82 1 3300 0 |
|-----------------------------|
7. | 3 80 0 3000 0 |
8. | 3 81 0 2000 0 |
9. | 3 82 0 1000 1 |
+-----------------------------+
. reshape wide
(note: j = 80 81 82)
Contoh 1.3:
. use “D:/Analisis Data Longitudinal/Data/reshape5.dta”, clear
. list
+-------------------------+
| hid sex year inc |
|-------------------------|
1. | 1 f 90 3200 |
2. | 1 f 91 4700 |
3. | 1 m 90 4500 |
4. | 1 m 91 4600 |
+-------------------------+
7
Berikut data akan diubah dari format memanjang-memanjang (long-
long) menjadi format melebar-melebar (wide-wide) untuk 2 variabel j (sex
dan year). Perubahan yang menyangkut 2 variabel ini tidak dapat dilakukan
dalam 1 tahap dengan 1 perintah Stata, melainkan memerlukan 2 tahap
dengan 2 perintah Stata. Karena tidak ada variabel identitas i, maka
digunakan kombinasi (hid year), sedangkan untuk pengulangan pengukuran
j digunakan (sex), yang tidak membentuk inc1 dan inc2 pada format
melebar, melainkan minc (male inc) dan finc (female inc). Operator @ di
depan inc menyatakan huruf m (male) dan f (female) diletakkan di depan
inc. Opsi string menyatakan variabel sex adalah string.
. list
+--------------------------+
| hid year finc minc |
|--------------------------|
1. | 1 90 3200 4500 |
2. | 1 91 4700 4600 |
+--------------------------+
. list
+-----------------------------------------+
| hid finc90 minc90 finc91 minc91 |
|-----------------------------------------|
1. | 1 3200 4500 4700 4600 |
+-----------------------------------------+
9
. reshape long @inc, i(hid year) j(sex) string
(note: j = f m)
. list
+-------------------------+
| hid year sex inc |
|-------------------------|
1. | 1 90 f 3200 |
2. | 1 90 m 4500 |
3. | 1 91 f 4700 |
4. | 1 91 m 4600 |
+-------------------------+
10
Contoh 1.4:
. list in 1/3
+-------------------------------------------------------------------+
1. | id | pov1 | mother1 | spouse1 | school1 | hours1 | pov2 | mother2 |
| 22 | 1| 0| 0| 1| 21 | 0| 0|
|-------------------------------------------------------------------|
| spouse2 | school2 | hours2 | pov3 | mother3 | spouse3 | school3 |
| 0| 1| 15 | 0| 0| 0| 1|
|-------------------------------------------------------------------|
| hours3 | pov4 | mother4 | spouse4 | school4 | hours4 | age |
| 3| 0| 0| 0 | 1 | 0 | 16 |
|-------------------------------------------------------------------|
| black | pov5 | mother5 | spouse5 | school5 | hours5 |
| 0 | 0 | 0 | 0 | 1 | 0 |
+-------------------------------------------------------------------+
+-------------------------------------------------------------------+
2. | id | pov1 | mother1 | spouse1 | school1 | hours1 | pov2 | mother2 |
| 75 | 0| 0| 0| 1| 8| 0| 0|
|-------------------------------------------------------------------|
| spouse2 | school2 | hours2 | pov3 | mother3 | spouse3 | school3 |
| 0| 1| 0| 0| 0| 0| 1|
|-------------------------------------------------------------------|
| hours3 | pov4 | mother4 | spouse4 | school4 | hours4 | age |
| 0| 0| 0| 0 | 1 | 4 | 17 |
|-------------------------------------------------------------------|
| black | pov5 | mother5 | spouse5 | school5 | hours5 |
| 0 | 1 | 0 | 0 | 1 | 0 |
+-------------------------------------------------------------------+
11
+-------------------------------------------------------------------+
3. | id | pov1 | mother1 | spouse1 | school1 | hours1 | pov2 | mother2 |
| 92 | 0| 0| 0| 1| 30 | 0| 0|
|-------------------------------------------------------------------|
| spouse2 | school2 | hours2 | pov3 | mother3 | spouse3 | school3 |
| 0| 1| 27 | 0| 0| 0| 1|
|-------------------------------------------------------------------|
| hours3 | pov4 | mother4 | spouse4 | school4 | hours4 | age |
| 24 | 1| 1| 0 | 0 | 31 | 16 |
|-------------------------------------------------------------------|
| black | pov5 | mother5 | spouse5 | school5 | hours5 |
| 0 | 1 | 1 | 0 | 1 | 0 |
+-------------------------------------------------------------------+
12
. list in 1/15
+----------------------------------------------------------+
| id year age black pov mother spouse school hours |
|----------------------------------------------------------|
1. | 22 1 16 0 1 0 0 1 21 |
2. | 22 2 16 0 0 0 0 1 15 |
3. | 22 3 16 0 0 0 0 1 3 |
4. | 22 4 16 0 0 0 0 1 0 |
5. | 22 5 16 0 0 0 0 1 0 |
|----------------------------------------------------------|
6. | 75 1 17 0 0 0 0 1 8 |
7. | 75 2 17 0 0 0 0 1 0 |
8. | 75 3 17 0 0 0 0 1 0 |
9. | 75 4 17 0 0 0 0 1 4 |
10. | 75 5 17 0 1 0 0 1 0 |
|----------------------------------------------------------|
11. | 92 1 16 0 0 0 0 1 30 |
12. | 92 2 16 0 0 0 0 1 27 |
13. | 92 3 16 0 0 0 0 1 24 |
14. | 92 4 16 0 1 1 0 0 31 |
15. | 92 5 16 0 1 1 0 0 0 |
+----------------------------------------------------------+
13
BAB 2
DASAR-DASAR ANALISIS DATA
LONGITUDINAL
xtset panelvar
Contoh 2.1:
. use "D:\Analisis Data Longitudinal\Data\nlswork.dta"
(National Longitudinal Survey. Young Women 14-26
years of age in 1968)
15
. list idcode year union age grade not_smsa south in 1/10
+--------------------------------------------------------+
| idcode year union age grade not_smsa south |
|--------------------------------------------------------|
1. | 1 70 . 18 12 0 0 |
2. | 1 71 . 19 12 0 0 |
3. | 1 72 1 20 12 0 0 |
4. | 1 73 . 21 12 0 0 |
5. | 1 75 . 23 12 0 0 |
|--------------------------------------------------------|
6. | 1 77 0 25 12 0 0 |
7. | 1 78 . 26 12 0 0 |
8. | 1 80 1 28 12 0 0 |
9. | 1 83 1 31 12 0 0 |
10. | 1 85 1 33 12 0 0 |
+--------------------------------------------------------+
. xtset idcode
panel variable: idcode (unbalanced)
Contoh 2.2:
. use "D:\Analisis Data Longitudinal\Data\union.dta", clear
(NLS Women 14-24 in 1968)
Dataset ini memiliki daftar variabel yang hampir sama namun lebih
sedikit daripada Contoh 2.1.
16
. list idcode year union age grade not_smsa south in 1/10
+--------------------------------------------------------+
| idcode year union age grade not_smsa south |
|--------------------------------------------------------|
1. | 1 72 1 20 12 0 0 |
2. | 1 77 0 25 12 0 0 |
3. | 1 80 1 28 12 0 0 |
4. | 1 83 1 31 12 0 0 |
5. | 1 85 1 33 12 0 0 |
|--------------------------------------------------------|
6. | 1 87 1 35 12 0 0 |
7. | 1 88 1 37 12 0 0 |
8. | 2 71 0 19 12 0 0 |
9. | 2 77 1 25 12 0 0 |
10. | 2 78 1 26 12 0 0 |
+--------------------------------------------------------+
. xtset id year
panel variable: idcode (unbalanced)
time variable: year, 70 to 88, but with gaps
delta: 1 unit
Contoh 2.3:
17
. list in 1/5
+----------------------------------------------------------+
| id year age black pov mother spouse school hours |
|----------------------------------------------------------|
1. | 22 1 16 0 1 0 0 1 21 |
2. | 22 2 16 0 0 0 0 1 15 |
3. | 22 3 16 0 0 0 0 1 3 |
4. | 22 4 16 0 0 0 0 1 0 |
5. | 22 5 16 0 0 0 0 1 0 |
|----------------------------------------------------------|
. xtset id year
panel variable: id (strongly balanced)
time variable: year, 1 to 5
delta: 1 unit
18
. xtset
panel variable: id (strongly balanced)
time variable: year, 1 to 5
delta: 1 unit
• Perintah untuk menampilkan grafik, tidak spesifik untuk data xt, tidak
memerlukan deklarasi data xt:
twoway scatter varlist [if] [in], [, options]
Menampilkan grafik diagram tebar.
graph box yvar [if] [in] [, options]
Menampilkan grafik kotak dan titik.
19
Contoh 2.4:
Lihat kembali dataset pada Contoh 2.2.
. xtdes
20
Contoh 2.5:
Lihat kembali dataset pada Contoh 2.1.
. use "D:\Analisis Data Longitudinal\Data\nlswork.dta"
. xtset idcode year
panel variable: idcode (unbalanced)
time variable: year, 68 to 88, but with gaps
delta: 1 unit
. xttab msp
. xttab race
21
Contoh 2.6:
Lihat kembali dataset pada Contoh 2.3.
. use "D:\Analisis Data Longitudinal\Data\teenprov_long.dta"
. xtset id year
. xtsum
22
spouse overall | .0992181 .2989806 0 1| N= 5755
between | .2206498 0 1| n= 1151
within | .2018338 -.7007819 .8992181 | T = 5
| |
school overall | .6304083 .4827361 0 1| N= 5755
between | .32013 0 1| n= 1151
within | .3614169 -.1695917 1.430408 | T = 5
| |
hours overall | 8.671764 14.54341 0 90 | N = 5755
between | 9.363817 0 52.4 | n = 1151
within | 11.13062 -43.72824 72.07176 | T = 5
Contoh 2.7:
. use "D:\Analisis Data Longitudinal\Data\depress.dta"
. list in 1/5
+-------------------------------------------------------------+
| subj dep1 dep2 dep3 dep4 dep5 dep6 group pre |
|-------------------------------------------------------------|
1. | 1 17 18 15 17 14 15 0 18 |
2. | 2 26 23 18 17 12 10 0 27 |
3. | 3 17 14 . . . . 0 16 |
4. | 4 14 23 17 13 12 12 0 17 |
5. | 5 12 10 8 4 5 5 0 15 |
+-------------------------------------------------------------+
23
. graph box dep1-dep6, by(group)
30
20
10
0
24
. list in 1/5
+----------------------------------+
| subj visit dep group pre |
|----------------------------------|
1. | 1 1 17 0 18 |
2. | 1 2 18 0 18 |
3. | 1 3 15 0 18 |
4. | 1 4 17 0 18 |
5. | 1 5 14 0 18 |
+----------------------------------+
25
Contoh 2.8:
. use "D:\Analisis Data Longitudinal\Data\epil.dta"
. reshape long y, i(subj) j(time)
(note: j = 1 2 3 4)
. list in 1/5
+------------------------------------------------+
| subj time id y treat baseline age |
|------------------------------------------------|
1. | 1 1 104 5 0 11 31 |
2. | 1 2 104 3 0 11 31 |
3. | 1 3 104 3 0 11 31 |
4. | 1 4 104 3 0 11 31 |
5. | 2 1 106 3 0 11 30 |
+------------------------------------------------+
26
BAB 3
ANOVA DENGAN
PENGUKURAN BERULANG
yij = µ + βi + τ j + ε ij
i = 1, 2, . . . , n ; j = 1, 2, . . . , p
yij : nilai observasi subjek (individu)
µ : rerata keseluruhan populasi
28
βi : efek ‘subjek’ (blok)
τj : efek pengulangan / waktu (perlakuan)
ε ij : komponen residual yang merepresentasikan semua sumber variasi
selain perlakuan dan subjek
Dalam model ini tidak ada efek grup (seluruh subjek hanya
merupakan 1 grup), sehingga tidak ada interaksi antara grup dengan waktu
(perlakuan). Penguraian variansi responsnya disajikan dalam bentuk tabel
ANOVA berikut.
29
Dengan Stata, perintahnya adalah:
anova depvar id timevar, repeated(timevar)
depvar : Variabel dependen, respons individual
id : Variabel blok (subjek)
timevar : Variabel waktu (pengulangan)
Perintah Stata ini diberikan pada dataset yang dalam format
memanjang, tidak memerlukan deklarasi dataset logitudinal.
Contoh 3.1:
. use "D:\Analisis Data Longitudinal\Data\rat.dta"
. list
+--------------------------------+
| rat trial1 trial2 trial3 |
|--------------------------------|
1. | 1 10 8.2 5.3 |
2. | 2 12.1 11.2 9.1 |
3. | 3 9.2 8.1 4.6 |
4. | 4 11.6 10.5 8.1 |
5. | 5 8.3 7.6 5.5 |
|--------------------------------|
6. | 6 10.5 9.5 8.1 |
+--------------------------------+
+----------------------+
| rat repeat trial |
|----------------------|
1. | 1 1 10 |
2. | 1 2 8.2 |
3. | 1 3 5.3 |
4. | 2 1 12.1 |
5. | 2 2 11.2 |
|----------------------|
6. | 2 3 9.1 |
7. | 3 1 9.2 |
8. | 3 2 8.1 |
9. | 3 3 4.6 |
10. | 4 1 11.6 |
|----------------------|
31
Between-subjects error term: rat
Levels: 6 (5 df)
Lowest b.s.e. variable: rat
32
ε ijk : galat pada unit ke-i dalam grup j pada waktu ke-k
Contoh 3.2:
. use "D:\Analisis Data Longitudinal\Data\rat1.dta"
. list in 1/5
+------------------------------+
| rat repeat trial treat |
|------------------------------|
1. | 1 1 10 1 |
2. | 1 2 8.2 1 |
3. | 1 3 5.3 1 |
4. | 2 1 12.1 0 |
5. | 2 2 11.2 0 |
|------------------------------|
33
Source | Partial SS df MS F Prob>F
-------------+-------------------------------------------
Model | 75.02278 9 8.3358644 39.64 0.0000
|
treat | 31.733893 1 31.733893 32.68 0.0046
rat|treat | 3.8844446 4 .97111116
-------------+-------------------------------------------
repeat | 38.439997 2 19.219999 91.40 0.0000
repeat#treat | .96444486 2 .48222243 2.29 0.1632
|
Residual | 1.6822223 8 .21027779
-------------+-------------------------------------------
Total | 76.705002 17 4.5120589
34
Contoh 3.3:
. use “D:\Analisis Data Longitudinal\Data\repeat1.dta”, clear
. sum y1-y4
Variable | Obs Mean Std. Dev. Min Max
---------+-----------------------------------
y1 | 8 3 1.690309 1 6.5
y2 | 8 3.75 1.101946 2 5.5
y3 | 8 6.5 1.253566 5 8.5
y4 | 8 9.25 1.101946 7.5 11
trt | y1 y2 y3 y4
------+----------------------------------------
1 | 4 4 4 4
| 4.25 4.5 7.5 8.5
| 1.5 .8164966 .8164966 .8164966
| 2.25 .6666667 .6666667 .6666667
------+----------------------------------------
2 | 4 4 4 4
| 1.75 3 5.5 10
| .5 .8164966 .5773503 .8164966
| .25 .6666667 .3333333 .6666667
------+----------------------------------------
Total | 8 8 8 8
| 3 3.75 6.5 9.25
| 1.690309 1.101946 1.253566 1.101946
| 2.857143 1.214286 1.571429 1.214286
-----------------------------------------------
35
Grafik untuk kedelapan rerata sel di atas adalah:
. correlate y1-y4
(obs=8)
| y1 y2 y3 y4
--------+------------------------------------
------------------------------------
y1 | 1.0000
y2 | 0.8820 1.0000
y3 | 0.9102 0.8273 1.0000
y4 | -0.5752 -0.6471
0.6471 -0.5171 1.0000
36
. correlate y1-y4, cov
(obs=8)
| y1 y2 y3 y4
--------+------------------------------------
y1 | 2.85714
y2 | 1.64286 1.21429
y3 | 1.92857 1.14286 1.57143
y4 | -1.07143 -.785714 -.714286 1.21429
. list in 1/5
+-----------------------+
| id time trt y |
|-----------------------|
1. | 1 1 1 3.5 |
2. | 1 2 1 4.5 |
3. | 1 3 1 7.5 |
4. | 1 4 1 7.5 |
5. | 2 1 1 6.5 |
+-----------------------+
37
Rancangan ini dinamakan juga Analisis Variansi Faktorial Split-
plot. Pada Stata dengan format data memanjang, perlu dispesifikasikan suku
galat untuk efek antar-subjek maupun dalam-subjek. Syaratnya yaitu ada satu
suku galat untuk seluruh efek antar-subjek, suku galat terpisah untuk tiap
faktor dalam subjek, dan interaksi antar faktor dalam-subjek. Pada model ini
juga ada 2 suku galat tersebut. Efek antar-subjek adalah treatment (trt) dan
suku galatnya tersarang dalam treatment (id | trt). Faktor waktu dalam-
subjek adalah time. Suku galatnya adalah galat residual untuk model.
Pada ANOVA dengan pengukuran berulang diasumsikan struktur
kovariansi bersifat simetrik compound, yang dikenal juga sebagai
exchangeable. Dengan simetri compound diasumsikan variansi sama pada
tiap titik waktu dan kovariansi juga sama satu dengan lainnya. Jika struktur
kovariansi dalam-subjek tidak memiliki simetri compound, maka nilai p yang
diperoleh pada ANOVA dengan pengukuran berulang tidak merefleksikan
probabilitas yang “benar” secara akurat. Pada Stata ketiadaan simetri
compound dikoreksi dengan memasukkan opsi repeated() ke dalam
perintah anova yang akan menghasilkan perhitungan nilai p dengan uji F
konservatif.
38
Residual | 9.125 18 .50694444
---------+--------------------------------------------
Total | 242.5 31 7.8225806
39
. contrast time@trt, effect
Contrasts of marginal linear predictions
Margins : asbalanced
-----------------------------------------------
| df F P>F
------------+----------------------------------
time@trt |
1 | 3 35.96 0.0000
2 | 3 104.67 0.0000
Joint | 6 70.32 0.0000
|
Denominator | 18
-----------------------------------------------
---------------+-----------------------------------------------------
| Contrast Std. Err. t P>|t| [95% Conf. Interval]
---------------------------------------------------------------------
time@trt |
(2 vs base) 1 | .25 .5034602 0.50 0.626 -.8077307 1.307731
(2 vs base) 2 | 1.25 .5034602 2.48 0.023 .1922693 2.307731
(3 vs base) 1 | 3.25 .5034602 6.46 0.000 2.192269 4.307731
(3 vs base) 2 | 3.75 .5034602 7.45 0.000 2.692269 4.807731
(4 vs base) 1 | 4.25 .5034602 8.44 0.000 3.192269 5.307731
(4 vs base) 2 | 8.25 .5034602 16.39 0.000 7.192269 9.307731
---------------------------------------------------------------------
40
BAB 4
MANOVA DENGAN
PENGUKURAN BERULANG
41
c. Lawley-Hotelling trace: Jumlah akar perkalian matriks jumlah
kuadrat model dengan matriks jumlah kuadrat galat.
d. Roy’s largest root: Akar terbesar perkalian matriks jumlah kuadrat
model dengan matriks jumlah kuadrat galat.
Uji hipotesis H 0 : τ 1 = τ 2 = . . . = τ k = 0
Uji hipotesis H 0 : µ 1 = µ 2 = . . . = µ k
Contoh 4.1:
Di sini diperlihatkan pelaksanaan uji normalitas multivariat dan uji
homogenitas matriks kovariansi.
. use “D:\Analisis Data Longitudinal\Data\manova3.dta”, clear
Ada 3 grup pada dataset ini. Grup 1 dinamakan grup treatment,
grup 2 dinamakan control_1, dan grup 3 adalah control_2. Untuk tiap
grup, variabel respons adalah useful, difficulty, dan importance.
43
. summarize useful difficulty importance
44
. correlate useful difficulty importance
(obs=33)
Contoh 4.2:
. use “D:\Analisis Data Longitudinal\Data\manova_nobetween.dta”,
clear
. list
+---------------------------------+
| subject test1 test2 test3 |
|---------------------------------|
1. | 1 68 69 95 |
2. | 2 50 74 69 |
45
3. | 3 72 89 71 |
4. | 4 61 64 61 |
5. | 5 60 71 90 |
+---------------------------------+
. generate mycons = 1
Number of obs = 5
. mat in c = (1,0,-1\0,1,-1)
46
. manovatest mycons, ytransform(c)
47
j variable (3 values) -> testnum
xij variables:
test1 test2 test3 -> test
-------------------------------------------------------
Contoh 4.3:
Pada Contoh 4.3 ini akan diperlihatkan contoh dengan rancangan
dalam-subjek, yang dikenal juga sebagai rancangan blok randomisasi.
Untuk tiap subjek dilakukan 4 kali pengamatan, yaitu y1. y2, y3, dan y4.
ycomp[3,4]
c1 c2 c3 c4
r1 1 0 0 -1
r2 0 1 0 -1
r3 0 0 1 -1
49
Source | Statistic df F(df1, df2) = F Prob>F
---------+----------------------------------------------
con | W 0.2458 1 3.0 5.0 5.11 0.0554 e
| P 0.7542 3.0 5.0 5.11 0.0554 e
| L 3.0682 3.0 5.0 5.11 0.0554 e
| R 3.0682 3.0 5.0 5.11 0.0554 e
|----------------------------------------------
Residual | 7
--------------------------------------------------------
e = exact, a = approximate, u = upper bound on F
Contoh 4.4:
Dataset pada Contoh 4.4 ini juga menggunakan rancangan blok
randomisasi.
Number of obs = 20
50
|-------------------------------------------------
Residual | 12
---------+-------------------------------------------------
variety | W 0.0011 3 15.0 22.5 16.11 0.0000 a
| P 2.5031 15.0 30.0 10.08 0.0000 a
| L 48.3550 15.0 20.0 21.49 0.0000 a
| R 40.0068 5.0 10.0 80.01 0.0000 u
|-------------------------------------------------
block | W 0.0047 4 20.0 27.5 5.55 0.0000 a
| P 1.7518 20.0 44.0 1.71 0.0681 a
| L 77.9162 20.0 26.0 25.32 0.0000 a
| R 76.4899 5.0 11.0 168.28 0.0000 u
|-------------------------------------------------
Residual | 12
---------+-------------------------------------------------
Total | 19
-----------------------------------------------------------
e = exact, a = approximate, u = upper bound on F
. matrix m1 = J(1,5,1)
. manovatest, showorder
51
. matrix inp c1 = (1 −1 0 0 0 0 0 0 0 0\1 0 −1 0 0 0 0 0 0 0\1 0 0 −1 0 0 0
0 0 0)
Test constraints
(1) 1.variety - 2.variety = 0
(2) 1.variety - 3.variety = 0
(3) 1.variety - 4.variety = 0
52
Test constraint
(1) .25*1.variety + .25*2.variety + .25*3.variety +
.25*4.variety + .2*1.block + .2*2.block + .2*3.block +
.2*4.block + .2*5.block + _cons = 0
Test constraints
(1) 1.variety - 2.variety = 0
(2) 1.variety - 3.variety = 0
(3) 1.variety - 4.variety = 0
53
Source | Statistic df F(df1, df2) = F Prob>F
-----------+------------------------------------------------
manovatest | W 0.0143 3 12.0 24.1 8.00 0.0000 a
| P 2.1463 12.0 33.0 6.91 0.0000 a
| L 12.1760 12.0 23.0 7.78 0.0000 a
| R 8.7953 4.0 11.0 24.19 0.0000 u
|------------------------------------------------
Residual | 12
------------------------------------------------------------
e = exact, a = approximate, u = upper bound on F
Contoh 4.5:
Di sini diperlihatkan contoh rancangan dalam-subjek dengan 2 level,
yang dapat digolongkan ke dalam rancangan faktorial split-plot.
. manova y1 y2 y3 y4 = a
Number of obs = 8
54
e = exact, a = approximate, u = upper bound on F
. manovatest a, ytransform(ymat)
Transformations of the dependent variables
(1) y1 - y4
(2) y2 - y4
(3) y3 - y4
55
Berikut akan diuji efek variabel dalam-subjek dengan menggunakan
matriks xmat untuk membentuk kontras bagi variabel prediktor.
xmat[1,3]
c1 c2 c3
r1 1 .5 .5
Test constraint
(1) 1.a + .5*2.a + .5*_cons = 0
56
Contoh 4.6:
Lihat kembali dataset pada Contoh 4.1. Setelah uji asumsi pada
Contoh 4.1, uji MANOVA akan dilanjutkan di sini.
e(eigvals_m)[1,2]
c1 c2
r1 .8919879 .00524207
57
Perhitungan keempat statistik penguji multivariat untuk group
adalah:
Wilk’s lambda:
1
= ∑i 1+ λ
i
1 1 1
= + +
1 + 0.8919879 1 + 0.00524207 1+ 0
= 0.5258
Pillai’s trace:
0.8919879
= + 0.00524207 + 0
1 + 0.8919879 1 + 0.00524207 1+ 0
= 0.4767
Lawley-Hotelling trace:
= 0.8919879 + 0.00524207 + 0
= 0.8972
. manovatest, showorder
. matrix c1=(2,-1,-1,0)
. manovatest, test(c1)
58
Test constraint
(1) 2*1.group - 2.group - 3.group = 0
. matrix c2=(0,1,-1,0)
. manovatest, test(c2)
Test constraint
(1) 2.group - 3.group = 0
59
| L 0.0068 3.0 28.0 0.06 0.9785 e
| R 0.0068 3.0 28.0 0.06 0.9785 e
|-----------------------------------------------
Residual | 30
-----------------------------------------------------------
e = exact, a = approximate, u = upper bound on F
---------------------------------------------------------------
| Delta-method
| Margin Std. Err. t P>|t| [95% Conf. Interval]
-----------+---------------------------------------------------
group |
treatment | 6.190909 .6186184 10.01 0.000 4.927522 7.454296
control_1 | 5.581818 .6186184 9.02 0.000 4.318431 6.845206
control_2 | 5.372727 .6186184 8.69 0.000 4.10934 6.636115
---------------------------------------------------------------
60
---------------------------------------------------------------
| Delta-method
| Margin Std. Err. t P>|t| [95% Conf. Interval]
-----------+---------------------------------------------------
group |
treatment | 18.11818 .9438243 19.20 0.000 16.19064 20.04573
control_1 | 15.52727 .9438243 16.45 0.000 13.59973 17.45482
control_2 | 15.34545 .9438243 16.26 0.000 13.41791 17.273
---------------------------------------------------------------
---------------------------------------------------------------
| Delta-method
| Margin Std. Err. t P>|t| [95% Conf. Interval]
-----------+---------------------------------------------------
group |
treatment | 8.681818 1.136676 7.64 0.000 6.360415 11.00322
control_1 | 5.109091 1.136676 4.49 0.000 2.787688 7.430494
control_2 | 5.636364 1.136676 4.96 0.000 3.314961 7.957766
---------------------------------------------------------------
61
BAB 5
ANALISIS GENERALIZED
ESTIMATING EQUATIONS
Pengertian GEE
Generalized Estimating Equations (GEE) adalah himpunan prosedur
inferensi statistik bagi data yang berkorelasi, terutama data longitudinal,
yang tidak memenuhi asumsi Generalized Linear Models tentang normalitas
dan independensi. GEE merupakan pengembangan GLM yang khusus
diperuntukkan untuk data berkorelasi.
Model yang digunakan adalah model sederhana untuk korelasi
dalam-subjek dengan matriks korelasi kerja (working correlation matrix)
yang mengakomodasikan korelasi tersebut. Dengan prosedur iteratif yang
menggunakan metode quasi-likelihood diperoleh estimasi parameter rerata
yang konsisten, walaupun spesifikasi struktur kovariansi yang digunakan
tidak benar.
63
t1 t2 t3 t4 t5 t6
t1 − 0 0 0 0 0
t2 0 − 0 0 0 0
t3 0 0 − 0 0 0
0
t4 0 0 0 − 0
t5 0 0 0 0 − 0
t6 0 0 0 0 0 −
t1 t2 t3 t4 t5 t6
t1 − ρ ρ ρ ρ ρ
t2 ρ − ρ ρ ρ ρ
t3 ρ ρ − ρ ρ ρ
t4 ρ ρ ρ − ρ ρ
t5 ρ ρ ρ ρ − ρ
t6 ρ ρ ρ ρ ρ −
64
t1 t2 t3 t4 t5 t6
t1 − ρ1 ρ2 0 0 0
t2 ρ1 − ρ1 ρ2 0 0
t3 ρ2 ρ1 − ρ1 ρ2 0
t4 0 ρ2 ρ1 − ρ1 ρ2
t5 0 0 ρ2 ρ1 − ρ1
t6 0 0 0 ρ2 ρ1 −
t1 t2 t3 t4 t5 t6
t1 − ρ1 ρ2 ρ3 ρ4 ρ5
t2 ρ1 − ρ1 ρ2 ρ3 ρ4
t3 ρ2 ρ1 − ρ1 ρ2 ρ3
t4 ρ3 ρ2 ρ1 − ρ1 ρ2
t5 ρ4 ρ3 ρ2 ρ1 − ρ1
t6 ρ5 ρ4 ρ3 ρ2 ρ1 −
t1 t2 t3 t4 t5 t6
t1 − ρ1 ρ2 ρ3 ρ4 ρ5
t2 ρ1 − ρ6 ρ7 ρ8 ρ9
t3 ρ2 ρ6 − ρ10 ρ11 ρ12
65
t4 ρ3 ρ7 ρ10 − ρ13 ρ14
t5 ρ4 ρ8 ρ11 ρ13 − ρ15
t6 ρ5 ρ9 ρ12 ρ14 ρ15 −
Beberapa opsi:
family(family) :Distribusi respons, default-nya adalah
family(gaussian)
link(link) : Fungsi link, default-nya adalah fungsi link yang sesuai
dengan family-nya.
corr(correlation) : Struktur korelasi dalam-grup, default-nya adalah
corr(exchangeable)
Daftar distribusi respons dan fungsi link diperlihatkan pada tabel 6.1
berikut.
Tabel 6.1 Daftar Family dan Link untuk beberapa model regresi
66
Opsi struktur korelasi yang tersedia pada Stata adalah:
exchangeable : pertukaran (exchangeable)
independent : independen
unstructured : tak-terstruktur
ar # : auto-regresi derajat #
stationary # : stasioner derajat #
Pasangan struktur korelasi yang sesuai untuk tiap family dan link
diperlihatkan pada tabel berikut:
Contoh 5.1:
. use "D:\Analisis Data Longitudinal\Data\union.dta", clear
(NLS Women 14-24 in 1968)
67
. xtset id year
panel variable: idcode (unbalanced)
time variable: year, 70 to 88, but with gaps
delta: 1 unit
----------------------------------------------------------------
union | Coef. Std. Err. z P>|z| [95% Conf. Interval]
---------+------------------------------------------------------
age | .0098801 .0020824 4.74 0.000 .0057986 .0139616
grade | .0606146 .0108383 5.59 0.000 .0393719 .0818573
not_smsa | -.1257349 .0483488 -2.60 0.009 -.2204969 -.0309729
south | -.5747081 .048645 -11.81 0.000 -.6700506 -.4793656
_cons | -2.163394 .1484472 -14.57 0.000 -2.454345 -1.872443
----------------------------------------------------------------
68
Contoh 5.2:
. use "D:\Analisis Data Longitudinal\Data\nlswork.dta"
(National Longitudinal Survey. Young Women 14-26
years of age in 1968)
. xtset idcode
panel variable: idcode (unbalanced)
------------------------------------------------------------------
union | Coef. Std. Err. z P>|z| [95% Conf. Interval]
---------+--------------------------------------------------------
age | .0078591 .0024113 3.26 0.001 .0031331 .0125851
not_smsa | -.2502181 .0558235 -4.48 0.000 -.3596302 -.140806
_cons | -1.446498 .0831114 -17.40 0.000 -1.609393 -1.283602
------------------------------------------------------------------
69
Contoh 5.3:
. use "D:\Analisis Data Longitudinal\Data\teenprov.dta"
. list in 1/3
+-------------------------------------------------------------------+
1. | id | pov1 | mother1 | spouse1 | school1 | hours1 | pov2 | mother2 |
| 22 | 1| 0| 0| 1| 21 | 0| 0|
|-------------------------------------------------------------------|
| spouse2 | school2 | hours2 | pov3 | mother3 | spouse3 | school3 |
| 0| 1| 15 | 0| 0| 0| 1|
|-------------------------------------------------------------------|
| hours3 | pov4 | mother4 | spouse4 | school4 | hours4 | age |
| 3| 0| 0| 0 | 1 | 0 | 16 |
|-------------------------------------------------------------------|
| black | pov5 | mother5 | spouse5 | school5 | hours5 |
| 0 | 0 | 0 | 0 | 1 | 0 |
+-------------------------------------------------------------------+
+-------------------------------------------------------------------+
2. | id | pov1 | mother1 | spouse1 | school1 | hours1 | pov2 | mother2 |
| 75 | 0| 0| 0| 1| 8| 0| 0|
|-------------------------------------------------------------------|
| spouse2 | school2 | hours2 | pov3 | mother3 | spouse3 | school3 |
| 0| 1| 0| 0| 0| 0| 1|
|-------------------------------------------------------------------|
| hours3 | pov4 | mother4 | spouse4 | school4 | hours4 | age |
| 0| 0| 0| 0 | 1 | 4 | 17 |
|-------------------------------------------------------------------|
| black | pov5 | mother5 | spouse5 | school5 | hours5 |
| 0 | 1 | 0 | 0 | 1 | 0 |
+-------------------------------------------------------------------+
70
+-------------------------------------------------------------------+
3. | id | pov1 | mother1 | spouse1 | school1 | hours1 | pov2 | mother2 |
| 92 | 0| 0| 0| 1| 30 | 0| 0|
|-------------------------------------------------------------------|
| spouse2 | school2 | hours2 | pov3 | mother3 | spouse3 | school3 |
| 0| 1| 27 | 0| 0| 0| 1|
|-------------------------------------------------------------------|
| hours3 | pov4 | mother4 | spouse4 | school4 | hours4 | age |
| 24 | 1| 1| 0 | 0 | 31 | 16 |
|-------------------------------------------------------------------|
| black | pov5 | mother5 | spouse5 | school5 | hours5 |
| 0 | 1 | 1 | 0 | 1 | 0 |
+-------------------------------------------------------------------+
71
Data wide -> long
------------------------------------------------
Number of obs. 1151 -> 5755
Number of variables 28 -> 9
j variable (5 values) -> year
xij variables:
pov1 pov2 ... pov5 -> pov
mother1 mother2 ... mother5 -> mother
spouse1 spouse2 ... spouse5 -> spouse
school1 school2 ... school5 -> school
hours1 hours2 ... hours5 -> hours
------------------------------------------------
. list in 1/15
+----------------------------------------------------------+
| id year age black pov mother spouse school hours |
|----------------------------------------------------------|
1. | 22 1 16 0 1 0 0 1 21 |
2. | 22 2 16 0 0 0 0 1 15 |
3. | 22 3 16 0 0 0 0 1 3 |
4. | 22 4 16 0 0 0 0 1 0 |
5. | 22 5 16 0 0 0 0 1 0 |
|----------------------------------------------------------|
6. | 75 1 17 0 0 0 0 1 8 |
7. | 75 2 17 0 0 0 0 1 0 |
8. | 75 3 17 0 0 0 0 1 0 |
9. | 75 4 17 0 0 0 0 1 4 |
10. | 75 5 17 0 1 0 0 1 0 |
|----------------------------------------------------------|
11. | 92 1 16 0 0 0 0 1 30 |
12. | 92 2 16 0 0 0 0 1 27 |
13. | 92 3 16 0 0 0 0 1 24 |
72
14. | 92 4 16 0 1 1 0 0 31 |
15. | 92 5 16 0 1 1 0 0 0 |
+----------------------------------------------------------+
. xtset id year
panel variable: id (strongly balanced)
time variable: year, 1 to 5
delta: 1 unit
. xtsum
73
mother overall | .1986099 .3989883 0 1| N= 5755
between | .3253864 0 1| n= 1151
within | .2310605 -.6013901 .9986099 | T = 5
| |
spouse overall | .0992181 .2989806 0 1| N= 5755
between | .2206498 0 1| n= 1151
within | .2018338 -.7007819 .8992181 | T = 5
| |
school overall | .6304083 .4827361 0 1| N= 5755
between | .32013 0 1| n= 1151
within | .3614169 -.1695917 1.430408 | T = 5
| |
hours overall | 8.671764 14.54341 0 90 | N = 5755
between | 9.363817 0 52.4 | n = 1151
within | 11.13062 -43.72824 72.07176 | T = 5
74
---------------------------------------------------------------
pov | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------+-------------------------------------------------------
age | -.0569927 .0369965 -1.54 0.123 -.1295045 .0155192
black | .4980237 .077386 6.44 0.000 .34635 .6496974
mother | .8258969 .0923618 8.94 0.000 .644871 1.006923
spouse | -.9493282 .1219036 -7.79 0.000 -1.188255 -.7104015
school | -.1081528 .0725594 -1.49 0.136 -.2503666 .034061
hours | -.0208458 .002309 -9.03 0.000 -.0253713 -.0163202
_cons | .2429719 .58535 0.42 0.678 -.9042931 1.390237
---------------------------------------------------------------
Contoh 5.4:
. use "D:\Analisis Data Longitudinal\Data\epil.dta"
. reshape long y, i(subj) j(time)
(note: j = 1 2 3 4)
. list in 1/12
+------------------------------------------------+
| subj time id y treat baseline age |
|------------------------------------------------|
1. | 1 1 104 5 0 11 31 |
2. | 1 2 104 3 0 11 31 |
3. | 1 3 104 3 0 11 31 |
75
4. | 1 4 104 3 0 11 31 |
5. | 2 1 106 3 0 11 30 |
|------------------------------------------------|
6. | 2 2 106 5 0 11 30 |
7. | 2 3 106 3 0 11 30 |
8. | 2 4 106 3 0 11 30 |
9. | 3 1 107 2 0 6 25 |
10. | 3 2 107 4 0 6 25 |
|------------------------------------------------|
11. | 3 3 107 0 0 6 25 |
12. | 3 4 107 5 0 6 25 |
+------------------------------------------------+
76
GEE population-averaged model Number of obs = 236
Group variable: subj Number of groups = 59
Link: log Obs per group:
Family: Poisson min = 4
Correlation: exchangeable avg = 4.0
max = 4
Wald chi2(4) = 970.41
Scale parameter: 1 Prob > chi2 = 0.0000
-----------------------------------------------------------------
y | Coef. Std. Err. z P>|z| [95% Conf. Interval]
---------+-------------------------------------------------------
time | -.0587233 .0156912 -3.74 0.000 -.0894776 -.0279691
treat | -.1478458 .0709743 -2.08 0.037 -.286953 -.0087386
age | .0235715 .0059738 3.95 0.000 .0118631 .03528
baseline | .0227431 .0007557 30.10 0.000 .021262 .0242243
_cons | .6759401 .2048927 3.30 0.001 .2743578 1.077522
-----------------------------------------------------------------
77
BAB 6
ANALISIS KOEFISIEN RANDOM
79
Model analisis koefisien random dengan random intercept adalah:
Yit = β 0i + β 1 t + ε it
Yit : Respons subjek ke-i pada waktu t
β 0i : Intersep random
β1 : Slope fixed
t : Waktu pengukuran
ε it : Galat untuk subjek ke-i pada waktu t
Tampak bahwa slope β 1 adalah konstan untuk tiap subjek,
sedangkan intersep β 0i nilainya bervariasi untuk tiap subjek ke
ke-i (gambar
6.2). Model ini digunakan jika efek waktu terhadap tiap subjek diasumsikan
sama besar, tetapi tiap subjek memiliki titik awal / baseline yang berbeda.
80
Tampak bahwa intersep β 0 adalah konstan untuk tiap subjek,
sedangkan slope β 1i nilainya bervariasi untuk tiap subjek ke
ke-i (gambar 6.3).
Model ini digunakan jika tiap subjek memulai pengamatan dari baseline
yang sama, tetapi efek waktu terhadap tiap subjek bbervariasi.
81
:
Contoh 6.1:
. use "D:\Analisis Data Longitu
udinal\Data\invest2.dta"
. xtreg invest market stock
------------------------------------------------------------------
invest | Coef. Std. Err. z P>|z| [95% Conf. Interval]
--------+---------------------------------------------------------
market | .1048856 .0147972 7.09 0.000 .0758835 .1338876
stock | .3460156 .0242535 14.27 0.000 .2984796 .3935517
_cons | -60.29049 54.48388 -1.11 0.268 -167.0769 46.49595
--------+---------------------------------------------------------
sigma_u | 104.65267
sigma_e | 69.117977
rho | .69628394 (fraction of variance due to u_i)
------------------------------------------------------------------
83
max = 20
Wald chi2(2) = 397.01
Scale parameter: 15930.98 Prob > chi2 = 0.0000
----------------------------------------------------------------
invest | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------+--------------------------------------------------------
market | .1049279 .0146039 7.18 0.000 .0763048 .1335511
stock | .3460474 .02386 14.50 0.000 .2992826 .3928121
_cons | -60.38182 54.62176 -1.11 0.269 -167.4385 46.67487
----------------------------------------------------------------
.Contoh 6.2:
84
tau = 0.1 log likelihood = -12923.751
tau = 0.2 log likelihood = -12417.651
tau = 0.3 log likelihood = -12001.665
tau = 0.4 log likelihood = -11655.586
tau = 0.5 log likelihood = -11366.441
tau = 0.6 log likelihood = -11128.749
tau = 0.7 log likelihood = -10946.399
tau = 0.8 log likelihood = -10844.833
-----------------------------------------------------------------------
union | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+---------------------------------------------------------
age | .0156732 .0149895 1.05 0.296 -.0137056 .045052
grade | .0870851 .0176476 4.93 0.000 .0524965 .1216738
not_smsa | -.2511884 .0823508 -3.05 0.002 -.4125929 -.0897839
85
1.south | -2.839112 .6413116 -4.43 0.000 -4.096059 -1.582164
year | -.0068604 .0156575 -0.44 0.661 -.0375486 .0238277
|
south#c.year |
1 | .0238506 .0079732 2.99 0.003 .0082235 .0394777
|
_cons | -3.009365 .8414963 -3.58 0.000 -4.658667 -1.360062
-------------+---------------------------------------------------------
/lnsig2u | 1.749366 .0470017 1.657245 1.841488
-------------+---------------------------------------------------------
sigma_u | 2.398116 .0563577 2.290162 2.511158
rho | .6361098 .0108797 .6145307 .6571548
-----------------------------------------------------------------------
LR test of rho=0: chibar2(01) = 6004.43
Prob >= chibar2 = 0.000
86
----------------------------------------------------------------------
union | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+--------------------------------------------------------
age | .0165893 .0092229 1.80 0.072 -.0014873 .0346659
grade | .0600669 .0108343 5.54 0.000 .0388321 .0813016
not_smsa | -.1215445 .0483713 -2.51 0.012 -.2163505 -.0267384
1.south | -1.857094 .372967 -4.98 0.000 -2.588096 -1.126092
year | -.0121168 .0095707 -1.27 0.205 -.030875 .0066413
|
south#c.year |
1 | .0160193 .0046076 3.48 0.001 .0069886 .0250501
|
_cons | -1.39755 .5089508 -2.75 0.006 -2.395075 -.4000247
----------------------------------------------------------------------
87
BAB 7
REGRESI VARIABEL INSTRUMENTAL
DENGAN ESTIMATOR EFEK
RANDOM DAN FIXED
89
Sebuah prediktor dinyatakan bersifat endogen jika prediktor tersebut
berkorelasi dengan suku galat.
Eksogenitas instrumen menyatakan bahwa setelah mengendalikan x dan
variabel yang tak diamati (omitted variables), z tak memiliki efek parsial
omitted variables
terhadap y dan z tak berkorelasi dengan variabel yang tak diamati.
Regresi variabel instrumental untuk data longitudinal padpada Stata dilakukan
dengan perintah xtivreg. Untuk perintah Stata ini tersedia beberapa opsi
estimator, antara lain yaitu estimator re (random effects) sebagai default,
estimator fe (fixed effects), dan fd ((first-difference). Di sini hanya akan dibahas
regresi variabel instrumental untuk data longitudinal dengan estimator re dan fd.
Sintaks untuk perintah xtivreg ini adalah:
90
Didefinisikan juga suku galat komposit ν it :
ν it = ai + uit
σ a2
Corr (ν it ; ν is ) = ; t≠s
σ a2 + σ u2
σ a2 = Var ( ai ) ; σ u2 = Var ( uit )
σ u2
θ =1− ; 0<θ <1 (7.5)
σ u2 + Tσ a2
Maka diperoleh:
yit − θ yi = β0 (1 − θ ) + β1 ( xit1 − θ xi1 ) + . . . + β k ( xitk − θ xik )
+ (ν it − θ ν i ) (7.6)
91
varlist2 : Himpunan variabel independen yang berkorelasi dengan galat,
disebut variabel endogen yang terinstrumentasi oleh (instrumented
by) variabel instrumental.
varlistIV : Variabel instrumental
Sebagai perbandingan, perintah Stata untuk regresi variabel instrumental
dengan efek fixed dilakukan dengan mengganti opsi re pada perintah Stata di atas
dengan opsi fe.
Contoh 7.1:
92
---------------------------------------------------------------------
ln_wage | Coef. Std. Err. z P>|z| [95% Conf. Interval]
------------+--------------------------------------------------------
tenure | .1391798 .0078756 17.67 0.000 .123744 .1546157
age | .0279649 .0054182 5.16 0.000 .0173454 .0385843
|
c.age#c.age | -.0008357 .0000871 -9.60 0.000 -.0010063 -.000665
|
not_smsa | -.2235103 .0111371 -20.07 0.000 -.2453386 -.2016821
|
race |
black | -.2078613 .0125803 -16.52 0.000 -.2325183 -.1832044
_cons | 1.337684 .0844988 15.83 0.000 1.172069 1.503299
------------+--------------------------------------------------------
sigma_u | .36582493
sigma_e | .63031479
rho | .25197078 (fraction of variance due to u_i)
----------------------------------------------------------------------
Instrumented: tenure
Instruments: age c.age#c.age not_smsa 2.race union birth_yr south
---------------------------------------------------------------------
Contoh 7.2:
Pada regresi variabel instrumental untuk data longitudinal dengan
estimator fd ini ai pada persamaan 7.2 diasumsikan berkorelasi dengan kovariat x
dan yang digunakan adalah demeaned data, yaitu θ = 1.
93
Fixed-effects (within) IV regression Number of obs = 19,007
Group variable: idcode Number of groups = 4,134
---------------------------------------------------------------------
ln_wage | Coef. Std. Err. z P>|z| [95% Conf. Interval]
------------+--------------------------------------------------------
tenure | .2403531 .0373419 6.44 0.000 .1671643 .3135419
age | .0118437 .0090032 1.32 0.188 -.0058023 .0294897
|
c.age#c.age | -.0012145 .0001968 -6.17 0.000 -.0016003 -.0008286
|
not_smsa | -.0167178 .0339236 -0.49 0.622 -.0832069 .0497713
|
race |
black | 0 (omitted)
_cons | 1.678287 .1626657 10.32 0.000 1.359468 1.997106
------------+--------------------------------------------------------
sigma_u | .70661941
sigma_e | .63029359
rho | .55690561 (fraction of variance due to u_i)
---------------------------------------------------------------------
F test that all u_i=0: F(4133,14869) = 1.36 Prob > F = 0.0000
---------------------------------------------------------------------
Instrumented: tenure
Instruments: age c.age#c.age not_smsa 2.race union birth_yr south
---------------------------------------------------------------------
94
. Tampak bahwa dengan asumsi yang berbeda, hasil yang diperoleh berbeda
pula antara estimator efek random dengan efek fixed.
Contoh 7.3:
. use “D:\Analisis Data Longitudinal\Data\airfare.dta”
lpassen : log(passen)
passen : rata-rata penumpang per hari
ldist : log(distance)
dist : jarak dalam mil
ldistsq : ldist^2
y98 : = 1 jika year==1998
y99 : = 1 jika year==1999
y00 : = 1 jika year==2000
lfare : log(fare)
fare : rata-rata tarif one-way dalam $
concen : bmktshr (the market share of the largest carrier in a market)
. xtivreg lpassen ldist ldistsq y98 y99 y00 (lfare = concen), re theta
95
-------------------------------------------------------------------------------------
lpassen | Coef. Std. Err. z P>|z| [95% Conf. Interval]
--------+----------------------------------------------------------
lfare | -.5078761 .229698 -2.21 0.027 -.9580759 -.0576762
ldist | -1.504805 .6933146 -2.17 0.030 -2.863677 -.1459332
ldistsq | .1176012 .0546255 2.15 0.031 .0105373 .2246651
y98 | .0307363 .0086054 3.57 0.000 .0138699 .0476027
y99 | .0796548 .01038 7.67 0.000 .0593104 .0999992
y00 | .1325795 .0229831 5.77 0.000 .0875335 .1776255
_cons | 13.29643 2.626949 5.06 0.000 8.147707 18.44516
--------+----------------------------------------------------------
sigma_u | .94920686
sigma_e | .16964171
rho | .96904799 (fraction of variance due to u_i)
-------------------------------------------------------------------
Instrumented: lfare
Instruments: ldist ldistsq y98 y99 y00 concen
-------------------------------------------------------------------
. xtivreg lpassen ldist ldistsq y98 y99 y00 concenb (lfare = concen),
re theta
G2SLS random-effects IV regression Number of obs = 4,596
Group variable: id Number of groups = 1,149
96
-------------------------------------------------------------------
lpassen | Coef. Std. Err. z P>|z| [95% Conf. Interval]
--------+----------------------------------------------------------
lfare | -.3015762 .2764376 -1.09 0.275 -.8433839 .2402315
ldist | -1.148781 .697019 -1.65 0.099 -2.514913 .2173511
ldistsq | .0772565 .0570609 1.35 0.176 -.0345808 .1890938
y98 | .0257147 .0097479 2.64 0.008 .0066092 .0448203
y99 | .0724166 .0119924 6.04 0.000 .0489118 .0959213
y00 | .1127914 .0274377 4.11 0.000 .0590146 .1665682
concenb | -.5933022 .1926313 -3.08 0.002 -.9708526 -.2157518
_cons | 12.0578 2.735977 4.41 0.000 6.695385 17.42022
--------+----------------------------------------------------------
sigma_u | .85125514
sigma_e | .16964171
rho | .96180277 (fraction of variance due to u_i)
-------------------------------------------------------------------
Instrumented: lfare
Instruments: ldist ldistsq y98 y99 y00 concenb concen
-------------------------------------------------------------------
. xtivreg lpassen ldist ldistsq y98 y99 y00 (lfare = concen), fe vce(cl
id)
Fixed-effects (within) IV regression Number of obs = 4,596
Group variable: id Number of groups = 1,149
97
(Std. Err. adjusted for 1,149 clusters in id)
------------------------------------------------------------------
| Robust
lpassen | Coef. Std. Err. z P>|z| [95% Conf. Interval]
--------+---------------------------------------------------------
lfare | -.3015761 .6129462 -0.49 0.623 -1.502929 .8997764
ldist | 0 (omitted)
ldistsq | 0 (omitted)
y98 | .0257147 .0164237 1.57 0.117 -.0064751 .0579046
y99 | .0724166 .0251189 2.88 0.004 .0231843 .1216488
y00 | .1127914 .0620655 1.82 0.069 -.0088547 .2344375
_cons | 7.501008 3.098097 2.42 0.015 1.428849 13.57317
--------+---------------------------------------------------------
sigma_u | .8493153
sigma_e | .16964171
rho | .96163479 (fraction of variance due to u_i)
------------------------------------------------------------------
Instrumented: lfare
Instruments: ldist ldistsq y98 y99 y00 concen
------------------------------------------------------------------
98
BAB 8
REGRESI VARIABEL INSTRUMENTAL
DENGAN ESTIMATOR
FIRST-DIFFERENCED
Diperoleh: yi 2 = ( β0 + 1) + β1 xi 2 + ai + ui 2 (t = 2)
yi1 = β0 + β1 xi1 + ai + ui1 (t = 1)
Selanjutnya substraksikan:
( yi 2 − yi1 ) = δ 0 + β1 ( xi 2 − xi1 ) + ( ui 2 − ui1 )
∆yi = 1 + β1 ∆xi + ∆ui
∆ui tak berkorelasi dengan ∆xi , sehingga persamaan terakhir ini
dapat diselesaikan dengan estimator OLS.
99
depvar : Variabel dependen
varlist1 : Himpunan variabel independen yang tak berkorelasi dengan
galat, disebut variabel eksogen
varlist2 : Himpunan variabel independen yang berkorelasi dengan galat,
disebut variabel endogen yang terinstrumentasi oleh
(instrumented by) variabel instrumental.
varlistIV : Variabel instrumental
Opsi:
fd : Gunakan estimator selisih-pertama (first-differenced
estimator)
regress : Perlakukan kovariat sebagai variabel eksogen, abaikan
variabel instrumental
first : Laporkan estimasi tahap pertama
small : Laporkan statistik t dan F, bukan statistik Z dan χ 2
Contoh 8.1:
Sebagai contoh, digunakan file data abdata.dta. mengenai tenaga
kerja pada sejumlah firma, dan beberapa data tentang masing-masing firma.
Beberapa variabel yang akan dianalisis adalah:
nit : log tenaga kerja pada firma i pada waktu t
wit : log naturalis gaji (wage) untuk produk real
kit : log naturalis stok kapital gross
ysit : log naturalis output industri
yr1980, yr1981, yr1982, yr1983, dan yr1984 adalah variabel-variabel
indikator yang menyatakan waktu.
100
. use “D:\Analisis Data Longitudinal\Data\abdata.dta”
. xtivreg n l2.n l(0/1).w l(0/2).(k ys) yr1981-yr1984 (l.n = l3.n), fd
vce(robust)
First-differenced IV regression
Group variable: id Number of obs = 471
Time variable: year Number of groups = 140
101
ys |
D1. | .7660906 .3172664 2.41 0.016 .14426 1.387921
LD. | -1.361881 .8980497 -1.52 0.129 -3.122026 .3982639
L2D. | .3212993 .4234835 0.76 0.448 -.508713 1.151312
|
yr1981 |
D1. | -.0574197 .0323419 -1.78 0.076 -.1208088 .0059693
|
yr1982 |
D1. | -.0882952 .0580339 -1.52 0.128 -.2020395 .0254491
|
yr1983 |
D1. | -.1063153 .0934136 -1.14 0.255 -.2894026 .0767719
|
yr1984 |
D1. | -.1172108 .1150944 -1.02 0.308 -.3427917 .1083701
|
_cons | .0161204 .025376 0.64 0.525 -.0336155 .0658564
--------+-------------------------------------------------------------
sigma_u | .29069213
sigma_e | .34152632
rho | .42011045 (fraction of variance due to u_i)
----------------------------------------------------------------------
Instrumented: L.n
Instruments: L2.n w L.w k L.k L2.k ys L.ys L2.ys yr1981 yr1982 yr1983
yr1984 L3.n
----------------------------------------------------------------------
Perhatikan:
- L : Lagged
- D : Difference
- L0.x = x = xi
L1.x = L.x = xi −1
L2.x = xi −2
102
- D.x = L0D.x = xi − xi −1
LD.x = L1D.x = xi −1 − xi −2
L2D.x = xi −2 − xi −3
+-----------------------------------------------------------------+
| D. D. LD. LD. L2D.|
| n n n n n n|
|-----------------------------------------------------------------|
1. | 1.617604 . . . . .|
2. | 1.722767 .1051621 .1051621 . . .|
103
3. | 1.612433 -.1103332 -.1103332 .1051621 .1051621 .|
4. | 1.550749 -.0616845 -.0616845 -.1103332 -.1103332 .1051621 |
5. | 1.409278 -.1414708 -.1414708 -.0616845 -.0616845 -.1103332 |
|-----------------------------------------------------------------|
6. | 1.152469 -.2568092 -.2568092 -.1414708 -.1414708 -.0616845 |
7. | 1.077048 -.0754207 -.0754207 -.2568092 -.2568092 -.1414708 |
8. | 4.267163 . . . . .|
9. | 4.257639 -.0095239 -.0095239 . . .|
10. | 4.261524 .0038853 .0038853 -.0095239 -.0095239 .|
+-----------------------------------------------------------------+
Tampak juga bahwa selain faktor waktu (year), prediktor yang bermakna
adalah D1.w, D1.k, dan D1.ys.
104
KEPUSTAKAAN
105
Lampiran
UKURAN SAMPEL
PADA STUDI LONGITUDINAL
Respons Kontinu
Model regresi longitudinal untuk rancangan balans adalah:
Yij = β 0 + β 1 xij1 + β 2 xij 2 + . . . + β p xijp + ε ij (1)
m=
(
2 Zα + Z β ) σ 2 (1 − ρ )
(4)
ns x2 d 2
dengan:
106
σ2 : Variansi suku galat; σ 2 = Var ( ε ij )
ρ : Koefisien korelasi matriks uniform; diasumsikan data longitudinal
memiliki struktur korelasi uniform (exchangeable); ρ = rjk untuk
j ≠ k.
s x2 : Variansi dalam-subjek untuk subjek ke-j, x j
2
(xj − x)
s x2 = ∑j n
(4.a)
Contoh 1:
Misalkan dimiliki data hipotetis untuk uji klinik terhadap pengobatan
baru untuk hipertensi. Pasien dibagi menjadi 2 kelompok, kelompok uji dan
kelompok kontrol. Tiap pasien akan diperiksa tekanan darah pada 3 kali
kunjungan, yaitu bulan ke-0, ke-2, dan ke-5. Dengan kesalahan tipe I sebesar
0.05 dan power 0.8, variansi dalam-subjek sebesar 4.22, serta perbedaan
tekanan darah minimum yang dianggap bermakna antara kedua kelompok
sebesar 0.5 mm Hg/bulan, maka:
Zα = 1.64 Z β = 0.84
n=3 d = 0.5
s x2 = 4.22
2
m=
( )
2 Zα + Z β σ 2 (1 − ρ )
ns x2 d 2
2
2 (1.64 + 0.84 ) σ 2 (1 − ρ )
=
( 3)( 4.22 )( 0.25 )
= 3.89 σ 2 (1 − ρ )
ρ σ2
100 200 300
0.2 313 625 937
0.5 195 391 586
0.8 79 157 235
107
Tampak bahwa tiap nilai tertentu σ 2 , jika korelasi ρ meningkat
maka ukuran sampel yang dibutuhkan m mengecil.
Respons Biner
Untuk respons biner dengan 2 kelompok perbandingan A dan B,
diasumsikan:
p untuk grup A
P ( Yij = 1) = Yij A
pB untuk grup B
i = 1, 2, . . . , m ; j = 1, 2, . . . , n
Diasumsikan pula struktur korelasi uniform (exchangeable), yaitu
Corr ( Yij ; Yik ) = ρ untuk j ≠ k, dan d adalah selisih minimum probabilitas
respons yang bermakna antara kedua kelompok perbandingan, maka ukuran
sampel minimum yang dibutuhkan per kelompok adalah:
2
m=
{Zα 2 pq + Z β p A q A + pB qB } {1 + ( n − 1) ρ} (5)
nd 2
p A + pB
dengan: p = ; q =1− p (5.a)
2
Contoh 2:
Misalkan pada suatu studi longitudinal dengan 2 kelompok
perbandingan A dan B diasumsikan kesalahan tipe I adalah 0.05, power
adalah 0.8, pengukuran untuk tiap subjek dilakukan 3 kali, dan probabilitas
respons pada kelompok A adalah 0.5, maka:
Zα = 1.64 Z β = 0.84
n=3 p A = 0.5
d = pB − p A
Jika data diasumsikan memiliki struktur korelasi exchangeable, maka
ukuran sampel minimum per kelompok yang dibutuhkan adalah:
2
m=
{Zα 2 pq + Z β p A q A + pB qB } {1 + ( n − 1) ρ}
nd 2
108
=
2
{1.64 2 (0.25 − 0.25d ) + 0.84 0.25 + (0.25 − d )} {1 + 2ρ}
2 2
3d 2
Untuk beberapa nilai ρ dan d, ukuran sampel minimum per
kelompok m yang dibutuhkan adalah:
ρ d
0.3 0.2 0.1
0.2 15 35 143
0.5 21 49 204
0.8 27 64 265
109