STUDI LITERATUR
Disususn untuk memenuhi syarat kelulusan pada mata kuliah studi literatur
di jurusan Matematika
Oleh
Siti Nurjamilah
1167010067
JURUSAN MATEMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM SUNAN GUNUNG DJATI
BANDUNG
2020
LEMBAR PENGESAHAN
STUDI LITERATUR
JURUSAN MATEMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI SUNAN GUNUNG DJATI
BANDUNG
Oleh:
Siti Nurjamilah
NIM : 1167010067
Bandung, Januari 2020
Menyetujui,
Dosen Pembimbing SL Dosen Penguji SL
Mengetahui,
Ketua Jurusan Matematika
i
ABSTRAK
ii
parameter efek acak. Keduanya merujuk pada Estmasi Maksimum Likelihood
(MLE). Dari hasil analisis kedua metode tersebut diperoleh estimais sebagai
berikut:
̂ = (𝐗 ′ 𝐗)−𝟏 𝐗 ′ 𝐘
𝜷 (estimasi parameetr efek tetap)
̂ = 𝐃𝐙 ′ 𝐕 −𝟏 (𝐘 − 𝐗𝛃)
𝒖 (estimasi parameter efek acak)
Sehingga model liniear campuran bivariat pada data longitudinal dengan setimasi
parameter efek tetap dan efek acak adalah sebagai berikut:
𝒀 ̂ + 𝒁𝒖
̂ = 𝐗𝜷 ̂ + 𝜺̂
Kata kunci: Data longitudinal, liniear campuran bivariat efek acak (random
effect), efek tetap (fixed effect), least square dummy variable (LSDV), generalized
least square (GLS)
iii
KATA PENGANTAR
iv
8. Teman-teman S1 Matematika angkatan 2016, yang sangat istimewa dan
memberikan banyak pengalaman serta pengetahuan untuk penulis.
9. Ibu dan bapak Surya yang selalu memberikan doa, motivasi dan kemudahan
penulis dalam mencetak dan mengedit selama penyusunan.
10. Bunda Siti Fatimah dan keluarga yang selalu memberikan kenyamanan
penulis dalam melakukan penyusunan.
11. Pihak-pihak lain yang telah mendukung dan membantu dalam penyusunan
studi literatur ini yang tidak bisa penulis sebutkan satu per satu, penulis
ucapkan banyak terima kasih.
Penulis menyadari bahwa penyusunan studi literatur ini masih jauh dari
sempurna, maka kritik dan saran yang membangun akan senantiasa penulis
harapkan demi kesempurnaan di masa mendatang. Semoga laporan studi literatur
ini dapat bermanfaat bagi semua pihak.
v
DAFTAR ISI
vi
2.6.1 Common Effect Model (CEM) ................................................................ 25
3.4 Contoh kasus estimasi model liniear campuran bivariat pada data
longitudinal ............................................................................................................ 42
vii
DAFTAR TABEL
viii
DAFTAR GAMBAR
ix
BAB I
PENDAHULUAN
1
Selama beberapa dekade terakhir, banyak model statistik telah diusulkan untuk
analisis data longitudinal yang melibatkan lebih dari satu variabel dan yang paling
populer adalah model campuran gabungan yang menghubungkan model campuran
linier dengan kemungkinan model efek acak untuk dikorelasikan. Gueorguieva dan
Sanacora mengembangkan model campuran gabungan untuk menggabungkan
jenis hasil longitudinal berbeda dan dianalisis berulang pada pengukuran variabel
ordinal dan kontinyu.
Baru-baru ini Luo et al. mengusulkan model linear campuran bivariat untuk
memperkirakan koefisien korelasi dalam data cross-sectional. Hampir semua
model gabungan tersebut mengasumsikan bahwa subjek diambil dari populasi
homogen tunggal. Secara khusus, model liniear campuran bivariat dipasang untuk
menilai keduanya korelasi antara efek acak dan korelasi marginal dari waktu ke
waktu, dan kemudian korelasi kondisional (korelasi marginal yang diberikan efek
acak)[3] .
Dalam studi literatur ini, berfokus pada Estimasi parameter model liniear
campuran bivariat, dengan korelasi antara efek acak Korelasi antara dua variabel
dependen kemudian yang dari efek acak terkait dengan variabel dependen ini.
Disini mengasumsikan bahwa efek acak dan kesalahan (residual) mengikuti
distribusi Gaussian.[4] Kami menggunakan algoritma Estimasi Maksimum
Likelihood untuk estimasi parameter model tetapi di sini.
2
1.3 Batasan Masalah
Fixed Random
Effect Effect
Model Model
(FEM) (REM)
Model linier
campuran bivariat
3
Ruang lingkup dalam penelitian ini yaitu estimasi parameter pada data
longitudinal dengan model liniear campuran bivariat. Dalam model liniear
campuran terdapat variabel efek acak dan variabel efek tetap. Pada masing-
masing variabel terdapat parameter, variabel efek tetap dengan parameter efek
tetap, begitupun variabel efek acak dengan parameter efek acak. Masing-masing
parameter tersebut diestimasi menggunakan metode least square dummy variable
(LSDV) untuk parameter efek tetap dan generalized least square (GLS) untuk
parameter efek acak. Keduanya merujuk pada Estmasi Maksimum Likelihood
(MLE).
4
BAB II
LANDASAN TEORI
5
Analisis multivariate berasal kata multi (banyak) dan variate (variable),
sehingga analisis multivariate adalah analisis terhadap banyak variable yang
merupakan pengembangan dari analisis univariate dan bivariate. Analisis
multivariate memiliki lebih dari dua variabel. Supranto (2010:18)
mengilustrasikan analisis multivariate dengan adanya masalah atau gap yang
disebabkan oleh tidak adanya kesesuaian antara harapan (expected) dan kenyataan
(observed). Setiap masalah pasti ada faktor-faktor penyebab (pada umumnya lebih
dari satu penyebab). Kalau masalah kita sebut variabel dependen (Y) dan faktor
penyebab kita sebut variabel bebas (X) maka masalah (Y) adalah fungsi dari
𝑋1 , 𝑋2 , 𝑋3 … . … 𝑋𝑛 . Fenomena ini disebut fenomena multivariate. Dengan
demikian, analisis multivariate ini merujuk kepada teknik statistik tertentu yang
menganalisis banyak variabel secara simultan[2].
6
penelitian. Peneliti yang menggunakan statistik inferensial harus
menentukan tingkat kesalahan yang bisa diterima karena adanya kesalahan
sampling (sampling error). Dalam penelitian, tingkat kesalahan (𝛼) yang
dapat diterima adalah 5 %, sehingga tingkat keyakinan (level of confidence)
adalah 100 % - 5 % = 95 %.[5]
Pendekatan yang digunakan dalam menentukan besarnya tingkat
kesalahan yang diterima adalah tipe kesalahan I (type I error) yang dikenal
dengan alpha ( ). Tipe kesalahan I atau merupakan probabilitas menolak
hipotesis nol (𝐻0 ) yang benar. Ketika peneliti menentukan besarnya , maka
peneliti juga secara otomatis menentukan besarnya kesalahan jenis lain yang
terkait yaitu tipe kesalahan II dikenal dengan . Dengan demikian ini
merupakan probabilitas menerima hipotesis nol (𝐻0 ) yang salah. Berkaitan
dengan, probabilitas yang sering digunakan adalah probabilitas 1 – yang
menunjukkan kekuatan statistik inferensial (statistical power). 1 –
merupakan probabilitas menolak hipotesis nol yang salah. Hubungan antara
kedua probabilitas tersebut dapat digambarkan di dalam Tabel 2.1.
Kesalahan dalam Pengujian Hipotesis, sebagai berikut :[2]
7
dan menolak 𝐻𝑎 , sehingga secara statistik tidak signifikan. Nilai 𝑃
(Probabilitas) juga dapat digunakan untuk menerima atau menolak 𝐻0 .
𝑃𝑣𝑎𝑙𝑢𝑒 merupakan besarnya yang sebenarnya. Jika 𝑃𝑣𝑎𝑙𝑢𝑒 lebih kecil dari
(5 %) maka kita menolak 𝐻0 . Sebaliknya jika 𝑃𝑣𝑎𝑙𝑢𝑒 lebih besar dari
(5 %) maka kita menerima 𝐻0 .
8
karakteristik beberapa kategori. Contoh beberapa data non metric : agama,
jenis kelamin dll.[2].
Variabel dependen
Jenis Jenis analisis
No Jumlah
Jenis variabel independen multivariat
variabel
1 Non metrik
1 1 metrik Uji beda t-test
dua kategori
Metrik/ Non
2 1 metrik Regresi
metrik
Non metrik dua Metrik/ Non
3 1 Regresi Logistik
kategori metrik
1 atau lebih
Non metrik dua Analisis
4 1 Metrik/ Non
kategori Diskriminan
metrik
Non metrik dua 1 atau lebih Analisis Multiple
5 1
kategori Metrik Diskriminan
6 1 Non metrik Non metrik Analisis Konjoin
1 non metrik, Analysis of Variance
7 1 metrik
> 2 kategori (ANOVA)
9
Multivariate
1 atau lebih
8 >1 metrik Analysis of Variance
Non metrik
(MANOVA).
Analisis Korelasi
9 >1 metrik > 1 metrik
Kanonikal
Analisis Jalur (Path
Analysis) dan
10 >1 metrik > 1 metrik
Structural Equation
Modeling (SEM)
Sumber : Ghozali (2009:9) dan Widarjono (2010:5).
Variabel berskala
No Jumlah Variabel metriks
metriks
Tabel kontinjensi two-
1 2 variabel Korelasi Sederhana way
Loglinear
Principle Skala
2 > 2 variabel
component multidimensional
3 > 2 variabel Analisis faktor Analisis koresponden
4 > 2 variabel Analisis cluster Longlinear model
Sumber : Ghozali (2009:9) dan Widarjono (2010:6)
10
2.2 Analisis data Bivariat
Analisis Bivariat adalah sebuah analisis yang digunakan untuk menguji ada
atau tidaknya pengaruh antara variabel dependen dan independen, misalkan 𝑋
Sebagai variabel independen dan 𝑌 Sebagai variabel dependen. Dalam hal ini
biasanya para ahli tertarik untuk melihat hubungan linier antara kedua variabel
tersebut.[6]
Misalkan terdapat 𝑛 pasangan variabel dependen dan independen, maka
Notasi untuk keduanya adalah (𝑥1 , 𝑦1 ), (𝑥2 , 𝑦2 ), … , (𝑥𝑛 , 𝑦𝑛 ). Seberapa kuat
hubungan antara kedua variabel disebut dengan koefisien korelasi (koefisien
korelasi pearson) antara 𝑋 dan 𝑌. Untuk Menentukan koefisien korelasi bisa
menggunakan persamaan sebagai berikut:[6]
𝑛 𝑛 𝑛
1
𝐿𝑥𝑦 = ∑ 𝑥𝑖 𝑦𝑖 − (∑ 𝑥𝑖 ) (∑ 𝑦𝑖 ) (2.1)
𝑛
𝑖=1 𝑖=1 𝑖=1
𝑛 𝑛 2
1
𝐿𝑥𝑥 = ∑ 𝑥𝑖 2 − (∑ 𝑥𝑖 ) (2.2)
𝑛
𝑖=1 𝑖=1
𝑛 𝑛 2
1
𝐿𝑦𝑦 = ∑ 𝑦𝑖 2 − (∑ 𝑦𝑖 ) (2.3)
𝑛
𝑖=1 𝑖=1
−1 ≤ 𝑟 ≤ 1
Maka ketika 𝑟 mendekati −1 atau 1 (idealnya 0.5 < 𝑟 < 1 atau −1 < 𝑟 <
−0.5).
Ketika 𝑟 mendekati −1 atau 1, ada kemungkinan hubungan linier antara 𝑥
dan 𝑦 sebagai berikut:
𝑦 = 𝑎 + 𝑏𝑥 (2.5)
11
Dalam kasus seperti ini, 𝑟 2 menunjukan proporsi variabilitas pada
hubungan linear antara 𝑥 dan 𝑦. Dan dapat terlihat sebagai berikut:
2
∑𝑖 𝑟𝑖2 ∑𝑖 (𝑦𝑖 − 𝑦̂𝑖 )2
𝑟 =1− =1−
∑𝑖 𝑑𝑖2 ∑𝑖 (𝑦𝑖 − 𝑦̅𝑖 )2
Kemudian untuk menarik garis lurus dengan besar nilai |𝑟| dikenal dengan
regresi linier sederhana. Misalkan kita memiliki 𝑛 pasangan pengamatan,
(𝑥1 , 𝑦1 ), (𝑥2 , 𝑦2 ), … , (𝑥𝑛 , 𝑦𝑛 ) dan plot menunjukkan bahwa ada kemungkinan
garis lurus pada data ini. Untuk menemukan garis lurus kita perlu kemiringan
(atau gradien) dan intersep-𝑦. Dengan menggunakan persamaan (2.5), yaitu: 𝑦 =
𝑎 + 𝑏𝑥, dengan memisalkan 𝛽 adalah kemiringan dan 𝛼 adalah intersep-𝑦, maka
diagram dapat disajikan sebagai berikut:
12
Sumber: G. Verbeke, S. Fieuws, G. Molenberghs, and M. Davidian, “Statistical
Methods in Medical Research,” 2014
Gambar 2. 3 garis regresi
Data adalah hal yang paling penting dalam sebuah penelitian dan merupakan
sumber informasi. Secara umum, data berdasarkan waktu pengambilannya yaitu
cross-section dan data time series. Data cross section adalah data yang
13
pengambilannya pada waktu tertentu sesuai dengan tujuan penelitiannya,
contohnya yaitu data sensus, data penelitian yang menggunakan kuesioner dan
lain-lain. Sedangkan data time series adalah data yang pengambilannya dari waktu
ke waktu secara berkala untuk melihat perkembangan suatu kejadian atau kegiatan
selama periode tersebut. Gabungan dari data cross-section dan data time series
adalah data longitudinal.[7]
Data longitudinal adalah data yang diperoleh dari pengamatan terhadap
beberapa objek lebih dari satu kali pada waktu yang berbeda. Analisi data
longitudinal merupakan gabungan dari analisis regresi dan time-series. Penelitian
yang menghasilkan data longitudinal sering dilakukan pada bidang kesehatan.
Contohnya pengukuran kadar trombosit selama t hari pada n pasien DBD. Selain
dibidang kesehatan, data longitudinal juga digunakan dalam bidang ekonomi,
pendidikan dan sebagainya. Data longitudinal ini biasanya digunakan untuk
mengetahui perubahan subjek penelitian setelah periode waktu tertentu[7].
Dalam studi longitudinal mempelajari perubahan respon antar waktu beserta
faktor-faktor yang mempengaruhi perubahan tersebut, baik pada level populasi
maupun level individu. Data longitudinal ditandai dengan adanya fakta bahwa
pengamatan berulang dalam subyek yang sama cenderung berkorelasi (Zeger et al.
1988), sehingga model-model untuk analisis data longitudinal harus mengenali
hubungan antara pengamatan berkala dalam subyek yang sama (Laird & Ware
1982). Korelasi antar pengamatan berulang dapat dimodelkan secara eksplisit
(melalui pola matriks kovarian), maupun secara implisit (melalui pengaruh
acak).[8]
Untuk memodelkan keheterogenan antar subyek, ada dua pendekatan dalam
analisis data longitudinal (Zeger et al. 1988). Pertama dengan memodelkan
keheterogenan secara eksplisit, dikenal sebagai pendekatan spesifik subyek,
misalnya melalui model campuran dimana pengaruh spesifik subyek diasumsikan
mengikuti suatu sebaran parametrik tertentu. Untuk data longitudinal kontinu,
model linear campuran dari Laird dan Ware (1982) merupakan model yang sering
digunakan. Kedua, respon rataan populasi dapat dimodelkan sebagai fungsi dari
kovariat tanpa secara eksplisit memperhitungkan keheterogenan dari subyek ke
subyek. Pendekatan ini dikenal sebagai model rataan populasi.[8]
14
Dalam pendekatan ini, matriks kovarian dari peubah respon secara langsung
dimodelkan melalui struktur kovarian bagi galat intra-subyek. Model spesifik
subyek dikenal juga sebagai model bersyarat, sedangkan model rataan populasi
sering disebut model marginal (Pinheiro 2006). Perbedaan mendasar dari kedua
model di atas adalah model spesifik subyek memungkinkan inferensi terhadap
subyek tertentu, sedangkan pada model rataan populasi tidak.
Menurut Gujarati (2004), model longitudinal secara umum dapat
dinyatakapada persamaan berikut:[9]
𝑌𝑖𝑡 = 𝛼𝑖 + 𝛽𝑖 𝑋𝑖 + 𝜀𝑖𝑡
Dimana :
𝑌𝑖𝑡 : Nilai variabel dependen unit respon ke-𝑖 dan unit waktu ke-𝑡
𝑋𝑖 : nilai variabel independen unit respon ke-𝑖 dan unit waktu ke-𝑡
𝛼𝑖 , 𝛽𝑖 :koefisien regresi unit respon ke-𝑖 dan unit waktu ke-𝑡
𝜀𝑖𝑡 :galat untuk repon ke-𝑖 dan unit waktu ke-𝑡
Contoh desain data longitudinal juga dapat disusun dalam bentuk tabel
berikut:
Tabel 2. 4 struktur data longitudinal untuk k variabel independen
15
𝑁 1 𝑌𝑁1 𝑋1𝑁1 ⋯ 𝑿𝒌𝑵𝟏
𝑁 2 𝑌𝑁2 𝑋1𝑁2 ⋯ 𝑿𝒌𝑵𝟐
⋮ ⋮ ⋮ ⋮ ⋯ ⋮
𝑁 𝑇 𝑌𝑁𝑇 𝑋1𝑁𝑇 ⋯ 𝑋𝑘𝑁𝑇
Sumber : Ghozali (2009:9) dan Widarjono (2010:5)
16
𝑦111 𝑦112 𝑦11𝐾 1
1 ⋯
𝑦121 𝑦122 𝑦12𝐾 2
1 ⋯
⋮ ⋮ ⋮ ⋮ ⋮
⋱
1 𝑦1𝐽1 𝑦1𝐽2 𝑦1𝐽𝐾 J
⋯
2 𝑦211 𝑦212 ⋯ 𝑦21𝐾 1
2 𝑦221 𝑦222 ⋯ 𝑦22𝐾 2
⋮ ⋮ ⋮ ⋱ ⋮ ⋮
⋮ ⋮ ⋮ ⋱ ⋮ ⋮
𝑦𝑁11 𝑦𝑁12 ⋯ 𝑦𝑁1𝐾
𝑁 1
𝑦𝑁21 𝑦𝑁22 ⋯ 𝑦𝑁2𝐾
𝑁 ⋱ 2
⋮ ⋮ ⋮ ⋮ ⋮
(𝑁) ( 𝑦𝑁𝐽1 ⋯
𝑦𝑁𝐽2 𝑦𝑁𝐽𝐾 ) ( J )
Tabel 2.5 Struktur data longitudinal multivariat
17
Pertimbangkan vektor d-dimensi pengamatan Y, direkam pada waktu yang
sama-sama t = 1 ,. . . , n, dan menunjukkan vektor data lengkap oleh:
𝒀𝑻𝟏
𝒀= [ ⋮ ]
𝒀𝑻𝒏
18
2.5 Analisis regresi
19
(∑ Y)(∑ X 2 ) − (∑ X)(∑ XY)
𝑎=
(𝑛)(∑ X 2 ) − (∑ X)2
(𝑛)(∑ XY) − (∑ X)(∑ Y)
𝑏=
(𝑛)(∑ X 2 ) − (∑ X)2
Sedangkan pendekatan dengan matriks adalah sebagai berikut:
𝑛 ∑X 𝑎 ∑Y
( )( ) = ( )
2 𝑏
∑X ∑X ∑ XY
Dengan
det 𝐴1
𝑎=
det 𝐴
det 𝐴2
𝑏=
det 𝐴
𝑛 ∑X
𝐴=( )
∑ X ∑ X2
∑Y ∑X
𝐴1 = ( )
2
∑X𝑌 ∑X
∑n ∑Y
𝐴2 = ( )
∑ X ∑ 𝑋𝑌
det 𝐴 = (∑ 𝑛) (∑ X 2 ) − (∑ X) (∑ X)
det 𝐴1 = (∑ Y) (∑ X 2 ) − (∑ XY) (∑ X)
det 𝐴2 = (∑ n) (∑ XY) − (∑ X) (∑ Y)
Sehingga
(𝑛)(∑ XY) − (∑ X)(∑ Y)
𝑏=
(𝑛)(∑ X 2 ) − (∑ X)2
𝑎 = 𝑌̅ − 𝑏𝑋̅
Adapun koefisisen determinasi (R2 ) dapat dicari dengan persamaan sebagai
berikut:
20
2
((𝑛)(∑ XY) − (∑ X)(∑ Y))
R2 =
(𝑛(∑ X 2 ) − (∑ X)2 )(𝑛(∑ Y 2 ) − (∑ Y)2 )
Sehingga memiliki selisih taksir standar (standar deviasi). Adapun
rinciannya sebagai berikut:
1. Angka indeks digunakan untuk mengukur ketepatan suatau penduga atau
mengukur jumlah variasi titik-titik observasi disekitar garis regresi.
2. Jika semua titik observasi berada tepat pada garis regresi, selisih taksir
standar sama dengan nol.
3. Selisih taksir standar berguna mengetahui batasan seberapa jauh melesetnya
perkiraan dalam meramal data.
Adapun persamaan untuk menentukan selisih taksir standar (standar deviasi)
adalah sebagai berikut:
∑(𝑌 − 𝑌′)2
𝑆𝑦/𝑥 = 𝑆𝑥.𝑦 = 𝑆𝑒 = √
𝑛−2
Atau
∑(𝑋 − 𝑋′)2
𝑆𝑥/𝑦 = 𝑆𝑦.𝑥 = 𝑆𝑒 = √
𝑛−2
Keterangan:
𝑆𝑦/𝑥 = 𝑆𝑥/𝑦 = Standar Deviasi
𝑌= 𝑋 = Nilai Variabel Sebenarnya
𝑌 ′ = 𝑋′ = Nilai Variabel Yang Ditaksir
𝑛 = Jumlah Frekuensi
21
variabel tak bebas. Model regresi linier sederhana ini dapat dirumuskan
sebagai berikut:
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝜀𝑖 ; 𝑖 = 1,2, … 𝑛
Keterangan:
𝑌𝑖 = Variabel tak bebas (dependent variable)
𝑋𝑖 = Variabel bebas (independent variable)
𝛽0 = Parameter konstanta/regresi yang tidak diketahui nilainya
𝛽1 = Parameter koefisien regresi yang tidak diketahui nilainya
𝜀 = Variabel galat/kesalahan regresi
𝑛 = Banyaknya data observasi
Adapun analisis regresi berganda (multiple regression analysis) atau
regresi lebih dari dua variabel, mempelajari hubungan variabel tak bebas
pada lebih dari satu variabel bebas. Adapun rumusan untuk regresi berganda
adalah sebagai berikut:
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋1 + 𝛽2 𝑋2 + ⋯ + 𝛽𝑘 𝑋𝑘 + 𝜀𝑖 ; 𝑖 = 1,2, … 𝑛
Keterangan:
𝑌𝑖 = Variabel tak bebas (dependent variable)
𝑋𝑖 = Variabel bebas (independent variable)
𝛽0 = Parameter konstanta/regresi yang tidak diketahui nilainya
𝛽𝑘 = Parameter koefisien regresi yang tidak diketahui nilainya
𝑘 = Banyaknya variabel bebas/faktor
𝜀 = Variabel galat/kesalahan regresi
𝑛 = Banyaknya data observasi
Model regresi yang paling sederhana adalah model linier. Model ini
terdiri dari satu variabel bebas. Model tersebut dapat digeneralisasikan
menjadi lebih dari satu dalam variabel bebas. Persamaan model regresi
linier dengan variabel bebas diberikan sebagai berikut (Sembiring,1995):
𝑌 = 𝛽0 + 𝛽1 𝑋1 + 𝛽2 𝑋2 + ⋯ + 𝛽𝑘 𝑋𝑘 + 𝜀
22
Dan Pernyataan Diatas dapat Dinyatakan menjadi persamaan sebagai
berikut:
𝑌 = 𝛽0 + 𝛽1 𝑋𝑖1 + 𝛽2 𝑋𝑖2 + ⋯ + 𝛽𝑘 𝑋𝑖𝑘 + 𝜀𝑖 𝑖 = 1,2, … 𝑛
Jika persamaan diatas dinotasikan dalam bentuk matriks, maka persamaan
sebagai berikut:
𝛽0
𝑌2 1 X11 X12 ⋯ X1k 𝜀0
𝛽1 𝜀1
𝑌 1 X21 X22 ⋯ X2k
[ 2] = [ ] 𝛽2 + [ ⋮ ] (2.6)
⋮ ⋮ ⋮ ⋮ ⋱ ⋮
⋮ 𝜀𝑛
𝑌𝑛 1 Xn1 Xn2 ⋯ Xnk
[𝛽𝑘 ]
Misalkan
𝛽0
𝑌2 1 X11 X12 ⋯ X1k 𝜀0
𝛽1 𝜀1
𝑌2 1 X21 X22 ⋯ X2k
𝑌 = [ ]; 𝑋 = [ ] ; 𝛽 = 𝛽2 ; 𝜀 = [ ⋮ ]
⋮ ⋮ ⋮ ⋮ ⋱ ⋮
⋮ 𝜀𝑛
𝑌𝑛 1 Xn1 Xn2 ⋯ Xnk
[𝛽𝑘 ]
Sehingga persamaan (2.6) tersebut dapat dinyatakan sebagai berikut:
𝒀=𝑿𝜷+ 𝜺
Keterangan :
𝒀 = Vektor respon (𝑛 × 1)
𝑿 = Matrik peubah bebas (𝑛 × 𝑘)
𝜷 = Vektor parameter (𝑘 × 1)
𝜺 = Vektor galat/error (𝑛 × 1)
Data longitudinal adalah data yang merupakan hasil dari pengamatan pada
beberapa individu (cross-sectional unit) yang masing-masing diamati dalam
beberapa periode waktu berurutan (timeseries unit) (Baltagi, 2005). Menurut
Wanner & Pevalin sebagaimana dikutip oleh Sembodo (2013) menyebutkan
bahwa regresi longitudinal merupakan sekumpulan teknik untuk memodelkan
pengaruh peubah penjelas terhadap peubah respon pada data longitudinal. Ada
beberapa model regresi longitudinal, salah satunya adalah model dengan slope
konstan dan intercept bervariasi. Model regresi longitudinal yang hanya
dipengaruhi oleh salah satu unit saja (cross-sectional unit atau timeseries unit)
disebut model komponen satu arah, sedangkan model regresi longitudinal yang
23
dipengaruhi oleh kedua unit (cross-sectional unit atau timeseries unit) disebut
model komponen dua arah. Secara umum terdapat dua pendekatan yang
digunakan dalam estimasi model dari data longitudinal yaitu model tanpa
pengaruh individu (common effect) dan model dengan pengaruh individu (fixed
effect dan random effect).[11]
Menurut Jaya & Sunengsih (2009), analisis regresi data longitudinal adalah
analisis regresi yang mengamati hubungan antara satu variabel tak bebas
(dependent variable) dengan satu atau lebih variabel bebas (independent
variable). [11]
Model 1: semua koefisien baik intercept maupun slope koefisien konstan
𝑲
Model 4: intercept dan slope koefisien berbeda akibat perbedaan unit cross
section.
𝑲
Model 5: intercept dan slope koefisien berbeda akibat perbedaan unit cross
section dan berubahnya waktu
𝑲
Dengan, 𝑖 = 1,2, … , 𝑁
24
𝑡 = 1,2, … , 𝑇
𝑁 : Banyak unit cross section
𝑇 : Banyak data time series
𝒀𝒊𝒕 : Nilai variabel tak bebas cross section ke- 𝑖
𝑿𝒊𝒕 : Nilai variabel bebas ke- 𝑘 untuk cross section ke- 𝑖 tahun
ke- 𝑡
𝜷𝒊𝒕 : Parameter yang ditaksir
𝜺𝒊𝒕 : Error populasi
𝐾 : Banyaknya parameter regresi yang ditaksir
effect) adalah pendugaan yang menggabungkan seluruh data time series dan
Dengan,
𝒀𝒊𝒕 : Variabel respon pada unit observasi ke- 𝑖 dan waktu ke- 𝑡
25
waktu ke- 𝑡
akan mempunyai observasi lebih banyak dibanding data cross section atau
time series saja. Akibatnya, ketika data digabungkan menjadi pooled data
untuk membuat regresi, maka hasilnya cenderung akan lebih baik dibanding
regresi yang hanya menggunakan data cross section atau time series saja.
berikut:
26
Bila diasumsikan bahwa 𝜶 dan 𝜷 akan sama (konstan) untuk setiap
data time series dan cross section, maka 𝜶 dan 𝜷 dapat diestimasi dengan
27
Dimana, jika matriks transpose (𝑋𝛽 )′ = 𝑋′𝛽′ , maka scalar 𝛽 ′ 𝑋 ′ 𝑌 =
𝑌′𝑋𝛽. Untuk mendapatkan penduga parameter 𝛽 yang menyebabkan jumlah
kuadrat galat minimum, yaitu dengan cara menurunkan persamaan (2.48)
terhadap parameter 𝛽 yang kemudian hasil turunan tersebut disamakan
dengan nol atau
𝜕(𝑢′𝑢)
=0
𝜕𝛽
sehingga diperoleh:
𝜕(𝑌 ′ 𝑌 − 2 𝛽′𝑋′𝑌 + 𝛽′𝑋′𝑋𝛽 )
=0
𝜕𝛽
−2𝑋 ′ 𝑌 + 2𝑋 ′ 𝑋𝛽̂ = 0
2𝑋 ′ 𝑋𝛽̂ = 2𝑋 ′ 𝑌
𝑋 ′ 𝑋𝛽̂ = 𝑋 ′ 𝑌
𝛽̂ = (𝑋 ′ 𝑋)−1 𝑋 ′ 𝑌 (2.7)
28
𝑌𝑖𝑡 = 𝛼 + 𝛾1 𝐷1𝑖𝑡 + ⋯ + 𝛾𝑁 𝐷(𝑁−1)𝑖𝑡 + 𝛿1 𝐷1𝑖𝑡 + ⋯
+ 𝛿𝑇 𝐷(𝑇−1)𝑖𝑡 𝛽𝑋𝑖𝑡 + 𝑢𝑖𝑡
Dengan 𝐷𝑗𝑖𝑡 = 𝑝𝑒𝑢𝑏𝑎ℎ 𝑑𝑢𝑚𝑚𝑦 𝑘𝑒 − 𝑗 (𝑗 = 1,2, … , (𝑁 − 1)) unit cross-
sectional ke-𝑖 dan unit waktu ke-𝑡. 𝐷𝑗𝑖𝑡 Bernilai 1 jika 𝑗 = 𝑖 dan bernilai 0
jika 𝑗 ≠ 𝑖.
𝐷𝑘𝑖𝑡 = 𝑝𝑒𝑢𝑏𝑎ℎ 𝑑𝑢𝑚𝑚𝑦 𝑘𝑒 − 𝑘(𝑘 = 1,2, … , (𝑇 − 1)) unit cross-section ke-
𝑖 dan unit waktu ke-𝑡. 𝐷𝑘𝑖𝑡 Bernilai 1 jika 𝑘 = 𝑖 dan bernilai 0 jika 𝑘 ≠ 𝑖.
𝑎𝑗= rata-rata peubah respon jika peubah dummy ke-𝑗 bernilai satu dan peubah
penjelas bernilai 0. 𝑎𝑘= rata-rata peubah respon jika peubah dummy ke-𝑘
bernilai satu dan peubah penjelas bernilai 0.
Dimana,
𝑢𝑖 Komponen error cross section
𝑣𝑡 Komponen error time series
𝑤𝑖𝑡 Komponen error gabungan
29
𝑤𝑖𝑡 ~𝑁(0, 𝜎𝑤2 )
Dengan persamaan di atas, maka dapat dinyatakan bahwa MER
menganggap efek rata-rata dari data cross section dan time series
direpresentasikan dalam intercept. Sedangkan deviasi efek secara random
untuk data time series direpresentasikan dalam 𝑣𝑡 dan deviasi untuk data
cross section dinyatakan dalam 𝑢𝑖 .
𝜀𝑖𝑡 = 𝑢𝑖 + 𝑣𝑡 + 𝑤𝑖𝑡
Dengan demikian varians dari error tersebut dapat dituliskan sebagai
berikut:
𝑣𝑎𝑟(𝜀𝑖𝑡 ) = 𝜎𝑢 2 + 𝜎𝑣 2 + 𝜎𝑤 2
Hal ini tentunya berbeda dengan Model OLS yang diterapkan pada
data longitudinal (pooled data), yang mempunyai varian error sebesar:
𝑣𝑎𝑟(𝜀𝑖𝑡 ) = 𝜎𝑤 2
Dengan demikian, MER bisa diestimasi dengan OLS bila 𝜎𝑢 2 =
𝜎𝑣 2 = 0 . Jika tidak demikian, MER perlu diestimasi dengan metode lain.
Adapun metode estimasi yang digunakan adalah Generalized Least Square
(GLS).
Generalized Least Square (GLS)
Menurut Greene (1997), estimasi dapatdikatan sebagai kuadrat
terkecil yang diberlakukan secara umum atau disebut Generalized Least
Square (GLS). Random Effect Model (REM), pendugaan parameternya
dilakukan menggunakan GLS.
Pada REM ketidaklengkapan informasi untuk setiap unit cross section
dipandang sebagai error sehingga adalah bagian dari unsur gangguan. Model
REM dapat dituliskan dapat dituliskan sebagai berikut.[11]
𝐾
Asumsi
𝜇𝑖 ~𝑁(0, 𝜎𝜇2 )𝐸(𝜇𝑖 , 𝜇𝑗 ) = 0; 𝑖 ≠ 𝑗
𝑒𝑖𝑡 ~𝑁(0, 𝜎𝑣2 )𝐸 (𝜇𝑖 , 𝑒𝑖𝑡 ) = 0
𝐸 (𝑒𝑖𝑡 , 𝑒𝑖𝑠 ) = 𝐸(𝑒𝑖𝑡 , 𝑒𝑗𝑠 ) = 0; 𝑖 ≠ 𝑗; 𝑡 ≠ 𝑠
Misalkan
30
𝜀 = 𝑌 − 𝑋𝛽̂ , Dengan mensubstitusi persamaan (2.7) diperoleh:
𝜀 = 𝑌 − 𝑋 ( (𝑋 ′ 𝑋)−1 𝑋 ′ 𝑌)
𝜀 = (1 − 𝑋(𝑋 ′ 𝑋)−1 𝑋 ′ )𝑌 (2.9)
⋮
Maka 𝑌𝑛𝑡 = 𝛽0 + 𝛽𝑛 𝑋𝑛𝑛𝑡 + 𝛽2 𝑋2𝑛𝑡 + ⋯ + 𝛽𝑛 𝑋𝑛𝑛𝑡 +
𝑖=𝑛
𝜇𝑛𝑡 + 𝜀𝑛𝑡
Maka 𝑌11 = 𝛽0 + 𝛽1 𝑋111 + 𝛽2 𝑋211 + ⋯ + 𝛽𝑛 𝑋𝑛11 +
𝑡=1
𝜇11 + 𝜀11
Maka 𝑌12 = 𝛽0 + 𝛽1 𝑋112 + 𝛽2 𝑋212 + ⋯ + 𝛽𝑛 𝑋𝑛12 +
𝑡=1
𝜇12 + 𝜀12
⋮
Maka 𝑌1𝑛 = 𝛽0 + 𝛽1 𝑋11𝑛 + 𝛽2 𝑋21𝑛 + ⋯ + 𝛽𝑛 𝑋𝑛1𝑛 +
𝑡=𝑛
𝜇1𝑛 + 𝜀1𝑛
Sehingga model acak pada persamaan (2.8) dapat ditulis dalam
bentuk matriks sebagai berikut:
𝑌𝑛1 1 𝑋1𝑛1 ⋯ 𝑋𝑃21 𝛽0 𝜇𝑛1 𝜀𝑛1
𝑌 1 𝑋1𝑛2 ⋯ 𝑋𝑃22 𝛽1 𝜇𝑛1 𝜀𝑛2
[ 𝑛2 ] = [ ][ ]+[ ⋮ ]+[ ⋮ ]
⋮ ⋮ ⋮ ⋱ ⋮ ⋮
𝑌𝑛𝑇 1 𝑋1𝑛𝑇 ⋯ 𝑋𝑝𝑛𝑇 𝛽𝑝 𝜇𝑛𝑇 𝜀𝑛𝑡
Maka :
31
𝑌 = 𝑿𝛽 + 𝜇 + 𝜀
Keterangan :[12]
𝒚 : vektor pengamatan berukuran 𝑛 × 1
𝒖 : Vektor efek acak berukuran 𝑟 × 1
𝜷 : Vektor efek tetap berukuran 𝑝 × 1
𝒁 : matriks rancangan efek acak berukuran 𝑛 × 𝑟
𝑿 : matriks rancangan efek tetap berukuran 𝑛 × 𝑝
𝜺 : vektor komponen sisa/error berukuran 𝑛 × 1
dan
𝑉𝑎𝑟 (𝒚|𝒖 ) = 𝑹
Sehingga nilai tengah dan matriks varian covarian untuk 𝒚 adalah
𝑬(𝒚) = 𝑿𝜷
Dan [12].
var(𝒚) = 𝑽 = 𝒁𝑫𝒁′ + 𝑹
Varian kovarian banyak kita temui saat kita melakukan analisa regresi
atau rancangan percobaan. Varian atau ragam suatu peubah acak (atau
distribusi probabilitas) adalah ukuran seberapa jauh sebuah kumpulan
bilangan tersebar sedangkan Kovarian adalah istilah yang menunjukkan
32
seberapa besar perubahan dari dua variabe acak secara bersama-sama.
Residual adalah selisih antara nilai duga (predicted value) dengan nilai
pengamatan sebenarnya apabila data yang digunakan adalah data sampel.
Error adalah selisih antara nilai duga (predicted value) dengan nilai
pengamatan yang sebenarnya apabila data yang digunakan adalah data
populasi.
Adapun struktur umum varian kovarians dengan m faktor adalah
sebagai berikut:
𝒎
𝑬(𝒚|𝒖) = 𝑿𝜷 + ∑ 𝒁𝒊 𝒖𝒊
𝒊=𝟏
Keterangan :
𝑿 : matriks rancangan efek tetap
𝜷 : Efek tetap
𝒁𝒊 : matriks rancangan efek acak ke-𝑖, 𝑖 = 1,2, … , 𝑚
𝒖𝒊 : Vektor efek acak ke-𝑖, 𝑖 = 1,2, … 𝑚
𝒎 𝒎 𝒎
𝐙 = [𝒁𝟏 𝒁𝟐 ⋯ 𝒁𝒎 ] = {𝒁𝒊 }𝒎
𝒊=𝟏
𝒖 = {𝒖𝒊 }𝒎
𝒊=𝟏
𝑫 = 𝑣𝑎𝑟(𝒖) = {𝑫𝒊𝒊′ }𝒎
𝒊,𝒊′=𝟏
𝑫𝒊𝒊 = 𝑣𝑎𝑟(𝒖𝒊 )
Jika terdapat m faktor acak saling bebas, antar individu dalam faktor
acak tersebut juga bebas , dan memiliki ragam homogen, maka dapat
dituliskan sebagai berikut:
𝑚
𝑫 = {𝜎𝑖2 𝑰𝑞𝑖 }𝑖=1
33
𝒎
𝑽 = ∑ 𝒁𝒊 𝒁′𝒊 𝜎𝑖2 + 𝜎 2 𝑰𝑁
𝒊=𝟏
Menurut Laird dan Ware (1982) untuk kasus dengan data longitudinal
sebagai berikut:
𝐸 [𝒚𝒊 |𝒖𝒊 ] = 𝑿𝒊 𝜷 + 𝒁𝒊 𝐮𝒊
Keterangan:
𝒚𝒊 : vektor dari pengukuran pada respon 𝑘𝑒 − 𝑖
vektor dari pengaruh tetap, Nilai koefisien 𝜷 akan sama untuk
𝜷 :
setiap respon
vektor dari pengaruh acak, Nilai koefisien 𝐮𝒊 akan sama untuk
𝐮𝒊 :
setiap respon
variabel bebas yang diketahui, memodelkan bagaimana respon
𝒁𝒊 :
disusun berdasarkan waktu untuk subjek ke-i.
Misalkan ada m respon, maka :
𝒚 = {𝒚𝒊 }, 𝑿 = {𝑿𝒊 }, 𝒁 = {𝒁𝒊 }, 𝒅𝒂𝒏 𝒖 = {𝒖𝒊 },
Sehingga struktur varian yang diajukan oleh Laird dan Ware (1982)[12]:
𝑽 = 𝒁𝑫𝒁′ + 𝑹
𝑫𝒊𝒊 = 𝑫, ∀𝒊 , 𝑫𝒊𝒊′ = 𝟎, ∀𝒊≠𝒊 ,
𝐑 = {𝑹𝒊 }
𝑽 = 𝑣𝑎𝑟(𝑦) = {𝒁𝒊 𝑫𝒁′𝒊 + 𝑹𝒊 }
34
2.8.1 Menduga efek tetap
1 𝑁
𝒍=− 𝑙𝑜𝑔 |𝑽| − log 2𝜋
2 2
Dimana 𝜇 = 𝜇(𝜃) dan 𝑉 = 𝑉(𝜑)
𝜕𝒍 𝜕𝝁′ −1
= 𝑽 (𝒚 − 𝝁) = 0
𝜕𝜃 𝜕𝜃
Estimasi 𝜷 (dilambangkan dengan 𝛽̂ )
𝑿′ 𝑽−𝟏 (𝒚 − 𝑿𝛽̂ ) = 𝟎
𝑿′𝑹 −𝟏
𝑿 𝑿′𝑹 −𝟏
𝒁 𝜷 𝐗′𝑹−𝟏 𝒚
[ ] [ ] = [ ]
𝒁′𝑹−𝟏 𝑿 𝒁′𝑹−𝟏 𝒁 + 𝑫−𝟏 𝐙′𝑹−𝟏 𝒚
̂ dan 𝒖
Jika 𝜷 ̂ adalah solusi dari persamaan (2.11) maka baris kedua
dari persamaaan (2.11) adalah :
̂ + [𝒁′𝑹−𝟏 𝒁 + 𝑫−𝟏 ]𝒖
𝒁′𝑹−𝟏 𝑿𝜷 ̂ = 𝐙′𝑹−𝟏 𝒚 atau
̂)
̂ = [𝒁′𝑹−𝟏 𝒁 + 𝑫−𝟏 ]−𝟏 𝒁′𝑹−𝟏 (𝒚 − 𝑿𝜷
𝒖
Sedangkan baris pertama dari persamaan (2.11) adalah
̂ + 𝑿′𝑹−𝟏 𝒖
𝑿′𝑹−𝟏 𝑿𝜷 ̂ = 𝑿′𝑹−𝟏 𝒚
̂ pada persamaan (2.85) menghasilkan
Substitusi 𝒖
̂ + 𝒁′ 𝑹−𝟏 [𝒁′ 𝑹−𝟏 𝒁 + 𝑫−𝟏 ]−𝟏 𝒁′ 𝑹−𝟏 (𝒚 − 𝑿𝜷
𝑿′𝑹−𝟏 𝑿𝜷 ̂ ) = 𝒁′𝑹−𝟏 𝒚 atau
̂ − 𝒁′𝑹−𝟏 [𝒁′ 𝑹−𝟏 𝒁′ + 𝑫−𝟏 ]−𝟏 𝒁′𝑹−𝟏 𝑿𝜷
𝑿′𝑹−𝟏 𝑿𝜷 ̂ = 𝑿′𝑹−𝟏 𝒚 −
𝒁′ 𝑹−𝟏 𝒁[𝒁′𝑹−𝟏 𝒁 + 𝑫−𝟏 ]−𝟏 𝒁′𝑹−𝟏 𝒚 atau
̂ = 𝑿′𝑽−𝟏 𝒚 sehingga
𝑿′𝑽−𝟏 𝑿𝜷
̂ = (𝑿′𝑽−𝟏 𝑿)−1 𝑿′𝑽−𝟏 𝒚
𝜷 (2.10)
35
Estimasi efek tetap ̂ adalah estimasi GLS (Generalized least
𝜷
̂ adalah BLUE (Best linear unbiased estimator) untuk 𝐗𝜷.
squares) dan 𝐗𝜷
̂ adalah MLE (Maximum
Bila 𝒚 mempunyai sebaran normal, maka 𝜷
̂ pada persamaan (2.12) dapat
likelihood estimator). Estimasi efek acak 𝒖
dinyatakan sebagai berikut:
𝒖 ̂)
̂ = 𝑫𝒁′ 𝑽−𝟏 (𝒚 − 𝑿𝜷 (2.11)
36
BAB III
Keterangan:[17]
𝒀𝒊 : Matriks (𝑛 × 1), vektor dimensi 𝑛𝑖 pengukuran berulang
untuk subjek ke-i
𝑿𝒊 : matriks (𝑛 × 𝑝), variabel bebas yang diketahui
𝜷𝒊 : Matriks (p × 1), vektor dimensi q koefisien regresi subjek
spesifik
𝜺𝒊 : Matriks (𝑛 × 1), vektor komponen residual 𝜀𝑖𝑗 , 𝜺𝒊 ~
N(0,𝝈𝟐 𝑰𝒏 )
𝒁𝒊 : Matriks (𝑛 × 𝑞) variabel bebas yang diketahui,
memodelkan bagaimana respon disusun berdasarkan
waktu untuk subjek ke-i.
𝐮𝒊 : Matriks (𝑞 × 1) vektor komponen residual 𝑏𝑖 ~ 𝑵𝒒 (0,D)
D : matriks kovarian
37
Pada persamaan (3.1) 𝐮𝒊 sebagai efek acak dan 𝒀𝒊 diasumsikan berdistribusi
normal dengan vekor rata-rata 𝑿𝒊 𝜷𝒊 + 𝒁𝒊 𝐮𝒊 atau 𝐸 (𝒚|𝒖) = 𝑿𝒊 𝜷𝒊 + 𝒁𝒊 𝐮𝒊 , dan
matriks kovarian 𝑹 atau 𝑣𝑎𝑟(𝒚|𝒖) = 𝑹 = 𝝈𝟐 𝑰𝒏. Efek acak diasumsikan
berdistribusi normal dengan vektor rata-rata nol dan matriks kovarian adalah 𝑫
seperti pada persamaan (3.3). Misalkan 𝑓(𝒚|𝒖) dan 𝑓(𝑢) adalah fungsi kepadatan,
maka:
𝑓(𝑦) = 𝑓 (𝒚|𝒖) 𝑓(𝑢)𝜕𝑓(𝑢), ditunjukan sebagai kepadatan berdistribusi normal
dengan 𝑋𝜷 sebagai vektor rata-rata atau 𝐸(y) = 𝑿𝜷. Dan kovariannya adalah:
𝑽 = 𝒁𝑫𝒁′ + 𝑹 (3.3)
Dalam model linier campuran bivariat terdapat dua efek yang digunakan,
yaitu efek tetap dan efek acak, adapaun estimasi yang digunakan adalah sebagai
berikut:
terbentuk adalah:
1 ′ −𝟏 (𝒀−𝑿𝜷)
1
𝑓(𝒀|𝜷, 𝑽 = 𝝈𝟐 𝑰) = ((2𝜋)𝑁/2 |𝑽|1/2 ) 𝑒 −2(𝒀−𝑿𝜷) 𝑽 (3.4)
38
L(𝛃; 𝐘) = 𝑙𝑛L(𝛃; 𝐘)
1 ′ −𝟏 (𝒀−𝑿𝜷)
1
= 𝑙𝑛 (2𝜋)𝑁/2 |𝑽|1/2 𝑒 −2(𝒀−𝑿𝜷) 𝑽
1 ′ −𝟏 (𝒀−𝑿𝜷)
1
= 𝑙𝑛 (2𝜋)𝑁/2 |𝑽|1/2 + 𝑙𝑛 [𝑒 −2(𝒀−𝑿𝜷) 𝑽 ]
1 1
= 𝑙𝑛 (2𝜋)𝑁/2 |𝑽|1/2 − (𝒀 − 𝑿𝜷)′ 𝑽−𝟏 (𝒀 − 𝑿𝜷)
2
1 1
∂ ln ∂ (𝒀−𝑿𝜷)′ 𝑽−𝟏 (𝒀−𝑿𝜷)
(2𝜋)𝑁/2|𝑽|1/2 2
= −
∂𝛃 ∂𝛃
∂ 1
= − ∂β (2)(𝒀 − 𝑿𝜷)′ 𝑽−𝟏 (𝒀 − 𝑿𝜷) (3.5)
∂ 1
− ∂𝛃 (2)(𝒀 − 𝑿𝜷)′ 𝑽−𝟏 (𝒀 − 𝑿𝜷) = 0
∂ 1
= − ∂𝛃 (2 (𝒀 − 𝑿𝜷)′ 𝑽−𝟏 (𝒀 − 𝑿𝜷)
39
∂ 1
( (𝒀 − 𝑿𝜷)′ 𝑽−𝟏 (𝒀 − 𝑿𝜷) 1
∂𝛃 2 = 2 (−𝑿)′ (2𝑽−𝟏 )(𝒀 − 𝑿𝜷)
= −𝐗 ′ 𝑽−𝟏 𝒀 + 𝐗′𝑽−𝟏 𝑿𝜷
−𝐗 ′ 𝑽−𝟏 𝒀 + 𝐗′𝑽−𝟏 𝑿𝜷 = 𝟎
𝐗′𝑽−𝟏 𝑿𝜷 = 𝐗 ′ 𝑽−𝟏 𝒀
40
Pada literasi Bayesian, distribusi ini disebut distribusi prior pada parameter
𝐮𝒊 , karena tidak bergantung pada data 𝐘i . Setelah nilai-nilai 𝐲i pada 𝐘i
teramati dengan distribusi 𝐮𝒊 , kondisi pada 𝐘i = 𝐲i dapat dilakukan
perhitungan. Jika kita tunjukan fungsi kepadatan 𝐘i dengan kondisi 𝐮𝒊 , dan
fungsi kepadatan pada 𝐘i adalah f(𝐲i |𝐮𝒊 ) dan f(𝐮𝒊 ). maka fungsi kepadatan
posterior pada 𝐮𝒊 diberikan dengan 𝐘i = 𝐲i sehingga:
f(𝐲i |𝐮𝒊 )f(𝐮𝒊 )
f(𝐮𝒊 |𝐲i ) ≡ f(𝐮𝒊 |𝐘i = 𝐲i ) =
∫ f(𝐲i |𝐮𝒊)f(𝐮𝒊 )d𝐮𝒊
1. Menentukan model linier campuran, dalam hal ini adalah linier campuran
bivariat seperti Pada persamaan (3.1), yaitu:
𝑌𝑖 = 𝑿𝒊 𝜷𝒊 + 𝒁𝒊 𝐮𝒊 + 𝜺𝒊
2. Menentukan variabel pengaruh tetap (𝛃) acak (𝐮)
3. Menentukan matriks rancangan (𝑿) untuk pengaruh tetap dan matriks
rancangan (𝒁) untuk pengaruh acak
4. Menentukan matris kovarians dari distribusi marginal atau 𝑣𝑎𝑟(𝒚|𝒖) = 𝑹 =
𝝈 𝟐 𝑰𝒏
41
5. Menentukan matris kovarians dari efek acak, seperti pada persamaan (3.2)
var (u) cov (u, u′ ) 𝐷 𝐷12
yaitu: 𝐃 = 𝐯𝐚𝐫 (𝐮) = [ ]=[ 1 ]
cov (𝑢, 𝑢′ ) var (𝑢) 𝐷21 𝐷2
6. Menentukan matriks kovarians dari pengaruh efek acak seperti pada
persamaan (3.3), yaitu:
𝑽 = 𝒁𝑫𝒁′ + 𝑹
7. Melakukan perhitungan estimasi 𝛽 seperti pada persamaan Menentukan
nilai 𝛽̂ dengan persamaan (3.6)
8. Substitusi ke pers(3.7)
̂ = 𝑫𝒁′ 𝑽−𝟏 (𝒚 − 𝑿𝜷)
𝒖
3.4 Contoh kasus estimasi model liniear campuran bivariat pada data
longitudinal
Contoh terperinci. Pada data longitudinal di mana mengamati variabel
respon 𝑦 yaitu ukuran bayi (cm) sesuai dengan kualitas makanan bayi (V) serta
banyak bayi, 𝑛 = 3 perempuan (P) dan anak laki-laki (L) yang diamati dari
waktu ke waktu. Data disajikan oleh Tabel berikut:
Tabel 3. 1 tabel data pengamatan
42
(dalam bulan). Sebagai contoh, mempertimbangkan batasan pengidentifikasian
yang mencakup variabel jenis kelamin yang level F-nya adalah rujukan, model
campuran linier bivariat dapat ditulis sebagai berikut:
𝑦 = (𝟙 V 𝑗𝑒𝑛𝑖𝑠 𝑘𝑒𝑙𝑎𝑚𝑖𝑛 )𝛽𝑖 + 𝑍𝑖 u𝑖 + 𝜀𝑖
=𝑋
1 38,16 0
1 41,46 1
1 41,37 0
1 48,76 1
Dimana, secara eksplisit 𝑿 = 1 44,79 1 ;
1 48,17 1
1 44,79 0
1 47,91 1
[1 44,7 1]
1 0 0
0 1 0
1 0 0
0 0 1
𝐙= 0 1 0 ;
0 1 0
1 0 0
0 0 1
[0 0 1]
Jika dari tabel (3.1). misalkan 𝜷 = 𝝈𝟐𝜷 adalah rata-rata ukuran panjang bayi tiap
waktu pengambilan data, dan 𝒖 = 𝝈𝟐𝒖 adalah pengukuran ukuran bayi dari
masing-masing bayi. Sehingga tabel diatas dapat disajikan sebagai berikut:
43
Dari tebel diatas diperoleh:
52,257 69,05
𝜷 = [83, 057], dan 𝒖 = [ 81.9 ]
88,32 72,583
dengan menggunakan persamaan (3.2) diperoleh
14,912 −20,176 5,264
( )
𝑫 = 𝑣𝑎𝑟 𝒖 = [−20,176 27,298 −7,112] (3.8)
5,264 −7,112 1,858
- - -
94,069 10,937 18,770 92,992 -72,45 -30,054
64,747 19,5164 29,993
-
10,937 39,527 62,182 27,360 9,778 6,748 -33,708 -21,004
20,981
- -
18,770 -18,65 15,099 9,540 13,233 3,542261 3,545
22,349 22,724
-
92,991 27,360 9,540 99,085 -65,06 -32,892 -37,28 -37,21
56,512
- -
58,411 -56,51 52,394 56,735 -0,790 12,764 12,73
64,747 22,348
- - -
6,748 56,735 61,829 2,563 16,204 16,16
72,457 22,724 65,064
-
-33,708 13,233 -32,89 -0,790 2,563 29,886 20,6249 20,59
19,516
-
-21,004 3,542 -37,28 12,76 6,205 20,625 17,589 17,589
30,054
-
-20,981 3,5451 -37,21 12,731 16,165 20,599 17,589 17,563
29,995
44
Sehingga diperoleh:
48,468
̂ = (57,889)
𝒖
61,098
45
BAB IV
PENUTUP
4.1 Kesimpulan
̂)
̂ = 𝑫𝒁′𝑽−𝟏 (𝒚 − 𝐗𝜷
𝒖
Sehingga diperoleh:
𝒀 ̂ + 𝒁𝒖
̂ = 𝐗𝜷 ̂+𝜺
Pada kasus pengukuran bayi, diperoleh:
217,1738
̂ = ( 4,911 ) , dan
𝜷
187, 9215
48,468
̂ = (57,889)
𝒖
61,098
.
4.2 Saran
46
DAFTAR PUSTAKA
[8] D. Park, “model linear campuran pada data longitudinal,” Anal. DATA
Longitud., no. 4483, p. 9, 2017.
[10] N. A. Rizki, “Model Regresi Data Panel Random Effect Dengan Metode
Generalized Least Squares (GLS),” 2011.
47
[12] “epdf.pub_generalized-linear-and-mixed-models-wiley-series-i.pdf.” .
[13] S. K. Ragam, “3. model linear campuran 3.1.,” no. 1939, 1992.
48