Anda di halaman 1dari 58

ESTIMASI PARAMETER MODEL LINIER CAMPURAN

BIVARIAT PADA DATA LONGITUDINAL

STUDI LITERATUR

Disususn untuk memenuhi syarat kelulusan pada mata kuliah studi literatur
di jurusan Matematika

Oleh
Siti Nurjamilah
1167010067

JURUSAN MATEMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM SUNAN GUNUNG DJATI
BANDUNG
2020
LEMBAR PENGESAHAN

ESTIMASI PARAMETER MODEL LINIER CAMPURAN


BIVARIAT PADA DATA LONGITUDINAL

STUDI LITERATUR
JURUSAN MATEMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI SUNAN GUNUNG DJATI
BANDUNG

Oleh:
Siti Nurjamilah
NIM : 1167010067
Bandung, Januari 2020
Menyetujui,
Dosen Pembimbing SL Dosen Penguji SL

Asep Solih Awaludin, M.Si ---------------------------


NIP. 197611212009121004 NIP.

Mengetahui,
Ketua Jurusan Matematika

Asep Solih Awaludin, M.Si


NIP.197611212009121004

i
ABSTRAK

Nama : Siti Nurjamilah


NIM : 1167010067
Judul : Estimasi Parameter Model Linier Campuran Bivariat

Pada Data Longitudinal

Model efek campuran merupakan sebuah perluasan model linear yang


menggabungkan efek tetap (fixed effect) dan efek acak (random effect). fixed
effect adalah efek yang dapat dikontrol oleh peneliti dan random effect adalah efek
yang tidak dapat dikontrol oleh peneliti. Model efek campuran dapat diilustrasikan
sebagai berikut:
𝑦𝑖𝑗𝑘 = 𝜇 + 𝛼𝑖 + 𝑏𝑗 + 𝑐𝑖𝑗 + 𝜀𝑖𝑗𝑘 , 𝑖 = 1,2,3, … 𝐼, 𝑗 = 1,2,3, … , 𝐽, 𝑘 = 1,2,3, … , 𝐾
Secara umum, model efek campuran dapat dituliskan kedalam model linear
campuran yaitu: 𝑦 = 𝑋𝛽 + 𝑍𝑢 + 𝜀. Hasil estimasi model efek campuran
menggunakan model linier campuran berdasarkan estimator best linier unbiased
predictor yaitu:
̂ = 𝑿(𝑿′𝑽−𝟏 𝑿)−𝟏 𝑿′𝑽−𝟏 𝒚 + 𝒁(𝐃𝐙 ′ 𝐕 −𝟏 (𝐲 − 𝐗((𝑿′𝑽−𝟏 𝑿)−𝟏 𝑿′𝑽−𝟏 𝒚))
𝒚
Data yang digunakan yaitu pengukuran panjang badan tiga bayi yang
dilakukan tiga kali untuk masing-masing bayi dan melihat adanya pengaruh pola
makan bayi terhadap panjang bayi. Perubahan Panjang badan semua bayi dari
waktu-kewaktu sebagai efek tetap sedangkan perubahan panjang badan masing-
masing bayi dari waktu-kewaktu sebagai efek acak.

untuk mempelajari pengaruh Data empiris dalam suatu penelitian terdiri


dari berbagai macam tipe, yaitu time series, cross-section dan data longitudinal,
yang merupakan gabungan antara time series dan cross-section. Data
longitudinal adalah data yang diperoleh dari pengamatan terhadap beberapa objek
lebih dari satu kali pada waktu yang berbeda. Penelitian longitudinal tidak cukup
hanya mengetahui bagaimana perubahan data dari waktu ke waktu, tapi juga
bagaimana perubahan pada waktu yang sama dan variabel berbeda. Berdasarkan
jumlah variabel, Analisis statistik bisa dikelompokkan menjadi univariate,
bivariate dan multivariate. Secara khusus, model liniear campuran bivariat
dipasang untuk menilai keduanya (perubahan data dari waktu ke waktu dan
bagaimana perubahan pada waktu yang sama dengan variabel berbeda). Model ini
melibatkan efek acak (random effect) dan efek tetap (fixed effect).
Dalam studi literatur ini menggunakan metode least square dummy variable
(LSDV) untuk parameter efek tetap dan generalized least square (GLS) untuk

ii
parameter efek acak. Keduanya merujuk pada Estmasi Maksimum Likelihood
(MLE). Dari hasil analisis kedua metode tersebut diperoleh estimais sebagai
berikut:
̂ = (𝐗 ′ 𝐗)−𝟏 𝐗 ′ 𝐘
𝜷 (estimasi parameetr efek tetap)
̂ = 𝐃𝐙 ′ 𝐕 −𝟏 (𝐘 − 𝐗𝛃)
𝒖 (estimasi parameter efek acak)

Sehingga model liniear campuran bivariat pada data longitudinal dengan setimasi
parameter efek tetap dan efek acak adalah sebagai berikut:
𝒀 ̂ + 𝒁𝒖
̂ = 𝐗𝜷 ̂ + 𝜺̂

Kata kunci: Data longitudinal, liniear campuran bivariat efek acak (random
effect), efek tetap (fixed effect), least square dummy variable (LSDV), generalized
least square (GLS)

iii
KATA PENGANTAR

Alhamdulillah puji syukur penulis panjatkan kehadirat Allah SWT atas


segala Rahmat dan Karunia-Nya, serta sholawat dan salam kepada Baginda Alam
Nabi Muhammad SAW sehingga penulis dapat menyelesaikan penyusunan Studi
Literatur yang berjudul “Estimasi Parameter Model Linier Campuran Bivariat
Pada Data Longitudinal” dengan baik dan tepat pada waktunya.
Penyusunan Studi Literatur ini adalah salahsatu syarat yang harus dipenuhi
dalam memperoleh gelar Sarjana Sains sesuai dengan kurikulum jurusan
Matematika Fakultas Sains Dan Teknologi Universitas Islam Negeri Sunan
Gunung Djati Bandung. Dalam penyusunan studi literatur ini tidak terlepas dari
bantuan serta dukungan dari berbagai pihak. Oleh karena itu penulis tidak lupa
menyampaikan ucapan terimakasih kepada:
1. Bapak Asep Solih Awalluddin M.Si selaku ketua jurusan sekaligus
pembimbing Studi Literatur yang telah sabar meluangkan waktu, tenaga dan
pikirannya untuk memberikan bimbingan, saran, dan motivasi kepada
penulis untuk menyelesaikan penyusunan studi literatur ini.
2. Bapak/ ibu...., selaku dosen penguji yang telah memberikan tambahan ilmu
selama proses perbaikan laporan studi literatur.
3. kedua orangtua terhebat dan tercinta penulis, terima kasih atas doa,
motivasi, pengorbanan, dan kasih sayang yang selalu diberikan kepada
penulis.
4. Seluruh Kakak tersayang, yang tiada henti memberikan kasih sayang, doa
dan motivasi.
5. Sahabat seperjuangan dari awal perkuliahan yaitu Pipih Nurul Faoziah, Pibi
Ahustiani, Rani Nuryanti, Siti Nurlela, Risatianti Soleha, Siti Samkhah, Tita
Hertanti, Yuli Yulianti, Tuti Hartuti dan Sumiati yang tidak henti
memberikan dukungan dan membersamai dalam suka dan duka.
6. Sahabat tersayang penulis Fadillah Tsani, Puput Futuhul, dan Nurmaya
yang sudah banyak memberikan doa dan motivasi kepada penulis.
7. Rekan-rekan satu Bimbingan yang tidak henti-hentinya selalu mengingatkan
dan memberikan motivasi.

iv
8. Teman-teman S1 Matematika angkatan 2016, yang sangat istimewa dan
memberikan banyak pengalaman serta pengetahuan untuk penulis.
9. Ibu dan bapak Surya yang selalu memberikan doa, motivasi dan kemudahan
penulis dalam mencetak dan mengedit selama penyusunan.
10. Bunda Siti Fatimah dan keluarga yang selalu memberikan kenyamanan
penulis dalam melakukan penyusunan.
11. Pihak-pihak lain yang telah mendukung dan membantu dalam penyusunan
studi literatur ini yang tidak bisa penulis sebutkan satu per satu, penulis
ucapkan banyak terima kasih.
Penulis menyadari bahwa penyusunan studi literatur ini masih jauh dari
sempurna, maka kritik dan saran yang membangun akan senantiasa penulis
harapkan demi kesempurnaan di masa mendatang. Semoga laporan studi literatur
ini dapat bermanfaat bagi semua pihak.

Bandung, Januari 2020


Penulis

v
DAFTAR ISI

LEMBAR PENGESAHAN .......................................................................................... i


ABSTRAK................................................................................................................... ii
KATA PENGANTAR ................................................................................................ iv
DAFTAR ISI .............................................................................................................. vi
DAFTAR TABEL .................................................................................................... viii
DAFTAR GAMBAR .................................................................................................. ix
BAB I PENDAHULUAN .......................................................................................... 1
1.1 Latar Belakang Masalah .................................................................................. 1

1.2 Rumusan Masalah ........................................................................................... 2

1.3 Batasan Masalah ............................................................................................. 3

1.4 Tujuan Penelitian ............................................................................................ 3

1.5 Ruang Lingkup Penelitian ............................................................................... 3

1.6 Sistematika Penulisan ...................................................................................... 4

BAB II LANDASAN TEORI ..................................................................................... 5


2.1 Data Multivariat .............................................................................................. 5

2.1.1 Uji ststistik Multivariat ............................................................................. 6

2.1.2 Teknik Analisis Multivariat ...................................................................... 8

2.2 Analisis data Bivariat .................................................................................... 11

2.3 Data longitudinal ........................................................................................... 13

2.4 Model data longitudinal multivariat ............................................................... 16

2.5 Analisis regresi .............................................................................................. 19

2.5.1 Analisis regresi sederhana (simple regression analysis) dan analisis


berganda (multiple regression analysis) ............................................................. 21

2.5.2 Model regresi dalam pendekatan matriks ................................................ 22

2.6 Model Regresi longitudinal ........................................................................... 23

vi
2.6.1 Common Effect Model (CEM) ................................................................ 25

2.6.2 Fixed Effect Model (FEM) ..................................................................... 27

2.6.3 Random Effect Model (REM) ................................................................. 29

2.7 Model Linier Campuran ................................................................................ 32

2.7.1 Struktur Varian Kovaran model linear campuran .................................... 32

2.7.2 Model Campuran untuk data longitudinal ............................................... 34

2.8 Estimasi model linier campuran ..................................................................... 34

2.8.1 Menduga efek tetap ................................................................................ 35

2.8.2 Estimasi efek tetap dan efek acak ........................................................... 35

BAB III ESTIMAS PARAMETER MODEL LINIER CAMPURAN


BIVARIAT PADA DATA LONGITUDINAL ........................................... 37
3.1 Menentukan model liniear campuran bivariat pada data longitudinal ............. 37

3.2 Menentukan estimasi parameter model linier campuran bivariat .................... 38

3.2.1 Estimasi parameter efek tetap (𝛃) ........................................................... 38

3.2.2 Estimasi parameter 𝒖 ............................................................................. 40

3.3 Langkah-langkah Estimasi parameter model liniear campuran bivariat


pada data longitudinal............................................................................................. 41

3.4 Contoh kasus estimasi model liniear campuran bivariat pada data
longitudinal ............................................................................................................ 42

BAB IV PENUTUP ................................................................................................... 46


4.1 Kesimpulan ................................................................................................... 46

4.2 Saran ............................................................................................................. 46

DAFTAR PUSTAKA ................................................................................................ 47

vii
DAFTAR TABEL

Tabel 2. 1 kesalahan dalam pengujian Hipotesis ................................................... 7


Tabel 2. 2 Jenis Teknik Dependen ........................................................................ 9
Tabel 2. 3 Jenis Teknik Interdependen ............................................................... 10
Tabel 2. 4 struktur data longitudinal untuk k variabel independen ...................... 15
Tabel 2.5 Struktur data longitudinal multivariat ................................................. 17
Tabel 3. 1 tabel data pengamatan................................................................... .......42
Tabel 3. 2 data parameter ................................................................................... 43

viii
DAFTAR GAMBAR

Gambar 1. 1 Ruang Lingkup penelitian ................................................................ 3


Gambar 2. 1 Analisis statistik berdasarkan jumlah variabel......................... ..........6
Gambar 2. 2 Residu antara hubungan X dan Y ketika r mendekati -1 atau 1 ....... 12
Gambar 2. 3 garis regresi ................................................................................... 13

ix
BAB I
PENDAHULUAN

1.1 Latar Belakang Masalah

Data longitudinal adalah data yang diperoleh dari pengamatan terhadap


beberapa objek lebih dari satu kali pada waktu yang berbeda. Data longitudinal
seringkali digunakan dibidang kesehatan misalnya meneliti tentang perkembangan
laju sebuah virus penyakit, dll. Namun seringkali penelitian tidak cukup hanya
mengetahui bagaimana perubahan data dari waktu ke waktu, tapi juga bagaimana
perubahan pada waktu yang sama dan variabel berbeda.[1] Berdasarkan jumlah
variabel, Analisis statistik bisa dikelompokkan menjadi univariate, bivariate dan
multivariate.[2]
Kata univariate terbentuk dari kata uni (satu) dan variate (variable),
sehingga analisis univariat adalah analisis satu variabel. Contoh analisis univariat
adalah pengukuran rata-rata (mean), standar deviasi dan varian sebagai ukuran
pusat dari sekelompok data. Kata bivariate berasal dari kata bi (dua) dan variate
(variable), sehingga analisis bivariate berkaitan dengan dua variabel. Menurut
Sunyoto (2007:31) pengukuran korelasi bivariat dapat dibedakan menjadi
pengukuran secara linear (termasuk parsial) dan secara berganda (multiple).[2].
Analisis multivariate berasal kata multi (banyak) dan variate (variable),
sehingga analisis multivariate adalah analisis terhadap banyak variable yang
merupakan pengembangan dari analisis univariate dan bivariate. Analisis
multivariate memiliki lebih dari dua variabel. Supranto (2010:18)
mengilustrasikan analisis multivariate dengan adanya masalah atau gap yang
disebabkan oleh tidak adanya kesesuaian antara harapan (expected) dan kenyataan
(observed). Setiap masalah pasti ada faktor-faktor penyebab (pada umumnya lebih
dari satu penyebab). Kalau masalah kita sebut variabel dependen (Y) dan faktor
penyebab kita sebut variabel bebas (X) maka masalah (Y) adalah fungsi dari
X1 , X2 , X3 … . … X𝑛 . Fenomena ini disebut fenomena multivariate. Dengan
demikian, analisis multivariate ini merujuk kepada teknik statistik tertentu yang
menganalisis banyak variabel secara simultan[2].

1
Selama beberapa dekade terakhir, banyak model statistik telah diusulkan untuk
analisis data longitudinal yang melibatkan lebih dari satu variabel dan yang paling
populer adalah model campuran gabungan yang menghubungkan model campuran
linier dengan kemungkinan model efek acak untuk dikorelasikan. Gueorguieva dan
Sanacora mengembangkan model campuran gabungan untuk menggabungkan
jenis hasil longitudinal berbeda dan dianalisis berulang pada pengukuran variabel
ordinal dan kontinyu.
Baru-baru ini Luo et al. mengusulkan model linear campuran bivariat untuk
memperkirakan koefisien korelasi dalam data cross-sectional. Hampir semua
model gabungan tersebut mengasumsikan bahwa subjek diambil dari populasi
homogen tunggal. Secara khusus, model liniear campuran bivariat dipasang untuk
menilai keduanya korelasi antara efek acak dan korelasi marginal dari waktu ke
waktu, dan kemudian korelasi kondisional (korelasi marginal yang diberikan efek
acak)[3] .
Dalam studi literatur ini, berfokus pada Estimasi parameter model liniear
campuran bivariat, dengan korelasi antara efek acak Korelasi antara dua variabel
dependen kemudian yang dari efek acak terkait dengan variabel dependen ini.
Disini mengasumsikan bahwa efek acak dan kesalahan (residual) mengikuti
distribusi Gaussian.[4] Kami menggunakan algoritma Estimasi Maksimum
Likelihood untuk estimasi parameter model tetapi di sini.

1.2 Rumusan Masalah

1. Apa yang dimaksud dengan data linier campuran bivariat?


2. Bagaimana Model linier campuran bivariat pada data longitudinal?
3. Bagaimana langkah-langkah estimasi model linier campuran bivariat pada
data longitudinal?

2
1.3 Batasan Masalah

Batasan masalah dalam studi literatur ini adalah mengenai estimasi


parameter model linier campuran bivariat pada data longitudinal yang melibatkan
efek tetap dan efek acak.

1.4 Tujuan Penelitian

1. Untuk mengetahui data linier campuran bivariat


2. Untuk mengetahui Model linier campuran bivariat pada data longitudinal.
3. Untuk mengetahui langkah-langkah estimasi model linier campuran
bivariat pada data longitudinal.

1.5 Ruang Lingkup Penelitian

Regresi Liniear Data longitudinal

Regresi Liniear Campuran

Fixed Random
Effect Effect
Model Model
(FEM) (REM)

Model linier
campuran bivariat

Estimasi parameter model linier


campuran bivariat pada data
longitudinal

Gambar 1. 1 Ruang Lingkup penelitian

3
Ruang lingkup dalam penelitian ini yaitu estimasi parameter pada data
longitudinal dengan model liniear campuran bivariat. Dalam model liniear
campuran terdapat variabel efek acak dan variabel efek tetap. Pada masing-
masing variabel terdapat parameter, variabel efek tetap dengan parameter efek
tetap, begitupun variabel efek acak dengan parameter efek acak. Masing-masing
parameter tersebut diestimasi menggunakan metode least square dummy variable
(LSDV) untuk parameter efek tetap dan generalized least square (GLS) untuk
parameter efek acak. Keduanya merujuk pada Estmasi Maksimum Likelihood
(MLE).

1.6 Sistematika Penulisan

Bersadarkan sistematika penulisannya, studi literatur ini terdiri atas empat


bab, dimana dalam setiap bab terdapat beberapa subbab. Sebagai berikut:

Bab I Berisi Latar Belakang, Rumusan Masalah, Batasan Masalah, Tujuan


Penelitian,Ruang Lingkup Penelitian dan Sistematika Penulisan.
Bab II Landasan Teori
Secara garis besar, bab ini mencakup semua yang berkaitan dengan
masalah data longitudinal, model liniear campuran dan estimasi parameter
model liniear campuran.
Bab III Estimasi parameter model linier campuran bivariat pada data longitudinal
Dalam bab ini diuraikan tentang inti penelitian yang dilakukan, yaitu
estimasi parameter model linier campuran bivariat pada data longitudinal
dan contoh kasusnya, yaitu dalam pengukuran ukuran bayi disebuah kota
di newyork.
Bab IV penutup
Pada bab ini dipaparkan kesimpulan yang merupakan jawaban dari
rumusan masalah serta saran-saran untuk penelitian selanjutnya.

4
BAB II
LANDASAN TEORI

2.1 Data Multivariat

Menurut Widarjono (2010:1) analisis multivariat merupakan salah satu


analisis statistik yang berkaitan dengan banyak variabel. Analisis statistik bisa
dikelompokkan berdasarkan jumlah variable, yaitu : univariate, bivariate dan
multivariate. Kata univariate terbentuk dari kata uni (satu) dan variate (variable),
sehingga analisis univariat adalah analisis satu variabel. Contoh analisis univariat
adalah pengukuran rata-rata (mean), standar deviasi dan varian sebagai ukuran
pusat dari sekelompok data. Jadi analisis univariate lebih bersifat analisis tunggal
terhadap satu variabel. Jadi analisis disebut univariat jika setiap variabel berdiri
sendiri tidak terkait dengan variabel lain. Analisis terhadap variabel tunggal ini
disebut univariate. Dengan demikian analisis univariat boleh saja dikatakan
sebagai analisis statistik deskriptif. Dalam statistika dikenal istilah statistik
deskriptif dan inferensial. Statistik deskriptif berfungsi mendeskripsikan
karakteristik dari sekelompok hasil data penelitian terhadap variabel tunggal.
Sedangkan statistik inferensial berusaha menyimpulkan fenomena atau hubungan-
hubungan antara lebih dari satu variabel pada sebuah persamaan statistik[2].
Kata bivariate berasal dari kata bi (dua) dan variate (variable), sehingga
analisis bivariate berkaitan dengan dua variabel. Misalnya analisis korelasi yang
mencari keeratan hubungan antara dua variable exogen dan endogen. Menurut
Sunyoto (2007:31) pengukuran korelasi bivariat dapat dibedakan menjadi
pengukuran secara linear (termasuk parsial) dan secara berganda (multiple). Yang
dimaksud dengan pengukuran korelasi linear adalah pengukuran atau perhitungan
korelasi yang hanya melibatkan satu variable bebas (independent atau X) dan satu
variable terikat (dependent atau Y). Sedangkan pengukuran korelasi berganda
adalah perhitungan korelasi dengan melibatkan lebih dari satu variabel
independent (bebas) dengan satu variabel dependent (terikat).

5
Analisis multivariate berasal kata multi (banyak) dan variate (variable),
sehingga analisis multivariate adalah analisis terhadap banyak variable yang
merupakan pengembangan dari analisis univariate dan bivariate. Analisis
multivariate memiliki lebih dari dua variabel. Supranto (2010:18)
mengilustrasikan analisis multivariate dengan adanya masalah atau gap yang
disebabkan oleh tidak adanya kesesuaian antara harapan (expected) dan kenyataan
(observed). Setiap masalah pasti ada faktor-faktor penyebab (pada umumnya lebih
dari satu penyebab). Kalau masalah kita sebut variabel dependen (Y) dan faktor
penyebab kita sebut variabel bebas (X) maka masalah (Y) adalah fungsi dari
𝑋1 , 𝑋2 , 𝑋3 … . … 𝑋𝑛 . Fenomena ini disebut fenomena multivariate. Dengan
demikian, analisis multivariate ini merujuk kepada teknik statistik tertentu yang
menganalisis banyak variabel secara simultan[2].

Gambar 2. 1 Analisis statistik berdasarkan jumlah variabel

2.1.1 Uji ststistik Multivariat

Sebagai bagian dari statistik inferensial, analisis multivariat dilakukan


terhadap data sampel dari sebuah populasi. Karakteristik populasi yang
diteliti hanya didasarkan pada karakteristik sampel yang diambil secara
random dari populasi. Untuk itu, kesimpulan di dalam analisis mulivariat
didasarkan pada statistik inferensial. Statistika inferensial berusaha
menyimpulkan fenomena-fenomena atau hipotesis yang diuji dalam sebuah

6
penelitian. Peneliti yang menggunakan statistik inferensial harus
menentukan tingkat kesalahan yang bisa diterima karena adanya kesalahan
sampling (sampling error). Dalam penelitian, tingkat kesalahan (𝛼) yang
dapat diterima adalah 5 %, sehingga tingkat keyakinan (level of confidence)
adalah 100 % - 5 % = 95 %.[5]
Pendekatan yang digunakan dalam menentukan besarnya tingkat
kesalahan yang diterima adalah tipe kesalahan I (type I error) yang dikenal
dengan alpha ( ). Tipe kesalahan I atau  merupakan probabilitas menolak
hipotesis nol (𝐻0 ) yang benar. Ketika peneliti menentukan besarnya , maka
peneliti juga secara otomatis menentukan besarnya kesalahan jenis lain yang
terkait yaitu tipe kesalahan II dikenal dengan . Dengan demikian  ini
merupakan probabilitas menerima hipotesis nol (𝐻0 ) yang salah. Berkaitan
dengan, probabilitas yang sering digunakan adalah probabilitas 1 –  yang
menunjukkan kekuatan statistik inferensial (statistical power). 1 – 
merupakan probabilitas menolak hipotesis nol yang salah. Hubungan antara
kedua probabilitas tersebut dapat digambarkan di dalam Tabel 2.1.
Kesalahan dalam Pengujian Hipotesis, sebagai berikut :[2]

Tabel 2. 1 kesalahan dalam pengujian Hipotesis

Keputusan Kondisi populasi


Hipotesis noh (𝐻0 ) benar Hipotesis nol (𝐻0 ) Salah
Menerima Keputusan benar dengan  (kesalahan tipe II)
𝐻0 derajat kepercayaan (1-)
Menolak 𝐻0  (kesalahan tipe II) Keputusan benar (1-)

Dalam prosedur uji statistik, keputusan menolak atau menerima 𝐻0


tergantung dari besarnya nilai hitung dari uji statistik yang kita gunakan
(missal 𝑡ℎ𝑖𝑡𝑢𝑛𝑔 ) dibandingkan dengan nilai statistik table pada  = 5 %.
Jika nilai absolut statistik hitung ≥ dari nilai kritisnya maka kita menolak
𝐻0 dan menerima 𝐻𝑎 , sehingga secara statistik signifikan. Sebaliknya jika
nilai absolut statistik hitung ≤ dari nilai kritisnya maka kita menerima 𝐻0

7
dan menolak 𝐻𝑎 , sehingga secara statistik tidak signifikan. Nilai 𝑃
(Probabilitas) juga dapat digunakan untuk menerima atau menolak 𝐻0 .
𝑃𝑣𝑎𝑙𝑢𝑒 merupakan besarnya  yang sebenarnya. Jika 𝑃𝑣𝑎𝑙𝑢𝑒 lebih kecil dari
 (5 %) maka kita menolak 𝐻0 . Sebaliknya jika 𝑃𝑣𝑎𝑙𝑢𝑒 lebih besar dari
 (5 %) maka kita menerima 𝐻0 .

2.1.2 Teknik Analisis Multivariat

Terdapat tiga jenis teknik dalam analisis multivariate, yaitu : (1).


Teknik dependent, (2). Teknik interdependent, dan (3). Teknik persamaan
structural (structural model). Teknik dependen yaitu jika variabel dependen
dipengaruhi oleh variabel independen. Sedangkan teknik interdependen
yaitu jika semua variabel saling berpengaruh. Dengan kata lain, dalam
teknik interdependen semua variabel adalah independen. Untuk memilih
jenis analisis multivariat yang akan digunakan dalam penelitian, peneliti
terlebih dahulu memperhatikan jenis pengukuran data dari variabel yang
diteliti. Jenis data dari variabel yang diteliti dengan analisis multivariat
dapat bersifat kuantitatif atau kualitatif[2]. Data kuantitatif dapat langsung
dihitung. Menurut Widarjono (2010:2) variabel kuantitatif adalah data yang
dilaporkan dalam bentuk angka atau metrik (metric number). Variabel yang
diukur dengan cara ini disebut variabel yang mempunyai data metric.
Contoh beberapa data metric : jumlah mahasiswa dalam satu kelas.
Sedangkan data kualitatif tidak dapat langsung dihitung seperti
pendapat pelanggan tentang kepuasan pelayanan. Data yang berasal dari
variable behavioral bersifat kualitatif. Data kualitatif diukur dengan teknik
penskalaan (scaling technique). Teknik skala yang terkenal adalah Skala
Likert, yang dikembangkan oleh Rensis Likert. Variabel kualitatif adalah
data yang dilaporkan tidak dalam bentuk angka atau non metrik (non
metric).
Variabel yang diukur dengan cara ini disebut variabel yang
mempunyai data non metric. Data kualitatif diukur dalam bentuk atribut
atau karakteristik. Sering juga disebut data kategori, karena memiliki

8
karakteristik beberapa kategori. Contoh beberapa data non metric : agama,
jenis kelamin dll.[2].

2.1.2.1 Teknik Dependen

Teknik ini digunakan jika variabel dependen dan varaiabel


independen mudah diketahui. Teknik ini memiliki dua kelompok,
yaitu: Jumlah variabel dependen dan Jenis pengukuran data baik
variabel dependen maupun independen.[2]
Teknik dependen bisa memiliki satu, dua atau beberapa variabel
dependen. Setelah diketahui jumlah variabel dependen, selanjutnya
dikelompokan berdasarkan jenis pengukuran data baik variabel
dependen maupun independen.

Tabel 2. 2 Jenis Teknik Dependen

Variabel dependen
Jenis Jenis analisis
No Jumlah
Jenis variabel independen multivariat
variabel
1 Non metrik
1 1 metrik Uji beda t-test
dua kategori
Metrik/ Non
2 1 metrik Regresi
metrik
Non metrik dua Metrik/ Non
3 1 Regresi Logistik
kategori metrik
1 atau lebih
Non metrik dua Analisis
4 1 Metrik/ Non
kategori Diskriminan
metrik
Non metrik dua 1 atau lebih Analisis Multiple
5 1
kategori Metrik Diskriminan
6 1 Non metrik Non metrik Analisis Konjoin
1 non metrik, Analysis of Variance
7 1 metrik
> 2 kategori (ANOVA)

9
Multivariate
1 atau lebih
8 >1 metrik Analysis of Variance
Non metrik
(MANOVA).
Analisis Korelasi
9 >1 metrik > 1 metrik
Kanonikal
Analisis Jalur (Path
Analysis) dan
10 >1 metrik > 1 metrik
Structural Equation
Modeling (SEM)
Sumber : Ghozali (2009:9) dan Widarjono (2010:5).

2.1.2.2 Teknik lnterdependen

Teknik ini digunakan ketika variabel sulit ditentukan, apakah


dependen atau independen. Tujuan utama analisis interdependen
adalah menganalisis mengapa dan bagaimana variabel yang ada saling
berhubungan. Metode interdependen ditentukan berdasarkan jenis
pengukuran variabel apakah bersifat metric atau non metric.[2]

Tabel 2. 3 Jenis Teknik Interdependen

Variabel berskala
No Jumlah Variabel metriks
metriks
Tabel kontinjensi two-
1 2 variabel Korelasi Sederhana way
Loglinear
Principle Skala
2 > 2 variabel
component multidimensional
3 > 2 variabel Analisis faktor Analisis koresponden
4 > 2 variabel Analisis cluster Longlinear model
Sumber : Ghozali (2009:9) dan Widarjono (2010:6)

10
2.2 Analisis data Bivariat

Analisis Bivariat adalah sebuah analisis yang digunakan untuk menguji ada
atau tidaknya pengaruh antara variabel dependen dan independen, misalkan 𝑋
Sebagai variabel independen dan 𝑌 Sebagai variabel dependen. Dalam hal ini
biasanya para ahli tertarik untuk melihat hubungan linier antara kedua variabel
tersebut.[6]
Misalkan terdapat 𝑛 pasangan variabel dependen dan independen, maka
Notasi untuk keduanya adalah (𝑥1 , 𝑦1 ), (𝑥2 , 𝑦2 ), … , (𝑥𝑛 , 𝑦𝑛 ). Seberapa kuat
hubungan antara kedua variabel disebut dengan koefisien korelasi (koefisien
korelasi pearson) antara 𝑋 dan 𝑌. Untuk Menentukan koefisien korelasi bisa
menggunakan persamaan sebagai berikut:[6]
𝑛 𝑛 𝑛
1
𝐿𝑥𝑦 = ∑ 𝑥𝑖 𝑦𝑖 − (∑ 𝑥𝑖 ) (∑ 𝑦𝑖 ) (2.1)
𝑛
𝑖=1 𝑖=1 𝑖=1
𝑛 𝑛 2
1
𝐿𝑥𝑥 = ∑ 𝑥𝑖 2 − (∑ 𝑥𝑖 ) (2.2)
𝑛
𝑖=1 𝑖=1
𝑛 𝑛 2
1
𝐿𝑦𝑦 = ∑ 𝑦𝑖 2 − (∑ 𝑦𝑖 ) (2.3)
𝑛
𝑖=1 𝑖=1

Persamaan (2.2) digunakan dalam perhitungan 𝑠 2 . Sekarang koefisien


korelasi antara 𝑋 dan 𝑌 dilambangkan dengan 𝑟 sebagai rasio sebagai berikut:
𝐿𝑥𝑦
𝑟= (2.4)
√𝐿𝑥𝑥 𝐿𝑦𝑦

Dengan nilai 𝑟 antara −1 dan 1 atau

−1 ≤ 𝑟 ≤ 1

Maka ketika 𝑟 mendekati −1 atau 1 (idealnya 0.5 < 𝑟 < 1 atau −1 < 𝑟 <
−0.5).
Ketika 𝑟 mendekati −1 atau 1, ada kemungkinan hubungan linier antara 𝑥
dan 𝑦 sebagai berikut:
𝑦 = 𝑎 + 𝑏𝑥 (2.5)

11
Dalam kasus seperti ini, 𝑟 2 menunjukan proporsi variabilitas pada
hubungan linear antara 𝑥 dan 𝑦. Dan dapat terlihat sebagai berikut:

Sumber: G. Verbeke, S. Fieuws, G. Molenberghs, and M. Davidian, “Statistical


Methods in Medical Research
Gambar 2. 2 Residu antara hubungan X dan Y ketika r mendekati -1 atau 1

Sehingga diperoleh persamaan sebagi berikut:

2
∑𝑖 𝑟𝑖2 ∑𝑖 (𝑦𝑖 − 𝑦̂𝑖 )2
𝑟 =1− =1−
∑𝑖 𝑑𝑖2 ∑𝑖 (𝑦𝑖 − 𝑦̅𝑖 )2
Kemudian untuk menarik garis lurus dengan besar nilai |𝑟| dikenal dengan
regresi linier sederhana. Misalkan kita memiliki 𝑛 pasangan pengamatan,
(𝑥1 , 𝑦1 ), (𝑥2 , 𝑦2 ), … , (𝑥𝑛 , 𝑦𝑛 ) dan plot menunjukkan bahwa ada kemungkinan
garis lurus pada data ini. Untuk menemukan garis lurus kita perlu kemiringan
(atau gradien) dan intersep-𝑦. Dengan menggunakan persamaan (2.5), yaitu: 𝑦 =
𝑎 + 𝑏𝑥, dengan memisalkan 𝛽 adalah kemiringan dan 𝛼 adalah intersep-𝑦, maka
diagram dapat disajikan sebagai berikut:

12
Sumber: G. Verbeke, S. Fieuws, G. Molenberghs, and M. Davidian, “Statistical
Methods in Medical Research,” 2014
Gambar 2. 3 garis regresi

Adapun estipasi pada 𝛼 dan 𝛽 adalah sebagai berikut:


Misalkan 𝑎 dan 𝑏 menjadi parameter estimasi sebenarnya dari 𝛼 (intersep-
𝑦) dan 𝛽 (kemiringan). Dapat diketahui bahwa:
𝐿𝑥𝑦
𝑏=
𝐿𝑥𝑥
Sebagai estimator untuk 𝛽 dan
̅ − 𝒃𝒙
𝒂=𝒚 ̅
Sebagai estimator 𝛼. Maka estimasi regresi gari adalah sebgai berikut:
𝑦̂ = 𝑎 + 𝑏𝑥
Dimana 𝑎 dan 𝑏 adalah estimator kuadrat terkecil, karena keduanya
meminimalkan jumlah jarak kuadrat antara 𝑦𝑖 yag diamati dan 𝑦̂𝑖 yang
diperkirakan.[6]

2.3 Data longitudinal

Data adalah hal yang paling penting dalam sebuah penelitian dan merupakan
sumber informasi. Secara umum, data berdasarkan waktu pengambilannya yaitu
cross-section dan data time series. Data cross section adalah data yang

13
pengambilannya pada waktu tertentu sesuai dengan tujuan penelitiannya,
contohnya yaitu data sensus, data penelitian yang menggunakan kuesioner dan
lain-lain. Sedangkan data time series adalah data yang pengambilannya dari waktu
ke waktu secara berkala untuk melihat perkembangan suatu kejadian atau kegiatan
selama periode tersebut. Gabungan dari data cross-section dan data time series
adalah data longitudinal.[7]
Data longitudinal adalah data yang diperoleh dari pengamatan terhadap
beberapa objek lebih dari satu kali pada waktu yang berbeda. Analisi data
longitudinal merupakan gabungan dari analisis regresi dan time-series. Penelitian
yang menghasilkan data longitudinal sering dilakukan pada bidang kesehatan.
Contohnya pengukuran kadar trombosit selama t hari pada n pasien DBD. Selain
dibidang kesehatan, data longitudinal juga digunakan dalam bidang ekonomi,
pendidikan dan sebagainya. Data longitudinal ini biasanya digunakan untuk
mengetahui perubahan subjek penelitian setelah periode waktu tertentu[7].
Dalam studi longitudinal mempelajari perubahan respon antar waktu beserta
faktor-faktor yang mempengaruhi perubahan tersebut, baik pada level populasi
maupun level individu. Data longitudinal ditandai dengan adanya fakta bahwa
pengamatan berulang dalam subyek yang sama cenderung berkorelasi (Zeger et al.
1988), sehingga model-model untuk analisis data longitudinal harus mengenali
hubungan antara pengamatan berkala dalam subyek yang sama (Laird & Ware
1982). Korelasi antar pengamatan berulang dapat dimodelkan secara eksplisit
(melalui pola matriks kovarian), maupun secara implisit (melalui pengaruh
acak).[8]
Untuk memodelkan keheterogenan antar subyek, ada dua pendekatan dalam
analisis data longitudinal (Zeger et al. 1988). Pertama dengan memodelkan
keheterogenan secara eksplisit, dikenal sebagai pendekatan spesifik subyek,
misalnya melalui model campuran dimana pengaruh spesifik subyek diasumsikan
mengikuti suatu sebaran parametrik tertentu. Untuk data longitudinal kontinu,
model linear campuran dari Laird dan Ware (1982) merupakan model yang sering
digunakan. Kedua, respon rataan populasi dapat dimodelkan sebagai fungsi dari
kovariat tanpa secara eksplisit memperhitungkan keheterogenan dari subyek ke
subyek. Pendekatan ini dikenal sebagai model rataan populasi.[8]

14
Dalam pendekatan ini, matriks kovarian dari peubah respon secara langsung
dimodelkan melalui struktur kovarian bagi galat intra-subyek. Model spesifik
subyek dikenal juga sebagai model bersyarat, sedangkan model rataan populasi
sering disebut model marginal (Pinheiro 2006). Perbedaan mendasar dari kedua
model di atas adalah model spesifik subyek memungkinkan inferensi terhadap
subyek tertentu, sedangkan pada model rataan populasi tidak.
Menurut Gujarati (2004), model longitudinal secara umum dapat
dinyatakapada persamaan berikut:[9]

𝑌𝑖𝑡 = 𝛼𝑖 + 𝛽𝑖 𝑋𝑖 + 𝜀𝑖𝑡
Dimana :
𝑌𝑖𝑡 : Nilai variabel dependen unit respon ke-𝑖 dan unit waktu ke-𝑡
𝑋𝑖 : nilai variabel independen unit respon ke-𝑖 dan unit waktu ke-𝑡
𝛼𝑖 , 𝛽𝑖 :koefisien regresi unit respon ke-𝑖 dan unit waktu ke-𝑡
𝜀𝑖𝑡 :galat untuk repon ke-𝑖 dan unit waktu ke-𝑡
Contoh desain data longitudinal juga dapat disusun dalam bentuk tabel
berikut:
Tabel 2. 4 struktur data longitudinal untuk k variabel independen

Variabel variabel Variabel


Respon (𝒊) Waktu (𝒕) dependen independen ⋯ Independen
(𝒀𝒊𝒕 ) (𝑿𝟏𝒊𝒕 ) (𝑿𝒌𝒊𝒕 )
1 1 𝑌11 𝑋111 ⋯ 𝑿𝒌𝟏𝟏
1 2 𝑌12 𝑋112 ⋯ 𝑿𝒌𝟏𝟐
⋮ ⋮ ⋮ ⋮ ⋯ ⋮
1 𝑇 𝑌1𝑇 𝑋11𝑇 ⋯ 𝑿𝒌𝟏𝑻
2 1 𝑌21 𝑋121 ⋯ 𝑿𝒌𝟐𝟏
2 2 𝑌22 𝑋122 ⋯ 𝑿𝒌𝟐𝟐
⋮ ⋮ ⋮ ⋮ ⋯ ⋮
2 𝑇 𝑌2𝑇 𝑋12𝑇 ⋯ 𝑿𝒌𝟐𝑻
⋮ ⋮ ⋮ ⋮ ⋮ ⋮
⋮ ⋮ ⋮ ⋮ ⋯ ⋮
⋮ ⋮ ⋮ ⋮ ⋯ ⋮

15
𝑁 1 𝑌𝑁1 𝑋1𝑁1 ⋯ 𝑿𝒌𝑵𝟏
𝑁 2 𝑌𝑁2 𝑋1𝑁2 ⋯ 𝑿𝒌𝑵𝟐
⋮ ⋮ ⋮ ⋮ ⋯ ⋮
𝑁 𝑇 𝑌𝑁𝑇 𝑋1𝑁𝑇 ⋯ 𝑋𝑘𝑁𝑇
Sumber : Ghozali (2009:9) dan Widarjono (2010:5)

Data longitudinal memiliki kelebihan dibandingkan dengan data cross


section dan time series. Hsio dan klevmarken menyebutkan beberapa kelebihan
data longitudinal[9]
1. Dapat mengontrol individual heterogenity.
2. Memberikan data yang lebih informatif, lebih bervariasi, mengurangi
kolinearitas antar peubah, memperbesar derajat kebebasan, dan lebih efisien.
3. Dapat dipelajari suatu bentuk perubahan yang dinamis.
4. Data longitudinal dapat mendeteksi dan mengukur efek suatu data yang
tidak dapat diukur oleh data time series dan cross sectional.
5. Data longitudinal juga dapat digunakan untuk mempelajari model-model
prilaku.
Data alongitudinal juga memiliki keterbatasan salah satunya yaitu akan
menyebabkan bias jika pengamatan tidak dipantau dengan lengkap sehingga
kesimpulan penelitian tidak dapat mewakili keadaan yang sebenernya pada
populasi [7]. Data longitudinal juga biasanya memakan waktu yang lama dan dana
yang digunakan sangat besar namun informasi yang dihasilkan lebih lengkap.

2.4 Model data longitudinal multivariat

Model data longitudinal multivariat merupakan kelanjutan dari model data


longitudinal univariat, tetapi untuk lebih dari satu hasil. Setiap individu i memiliki
vektor respon yang berbeda, 𝑘 = 1,2, … 𝐾.Setiap individu diukur pada waktu dan
kesempatan yang berbeda, 𝑗 = 1,2, … , Ji dan memiliki ukuran ni = Ji K. Misalkan
dengan K model untuk beberapa waktu, maka dapat dimodelkan sebagai berikut:

16
𝑦111 𝑦112 𝑦11𝐾 1
1 ⋯
𝑦121 𝑦122 𝑦12𝐾 2
1 ⋯
⋮ ⋮ ⋮ ⋮ ⋮

1 𝑦1𝐽1 𝑦1𝐽2 𝑦1𝐽𝐾 J

2 𝑦211 𝑦212 ⋯ 𝑦21𝐾 1
2 𝑦221 𝑦222 ⋯ 𝑦22𝐾 2
⋮ ⋮ ⋮ ⋱ ⋮ ⋮
⋮ ⋮ ⋮ ⋱ ⋮ ⋮
𝑦𝑁11 𝑦𝑁12 ⋯ 𝑦𝑁1𝐾
𝑁 1
𝑦𝑁21 𝑦𝑁22 ⋯ 𝑦𝑁2𝐾
𝑁 ⋱ 2
⋮ ⋮ ⋮ ⋮ ⋮
(𝑁) ( 𝑦𝑁𝐽1 ⋯
𝑦𝑁𝐽2 𝑦𝑁𝐽𝐾 ) ( J )
Tabel 2.5 Struktur data longitudinal multivariat

Untuk menyederhanakan notasi diatas, dengan memisalkan Ji sebagai J yang


merupakan jumlah kunjungan atas semua pengamatan, maka vektor respon pada
respon i adalah:
T
𝑌𝑖 = {𝑌𝑖11, 𝑌𝑖21, … , 𝑌𝑖𝐽1, 𝑌𝑖12, 𝑌𝑖22, 𝑌𝑖32, … , 𝑌𝑖𝐽2, … … … 𝑌𝑖1𝐾, 𝑌𝑖2𝐾, … , 𝑌𝑖𝐽𝐾 }
Untuk estimasi data longitudinal multivariat diatas, diasumsikan kasus
sedehana Data longitudinal multivariat digunakan saat memodelkan data
longitudinal berdimensi tinggi dan melibatkan lebih dari satu variabel.Data
longitudinal multivariat digunakan untuk menilai hubungan antara beberapa
kovariat dan semua hasil secara bersamaan, dalam mempelajari bagaimana
hubungan antara berbagai hasil yang berkembang dari waktu ke waktu, atau
dalam menyelidiki hubungan antara perubahan semua hasil.[14]
Misalkan 𝒀𝟏 , 𝒀𝟐 , … , 𝒀𝒎 menunjukan m vektor yang berisi pengukuran
longitudinal untuk m hasil dan misalkan 𝒀𝒌 (𝑡), 𝑖 = 1,2, … , 𝑚 menunjukan
pengukuran untuk data ke-𝑘 pada waktu 𝑡, 𝒀(𝒕) menunjukan semua vektor hasil
pada waktu 𝑡.
Dengan
𝑌 = 𝛼 + 𝑋𝛽 + 𝜀
Keterangan :
Α : sebuah vektor intercep pada m
X : matriks 𝑚 × 𝑟 yang memuat faktor (umum)
Β :vektor r-dimensi acak dari skor pada variabel laten
𝜀 : vektor m dimensi komponen kesalahan klasik

17
Pertimbangkan vektor d-dimensi pengamatan Y, direkam pada waktu yang
sama-sama t = 1 ,. . . , n, dan menunjukkan vektor data lengkap oleh:
𝒀𝑻𝟏
𝒀= [ ⋮ ]
𝒀𝑻𝒏

Misalkan 𝜽𝒕 adalah proses univariat laten dan vektor 𝜃 ditunjukan oleh:


𝜃1
𝜃
𝜽 = [ 2]

𝜃𝑛

Dimana 𝜽 adalah variabel inisial. Dengan mengansumsikan bahwa


komponen n pada 𝒀 adalah kondisi independen yang dipengaruhi 𝜽, dan distribusi
𝒀𝑖 bergantung pada 𝜃𝑡 . Misalkan 𝒙𝒕 ∈ 𝑹𝒌 dan 𝒛𝒕 ∈ 𝑹𝒍 dua vektor yang berbeda
dengan variasi kovariat waktu yang berbeda, yang masing-masing berisi kovariat
jangka pendek dan jangka panjang.
Distribusi bersyarat ke- 𝑖 dari 𝒀𝑖 , diberikan 𝜃𝑡 , diasumsikan mengikuti
model dispersi eksponensial Tweedie,[15]
𝑣𝑖2
𝒀𝒊𝒕 | 𝜃𝑡 ~ 𝑇𝑤𝑝𝑖 (𝑎𝑖𝑡 𝜃𝑡 , 𝑝𝑖−1 )
𝜃𝑡
, untuk 𝑖 = 1, … , 𝑑, 𝑡 = 1,2, … , 𝑛 dimana
𝑎𝑖𝑡 = 𝐞𝐱𝐩(𝒙𝑻𝒊 𝜶𝒊 )
𝒀𝒊𝒕 kovariat jangka pendek yang relatif terhadap 𝜃𝑡 , parameter regresi 𝜶𝒊 ∈
𝑹𝒌 dapat bervariasi diantara 𝑑 kategori. Notasi 𝑇𝑤𝑝𝑖 (𝜇, 𝜎 2 ) menunjukan model
tweedie dengan parameter 𝑝, diaman 𝑝𝑖 harus memenuhi 𝑝𝑖 ≥ atau 𝑝𝑖 ≤ 0
diketahui, tetapi dapat bervariasi dari kategori ke kategori, yang memungkinkan
setiap kategori memiliki distribusi yang berbeda [15]. Parameter 𝑣𝑖2 , adalah
parameter dispersi, sehingga ketika dalam kasus 𝑝𝑖 yang sama, kategori 𝑑 dapat
memiliki dispersi yang berbeda.

18
2.5 Analisis regresi

Secara umum, analisis regresi berkenaan dengan studi ketergantungan suatu


variabel, yaitu variabel tak bebas (dependent variable) dengan satu atau lebih
variabel lain, yaitu variabel bebas (Independent variable), dengan maksud
menduga dan atau meramalkan nilai rata-rata hitung (mean) rata-rata (populasi)
dari variabel tak bebas. Secara singkatnya, analissi regresi adalah alat ukur yang
digunakan untuk mengetahui ada tidaknya korelasi antarvariabel. [10]
Menurut Supranto (1994), hubungan fungsi antara variabel 𝑋 (Variabel
bebas) dan 𝑌 (variabel tak bebas) tidak selalu bersifat linier, bisa juga bukan linear
(nonlinier). Untuk hubungan linier didekati dengan garis lurus sedangkan untuk
hubungan yang bersifat nonliniee didekati dengan garis lengkung. Analisis regresi
lebih akurat dalam analisis korelasi karena tingkat perubahan suatu variabel
terhadap variabel lainnya dapat ditentukan. Jadi pada regresi, estimasi atau
perkiraan nilai variabel tak bebas pada nilai variabel bebas lebih akurat pula.
Adapun tujuan analisis regresi adalah untuk mendapatkan estimasi dari suatu
variabel dengan menggunakan variabel lain yang telah diketahui.[10]
Sedangkan regresi linier adalah regresi yang variabel bebasnya (Variabel X)
berpangkat paling tinggi satu. Menurut Firdaus (2004), analisis regresi linear
dibedakan menjadi yaitu Analisis regresi sederhana (simple regression analysis)
atau regresi dua variabel dan regresi berganda (multiple regression analysis)
Secara umum analsis regresi linier dapat ditulisakan sebagai berikut:
Y = a + bX
Keterangan :
Y = Variabel terikat (dependent variable)
X = Variabel bebas (independent variable)
𝑎 = Intersep/konstanta
𝑏 = Koefisien regresi/slop/kemiringan
Persamaan (2.12) diatas juga dapat disajikan dalam bentuk:
∑ xy
Y=( )𝑥
∑ x2
Untuk menentukan nilai a dan b pada persamaan diatas adalah sebagai
berikut:

19
(∑ Y)(∑ X 2 ) − (∑ X)(∑ XY)
𝑎=
(𝑛)(∑ X 2 ) − (∑ X)2
(𝑛)(∑ XY) − (∑ X)(∑ Y)
𝑏=
(𝑛)(∑ X 2 ) − (∑ X)2
Sedangkan pendekatan dengan matriks adalah sebagai berikut:

𝑛 ∑X 𝑎 ∑Y
( )( ) = ( )
2 𝑏
∑X ∑X ∑ XY

Dengan
det 𝐴1
𝑎=
det 𝐴
det 𝐴2
𝑏=
det 𝐴

𝑛 ∑X
𝐴=( )
∑ X ∑ X2

∑Y ∑X
𝐴1 = ( )
2
∑X𝑌 ∑X

∑n ∑Y
𝐴2 = ( )
∑ X ∑ 𝑋𝑌

det 𝐴 = (∑ 𝑛) (∑ X 2 ) − (∑ X) (∑ X)

det 𝐴1 = (∑ Y) (∑ X 2 ) − (∑ XY) (∑ X)

det 𝐴2 = (∑ n) (∑ XY) − (∑ X) (∑ Y)

Sehingga
(𝑛)(∑ XY) − (∑ X)(∑ Y)
𝑏=
(𝑛)(∑ X 2 ) − (∑ X)2
𝑎 = 𝑌̅ − 𝑏𝑋̅
Adapun koefisisen determinasi (R2 ) dapat dicari dengan persamaan sebagai
berikut:

20
2
((𝑛)(∑ XY) − (∑ X)(∑ Y))
R2 =
(𝑛(∑ X 2 ) − (∑ X)2 )(𝑛(∑ Y 2 ) − (∑ Y)2 )
Sehingga memiliki selisih taksir standar (standar deviasi). Adapun
rinciannya sebagai berikut:
1. Angka indeks digunakan untuk mengukur ketepatan suatau penduga atau
mengukur jumlah variasi titik-titik observasi disekitar garis regresi.
2. Jika semua titik observasi berada tepat pada garis regresi, selisih taksir
standar sama dengan nol.
3. Selisih taksir standar berguna mengetahui batasan seberapa jauh melesetnya
perkiraan dalam meramal data.
Adapun persamaan untuk menentukan selisih taksir standar (standar deviasi)
adalah sebagai berikut:

∑(𝑌 − 𝑌′)2
𝑆𝑦/𝑥 = 𝑆𝑥.𝑦 = 𝑆𝑒 = √
𝑛−2
Atau

∑(𝑋 − 𝑋′)2
𝑆𝑥/𝑦 = 𝑆𝑦.𝑥 = 𝑆𝑒 = √
𝑛−2

Keterangan:
𝑆𝑦/𝑥 = 𝑆𝑥/𝑦 = Standar Deviasi
𝑌= 𝑋 = Nilai Variabel Sebenarnya
𝑌 ′ = 𝑋′ = Nilai Variabel Yang Ditaksir
𝑛 = Jumlah Frekuensi

1. Analisis regresi sederhana (simple regression analysis) atau regresi dua


variabel, yang mempelajari ketergantungan satu variabel tak bebas hanya
pada satu variabel bebas

2.5.1 Analisis regresi sederhana (simple regression analysis) dan analisis

berganda (multiple regression analysis)

Analisis regresi sederhana (simple regression analysis) atau regresi


dua variabel, mempelajari hubungan satu variabel bebas dengan satu

21
variabel tak bebas. Model regresi linier sederhana ini dapat dirumuskan
sebagai berikut:
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝜀𝑖 ; 𝑖 = 1,2, … 𝑛
Keterangan:
𝑌𝑖 = Variabel tak bebas (dependent variable)
𝑋𝑖 = Variabel bebas (independent variable)
𝛽0 = Parameter konstanta/regresi yang tidak diketahui nilainya
𝛽1 = Parameter koefisien regresi yang tidak diketahui nilainya
𝜀 = Variabel galat/kesalahan regresi
𝑛 = Banyaknya data observasi
Adapun analisis regresi berganda (multiple regression analysis) atau
regresi lebih dari dua variabel, mempelajari hubungan variabel tak bebas
pada lebih dari satu variabel bebas. Adapun rumusan untuk regresi berganda
adalah sebagai berikut:
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋1 + 𝛽2 𝑋2 + ⋯ + 𝛽𝑘 𝑋𝑘 + 𝜀𝑖 ; 𝑖 = 1,2, … 𝑛
Keterangan:
𝑌𝑖 = Variabel tak bebas (dependent variable)
𝑋𝑖 = Variabel bebas (independent variable)
𝛽0 = Parameter konstanta/regresi yang tidak diketahui nilainya
𝛽𝑘 = Parameter koefisien regresi yang tidak diketahui nilainya
𝑘 = Banyaknya variabel bebas/faktor
𝜀 = Variabel galat/kesalahan regresi
𝑛 = Banyaknya data observasi

2.5.2 Model regresi dalam pendekatan matriks

Model regresi yang paling sederhana adalah model linier. Model ini
terdiri dari satu variabel bebas. Model tersebut dapat digeneralisasikan
menjadi lebih dari satu dalam variabel bebas. Persamaan model regresi
linier dengan variabel bebas diberikan sebagai berikut (Sembiring,1995):
𝑌 = 𝛽0 + 𝛽1 𝑋1 + 𝛽2 𝑋2 + ⋯ + 𝛽𝑘 𝑋𝑘 + 𝜀

22
Dan Pernyataan Diatas dapat Dinyatakan menjadi persamaan sebagai
berikut:
𝑌 = 𝛽0 + 𝛽1 𝑋𝑖1 + 𝛽2 𝑋𝑖2 + ⋯ + 𝛽𝑘 𝑋𝑖𝑘 + 𝜀𝑖 𝑖 = 1,2, … 𝑛
Jika persamaan diatas dinotasikan dalam bentuk matriks, maka persamaan
sebagai berikut:
𝛽0
𝑌2 1 X11 X12 ⋯ X1k 𝜀0
𝛽1 𝜀1
𝑌 1 X21 X22 ⋯ X2k
[ 2] = [ ] 𝛽2 + [ ⋮ ] (2.6)
⋮ ⋮ ⋮ ⋮ ⋱ ⋮
⋮ 𝜀𝑛
𝑌𝑛 1 Xn1 Xn2 ⋯ Xnk
[𝛽𝑘 ]
Misalkan
𝛽0
𝑌2 1 X11 X12 ⋯ X1k 𝜀0
𝛽1 𝜀1
𝑌2 1 X21 X22 ⋯ X2k
𝑌 = [ ]; 𝑋 = [ ] ; 𝛽 = 𝛽2 ; 𝜀 = [ ⋮ ]
⋮ ⋮ ⋮ ⋮ ⋱ ⋮
⋮ 𝜀𝑛
𝑌𝑛 1 Xn1 Xn2 ⋯ Xnk
[𝛽𝑘 ]
Sehingga persamaan (2.6) tersebut dapat dinyatakan sebagai berikut:
𝒀=𝑿𝜷+ 𝜺
Keterangan :
𝒀 = Vektor respon (𝑛 × 1)
𝑿 = Matrik peubah bebas (𝑛 × 𝑘)
𝜷 = Vektor parameter (𝑘 × 1)
𝜺 = Vektor galat/error (𝑛 × 1)

2.6 Model Regresi longitudinal

Data longitudinal adalah data yang merupakan hasil dari pengamatan pada
beberapa individu (cross-sectional unit) yang masing-masing diamati dalam
beberapa periode waktu berurutan (timeseries unit) (Baltagi, 2005). Menurut
Wanner & Pevalin sebagaimana dikutip oleh Sembodo (2013) menyebutkan
bahwa regresi longitudinal merupakan sekumpulan teknik untuk memodelkan
pengaruh peubah penjelas terhadap peubah respon pada data longitudinal. Ada
beberapa model regresi longitudinal, salah satunya adalah model dengan slope
konstan dan intercept bervariasi. Model regresi longitudinal yang hanya
dipengaruhi oleh salah satu unit saja (cross-sectional unit atau timeseries unit)
disebut model komponen satu arah, sedangkan model regresi longitudinal yang

23
dipengaruhi oleh kedua unit (cross-sectional unit atau timeseries unit) disebut
model komponen dua arah. Secara umum terdapat dua pendekatan yang
digunakan dalam estimasi model dari data longitudinal yaitu model tanpa
pengaruh individu (common effect) dan model dengan pengaruh individu (fixed
effect dan random effect).[11]
Menurut Jaya & Sunengsih (2009), analisis regresi data longitudinal adalah
analisis regresi yang mengamati hubungan antara satu variabel tak bebas
(dependent variable) dengan satu atau lebih variabel bebas (independent
variable). [11]
Model 1: semua koefisien baik intercept maupun slope koefisien konstan
𝑲

𝒀𝒊𝒕 = 𝜷𝟏 + ∑ 𝜷𝒌 𝑿𝒌𝒊𝒕 + 𝜺𝒊𝒕


𝒌=𝟐

Model 2: slope koefisien konstan, tetapi intercept berbeda akibat perbedaan


unit cross section.
𝑲

𝒀𝒊𝒕 = 𝜷𝟏𝒊 + ∑ 𝜷𝒌 𝑿𝒌𝒊𝒕 + 𝜺𝒊𝒕


𝒌=𝟐

Model 3: slope koefisien konstan, tetapi intercept berbeda akibat perbedaan


unit cross section dan berubahnya waktu.
𝑲

𝒀𝒊𝒕 = 𝜷𝟏𝒊𝒕 + ∑ 𝜷𝒌 𝑿𝒌𝒊𝒕 + 𝜺𝒊𝒕


𝒌=𝟐

Model 4: intercept dan slope koefisien berbeda akibat perbedaan unit cross
section.
𝑲

𝒀𝒊𝒕 = 𝜷𝟏𝒊 + ∑ 𝜷𝒌𝒊 𝑿𝒌𝒊𝒕 + 𝜺𝒊𝒕


𝒌=𝟐

Model 5: intercept dan slope koefisien berbeda akibat perbedaan unit cross
section dan berubahnya waktu
𝑲

𝒀𝒊𝒕 = 𝜷𝟏𝒊𝒕 + ∑ 𝜷𝒌𝒊𝒕 𝑿𝒌𝒊𝒕 + 𝜺𝒊𝒕


𝒌=𝟐

Dengan, 𝑖 = 1,2, … , 𝑁

24
𝑡 = 1,2, … , 𝑇
𝑁 : Banyak unit cross section
𝑇 : Banyak data time series
𝒀𝒊𝒕 : Nilai variabel tak bebas cross section ke- 𝑖
𝑿𝒊𝒕 : Nilai variabel bebas ke- 𝑘 untuk cross section ke- 𝑖 tahun
ke- 𝑡
𝜷𝒊𝒕 : Parameter yang ditaksir
𝜺𝒊𝒕 : Error populasi
𝐾 : Banyaknya parameter regresi yang ditaksir

2.6.1 Common Effect Model (CEM)

Menurut Baltagi (2005) model tanpa pengaruh individu (common

effect) adalah pendugaan yang menggabungkan seluruh data time series dan

cross section dan menggunakan pendekatan OLS (Ordinary Least Square)

untuk menduga parameternya. Metode OLS merupakan salah satu metode

populer untuk menduga nilai parameter dalam persamaan regresi linear.

Secara umum, persamaan modelnya dituliskan sebagai berikut:

𝒀𝒊𝒕 = 𝜶 + 𝜷𝑿𝒊𝒕 + 𝜺𝒊𝒕

Dengan,

𝒀𝒊𝒕 : Variabel respon pada unit observasi ke- 𝑖 dan waktu ke- 𝑡

Variabel prediktor pada unit observasi ke- 𝑖 dan waktu ke-


𝑿𝒊𝒕
:
𝑡

𝜷 Koefisien slope atau koefisien arah


:
𝜶 Intercept model regresi
:
𝜺𝒊𝒕 Galat atau komponen error pada unit observasi ke- 𝑖 dan
:

25
waktu ke- 𝑡

Ordinary Least Square (OLS)

Menurut Nachrowi & Usman (2006, 312) bahwa data longitudinal l

akan mempunyai observasi lebih banyak dibanding data cross section atau

time series saja. Akibatnya, ketika data digabungkan menjadi pooled data

untuk membuat regresi, maka hasilnya cenderung akan lebih baik dibanding

regresi yang hanya menggunakan data cross section atau time series saja.

Dengan model sebagai berikut:

𝒀𝒊𝒕 = 𝜶 + 𝜷𝑿𝒊𝒕 + 𝜺𝒊𝒕 : 𝑖 = 1,2, … , 𝑁; 𝑡 = 1,2, … , 𝑇

Bila 𝑐𝑜𝑣(𝜺𝒊𝒕 , 𝜺𝒋𝒕 ) = 0; 𝑐𝑜𝑣(𝜺𝒊𝒕 , 𝜺𝒊𝒕−𝟏 ) = 0; 𝐸 (𝜺𝒊𝒕 ) = 0; 𝑣𝑎𝑟(𝜺𝒊𝒕 ) =

𝜎 2 , dapat diestimasikan model tersebut dengan memisahkan waktunya

sehingga ada 𝑇 regresi dengan 𝑁 pengamatan. Atau dapat ditulis sebagai

berikut:

𝒀𝒊𝟏 = 𝜶 + 𝜷𝑿𝒊𝟏 + 𝜺𝒊𝟏 ; 𝑖 = 1,2, … , 𝑁


𝒀𝒊𝟐 = 𝜶 + 𝜷𝑿𝒊𝟐 + 𝜺𝒊𝟐

𝒀𝒊𝑻 = 𝜶 + 𝜷𝑿𝒊𝑻 + 𝜺𝒊𝑻
Model juga dapat diestimasi dengan memisahkan cross section-nya

sehingga didapat 𝑁 regresi dengan masing-masing 𝑇 pengamatan. Atau

dapat ditulis dengan:

𝑖 = 1; 𝒀𝟏𝒕 = 𝜶 + 𝜷𝑿𝟏𝒕 + 𝜺𝟏𝒕 ; 𝑡 = 1,2, … , 𝑇

𝑖 = 𝟐; 𝒀𝟐𝒕 = 𝜶 + 𝜷𝑿𝟐𝒕 + 𝜺𝟐𝒕

𝑖 = 𝑵; 𝒀𝑵𝒕 = 𝜶 + 𝜷𝑿𝑵𝒕 + 𝜺𝑵𝒕

26
Bila diasumsikan bahwa 𝜶 dan 𝜷 akan sama (konstan) untuk setiap

data time series dan cross section, maka 𝜶 dan 𝜷 dapat diestimasi dengan

model berikut, dengan menggunakan 𝑁 × 𝑇 pengamatan.

𝒀𝟏𝒕 = 𝜶 + 𝜷𝑿𝟏𝒕 + 𝜺𝟏𝒕 ; 𝑖 = 1,2, … , 𝑁; 𝑡 = 1,2, … , 𝑇

2.6.2 Fixed Effect Model (FEM)

Pendugaan parameter regresi longitudinal dengan Fixed Effect Model


menggunakan teknik penambahan variabel dummy sehingga metode ini
seringkali disebut dengan Least Square Dummy Variable model. Persamaan
regresi pada Fixed Effect Model adalah:
𝑵

𝒀𝒊𝒕 = 𝜶𝟏 + ∑ 𝒂𝒌𝒊 𝑫𝒌𝒊 + 𝜷𝑿𝒊𝒕 + 𝜺𝒊𝒕


𝒌=𝟐

Gujarati (2004) mengatakan bahwa pada Fixed Effect Model


diasumsikan bahwa koefisien slope bernilai konstan tetapi intercept bersifat
tidak konstan. [11]
Least Square Dummy Variable (LSDV)
Menurut Greene (2007), secara umum pendugaan parameter model
efek tetap dilakukan dengan LSDV (Least Square Dummy Variable),
dimana LSDV merupakan suatu metode yang dipakai dalam pendugaan
parameter regresi linear dengan menggunakan Metode Kuadrat Terkecil
(MKT) model melibatkan variabel Dummy sebagai salah satu variabel
prediktornya. MKT merupakan teknik penentuan garis lurus terbaik untuk
menghubungkan variabel prediktor (𝑋) dan variabel respon (𝑌) . Berikut.
adalah prinsip dasar MKT:
𝑢 = 𝑌 − 𝑋𝛽
Sehingga didapatkan jumlah kuadrat galat sebagai berikut:
𝑢′𝑢 = (𝑌 − 𝑋𝛽 )′ (𝑌 − 𝑋𝛽 )
= 𝑌 ′ 𝑌 − 𝛽 ′ 𝑋 ′ 𝑌 − 𝑌′𝑋𝛽 + 𝛽′𝑋′𝑋𝛽
= 𝑌 ′ 𝑌 − 2 𝛽′𝑋′𝑌′ + 𝛽′𝑋′𝑋𝛽

27
Dimana, jika matriks transpose (𝑋𝛽 )′ = 𝑋′𝛽′ , maka scalar 𝛽 ′ 𝑋 ′ 𝑌 =
𝑌′𝑋𝛽. Untuk mendapatkan penduga parameter 𝛽 yang menyebabkan jumlah
kuadrat galat minimum, yaitu dengan cara menurunkan persamaan (2.48)
terhadap parameter 𝛽 yang kemudian hasil turunan tersebut disamakan
dengan nol atau
𝜕(𝑢′𝑢)
=0
𝜕𝛽
sehingga diperoleh:
𝜕(𝑌 ′ 𝑌 − 2 𝛽′𝑋′𝑌 + 𝛽′𝑋′𝑋𝛽 )
=0
𝜕𝛽
−2𝑋 ′ 𝑌 + 2𝑋 ′ 𝑋𝛽̂ = 0

2𝑋 ′ 𝑋𝛽̂ = 2𝑋 ′ 𝑌

𝑋 ′ 𝑋𝛽̂ = 𝑋 ′ 𝑌

(𝑋 ′ 𝑋)−1 (𝑋 ′ 𝑋𝛽̂ ) = (𝑋 ′ 𝑋)−1 𝑋 ′ 𝑌

𝛽̂ = (𝑋 ′ 𝑋)−1 𝑋 ′ 𝑌 (2.7)

Pada pemodelan efek tetap, variabel dummy yang dibentuk adalah


sebanyak (𝑁 − 1), sehingga model yang akan diestimasi dalam pemodelan
efek tetap adalah sebagai berikut:
𝑌𝑖𝑡 = 𝛼 + 𝛼1 𝐷1𝑖𝑡 + ⋯ + 𝛼𝑁 𝐷(𝑁−1)𝑖𝑡 𝛽𝑋𝑖𝑡 + 𝑢𝑖𝑡
Sedangkan untuk pemodelan efek tetap waktu, variabel dummy yang
dibentuk bedasarkan unit waktu, dimana variabel boneka yang terbentuk
yang terbentuk sebanyak 𝑇 − 1 , sehingga model yang akan diduga dalam
pemodelan efek tetap waktu adalah sebagai berikut:
𝑌𝑖𝑡 = 𝛼 + 𝛼1 𝐷1𝑖𝑡 + ⋯ + 𝛼 𝑇 𝐷(𝑇−1)𝑖𝑡 𝛽𝑋𝑖𝑡 + 𝑢𝑖𝑡
Hun (2005) juga mengemukakan bahwa pada model regresi
longitudinal dengan intercept bervariasi dan slope konstan, pemodelan efek
tetap komponen dua arah secara umum dilakukan dengan Least Square
Dummy Variable (LSDV) dimana model dengan peubah dummy seperti
berikut:

28
𝑌𝑖𝑡 = 𝛼 + 𝛾1 𝐷1𝑖𝑡 + ⋯ + 𝛾𝑁 𝐷(𝑁−1)𝑖𝑡 + 𝛿1 𝐷1𝑖𝑡 + ⋯
+ 𝛿𝑇 𝐷(𝑇−1)𝑖𝑡 𝛽𝑋𝑖𝑡 + 𝑢𝑖𝑡
Dengan 𝐷𝑗𝑖𝑡 = 𝑝𝑒𝑢𝑏𝑎ℎ 𝑑𝑢𝑚𝑚𝑦 𝑘𝑒 − 𝑗 (𝑗 = 1,2, … , (𝑁 − 1)) unit cross-
sectional ke-𝑖 dan unit waktu ke-𝑡. 𝐷𝑗𝑖𝑡 Bernilai 1 jika 𝑗 = 𝑖 dan bernilai 0
jika 𝑗 ≠ 𝑖.
𝐷𝑘𝑖𝑡 = 𝑝𝑒𝑢𝑏𝑎ℎ 𝑑𝑢𝑚𝑚𝑦 𝑘𝑒 − 𝑘(𝑘 = 1,2, … , (𝑇 − 1)) unit cross-section ke-
𝑖 dan unit waktu ke-𝑡. 𝐷𝑘𝑖𝑡 Bernilai 1 jika 𝑘 = 𝑖 dan bernilai 0 jika 𝑘 ≠ 𝑖.
𝑎𝑗= rata-rata peubah respon jika peubah dummy ke-𝑗 bernilai satu dan peubah
penjelas bernilai 0. 𝑎𝑘= rata-rata peubah respon jika peubah dummy ke-𝑘
bernilai satu dan peubah penjelas bernilai 0.

2.6.3 Random Effect Model (REM)

Menurut Nachrowi & Usman (2006, 315) sebagaimana telah diketahui


bahwa pada Model Efek Tetap (MET), perbedaan karakteristik-karakteristik
individu dan waktu diakomodasikan pada intercept sehingga intercept-nya
berubah antar waktu. Sementara Model Efek Random (MER) perbedaan
karakteristik individu dan waktu diakomodasikan pada error dari model.
Mengingat ada dua komponen yang mempunyai kontribusi pada
pembentukan error, yaitu individu dan waktu, maka random error pada
MER juga perlu diurai menjadi error untuk komponen waktu dan error
gabungan. Dengan demikian persamaan MER diformulasikan sebagai
berikut:
𝑌𝑛 = 𝛼 + 𝛽𝑋𝑖𝑡 + 𝜀𝑖𝑡 ; 𝜀𝑖𝑡 = 𝑢𝑖 + 𝑣𝑡 + 𝑤𝑖𝑡

Dimana,
𝑢𝑖 Komponen error cross section
𝑣𝑡 Komponen error time series
𝑤𝑖𝑡 Komponen error gabungan

Adapun asumsi yang digunakan untuk komponen error tersebut adalah:


𝑢𝑖 ~𝑁(0, 𝜎𝑢2 )
𝑣𝑡 ~𝑁(0, 𝜎𝑣2 )

29
𝑤𝑖𝑡 ~𝑁(0, 𝜎𝑤2 )
Dengan persamaan di atas, maka dapat dinyatakan bahwa MER
menganggap efek rata-rata dari data cross section dan time series
direpresentasikan dalam intercept. Sedangkan deviasi efek secara random
untuk data time series direpresentasikan dalam 𝑣𝑡 dan deviasi untuk data
cross section dinyatakan dalam 𝑢𝑖 .
𝜀𝑖𝑡 = 𝑢𝑖 + 𝑣𝑡 + 𝑤𝑖𝑡
Dengan demikian varians dari error tersebut dapat dituliskan sebagai
berikut:
𝑣𝑎𝑟(𝜀𝑖𝑡 ) = 𝜎𝑢 2 + 𝜎𝑣 2 + 𝜎𝑤 2
Hal ini tentunya berbeda dengan Model OLS yang diterapkan pada
data longitudinal (pooled data), yang mempunyai varian error sebesar:
𝑣𝑎𝑟(𝜀𝑖𝑡 ) = 𝜎𝑤 2
Dengan demikian, MER bisa diestimasi dengan OLS bila 𝜎𝑢 2 =
𝜎𝑣 2 = 0 . Jika tidak demikian, MER perlu diestimasi dengan metode lain.
Adapun metode estimasi yang digunakan adalah Generalized Least Square
(GLS).
Generalized Least Square (GLS)
Menurut Greene (1997), estimasi dapatdikatan sebagai kuadrat
terkecil yang diberlakukan secara umum atau disebut Generalized Least
Square (GLS). Random Effect Model (REM), pendugaan parameternya
dilakukan menggunakan GLS.
Pada REM ketidaklengkapan informasi untuk setiap unit cross section
dipandang sebagai error sehingga adalah bagian dari unsur gangguan. Model
REM dapat dituliskan dapat dituliskan sebagai berikut.[11]
𝐾

𝑌𝑖𝑡 = 𝛼1 + ∑ 𝛽𝑘 𝑋𝑘𝑖𝑡 + (𝜇𝑖 − 𝑒𝑛 ) (2.8)


𝑘=1

Asumsi
𝜇𝑖 ~𝑁(0, 𝜎𝜇2 )𝐸(𝜇𝑖 , 𝜇𝑗 ) = 0; 𝑖 ≠ 𝑗
𝑒𝑖𝑡 ~𝑁(0, 𝜎𝑣2 )𝐸 (𝜇𝑖 , 𝑒𝑖𝑡 ) = 0
𝐸 (𝑒𝑖𝑡 , 𝑒𝑖𝑠 ) = 𝐸(𝑒𝑖𝑡 , 𝑒𝑗𝑠 ) = 0; 𝑖 ≠ 𝑗; 𝑡 ≠ 𝑠
Misalkan

30
𝜀 = 𝑌 − 𝑋𝛽̂ , Dengan mensubstitusi persamaan (2.7) diperoleh:
𝜀 = 𝑌 − 𝑋 ( (𝑋 ′ 𝑋)−1 𝑋 ′ 𝑌)
𝜀 = (1 − 𝑋(𝑋 ′ 𝑋)−1 𝑋 ′ )𝑌 (2.9)

Sehingga model efek acak pada data longitudinal untuk 𝑛 persamaan


individu dengan masing-masing T observasi waktu dapat dituliskan sebagai
berikut:
Maka 𝑌1𝑡 = 𝛽0 + 𝛽1 𝑋11𝑡 + 𝛽2 𝑋21𝑡 + ⋯ + 𝛽𝑛 𝑋𝑛1𝑡 +
Untuk 𝑖=1
𝜇1𝑡 + 𝜀1𝑡
Maka 𝑌2𝑡 = 𝛽0 + 𝛽2 𝑋22𝑡 + 𝛽2 𝑋22𝑡 + ⋯ + 𝛽𝑛 𝑋𝑛2𝑡 +
𝑖=1
𝜇2𝑡 + 𝜀2𝑡


Maka 𝑌𝑛𝑡 = 𝛽0 + 𝛽𝑛 𝑋𝑛𝑛𝑡 + 𝛽2 𝑋2𝑛𝑡 + ⋯ + 𝛽𝑛 𝑋𝑛𝑛𝑡 +
𝑖=𝑛
𝜇𝑛𝑡 + 𝜀𝑛𝑡
Maka 𝑌11 = 𝛽0 + 𝛽1 𝑋111 + 𝛽2 𝑋211 + ⋯ + 𝛽𝑛 𝑋𝑛11 +
𝑡=1
𝜇11 + 𝜀11
Maka 𝑌12 = 𝛽0 + 𝛽1 𝑋112 + 𝛽2 𝑋212 + ⋯ + 𝛽𝑛 𝑋𝑛12 +
𝑡=1
𝜇12 + 𝜀12


Maka 𝑌1𝑛 = 𝛽0 + 𝛽1 𝑋11𝑛 + 𝛽2 𝑋21𝑛 + ⋯ + 𝛽𝑛 𝑋𝑛1𝑛 +
𝑡=𝑛
𝜇1𝑛 + 𝜀1𝑛
Sehingga model acak pada persamaan (2.8) dapat ditulis dalam
bentuk matriks sebagai berikut:
𝑌𝑛1 1 𝑋1𝑛1 ⋯ 𝑋𝑃21 𝛽0 𝜇𝑛1 𝜀𝑛1
𝑌 1 𝑋1𝑛2 ⋯ 𝑋𝑃22 𝛽1 𝜇𝑛1 𝜀𝑛2
[ 𝑛2 ] = [ ][ ]+[ ⋮ ]+[ ⋮ ]
⋮ ⋮ ⋮ ⋱ ⋮ ⋮
𝑌𝑛𝑇 1 𝑋1𝑛𝑇 ⋯ 𝑋𝑝𝑛𝑇 𝛽𝑝 𝜇𝑛𝑇 𝜀𝑛𝑡

Maka untuk individu ke- n dapat ditulis dalam bentuk:


𝑝

𝑌𝑛𝑡 = 𝛽0 + ∑ 𝛽𝑘 𝑋𝑘𝑛𝑡 + 𝜇𝑛𝑖 + 𝜀𝑛𝑡


𝑘=1

Maka :

31
𝑌 = 𝑿𝛽 + 𝜇 + 𝜀

2.7 Model Linier Campuran

Bentuk umum model linear campuran adalah


𝑢 0 𝐷 0
𝒚 = 𝑿𝜷 + 𝒁𝒖 + 𝜺 dengan [ ] ~ ([ ] , [ ])
𝜀 0 0 𝑅

Keterangan :[12]
𝒚 : vektor pengamatan berukuran 𝑛 × 1
𝒖 : Vektor efek acak berukuran 𝑟 × 1
𝜷 : Vektor efek tetap berukuran 𝑝 × 1
𝒁 : matriks rancangan efek acak berukuran 𝑛 × 𝑟
𝑿 : matriks rancangan efek tetap berukuran 𝑛 × 𝑝
𝜺 : vektor komponen sisa/error berukuran 𝑛 × 1

𝒚|𝒖 diasumsikan mengikuti sebaran tertentu dengan


𝑬(𝒚|𝒖) = 𝑿𝜷 + 𝒁𝒖

dan
𝑉𝑎𝑟 (𝒚|𝒖 ) = 𝑹
Sehingga nilai tengah dan matriks varian covarian untuk 𝒚 adalah
𝑬(𝒚) = 𝑿𝜷
Dan [12].
var(𝒚) = 𝑽 = 𝒁𝑫𝒁′ + 𝑹

2.7.1 Struktur Varian Kovaran model linear campuran

Varian kovarian banyak kita temui saat kita melakukan analisa regresi
atau rancangan percobaan. Varian atau ragam suatu peubah acak (atau
distribusi probabilitas) adalah ukuran seberapa jauh sebuah kumpulan
bilangan tersebar sedangkan Kovarian adalah istilah yang menunjukkan

32
seberapa besar perubahan dari dua variabe acak secara bersama-sama.
Residual adalah selisih antara nilai duga (predicted value) dengan nilai
pengamatan sebenarnya apabila data yang digunakan adalah data sampel.
Error adalah selisih antara nilai duga (predicted value) dengan nilai
pengamatan yang sebenarnya apabila data yang digunakan adalah data
populasi.
Adapun struktur umum varian kovarians dengan m faktor adalah
sebagai berikut:
𝒎

𝑬(𝒚|𝒖) = 𝑿𝜷 + ∑ 𝒁𝒊 𝒖𝒊
𝒊=𝟏

Keterangan :
𝑿 : matriks rancangan efek tetap
𝜷 : Efek tetap
𝒁𝒊 : matriks rancangan efek acak ke-𝑖, 𝑖 = 1,2, … , 𝑚
𝒖𝒊 : Vektor efek acak ke-𝑖, 𝑖 = 1,2, … 𝑚

𝒎 𝒎 𝒎

𝐕 = ∑ 𝒁𝒊 𝑫𝒊𝒊 𝒁′𝒊 + ∑ ∑ 𝒁𝒊 𝑫𝒊𝒊′ 𝒁′𝒊′ + 𝑹


𝒊=𝟏 𝒊=𝟏 𝒊′=𝟏

𝐙 = [𝒁𝟏 𝒁𝟐 ⋯ 𝒁𝒎 ] = {𝒁𝒊 }𝒎
𝒊=𝟏

𝒖 = {𝒖𝒊 }𝒎
𝒊=𝟏

𝑫 = 𝑣𝑎𝑟(𝒖) = {𝑫𝒊𝒊′ }𝒎
𝒊,𝒊′=𝟏

𝑫𝒊𝒊 = 𝑣𝑎𝑟(𝒖𝒊 )

𝑫𝒊𝒊′ = 𝑐𝑜𝑣 (𝒖𝒊 , 𝒖′𝒊′ )

Jika terdapat m faktor acak saling bebas, antar individu dalam faktor
acak tersebut juga bebas , dan memiliki ragam homogen, maka dapat
dituliskan sebagai berikut:
𝑚
𝑫 = {𝜎𝑖2 𝑰𝑞𝑖 }𝑖=1

33
𝒎

𝑽 = ∑ 𝒁𝒊 𝒁′𝒊 𝜎𝑖2 + 𝜎 2 𝑰𝑁
𝒊=𝟏

2.7.2 Model Campuran untuk data longitudinal

Menurut Laird dan Ware (1982) untuk kasus dengan data longitudinal
sebagai berikut:
𝐸 [𝒚𝒊 |𝒖𝒊 ] = 𝑿𝒊 𝜷 + 𝒁𝒊 𝐮𝒊
Keterangan:
𝒚𝒊 : vektor dari pengukuran pada respon 𝑘𝑒 − 𝑖
vektor dari pengaruh tetap, Nilai koefisien 𝜷 akan sama untuk
𝜷 :
setiap respon
vektor dari pengaruh acak, Nilai koefisien 𝐮𝒊 akan sama untuk
𝐮𝒊 :
setiap respon
variabel bebas yang diketahui, memodelkan bagaimana respon
𝒁𝒊 :
disusun berdasarkan waktu untuk subjek ke-i.
Misalkan ada m respon, maka :
𝒚 = {𝒚𝒊 }, 𝑿 = {𝑿𝒊 }, 𝒁 = {𝒁𝒊 }, 𝒅𝒂𝒏 𝒖 = {𝒖𝒊 },

{𝐸 [𝒚𝒊 |𝒖𝒊 ]}𝑚


𝑖=1 = 𝑬[𝒚|𝒖] = 𝑿𝜷 + 𝒁𝒖

Sehingga struktur varian yang diajukan oleh Laird dan Ware (1982)[12]:
𝑽 = 𝒁𝑫𝒁′ + 𝑹
𝑫𝒊𝒊 = 𝑫, ∀𝒊 , 𝑫𝒊𝒊′ = 𝟎, ∀𝒊≠𝒊 ,
𝐑 = {𝑹𝒊 }
𝑽 = 𝑣𝑎𝑟(𝑦) = {𝒁𝒊 𝑫𝒁′𝒊 + 𝑹𝒊 }

2.8 Estimasi model linier campuran

Terdapat beberapa kasus estimasi pada data linier campuran, diantaranya


adalah sebagai berikut:[12]

34
2.8.1 Menduga efek tetap

Untuk melakukan estimasi pada efek dengan varian (𝑉) diketahui,

dilakukan dengan menggunakan estimasi maksimum likelihood. Misalnya

𝒚~𝑵(𝑿𝜷, 𝑽), persamaan log likelihood untuk 𝒚 adalah sebagai berikut:

1 𝑁
𝒍=− 𝑙𝑜𝑔 |𝑽| − log 2𝜋
2 2
Dimana 𝜇 = 𝜇(𝜃) dan 𝑉 = 𝑉(𝜑)
𝜕𝒍 𝜕𝝁′ −1
= 𝑽 (𝒚 − 𝝁) = 0
𝜕𝜃 𝜕𝜃
Estimasi 𝜷 (dilambangkan dengan 𝛽̂ )
𝑿′ 𝑽−𝟏 (𝒚 − 𝑿𝛽̂ ) = 𝟎

𝑿′ 𝑽−𝟏 𝒚 − 𝑿′ 𝑽−𝟏 𝑿𝛽̂ = 𝟎

𝛽̂ = (𝑿′ 𝑽−𝟏 𝑿)/(𝑿′ 𝑽−𝟏 𝒚)

Sedangkan Estimasi maksimum likelihood bagi 𝑿𝜷


𝑀𝐿(𝑿𝜷) = 𝑿𝛽̂ = 𝑿(𝑿′ 𝑽−𝟏 𝑿)/(𝑿′ 𝑽−𝟏 𝒚)

2.8.2 Estimasi efek tetap dan efek acak


Persamaan model linear campuran didefinisikan sebagai :

𝑿′𝑹 −𝟏
𝑿 𝑿′𝑹 −𝟏
𝒁 𝜷 𝐗′𝑹−𝟏 𝒚
[ ] [ ] = [ ]
𝒁′𝑹−𝟏 𝑿 𝒁′𝑹−𝟏 𝒁 + 𝑫−𝟏  𝐙′𝑹−𝟏 𝒚
̂ dan 𝒖
Jika 𝜷 ̂ adalah solusi dari persamaan (2.11) maka baris kedua
dari persamaaan (2.11) adalah :
̂ + [𝒁′𝑹−𝟏 𝒁 + 𝑫−𝟏 ]𝒖
𝒁′𝑹−𝟏 𝑿𝜷 ̂ = 𝐙′𝑹−𝟏 𝒚 atau
̂)
̂ = [𝒁′𝑹−𝟏 𝒁 + 𝑫−𝟏 ]−𝟏 𝒁′𝑹−𝟏 (𝒚 − 𝑿𝜷
𝒖
Sedangkan baris pertama dari persamaan (2.11) adalah
̂ + 𝑿′𝑹−𝟏 𝒖
𝑿′𝑹−𝟏 𝑿𝜷 ̂ = 𝑿′𝑹−𝟏 𝒚
̂ pada persamaan (2.85) menghasilkan
Substitusi 𝒖
̂ + 𝒁′ 𝑹−𝟏 [𝒁′ 𝑹−𝟏 𝒁 + 𝑫−𝟏 ]−𝟏 𝒁′ 𝑹−𝟏 (𝒚 − 𝑿𝜷
𝑿′𝑹−𝟏 𝑿𝜷 ̂ ) = 𝒁′𝑹−𝟏 𝒚 atau
̂ − 𝒁′𝑹−𝟏 [𝒁′ 𝑹−𝟏 𝒁′ + 𝑫−𝟏 ]−𝟏 𝒁′𝑹−𝟏 𝑿𝜷
𝑿′𝑹−𝟏 𝑿𝜷 ̂ = 𝑿′𝑹−𝟏 𝒚 −
𝒁′ 𝑹−𝟏 𝒁[𝒁′𝑹−𝟏 𝒁 + 𝑫−𝟏 ]−𝟏 𝒁′𝑹−𝟏 𝒚 atau
̂ = 𝑿′𝑽−𝟏 𝒚 sehingga
𝑿′𝑽−𝟏 𝑿𝜷
̂ = (𝑿′𝑽−𝟏 𝑿)−1 𝑿′𝑽−𝟏 𝒚
𝜷 (2.10)

35
Estimasi efek tetap ̂ adalah estimasi GLS (Generalized least
𝜷
̂ adalah BLUE (Best linear unbiased estimator) untuk 𝐗𝜷.
squares) dan 𝐗𝜷
̂ adalah MLE (Maximum
Bila 𝒚 mempunyai sebaran normal, maka 𝜷
̂ pada persamaan (2.12) dapat
likelihood estimator). Estimasi efek acak 𝒖
dinyatakan sebagai berikut:
𝒖 ̂)
̂ = 𝑫𝒁′ 𝑽−𝟏 (𝒚 − 𝑿𝜷 (2.11)

Yang merupakan BLUP (Best linear unbiased Prediction) dari 𝐮


((Christensen, 1987). Salahsatu cara yang paling sederhana untuk
mendapatkan BLUP adalah menggunakan justifikasi Salah satu cara yang
paling sederhana untuk mendapatkan BLUP adalah menggunakan justifikasi
Henderson (Henderson’s justification) dengan menggunakan asumsi
sebaran, yaitu :[13]
𝒚|𝒖 ~ 𝑁(𝑿𝜷 + 𝒁𝒖, 𝑹) 𝑑𝑎𝑛 𝒖 ~ N (𝟎, 𝐆)
maksimisasi fungsi kemungkinan bersama (y,u) pada β dan u yang
tidak diketahui akan menghasilkan kriteria[13]
(𝒚 − 𝑿𝜷 − 𝒁𝒖)′ 𝑹−𝟏 ((𝒚 − 𝑿𝜷 − 𝒁𝒖) + 𝒖′𝑫−𝟏 𝒖
: Suku pertama pada persamaan (2.17) adalah jumlah kuadrat
tertimbang dan suku keduanya adalah penalti. Hal ini menunjukkan bahwa
kriteria BLUP dari (𝜷, 𝒖) terdiri dari GLS ditambah dengan satu suku
penalti. BLUP dari (𝜷, 𝒖) dapat ditulis sebagai:[13]

36
BAB III

ESTIMAS PARAMETER MODEL LINIER CAMPURAN BIVARIAT

PADA DATA LONGITUDINAL

3.1 Menentukan model liniear campuran bivariat pada data longitudinal

Diasumsikan model linier yang dipakai adalah model linier campuran


bivariat erikut: adalah sebagai berikut:
𝒀 𝒊 = 𝑿 𝒊 𝜷𝒊 + 𝒁 𝒊 𝐮 𝒊 + 𝜺 𝒊 (3.1)

Persamaan (3.1) jika dalam matriks dapat disajikan sebagai berikut:


𝑦1 1 𝑥11 … 𝑥1𝑝 𝛽1 𝑧11 𝑧12 … 𝑧1𝑞 𝜀1
𝑦2 1 𝑥21 … 𝑥2𝑝 𝛽 𝑧 𝑧22 … 𝑧2𝑞 𝜀2
( ⋮ )=( ) ( ⋮2 ) + ( 21 )+( ⋮ )
⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
𝑦𝑛 1 𝑥𝑛1 … 𝑥𝑛𝑝 𝛽𝑝 𝑧𝑛1 𝑧𝑛2 … 𝑧𝑛𝑞 𝜀𝑛
var (u) cov (u, u′) 𝐷 𝐷12
𝑢 = 𝑢~𝑁 (0; 𝐃 = 𝐯𝐚𝐫 (𝐮) = [ ]=[ 1 ]) (3.2)
cov (𝑢, 𝑢′) var (𝑢) 𝐷21 𝐷2

Keterangan:[17]
𝒀𝒊 : Matriks (𝑛 × 1), vektor dimensi 𝑛𝑖 pengukuran berulang
untuk subjek ke-i
𝑿𝒊 : matriks (𝑛 × 𝑝), variabel bebas yang diketahui
𝜷𝒊 : Matriks (p × 1), vektor dimensi q koefisien regresi subjek
spesifik
𝜺𝒊 : Matriks (𝑛 × 1), vektor komponen residual 𝜀𝑖𝑗 , 𝜺𝒊 ~
N(0,𝝈𝟐 𝑰𝒏 )
𝒁𝒊 : Matriks (𝑛 × 𝑞) variabel bebas yang diketahui,
memodelkan bagaimana respon disusun berdasarkan
waktu untuk subjek ke-i.
𝐮𝒊 : Matriks (𝑞 × 1) vektor komponen residual 𝑏𝑖 ~ 𝑵𝒒 (0,D)
D : matriks kovarian

37
Pada persamaan (3.1) 𝐮𝒊 sebagai efek acak dan 𝒀𝒊 diasumsikan berdistribusi
normal dengan vekor rata-rata 𝑿𝒊 𝜷𝒊 + 𝒁𝒊 𝐮𝒊 atau 𝐸 (𝒚|𝒖) = 𝑿𝒊 𝜷𝒊 + 𝒁𝒊 𝐮𝒊 , dan
matriks kovarian 𝑹 atau 𝑣𝑎𝑟(𝒚|𝒖) = 𝑹 = 𝝈𝟐 𝑰𝒏. Efek acak diasumsikan
berdistribusi normal dengan vektor rata-rata nol dan matriks kovarian adalah 𝑫
seperti pada persamaan (3.3). Misalkan 𝑓(𝒚|𝒖) dan 𝑓(𝑢) adalah fungsi kepadatan,
maka:
𝑓(𝑦) = 𝑓 (𝒚|𝒖) 𝑓(𝑢)𝜕𝑓(𝑢), ditunjukan sebagai kepadatan berdistribusi normal
dengan 𝑋𝜷 sebagai vektor rata-rata atau 𝐸(y) = 𝑿𝜷. Dan kovariannya adalah:
𝑽 = 𝒁𝑫𝒁′ + 𝑹 (3.3)

3.2 Menentukan estimasi parameter model linier campuran bivariat

Dalam model linier campuran bivariat terdapat dua efek yang digunakan,
yaitu efek tetap dan efek acak, adapaun estimasi yang digunakan adalah sebagai
berikut:

3.2.1 Estimasi parameter efek tetap (𝛃)

Dari persamaan (3.2) diketahui bahwa 𝒀 = (𝑦1 , 𝑦2 , … , 𝑦𝑛 )′ dan

diasumsikan 𝒀 = 𝑿𝜷 + 𝜺 berdistribusi normal maka fungsi likelihood yang

terbentuk adalah:
1 ′ −𝟏 (𝒀−𝑿𝜷)
1
𝑓(𝒀|𝜷, 𝑽 = 𝝈𝟐 𝑰) = ((2𝜋)𝑁/2 |𝑽|1/2 ) 𝑒 −2(𝒀−𝑿𝜷) 𝑽 (3.4)

Untuk menentukan penduga parameter menggunakan metode

maximum likelihood estimation, terlebih dahulu ditentukan fungsi likelihood

yang diperoleh dari fungsi distribusi peluang gabungan. Untuk fungsi

likelihood yang diperoleh dari fungsi distribusi peluang gabungan 𝒀

Bersyarat 𝜷 pada persamaan (3.4) adalah:


1 ′ −𝟏 (𝒀−𝑿𝜷)
1
L(𝛃; 𝐘) = ( 𝑁/2 1/2 ) 𝑒 −2(𝒀−𝑿𝜷) 𝑽
(2𝜋) |𝑉|

Maka log likelihoodnya adalah

38
L(𝛃; 𝐘) = 𝑙𝑛L(𝛃; 𝐘)
1 ′ −𝟏 (𝒀−𝑿𝜷)
1
= 𝑙𝑛 (2𝜋)𝑁/2 |𝑽|1/2 𝑒 −2(𝒀−𝑿𝜷) 𝑽

1 ′ −𝟏 (𝒀−𝑿𝜷)
1
= 𝑙𝑛 (2𝜋)𝑁/2 |𝑽|1/2 + 𝑙𝑛 [𝑒 −2(𝒀−𝑿𝜷) 𝑽 ]

1 1
= 𝑙𝑛 (2𝜋)𝑁/2 |𝑽|1/2 − (𝒀 − 𝑿𝜷)′ 𝑽−𝟏 (𝒀 − 𝑿𝜷)
2

Selanjutnya mencari nilai penduga yang memaksimumkan fungsi

likelihood tersebut. Dilakukan dengan menurunkan parsial terhadap

parameter (𝛃), kemudian persamaan hasil turunan disamadengankan nol.

Untuk turunan parsial 𝑙𝑛L(𝛃; 𝐘) terhadap parameter 𝛃 adalah:


1 1
∂ ln − (𝒀−𝑿𝜷)′ 𝑽−𝟏 (𝒀−𝑿𝜷)
(2𝜋)𝑁/2|𝑽|1/2 2
= ∂𝛃

1 1
∂ ln ∂ (𝒀−𝑿𝜷)′ 𝑽−𝟏 (𝒀−𝑿𝜷)
(2𝜋)𝑁/2|𝑽|1/2 2
= −
∂𝛃 ∂𝛃

∂ 1
= − ∂β (2)(𝒀 − 𝑿𝜷)′ 𝑽−𝟏 (𝒀 − 𝑿𝜷) (3.5)

Kemudian persamaan (3.5) disamadengankan nol, sehingga diperoleh:

∂ 1
− ∂𝛃 (2)(𝒀 − 𝑿𝜷)′ 𝑽−𝟏 (𝒀 − 𝑿𝜷) = 0

∂ 1
= − ∂𝛃 (2 (𝒀 − 𝑿𝜷)′ 𝑽−𝟏 (𝒀 − 𝑿𝜷)

Dengan menggunakan sifat

turunan matriks y = f(x) 1


= 2 (−𝑿)′ (𝑽−𝟏 + (𝑽−𝟏 )′)((𝒀 − 𝑿𝜷) (3.6)
∂f
= x ′ Ax, maka ∂x = (A + A′ )x

Karena V −1 matriks simetris maka (V −1 )′ juga simetris, sehingga

𝐕 −𝟏 =(𝐕 −𝟏 )′. Jadi 𝐕 −𝟏 + (𝐕 −𝟏 )′ = 𝟐𝐕 −𝟏 .

Dengan demikian, persamaan (3.6) menjadi seperti berikut:

39
∂ 1
( (𝒀 − 𝑿𝜷)′ 𝑽−𝟏 (𝒀 − 𝑿𝜷) 1
∂𝛃 2 = 2 (−𝑿)′ (2𝑽−𝟏 )(𝒀 − 𝑿𝜷)

= (−𝑿)′ (𝑽−𝟏 )(𝒀 − 𝑿𝜷)

= −𝐗 ′ 𝑽−𝟏 𝒀 + 𝐗′𝑽−𝟏 𝑿𝜷

Diperoleh persamaan karakteristik:

−𝐗 ′ 𝑽−𝟏 𝒀 + 𝐗′𝑽−𝟏 𝑿𝜷 = 𝟎

𝐗′𝑽−𝟏 𝑿𝜷 = 𝐗 ′ 𝑽−𝟏 𝒀

(𝐗 ′ 𝑽−𝟏 𝑿)−𝟏 𝐗′𝑽−𝟏 𝑿𝜷 = (𝐗 ′ 𝑽−𝟏 𝑿)−𝟏 𝐗 ′ 𝑽−𝟏 𝒀

𝑰𝜷= (𝐗 ′ 𝑽−𝟏 𝑿)−𝟏 𝐗 ′ 𝑽−𝟏 𝒀

𝜷= (𝐗 ′ 𝑽−𝟏 𝑿)−𝟏 𝐗 ′ 𝑽−𝟏 𝒀

Sehingga estimasi parameter untuk efek tetap adalah sebagai berikut:

̂ = (𝐗 ′ 𝑽−𝟏 𝑿)−𝟏 𝐗 ′ 𝑽−𝟏 𝒀


𝜷 (3.6)

yang diperoleh dari fungsi distribusi peluang gabungan 𝒀 Bersyarat 𝒖

pada persamaan (3.5) adalah:

3.2.2 Estimasi parameter 𝒖

Karena efek acak pada persamaan (3.1) diasumsikan terdapat pada


variabel acak, maka keduanya dapat diestimasi dengan menggunakan teknik
pendekatan Bayesian (Tiao 1992, Gelmen et al. 1995). Distribusi vektor 𝐘i
untuk respon individu ke- i , tergantung pada koefisien regresi 𝐮i individu
tersebut. Dan berdistribusi normal dengan vektor rata-rata 𝑿𝒊 𝜷𝒊 + 𝒁𝒊 𝐮𝒊 dan
kovarian matriks 𝑹. Kemudian distribusi marginal 𝐮𝒊 adalah normal
multivariat dengan vektotor rata-rata nol dan matriks covariatnya adalah 𝑫.

40
Pada literasi Bayesian, distribusi ini disebut distribusi prior pada parameter
𝐮𝒊 , karena tidak bergantung pada data 𝐘i . Setelah nilai-nilai 𝐲i pada 𝐘i
teramati dengan distribusi 𝐮𝒊 , kondisi pada 𝐘i = 𝐲i dapat dilakukan
perhitungan. Jika kita tunjukan fungsi kepadatan 𝐘i dengan kondisi 𝐮𝒊 , dan
fungsi kepadatan pada 𝐘i adalah f(𝐲i |𝐮𝒊 ) dan f(𝐮𝒊 ). maka fungsi kepadatan
posterior pada 𝐮𝒊 diberikan dengan 𝐘i = 𝐲i sehingga:
f(𝐲i |𝐮𝒊 )f(𝐮𝒊 )
f(𝐮𝒊 |𝐲i ) ≡ f(𝐮𝒊 |𝐘i = 𝐲i ) =
∫ f(𝐲i |𝐮𝒊)f(𝐮𝒊 )d𝐮𝒊

Dengan menggunakan teori modela liniear Bayesian (Smith 1973,


Lindley and Smith 1972) dimana 𝐮𝒊 diestimasi dengan rata-rata distribusi
posterior, yang disebut posterior rata-rata 𝐮𝒊 . dengan estimasi sebagai
berikut:
𝐮̂𝒊 = 𝐸 [𝐮𝒊 |𝒀𝑖 = 𝒚𝑖 ]

= ∫ 𝐮𝒊 𝑓(𝐮𝒊 |𝒚𝑖 )𝑑𝐮𝒊

= 𝑫𝒁′ 𝑽−𝟏 (𝒚 − 𝑿𝜷) (3.7)

3.3 Langkah-langkah Estimasi parameter model liniear campuran bivariat


pada data longitudinal

Dalam menentuka estimasi parameter, dalam hal ini adalah parameter

pengaruh acak ada beberapa langkah yang dilakukan, diantaranya adalah:

1. Menentukan model linier campuran, dalam hal ini adalah linier campuran
bivariat seperti Pada persamaan (3.1), yaitu:
𝑌𝑖 = 𝑿𝒊 𝜷𝒊 + 𝒁𝒊 𝐮𝒊 + 𝜺𝒊
2. Menentukan variabel pengaruh tetap (𝛃) acak (𝐮)
3. Menentukan matriks rancangan (𝑿) untuk pengaruh tetap dan matriks
rancangan (𝒁) untuk pengaruh acak
4. Menentukan matris kovarians dari distribusi marginal atau 𝑣𝑎𝑟(𝒚|𝒖) = 𝑹 =
𝝈 𝟐 𝑰𝒏

41
5. Menentukan matris kovarians dari efek acak, seperti pada persamaan (3.2)
var (u) cov (u, u′ ) 𝐷 𝐷12
yaitu: 𝐃 = 𝐯𝐚𝐫 (𝐮) = [ ]=[ 1 ]
cov (𝑢, 𝑢′ ) var (𝑢) 𝐷21 𝐷2
6. Menentukan matriks kovarians dari pengaruh efek acak seperti pada
persamaan (3.3), yaitu:
𝑽 = 𝒁𝑫𝒁′ + 𝑹
7. Melakukan perhitungan estimasi 𝛽 seperti pada persamaan Menentukan
nilai 𝛽̂ dengan persamaan (3.6)

̂ = (𝐗 ′ 𝑽−𝟏 𝑿)−𝟏 𝐗 ′ 𝑽−𝟏 𝒀


𝜷

8. Substitusi ke pers(3.7)
̂ = 𝑫𝒁′ 𝑽−𝟏 (𝒚 − 𝑿𝜷)
𝒖

3.4 Contoh kasus estimasi model liniear campuran bivariat pada data
longitudinal
Contoh terperinci. Pada data longitudinal di mana mengamati variabel
respon 𝑦 yaitu ukuran bayi (cm) sesuai dengan kualitas makanan bayi (V) serta
banyak bayi, 𝑛 = 3 perempuan (P) dan anak laki-laki (L) yang diamati dari
waktu ke waktu. Data disajikan oleh Tabel berikut:
Tabel 3. 1 tabel data pengamatan

jenis skor kualitas


Usia ukuran bayi
Bayi kelamin makan anak
(bulan) (cm)= y
(L=1, P=0) (V)
1 0 P 38,16 47,82
2 4 L 41,46 64,02
1 6 P 41,37 73,21
3 0 L 48,76 44,93
2 7 L 44,79 89,54
2 10 L 48,17 92,14
1 16 P 44,79 86,12
3 9 L 47,91 86,42
3 12 L 44,7 86,4

Misalkan model pada masing-masing dari dua dimensi memiliki satu


intercept acak oleh subjek (bayi) dan satu slope acak dengan subjek usia bayi

42
(dalam bulan). Sebagai contoh, mempertimbangkan batasan pengidentifikasian
yang mencakup variabel jenis kelamin yang level F-nya adalah rujukan, model
campuran linier bivariat dapat ditulis sebagai berikut:
𝑦 = (𝟙 V 𝑗𝑒𝑛𝑖𝑠 𝑘𝑒𝑙𝑎𝑚𝑖𝑛 )𝛽𝑖 + 𝑍𝑖 u𝑖 + 𝜀𝑖
=𝑋

1 38,16 0
1 41,46 1
1 41,37 0
1 48,76 1
Dimana, secara eksplisit 𝑿 = 1 44,79 1 ;
1 48,17 1
1 44,79 0
1 47,91 1
[1 44,7 1]
1 0 0
0 1 0
1 0 0
0 0 1
𝐙= 0 1 0 ;
0 1 0
1 0 0
0 0 1
[0 0 1]

Jika dari tabel (3.1). misalkan 𝜷 = 𝝈𝟐𝜷 adalah rata-rata ukuran panjang bayi tiap
waktu pengambilan data, dan 𝒖 = 𝝈𝟐𝒖 adalah pengukuran ukuran bayi dari
masing-masing bayi. Sehingga tabel diatas dapat disajikan sebagai berikut:

Tabel 3. 2 data parameter

Parameter Data ke- Ukuran bayi


𝜷 1 52,257
2 83, 057
3 88,32
𝒖 1 69,05
2 81.9
3 72,583

43
Dari tebel diatas diperoleh:
52,257 69,05
𝜷 = [83, 057], dan 𝒖 = [ 81.9 ]
88,32 72,583
dengan menggunakan persamaan (3.2) diperoleh
14,912 −20,176 5,264
( )
𝑫 = 𝑣𝑎𝑟 𝒖 = [−20,176 27,298 −7,112] (3.8)
5,264 −7,112 1,858

Dengan persamaan 𝑽 = 𝒁𝑫𝒁′ + 𝑹 dengan mensubstitusi persamaan (3.8)


untuk nilai D, diperoleh: Dengan mengunakan perhitungan matriks pada
program Microsoft excel diperoleh:

- - -
94,069 10,937 18,770 92,992 -72,45 -30,054
64,747 19,5164 29,993
-
10,937 39,527 62,182 27,360 9,778 6,748 -33,708 -21,004
20,981
- -
18,770 -18,65 15,099 9,540 13,233 3,542261 3,545
22,349 22,724
-
92,991 27,360 9,540 99,085 -65,06 -32,892 -37,28 -37,21
56,512
- -
58,411 -56,51 52,394 56,735 -0,790 12,764 12,73
64,747 22,348
- - -
6,748 56,735 61,829 2,563 16,204 16,16
72,457 22,724 65,064
-
-33,708 13,233 -32,89 -0,790 2,563 29,886 20,6249 20,59
19,516
-
-21,004 3,542 -37,28 12,76 6,205 20,625 17,589 17,589
30,054
-
-20,981 3,5451 -37,21 12,731 16,165 20,599 17,589 17,563
29,995

Sehingga estimasi parameter dapat dilakukan dengan menggunakan persamaan


(3.6)

̂ = (𝐗 ′ 𝑽−𝟏 𝑿)−𝟏 𝐗 ′ 𝑽−𝟏 𝒀


𝜷

Diperoleh sebagai berikut:


217,1738
̂
𝜷 = ( 4,911 )
187, 9215

̂ ) diperoleh dengan persamaan (3.7)


Dan estimasi efek acak ( 𝒖
̂ = 𝑫𝒁′𝑽−𝟏 (𝒚 − 𝐗𝜷
𝒖 ̂)

44
Sehingga diperoleh:
48,468
̂ = (57,889)
𝒖
61,098

45
BAB IV
PENUTUP

4.1 Kesimpulan

Berdasarkan uraian diatas, diperoleh kesimpulan bahwa estimasi parameter


pada model liniear campuran bivariat pada data longitudinal dengan menggunakan
metode least square dummy variable (LSDV) untuk parameter efek tetap dan
generalized least square (GLS) untuk parameter efek acak. Keduanya merujuk
pada Estmasi Maksimum Likelihood (MLE) diperoleh :

̂ = (𝐗 ′ 𝑽−𝟏 𝑿)−𝟏 𝐗 ′ 𝑽−𝟏 𝒀


𝜷

̂)
̂ = 𝑫𝒁′𝑽−𝟏 (𝒚 − 𝐗𝜷
𝒖
Sehingga diperoleh:
𝒀 ̂ + 𝒁𝒖
̂ = 𝐗𝜷 ̂+𝜺
Pada kasus pengukuran bayi, diperoleh:
217,1738
̂ = ( 4,911 ) , dan
𝜷
187, 9215
48,468
̂ = (57,889)
𝒖
61,098
.

4.2 Saran

Dalam penelitian ini, peneliti menggunakan model liniear campuran bivariat


yang diaplikasikan langsung pada data longitudinal dengan menggunakan metode
least square dummy variable (LSDV) untuk parameter efek tetap dan generalized
least square (GLS). Bagi para pembaca yang ingin melakukann penelitian serupa,
peneliti menyarankan menggunakan metode lain dengan model regresi pada
analisis data longitudinal.

46
DAFTAR PUSTAKA

[1] F. Gao et al., “Estimating correlation between multivariate longitudinal


data in the presence of heterogeneity,” BMC Med. Res. Methodol., vol. 17,
no. 1, pp. 1–11, 2017.

[2] A. Itu, A. Statistik, A. A. Itu, and A. Statistik, “Analisis multivariat,” pp.


17–21, 2010.

[3] Z. Thmasebinejad and E. Tabrizi, “Sensitivity Analysis in Correlated


Bivariate Continuous and Binary Responses,” vol. 10, no. 1, pp. 609–619,
2015.

[4] E. H. Adjakossa, I. Sadissou, and M. N. Hounkonnou, “Multivariate


Longitudinal Analysis with Bivariate Correlation Test,” pp. 1–33, 2016.

[5] S. Fieuws, G. Verbeke, and G. Molenberghs, “Statistical Methods in


Medical Research,” 2007.

[6] P. Introduction, “Bivariate Data Analysis : Regression and Correlation,”


vol. 1015, pp. 1–22, 2013.

[7] E. W. FREES, LONGITUDINAL AND PANEL DATA, First. New York:


Cambridge University Press The Edinburgh Building, Cambridge cb2 2ru,
UK, 2004.

[8] D. Park, “model linear campuran pada data longitudinal,” Anal. DATA
Longitud., no. 4483, p. 9, 2017.

[9] H. Alzahrani., “Generating Multivariate Longitudinal Binary Random


Variables for Gee Models Using Bridge Distribution.,” Int. J. Adv. Res.,
vol. 5, no. 12, pp. 1410–1426, 2017.

[10] N. A. Rizki, “Model Regresi Data Panel Random Effect Dengan Metode
Generalized Least Squares (GLS),” 2011.

[11] S. Pangestika, “‘Analisis estimasi model regresi data panel dengan


pendekatan common effect model (cem), fixed effect model (fem), dan
random effect model (rem)’. Skripsi. Universitas Negeri Semarang (tidak
dipublikasikan),” Unnes J., vol. 2, no. 1, pp. 16–40, 2015.

47
[12] “epdf.pub_generalized-linear-and-mixed-models-wiley-series-i.pdf.” .

[13] S. K. Ragam, “3. model linear campuran 3.1.,” no. 1939, 1992.

[14] G. Verbeke, S. Fieuws, G. Molenberghs, and M. Davidian, “Statistical


Methods in Medical Research,” 2014.

[15] B. Jpirgensen, S. Lundbye-christensen, P. X. Song, and L. I. Sun, “State-


space models for multivariate longitudinal data of mixed types *,” vol. 24,
no. 3, pp. 385–402, 1996.

[16] R. Thiébaut, H. Jacqmin-gadda, G. Chêne, C. Leport, and B. Cedex,


“Bivariate linear mixed models using SAS proc MIXED.”

[17] A. A. R. Fernandes and D. Wound, “ANALISIS DATA


LONGITUDINAL,” pp. 1–7.

48

Anda mungkin juga menyukai