Anda di halaman 1dari 10

1

PENGGUNAAN METODE EMPIRICAL BEST LINEAR UNBIASED PREDICTION


(EBLUP) PADA GENERAL LINEAR MIXED MODEL
Tri Handhika
Pusat Studi Komputasi Matematika (PSKM), Kampus D 139 Universitas Gunadarma
trihandika@staff.gunadarma.ac.id
Abstrak
Makalah ini bertujuan untuk mencari taksiran parameter pada General Linear Mixed
Model. Parameter-parameter pada General Linear Mixed Model merupakan parameter
untuk melihat efek fixed dan efek random dari variabel-variabel prediktor terhadap variabel
respon. Dalam hal ini, metode yang digunakan untuk mencari taksiran parameter pada
General Linear Mixed Model adalah Metode Empirical Best Linear Unbiased Prediction
(EBLUP). Berbeda dengan Metode Best Linear Unbiased Prediction (BLUP) di mana
parameter dari variansi efek random-nya diketahui, Metode EBLUP memerlukan
penaksiran terhadap parameter tersebut yang pada kenyataannya tidak diketahui nilainya.
Metode yang digunakan untuk menaksir parameter dari variansi efek random adalah
Metode Maximum Likelihood (ML).
Kata kunci: Best Linear Unbiased Prediction; Empirical Best Linear Unbiased Prediction;
General Linear Mixed Model.
Abstract
This paper aims to find the estimated parameters in the General Linear Mixed
Model. Parameters in the General Linear Mixed Model are the parameter to see the fixed
effects and the random effects of the predictor variables on the response variable. In this
case, the estimation methods used to search the parameters in the General Linear Mixed
Model is the Empirical Best Linear Unbiased Prediction (EBLUP) method. Unlike the Best
Linear Unbiased Prediction (BLUP) method where the variance parameters of the random
effects is known, the EBLUP method requires estimation of the variance parameters that in
fact the value is not known. The method used to estimate the variance parameters of the
random effects is the Maximum Likelihood (ML) method.
Key word: Best Linear Unbiased Prediction; Empirical Best Linear Unbiased Prediction;
General Linear Mixed Model.
1. PENDAHULUAN
Pola hubungan antara variabel prediktor dengan variabel respon dapat dinyatakan
dalam bentuk persamaan regresi di mana variabel prediktornya dapat berupa faktor fixed
atau faktor random. Model regresi linier yang melibatkan lebih dari satu variabel prediktor
2
dengan satu variabel respon disebut model regresi linier berganda. Pada model ini
diasumsikan bahwa variansi error spherical.
Jika asumsi tersebut tidak dapat terpenuhi maka model tersebut dinamakan
Generalized Linear Regression Model (GLRM) dengan asumsi variansi error nonspherical.
Model GLRM yang dipengaruhi tidak hanya oleh efek fixed tetapi juga oleh efek random
disebut General Linear Mixed Model. Makalah ini bertujuan untuk mencari taksiran
parameter pada General Linear Mixed Model sehingga dapat dilihat efek-efek dari variabel
prediktor tersebut terhadap variabel respon.
Terdapat bermacam-macam metode penaksiran parameter pada General Linear
Mixed Model, di antaranya adalah Best Linear Unbiased Prediction (BLUP) dan EBLUP.
Pada Makalah ini akan dibahas metode penaksiran parameter pada General Linear Mixed
Model dengan Metode EBLUP yang merupakan perluasan dari Metode BLUP.
Pada metode EBLUP, asumsi bahwa parameter dari variansi efek random diketahui
tidak digunakan seperti halnya pada BLUP, melainkan akan diestimasi melalui Metode
Maximum Likelihood (ML) yang akan dijelaskan lebih lanjut. Penaksiran ini dilakukan
karena pada kenyataannya sulit untuk mengetahui parameter dari variansi efek random
tersebut.
2. MODEL
Pada bagian ini diberikan General Linear Mixed Model adalah sebagai berikut:
= + + y X Zb e o
(2.1)
di mana
y
: vektor random dari variabel respon yang terobservasi berukuran
1 n
di mana nilai
observasinya disebut vektor data.
X : matriks full rank berukuran
n k
dari variabel prediktor yang elemen-elemennya
diketahui.
o
: vektor parameter bersifat fixed berukuran
1 k
yang tidak diketahui dan tidak
terobservasi.
Z : matriks full rank berukuran
n h
dari variabel prediktor yang elemen-elemennya
diketahui.
b
: vektor random parameter yang tidak diketahui dan tidak terobservasi berukuran
1 h
.
e
: vektor random error yang tidak terobservasi berukuran
1 n
.
3
dengan asumsi
, ) E = b 0
,
, ) E = e 0
,
, ) , )
T
Var E = = b bb G
,
, ) , )
T
Var E = = e ee R
, di mana b dan e
independently distributed sedangkan G dan R adalah matriks varians kovarians yang
tergantung pada vektor parameter dari variansi efek random, yaitu , )
1 2
, , ,
T
q
= o
.
Oleh karena b dan e independen, maka
, ) , corr = b e 0
sehingga
, ) , ) , )
cov ,
T T
E E = = = b e be eb 0
. Berikut ini diberikan bentuk dari matriks G dan R:
Prosedur penaksiran parameter dengan menggunakan Metode Best Linear Unbiasd
Prediction (BLUP) dimulai dengan memisalkan nilai-nilai dari vektor random
b
yang
dapat dinotasikan dengan
|
di mana
|
berbentuk vektor. Ingin diketahui pengaruh dari
efek fixed dan efek random (tetapi bukan error) yang merupakan kombinasi linier dari
o
dan
|
. Misalkan
, )
T
T c = + y y l
adalah sembarang penaksir dari kombinasi linier
T T
+ o e |
di mana
c
suatu nilai konstanta dan
l
suatu vektor konstanta sedangkan

berukuran
1 k
dan
e
berukuran
1 h
.
, ) T y
dapat mengestimasi kombinasi linier
tersebut jika
, ) T y
merupakan penaksir yang unbiased dan linier di mana definisi masing-
masingnya adalah sebagai berikut,
, ) T y
disebut unbiased jika
, ) , ) , )
T T
E T E = + y b o e
,
dan disebut linier jika
, ) , ) , )
1 2 1 2
T a b aT bT + = + y y y y
.
Diketahui bahwa
T T
+ o e |
dapat diestimasi oleh
, ) T y
jika dan hanya jika
0 c =
dan
T
merupakan kombinasi linier dari baris-baris X. Selanjutnya, ambil sembarang
T T
= + o e |
yang merupakan kombinasi linier yang dapat diestimasi kemudian
definisikan t
T T
= + b o e . Selain itu, definisikan pula
, ) , )
2
T T
E T
(

(

y b o e
sebagai
Mean Squared Error (MSE) dari penaksir
, ) T y
.
, )
, ) , ) , )
, ) , ) , )
, ) , ) , )
, )
, ) , ) , )
, ) , ) , )
, ) , ) , )
11 12 1
21 22 2
1 2
11 12 1
21 22 2
1 2
h
h
h h hh
n
n
n n nn
g g g
g g g
g g g
r r r
r r r
r r r
| |
|
|
=
|
|
|
\ .
| |
|
|
=
|
|
|
\ .
G
R

o o o
o o o
o
o o o
o o o
o o o
o
o o o
4
Dengan menggunakan Metode Best Linear Unbiased Prediction (BLUP) di mana
diasumsikan
o
diketahui, didapat
, )
y o o,
dan
, )

y | o,
sedemikian sehingga
, ) , ) , ) , )
1
1 1

T T


= y X X X y o o, O o O o
(2.2)
dan
, ) , ) , ) , ) , )
1

T
= y G Z y X y | o, o O o o o,
(2.3)
di mana
, ) .
T
= = + R ZGZ O o O
Dengan demikian, Best Linear Unbiased Predictor (BLUP) dari

adalah
, ) , ) , )


T T
= + y y y o, o o, e | o,
(2.4)
yang memiliki MSE terkecil dari semua taksiran yang unbiased dan linier. Detail
penurunan rumus dapat dilihat pada Makalah Phydelya dengan judul Penggunaan Metode
Best Linear Unbiased Prediction pada Generalized Linear Mixed Model.
3. HASIL
3.1. Penaksiran Parameter pada General Linear Mixed Model dengan Asumsi b dan
e Berdistribusi Normal
Pada Bagian sebelumnya telah dijelaskan mengenai penggunaan Metode Best
Linear Unbiased Prediction (BLUP) dalam penaksiran pada General Linear Mixed Model
tanpa asumsi distribusi. Pada dasarnya Metode EBLUP adalah suatu metode penaksiran
parameter pada General Linear Mixed Model yang merupakan perluasan dari Metode
BLUP dengan menggunakan taksiran parameter dari variansi efek random , )

o
yang pada
kenyataannya parameter tersebut tidak diketahui nilainya. Metode penaksiran
o
yang
digunakan pada Makalah ini adalah Metode ML yang memerlukan asumsi distribusi. Oleh
sebab itu, diasumsikan bahwa b dan e berdistribusi normal. Dikarenakan taksiran parameter
pada General Linear Mixed Model yang telah didapat sebelumnya ((2.2)) dan (2.3)), yaitu
o
dan

|
, didapat tanpa asumsi distribusi maka harus dicari taksiran parameter pada
General Linear Mixed Model dengan asumsi b dan e berdistribusi normal yang dinotasikan
dengan
o
dan

|
.
5
Dengan asumsi b dan e berdistribusi normal, parameter pada General Linear Mixed
Model, yaitu
o
dan
|
dapat ditaksir menggunakan Metode ML. Metode ini memerlukan
fungsi likelihood yang merupakan joint pdf dari , )
1 2
y , y , , y
T
n
= y
dan
, )
1 2
, , ,
T
h
= | | | |
. Joint pdf tersebut dapat dinyatakan sebagai berikut:
, ) , ) , ) , | f g h = y y | | |
(3.1.1)
di mana
, ) , ) | g g = y | c
(3.1.2)
Oleh sebab itu, (3.1.1) dapat ditulis sebagai
, ) , ) , ) , f g h = y | c |
di mana
, )
, )
-1
1
2 2
1 1
exp .
2
2
T
n
h

| |
=
|
\ .
G
G
| | |
sehingga diperoleh
, ) , )
, ) , )
, ) , )
, )
-1 -1
1
2
, ; ,
1 1
exp .
2
2
T T
n
L f
g h

=
=
| |
= +
|
\ .
y y
R G
G R
o | |
c |
c c | |
Oleh karena ingin dicari taksiran dari
o
dan
|
menggunakan Metode ML, agar
lebih mudah dalam hal perhitungannya akan digunakan fungsi log-likelihood, yaitu:
, )
-1 -1 -1 -1 -1 -1
-1 -1 -1 -1
1
ln , ; (
2
)
T T T T T T T T T
T T T T T T T
L c = + +
+ + +
y y R y y R X y R Z X R y X R X X R Z
Z R y Z R X Z R Z G
o | o | o o o o |
| | o | | | |
(3.1.3)
dengan , ) , )
1
2
ln 2
n
c = G R suatu konstanta. Selanjutnya, fungsi log-likelihood tersebut
diturunkan terhadap masing-masing
o
dan
|
kemudian dicari penyelesaiannya sehingga
didapat
6
-1 -1 -1 T T T
+ = X R X X R Z X R y

o |
(3.1.4)
, )
-1 -1 -1 -1
.
T T T
+ + = Z R X Z R Z G Z R y

o |
(3.1.5)
Selanjutnya, dengan proses eliminasi didapat
, )
, ) , )
, )
, )
1
1 1
-1 -1 -1 -1 -1 -1 -1 -1 -1 -1 T T T T T T


= + + X R R Z Z R Z G Z R X X R R Z Z R Z G Z R y o
(3.1.6)
dan
, ) , )
1
-1 -1 -1
.
T T

= + Z R Z G Z R y X

| o
(3.1.7)
Jadi, selain
o dan

| yang didapat tanpa asumsi distribusi, terdapat pula


o
dan

|
yang merupakan taksiran parameter pada General Linear Mixed Model dengan
mengasumsikan b dan e berdistribusi normal. Selanjutnya, untuk penaksiran
o
menggunakan Metode ML seharusnya memerlukan
o
dan

|
yang didapat dengan asumsi
b dan e berdistribusi normal. Akan tetapi, berikutnya akan dibuktikan bahwa
o
dan

|
yang didapat dengan asumsi b dan e berdistribusi normal tersebut, ternyata identik dengan
o dan

| yang diperoleh tanpa asumsi distribusi. Oleh karena itu, untuk seterusnya
penaksiran
o
akan menggunakan
o dan

| .
3.2. Memeriksa bahwa Taksiran Parameter pada General Linear Mixed Model
yang didapat dengan atau tanpa Asumsi b dan e Berdistribusi Normal adalah
Identik
Telah diketahui dari (2.2) dan (2.3) bahwa taksiran parameter pada General Linear
Mixed Model tanpa asumsi distribusi adalah
o dan

| . Sedangkan, taksiran parameter pada


General Linear Mixed Model dengan asumsi b dan e berdistribusi normal diberikan oleh
(3.1.6) dan (3.1.7). Dari (3.1.6), misalkan:
, )
1
-1 -1 -1 -1 -1
.
T T

= + W R R Z Z R Z G Z R
(3.2.1)
Oleh karena dapat dibuktikan bahwa
= W I O
, maka terbukti pula bahwa
= o o. (3.2.2)
7
Selain itu, dapat dibuktikan pula bahwa , )
1
-1 -1 -1 1 T T T


+ = Z R Z G Z R GZ O
sehingga dapat
disimpulkan bahwa

| |. (3.2.3)
Berdasarkan (3.2.2) dan (3.2.3) terbukti bahwa dengan atau tanpa asumsi b dan e
berdistribusi normal kedua jenis taksiran parameter pada General Linear Mixed Model
tersebut identik sehingga taksiran parameter yang didapat dengan asumsi b dan e
berdistribusi normal juga memiliki sifat linear, unbiased, dan best.
3.3. Penaksiran Parameter dari Variansi Efek Random
, ) o
Pada Makalah ini, Metode ML digunakan untuk menaksir
o
pada General Linear
Mixed Model. Oleh karena itu, dibutuhkan fungsi likelihood yang merupakan joint pdf dari
, )
1 2
y , y , , y
T
n
= y
sehingga fungsi likelihood-nya adalah sebagai berikut:
, ) , )
, ) , )
, ) , ) , )
-1
1
2
2
1 1
, ; exp
2
2
T
n
L f

| |
= =
|
\ .
y y y X y X o o o O o o
O o
(3.3.1)
Sebagaimana sebelumnya, Metode ML menggunakan fungsi log-likelihood, yaitu:
, ) , )
, )
, ) , ) , )
, )
-1
1
ln , ; ln
2
T
L c = + y y X y X o o O o o O o o
(3.3.2)
dengan
, ) ln 2
2
n
c =
adalah suatu konstanta. Selanjutnya, fungsi log-likelihood tersebut
diturunkan terhadap
o
, dinotasikan dengan
, ) , s o o
, sehingga untuk elemen ke-j didapat
formula berikut ini:
, )
, )
, )
, )
, )
, )
, )
-1 -1 -1
1 1
,
2 2
T
j j j
s tr = + y X y X o o O O o O O O o
(3.3.3)
dengan
, )
, )
j
j
c
=
co
O o
O
.
Sesuai dengan Metode ML, berikutnya (3.3.3) dicari solusinya menjadi
, )
, )
, )
, ) , )
, )
, )
, )
, )
-1 -1 -1

T
j j
tr = y X y X O o O o O o O O o o
(3.3.4)
8
Terlihat dari (3.3.4)
o
tidak dapat diselesaikan secara analitik. Oleh karena itu,
taksiran
o
dengan Metode ML kemudian diselesaikan secara numerik. Pada Makalah ini,
algoritma yang digunakan adalah Scoring Algorithm di mana iterasi ke-
1 a +
, yaitu
, ) 1

a+
o ,
secara iteratif menggunakan formula sebagai berikut:
, ) , ) , )
, ) , )
, )
, )
, )
, )
1
1

,
a a a a a

+
= + s o o T o o o o
dengan
, ) , ) , ) , ) , ) 1 2

, , , , , , ,
T
q
s s s = s o o o o o o o o
dan
, ) , ) , ) , ) , ) 1 2

T
T T T
q
= , , , T o T o T o T o
di mana
, )
, )
, ) , )
, )
2
-1 -1
ln , ;
1
2
jk j k
k j
L
E tr

| |
c
= =
|
|
c c
\ .
y o o
T o O O O O
(3.3.5)
Berdasarkan penjabaran di atas, didapatkan taksiran parameter dari variansi efek
random , )

o
secara numerik yang selanjutnya akan digunakan dalam penaksiran parameter
pada General Linear Mixed Model sesuai dengan Metode EBLUP.
3.4. Penaksiran Parameter pada General Linear Mixed Model dengan Metode
EBLUP
Taksiran parameter pada General Linear Mixed Model dengan menggunakan
Metode EBLUP didapat dengan mensubstitusikan taksiran
o
, dinotasikan dengan
, )

y o
,
ke
o dan

| , yaitu:
, )
, ) , ) , ) , )
1
1 1

,
T T


= y y X X X y o o O o O o
dan
, )
, ) , ) , )
, )
, ) , )
1

, ,
T
= y y G Z y X y y | o o O o o o
Berdasarkan (2.4) taksiran kombinasi linier yang baru adalah sebagai berikut:
, )
, )
, )
, )
, )
, )

.
T T
, = , + , y y y y y y o o o e | o
(3.4.1)
9
Oleh karena
, )
, )

y y o ,
tersebut didapat dengan mensubstitusikan
, )

y o
ke
o dan

| ,
maka perlu dibuktikan ketakbiasan dari taksiran tersebut. Sebelumnya diketahui lemma
berikut ini:
Lemma 3.1
Jika
z
adalah vektor random berdistribusi simetris di sekitar nol sedemikian sehingga
z
dan
z
identically distributed, dan
, ) f z
adalah variabel random yang merupakan fungsi
ganjil dari
z
sehingga
, ) , ) f f = z z
, maka
, ) f z
berdistribusi simetris di sekitar nol.
Sebelumnya diketahui bahwa
, )
, ) , )

E y y o ,
berhingga dan
, )

y o
merupakan
fungsi genap serta translation-invariant dari
y
sehingga didapat
, ) , ) , ) , ) , )

= = + = + y y X Zb e Zb e o o o o o
(3.4.2)
Oleh karena terbukti bahwa
, )
, ) , )

t 0 E = y y o ,
maka dapat disimpulkan bahwa
, )
, )

y y o ,
tetap unbiased untuk mengestimasi
T T
= + o e |
.
4. PENERAPAN
Sebuah Waralaba makanan cepat saji ingin menambahkan produk makanan baru
dalam daftar menunya. Oleh sebab itu, pihak marketing mengusulkan kepada pihak
manajemen tiga pilihan bentuk promosi atau campaign
, ) X
yang akan diujicobakan di
enam lokasi Waralaba atau location
, ) Z
yang dipilih secara acak dari sepuluh Waralaba
yang ada. Namun, selama satu bulan pertama pihak manajemen ingin melihat terlebih
dahulu seberapa besar pengaruh masing-masing bentuk promosi dan lokasi Waralaba dalam
meningkatkan penjualannya (sales). Diasumsikan bahwa matriks-matriks varians kovarians
dari e dan b, yaitu 0 r
= R I
dan 1 g
= G I
di mana 0

dan 1

merupakan parameter dari


variansi e dan b sedangkan r
I
dan g
I
merupakan matriks identitas berukuran
30 30
dan
6 6
. Sebelum melakukan penaksiran parameter pada General Linear Mixed Model, perlu
diperiksa terlebih dahulu kenormalan dari variabel dependen (Sales). Dengan menggunakan
Metode EBLUP didapatkan taksiran dari parameter-parameter tersebut, yaitu sebagai
berikut.
, )

46.0171, 832.7489
T
= o
, ) = 230 0812 191.1613 218.5482 . , ,
T
o
, ) = 53 4308 -0.2670 -38.0198 -5.1867, 11.8286, -21.7859 .

. , , ,
T
|
10
5. KESIMPULAN
Dari pembahasan Makalah ini dapat disimpulkan bahwa Metode Empirical Best
Linear Unbiased Prediction (EBLUP) yang merupakan perluasan dari Metode Best Linear
Unbiased Prediction (BLUP) dapat digunakan untuk menaksir parameter pada General
Linear Mixed Model dengan terlebih dahulu melakukan penaksiran terhadap parameter dari
variansi efek random yang pada kenyataannya tidak diketahui nilainya.
REFERENSI
Anton, H. (2000), Dasar-Dasar Aljabar Linier, Batam: Interaksara.
Jiang, J. (2007), Linear and Generalized Linear Mixed Models and Their Applications,
New York: Springer.
Harville, D. A. (1997), Matrix Algebra from A Statisticians Perspective, New York:
Springer.
Kackar, R. N., and Harville, D. A. (1981), Unbiasedness of Two-stage Estimation and
Prediction Procedures for Mixed Linear Models, Communications in Statistics,
Series A, 10, 1249-1261.
McCulloch, C. E., and Searle, S. R. (2001), Generalized, Linear, and Mixed Models, New
York: John Wiley and Sons.
Phydelya, A. (2007), Penggunaan Metode Best Linear Unbiased Prediction pada
Generalized Linear Mixed Model, Depok: Departemen Matematika FMIPA UI.
Searle, S.R., Casella, G., and McCulloch, C. E. (1992), Variance Components, New York:
Wiley.

Anda mungkin juga menyukai