Anda di halaman 1dari 4

Transformasi

Multivariat

untuk

data

tidak

normal

dengan

Transformasi Box-Cox.

Dalam banyak kasus, pemilihan suatu transformasi yang tepat untuk dapat
meningkatkan pendekatan data ke arah normalitas terkadang tidak benar.
Untuk kasus seperti itu, akan sangat tepat jika data yang mempengaruhi
pemilihan transformasinya. Keluarga transformasi yang tepat untuk tujuan
tersebut

adalah

keluarga

power-transformations.

disimbolkan dengan parameter

variabel yang positif. Nilai

Power-transformations

dan hanya digunakan pada variabeldipilih pada selang tertentu, umumnya

[ 2,2 ] .

Suatu metode analisis yang tepat dalam memilih

baik dalam kasus

univariat maupun multivariat adalah transformasi Box-Cox. Transformasi


tersebut dapat didefinisikan dalam bentuk baku sebagai berikut:

x 1
; 0
x=

lnx; =0

(1)

Langkah-langkah yang harus dilakukan dalam transformasi multivariat untuk


data tidak normal adalah sebagai berikut:
1. Sebelum dilakukan transformasi, data harus selalu diuji dengan Q-Q plot
atau uji lain untuk melihat apakah asumsi normal sementara terpenuhi.
Jika dari plot data tidak membentuk garis lurus maka asumsi tersebut
tidak dipenuhi sehingga data tersebut tidak normal sehingga diperlukan

transformasi. Langkah-langkah membuat Q-Q plot sudah dijelaskan


dalam pertemuan sebelumnya.
2. Dalam kasus multivariat,

harus dipilih untuk setiap variabel.

1 , 2 , , p . Maka tiap

Misalkan terdapat

dipilih dengan

memaksimumkan:

l ( )=

Nilai

n
1

ln x (jk ) x (k )
2
n j=1

yang diperoleh ini adalah

memaksimumkan persamaan (2)


, ...,

+ ( k 1 ) ln x jk
j=1

^1 , ^2 , . , ^ p

(2)

yang secara individual

disebut distribusi marginal dari

x1 ,

x2

xn .

Keterangan:

x 1k , x 2 k , . , x nk

adalah n observasi pada variabel ke-k, k=1,2,..., p.

Dimana

1 n 1 n x 1
x (k )= x (jk )= jk
n j=1
n j=1
k
k

( )

(3)

Adalah rata-rata dari pengamatan yang ditransformasi. Sedangkan pengamatan


multivariat ke-j yang ditransformasi adalah sebagai berikut:

[]
^

x j 11
^ 1
^

x j 21

x (j )= ^
2
2

x 1
^ p
^
p
jp

3. Setelah itu, masukan nilai masing-masing

^1 , ^2 , . , ^ p

kedalam

persamaan (1) sehingga diperoleh data hasil transformasi untuk masingmasing

xj .

4. Buat Q-Q plot dari data hasil transformasi. Jika plot menunjukan garis
regresinya adalah garis lurus maka dapat kita simpulkan bahwa data
hasil transformasi sudah mendekati normal.
5. Meskipun distribusi marginal yang normal tidak cukup menjamin
kenormalan joint distribusinya, akan tetapi hal tersebut sudah cukup baik
dalam aplikasi. Jika tidak maka kita dapat mulai dari nilai

^1 , ^2 , . , ^ p

yang diperoleh dari transformasi sebelumnya dan iterasikan terhadap


'

=[ 1 , 2 , , p ]

yang secara bersama memaksimumkan:


n

n
l ( 1 , 2 , , p ) =
ln |S ( )|+ ( 11 ) ln x j 1 + ( 21 ) ln x j 2+ + ( p1 ) ln x jp
2
j=1
j=1
j=1

(4)
dimana

S ( )

adalah matriks kovarian untuk sampel yang diperoleh dari:

[]
x j1 1
1
1

x j 21
x = 2

x jp 1
p
2

( )
j

j= 1, 2, ..., n.
Dengan memaksimumkan
distribusi dari
normal.

x1 ,

x 2 , ...,

l ( 1 , 2 , , p )
xn

maka diperoleh

( ^ 1 , ^2 , , ^ p )

joint

yang diharapkan akan mendekati mutivariat