Anda di halaman 1dari 5

ANALISIS STATISTIKA MULTIVARIATE

Analisis statistika multivariate adalah analisis statistika yang dikenakan pada data
yang terdiri dari banyak variabel dan antar variabel saling berkorelasi. Beberapa metode
yang termasuk ke dalam golongan analisis ini adalah :
# Metode Tujuan Model
1 Principal Mereduksi dimensi data dengan cara Yi a' X
Component membangkitkan variabel baru (komponen maks var(Yi) dan
Analysis utama) yang merupakan kombinasi linear corr(Yi, Yj)=0
dari variabel asal sedemikan hingga varians
komponen utama menjadi maksimum dan
antar komponen utama bersifat saling bebas
2 Factor Mereduksi dimensi data dengan cara X CF
Analysis menyatakan variabel asal sebagai kombinasi maks var(CF)
linear sejumlah faktor, sedemikian hingga
sejumlah faktor tersebut mampu menjelas-
kan sebesar mungkin keragaman data yang
dijelaskan oleh variabel asal.
3 Cannonical Menganalisis hubungan antar dua kelompok Ada dua kelompok
Correlation variabel dengan cara membangkitkan vari- variabel :X dan Y
abel baru pada setiap kelompok. Variabel dibangkitkan variabel
baru tersebut merupakan kombinasi linear baru :
dari variabel asal. Kombinasi linearnya U i a' X dan
ditentukan sedemikian hingga korelasi antar Vi b' Y sehingga
variabel baru yang berasal dari dua ke- corr( U , V ) maks
i i
lompok menjadi maksimum
dan corr( i , V j )=0
U
4 Multivariate Memodelkan hubungan antara kelompok Y X
Regression variabel respon (Y) dengan kelompok
variabel (X) yang diduga mempengaruhi
variabel respon
5 MANOVA Menganalisis hubungan antara vektor va- Yijk k ik ijk
riabel respon (Y) yang diduga dipengaruhi i=1,...,t j=1,...,ni
oleh beberapa perlakuan (treatment). k=1,...,p
6 Discriminant Membentuk fungsi yang memisahkan antar
Analysis kelompok berdasarkan variabel pembeda,
fungsi tsb disusun sedemikian nisbah kera-
gaman data antar dan kelompok maksimum.
7 Cluster Mengelompokkan data ke dalam beberapa
Analysis kelompok sedemikian hingga data yang
berada di dalam kelompok yang sama
cenderung mempunyai sifat yang lebih
homogen daripada data yang berada di
kelompok yang berbeda

Analisis Statistika Multivariate 1


Distribusi Multinormal
Beberapa metode statistika multivariate seperti : MANOVA, dan discriminant
analysis seringkali mensyaratkan terpenuhinya asumsi distribusi multinormal. Asumsi ini
diperlukan karena di dalam MANOVA dan discriminant analysis dilakukan pengujian
dengan menggunakan statistik uji Wilk. Kesimpulan yang diambil berdasarkan statistik
ini dikatakan sahih (valid), jika syarat distribusi multinormal dipenuhi.
Variabel X i , X 2 ,..., X p dikatakan berditribusi normal multivariate dengan
parameter dan jika mempunyai probability density function :
1
1 ( X )' 1 ( X )
f ( X i , X 2 ,..., X p ) p/2
e 2

( 2 ) p / 2

Jika X i , X 2 ,..., X p berdistribusi normal multivariate maka ( X )' 1 ( X )


berditribusi p . Berdasarkan sifat ini maka pemeriksaan distribusi multinormal dapat
2

1

dilakukan dengan cara membuat q-q plot dari nilai d i X i X)' S ( X i X , i 1,..., n .
2

Tahapan dari pembuatan q-q plot ini adalah sebagai berikut (Johnson, 1990)
1. Mulai
2. Tentukan nilai vektor rata-rata : X
3. Tentukan nilai matriks varians-kovarians : S
4. Tentukan nilai jarak Mahalanobis setiap titik pengamatan dengan vektor rata-
1
ratanya d i X i X)' S ( X i X , i 1,..., n
2

5. Urutkan nilai d dari kecil ke besar : d (1) d ( 2) d ( 3) ... d ( n )
2 2 2 2 2
i

i 1/ 2
6. Tentukan nilai pi , i 1,..., n
n
qi

f ( ) d 2 p i
2
7. Tentukan nilai q i sedemikian hingga

2
8. Buat scatter-plot d (i ) dengan q i
9. Jika scatter-plot ini cenderung membentuk garis lurus dan lebih dari 50 %
nilai d i p ,0.50
2 2

10. Selesai

1
Implementasi pembuatan q-q plot dari nilai d i X i X)' S ( X i X , i 1,..., n
2

dalam macro MINITAB disajikan pada Lampiran 1.

Analisis Statistika Multivariate 2


Selain dengan memeriksa nilai jarak Mahalanobis setiap pengamatan dengan
vektor rata-ratanya. Menurut Mardia (1974) di dalam Rencher (1995) pemeriksaan
kemultinormalan data dapat juga dikaji melalui nilai multivariate skewnewss ( b1, p ) dan
kurtosisnya ( b2, p )

n n
1 1 n 2
b1, p
n2
g
i 1 j 1
3
ij dan b2, p g ii
n i 1
1
sedangkan g ij ( X i X)' S ( X j X)

Jika X i , X 2 ,..., X p dikatakan berditribusi normal multivariate maka :

( p 1)(n 1)(n 3)
z1 b1, p berditribusi p2 ( p 1)( p 2 ) / 6 dan
6 ( n 1)( p 1) 6

b2, p p ( p 2)
z2 berdistribusi normal baku.
8 p ( p 2) / n
Penentuan nilai z1, z2 dengan bantuan macro MINITAB disajikan pada Lampiran
2.

Kebebasan antar variabel


Variabel X i , X 2 ,..., X p dikatakan bersifat saling bebas (independent) jika
matriks korelasi antar variabel membentuk matriks identitas. Untuk menguji kebebasan
antar variabel ini dapar dilakukan uji Bartlett sphericity berikut (Morrison, 2005) :
Hipotesis :
Ho : R = I
H1 : R I
2 p 5
Statiistik uji : hitung n 1
2
ln R
6

Terima hipotesis Ho yang berarti antar variabel bersifat saling bebas jika nilai
2
12
p ( p 1) . Jika hipotesis ini yang diterima maka penggunanan metode
hitung
2

multivariate tidak layak terutama metode analisis komponen utama dan analisis faktor.
Penentuan nilai statistik uji Bartlett sphericity dengan bantuan macro MINITAB
disajikan pada Lampiran 3.

Analisis Statistika Multivariate 3


Kehomogenan Matriks Varians-Kovarians
Beberapa analisis statistika multivariate seperti discriminant analysis dan
MANOVA membutuhkan syarat matriks varians-kovarians yang homogen. Untuk menguji
syarat ini dapat dipergunakan statistik uji Box-M. Hipoteris dan statistik uji Box-M
adalah (Rencher, 1995) :
Hipotesis
Ho : 1 2 ... k
H1 : i j untuk i j
Statistik uji

1 k 1 k

2
hitung 2(1 c1 ) vi ln S i ln S pool v i
2 i 1 2 ii 1

dan
k

v S i i

k 1

1 2 p 2 3 p 1
S pool i 1
c1 v i ni 1
k
i 1 vi
k
6( p 1)( k 1)
vi
v
i 1
i i 1

Terima hipotesis nol yang berarti matriks varians-kovarians bersifat homogen jika

hitung
2
12
( k 1) p ( p 1
2

Analisis Statistika Multivariate 4


Outlier
Data tidak bersitribusi multinormal atau matriks varians-variansnya tidak homogen
bisa saja disebabkan oleh sedikit pengamatan yang mempunyai pola berbeda dengan
sebagian besar pengamatan. Pengamatan yang mempunyai perilaku seperti ini disebut
outlier. Contoh pengamatan yang merupakan outlier adalah negara Jepang (Gambar 1.)
Statistik uji yang dapat dipakai untuk mendeteksi adanya outlier adalah (Morrison, 2005)
n p 1 nd i2
Fi
p n 1 npd i2
2

Pengamatan ke-i adalah outlier jika Fi F ; p ,n p 1 Penentuan adanya outlier


dengan menggunakan macro MINITAB disajikan di Lampiran 4.

10 Japan

Belgium
Netherland
7

Denmark
France
6
Italy

Germany
5 Sweden
Produktivitas

4
UK
US
3
1500 1600 1700 1800 1900 2000 2100 2200

Jam kerja setahun

Gambar 1. Scater-plot produktivitas dan jam-kerja bebarapa negara-negara maju

Analisis Statistika Multivariate 5

Anda mungkin juga menyukai