Analisis Statistika Multivariate
Analisis Statistika Multivariate
Analisis statistika multivariate adalah analisis statistika yang dikenakan pada data
yang terdiri dari banyak variabel dan antar variabel saling berkorelasi. Beberapa metode
yang termasuk ke dalam golongan analisis ini adalah :
# Metode Tujuan Model
1 Principal
Component
Analysis
Mereduksi dimensi data dengan cara
membangkitkan variabel baru (komponen
utama yang merupakan kombinasi linear
dari variabel asal sedemikan hingga varians
komponen utama menjadi maksimum dan
antar komponen utama bersi!at saling bebas
X a Y "
i
maks var(Y
i
dan
corr(Y
i
# Y
j
$%
& Factor
Analysis
Mereduksi dimensi data dengan cara
menyatakan variabel asal sebagai kombinasi
linear sejumlah !aktor# sedemikian hingga
sejumlah !aktor tersebut mampu menjelas'
kan sebesar mungkin keragaman data yang
dijelaskan oleh variabel asal.
+ CF X
maks var((F
) Cannonical
Correlation
Menganalisis hubungan antar dua kelompok
variabel dengan cara membangkitkan vari'
abel baru pada setiap kelompok. *ariabel
baru tersebut merupakan kombinasi linear
dari variabel asal. +ombinasi linearnya
ditentukan sedemikian hingga korelasi antar
variabel baru yang berasal dari dua ke'
lompok menjadi maksimum
Ada dua kelompok
variabel :X dan Y
dibangkitkan variabel
baru :
X a U "
i dan
Y b V "
i
sehingga
corr( i i
V U #
maks
dan corr( j i
V U #
$%
, Multivariate
Regression
Memodelkan hubungan antara kelompok
variabel respon (Y dengan kelompok
variabel (X) yang diduga mempengaruhi
variabel respon
+ X Y
- MANOVA Menganalisis hubungan antara vektor va'
riabel respon (Y yang diduga dipengaruhi
oleh beberapa perlakuan (treatment).
ijk ik k ijk
Y + +
i$1#...#t j$1#...#n
i
k$1#...#p
. Discriminant
Analysis
Membentuk !ungsi yang memisahkan antar
kelompok berdasarkan variabel pembeda#
!ungsi tsb disusun sedemikian nisbah kera'
gaman data antar dan kelompok maksimum.
/ Cluster
Analysis
Mengelompokkan data ke dalam beberapa
kelompok sedemikian hingga data yang
berada di dalam kelompok yang sama
cenderung mempunyai si!at yang lebih
homogen daripada data yang berada di
kelompok yang berbeda
Analisis 0tatistika Multivariate 1
Distribusi Multinormal
Beberapa metode statistika multivariate seperti : MANOVA dan !iscriminant
analysis seringkali mensyaratkan terpenuhinya asumsi distribusi multinormal. Asumsi
ini diperlukan karena di dalam MANOVA dan !iscriminant analysis dilakukan pengujian
dengan menggunakan statistik uji 1ilk. +esimpulan yang diambil berdasarkan statistik
ini dikatakan sahih (vali!) jika syarat distribusi multinormal dipenuhi.
*ariabel p i
X X X #...# #
& dikatakan berditribusi normal multivariate dengan
parameter dan jika mempunyai pro"a"ility !ensity #unction :
( " (
&
1
& 2
& 2
&
1
& (
1
#...# # (
X X
X X X e #
p
p
p i
3ika p i
X X X #...# #
& berdistribusi normal multivariate maka ( " (
1
X X
berditribusi
&
p
/. Tentukan nilai i
$
sedemikian hingga
i
$
p ! #
i
& &
(
6. Buat scatter%plot
&
(i
!
dengan i
$
4. 3ika scatter%plot ini cenderung membentuk garis lurus dan lebih dari -% 7
nilai
&
-% . % #
&
p i
!
1%. 0elesai
8mplementasi pembuatan $%$ plot dari nilai ( ) n i & !
i i i
#...# 1 # ( "
1 &
X X X X
dalam macro M898TAB disajikan pada :ampiran 1.
Analisis 0tatistika Multivariate &
0elain dengan memeriksa nilai jarak Mahalanobis setiap pengamatan dengan
vektor rata'ratanya. Menurut Mardia (14/, di dalam ;encher (144- pemeriksaan
kemultinormalan data dapat juga dikaji melalui nilai multivariate ske'ne'ss ( p
"
# 1 dan
kurtosisnya ( p
"
# &
n
i
n
j
ij p
g
n
"
1 1
)
&
# 1
1
dan
n
i
ii p
g
n
"
1
&
# &
1
sedangkan
( " (
1
X X S X X
j i ij
g
3ika p i
X X X #...# #
& dikatakan berditribusi normal multivariate maka :
[ ]
p
"
p n
n n p
(
# 1 1
. 1 ( 1 ( .
) ( 1 ( 1 (
+ +
+ + +
berditribusi
&
. 2 & ( 1 ( + + p p p
dan
n p p
p p "
(
p
2 & ( 6
& (
# &
&
+
+
'
+
Terima hipotesis >o yang berarti antar variabel bersi!at saling bebas jika nilai
&
1 (
&
1
&
p p
*itung
. 3ika hipotesis ini yang diterima maka penggunanan metode
multivariate tidak layak terutama metode analisis komponen utama dan analisis !aktor.
<enentuan nilai statistik uji )artlett sp*ericity dengan bantuan macro M898TAB
disajikan pada :ampiran ).
Analisis 0tatistika Multivariate )
Keomo!enan Matri"s Varians#Kovarians
Beberapa analisis statistika multivariate seperti !iscriminant analysis dan
MANOVA membutuhkan syarat matriks varians'kovarians yang homogen. 5ntuk menguji
syarat ini dapat dipergunakan statistik uji Bo?'M. >ipoteris dan statistik uji Bo?'M
adalah (;encher# 144- :
>ipotesis
>o : k
...
& 1
>1 : j i
untuk
j i
0tatistik uji
1
]
1
k
i
k
ii
i pool i i *itung
v v c
1 1
1
&
ln
&
1
ln
&
1
1 ( & S S
dan
k
i
i
k
i
i i
pool
v
v
1
1
S
S
1
]
1
+
+
1
1
1
1
]
1
1 ( 1 ( .
1 ) & 1 1
&
1
1
1
k p
p p
v
v
c
k
i
k
i
i
i
1
i i
n v
Terima hipotesis nol yang berarti matriks varians'kovarians bersi!at homogen jika
&
1 ( 1 (
&
1
&
+
p p k
*itung
Analisis 0tatistika Multivariate ,
Outlier
@ata tidak bersitribusi multinormal atau matriks varians'variansnya tidak homogen
bisa saja disebabkan oleh sedikit pengamatan yang mempunyai pola berbeda dengan
sebagian besar pengamatan. <engamatan yang mempunyai perilaku seperti ini disebut
outlier+ (ontoh pengamatan yang merupakan outlier adalah negara 3epang (Aambar 1.
0tatistik uji yang dapat dipakai untuk mendeteksi adanya outlier adalah (Morrison# &%%-
( )
( )
& &
&
1
1
i
i
i
np! n p
n! p n
F
melampaui
1 # B
>
p n p i
F F
# dengan menggunakan macro M898TAB hal ini dapat
diselesaikan dengan cara :
MTB > %outlir.txt c1-c8
)o" *+,-T). d /0valu si10/
1 Afghanistan 10.9875 3.4699 0.043306
2 Ban1lads( 4.8952 0.$192 0.'29851
# *ambodia 4.'22# 0.58'4 0.'52289
4 *(ina 5.4980 0.'#94 0.$4$985
5 Hong Kong 11.0696 3.5676 0.040074
$ 2ndia 4.$'08 0.5'81 0.'588#'
' 2ndonsia 1.$888 0.1$24 0.98'188
8 Japan 13.6454 12.4126 0.000564
9 Mala3sia $.011' 0.854# 0.5'2$4'
10 -. 4ora 5.2$4$ 0.$911 0.$'9801
11 5a!istan 10.551# #.009$ 0.0$#4''
12 5(ili&&ins 2.815$ 0.295' 0.9#8851
1# 6. 4ora 5.9$21 0.842' 0.5'9908
14 6in1a&or 9.4582 2.1'1# 0.1#81'8
15 Tai"an 4.$4$5 0.5'#8 0.'$1898
1$ T(ailand 5.40#$ 0.'19$ 0.$$0#5#
1' 7itnam 4.'088 0.5849 0.'54010
Ada ) negara yang dianggap outlier yaitu 3epang# >ongkong dan A!ganistan.
>asil pengujian kemultinormalan setelah 3epang dikeluarkan adalah :
MTB > dlt 8 c1-c8
MTB > %mardia.txt c2-c8
Multivariat s!"nss
b1 #0.1551
%1 99.8985
&valu 0.11#$2$
Multivariat !urtosis
b2 5$.8194
%2 -1.10122
&valu 0.2'0800
0etelah 3epang dikeluarkan# ternyata data kependudukan 9egara'negara di Asia
berdistribusi multinormal. @ari contoh ini dapat ditunjukkan bahDa adanya
outlier dapat menyebabkan data tidak berdistribusi multinormal.
Analisis 0tatistika Multivariate 4
,. <engujian kesamaan matriks varians'kovarian untuk region A!rika dan Amerika
:atin dapat dilakukan dengan cara :
' Memilih negara'negara di region A!rika dan Amerika :atin
klik @ata# 0elect (ases
kemudian klik i! dan ketik region$, or region$.
klik (ontinue kemudian E+
Analisis 0tatistika Multivariate 1%
' Melakuan pengujian kehomogenan matriks varians'kovarians
klik Analy=e# (lasi!y# @iscriminant
klik 0tatistics
klik (ontinue kemudian E+
Test Results
70:555
2:015
28
4918:900
:001
*o<=s 5
2##ro<:
d71
d72
Si+:
'
.ests nu"" h%#othesis o7 e>ua" #o#u"ation (ovarian(e matri(es:
9ilai signi#icance statistik uji Bo?'M lebih kecil dari -7# sehingga disimpulkan
matriks varians'kovarians region A!rika dan Amerika :atin tidak homogen# di
duga ketidakhomogenan ini disebabkan adanya outlier+
Analisis 0tatistika Multivariate 11
@eteksi outlier 9egara'negara di A!rika dan Amerika :atin adalah :
MTB > %outlir.txt c1-c8
)o" *+,-T). d /0valu si10/
2 Barbados #0.0922 1'.#411 0.000000
5 Bra%il 1#.2080 2.4##0 0.040$04
#4 6omalia 15.'2'$ #.2245 0.0105'8
40 8ambia 1$.9#5# #.$'09 0.005090
>asil pengujian kehomogenan matriks varians'kovarians setelah Barbados
dikeluarkan adalah :
Test Results
55:121
1:564
28
4741:799
:030
*o<=s 5
2##ro<:
d71
d72
Si+:
'
.ests nu"" h%#othesis o7 e>ua" #o#u"ation (ovarian(e matri(es:
>asil pengujian kehomogenan matriks varians'kovarians setelah Barbados dan
Fambia dikeluarkan adalah :
Test Results
51:217
1:441
28
4403:414
:062
*o<=s 5
2##ro<:
d71
d72
Si+:
'
.ests nu"" h%#othesis o7 e>ua" #o#u"ation (ovarian(e matri(es:
0etelah Barbados dan Fambia dikeluarkan maka matriks varians'kovarians sudah
bersi!at homogen pada 5%. 0eandainya setelah dilakukan pembuangan data
outlier matriks varians'kovarians belum bersi!at homogen maka dapat dicoba
dilakukan trans!or'masi Bo?'(o? dengan mencobakan berbagai nilai . >asil
trans!ormasi ini tidak selalu berhasil menghomogenkan matriks varians'
kovarians. 3ika matriks varians'kovarians tidak bisa dihomogenkan maka dapat
dilakukan metode statistika yang lain yang tidak membutukan asumsi ini.
Analisis 0tatistika Multivariate 1&
Lam&iran '( Macro M898TAB untuk memeriksa kemultinormalan @ATA dari $%
$ plot nilai ( ) n i & !
i i i
#...# 1 # ( "
1 &
X X X X
macro
qq x.1-x.&
mconstant i n & t c(is
mcolumn d x.1-x.& dd &i q ss tt
mmatrix s sinv ma mb mc md
lt n9count:x.1;
cova x.1-x.& s
invrt s sinv
do i91<&
lt x.i9x.i-man:x.i;
nddo
do i91<n
co&3 x.1-x.& ma=
us i.
trans&os ma mb
multi&l3 ma sinv mc
multi&l3 mc mb md
co&3 md tt
lt t9tt:1;
lt d:i;9t
nddo
st &i
1<n
nd
lt &i9:&i-0.5;>n
sort d dd
invcd/ &i q=
c(is &.
&lot q?dd
invcd/ 0.5 c(is=
c(is &.
lt ss9dd@c(is
lt t9sum:ss;>n
&rint t
i/ t>0.5
not distribusi data multinormal
ndi/
i/ t@90.5
not distribusi data bu!an multinormal
ndi/
ndmacro
Analisis 0tatistika Multivariate 1)
Lam&iran )( Macro M898TAB untuk menguji kemultinormalan data melalui
multivariate ske'ness dan multivariate kurtosis
macro
mardia 3.1-3.&
mconstant i A n & 1 b1 b2 %1 %2 %% v && &valu
mcolumn x.1-x.& 3.1-3.& %.1-%.& t
mmatrix s sinv mi mA mAt ma mat mb mc md
lt n9count:3.1;
do i91<&
lt x.i93.i-man:3.i;
lt %.i9x.i>sqrt:n;
nddo
co&3 %.1-%.& ma
trans&os ma mat
multi&l3 mat ma s
invrt s sinv
lt b190
lt b290
do i91<n
co&3 x.1-x.& mi=
us i.
do A91<n
co&3 x.1-x.& mA=
us A.
trans&os mA mAt
multi&l3 mi sinv mc
multi&l3 mc mAt md
co&3 md t
lt 19t:1;
lt b19b1B1?1?1
i/ i9A
lt b29b2B1?1
ndi/
nddo
nddo
lt b19b1>:n?n;
lt b29b2>n
lt %19:&B1;?:nB1;?:nB#;?b1>:$?::nB1;?:&B1;-$;;
lt %29:b2-&?:&B2;;>sqrt:8?&?:&B2;>n;
lt v9&?:&B1;?:&B2;>$
not Multivariat s!"nss
cd/ %1 &&=
c(is v.
lt &valu91-&&
&rint b1 %1 &valu
not Multivariat !urtosis
lt %%9abs:%2;
cd/ %% &&=
normal 0 1.
lt &valu92?:1-&&;
&rint b2 %2 &valu
ndmacro
Analisis 0tatistika Multivariate 1,
Lam&iran *( Macro M898TAB untuk menguji kebebasan antar variabel dengan )artlett
sp*ericity test
macro
bart x.1-x.&
mconstant i n & d c(is && &valu v
mcolumn x.1-x.& i1n
mmatrix r
lt n9count:x.1;
corr x.1-x.& r
i1nvalus r i1n
lt d90
do i91<&
lt d9dBlo1:i1n:i;;
nddo
lt c(is9-:n-1-:2?&B5;>$;?d
lt v9&?:&-1;>2
cd/ c(is &&=
c(is v.
lt &valu91-&&
&rint c(is &valu
ndmacro
Analisis 0tatistika Multivariate 1-
Lam&iran +( Macro M898TAB untuk mendeteksi adanya multivariete outlier
macro
outlir obs 3.1-3.&
mconstant i n & d/
mcolumn d x.1-x.& 3.1-3.& dd &i /0valu tt obs &1 si10/
mmatrix s sinv ma mb mc md
lt n9count:3.1;
cova 3.1-3.& s
invrt s sinv
do i91<&
lt x.i93.i-man:3.i;
nddo
do i91<n
co&3 x.1-x.& ma=
us i.
trans&os ma mb
multi&l3 ma sinv mc
multi&l3 mc mb md
co&3 md tt
lt d:i;9tt:1;
nddo
lt /0valu9::n-&-1;?n?d;>:&?:n-1;??2-n?&?d;
lt d/9n-&-1
cd/ /0valu &1=
/ & d/.
lt si10/91-&1
&rint obs d /0valu si10/
ndmacro
Analisis 0tatistika Multivariate 1.