Anda di halaman 1dari 16

ANALISIS STATISTIKA MULTIVARIATE

Analisis statistika multivariate adalah analisis statistika yang dikenakan pada data
yang terdiri dari banyak variabel dan antar variabel saling berkorelasi. Beberapa metode
yang termasuk ke dalam golongan analisis ini adalah :
# Metode Tujuan Model
1 Principal
Component
Analysis
Mereduksi dimensi data dengan cara
membangkitkan variabel baru (komponen
utama yang merupakan kombinasi linear
dari variabel asal sedemikan hingga varians
komponen utama menjadi maksimum dan
antar komponen utama bersi!at saling bebas
X a Y "
i
maks var(Y
i
dan
corr(Y
i
# Y
j
$%
& Factor
Analysis
Mereduksi dimensi data dengan cara
menyatakan variabel asal sebagai kombinasi
linear sejumlah !aktor# sedemikian hingga
sejumlah !aktor tersebut mampu menjelas'
kan sebesar mungkin keragaman data yang
dijelaskan oleh variabel asal.
+ CF X
maks var((F
) Cannonical
Correlation
Menganalisis hubungan antar dua kelompok
variabel dengan cara membangkitkan vari'
abel baru pada setiap kelompok. *ariabel
baru tersebut merupakan kombinasi linear
dari variabel asal. +ombinasi linearnya
ditentukan sedemikian hingga korelasi antar
variabel baru yang berasal dari dua ke'
lompok menjadi maksimum
Ada dua kelompok
variabel :X dan Y
dibangkitkan variabel
baru :
X a U "
i dan
Y b V "
i
sehingga
corr( i i
V U #
maks
dan corr( j i
V U #
$%
, Multivariate
Regression
Memodelkan hubungan antara kelompok
variabel respon (Y dengan kelompok
variabel (X) yang diduga mempengaruhi
variabel respon
+ X Y
- MANOVA Menganalisis hubungan antara vektor va'
riabel respon (Y yang diduga dipengaruhi
oleh beberapa perlakuan (treatment).
ijk ik k ijk
Y + +
i$1#...#t j$1#...#n
i
k$1#...#p
. Discriminant
Analysis
Membentuk !ungsi yang memisahkan antar
kelompok berdasarkan variabel pembeda#
!ungsi tsb disusun sedemikian nisbah kera'
gaman data antar dan kelompok maksimum.
/ Cluster
Analysis
Mengelompokkan data ke dalam beberapa
kelompok sedemikian hingga data yang
berada di dalam kelompok yang sama
cenderung mempunyai si!at yang lebih
homogen daripada data yang berada di
kelompok yang berbeda
Analisis 0tatistika Multivariate 1
Distribusi Multinormal
Beberapa metode statistika multivariate seperti : MANOVA dan !iscriminant
analysis seringkali mensyaratkan terpenuhinya asumsi distribusi multinormal. Asumsi
ini diperlukan karena di dalam MANOVA dan !iscriminant analysis dilakukan pengujian
dengan menggunakan statistik uji 1ilk. +esimpulan yang diambil berdasarkan statistik
ini dikatakan sahih (vali!) jika syarat distribusi multinormal dipenuhi.
*ariabel p i
X X X #...# #
& dikatakan berditribusi normal multivariate dengan
parameter dan jika mempunyai pro"a"ility !ensity #unction :
( " (
&
1
& 2
& 2
&
1
& (
1
#...# # (

X X
X X X e #
p
p
p i
3ika p i
X X X #...# #
& berdistribusi normal multivariate maka ( " (
1


X X
berditribusi
&
p

. Berdasarkan si!at ini maka pemeriksaan distribusi multinormal dapat


dilakukan dengan cara membuat $%$ plot dari nilai
( ) n i & !
i i i
#...# 1 # ( "
1 &


X X X X .
Tahapan dari pembuatan $%$ plot ini adalah sebagai berikut (3ohnson# 144%
1. Mulai
&. Tentukan nilai vektor rata'rata : X
). Tentukan nilai matriks varians'kovarians : S
,. Tentukan nilai jarak Mahalanobis setiap titik pengamatan dengan vektor rata'
ratanya ( ) n i & !
i i i
#...# 1 # ( "
1 &


X X X X
-. 5rutkan nilai
&
i
! dari kecil ke besar :
&
(
&
) (
&
& (
&
1 (
...
n
! ! ! !
.. Tentukan nilai
n i
n
i
p
i
#...# 1 #
& 2 1

/. Tentukan nilai
i
$
sedemikian hingga
i
$
p ! #
i


& &
(
6. Buat scatter%plot
&
(i
!
dengan i
$
4. 3ika scatter%plot ini cenderung membentuk garis lurus dan lebih dari -% 7
nilai
&
-% . % #
&
p i
!
1%. 0elesai
8mplementasi pembuatan $%$ plot dari nilai ( ) n i & !
i i i
#...# 1 # ( "
1 &


X X X X
dalam macro M898TAB disajikan pada :ampiran 1.
Analisis 0tatistika Multivariate &
0elain dengan memeriksa nilai jarak Mahalanobis setiap pengamatan dengan
vektor rata'ratanya. Menurut Mardia (14/, di dalam ;encher (144- pemeriksaan
kemultinormalan data dapat juga dikaji melalui nilai multivariate ske'ne'ss ( p
"
# 1 dan
kurtosisnya ( p
"
# &

n
i
n
j
ij p
g
n
"
1 1
)
&
# 1
1
dan

n
i
ii p
g
n
"
1
&
# &
1
sedangkan
( " (
1
X X S X X

j i ij
g
3ika p i
X X X #...# #
& dikatakan berditribusi normal multivariate maka :
[ ]
p
"
p n
n n p
(
# 1 1
. 1 ( 1 ( .
) ( 1 ( 1 (
+ +
+ + +

berditribusi
&
. 2 & ( 1 ( + + p p p

dan
n p p
p p "
(
p
2 & ( 6
& (
# &
&
+
+

berdistribusi normal baku.


<enentuan nilai =
1
# =
&
dengan bantuan macro M898TAB disajikan pada :ampiran
&.
Kebebasan antar variabel
*ariabel p i
X X X #...# #
& dikatakan bersi!at saling bebas (in!epen!ent) jika
matriks korelasi antar variabel membentuk matriks identitas. 5ntuk menguji kebebasan
antar variabel ini dapar dilakukan uji )artlett sp*ericity berikut (Morrison# &%%- :
>ipotesis :
>o : ; $ 8
>1 : ; 8
0tatiistik uji :
R
p
n
*itung
ln
.
- &
1
&

'
+

Terima hipotesis >o yang berarti antar variabel bersi!at saling bebas jika nilai
&
1 (
&
1
&

p p
*itung

. 3ika hipotesis ini yang diterima maka penggunanan metode
multivariate tidak layak terutama metode analisis komponen utama dan analisis !aktor.
<enentuan nilai statistik uji )artlett sp*ericity dengan bantuan macro M898TAB
disajikan pada :ampiran ).
Analisis 0tatistika Multivariate )
Keomo!enan Matri"s Varians#Kovarians
Beberapa analisis statistika multivariate seperti !iscriminant analysis dan
MANOVA membutuhkan syarat matriks varians'kovarians yang homogen. 5ntuk menguji
syarat ini dapat dipergunakan statistik uji Bo?'M. >ipoteris dan statistik uji Bo?'M
adalah (;encher# 144- :
>ipotesis
>o : k
...
& 1
>1 : j i

untuk
j i
0tatistik uji
1
]
1




k
i
k
ii
i pool i i *itung
v v c
1 1
1
&
ln
&
1
ln
&
1
1 ( & S S
dan

k
i
i
k
i
i i
pool
v
v
1
1
S
S

1
]
1

+
+
1
1
1
1
]
1

1 ( 1 ( .
1 ) & 1 1
&
1
1
1
k p
p p
v
v
c
k
i
k
i
i
i

1
i i
n v
Terima hipotesis nol yang berarti matriks varians'kovarians bersi!at homogen jika
&
1 ( 1 (
&
1
&
+

p p k
*itung

Analisis 0tatistika Multivariate ,
Outlier
@ata tidak bersitribusi multinormal atau matriks varians'variansnya tidak homogen
bisa saja disebabkan oleh sedikit pengamatan yang mempunyai pola berbeda dengan
sebagian besar pengamatan. <engamatan yang mempunyai perilaku seperti ini disebut
outlier+ (ontoh pengamatan yang merupakan outlier adalah negara 3epang (Aambar 1.
0tatistik uji yang dapat dipakai untuk mendeteksi adanya outlier adalah (Morrison# &%%-
( )
( )
& &
&
1
1
i
i
i
np! n p
n! p n
F

<engamatan ke'i adalah outlier jika 1 # B


>
p n p i
F F
<enentuan adanya outlier
dengan menggunakan macro M898TAB disajikan di :ampiran ,.
Jam kerja setahun
2200 2100 2000 1900 1800 1700 1600 1500
P
r
o
d
u
k
t
i
v
i
t
a
s
10
9
8
7
6
5
4
3
US
UK
Seden
!ether"and
Ja#an
$ta"%
&erman%
'ran(e
)enmark
*e"+ium
Aambar 1. &cater%plot produktivitas dan jam'kerja bebarapa negara'negara maju
Analisis 0tatistika Multivariate -
Ke!iatan $ra"ti"um
,-U!./0 )1!S$.0 U/*2! 3$'114P' 3$'114P5 3$.1/2,0 *2*05-/. &)P6,2P
27+hanistan 25 18 44 45 29 168 205
*an+"adesh 800 16 53 53 35 106 202
,am8odia 55 12 52 50 35 112 260
,hina 124 26 69 67 78 52 377
9on+ Kon+ 5494 94 80 75 77 5:8 14641
$ndia 283 26 59 58 52 79 275
$ndonesia 102 29 65 61 77 68 681
Ja#an 330 77 82 76 99 4:4 19860
5a"a%sia 58 43 72 66 78 25:6 2995
!: Korea 189 60 73 67 99 27:7 1000
Pakistan 143 32 58 57 35 101 406
Phi"i##ines 221 43 68 63 90 51 867
S: Korea 447 72 74 68 96 21:7 6627
Sin+a#ore 4456 100 79 73 88 5:7 14990
.aian 582 71 78 72 91 5:1 7055
.hai"and 115 22 72 65 93 37 1800
;ietnam 218 20 68 63 88 46 230
0umber data : (ontoh data 0<00 'orl!,-+sav
+etrangan variabel :
*ariabel <enjelasan
Density Banyaknya penduduk per km persegi
.r"an <ersentase penduduk yang tinggal di perkotaan
/i#ee0p# >arapan hidup penduduk perempuan (tahun
/igee0pm >arapan hidup penduduk laki'laki (tahun
/iteracy <ersentase penduduk yang bisa baca'tulis
)a"ymort Banyaknya kematian bayi per 1%%% kelahiran
1!p2cap <enghasilan penduduk per kapita pertahun (50C
1. <eriksa kemultinormalan data kependudukan negara'negara di Asia dengan
a. Menggunakan $%$ plot dari nilai ( ) n i & !
i i i
#...# 1 # ( "
1 &


X X X X
b. Menggunakan multivariate ske'ness dan multivariate kurtosis
&. Apakah data di atas layak dianalisis dengan menggunakan analisis statistika
multivariate
). Tentukan negara'negara yang dianggap outlier jika ada outlier maka hapus
negara yang paling outlier (9ilai sig2# paling kecil kemudian lakukan pengujian
kemultinormalan melalui multivariate ske'ness dan kurtosis+
,. @engan menggunakan variabel yang sama# ujilah apakah matriks varians'
kovarians A!rika sama dengan Amerika :atin atau tidak # jika tidak sama# coba
lakukan penghapusan beberapa negara yang dianggap outlier
Analisis 0tatistika Multivariate .
$en%elesaian
1a. $%$ plot dari nilai ( ) n i & !
i i i
#...# 1 # ( "
1 &


X X X X untuk data kependudukan
negara'negara di Asia adalah :
MTB > %qq.txt c2-c8

t 0.529412
distribusi data multinormal
$%$ plot dari nilai ( ) n i & !
i i i
#...# 1 # ( "
1 &


X X X X cenderung
membentuk garis kurus dan ada lebih dari -% 7 (-&.4,1& 7 nilai
&
-% . % #
&
p i
!

sehingga data diatas cenderung berdistribusi multinormal.
1b. <emeriksaan kemultinormalan data melalui multivariate ske'ness dan kurtosis
adalah :
MTB > %mardia.txt c2-c8
Multivariat s!"nss
b1 ##.2#8$
%1 115.$12
&valu 0.012$$05
Multivariat !urtosis
b2 $0.5424
%2 -0.451#5#
&valu 0.$51'#5
Pvalue untuk statistik uji multivariate ske'ness lebih kecil dari
(5 %) sehingga data kependudukan negara'negara di Asia cenderung tidak
berdistribusi multinormal
Analisis 0tatistika Multivariate /
&. +elayakan penggunaan analisis statistika multivariate dapat dikaji melalui dua
sisi yaitu sisi terapan dan sisi statistika. @ari sisi terapan dapat ditunjukkan bahDa
berdasarkan re!erensi disiplin ilmu kependudukan# variabel'variabel di atas
memang saling terkait satu dengan yang lainnya. @ari disiplin ilmu statistika#
keeratan hubungan antar variabel dapat dilakukan melalui pengujian terhadap
matriks korelasi. Apakah matriks korelasinya membentuk matriks identitas atau
tidak# jika matriks korelasinya setelah diuji berbeda secara signi#icant dengan
matriks identitas maka dapat disimpulkan bahDa ada hubungan antar variabel.
0ehingga data ini layak di analisis dengan menggunakan analisis statistika
multivariate+ 3ika matriks korelasinya setelah diuji tidak berbeda dengan matriks
identitas# maka diduga sampel yang diperoleh tidak cukup# sehingga disarankan
untuk menambah sampel. @iharapkan setelah dilakukan penambahan sampel
maka hasil pengujian matriks korelasi berbeda dengan matriks identitas. +arena
dari hasil pengujian )artlett sp*ericity dapat disimpulkan perlunya penambahan
sampel maka uji ini disebut juga uji kecukupan sampel. @engan bantuan
M898TAB pengujian ini dapat diilakukan dengan cara :
MTB > %bart.txt c2-c8
c(is 1'8.#98
&valu 0
pvalue dari statistik uji )artlett sp*ericity lebih kecil dari (- 7 sehingga dapat
disimpulkan matriks korelasi antar variabel berbeda dengan matriks identitas.
+arena matriks korelasi bukan merupakan matriks identitas maka analisis
statistika multivariate layak untuk digunakan.
Analisis 0tatistika Multivariate 6
). 0uatu pengamatan diakatakan outlier jika nilai
( )
( )
& &
&
1
1
i
i
i
np! n p
n! p n
F

melampaui
1 # B
>
p n p i
F F
# dengan menggunakan macro M898TAB hal ini dapat
diselesaikan dengan cara :
MTB > %outlir.txt c1-c8
)o" *+,-T). d /0valu si10/
1 Afghanistan 10.9875 3.4699 0.043306
2 Ban1lads( 4.8952 0.$192 0.'29851
# *ambodia 4.'22# 0.58'4 0.'52289
4 *(ina 5.4980 0.'#94 0.$4$985
5 Hong Kong 11.0696 3.5676 0.040074
$ 2ndia 4.$'08 0.5'81 0.'588#'
' 2ndonsia 1.$888 0.1$24 0.98'188
8 Japan 13.6454 12.4126 0.000564
9 Mala3sia $.011' 0.854# 0.5'2$4'
10 -. 4ora 5.2$4$ 0.$911 0.$'9801
11 5a!istan 10.551# #.009$ 0.0$#4''
12 5(ili&&ins 2.815$ 0.295' 0.9#8851
1# 6. 4ora 5.9$21 0.842' 0.5'9908
14 6in1a&or 9.4582 2.1'1# 0.1#81'8
15 Tai"an 4.$4$5 0.5'#8 0.'$1898
1$ T(ailand 5.40#$ 0.'19$ 0.$$0#5#
1' 7itnam 4.'088 0.5849 0.'54010
Ada ) negara yang dianggap outlier yaitu 3epang# >ongkong dan A!ganistan.
>asil pengujian kemultinormalan setelah 3epang dikeluarkan adalah :
MTB > dlt 8 c1-c8
MTB > %mardia.txt c2-c8
Multivariat s!"nss
b1 #0.1551
%1 99.8985
&valu 0.11#$2$
Multivariat !urtosis
b2 5$.8194
%2 -1.10122
&valu 0.2'0800
0etelah 3epang dikeluarkan# ternyata data kependudukan 9egara'negara di Asia
berdistribusi multinormal. @ari contoh ini dapat ditunjukkan bahDa adanya
outlier dapat menyebabkan data tidak berdistribusi multinormal.
Analisis 0tatistika Multivariate 4
,. <engujian kesamaan matriks varians'kovarian untuk region A!rika dan Amerika
:atin dapat dilakukan dengan cara :
' Memilih negara'negara di region A!rika dan Amerika :atin
klik @ata# 0elect (ases
kemudian klik i! dan ketik region$, or region$.
klik (ontinue kemudian E+
Analisis 0tatistika Multivariate 1%
' Melakuan pengujian kehomogenan matriks varians'kovarians
klik Analy=e# (lasi!y# @iscriminant
klik 0tatistics
klik (ontinue kemudian E+
Test Results
70:555
2:015
28
4918:900
:001
*o<=s 5
2##ro<:
d71
d72
Si+:
'
.ests nu"" h%#othesis o7 e>ua" #o#u"ation (ovarian(e matri(es:
9ilai signi#icance statistik uji Bo?'M lebih kecil dari -7# sehingga disimpulkan
matriks varians'kovarians region A!rika dan Amerika :atin tidak homogen# di
duga ketidakhomogenan ini disebabkan adanya outlier+
Analisis 0tatistika Multivariate 11
@eteksi outlier 9egara'negara di A!rika dan Amerika :atin adalah :
MTB > %outlir.txt c1-c8
)o" *+,-T). d /0valu si10/
2 Barbados #0.0922 1'.#411 0.000000
5 Bra%il 1#.2080 2.4##0 0.040$04
#4 6omalia 15.'2'$ #.2245 0.0105'8
40 8ambia 1$.9#5# #.$'09 0.005090
>asil pengujian kehomogenan matriks varians'kovarians setelah Barbados
dikeluarkan adalah :
Test Results
55:121
1:564
28
4741:799
:030
*o<=s 5
2##ro<:
d71
d72
Si+:
'
.ests nu"" h%#othesis o7 e>ua" #o#u"ation (ovarian(e matri(es:
>asil pengujian kehomogenan matriks varians'kovarians setelah Barbados dan
Fambia dikeluarkan adalah :
Test Results
51:217
1:441
28
4403:414
:062
*o<=s 5
2##ro<:
d71
d72
Si+:
'
.ests nu"" h%#othesis o7 e>ua" #o#u"ation (ovarian(e matri(es:
0etelah Barbados dan Fambia dikeluarkan maka matriks varians'kovarians sudah
bersi!at homogen pada 5%. 0eandainya setelah dilakukan pembuangan data
outlier matriks varians'kovarians belum bersi!at homogen maka dapat dicoba
dilakukan trans!or'masi Bo?'(o? dengan mencobakan berbagai nilai . >asil
trans!ormasi ini tidak selalu berhasil menghomogenkan matriks varians'
kovarians. 3ika matriks varians'kovarians tidak bisa dihomogenkan maka dapat
dilakukan metode statistika yang lain yang tidak membutukan asumsi ini.
Analisis 0tatistika Multivariate 1&
Lam&iran '( Macro M898TAB untuk memeriksa kemultinormalan @ATA dari $%
$ plot nilai ( ) n i & !
i i i
#...# 1 # ( "
1 &


X X X X
macro
qq x.1-x.&
mconstant i n & t c(is
mcolumn d x.1-x.& dd &i q ss tt
mmatrix s sinv ma mb mc md
lt n9count:x.1;
cova x.1-x.& s
invrt s sinv
do i91<&
lt x.i9x.i-man:x.i;
nddo
do i91<n
co&3 x.1-x.& ma=
us i.
trans&os ma mb
multi&l3 ma sinv mc
multi&l3 mc mb md
co&3 md tt
lt t9tt:1;
lt d:i;9t
nddo
st &i
1<n
nd
lt &i9:&i-0.5;>n
sort d dd
invcd/ &i q=
c(is &.
&lot q?dd
invcd/ 0.5 c(is=
c(is &.
lt ss9dd@c(is
lt t9sum:ss;>n
&rint t
i/ t>0.5
not distribusi data multinormal
ndi/
i/ t@90.5
not distribusi data bu!an multinormal
ndi/
ndmacro
Analisis 0tatistika Multivariate 1)
Lam&iran )( Macro M898TAB untuk menguji kemultinormalan data melalui
multivariate ske'ness dan multivariate kurtosis
macro
mardia 3.1-3.&
mconstant i A n & 1 b1 b2 %1 %2 %% v && &valu
mcolumn x.1-x.& 3.1-3.& %.1-%.& t
mmatrix s sinv mi mA mAt ma mat mb mc md
lt n9count:3.1;
do i91<&
lt x.i93.i-man:3.i;
lt %.i9x.i>sqrt:n;
nddo
co&3 %.1-%.& ma
trans&os ma mat
multi&l3 mat ma s
invrt s sinv
lt b190
lt b290
do i91<n
co&3 x.1-x.& mi=
us i.
do A91<n
co&3 x.1-x.& mA=
us A.
trans&os mA mAt
multi&l3 mi sinv mc
multi&l3 mc mAt md
co&3 md t
lt 19t:1;
lt b19b1B1?1?1
i/ i9A
lt b29b2B1?1
ndi/
nddo
nddo
lt b19b1>:n?n;
lt b29b2>n
lt %19:&B1;?:nB1;?:nB#;?b1>:$?::nB1;?:&B1;-$;;
lt %29:b2-&?:&B2;;>sqrt:8?&?:&B2;>n;
lt v9&?:&B1;?:&B2;>$
not Multivariat s!"nss
cd/ %1 &&=
c(is v.
lt &valu91-&&
&rint b1 %1 &valu
not Multivariat !urtosis
lt %%9abs:%2;
cd/ %% &&=
normal 0 1.
lt &valu92?:1-&&;
&rint b2 %2 &valu
ndmacro
Analisis 0tatistika Multivariate 1,
Lam&iran *( Macro M898TAB untuk menguji kebebasan antar variabel dengan )artlett
sp*ericity test
macro
bart x.1-x.&
mconstant i n & d c(is && &valu v
mcolumn x.1-x.& i1n
mmatrix r
lt n9count:x.1;
corr x.1-x.& r
i1nvalus r i1n
lt d90
do i91<&
lt d9dBlo1:i1n:i;;
nddo
lt c(is9-:n-1-:2?&B5;>$;?d
lt v9&?:&-1;>2
cd/ c(is &&=
c(is v.
lt &valu91-&&
&rint c(is &valu
ndmacro
Analisis 0tatistika Multivariate 1-
Lam&iran +( Macro M898TAB untuk mendeteksi adanya multivariete outlier
macro
outlir obs 3.1-3.&
mconstant i n & d/
mcolumn d x.1-x.& 3.1-3.& dd &i /0valu tt obs &1 si10/
mmatrix s sinv ma mb mc md
lt n9count:3.1;
cova 3.1-3.& s
invrt s sinv
do i91<&
lt x.i93.i-man:3.i;
nddo
do i91<n
co&3 x.1-x.& ma=
us i.
trans&os ma mb
multi&l3 ma sinv mc
multi&l3 mc mb md
co&3 md tt
lt d:i;9tt:1;
nddo
lt /0valu9::n-&-1;?n?d;>:&?:n-1;??2-n?&?d;
lt d/9n-&-1
cd/ /0valu &1=
/ & d/.
lt si10/91-&1
&rint obs d /0valu si10/
ndmacro
Analisis 0tatistika Multivariate 1.

Anda mungkin juga menyukai