Anda di halaman 1dari 13

TUGAS PRAKTIKUM 3

ANALISIS DATA MULTIVARIAT I


Diajukan Sebagai Salah Satu Syarat Untuk Memenuhi Tugas Mata Kuliah
Analisis Data Multivariat I

Dosen Pengampu :
Drs. Achmad Bachrudin. ,M.S

Disusun Oleh:

Novia Sukmawati

140610160084

KELAS C

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM


UNIVERSITAS PADJADJARAN
2018
JARAK DAN DISTRIBUSI NORMAL MULTIVARIAT

1. JARAK MAHALANOBIS
Jarak Mahalanobis adalah suatu metode statistika yang digunakan untuk
mendapatkan suatu data dengan jarak tertentu terhadap mean data tersebut sehingga
diperoleh suatu penyebaran data yang memiliki pola terhadap nilai mean.

𝑑𝑖 = √(𝑋⃗𝑖 − 𝑋̅)𝑇 𝑆 −1 (𝑋⃗𝑖 − 𝑋̅)

Dengan : 𝑑𝑖 = 𝐽𝑎𝑟𝑎𝑘 𝑚𝑎ℎ𝑎𝑙𝑎𝑛𝑜𝑏𝑖𝑠


𝑋⃗𝑖 = 𝑉𝑒𝑘𝑡𝑜𝑟 𝑏𝑒𝑟𝑑𝑎𝑠𝑎𝑟𝑘𝑎𝑛 𝑑𝑎𝑡𝑎𝑛𝑦𝑎
𝑋̅ = 𝑉𝑒𝑘𝑡𝑜𝑟 𝑦𝑎𝑛𝑔 𝑏𝑒𝑟𝑖𝑠𝑖 𝑟𝑎𝑡𝑎 − 𝑟𝑎𝑡𝑎 𝑑𝑎𝑟𝑖 𝑑𝑎𝑡𝑎
𝑆 = 𝑀𝑎𝑡𝑟𝑖𝑘𝑠 𝑣𝑎𝑟𝑖𝑎𝑛𝑠 − 𝑘𝑜𝑣𝑎𝑟𝑖𝑎𝑛𝑠

Metode ini memiliki karakteristik yaitu dilihat dari rumusnya metode ini memiliki
nilai penguat yang fleksibel sehingga mudah disesuaikan dengan perubahan kondisi,
hal ini yang menyebabkan metode ini lebih akurat dibanding metode lain yang juga
digunakan untuk mencari nilai penyebaran data, misal metode Euclidean distance.
Penguat dari mahalanibis distance ini ada pada nilai covariannya, nilai penguat ini
yang membuat mahalanobis distance memiliki bidang atau luasan yang berbentuk
ellips.Bentuk penyebaran dari mahalanobis distance ini adalah berupa bidang ellips,
makin besar nilai matrik covarian (<1)

Contoh Kasus :

Akan dihitung Jarak Mahalanobis dari

𝑋1 𝑋2 𝑋3
MA2 3 4 4
EM2 3 5 4
CA2 3 7 6
MA3 4 5 3
EM3 4 6 4
CA3 4 8 7
Tabel 1. Tabel Data untuk Menghitung Jarak

Dengan Menggunakan Software R akan dicari Jarak Mahalanobisnya yaitu sebagai


berikut :
> X1=c(3,3,3,4,4,4)

> X2=c(4,5,7,5,6,8)

> X3=c(4,4,6,3,4,7)

> data=cbind(X1,X2,X3)
> data

X1 X2 X3

[1,] 3 4 4

[2,] 3 5 4

[3,] 3 7 6

[4,] 4 5 3

[5,] 4 6 4

[6,] 4 8 7

#Mencari Matriks Varians Kovarians

> S=cov(data)

> S

X1 X2 X3

X1 0.3 0.300000 0.000000

X2 0.3 2.166667 1.933333

X3 0.0 1.933333 2.266667

#Mencari Rata-Rata

> r=colMeans(data)

> r

X1 X2 X3

3.500000 5.833333 4.666667

> MA2=c(3,4,4)

> EM2=c(3,5,4)

> CA2=c(3,7,6)

> MA3=c(4,5,3)

> EM3=c(4,6,4)

> CA3=c(4,8,7)

> a=MA2-r

> b=EM2-r

> c=CA2-r

> d=MA3-r
> e=EM3-r

> f=CA3-r

#Mencari jarak mahalonobis

> d1=sqrt(t(a)%*%solve(S)%*%a)

> d1

[,1]

[1,] 1.927749

> d2=sqrt(t(b)%*%solve(S)%*%b)

> d2

[,1]

[1,] 1.133042

> d3=sqrt(t(c)%*%solve(S)%*%c)

> d3

[,1]

[1,] 1.704525

> d4=sqrt(t(d)%*%solve(S)%*%d)

> d4

[,1]

[1,] 1.447271

> d5=sqrt(t(e)%*%solve(S)%*%e)

> d5

[,1]

[1,] 1.133042

> d6=sqrt(t(f)%*%solve(S)%*%f)

> d6

[,1]

[1,] 1.927749

Dari Hasil Melalui Software R diatas maka diperoleh 6 Jarak Mahalanobis yaitu
diperoleh jarak Mahalanobis untuk MA2 sebesar 1.927749 , jarak Mahalanobis untuk
EM2 sebesar 1.133042 , jarak Mahalanobis untuk CA2 sebesar 1.704525 , jarak
Mahalanobis untuk MA3 sebesar 1.447271, jarak Mahalanobis untuk EM3 sebesar
1.133042,dan jarak Mahalanobis untuk CA3 sebesar 1.927749.
2. DISTRIBUSI NORMAL MULTIVARIAT
Analisis Multivariat merupajan metode pengolahan variabel dalam jumlah
yang banyak, dimana tujuannya adalah untuk mencari pengaruh variabel-variabel
tersebut terhadap suatu obyek secara simultan atau serentak.Pada Praktikum kali ini,
akan dibahas Pengujian Distribusi Normal Multivariat menggunakan Shapiro Wilk.
Syarat dari pengujian menggunakan Shapiro Wilk adalah :
a) Data Berskala Interval atau Ratio (Kuantitatif)
b) Data Tunggal / belum dikelompokkan pada tabel distribusi frekuensi
c) Data berasal dari sampel random
Dimana Pengujiannya adalah sebagai berikut :
 Pengujian Hipotesis :
𝐻0 = 𝑋1 , 𝑋2 , … , 𝑋𝑛 𝑏𝑒𝑟𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑠𝑖 𝑚𝑢𝑙𝑡𝑖𝑣𝑎𝑟𝑖𝑎𝑡 𝑛𝑜𝑟𝑚𝑎𝑙
𝐻1 = 𝑋1 , 𝑋2 , … , 𝑋𝑛 𝑡𝑖𝑑𝑎𝑘 𝑏𝑒𝑟𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑠𝑖 𝑚𝑢𝑙𝑡𝑖𝑣𝑎𝑟𝑖𝑎𝑡 𝑛𝑜𝑟𝑚𝑎𝑙
 Tentukan Taraf Signifikansinya (α)
 Statistik Uji :
(∑𝑛𝑖=1 𝑎𝑖 𝑥(𝑖) )2
𝑊= 𝑛
∑𝑖=1(𝑥𝑖 − 𝑥̅ )2

𝑚𝑇 𝑉 −1
(𝑎1 , 𝑎2 , … , 𝑎𝑛 ) = 1
(𝑚𝑇 𝑉 −1 𝑉 −1 𝑚)2
 Kriteria Uji:
Tolak H0 jika p-value < α

Contoh Kasus :

Akan diuji Distribusi Normal dari data berikut :

Tabel 2. Data parasit hook-bill betina


𝑥1 𝑥2 𝑥1 𝑥2 𝑥1 𝑥2
191 284 186 266 173 271
197 285 197 285 194 280
208 288 201 295 198 300
180 273 190 282 180 272
180 275 209 305 190 292
188 280 187 285 191 286
210 283 207 297 196 285
196 288 178 268 207 286
191 271 202 271 209 303
179 257 205 285 179 261
208 289 190 280 186 262
202 285 189 277 174 245
200 272 211 310 181 250
192 282 216 305 189 262
199 280 189 274 188 258
Sumber: Data courtesy of S. Temple
Hipotesis :

 𝐻0 = 𝑋1 , 𝑋2 , … , 𝑋𝑛 𝑏𝑒𝑟𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑠𝑖 𝑚𝑢𝑙𝑡𝑖𝑣𝑎𝑟𝑖𝑎𝑡 𝑛𝑜𝑟𝑚𝑎𝑙


𝐻1 = 𝑋1 , 𝑋2 , … , 𝑋𝑛 𝑡𝑖𝑑𝑎𝑘 𝑏𝑒𝑟𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑠𝑖 𝑚𝑢𝑙𝑡𝑖𝑣𝑎𝑟𝑖𝑎𝑡 𝑛𝑜𝑟𝑚𝑎𝑙
α= 5 %
Pengujian dengan menggnakan Software R :

> library(mvnormtest)
> data1=read.csv(file="multiprak.csv",sep=";")
> data1
x1 x2
1 191 284
2 197 285
3 208 288
4 180 273
5 180 275
6 188 280
7 210 283
8 196 288
9 191 271
10 179 257
11 208 289
12 202 285
13 200 272
14 192 282
15 199 280
16 186 266
17 197 285
18 201 295
19 190 282
20 209 305
21 187 285
22 207 297
23 178 268
24 202 271
25 205 285
26 190 280
27 189 277
28 211 310
29 216 305
30 189 274
31 173 271
32 194 280
33 198 300
34 180 272
35 190 292
36 191 286
37 196 285
38 207 286
39 209 303
40 179 261
41 186 262
42 174 245
43 181 250
44 189 262
45 188 258
> x=t(data1[1:45,1:2])
> x
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
17 18 19
x1 191 197 208 180 180 188 210 196 191 179 208 202 200 192 199 186
197 201 190
x2 284 285 288 273 275 280 283 288 271 257 289 285 272 282 280 266
285 295 282
20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35
36 37 38
x1 209 187 207 178 202 205 190 189 211 216 189 173 194 198 180 190
191 196 207
x2 305 285 297 268 271 285 280 277 310 305 274 271 280 300 272 292
286 285 286
39 40 41 42 43 44 45
x1 209 179 186 174 181 189 188
x2 303 261 262 245 250 262 258
> mshapiro.test(x)

Shapiro-Wilk normality test

data: Z
W = 0.9806, p-value = 0.6441

Kriteria uji :
Tolak H0 jika P-value < Alpha (α).

Kesimpulan :
Dengan taraf signifikan 5% diperoleh nilai p-value sebesar 0.6441 dimana
nilai p-value tersebut lebih besar dari 5%. Angka ini menunjukkan hasil yang tidak
signifikan (H0 diterima) artinya data berdistribusi multivariat normal.
TUGAS PRAKTIKUM 3

ANALISIS DATA MULTIVARIAT I


Diajukan Sebagai Salah Satu Syarat Untuk Memenuhi Tugas Mata Kuliah
Analisis Data Multivariat I

Dosen Pengampu :
Drs. Achmad Bachrudin. ,M.S

Disusun Oleh:

Novia Sukmawati

140610160084

KELAS C

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM


UNIVERSITAS PADJADJARAN
Carilah Data Real Multivariat, kemudian lakukan tentukan hal- hal berikut:

1. Uji Normalitas
2. Matriks Varians Kovarians
3. Matriks Korelasi
4. Vektor Rata-Rata

Jawab :

Hotel Nonbintang adalah usaha yang menggunakan suatu bangunan atau sebagian bangunan
yang disediakan secara khusus, dimana setiap orang dapat menginap, makan, serta
memperoleh pelayanan dan fasilitas lainnya dengan pembayaran dan belum memenuhi
persyaratan sebagai hotel berbintang tetapi telah memenuhi kriteria sebagai hotel nonbintang.

Tabel 3. Jumlah Fasilitas Penginapan pada Hotel Non Bintang Provinsi Yogyakarta
Jumlah Akomodasi, Kamar, dan
Tempat Tidur yang Tersedia pada
Hotel Nonbintang
Akomodasi Kamar Tempat Tidur
(𝑿𝟏 ) (𝑋2 ) (𝑋3 )
1027 10674 16712
1086 11212 17280
1052 11138 17376
1066 11757 18489
1144 12707 20136
1091 12077 17714
1147 12860 18412
1016 12165 17845
1083 13112 20702
1109 13547 21549
1071 13638 19896
1076 13831 19896
1076 14357 20295
Source : https://www.bps.go.id/
1. Pengujian Normalitas
Hipotesis :

 𝐻0 = 𝑋1 , 𝑋2 , 𝑋3 𝑏𝑒𝑟𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑠𝑖 𝑚𝑢𝑙𝑡𝑖𝑣𝑎𝑟𝑖𝑎𝑡 𝑛𝑜𝑟𝑚𝑎𝑙


𝐻1 = 𝑋1 , 𝑋2 , 𝑋3 𝑡𝑖𝑑𝑎𝑘 𝑏𝑒𝑟𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑠𝑖 𝑚𝑢𝑙𝑡𝑖𝑣𝑎𝑟𝑖𝑎𝑡 𝑛𝑜𝑟𝑚𝑎𝑙
α= 5 %
Pengujian dengan menggunakan software R:

> library(mvnormtest)
> data=read.csv(file="multixlsx.csv",sep=";")
> data
x1 x2 x3
1 1027 10674 16712
2 1086 11212 17280
3 1052 11138 17376
4 1066 11757 18489
5 1144 12707 20136
6 1091 12077 17714
7 1147 12860 18412
8 1016 12165 17845
9 1083 13112 20702
10 1109 13547 21549
11 1071 13638 19896
12 1076 13831 19896
13 1076 14357 20295
> x=t(data[1:13,1:3])
> x
1 2 3 4 5 6 7 8 9 10 11
12
x1 1027 1086 1052 1066 1144 1091 1147 1016 1083 1109 1071
1076
x2 10674 11212 11138 11757 12707 12077 12860 12165 13112 13547 13638
13831
x3 16712 17280 17376 18489 20136 17714 18412 17845 20702 21549 19896
19896
13
x1 1076
x2 14357
x3 20295
> mshapiro.test(x)

Shapiro-Wilk normality test

data: Z
W = 0.89134, p-value = 0.1017

Kriteria uji :
Tolak H0 jika P-value < Alpha (α).

Kesimpulan :
Dengan taraf signifikan 5% diperoleh nilai p-value sebesar 0.1017 dimana
nilai p-value tersebut lebih besar dari 5%. Angka ini menunjukkan hasil yang tidak
signifikan (H0 diterima) artinya data berdistribusi multivariat normal.
2. Matriks Varians Kovarians
Akan dicari Matriks Varians Kovarians menggunakan software R :

> S=cov(data)
> S
x1 x2 x3
x1 1465.731 16730.92 26588.81
x2 16730.923 1318690.86 1524793.59
x3 26588.814 1524793.59 2362940.56

Dalam nilai kovarians yang digunakan untuk mengukur besarnya hubungan antara dua
variabel. Jenis hubungan yang dapat terjadi atara dua buah variabel berdasarkan nilai
covariance-nya adalah:

 Positif : bila nilai covariance-nya positif atau > 0


 Negatif : nilai covariance-nya negatif atau < o
 Zero : bila nilai covariance-nya nol atau = 0

Berdasarkan hasil perhitungan diatas didapat nilai kovarians dari Akomodasi, Kamar,
dan Tempat Tidur yang Tersedia pada Hotel Nonbintang di Provinsi Yogyakarta yaitu
sebagai berikut:

 Varians atau keragaman dari variabel Akomodasi pada hotel Nonbintang di


Provinsi Yogyakarta sebesar 1465.731.
 Varians atau keragaman dari variabel Kamar pada hotel Nonbintang di
Provinsi Yogyakarta sebesar 1318690.86.
 Varians atau keragaman dari variabel Tempat Tidur pada hotel Nonbintang di
Provinsi Yogyakarta sebesar 2362940.56.

Sedangkan nilai kovarinas dari ketiga variabel tersebut adalah sebagi berikut:

 Kovarians dari variabel Akomodasi (X1) dengan variabel Kamar (X2) pada
hotel Nonbintang di Provinsi Yogyakarta sebesar 16730.923
 Kovarians dari variabel Akomodasi (X1) dengan variabel Tempat Tidur (X3)
pada hotel Nonbintang di Provinsi Yogyakarta sebesar 26588.81.
 Kovarians dari variabel Kamar (X2) dengan variabel Tempat Tidur (X3)
dengan data pada hotel Nonbintang di Provinsi Yogyakarta sebesar
1524793.59.

3. Matriks Korelasi
Akan dicari Matriks Korelasi menggunakan software R :

> R=cor(data)
> R
x1 x2 x3
x1 1.0000000 0.3805584 0.4517992
x2 0.3805584 1.0000000 0.8637999
x3 0.4517992 0.8637999 1.0000000

Dengan menggunakan R didapat nilai korelasi sebagai berikut :

 Korelasi diagonal pada matriks korelasi bernilai 1, hal ini dikarenakan suatu
variabel berkorelasi dengan dirinya sendiri.
 Korelasi antara variabel Akomodasi dengan variabel Kamar pada hotel
Nonbintang di Provinsi Yogyakarta, sebesar 0.3805584 artinya semakin tinggi
nilai variabel Akomodasi semakin tinggi juga nilai variabel Kamar.
 Korelasi antara variabel Akomodasi dengan variabel Tempat Tidur pada hotel
Nonbintang di Provinsi Yogyakarta sebesar 0.4517992 artinya semakin tinggi
nilai variabel Akomodasi semakin tinggi juga nilai variabel Tempat Tidur.
 Korelasi antara variabel Kamar dan Tempat Tidur pada hotel Nonbintang di
Provinsi Yogyakarta sebesar 0.8637999 artinya semakin tinggi nilai variabel
Kamar semakin tinggi juga nilai variabel Tempat Tidur.

4. Vektor Rata-Rata
Akan dicari Vektor Rata-Rata menggunakan software R :

> colMeans(data)
x1 x2 x3
1080.308 12544.231 18946.308

Berdasarkan hasil perhitungan diatas didapat nilai rata-rata dari Akomodasi,


Kamar, dan Tempat Tidur yang Tersedia pada Hotel Nonbintang di Provinsi
Yogyakarta yaitu sebagai berikut:
 Rata-rata dari variabel Akomodasi pada hotel Nonbintang di Provinsi
Yogyakarta sebanyak 1080.308 ≈ 1081 fasilitas penginapan.

 Rata-rata dari variabel Kamar pada hotel Nonbintang di Provinsi
Yogyakarta sebanyak 12544.231 ≈ 12545 fasilitas penginapan.

 Rata-rata dari variabel Tempat Tidur pada hotel Nonbintang di Provinsi


Yogyakarta sebanyak 18946.308 ≈ 18947 fasilitas penginapan

Anda mungkin juga menyukai