Anda di halaman 1dari 32

Tugas 1 Analisis

Multivariat
Ludia Ni’matuzzahroh (06211950015005)
Ardiana Fatma Dewi (06211950015006)
Data GDP ($ per capita)
1200
31100
Literacy (%)
47.5
100
 Terdapat 2 Variabel (p) yang digunakan 1500
3400
40.4
97
•Produk Domestik Bruto (PDB) perkapita 12800
($) 98
6700 99
•Presentase Angka Melek Huruf (AMH) (%) 29800 97
22000 99
22000 97.9
5400 67
 Banyak pengamatan (n) = 20 1400 45.2
12500 97
800 50.2
19800 95.4
 Sumber = https://www.kaggle.com 6900 74.2
27600 99
500 37.8
800 42.4
6300 92.5
2900 97

1
Data standardize : Z1
-0.90
Z2
-1.25
1.90 0.86
-0.87 -1.54
  𝑥𝑖 − ´𝑥 -0.69 0.74

𝑧=
Rumus yang digunakan 0.19 0.78

𝜎 -0.38
1.78
0.82
0.74
Mengapa dilakukan standardize? 1.05 0.82
1.05 0.77
Karena data memiliki perbedaan satuan -0.50 -0.47
yang terpaut jauh, PDB memiliki nilai -0.88 -1.35
0.16 0.74
ribuan hingga puluh ribuan, sedangkan -0.93 -1.14
AMH memiliki nilai puluhan saja, 0.85 0.67
sehingga akan menghasilkan variansi -0.36 -0.18
yang besar. Oleh karena itu untuk 1.58 0.82
-0.96 -1.64
mengatasi hal tersebut dilakukan
-0.93 -1.46
standarisasi variabel. -0.42 0.56
-0.74 0.74

2
Hubungan Antar Variabel
Berdasarkan Bidang Ilmu yang Mendasari
PDB merupakan nilai semua barang dan jasa yang dihasilkan oleh
suatu negara pada periode waktu tertentu
Angka Melek Huruf (AMH) merupakan proporsi penduduk usia 15
tahun ke atas yang mempunyai kemampuan membaca dan menulis
huruf latin dan huruf lainnya, tanpa harus mengeti apa yang dibaca/di
tulisnya terhadap penduduk usia 15 tahun ke atas.
Berdasarkan ilmu ekonomi, Produk Domestik Bruto (PDB) perkapita
serta angka melek huruf memiliki hubungan yang cukup erat. Terdapat
hubungan antara PDB dan AMH karena jika proporsi penduduk yang
melek huruf semakin besar atau semakin kecil maka akan
mempengaruhi nilai jasa yang akan dihasilkan oleh suatu negara (PDB).

3
•Berdasarkan
  Uji Bartlett Sphericity

Untuk mengetahui apakah terdapat hubungan antar variabel dengan


hipotesis yang digunakan adalah sebagai berikut,
• Hipotesis vs
• Statistik Uji

• Nilai Tabel

Keputusan : Tolak , karena nilai


Kesimpulan : Terdapat hubungan yang signifikan antara variabel PDB
dan AHM

4
Uji Multivariat
 

• Uji Hipotesis 
vs

• Statistik Uji

5
(Lanjutan)

•  Nilai Tabel:

Keputusan: Tolak , karena

6
(Lanjutan)

•  Mencari Nilai Eigen •  Dalam menentukan nilai eigen


digunakan rumus ABC

7
(Lanjutan)
•  Mencari Vektor Eigen •  
Misal:

Untuk

8
(Lanjutan)
•   •  
Misal:
• Mencari Vektor Eigen

Untuk

9
(Lanjutan)
••  Sumbu Mayor

10
(Lanjutan)

• Sumbu Minor
•  

11
(Lanjutan)

• Simultaneous Confidence Intervals


•  

12
(Lanjutan)

•  

13
Visualisasi Uji
Multivariat

 Keputusan : Tolak baik Uji Multivariat maupun Uji Univariat, karena berada
diluar ellipsoid
14
Uji Univariat
•  Variabel Produk Domestik Bruto (PDB)

• Uji Hipotesis :

vs

• Statistik Uji :

• Nilai Tabel :

Keputusan : Tolak karena

15
•  Confident Interval :

Keputusan : Tolak karena nilai berada di luar selang

(-0.17 0.17) 0.5


     

16
•  Variabel Angka Melek Huruf (AMH)

• Uji Hipotesis :

vs

• Statistik Uji :

• Nilai Tabel :

Keputusan : Tolak karena

17
•  Confident Interval :

Keputusan : Tolak karena nilai berada di luar selang

-0.8 (-0.17 0.17)


     

18
Visualisasi Uji Multivariat dan
Uji Univariat

 Keputusan : Tolak baik Uji Multivariat maupun Uji Univariat, karena


berada diluar ellipsoid maupun diluar persegi.
19
A Generalization of
Saphiro-Wilk’s Test for
Multivariate Normality
Jose A. Villasenor Alva & Elizabeth Gonzalea
Estrada (2009)
INTRODUCTION
• Telah diketahui bahwa uji Shapiro-Wilk (SWT)
adalah salah satu tes omnibus terbaik untuk
menguji hipotesis normalitas univariat (Thode,
2002).
• Pada artikel ini menggunakan uji Shapiro-Wilk
sebagai dasar untuk membangun uji goodness of
fit untuk distribusi normal multivariat (MVN),
setelah mengubah/mentransformasi pengamatan.
20
UJI UNTUK NORMALITAS
MULTIVARIAT
• Asumsikan
  adalah iid vektor random dalam , dimana .
• menunjukkan p-variate normal density dengan vektor rata-rata
dan matriks kovarian .
• jika dan hanya jika .
• dan S merupakan rata-rata sampel dan matriks kovarian, dimana:

21
Lanjutan
•• Ketika
  berdistribusi , vektor random berdistribusi mendekati .
• ; dimana:
j=1,2, ..., n
merupakan pendekatan independen dengan distribusi normal standar univariat.
• Hipotesis:

Dimana dan diketahui.


• Statistik uji:

Dimana adalah Shapiro-Wilk’s statistic dari observasi yang telah ditransformasi , .

22
Lanjutan
••  diperoleh dari rumus statistik uji Shapiro-Wilks univariat, yaitu:

Dimana:

• merupakan elemen ke-i dari vektor ,


dengan dan, dimana Z merupakan oerder statistics vector berukuran n dari normal
standard sampel random
• Kriteria penolakan :

23
Contoh Kasus Penerapan Uji Normalitas Multivariat dengan Saphiro Wilk’s Test

PDB perkapita
AMH (%)
($)
1200 47.5 Berikut merupakan langkah-langkah dalam
31100 100 melakukan pengujian normalitas multivariat
1500 40.4 dengan mengunakan Saphiro Wilk’s Test :
3400 97
12800 98
6700 99  1. Mencari (rata-rata sampel) pada masing-
29800 97 masing variabel, PDB ( dan AMH (
22000 99
22000 97.9
diperoleh hasil sebagai berikut,
5400 67 dan
1400 45.2
12500 97 2. Mencari nilai S (matriks kovarians) pada
800 50.2
19800 95.4 masing-masing variabel, PDB ( dan AMH (
6900 74.2 dan
27600 99
500 37.8
800 42.4
6300 92.5
2900 97
24
•   Mencari nilai , karena variabel yang digunakan sebanyak dua
3
maka akan diperoleh nilai dan , selanjutnya di urutkan dari
nilai terkecil hingga terbesar
Z(1) Z(2)
-0.98691 -1.68548
-0.95808 -1.57827
-0.95808 -1.4958
-0.91964 -1.38034
-0.90042 -1.2855
-0.89081 -1.17417
-0.75628 -0.48142
-0.70823 -0.18453
-0.51604 0.570074
-0.42955 0.689656
-0.39111 0.755632
-0.37189 0.755632
0.166247 0.755632
0.195076 0.755632
0.867752 0.792743
1.079164 0.796867
1.079164 0.838102
1.617304 0.838102
1.828717 0.838102
1.953642 0.879337

25
•4   Menghitung Statisik Uji Shapiro Wilk’s dari masing-
masing variabel (Secara univariat)

dimana :

diperoleh :

26
Tabel Koefisien Saphiro Wilk’s

27
•5   Menghitung Statisik Uji Shapiro Wilk’s dan menguji
secara multivariat
Statistik Uji :

Keputusan : Tolak karena 2


Kesimpulan: Data tidak mengikuti distribusi normal
multivariat

28
Nilai Tabel
 

29
Terima Kasih 

Anda mungkin juga menyukai