Syafira Irsalina - Laporan 2 SMT

Kelas B
LAPORAN PRAKTIKUM
STATISTIKA MULTIVARIAT TERAPAN
Modul 2: Distribusi Normal Multivariat
Nomor Tanggal Tanda Tangan

Nama Praktikan Praktikan
Mahasiswa Kumpul
Syafira Irsalina 18611105 04/04/2021
Tanggal Tandatangan
Nama Penilai Nilai
Koreksi Asisten Dosen
Dwi Septiandini Putri
Masthura Aya
Muhammad Muhajir,S.Si., M.Sc.
JURUSAN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS ISLAM INDONESIA
YOGYAKARTA
2021
i
Daftar Isi
Halaman sampul ....................................................................................................... i

Daftar Isi.................................................................................................................. ii
Daftar Tabel ........................................................................................................... iii
Daftar Gambar ........................................................................................................ iv
1 Pendahuluan..................................................................................................... 1
1.1 Data Missing ............................................................................................. 1
1.2 Data Outlier .............................................................................................. 1
1.3 Uji Normalitas Multivariate ..................................................................... 2
2 Deskripsi Kerja ................................................................................................ 4
2.1 Studi Kasus ............................................................................................... 4
2.2 Langkah Kerja .......................................................................................... 5
2.2.1 Studi Kasus 1 : Deteksi dan Penanganan Data Missing dan Data
Outlier .................................................................................................. 6
2.2.2 Studi Kasus 2 : Uji Normalitas Multivariat ......................................... 9
3 Pembahasan ................................................................................................... 12
3.1 Studi Kasus 1 : Deteksi dan Penanganan Data Missing dan Data
Outlier .................................................................................................... 12
3.1.1 Studi Kasus 1 : Deteksi dan Penanganan Data Missing .................... 12
3.1.2 Studi Kasus 1 : Deteksi dan Penanganan Data Outlier ..................... 13
3.2 Studi Kasus 2 : Uji Normalitas Multivariat ............................................ 16
4 Penutup .......................................................................................................... 24
4.1 Kesimpulan ............................................................................................. 24
5 Daftar Pustaka................................................................................................ 26
ii
Daftar Tabel
Tabel 2.1. Data faktor-faktor yang mempengaruhi nilai ekspor di Indonesia ........ 4
Tabel 4.1. Hasil uji normalitas multivariat dengan 6 metode............................... 24
iii
Daftar Gambar
Gambar 2.1. Icon Software RStudio ...................................................................... 5

Gambar 2.2. Tampilan awal dari RStudio ............................................................. 6
Gambar 2.3. Mengimpor data kedalam RStudio.................................................... 6
Gambar 2.4. Melihat data yang berhasil diimpor .................................................. 6
Gambar 2.5. Mengecek data missing dengan deskriptif data summary().......... 6
Gambar 2.6. Penanganan data missing dengan na.omit() ............................... 7
Gambar 2.7. Mengecek deskriptif data setelah penanganan data missing............. 7
Gambar 2.8. Melakukan installasi packages MVN ................................................. 7
Gambar 2.9. Mengaktifkan package MVN ............................................................. 7
Gambar 2.10. Deteksi pertama data outlier: quan ............................................... 7
Gambar 2.11. Deskriptif data setelah deteksi pertama data outlier: quan ........... 8
Gambar 2.12. Deteksi dan penanganan pertama data outlier: adj quan ........... 8
Gambar 2.13. Deskriptif data setelah deteksi pertama data outlier: adj quan . 8
Gambar 2.14. Deteksi dan penanganan kedua data outlier: adj quan .............. 8
Gambar 2.15. Deskriptif data setelah deteksi kedua data outlier: adj quan ..... 9
Gambar 2.16. Uji normalitas multivariat (data outlier) : Henze-Zirkler ............... 9
Gambar 2.17. Uji normalitas multivariat (data tanpa outlier) : Henze-Zirkler ..... 9
Gambar 2.18. Uji normalitas multivariat (data tanpa outlier): Mardia ................. 9
Gambar 2.19. Uji normalitas multivariat (data tanpa outlier): Royston .............. 10
Gambar 2.20. Uji normalitas multivariat (data tanpa outlier): Doornik-Hansen 10
Gambar 2.21. Uji normalitas multivariat (data tanpa outlier): E-Statistics ......... 10
Gambar 2.22. Melakukan installasi package mvnormtest .............................. 10
Gambar 2.23. Mengaktifkan package mvnormtest......................................... 10
Gambar 2.24. Uji normalitas multivariat (data tanpa outlier): Multivariate
Shapiro Wilk ................................................................................ 11
Gambar 3.1. Statistika deskriptif data: faktor yang mempengaruhi nilai ekspor 12
Gambar 3.2. Statistika deskriptif data : penanganan data missing ...................... 12
Gambar 3.3. Q-QPlot data : metode quan pertama .......................................... 13
Gambar 3.4. Data non-outlier : metode quan pertama ..................................... 14
Gambar 3.5. Q-QPlot data : metode adj quan pertama ................................ 15
Gambar 3.6. Statistika deskriptif data : metode adj quan pertama ............... 15
Gambar 3.7. Q-QPlot data : metode adj quan kedua .................................... 16
Gambar 3.8. Data non-outlier : metode adj quan kedua ............................... 16
Gambar 3.9. Hasil uji normalitas multivariat (data outlier) : Henze Zirkler ....... 17
Gambar 3.10. Hasil uji normalitas multivariat (data tanpa outlier): Henze
Zirkler............................................................................................ 18
Gambar 3.11. Hasil uji normalitas multivariat (data tanpa outlier): Mardia ....... 19
Gambar 3.12. Hasil uji normalitas multivariat (data tanpa outlier): Royston ..... 20
Gambar 3.13. Hasil uji normalitas multivariat (data tanpa outlier): Doornik-
Hansen ........................................................................................... 21
Gambar 3.14. Hasil uji normalitas multivariat (data tanpa outlier): E-Statistics 22
iv
Gambar 3.15. Hasil uji normalitas multivariat (data tanpa outlier): Multivariate
Shapiro-Wilk ................................................................................. 23
v
1 Pendahuluan
1.1 Data Missing

Data hilang atau missing data atau missing value dapat didefinisikan sebagai
data atau informasi yang “hilang” atau tidak tersedia mengenai subjek penelitian
pada variabel tertentu. Hal tersebut dapat disebabkan oleh beberapa faktor,
diantaranya terjadi akibat kealpaan dalam pengumpulan data, ketidakmampuan
responden dalam memberikan jawaban akurat atau responden tidak berkenan
memberikan jawaban yang akurat.
Data missing yang cukup banyak dalam suatu data, akan menimbulkan
masalah yang mengganggu dalam penelitian sehingga perlu dilakukan penanganan
(Rubin, 1976). Metode dalam menangani data missing secara umum dapat
dilakukan dengan cara berikut ini :
1. Mengabaikan dan membuat data missing
2. Men-substitusi missing value berdasarkan distribusi nilai
3. Men-substitusi missing value berdasarkan korelasi antar atribut
4. Men-substitusi missing value berdasarkan kemiripan antar atribut
(Muhammad Muhajir, 2021)
1.2 Data Outlier

Data outlier adalah data yang secara nyata berbeda dengan data-data yang
lain. Data outlier biasanya terjadi karena kesalahan dalam pemasukan data,
kesalahan dalam pengambilan sampel atau memang ada data-data ekstrim yang
tidak dapat dihindarkan keberadaannya (Widhiarso, 2011). Pengujian data outlier
dapat dilakukan dengan beberapa cara, diantaranya adalah dengan menggunakan
perbandingan jarak Mahalanobis dengan kuantil Chi-Square.Terdapat 2 metode
yaitu metode "quan" (metode kuantil berdasarkan jarak Mahalanobis) dan "adj"
(metode kuantil berdasarkan jarak Mahalanobis yang disesuaikan). (Everitt dan
Torsten, 2011).
1
1.3 Uji Normalitas Multivariate
Uji normalitas multivariat bertujuan untuk mengetahui apakah distribusi
sebuah data mengikuti atau mendekati distribusi normal. Data yang baik adalah data
yang mempunyai pola seperti distribusi normal (tidak menceng ke kanan maupun
ke kiri).
Hipotesis:
𝐻0 ∶ Data berdistribusi normal multivariat
𝐻1 ∶ Data tidak berdistribusi normal multivariat
Adapun beberapa metode yang dapat dilakukan untuk melakukan uji
normalitas multivariat diantaranya adalah:
1. Metode Henze-Zirkler
Statistik uji yang digunakan dalam uji Henze-Zirkler adalah sebagai berikut:
𝛽 2 𝑝 𝛽2 𝑝
1 𝑛 1 − 𝐷
𝐻𝑍 = 2
∑𝑖=1 ∑𝑛𝑗=1 𝑒 − 2 𝐷𝑖𝑗 − 2(1 + 𝛽)−2 ∑𝑛𝑖=1 𝑒 2(1+𝛽2 ) 𝑖
+ (1 + 2𝛽 2 )−2 (1.1)
𝑛 𝑛
dimana:
1
1 𝑛(2𝑝+1) 𝑝+4
𝛽= ( 4 ) (1.2)
√2
𝑇
𝐷𝑖𝑗 = (𝑥𝑖 − 𝑥𝑗 ) 𝑆 −1 (𝑥𝑖 − 𝑥𝑗 ) (1.3)
𝐷𝑗 = (𝑥𝑖 − 𝑥̅ )𝑇 𝑆 −1 (𝑥𝑖 − 𝑥̅ ) (1.4)
𝑝 = jumlah variabel atau dimensi
𝑆 −1 = matriks varians kovarians
(Henze dan Zirkler, 1990)
2. Metode Mardia
Mardia’s Test merupakan uji normalitas multivariat yang didasarkan pada
ekstensi multivariat darskewness (𝑌̂1,𝑝 ) dan kurtosis (𝑌̂2,𝑝 ) sebagai berikut:
1
𝑌̂1,𝑝 = 𝑛2 ∑𝑛𝑖=1 ∑𝑛𝑗=1 𝐷𝑖𝑗2 (1.5)
1
𝑌̂2,𝑝 = 𝑛 ∑𝑛𝑖=1 ∑𝑛𝑗=1 𝐷𝑖𝑗2 (1.6)
dimana :
𝐷𝑖𝑗 = jarak mahalanobis = (𝑥𝑖 − 𝑥̅ )𝑇 𝑆 −1 (𝑥𝑖 − 𝑥̅ ) (1.7)
𝑆 −1 = matriks varians kovarians
2
𝑝 = jumlah variabel atau dimensi
Statistik uji untuk skewness:
𝑛 𝑝(𝑝+1)(𝑝+2)
(6) 𝑌̂1,𝑝 berdistribusi 𝜒 2 dengan derajat bebas 6
Statistik uji untuk kurtosis:

𝑛 8𝑝(𝑝+2)
(6) 𝑌̂2,𝑝 berdistribusi 𝑁 (𝑝(𝑝 + 2), )
𝑛
(Mardia, 1974)
3. Metode Royston
𝑝
𝑒 ∑𝑗=1 𝜓𝑗
𝐻= ~𝜒𝑒2 (1.8)
𝑝
4. Metode Doornik-Hansen
𝐷𝐻 = 𝑍12 + 𝑍22 ~𝜒2𝑝
2
(1.9)
𝑍1 = 𝛿log(𝑦 + √𝑦 2 − 1) (1.10)
1 3 𝜒
𝑍2 = √9𝛼 (9𝑎 − 1 + √2𝑎) (1.11)
5. Metode E-Statistics
Jika 𝑦1 , 𝑦2 , … , 𝑦𝑛 menunjukkan elemen sampel yang telah distandarisasi
perhitungan untuk statistik uji normalitas 𝑝 − 𝑣𝑎𝑟𝑖𝑎𝑡 diberikan oleh:
𝑝+1
2 Γ( ) 1
𝑛𝜀𝑛,𝑝 = 𝑛 (𝑛 ∑𝑛𝑗=1 𝐸|𝑦𝑗 − 𝑍|𝑝 − 2 2
𝑝 − 𝑛2 ∑𝑛𝑗,𝑘=1|𝑦𝑗 − 𝑦𝑘 |𝑝 ) (1.12)
Γ( )
2
(Szekely dan Rizzo, 2017)

6. Metode Multivariate Shapiro Wilk
1
𝑤 = 𝑝 ∑𝑝𝐼=1 𝑤𝑧𝑖 (1.13)
dimana:
𝑤𝑍𝑖 = Shapiro Wilk statistik pada koordinat 𝑖 dari observasi yang telah
ditransformasi 𝑍𝑖1 , … , 𝑍𝑝𝑛
(Royston, 1982)
3
2 Deskripsi Kerja
2.1 Studi Kasus

Tabel 2.1. Data faktor-faktor yang mempengaruhi nilai ekspor di Indonesia
Prov Asal Prov Investasi Investasi

Provinsi Asal Barang
Barang Lain (PMDN) (PMA)
Aceh 38.7 56 229.4 0.8
Sumatera Utara 1839.7 4.6 283.3 362.4
Sumatera Barat 345.4 52.4 3.5 22.3
Riau 3209 23.2 553.3 347.5
Kepulauan Riau 2896.1 6.9 336.5 400.1
Jambi 219.8 324.7 72.8 6.8
Sumatera Selatan 778.6 127.1 171.1 223.6
Kep. Bangka Belitung 335.7 16.9 35 13.6
Bengkulu 35.3 18.6 181.2 43.7
Lampung 623.6 56.1 331.1 349.7
DKI Jakarta 2586.1 20.1 496.6 915.2
Banten 45 7126.2 159.8 322.1
Jawa Barat 370 2241.5 1194.2 914.5
Jawa Tengah 1619.1 567.9 1045 321
DI Yogyakarta 1.1 107.1 56.9 0.7
Jawa Timur 4883.8 108.8 1897.3 333.2
Bali 58.7 82.1 86.7 121.8
Nusa Tenggara Barat 46 5.4 67.9 64.9
Nusa Tenggara Timur 4.2 8.1 13.5 19.4
Kalimantan Barat 280.2 111.8 234 213.1
Kalimantan Tengah 139.8 196.9 50.7 30.7
Kalimatan Selatan 1584 621.5 104.2 4.3
Kalimantan Timur 3808.9 44.7 264.7 64.9
Kalimantan Utara 278.8 35.9 20.6 16.1
4
Sulawesi Utara 120 89.3 4.3 13
Gorontalo 3.3 2.8
Sulawesi Tengah 1770.7 11.9 82.5 345.4
Sulawesi Selatan 244.6 78.9 36.4 32.5
Sulawesi Barat 134 0.1
Sulawesi Tenggara 350.8 65.8 7.5 382.8
Maluku 18.9 0.5 29.1
Maluku Utara 130.6 1.6 0.9 768.5
Papua 101 15.4 8.6 112.4
Papua Barat 451 6.6 21.2 4.7
1. Lakukan pengecekan data missing dan outlier pada data mengenai faktor
yang mempengaruhi nilai Ekspor di Indonesia, apakah terdapat data missing
dan outlier? Jika Ya, lakukan penanganan yang tepat terhadap data missing
dan outlier tersebut!
2. Lakukan uji hipotesis apakah data tersebut berdistribusi normal multivariat
dengan menggunakan metode pengujian yang telah dipelajari!
NB: Penanganan data outlier maksimal sebanyak dua kali dan syntax nama
data menggunakan nama masing-masing praktikan.
2.2 Langkah Kerja

Dalam menyelesaikan studi kasus yang telah diberikan, maka praktikan akan
mengerjakannya dengan langkah-langkah pengerjaan sebagai berikut ini:
1. Hal pertama yang akan dilakukan oleh praktikan adalah membuka software
RStudio dengan cara: Desktop > Double Click pada Icon RStudio seperti
berikut ini.
Gambar 2.1. Icon Software RStudio

2. Maka akan muncul tampilan awal dari jendela Rstudio seperti berikut ini.
5
Gambar 2.2. Tampilan awal dari RStudio
3. Praktikan akan melakukan impor data terlebih dahulu menggunakan fungsi
read.csv dan disimpan dalam objek dat.ekspor seperti berikut ini.
Gambar 2.3. Mengimpor data kedalam RStudio

4. Untuk melihat datanya, praktikan akan menggunak an fungsi View()
seperti berikut ini.
Gambar 2.4. Melihat data yang berhasil diimpor
2.2.1 Studi Kasus 1 : Deteksi dan Penanganan Data Missing dan Data Outlier
Untuk studi kasus yang pertama adalah melakukan pengecekan dan
penanganan pada data mengenai faktor yang mempengaruhi nilai Ekspor di
Indonesia. Berikut langkah-langkah dalam melakukan eksplorasi data yang
dilakukan oleh praktikan.
1. Pertama, praktikan akan mengecek data missing menggunakan ringkasan
atau statistika deskriptif data dengan fungsi summary()seperti berikut ini.
Gambar 2.5. Mengecek data missing dengan deskriptif data summary()
6
2. Ternyata terdapat data missing dalam data nilai ekspor, sehingga praktikan
akan melakukan penanganan data missing dengan fungsi na.omit() dan
menyimpan dalam objek dat.eksporbaru seperti berikut ini.
Gambar 2.6. Penanganan data missing dengan na.omit()

3. Setelah berhasil, praktikan akan kembali mengecek data missing
menggunakan fungsi deskriptif summary() seperti berikut ini.
Gambar 2.7. Mengecek deskriptif data setelah penanganan data missing

4. Selanjutnya, praktikan akan melakukan pengecekan data outlier.
Sebelumnya, install terlebih dahulu package yang membantu untuk
mengecek data outlier yaitu package MVN seperti berikut ini.
Gambar 2.8. Melakukan installasi packages MVN

5. Setelah berhasil diinstall, berikutnya panggil terlebih dahulu package MVN
menggunakan fungsi library(MVN) seperti berikuti ini.
Gambar 2.9. Mengaktifkan package MVN

6. Praktikan akan melakukan deteksi data outlier menggunakan metode quan
yang disimpan dalam objek syafira.no.out. Lalu, praktikan
menampilkan hasil data baru tanpa data outlier dengan $newData yang
disimpan dalam objek syafira.baru seperti berikut ini.
Gambar 2.10. Deteksi pertama data outlier: quan
7
7. Praktikan akan mengecek ringkasan deskriptif data setelah dilakukan
penanganan terhadap data outlier dengan metode quan menggunakan
fungsi summary() seperti berikut ini.
Gambar 2.11. Deskriptif data setelah deteksi pertama data outlier: quan
8. Kemudian, praktikan akan mencoba menggunakan metode adj quan
yang disimpan dalam objek syafira.no.out.adj. Lalu, menampilkan
hasil data baru tanpa data outlier dengan $newData yang disimpan dalam
objek syafira.baru.adj seperti berikut ini.
Gambar 2.12. Deteksi dan penanganan pertama data outlier: adj quan
penanganan terhadap data outlier dengan metode adj quan menggunakan
Gambar 2.13. Deskriptif data setelah deteksi pertama data outlier: adj quan
10. Karena terdapat data outliernya cukup banyak, sehingga praktikan akan
melakukan deteksi data outlier yang kedua dengan menggunakan metode
adj quan yang disimpan dalam objek syafira.no.out2. Lalu,
praktikan menampilkan hasil data baru tanpa data outlier dengan
$newData yang disimpan dalam objek syafira.baru.ajd2 seperti
berikut ini.
Gambar 2.14. Deteksi dan penanganan kedua data outlier: adj quan
penanganan terhadap data outlier dengan metode adj quan menggunakan
8
Gambar 2.15. Deskriptif data setelah deteksi kedua data outlier: adj quan
2.2.2 Studi Kasus 2 : Uji Normalitas Multivariat

Pada studi kasus kedua yaitu melakukan analisis uji hipotesis normal
multivariat untuk data nilai ekspor. Diantara metode yang akan dilakukan yaitu
metode Henze Zirkler, metode Mardia, metode Royston, metode Doornik-Hansen,
metode E-Statistics, metode Multivariate Shapiro Wilk dengan langkah kerja
sebagai berikut.
1. Pertama, praktikan akan melakukan uji normalitas multivariat pada data
sebelum ada penanganan data outlier menggunakan metode Henze Zirkler
dengan fungsi mvnTest = “hz” sebagai berikut.
Gambar 2.16. Uji normalitas multivariat (data outlier) : Henze-Zirkler

2. praktikan akan melakukan uji normalitas multivariat pada data sesudah
dilakukan penanganan data outlier menggunakan metode Henze Zirkler
dengan fungsi mvnTest = “hz” sebagai berikut.
Gambar 2.17. Uji normalitas multivariat (data tanpa outlier) : Henze-Zirkler

3. Lalu, praktikan mencoba menggunakan metode yang kedua yaitu metode
Mardia dengan fungsi mvnTest = “mardia” sebagai berikut.
Gambar 2.18. Uji normalitas multivariat (data tanpa outlier): Mardia

4. Praktikan akan menggunakan metode yang ketiga yaitu metode Royston
dengan fungsi mvnTest = “royston” sebagai berikut.
9
Gambar 2.19. Uji normalitas multivariat (data tanpa outlier): Royston
5. Berikutnya, praktikan mencoba menggunakan metode keempat yaitu
Doornik-Hansen dengan fungsi mvnTest = “dh” seperti berikut ini.
Gambar 2.20. Uji normalitas multivariat (data tanpa outlier): Doornik-Hansen

6. Kemudian, praktikan menggunakan metode analisis yang kelima yaitu
metode E-Statistics dengan fungsi mvnTest = “energy” sebagai
berikut.
Gambar 2.21. Uji normalitas multivariat (data tanpa outlier): E-Statistics

7. Sebelum menggunakan metode yang terakhir yaitu metode Multivariate
Shapiro Wilk, praktikan menginstall dahulu package mvnormtest
menggunakan fungsi install.packages(“mvnormtest”) seperti
berikut ini.
Gambar 2.22. Melakukan installasi package mvnormtest
8. Setelah berhasil terinstall, praktikan akan mengaktifkan terlebih dahulu

package dengan menggunakan fungsi library(mvnormtest) seperti
berikut ini.
Gambar 2.23. Mengaktifkan package mvnormtest
9. Kemudian, praktikan menggunakan metode yang terakhir yaitu metode

Multivariate Shapiro Wilk menggunakan fungsi mshapiro.test dengan
10
sebelumnya data yang akan diubah kedalam bentuk matriks transpose
seperti berikut.
Gambar 2.24. Uji normalitas multivariat (data tanpa outlier): Multivariate

Shapiro Wilk
11
3 Pembahasan
Pada lembar pembahasan ini, praktikan akan menjelaskan lebih detail

mengenai output yang didapatkan dari deskripsi kerja sebelumnya.
3.1 Studi Kasus 1 : Deteksi dan Penanganan Data Missing dan Data Outlier
3.1.1 Studi Kasus 1 : Deteksi dan Penanganan Data Missing

Pertama, praktikan ingin mengetahui apakah dalam data nilai ekspor terdapat
nilai missing ataukah tidak. Dengan langkah kerja yang telah dilakukan oleh
praktikan sebelumnya, diperoleh statistika deskriptif data sebagai berikut.
Gambar 3.1. Statistika deskriptif data: faktor yang mempengaruhi nilai ekspor
Dari hasil diatas dapat dilihat bahwa ternyata terdapat data missing pada
beberapa variabel yaitu variabel Prov Asal Barang dengan jumlah data missing
(NA) sebanyak 3 data, variabel Investasi PMDN sebanyak 1 data missing, dan pada
variabel Investasi PMA terdapat 1 data missing. Langkah berikutnya, praktikan
akan melakukan penanganan terhadap data missing tersebut yang telah dilakukan
sebelumnya dan diperoleh hasil sebagai berikut.
Gambar 3.2. Statistika deskriptif data : penanganan data missing
Berdasarkan pada hasil diatas terlihat bahwa dalam data nilai ekspor yang
disimpan dalam objek dat.eksporbaru sudah bebas dari data missing. Hal
tersebut terlihat pada setiap ukuran statistika masing-masing variabel sudah tidak
terdapat nilai NA. Dari statistika deskriptif tersebut didapat beberapa nilai untuk
12
variabel Prov Asal Barang dengan nilai minimum sebesar 1.1, nilai maksimum
4883.8, nilai Q1 sebesar 110.5, nilai Q3 sebesar 1601.5, nilai median 335.7 dan nilai
mean (rata-rata) sebesar 941.8.
Lalu, pada variabel Prov Lain mempunyai nilai minimum sebesar 1.60, nilai
maksimum 7126.20, nilai Q1 sebesar 16.15, nilai Q3 sebesar 110.30, nilai median
56.00 dan nilai mean (rata-rata) sebesar 394.64. Untuk variabel Investasi PMDN
diperoleh nilai minimum sebesar 0.9, nilai maksimum sebesar 1897.3, nilai Q1
sebesar 28.1, nilai Q3 sebesar 274.0, nilai median 86.7 dan nilai mean (rata-rata)
sebesat 259.7. Dan untuk variabel Investasi PMA mempunyai nilai minimum
sebesar 0.70, nilai maksimum 915.20, nilai Q1 sebesar 17.75, nilai Q3 sebesar
346.45, nilai median 112.40 dan nilai mean (rata-rata) sebesar 218.44.
3.1.2 Studi Kasus 1 : Deteksi dan Penanganan Data Outlier

Dalam deteksi dan penanganan data outlier ini, praktikan menggunakan dua
metode yaitu metode quan dan adj quan. Dalam melakukan deteksi dan
penanganan data outlier menggunakan metode quan didapatkan hasil sebagai
berikut.
Gambar 3.3. Q-QPlot data : metode quan pertama
Dari hasil grafik diatas terlihat bahwa dalam data nilai ekspor terdapat 13 data
outlier yang melewati garis merah dan data non outlier ada sebanyak 18 data non
13
outlier dengan titik warna hitam. Dengan menggunakan perhitungan jarak
Mahalanobis terlihat bahwa data yang menjadi data outlier adalah data ke-2, 4, 5,
11, 12, 13, 14, 16, 22, 23, 27, 30 dan 32. Data outlier tersebut mungkin terjadi
karena kesalahan dalam pemasukan data, kesalahan dalam sampel, atau memang
data tersebut memang data-data yang ekstrim yang tidak bisa dihindarkan
keberadaannya. Diperoleh hasil untuk data yang tidak mengandung outlier setelah
dilakukan penanganan menggunakan metode quan sebagai berikut.
Gambar 3.4. Data non-outlier : metode quan pertama
Dari gambar diatas diperoleh data yang sudah tidak mengandung outlier.
Data yang non outlier tersebut adalah data ke-1, 10, 15, 17, 18, 19, 20, 21, 24, 25,
28, 3, 33, 34, 6, 7, 8 dan 9. Selain menggunakan metode quan, praktikan juga
mencoba menggunakan metode adj quan untuk mendeteksi data outlier dan
melakukan penanganan pada data tesebut. Sehingga diperoleh hasil sebagai berikut.
14
Gambar 3.5. Q-QPlot data : metode adj quan pertama
Dari hasil diatas dapat dilihat bahwa ternyata hasil deteksi data outlier
antara metode quan dan adj quan menghasilkan hasil yang sama yaitu ada
sebanyak 13 data outlier dan 18 data non outlier. Dari hasil tersebut, diperoleh nilai
ringkasan deskriptif dari data yang telah dilakukan penanganan data outlier baik
menggunakan metode quan maupun adj quan sebagai berikut.
Gambar 3.6. Statistika deskriptif data : metode adj quan pertama
Berdasarkan summary diatas dapat dilihat bahwa untuk variabel Prov Asal
Barang, Prov Lain, Investasi PMDN dan Investasi PMA mempunyai nilai mean
(rata-rata) secara berurutan sebesar, 227.92, 77.18, 90.27 dan 71.66. Selain nilai
mean, juga diperoleh informasi seperti nilai median, minimum, maksimum, Q1 dan
Q2. Karena data outlier cukup banyak sehingga nantinya dapat menganggu proses
analisis selanjutnya, maka praktikan melakukan penanganan data outlier
menggunakan metode adj quan dan diperoleh hasil sebagai berikut.
15
Gambar 3.7. Q-QPlot data : metode adj quan kedua
Dari gambar diatas dapat dilihat bahwa terdapat 7 data outlier setelah
dilakukan penanganan data outlier yang kedua kali. Data outlier tersebut adalah
data ke-1, 9, 7, 10, 17, 20 dan 33. Sedangkan data non-outlier ada sebanyak 11 data
yang ditampilkan sebagai berikut.
Gambar 3.8. Data non-outlier : metode adj quan kedua
Berdasarkan hasil diatas, data tersebut merupakan data yang tidak

mengandung outlier. Data yang tidak mengandung outlier tersebut ada sebanyak
11 data yaitu data ke-3, 6, 8, 15, 18, 19, 21, 24, 25, 28 dan 34.
3.2 Studi Kasus 2 : Uji Normalitas Multivariat

Untuk uji normalitas multivariat ini, praktikan akan melakukan uji terhadap
data yang masih mengandung data outlier yaitu data aslinya yang disimpan dalam
16
objek dat.ekspor. dalam melakukan uji normalitas ini, praktikan menggunakan
metode Henze-Zirkler dengan hasil yang didapatkan adalah sebagai berikut.
Gambar 3.9. Hasil uji normalitas multivariat (data outlier) : Henze Zirkler
Dari hasil diatas, praktikan akan melakukan uji hipotesis sebagai berikut:
i. Hipotesis:
H0 : Data berdistribusi normal multivariat
H1 : Data tidak berdistribusi normal multivariat
ii. Tingkat Signifikansi:
𝛼 = 5% = 0.05
iii. Daerah Kritis:
Tolak H0 jika p-value < 𝛼
Gagal tolak H0 jika p-value < 𝛼
iv. Statistik Uji:
Dengan menggunakan metode Henze-Zirkler diperoleh nilai p-value = 0.000
v. Keputusan:
Tolak H0 karena p-value < 𝛼 atau 0.000 < 0.05
vi. Kesimpulan:
Dengan menggunakan tingkat kepercayaan sebesar 95% maka data yang
ada mendukung untuk tolak H0 yang artinya data tidak berdistribusi normal
multivariat.
17
Dari uji hipotesis tersebut ternyata data aslinya tidak berdistribusi normal
multivariat. Sehingga praktikan akan mencoba melakukan uji hipotesis kembali
menggunakan data yang telah dilakukan penanganan terhadap data missing dan data
outlier. Praktikan akan menggunakan data yang telah dilakukan penanganan deteksi
outlier sebanyak dua kali yaitu data yang tersimpan dalam objek
syafira.baru.adj2. Untuk uji normalitas multivariat yang pertama praktikan
menggunakan metode Henze-Zirkler dengan perolehan hasil sebagai berikut.
Gambar 3.10. Hasil uji normalitas multivariat (data tanpa outlier): Henze Zirkler
Berdasarkan hasil diatas, berikut adalah uji hipotesis menggunakan metode
Henze-Zirkler:
i. Hipotesis:
𝛼 = 5% = 0.05
iii. Daerah Kritis:
Gagal tolak H0 jika p-value > 𝛼
iv. Statistik Uji:
Dengan menggunakan metode Henze-Zirkler diperoleh nilai p-value =
0.2040831
v. Keputusan:
Gagal tolak H0 karena p-value > 𝛼 atau 0.2040831 > 0.05
18
vi. Kesimpulan:
ada mendukung untuk gagal tolak H0 yang artinya data berdistribusi normal
multivariat.
Selanjutnya, untuk uji normalitas multivariat yang kedua yaitu menggunakan
metode Mardia diperoleh hasil sebagai berikut.
Gambar 3.11. Hasil uji normalitas multivariat (data tanpa outlier): Mardia
Mardia:
i. Hipotesis:
𝛼 = 5% = 0.05
iii. Daerah Kritis:
iv. Statistik Uji:
Dengan menggunakan metode Mardia :
 Mardia Skewness diperoleh nilai p-value = 0.1431
 Mardia Kurtosis diperoleh nilai p-value = 0.5579
v. Keputusan:
19
 Mardia Skewness : Gagal tolak H0, p-value > 𝛼 atau 0.1431 > 0.05
 Mardia Kurtosis : Gagal tolak H0, p-value > 𝛼 atau 0.5579 > 0.05
vi. Kesimpulan:
multivariat.
Berikutnya, untuk uji normalitas multivariat yang ketiga yaitu menggunakan
metode Royston diperoleh hasil sebagai berikut.
Gambar 3.12. Hasil uji normalitas multivariat (data tanpa outlier): Royston
Royston:
i. Hipotesis:
𝛼 = 5% = 0.05
iii. Daerah Kritis:
iv. Statistik Uji:
Dengan menggunakan metode Royston diperoleh nilai p-value = 0.0217
v. Keputusan:
20
vi. Kesimpulan:
multivariat.
Selanjutnya, untuk uji normalitas multivariat yang keempat yaitu
menggunakan metode Doornik-Hansen diperoleh hasil sebagai berikut.
Gambar 3.13. Hasil uji normalitas multivariat (data tanpa outlier): Doornik-
Hansen
Doornik-Hansen:
i. Hipotesis:
𝛼 = 5% = 0.05
iii. Daerah Kritis:
Gagal tolak H0 jika p-value < 𝛼
iv. Statistik Uji:
Dengan menggunakan metode Doornik-Hansen diperoleh nilai p-value =
0.1692357
v. Keputusan:
21
vi. Kesimpulan:
multivariat.
Berikutnya, untuk uji normalitas multivariat yang kelima yaitu menggunakan
metode E-Statistics diperoleh hasil sebagai berikut.
Gambar 3.14. Hasil uji normalitas multivariat (data tanpa outlier): E-Statistics
E-Statistics:
i. Hipotesis:
𝛼 = 5% = 0.05
iii. Daerah Kritis:
iv. Statistik Uji:
Dengan menggunakan metode E-Statistics diperoleh nilai p-value = 0.178
v. Keputusan:
vi. Kesimpulan:
22
multivariat.
Dan untuk uji normalitas multivariat yang terakhir yaitu menggunakan
metode Multivariate Shapiro-Wilk diperoleh hasil sebagai berikut.
Gambar 3.15. Hasil uji normalitas multivariat (data tanpa outlier): Multivariate
Shapiro-Wilk

Multivariate Shapiro-Wilk:
i. Hipotesis:
𝛼 = 5% = 0.05
iii. Daerah Kritis:
iv. Statistik Uji:
Dengan menggunakan metode Multivariate Shapiro-Wilk diperoleh untuk
nilai p-value = 0.001911
v. Keputusan:
vi. Kesimpulan:
multivariat.
23
4 Penutup
4.1 Kesimpulan
Berdasarkan pembahasan yang telah dipaparkan oleh praktikan sebelumnya
maka dapat diambil beberapa kesimpulan sebagai berikut:
1. Dalam melakukan deteksi dan penanganan terhadap data missing, praktikan
menggunakan bantuan fungsi na.omit untuk menghapus data missing
yang ada dalam data faktor-faktor yang mempengaruhi nilai ekspor di
Indonesia. Sedangkan, untuk melakukan deteksi dan penanganan terhadap
data outlier, praktikan menggunakan metode quan dan adj quan, namun
ternyata hasil dari kedua metode sama yaitu data outlier ada 13 dan non-
outlier ada 18. Praktikan memutuskan untuk melakukan penanganan data
outlier kedua kalinya menggunakan metode adj quan diperoleh hasil data
outlier sebanyak 7 data dan data non-outlier ada 11 data.
2. Dari hasil uji hipotesis normalitas multivariat yang telah dilakukan
praktikan dengan menggunakan 6 metode diperoleh hasil sebagai berikut:
Tabel 4.1. Hasil uji normalitas multivariat dengan 6 metode
Metode p-value Keterangan Keputusan Kesimpulan
Data tidak
Henze-Zirkler 0.000 < 0.05 Tolak H0 berdistribusi
normal multivariat
Gagal tolak Data berdistribusi
Skewness 0.1431 > 0.05
H0 normal multivariat
Mardia
Kurtosis 0.5579 > 0.05
Data tidak
Royston 0.0217 < 0.05 Tolak H0 berdistribusi
normal multivariat
0.1692 Gagal tolak Data berdistribusi
Doornik-Hansen > 0.05
357 H0 normal multivariat
24
E-Statistics 0.178 > 0.05
Data tidak
Multivariate 0.0019
< 0.05 Tolak H0 berdistribusi
Shapiro-Wilk 11
normal multivariat
25
5 Daftar Pustaka
Muhammad Muhajir, S. M. (2021). Modul Praktikum Statistika Multivariat

Terapan. Yogyakarta.
26

Syafira Irsalina - Laporan 2 SMT

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Syafira Irsalina - Laporan 2 SMT

Diunggah oleh

Hak Cipta:

Format Tersedia

Kelas B

Nomor Tanggal Tanda Tangan

Muhammad Muhajir,S.Si., M.Sc.

Halaman sampul ....................................................................................................... i

Gambar 2.1. Icon Software RStudio ...................................................................... 5

1.1 Data Missing

1.2 Data Outlier

Statistik uji untuk kurtosis:

(Szekely dan Rizzo, 2017)

2.1 Studi Kasus

Prov Asal Prov Investasi Investasi

2.2 Langkah Kerja

Gambar 2.1. Icon Software RStudio

Gambar 2.3. Mengimpor data kedalam RStudio

Gambar 2.4. Melihat data yang berhasil diimpor

Gambar 2.5. Mengecek data missing dengan deskriptif data summary()

Gambar 2.6. Penanganan data missing dengan na.omit()

Gambar 2.7. Mengecek deskriptif data setelah penanganan data missing

Gambar 2.8. Melakukan installasi packages MVN

Gambar 2.9. Mengaktifkan package MVN

Gambar 2.10. Deteksi pertama data outlier: quan

2.2.2 Studi Kasus 2 : Uji Normalitas Multivariat

Gambar 2.16. Uji normalitas multivariat (data outlier) : Henze-Zirkler

Gambar 2.17. Uji normalitas multivariat (data tanpa outlier) : Henze-Zirkler

Gambar 2.18. Uji normalitas multivariat (data tanpa outlier): Mardia

Gambar 2.20. Uji normalitas multivariat (data tanpa outlier): Doornik-Hansen

Gambar 2.21. Uji normalitas multivariat (data tanpa outlier): E-Statistics

Gambar 2.22. Melakukan installasi package mvnormtest

8. Setelah berhasil terinstall, praktikan akan mengaktifkan terlebih dahulu

Gambar 2.23. Mengaktifkan package mvnormtest

9. Kemudian, praktikan menggunakan metode yang terakhir yaitu metode

Gambar 2.24. Uji normalitas multivariat (data tanpa outlier): Multivariate

Pada lembar pembahasan ini, praktikan akan menjelaskan lebih detail

3.1.1 Studi Kasus 1 : Deteksi dan Penanganan Data Missing

Gambar 3.2. Statistika deskriptif data : penanganan data missing

3.1.2 Studi Kasus 1 : Deteksi dan Penanganan Data Outlier

Gambar 3.3. Q-QPlot data : metode quan pertama

Gambar 3.4. Data non-outlier : metode quan pertama

Gambar 3.6. Statistika deskriptif data : metode adj quan pertama

Gambar 3.8. Data non-outlier : metode adj quan kedua

Berdasarkan hasil diatas, data tersebut merupakan data yang tidak

3.2 Studi Kasus 2 : Uji Normalitas Multivariat

Berdasarkan hasil diatas, berikut adalah uji hipotesis menggunakan metode

Muhammad Muhajir, S. M. (2021). Modul Praktikum Statistika Multivariat

Anda mungkin juga menyukai