Makalah Metode Statistika Multivariat
Makalah Metode Statistika Multivariat
Disusun oleh:
(KELOMPOK 5)
Marlina (20203108 )
FAKULTAS SAINS
2023
KATA PENGANTAR
Segala puji bagi Allah SWT yang telah memberikan kami kemudahan sehingga kami dapat
menyelesaikan makalah ini dengan tepat waktu. Tanpa pertolongan-Nya tentunya kami tidak
akan sanggup untuk menyelesaikan makalah ini dengan baik. Shalawat serta salam semoga
terlimpah curahkan kepada baginda tercinta kita yaitu Nabi Muhammad SAW yang kita nanti-
natikan syafa'atnya di akhirat nanti.
Penulis mengucapkan syukur kepada Allah SWT atas limpahan nikmat sehat-Nya, baik itu
berupa sehat fisik maupun akal pikiran, sehingga penulis mampu untuk menyelesaikan
pembuatan makalah dengan judul “Menilai Asumsi Normalitas Multivariat, mendeteksi data
pencilan dan cleaning data dan transformasi normalitas”.
Penulis tentu menyadari bahwa makalah ini masih jauh dari kata sempurna dan masih
banyak terdapat kesalahan serta kekurangan di dalamnya. Untuk itu, penulis mengharapkan
kritik dan saran yang membangun dari pembaca demi kesempurnaan makalah ini.
Penulis
DAFTAR ISI
BAB 1
PENDAHULUAN
A. Latar Belakang
B. Rumusan Masalah
1. Bagaimana menilai asumsi normalitas multivariat
2. Bagaimana mendeteksi data pencilan dan cleaning data
3. Bagaimana transformasi nomalitas
C. Tujuan
1. Untuk menilai asumsi normalitas multivariat
2. Untuk mendeteksi data pencilan dan cleaning data
3. Untuk transformasi nomalitas
BAB II
PEMBAHASAN
0.385 −1
1
2
2
Sebagai contoh, P( Z ≤ 0,385 ¿= ∫ e 2 dz=0,65
−∞ √ 2 π
Garis lurus dari plot Q-Q dapat diukur dengan menghitung koefisien korelasi dari titik-
titik dalam plot. Koefisien korelasi untuk plot Q-Q didefinsikan dengan
n
∑ ( x ( j )−x )( q( i)−q )
i=1
rQ =
√∑ ( √∑
n n
x( j )−x ) ² ¿¿¿¿
i=1 i=1
Secara formal penolakan hipotesis dari normal pada level signifikansi α jika Q r berada
dibawah nilai perkiraan.
[ ] [
x= 155.60 , S= 7476.45 303.63
14.70 303.62 36.19 ]
Sehingga
−1
S =
1
[
26.19303.63
103,623.12 −303.637476.45 ]
[
¿ 0.000253−0.002930
−0.0029300.072148 ]
Dari table, di peroleh x 22 ( 0.5 )=1,39.lalu, sembarang pengamatan x’ = [x1,x21] memenuhi
[ ][ ][ ]
'
x1 −155.60 0.000253−0.002930 x 1−155.60 ≤1,39
x2 −14.70 −0.002930 0.072148 x 2−14.70
Jatuh didalam kontur pengamatan 50%. Pengamatan lain jatuh diluar kontur. Pengamatan
yang lain selain dari yang disebut diatas jatuh diluar kontru. Pasangan pengamatan
pertama, [x1 x2]’ = [108.28 17.05]. dalam kasus ini,
[ ][ ][ ]
'
108.28−155.60 0.000253−0.002930 108.28−155.60
17.05−14.70 −0.002930−0.072148 17.05−14.70
= 1.61 > 1.39
Dan titik ini jatuh diluar kontur 50%.
Metode formal lain yang dapat digunakan untuk menilai gabungan sifat normal
dari sekumpulan data adalah dengan memperhatikan jarak
kuadrat umum
Di mana x1,x2,....,xn adalah sampel pengamatan.
Ketika populasi primernya merupakan multivariate normal dimana n dan n − p
lebih besar dari 25 atau 30, setiap dari kuadrat jarak akan cenderung mengikuti variabel
random chi-kuadrat. Walaupun jarak tersebut tidak independent atau secara tepat
berdistribusi chikuadrat, namun cukup membantu untuk digambarkan plotnya. Plot yang
dihasilkan disebut plot chi-kuadrat atau Gamma Plot, karena distribusi chi-kuadrat
merupakan kasus khusus dari distribusi gamma.
Untuk mengontruksi plot chi-kuadrat
Langkah-langkah mengontruksi plot chi-kuarat
1. Urutkan data jarak dalam persamaan (0.51) di mulai yang paling kecil hingga
yang paling besar.
1
2. Gambarkan pasangan ¿ di mana ¿ merupakan kuantil ke-100 ( j - ¿/ n dari
2
distribusi chi-kuadrat dengan bebas p.
Hasil plotnya
B. Mendeteksi Data Pencilan Dan Cleaning Data
Kebanyakannya kumpulan data memuat satu atau lebih hasil pengamatan yang
berbeda keadaannya dari pengamatan yang lainnya atau diistilah dengan unusual
observartion atau dikenal dengan Data pencilan (outlier). Data yang demikian biasanya
berada pada posisi sangat kecil atau sangat dari kumpulan pengamatan. Keadaan data
yang demikian sangat berpengaruh dalam analisis statistic.
Langkah-langkah mendeteksi outlier :
Buat dot plot untuk setiap data variabel
1. Buat scatter plot atau diagram pencar untuk setiap pasangan variabel
2. Hitung nilai terstandar (standardized value) zjk = (xjk - x k ¿/ √ 8kk untuk j = 1,2,...,n
dan setiap k = 1,2,...,p. Uji nilai standar tersebut untuk nilai terkecil atau terbesar.
2 ' −1
3. Hitung jarak kuadrat umum d j=( x j−x ) S ( x j−x ) .Uji jarak-jarak tersebut untuk
unusual nilai besar. Dalam plot chi-kuadrat, titik-titik tersebut akan berada jauh
dari titik asal.
Dalan langkah ketiga, harus diinterprestasi relative terhadap ukuran sampel dan
jumlah variabel. Terdapat nilai terstandarkan sebanyak n x p. Andaikan terdapat n = 100
dan p = 5 , maka ada 500 nilai. Diharapkan 1 atau 2 dari data-data tersebut melebihi 3
atau kurang dari -3, jika data berasal dari distribusi multivariate hal tersebut berarti
normal, dan 3.5 dicurigai sebagai data yang besar. Nilai terstandarkan dihitung
berdasarkan rata-rata dan variansi sampel.
C. Transformasi Normalitas
Transformasi Data adalah upaya yang dilakukan dengan tujuan utama untuk
mengubah skala pengukuran data asli menjadi bentuk lain sehingga data dapat memenuhi
asumsi-asumsi yang mendasari analisis ragam.
Asumsi dasar setiap teknik statistic adalah sifat normalitas, ika sekumpulan data
tidak mengikuti distribusi normal, apa yang harus dilakukan atau langkah apa yang
selanjutnya diambil? Alternative pertama adalah menghilangkan data yang menyebabkan
tidak normal, namun cara ini tidak dianjurkan karena yang merusak kesimpulan atau
melahirkan kesimpulan yang tidak tepat. Alternative kedua adalah membuat data “tidak
normal” menjadi nampak “normal” atau hampir normal dengan transformasi data.
Transformasi data adalah menampilkan data dalam bentuk yang berbeda.
Transformasi yang tepat yang dianjurkan adalah (1) berdasarkan teori atau (2)
berdasarkan data itu sendiri atau (3) keduanya. Secara teoritis bahwa data yang dihitung
lebih sering cenderung normal dengan mengambil akar kuadrat. Dengan cara yang sama
transformasi logit untuk proporsi dan tranformasi z untuk koefisien korelasi
menghasilkan kuantitas yang mendekati distribusi normal.
Berikut beberapa bentuk tranformasi
no Skala asal Skala transformasi
1 Count, y √y
2 Proporsi, ^p 1
( )
logit ( ^p )= log
2
^p
1−^p
3 Korelasi, r
Fisher z(r) = log( )
1
2
1+r
1−r
[ ]
n n
n 1 2
ln ∑ ( x (jλ )−x ( λ ) ) +( λ) ∑ ln x j (0.53)
2 n j =1 j =1
BAB 3
PENUTUP
A. Kesimpulan
B. Saran
Daftar pustaka