Disusun untuk memenuhi salah satu tugas mata kuliah multivariate statistics
Disusun oleh:
TEAM 1
200101510003
Fayza Ananda
200101511002
JURUSAN MATEMATIKA
2023
KATA PENGANTAR
Puji syukur kehadirat Allah SWT yang telah melimpahkan rahmat dan karunianya sehingga
penulis dapat menyelesaikan makalah ini dengan baik. Salam dan shalawat selalu tecurahkan
kepada junjungan kita nabi besar Muhammad SAW. Tidak lupa kami ucapkan terima kasih
kepada Ibu Rosida, S.Pd., M.Pd., selaku dosen di mata kuliah Multivariate Statistics yang telah
membimbing kami dan terima kasih kepada pihak lain yang telah mendukung kami dalam
penyusunan makalah ini.
Makalah ini disusun dengan tujuan utama sebagai tugas kelompok. Makalah ini disusun
berdasarkan hasil kami membaca dan memahami dari berbagai sumber, baik dari diri kita sendiri
maupun dari pihak luar, seperti buku dan internet. Namun sebagai manusia biasa, karya tulis
yang kami buat tentunya memiliki kekurangan, entah itu karena kurangnya pengalaman atau
ketidak sengajaan. faktor. Semoga makalah yang telah kami susun ini bermanfaat bagi para
pembaca khususnya diri kita sendiri dalam keseharian kita dan menambah pengetahuan kita.
Kami berharap para pembaca dapat memberikan kritik dan saran untuk makalah ini.
Terima kasih.
Team 1
BAB I
PENDAHULUAN
Santoso (2012) menyatakan secara umum analisis multivariate memiliki hubngan dengan
metode-metode statistic yang secara simultan melakukan analisis terhadap lebih dari dua variable
pada objek atau individu. Dengan menggunakan teknik analisis ini maka kita dapat meneliti
korelasi, pengaruh, perbandingan beberapa variabel terhadap variabel – (variable) lainnya dalam
waktu yang bersamaan. Pada kasus multivariat, analisis sebagai perluasan dari Analisis Variansi
disebut Analisis Variansi Multivariat (MANOVA) merupakan teknik analisis data tentang
perbedaan pengaruh beberapa variabel independen dalam skala nominal terhadap sekelompok
variabel dependen dalam skala rasio. Namun sebelum masuk dalam MANOVA, terdapat uji
perbedaan dua vector mean yang harus dikuasai terlebih dahulu.
Dalam makalah ini akan dibahas pengujian hipotesis tentang perbedaan antara vektor rata-
rata dan vektor konstan. Mirip halnya dengan pengujian hipotesis pada situasi univariat. tentang
perbedaan antara rata-rata dan konstan. Pada situasi multivariat juga diperlukan syarat-syarat
agar rumus-rumus untuk pengujian hipotesis itu berlaku. Pada pengujian hipotesis untuk
univariat disyaratkan bahwa populasi yang bersangkutan berdistribusi normal. Sesuai dengan itu,
pada pengujian hipotesis untuk multivariat disyaratkan bahwa populasi yang bersangkutan
berdistribusi normal multivariate. Sehingga yang menjadi focus masalah makalah ini adalah
“Bagaimana Uji Perbedaan Dua Vektor Mean dan Aplikasinya Pada Software R Studio?”
BAB II
LANDASAN TEORI
Pada situasi univariat, jika variabel acak X mempunyai daerah harga (atau nilai-
X 1 , X 2 ,K , X n
nilainya adalah) X 1 , X 2 ,K , X n , maka rata-ratanya adalah µ x = dan
N
1 N
variansnya adalah σ x2 = ∑ ( xi − µ x ) .
2
n i =1
Jika dari nilai-nilai X yang mungkin itu hanya tersedia satu sampel acaknya saja,
misalnya X 1 , X 2 ,K , X n , maka rata-rata dan varians yang dapat dihitung adalah rata-rata
dan varians sampel saja, yang merupakan taksiran bagi rata-rata dan varians tersebut.
X 1 , X 2 ,K , X n
Rata-rata sampel adalah X= dan varians sampelnya adalah
n
1 n
∑ ( Xi − X ) .
2
sx2 =
n − 1 i =1
X 11 X 12 L X1 p
X 21 X 22 L X2p
X =
M M O M
X XN2 L X Np
N1
Jika µi menyatakan rata-rata dari variabel X i , maka dapat disusun matriks rata-rata
µ1 µ2 L µ p
µ1 µ 2 L µ p
µ
M M O M
µ1 µ2 L µ p
X 1i , X 2i ,K , X Ni
dimana µi = µ Xi = .
N
Ukuran yang mirip dengan σ X2 adalah Σ yang disebut matriks dispersi atau matriks
varians-kovarians, dengan rumus
( X − µ )′ ( X − µ )
1
Σ=
n
Dapat dihitung:
σ 12 σ 12 L σ1p
σ 21 σ 22 L σ2p
Σ=
M M O M
σ L σ p2
p1 σ p 2
N
1
dimana σ = ∑(x − µi )
2 2
i ri
N r =1
∑∑ ( x − µ j ) ( xtk − µk ) .
N N
1
σ jk = sj
N t =1 s =1
Telah kita kenal bahwa σ i2 disebut varians dari X i sedang σ jk disebut kovarians antara
1
Seperti yang telah ditunjukkan dalam bab 2, Σ = A , dimana A adalah matriks Jumlah
N
Kuadrat dan Hasil Silang (JKHS) dari X, dan dapat ditunjukkan bahwa
JKHS(X) = A
= ( X − µ )′ ( X − µ )
∑ x = ∑( X − µi )
2 2
dimana i ri
r =1
∑∑ x j xk = ∑∑ ( X sj − µ j ) ( X tk − µk )
N N
dan
t =1 s =1
Jika nilai-nilai dua variabel tersebut hanya tersedia sampel acak n nilai dari tiap-tiap
variabel, maka terdapat matriks data
X 11 X 12 L X 1 p
X 21 X 22 L X 2 p
X =
M M O M
X X n 2 L X np
n1
Taksiran untuk matriks rata-rata u adalah rata-rata sampel X, yaitu matriks berorde n x p.
X1 X2 L X p
X1 X2 L X p
X =
M M O M
X X 2 L X p
1
X 1i , X 2i ,K , X ni
dimana X i =
n
Adapun taksiran untuk matriks dispersi, Σ , adalah matriks dispersi sampel, S ,yaitu
matriks berorde p x p berikut ini
( X − X )′ ( X − X )
1
S=
n −1
1 1 1
n − 1 Σx1 ΣΣx1 x2 ΣΣx1 x p
2
L
n −1 n −1
1 ΣΣx x 1
Σx22 L
1
ΣΣx2 x p
θ = n −1 2 1
n −1 n −1
M M O M
1 1 1
ΣΣx p x1 ΣΣx p x2 L Σx 2p
n −1 n −1 n −1
s12 s12 L s1 p
s s22 L s2 p
θ = 21
M M O M
s p1 sp2 L s 2p
∑ xi2 = ∑ ( X ri − X i )
n
2
dimana
r =1
∑∑ x x = ∑∑ ( X − X j ) ( X tk − X k )
n n
j k sj
t =1 s =1
Variabel acak X dikatakan berdistribusi Normal dengan rata-rata = µ, dan varians = τ2,
diamana τ > 0 , jika fungsi kepadatan probabilitas dari X tertentu oleh rumus
X −µ
2
1 −1
σ
f (X ) = , untuk −∞ < X < ∞
2
e
σ 2π
Grafik dari y = f(X) merupakan kurva atau garis lengkung, yang lazim dikatakan berbentuk
lonceng (irisan bentuk lonceng).
Pada situasi mutivariat, terlibat lebih dari satu variabel. Sekelompok variabel
(X ,X
1 2 ,K , X p ) dikatakan berdistribusi normal p-variat dengan vektor rata-
f ( X 1 , X 2 ,K , X p ) =
1 −1 K
2
e
( 2π )
1
Σ
p
2
dimana
K = ( X − µ )′ Σ −1 ( X − µ )
X 1 − µ1
X 2 − µ2
∞ = ( X 1 − µ1 , X 2 − µ2 ,K , X p − µ p ) Σ −1
M
X p − µp
Tampak adanya kemiripan antara rumus fungsi kerapatan probabilitas univariat dan
multivariat.
= (σ 2 )
1 1
Pada univariat : Σ 2 2
= σ , diketahui p = 1 ,
( 2π ) = 2π , dan
p
sehingga
K = ( X − µ ) (σ 2 )
−1
( X − µ)
X −µ
2
∞=
σ
−1 1 σ 22 − ρσ 1σ 2
Σ =
(1 − ρ 2 )σ 12σ 22 − ρσ 2σ 1 σ 12
X − µ1
K = ( X 1 − µ1 , X 2 − µ 2 ) Σ −1 1
X 2 − µ2
1 ρ
σ2 σ 1σ 2 X 1 − µ1
1 1
∞ = ( X 1 − µ1 , X 2 − µ 2 )
1 − ρ 2
ρ 1 X 2 − µ2
σ σ 2
2 1 σ2
1 X 1 − µ1 X 2 − µ 2 ( X 1 − µ1 )( X 2 − µ2 )
2 2
∞=
2 + − 2
1 − ρ σ 1 σ 2 σ 1σ 2
1
f ( X1, X 2 ) =
−1 Q
2
e
2πσ 1σ 2 1 − ρ 2
Q=
1 X − µ 2 X − µ 2
1 1 + 2
( X 1 − µ1 )( X 2 − µ2 )
−2
2
dimana
1− ρ 2 σ 1 σ 2 σ 1σ 2
lonceng. Kalau luasan lengkung ini dipotong dengan bidang datar yang sejajar dengan
bidang ( X 1 , X 2 ) maka irisannya adalah suatu elips.
Elips demikian, untuk harga-harga k yang sesuai, merupakan batas daerah penolakan H0
pada pengujian hipotesis dalam Analisis Bivariat dan disebut elips kerapatan sama.
yaitu berdistribusi Normal dengan rata-rata = µ dan varians = σ 2 , maka rata-rata sampel,
τ2
yaitu X, berdistribusi N µ , jika sampel itu adalah sampel acak sebesar n.
n
X −µ
Dengan kata lain berdistribusi Normal Baku jika syarat-syarat tersebut dipenuhi.
σ
n
Salah satu sifat yang telah terbukti secara matematis ialah bahwa apabila variabel v
berdistribusi Normal Baku, sedang w = v 2 , maka w berdistribusi χ 2 dengan derajat
kebebasan 1. Berhubung dengan itu maka
(X − µ)
2
n
atau n ( X − µ ) (σ 2 ) (X − µ)
−1
σ 2
Pada situasi multivariat terdapat sifat yang mirip dengan sifat tersebut.
Pada situasi univariat, apabila σ 2 tak diketahui maka distribusi X dapat ditinjau dalam
X −µ
hubungannya dengan varians sampel, yaitu bahwa berdistribusi t dengan derajat
s
n
kebebasan n − 1 .
( X − µ)n atau n ( X − µ ) ( s 2 ) (X − µ)
−1
(1, n − 1) . Berhubung dengan itu maka 2
S
berdistribusi F dengan derajat kebebasan (1, n − 1) .
Pada situasi multivariat terdapat pula sifat yang mirip dengan itu. Misalkan
(X ,X
1 2 ,K , X p ) berdistribusi denganvektor rata-rata µ = ( µ1 , µ 2 ,K , µ p ) , sedang
X 1 − µ1
X 2 − µ2
apabila W = n ( X 1 − µ1 , X 2 − µ2 ,K , X p − µ p ) S −1
maka W berdistribusi Hotelling
M
X p − µp
T 2 dengan derajat kebebasan ( p, n − p ) . Dalam rumus tersebut S adalah matriks dispersi
( p, n − p ) .
Sifat-sifat dari distribusi statistik multivariat W tersebut dapat dimanfaatkan untuk
menguji signifikansi perbedaan antara vektor rata-rata suatu populasi dan vektor konstan,
atau perbedaan antara vektor-vektor rata-rata dua populasi.
Pada situasi univariat tentang selisih rata-rata dari dua sampel acak yang bebas, yaitu
X 1 − X 2 , diketahui bahwa statistik
(X 1 − X 2 ) − ( µ1 − µ 2 )
( n1 − 1) s12 + ( n2 − 1) s22 1 + 1
n1 + n2 − 2 n1 n2
a) Sampel pertama berasal dari populasi yang berdistribusi Normal, dengan rata-rata =
µ1 ;
b) Sampel kedua berasal dari populasi yang berdistribusi Normal, dengan rata-rata = µ2 ;
t=
(X 1 − X 2 ) − ( µ1 − µ 2 )
, atau
( n1 − 1) s12 + ( n2 − 1) s22 1 + 1
n1 + n2 − 2 n1 n2
( n1 + n2 − 2 ) n1n2
( X − X 2 ) − ( µ1 − µ2 ) ( n1 − 1) s12 + ( n2 − 1) s22
2 −1
t2 =
n1 + n2
1
(X 1 − X 2 ) − ( µ1 − µ 2 )
berdistribusi Normal Baku;
σ 12 σ 22
+
n1 n2
2 σ σ2
2
yang berarti bahwa ( X 1 − X 2 ) − ( µ1 − µ2 ) 1 + 2 berdistribusi χ 2 dengan derajat
n1 n2
kebebasan 1.
Pada situasi multivariat, distribusi statistik mirip dengan distribusi di atas juga ada, asal
dipenuhi syarat-syarat yang mirip dengan situasi univariat tersebut, yaitu
µ1 = ( µ11 , µ12 ,K , µ1 p )′ ;
µ2 = ( µ21 , µ 22 ,K , µ 2 p )′ ;
Jika syarat-syarat itu dipenuhi, dan sampel pertama mempunyai vektor rata-rata
n1θ n2
dan jika W = ( X 1 − X 2 ) − ( µ1 − µ2 ) ′ S p−1 ( X 1 − X 2 ) − ( µ1 − µ 2 )
n1θ n2
1
S p = ( n1 − 1) S1 + ( n2 − 1) S2 .
n +
1 2 n − 2
n + n − p −1
Hal ini berarti pula bahwa 1 2 berdistribusi T 2 dengan derajat kebebasan
p ( n + n − 2 ) W
1 2
( p; n1 + n2 − p − 1) .
pertama dan populasi kedua, baik untuk keadaan Σ1 = Σ 2 maupun untuk keaadaan Σ1 ≠ Σ 2 ,
1 1
matriks varians-kovarians Σ = Σ1 + Σ 2 .
n1 n2
BAB III
STUDI KASUS
Kita memulai dengan mengingat kembali teori univariat untuk menentukan jika sebuah nilai
tertentu adalah nilai untuk rata-rata populasi yang terbagi menjadi kasus sampel kecil dan
sampel besar.
a. SAMPEL KECIL
Asumsi
( )
Uji Hipotesis
Statistik Uji
Hotelling
( )
( ̅ ) ( ̅ )
Keputusan Uji
( )
Tolak , jika
b. SAMPEL BESAR
Asumsi
( )
Uji Hipotesis
Statistik Uji
( ̅ ) ( ̅ )
Keputusan Uji
Tolak , jika
Berdasarkan pengujian yang telah dilakukan pada kasus sampel besar mendapatkan hasil
ditolak yakni p-value dibawah 0.05 berarti matriks varian-kovarian tidak sama. Setelah
pengujian matriks varian-kovarian dilakukan pengujian nilai rata-rata beda populasi dengan
Hotelling menggunakan distribusi Chi-square, kemudian kita aplikasikan Zhotelling pada
data yang kita miliki sehingga menghasilkan data seperti yang terlampir. Lalu menghasilkan p-
value dibawah 0.05 yang artinya tolak bahwa terdapat minimal satu variable yang berbeda
antara kedua populasi.
DAFTAR PUSTAKA
Rahman, A., Mahmudah, K., Jufri, L. K., Vauzyah, R. N. & Insani, S. (2009). Inferensi vector
rata-rata. Fakultas Pendidikan Matematika dan Ilmu Pengetahuan, Universitas Pendidikan
Indonesia.
Johnson, R. A. & Wichern, D. W. (2002). Applied multivariate statistical analysis. Edisi ke-5.
Prentice-Hall, Inc. USA.
Mahendra, A., Fatihah, E. N., Ginting, M. T. K., Ahyandi, M. N., Meiliza, N. & Cahya, R. 2021.
Iferensia Vektor Rata-rata 2 Populasi Independen & Tutorial dengan R. youtube.
Statistik Inferensial. 14 menit.