Anda di halaman 1dari 21

PERBANDINGAN DUA VEKTOR MEAN

Disusun untuk memenuhi salah satu tugas mata kuliah multivariate statistics

Disusun oleh:

TEAM 1

Andi Ammar Akrar

200101510003

Fayza Ananda

200101511002

PROGRAM STUDI PENDIDIKAN MATEMATIKA

JURUSAN MATEMATIKA

FAKULTAS PENDIDIKAN MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS NEGERI MAKASSAR

2023
KATA PENGANTAR

Puji syukur kehadirat Allah SWT yang telah melimpahkan rahmat dan karunianya sehingga
penulis dapat menyelesaikan makalah ini dengan baik. Salam dan shalawat selalu tecurahkan
kepada junjungan kita nabi besar Muhammad SAW. Tidak lupa kami ucapkan terima kasih
kepada Ibu Rosida, S.Pd., M.Pd., selaku dosen di mata kuliah Multivariate Statistics yang telah
membimbing kami dan terima kasih kepada pihak lain yang telah mendukung kami dalam
penyusunan makalah ini.

Makalah ini disusun dengan tujuan utama sebagai tugas kelompok. Makalah ini disusun
berdasarkan hasil kami membaca dan memahami dari berbagai sumber, baik dari diri kita sendiri
maupun dari pihak luar, seperti buku dan internet. Namun sebagai manusia biasa, karya tulis
yang kami buat tentunya memiliki kekurangan, entah itu karena kurangnya pengalaman atau
ketidak sengajaan. faktor. Semoga makalah yang telah kami susun ini bermanfaat bagi para
pembaca khususnya diri kita sendiri dalam keseharian kita dan menambah pengetahuan kita.
Kami berharap para pembaca dapat memberikan kritik dan saran untuk makalah ini.

Terima kasih.

Makassar, 25 Februari 2023

Team 1
BAB I

PENDAHULUAN

Pemakaian metode statistic dalam membantu memecahkan masalah di beberapa bidang,


seperti ekonomi, bisnis, pertanian, teknik, psikologi, kedokteran, pendidikan, dan bidang spesifik
lainnya yang terasa semakin dibutuhkan. Statistika multivariate merupakan salah satu metode
statistika yang dapat digunakan.

Santoso (2012) menyatakan secara umum analisis multivariate memiliki hubngan dengan
metode-metode statistic yang secara simultan melakukan analisis terhadap lebih dari dua variable
pada objek atau individu. Dengan menggunakan teknik analisis ini maka kita dapat meneliti
korelasi, pengaruh, perbandingan beberapa variabel terhadap variabel – (variable) lainnya dalam
waktu yang bersamaan. Pada kasus multivariat, analisis sebagai perluasan dari Analisis Variansi
disebut Analisis Variansi Multivariat (MANOVA) merupakan teknik analisis data tentang
perbedaan pengaruh beberapa variabel independen dalam skala nominal terhadap sekelompok
variabel dependen dalam skala rasio. Namun sebelum masuk dalam MANOVA, terdapat uji
perbedaan dua vector mean yang harus dikuasai terlebih dahulu.

Dalam makalah ini akan dibahas pengujian hipotesis tentang perbedaan antara vektor rata-
rata dan vektor konstan. Mirip halnya dengan pengujian hipotesis pada situasi univariat. tentang
perbedaan antara rata-rata dan konstan. Pada situasi multivariat juga diperlukan syarat-syarat
agar rumus-rumus untuk pengujian hipotesis itu berlaku. Pada pengujian hipotesis untuk
univariat disyaratkan bahwa populasi yang bersangkutan berdistribusi normal. Sesuai dengan itu,
pada pengujian hipotesis untuk multivariat disyaratkan bahwa populasi yang bersangkutan
berdistribusi normal multivariate. Sehingga yang menjadi focus masalah makalah ini adalah
“Bagaimana Uji Perbedaan Dua Vektor Mean dan Aplikasinya Pada Software R Studio?”
BAB II
LANDASAN TEORI

2.1 Matriks Dispersi

Pada situasi univariat, jika variabel acak X mempunyai daerah harga (atau nilai-
X 1 , X 2 ,K , X n
nilainya adalah) X 1 , X 2 ,K , X n , maka rata-ratanya adalah µ x = dan
N
1 N
variansnya adalah σ x2 = ∑ ( xi − µ x ) .
2

n i =1

Jika dari nilai-nilai X yang mungkin itu hanya tersedia satu sampel acaknya saja,
misalnya X 1 , X 2 ,K , X n , maka rata-rata dan varians yang dapat dihitung adalah rata-rata
dan varians sampel saja, yang merupakan taksiran bagi rata-rata dan varians tersebut.

X 1 , X 2 ,K , X n
Rata-rata sampel adalah X= dan varians sampelnya adalah
n
1 n
∑ ( Xi − X ) .
2
sx2 =
n − 1 i =1

Pada situasi multivariat yang melibatkan p variabel acak X 1 , X 2 ,K , X p ; misalkan X ij

menyatakan nilai ke-j dari variabel X i , dimana 1 ≤ j ≤ N .

 X 11 X 12 L X1 p 
 
X 21 X 22 L X2p 
X =
 M M O M 
 
X XN2 L X Np 
 N1

Jika µi menyatakan rata-rata dari variabel X i , maka dapat disusun matriks rata-rata

berorde Nθ xθ p sesuai dengan X di atas, yaitu

 µ1 µ2 L µ p 

µ1 µ 2 L µ p 
µ
M M O M 
 
 µ1 µ2 L µ p 
X 1i , X 2i ,K , X Ni
dimana µi = µ Xi = .
N

Ukuran yang mirip dengan σ X2 adalah Σ yang disebut matriks dispersi atau matriks
varians-kovarians, dengan rumus

( X − µ )′ ( X − µ )
1
Σ=
n

Dapat dihitung:

 σ 12 σ 12 L σ1p 
 
 σ 21 σ 22 L σ2p 
Σ=
 M M O M 
 
σ L σ p2 
 p1 σ p 2

N
1
dimana σ = ∑(x − µi )
2 2
i ri
N r =1

∑∑ ( x − µ j ) ( xtk − µk ) .
N N
1
σ jk = sj
N t =1 s =1

Telah kita kenal bahwa σ i2 disebut varians dari X i sedang σ jk disebut kovarians antara

X j dan X k . Itulah sebabnya maka Σ disebut matriks varians-kovarians dari X.

1
Seperti yang telah ditunjukkan dalam bab 2, Σ = A , dimana A adalah matriks Jumlah
N
Kuadrat dan Hasil Silang (JKHS) dari X, dan dapat ditunjukkan bahwa

JKHS(X) = A

= ( X − µ )′ ( X − µ )

 Σx12 ΣΣx1 x2 L ΣΣx1 x p 


 
 ΣΣx2 x1 Σx22 L ΣΣx2 x p 
 M M O M 
 
 ΣΣx x ΣΣx x L Σx 2p 
 p 1 p 2
N

∑ x = ∑( X − µi )
2 2
dimana i ri
r =1

∑∑ x j xk = ∑∑ ( X sj − µ j ) ( X tk − µk )
N N
dan
t =1 s =1

perlu diingat bahwa σ jk = ρσ j ρσ k ,

ρ = koefisien korelasi antara X j dan X k ;


σ j = simpangan baku dari X j ;
dimana
σ k = simpangan baku dari X k ;
σ jk = kovarians antara X j dan X k .

Jika nilai-nilai dua variabel tersebut hanya tersedia sampel acak n nilai dari tiap-tiap
variabel, maka terdapat matriks data

 X 11 X 12 L X 1 p 
 
X 21 X 22 L X 2 p 
X =
 M M O M 
 
X X n 2 L X np 
 n1

Taksiran untuk matriks rata-rata u adalah rata-rata sampel X, yaitu matriks berorde n x p.

 X1 X2 L X p 
 
X1 X2 L X p 
X = 
M M O M 
 
X X 2 L X p 
 1

X 1i , X 2i ,K , X ni
dimana X i =
n

Adapun taksiran untuk matriks dispersi, Σ , adalah matriks dispersi sampel, S ,yaitu
matriks berorde p x p berikut ini
( X − X )′ ( X − X )
1
S=
n −1
 1 1 1 
 n − 1 Σx1 ΣΣx1 x2 ΣΣx1 x p 
2
L
n −1 n −1
 
 1 ΣΣx x 1
Σx22 L
1
ΣΣx2 x p 

θ = n −1 2 1
n −1 n −1 
 
 M M O M 
 1 1 1 
 ΣΣx p x1 ΣΣx p x2 L Σx 2p 
 n −1 n −1 n −1 
 s12 s12 L s1 p 
 
s s22 L s2 p 
θ =  21
 M M O M 
 
 s p1 sp2 L s 2p 

∑ xi2 = ∑ ( X ri − X i )
n
2
dimana
r =1

∑∑ x x = ∑∑ ( X − X j ) ( X tk − X k )
n n

j k sj
t =1 s =1

sii = si2 = varians sampel untuk X i


1
= Σ x i2
n-1
s jk = kovarians sampel antara X j dan X k
1
= ΣΣ x j . x k
n-1

2.2 Distribusi Normal Multivariat

Variabel acak X dikatakan berdistribusi Normal dengan rata-rata = µ, dan varians = τ2,
diamana τ > 0 , jika fungsi kepadatan probabilitas dari X tertentu oleh rumus

 X −µ 
2

1 −1 
σ 
f (X ) = , untuk −∞ < X < ∞
2
e 
σ 2π

Grafik dari y = f(X) merupakan kurva atau garis lengkung, yang lazim dikatakan berbentuk
lonceng (irisan bentuk lonceng).
Pada situasi mutivariat, terlibat lebih dari satu variabel. Sekelompok variabel

(X ,X
1 2 ,K , X p ) dikatakan berdistribusi normal p-variat dengan vektor rata-

rata µ = ( µ1 , µ 2 ,K , µ p )′ dan matriks varians-kovarians atau matriks dispersi Σ , jika fungsi

kerapatan probabilitas bersama dari p-variabel itu tertentu oleh rumus.

f ( X 1 , X 2 ,K , X p ) =
1 −1 K
2
e
( 2π )
1
Σ
p
2

dimana

K = ( X − µ )′ Σ −1 ( X − µ )
 X 1 − µ1 
 
X 2 − µ2 
∞ = ( X 1 − µ1 , X 2 − µ2 ,K , X p − µ p ) Σ −1 
 M 
 
 X p − µp 

Tampak adanya kemiripan antara rumus fungsi kerapatan probabilitas univariat dan
multivariat.

= (σ 2 )
1 1
Pada univariat : Σ 2 2
= σ , diketahui p = 1 ,

( 2π ) = 2π , dan
p
sehingga

K = ( X − µ ) (σ 2 )
−1
( X − µ)
 X −µ 
2

∞= 
 σ 

Khususnya jika p = 2, terdapat


σ σ 12   σ 12 ρσ 1σ 2 
Σ =  11 = 
 σ 21 σ 22   ρσ 2σ 1 σ 22 
Σ = (1 − ρ 2 ) σ 12σ 22 ;

−1 1  σ 22 − ρσ 1σ 2 
Σ =
(1 − ρ 2 )σ 12σ 22  − ρσ 2σ 1 σ 12 

 X − µ1 
K = ( X 1 − µ1 , X 2 − µ 2 ) Σ −1  1 
 X 2 − µ2 
 1 ρ 
 σ2 σ 1σ 2   X 1 − µ1 
 1  1
∞ = ( X 1 − µ1 , X 2 − µ 2 )  
 1 − ρ 2 
  ρ 1   X 2 − µ2 
σ σ 2 
 2 1 σ2 
 1   X 1 − µ1   X 2 − µ 2  ( X 1 − µ1 )( X 2 − µ2 ) 
2 2

∞= 
2    +  − 2
 1 − ρ   σ 1   σ 2  σ 1σ 2 

Fungsi kerapatan probabilitas Normal Bivariat, dan rumusnya adalah

1
f ( X1, X 2 ) =
−1 Q
2
e
2πσ 1σ 2 1 − ρ 2

Q=
1  X − µ  2  X − µ  2
 1 1  +  2
( X 1 − µ1 )( X 2 − µ2 ) 
 −2
2
dimana
1− ρ 2  σ 1   σ 2  σ 1σ 2 

ρ = korelasi antara x1 dan x 2 ;


µi = rata-rata dari X i ;
σ i = simpangan baku dari Xi ;

Grafik dari z = f ( X 1 , X 2 ) merupakan luasan lengkung, mirip permukaan suatu

lonceng. Kalau luasan lengkung ini dipotong dengan bidang datar yang sejajar dengan
bidang ( X 1 , X 2 ) maka irisannya adalah suatu elips.

Elips itu tertentu oleh suatu persamaan berbentuk Q = k, atau


( X 1 − µ1 )( X 2 − µ2 ) = k
2 2
 X 1 − µ1   X 2 − µ2 
  +  −2
 σ1   σ 2  σ 1σ 2

Elips demikian, untuk harga-harga k yang sesuai, merupakan batas daerah penolakan H0
pada pengujian hipotesis dalam Analisis Bivariat dan disebut elips kerapatan sama.

2.3 Beberapa Distribusi Statistik

Pada Statistika Univariat sudah dikenal sifat bahwa apabila X berdiatribusi N ( µ , σ 2 ) ,

yaitu berdistribusi Normal dengan rata-rata = µ dan varians = σ 2 , maka rata-rata sampel,

 τ2
yaitu X, berdistribusi N  µ ,  jika sampel itu adalah sampel acak sebesar n.
 n 

X −µ
Dengan kata lain berdistribusi Normal Baku jika syarat-syarat tersebut dipenuhi.
σ 
 
 n 

Salah satu sifat yang telah terbukti secara matematis ialah bahwa apabila variabel v
berdistribusi Normal Baku, sedang w = v 2 , maka w berdistribusi χ 2 dengan derajat
kebebasan 1. Berhubung dengan itu maka

(X − µ)
2
n
atau n ( X − µ ) (σ 2 ) (X − µ)
−1

σ 2

berdistribusi χ 2 dengan derajat kebebasan 1 apabila syarat-syarat tersebut di atas


terpenuhi.

Pada situasi multivariat terdapat sifat yang mirip dengan sifat tersebut.

Apabila X 1 , X 2 ,K , X p berdistribusi Normal Multivariat N ( µ , Σ ) , dimana

µ = ( µ1 , µ 2 ,K , µ p ) , sedang Σ adalah matriks dispersi, sedang X = ( X 1 , X 2 ,K , X p )′ ,

menyatakan vektor rata-rata dari sampel acak, dan apabila


 X 1 − µ1 
 
X 2 − µ2 
W = n ( X 1 − µ1 , X 2 − µ2 ,K , X p − µ p ) Σ −1 
 M 
 
 X p − µp 

maka W berdistribusi χ 2 dengan derajat kebebasan p: dimana n menyatakan besarnya


sampel.

Pada situasi univariat, apabila σ 2 tak diketahui maka distribusi X dapat ditinjau dalam
X −µ
hubungannya dengan varians sampel, yaitu bahwa berdistribusi t dengan derajat
 s 
 
 n
kebebasan n − 1 .

Juga telah dibuktikan bahwa apabila variabel v berdistribusi t dengan derajat


kebebasan n − 1 , sedangkan w = v 2 , maka W berdistribusi F dengan derajat kebebasan

( X − µ)n atau n ( X − µ ) ( s 2 ) (X − µ)
−1
(1, n − 1) . Berhubung dengan itu maka 2
S
berdistribusi F dengan derajat kebebasan (1, n − 1) .

Pada situasi multivariat terdapat pula sifat yang mirip dengan itu. Misalkan

(X ,X
1 2 ,K , X p ) berdistribusi denganvektor rata-rata µ = ( µ1 , µ 2 ,K , µ p ) , sedang

X = ( X 1 , X 2 ,K , X p )′ menyatakan vektor rata-rata dari sampel acak sebesar n , dan

 X 1 − µ1 
 
X 2 − µ2 
apabila W = n ( X 1 − µ1 , X 2 − µ2 ,K , X p − µ p ) S −1 
maka W berdistribusi Hotelling
 M 
 
 X p − µp 
T 2 dengan derajat kebebasan ( p, n − p ) . Dalam rumus tersebut S adalah matriks dispersi

sampel. Hotelling telah membuktikan bahwa apabila variabel W berdistribusi T 2 , dengan


n− p
derajat kebebasan ( p, n − p ) maka W berdistribusi F dengan derajat kebebasan
p ( n − 1)

( p, n − p ) .
Sifat-sifat dari distribusi statistik multivariat W tersebut dapat dimanfaatkan untuk
menguji signifikansi perbedaan antara vektor rata-rata suatu populasi dan vektor konstan,
atau perbedaan antara vektor-vektor rata-rata dua populasi.

Pada situasi univariat tentang selisih rata-rata dari dua sampel acak yang bebas, yaitu
X 1 − X 2 , diketahui bahwa statistik

(X 1 − X 2 ) − ( µ1 − µ 2 )
( n1 − 1) s12 + ( n2 − 1) s22  1 + 1
 
n1 + n2 − 2  n1 n2 

berdistribusi t dengan derajat kebebasan n1 + n2 − 2 , apabila

a) Sampel pertama berasal dari populasi yang berdistribusi Normal, dengan rata-rata =
µ1 ;

b) Sampel kedua berasal dari populasi yang berdistribusi Normal, dengan rata-rata = µ2 ;

c) Kedua distribusi normal itu memeiliki varians yang sama;

d) n1 = besarnya sampel pertama;

n2 = besarnya sampel kedua;

e) s12 = varians sampel pertama;

s22 = varians sampel kedua.

Maka dapat dituliskan:

t=
(X 1 − X 2 ) − ( µ1 − µ 2 )
, atau
( n1 − 1) s12 + ( n2 − 1) s22  1 + 1
 
n1 + n2 − 2  n1 n2 

( n1 + n2 − 2 ) n1n2 
( X − X 2 ) − ( µ1 − µ2 )  ( n1 − 1) s12 + ( n2 − 1) s22 
2 −1
t2 =
n1 + n2
1

Jika W = t 2 , maka W berdistribusi F dengan derajat kebebasan (1; n1 + n2 − 2 ) .


Apabila σ 12 dan σ 22 berturut-turut menyatakan varians dari populasi pertama dan
populasi kedua, maka

(X 1 − X 2 ) − ( µ1 − µ 2 )
berdistribusi Normal Baku;
σ 12 σ 22
+
n1 n2

2 σ σ2 
2
yang berarti bahwa ( X 1 − X 2 ) − ( µ1 − µ2 )   1 + 2  berdistribusi χ 2 dengan derajat
 n1 n2 
kebebasan 1.

Hal ini berlaku untuk keadaan σ 12 = σ 22 maupun σ 12 ≠ σ 22

Pada situasi multivariat, distribusi statistik mirip dengan distribusi di atas juga ada, asal
dipenuhi syarat-syarat yang mirip dengan situasi univariat tersebut, yaitu

a) Populasi pertama berdistribusi Normal p-variat dengan vektor rata-rata

µ1 = ( µ11 , µ12 ,K , µ1 p )′ ;

b) Populasi kedua berdistribusi Normal p-variat dengan vektor rata-rata

µ2 = ( µ21 , µ 22 ,K , µ 2 p )′ ;

c) Kedua populasi memiliki matriks varians-kovarians yang sama.

Jika syarat-syarat itu dipenuhi, dan sampel pertama mempunyai vektor rata-rata

X 1 = ( X 11 , X 12 ,K , X 1 p ) dan matriks varians-kovarians S1 , sedang sampel kedua

mempunyai vektor rata-rata X 2 = ( X 21 , X 22 ,K , X 2 p ) dan matriks varians-kovarians S2 ,

n1θ n2
dan jika W = ( X 1 − X 2 ) − ( µ1 − µ2 ) ′ S p−1 ( X 1 − X 2 ) − ( µ1 − µ 2 ) 
n1θ n2    

maka W berdistribusi T 2 dengan derajat kebebasan ( p; n1 + n2 − p − 1) dimana

 1 
S p = ( n1 − 1) S1 + ( n2 − 1) S2   .
n +
 1 2 n − 2 
 n + n − p −1 
Hal ini berarti pula bahwa  1 2 berdistribusi T 2 dengan derajat kebebasan
 p ( n + n − 2 )  W
 1 2 

( p; n1 + n2 − p − 1) .

Jika Σ1 dan Σ 2 , berturut-turut adalah matriks varians-kovarians dari populasi

pertama dan populasi kedua, baik untuk keadaan Σ1 = Σ 2 maupun untuk keaadaan Σ1 ≠ Σ 2 ,

maka X 1 − X 2 berdistribusi Normal p-variat dengan vektor rata-rata µ = ( µ1 − µ2 )′ dan

1 1
matriks varians-kovarians Σ = Σ1 + Σ 2 .
n1 n2
BAB III

STUDI KASUS

Kita memulai dengan mengingat kembali teori univariat untuk menentukan jika sebuah nilai
tertentu adalah nilai untuk rata-rata populasi yang terbagi menjadi kasus sampel kecil dan
sampel besar.

a. SAMPEL KECIL
 Asumsi
( )
 Uji Hipotesis

 Statistik Uji
Hotelling
( )
( ̅ ) ( ̅ )

 Keputusan Uji
( )
Tolak , jika

b. SAMPEL BESAR
 Asumsi
( )
 Uji Hipotesis

 Statistik Uji
( ̅ ) ( ̅ )
 Keputusan Uji
Tolak , jika

APLIKASI SOFTWARE R STUDIO

- Kasus Sampel Kecil


Simpulan:
Berdasarkan hasil uji melakukan software R Studio didapatkan bahwa ditolak dimana nilai
dibawah 0.05 artinya matriks varian-kovarian berbeda. Lalu pada pengujian beda rata-rata
dua populasi dan hasilny terlihat pada screenshoot, serta menghasilkan p value dibawah 0.05
yang artinya tolak yakni setidaknya ada satu variable yang berbeda antara kedua populasi.

- Kasus Sampel Besar


Simpulan:

Berdasarkan pengujian yang telah dilakukan pada kasus sampel besar mendapatkan hasil
ditolak yakni p-value dibawah 0.05 berarti matriks varian-kovarian tidak sama. Setelah
pengujian matriks varian-kovarian dilakukan pengujian nilai rata-rata beda populasi dengan
Hotelling menggunakan distribusi Chi-square, kemudian kita aplikasikan Zhotelling pada
data yang kita miliki sehingga menghasilkan data seperti yang terlampir. Lalu menghasilkan p-
value dibawah 0.05 yang artinya tolak bahwa terdapat minimal satu variable yang berbeda
antara kedua populasi.
DAFTAR PUSTAKA

Rahman, A., Mahmudah, K., Jufri, L. K., Vauzyah, R. N. & Insani, S. (2009). Inferensi vector
rata-rata. Fakultas Pendidikan Matematika dan Ilmu Pengetahuan, Universitas Pendidikan
Indonesia.
Johnson, R. A. & Wichern, D. W. (2002). Applied multivariate statistical analysis. Edisi ke-5.
Prentice-Hall, Inc. USA.
Mahendra, A., Fatihah, E. N., Ginting, M. T. K., Ahyandi, M. N., Meiliza, N. & Cahya, R. 2021.
Iferensia Vektor Rata-rata 2 Populasi Independen & Tutorial dengan R. youtube.
Statistik Inferensial. 14 menit.

Anda mungkin juga menyukai