Anda di halaman 1dari 80

Pengujian Hipotesis tentang

Vektor Rata-rata (Part 1)


Nusar Hajarisman
Department of Statistics, Universitas Islam Bandung

Pendahuluan

Pengujian hipotesis dalam konteks multivariat lebih


kompleks daripada dalam konteks univariat.
Begitu banyak parameter yang terlibat untuk dianalisis.
Misalnya, untuk distribusi normal dengan p-variat akan
mempunyai p buah rata-rata, p varians, dan C(p, 2)
kovarians, dimana besaran C(p, 2) menunjukkan
banyaknya pasangan diantara p buah variabel.
Dengan demikian banyaknya parameter yang terlibat
adalah sebanyak

Pendahuluan

Banyaknya parameter yang terlibat dalam analisis multivariat


adalah sebanyak
p 1
p + p + = p ( p + 3 )
2 2

Sebagai contoh, untuk p = 10, maka banyaknya parameter


ada sebanyak 65 yang masing-masing parameter dapat
dirumuskan hipotesisnya.
Lebih jauh, peneliti biasanya tertarik dalam pengujian
hipotesis mengenai subset dari parameter-parameter tersebut
atau mengenai fungsi dari parameter tersebut.

Pendahuluan

Setidaknya ada empat alasan mengapa


menggunakan pendekatan multivariat untuk
pengujian hipotesis pada p buah variabel
daripada secara univariat, yaitu:
Pertama:
Penggunaan uji univariat akan meningkatkan
kekeliruan jenis I, , sedangkan dalam uji
multivariat tetap mempertahankan pada taraf
sebesar .

Pendahuluan

Sebagai contoh, misalnya jika melakukan uji


univariat sebanyak p = 10 secara terpisah pada
taraf 0.05, maka peluang paling tidak melakukan
kesalahan dalam menolak hipotesis nol akan lebih
besar daripada 0.05.
Apabila variabel-variabel tersebut saling bebas
(yang pada kenyataannya jarang terjadi), maka
kita akan mempunyai (di bawah H0):
P(menolak H0) = 1 P(seluruh pengujian menerima H0)
= 1 (0.95)10 = 0.40

Pendahuluan

Taraf signifikansi sebesar 0.40 tentu saja


merupakan tingkat kekeliruan yang tidak dapat
diterima.
Biasanya, untuk 10 buah variabel yang saling
berkorelasi, maka taraf signifikansinya akan
berada diantara 0.05 sampai dengan 0.40.

Pendahuluan

Kedua:
Uji

univariat sama sekali mengabaikan korelasi


diantara variabel yang diamati, sedangkan uji
multivariat sudah mengakomodir secara langsung
korelasinya.

Ketiga:
Pada

umumnya terjadinya penolakan hipotesis dalam


uji multivariat disebabkan oleh rata-rata yang
terbentuk dari suatu kombinasi linear variabel
daripada oleh suatu variabel yang berdiri sendiri.

Pendahuluan

Keempat:
Uji multivariat lebih kuasa dalam banyak kasus. Kuasa uji
adalah peluang menolak H0 pada saat H0 itu adalah
benar.
Dalam beberapa kasus, seluruh p variabel dari uji univariat
seringkali gagal mencapai tingkat signifikansinya, tetapi
dalam uji multivariat adalah signifikan dikarenakan oleh
efek yang kecil pada beberapa variabel secara bersamasama memberikan kontribusi pada terjadinya penolakan H0.
Untuk ukuran sampel tertentu terdapat beberapa
keterbatasan pada banyaknya variabel dapat ditangani
oleh uji multivariat tanpa kehilangan kuasa ujinya.

Pengujian Satu Vektor Rata-rata

Matriks Kovarians Diketahui (Kasus Univariat)


Hipotesis yang akan diuji adalah rata-rata y sama
dengan suatu nilai tertentu, katakan saja 0,
melawan alternatif bahwa rata-rata y tidak sama
dengan 0:

H 0 : = 0

vs

H1 : 0

Disini tidak akan dibahas hipotesis alternatif satuarah karena tidak akan digunakan dalam kasus
multivariat.

Pengujian Satu Vektor Rata-rata

Matriks Kovarians Diketahui (Kasus Univariat)


Diasumsikan bahwa sampel acak dari n buah
observasi y1, y2, , yn berasal dari populasi yang
berdistribusi N(, 2) dengan 2 diketahui.
Statistik Uji:

y 0 y 0
z=
=
y
/ n

yang berdistribusi N(0, 1) pada saat H0 benar

Pengujian Satu Vektor Rata-rata

Matriks Kovarians Diketahui (Kasus Univariat)


Untuk = 0.05, hipotesis H0 akan ditolak jika |z|
1.96.
Alternatifnya, kita dapat menggunakan statistik z2
yang akan berdistribusi 2 dengan derajat bebas
satu, dan hipotesis nol ditolak jika z2 (1.96)2 =
3.84.
Pasa saat n besar, kita yakin melalui dalil limit pusat
bahwa z akan mendekati distribusi normal, bahkan
jika observasinya bukan berasal dari distribusi
normal.

Pengujian Satu Vektor Rata-rata

Dalam kasus multivariat kita akan mempunyai


beberapa variabel yang diukur pada masingmasing unit sampling, kemudian akan dihipotesiskan
suatu nilai untuk rata-rata dari setiap variabel, H0:
= 0 melawan H1: 0. Lebih eksplisit lagi
bentuk hipotesisnya menjadi
1 01

2
02
=
H 0 :
M M


p 0 p

1 01

2
02

H 1 :
M M


p 0 p

Pengujian Satu Vektor Rata-rata

Dimana setiap 0j dinyatakan berdasarkan pada


pengalaman sebelumnya atau nilai yang
ditargetkan.
Kesamaan vektor dalam H0 mempunyai makna j =
0j untuk seluruh j = 1, 2, , p.
Ketidaksamaan vektor dalam H1 mempunyai makna
bahwa paling tidak terdapat satu j 0j.
Jadi, misalnya jika j = 0j untuk seluruh j kecuali j
= 2, dimana 2 02, maka hipotesis nol akan
ditolak.

Pengujian Satu Vektor Rata-rata

Untuk menguji H0, kita akan menggunakan sampel


acak dari n vektor observasi y1, y2, , yn yang
berasal dari Np(, ), dimana diketahui, serta
menghitung vektor rata-rata, maka statistik ujinya
adalah:
1

Z = n ( y 0 )' ( y 0 )
2

Jika H0 benar, maka Z2 akan berdistribusi 2,


dengan demikian hipotesis nol akan ditolak jika
2
2
Z > , p

Pengujian Satu Vektor Rata-rata

Jika tidak diketahui, kita dalam menggunakan S


dan menggantikannya ke dalam (5.2), serta Z2
akan mengikuti pendekatan distribusi chi-kuadrat.
Tetapi menurut Rencher (2002), ukuran sampel n
akan lebih besar daripada yang ada dalam situasi
univariat, dimana

t = ( y 0 ) / s / n : N (0,1)

Contoh 5.1:

Data yang disajikan pada Tabel 3.1 adalah data


tentang tinggi dan berat badan dari 20 siswa lakilaki.
Misalkan diasumsikan bahwa sampel tersebut
berasal dari populasi bivariat normal N2(, ),
dimana:
20 100

=
100 1000

Contoh 5.1:

Misalkan akan diuji suatu hipotesis


H0: = (70, 170)`
Dari hasil perhitungan diperoleh informasi
y1 = 71.45

y2 = 164.7

Z 2 = n ( y 0 ) ' 1 ( y 0 )
1

71.45 70 20 100 71.45 70


= (20)

164.7

170
100
1000
164.7

170

0.01 1.45
0.1
= (20) (1.45 5.3)

= 8.4026
0.01 0.002 5.3
'

Contoh 5.1:

Dengan menggunakan =0.05, maka diketahui:


2
0.05;2
= 5.99
Hipotesis H0: = (70, 170)` ditolak sebab Z2 =
8.4026 > 5.99
Daerah penolakan untuk y = ( y1 , y2 )` adalah
berada dalam atau diluar ellips sebagaimana
yang ditunjukkan dalam Gambar 5.1
artinya statistik uji Z2 adalah lebih besar daripada
5.99 jika dan hanya jika y = ( y1 , y2 )` berada diluar
ellips

Contoh 5.1:

Jika y = ( y1 , y2 )` berada dalam wilayah ellips, maka


H0 diterima.
Jadi jarak dari 0 harus diperhitungkan dalam
proses pengujian hipotesis.
Apabila jarak tersebut dibakukan oleh -1, maka
seluruh titik-titik pada kurva secara statistik
berjarak sama dari titik pusatnya.

Gambar 5.1

Contoh 5.1:

Perlu dicatat bahwa pengujian ini sensitif terhadap


struktur kovarians.
Apabila cov(y1, y2) adalah negatif, maka y2
cenderung akan naik pada saat y1 menurun,
sehingga ellips akan mempunyai tingkat kemiringan
dalam arah yang berbeda.
Dalam hal seperti ini, y = ( y1 , y2 )` akan berada
dalam daerah penerimaan.

Contoh 5.1:

Selanjutnya akan diselidiki uji lanjutan pada


masing-masing variabel secara terpisah.
Dengan menggunakan z/2 = 1.96 untuk = 0.05,
diperoleh

z1 =
z2 =

y1 01
1 / n
y 2 02
21 / n

= 1.450 < 1.96


= 0.7495 > 1.96

Contoh 5.1:

Jadi dalam hal ini kedua pengujian menghasilkan


penerimaan hipotesis.
Dalam hal ini kedua rata-rata untuk y1 dan y2 cukup jauh
dari suatu nilai yang dihipotesiskan yang menyebabkan
terjadi penolakan pada hipotesis nol.
Akan tetapi pada saat terdapat korelasi positif antara y1
dan y2 yang diperhitungkan ke dalam uji multivariat,
maka terjadilah penolakan terhadap hipotesis nol.
Hasil ini mengilustrasikan kelebihan dari uji multivariat
dibandingkan dengan hasil-hasil dari uji univariat.

Contoh 5.1:

Gambar 5.2 menunjukkan daerah penerimaan


segiempat untuk uji univariat yang disatukan
dengan daerah penerimaan ellips untuk uji
multivariat.
Segiempat ini diperoleh dengan cara menghitung
dua buah daerah penerimaan:
1
1
01 1.96
< y1 < 01 + 1.96
n
n
2
2
02 1.96
< y 2 < 02 + 1.96
n
n

Gambar 5.2

Contoh 5.1:

Titik-titik di dalam ellips tetapi berada di luar


segiempat akan ditolak paling tidak dalam satu
dimensi univariat tetapi akan diterima secara
multivariat.
Hal ini mengilustrasikan adanya peningkatan dalam
sebagai hasil dari uji univariat.
Titik-titik di luar ellips tetapi berada dalam
segiempat akan ditolak secara multivariat tetapi
diterima dalam uji univariat.

Contoh 5.1:

Jadi dalam kedua kasus yang ditunjukkan dalam


wilayah yang diarsir, kita seharusnya menggunakan
hasil-hasil yang diberikan dalam uji multivariat.
Dalam satu kasus, uji multivariat lebih kuasa
dibandingkan dengan uji univariat, dalam kasus
yang lain uji multivariat memberikan nilai yang
eksak dibandingkan nilai yang meningkat dalam
uji univariat.

Kasus varians tidak diketahui

Pada bagian sebelumnya telah disinggung sedikit


mengenai sifat-sifat pengujian hipotesis, sebab
pengujian tersebut diterapkan dengan asumsi
bahwa diketahui.
Pembahasan mengenai pengujian untuk satu-sampel
penting untuk dibahas karena dapat dijadikan
dasar untuk lebih memahami kasus dua-sampel
yang memang sering diterapkan.
Menurut Rencher (2002) ada dua alasan mengapa
kasus satu-sampel penting untuk dibahas, yaitu:

Kasus varians tidak diketahui

Banyak sekali konsep-konsep dasar akan lebih


mudah diilustrasikan dalam kerangka kerja satusampel dibandingkan dalam kasus dua-sampel.
Beberapa pengujian yang sangat bermanfaat
dapat dituangkan dalam kerangka kerja satusampel. Misalnya nanti akan diterapkan pada
pengujian data berapasangan (dibahas pada bab
ini juga), serta dalam rancangan pengukuran
berulang dan analisis profil yang dibahas pada
Bab 6.

Kasus varians tidak diketahui


(Univariat)

Pertama-tama kita lihat kembali uji-t pada satusampel dalam kasus univariat, dengan hanya satu
variabel yang diukur pada setiap unit sampling.
Diasumsikan bahwa sampel acak y1, y2, , yn
berasal dari distribusi N(, 2).
Akan ditaksir oleh y dan 2 oleh s2.
Untuk menguji hipotesis H0: = 0 melawan H1:
0, akan menggunakan statistik uji:
n (y 0 )
y 0
t=
=
s/

Kasus varians tidak diketahui


(Univariat)

Jika H0 benar, maka t akan berdistribusi tn 1,


dimana n 1 adalah derajat bebasnya.
Hipotesis nol akan ditolak jika |t| t/2,n1, dimana
t/2,n1 adl nilai kritis yang diperoleh dari tabel-t.
t = ( y 0 ) s / n merupakan bentuk karakteristik
dari statistik-t, yang menunjukkan suatu jarak
sampel yang dibakukan antara y dengan 0.
Dalam bentuk seperti ini, rata-rata yang
dihipotesiskan dikurangi oleh y , dan selisihnya itu
kemudian dibagi oleh s y = s / n

Kasus varians tidak diketahui


(Univariat)

Oleh karena y1, y2, , yn merupakan sampel acak


dari N(, 2), maka variabel acak y dan s adalah
saling bebas.
Selanjutnya bentuk karakteristik ini akan analog
dengan statistik-T2 dalam kasus multivariat.

Kasus varians tidak diketahui


(Multivariat)

Sekarang pembahasan dilanjutkan pada kasus


multivariat dimana p buah variabel diukur pada
masing-masing unit sampling.
Diasumsikan bahwa sampel acak y1, y2, , yn
berasal dari Np(, ), dimana yi berisi p
pengukuran pada unit sampling ke-i.
Vektor rata-rata akan ditaksir oleh dan matriks
kovarians oleh S. Untuk menguji hipotesis H0: =
0 melawan H1: 0, akan digunakan perluasan
dari statistik-t univariat.

Kasus varians tidak diketahui


(Multivariat)

Dalam bentuk kuadrat, statistik-t univariat dapat


ditulis kembali sebagai
n ( y 0 )
2 1
t =
n
y

(
s
) ( y 0 )
=

(
0)
2
s
2

Pada saat ( y 0 ) dan s2 digantikan ( y 0 ) oleh


dan S, maka akan diperoleh statistik uji
T 2 = n ( y 0 ) (S ) 1 ( y 0 )
Alternatifnya, T2 dapat diperoleh melalui Z2
dengan cara menggantikan oleh S.

Kasus varians tidak diketahui


(Multivariat)

Distribusi dari T2 ditemukan oleh Hotelling pada


tahun 1931 dengan mengasumsikan bahwa H0
benar dan samplingnya adalah Np(, ).
Distribusi ini mempunyai indeks dua buah
parameter, yaitu p dimensi dan derajat bebas v =
n 1. Hipotesis nol ditolak jika T2 > T 2, p , n 1 .
Apabila sampel berukuran besar dan hipotesis nol
diterima, maka kita cukup mempunyai keyakinan
bahwa nilai yang sebenarnya mendekati suatu
nilai 0 yang dihipotesiskan.

Kasus varians tidak diketahui


(Multivariat)

Statistik-T2 dapat dipandang sebagai jarak sampel


dibakukan antara vektor rata-rata observasi
dengan vektor rata-rata yang dihipotesiskan.
Apabila vektor rata-rata sampel mempunyai jarak
yang cukup jauh dengan vektor rata-rata yang
dihipotesiskan, maka akan terjadi penolakan
terhadap H0.
Densitas dari T2 adalah miring sebab batas
bawahnya adalah nol dan tidak mempunyai batas
atas.

Kasus varians tidak diketahui


(Multivariat)

Statistik uji merupakan besaran skalar, karena


T 2 = n ( y 0 ) ( S ) 1 ( y 0 )

merupakan bentuk kuadratik.


Bentuk karakteristik dari statistik-T2 adalah

S
T = ( y 0 )
n
2

( y 0 )

Kasus varians tidak diketahui


(Multivariat)

Bentuk karakteristik ini mempunyai dua sifat


penting, yaitu:
S/n adalah matriks kovarians sampel dari y dan
dianggap sebagai matriks dibakukan dalam suatu
fungsi jarak.
Oleh karena y1, y2, , yn adalah bersitribusi Np(,
), maka y akan berdistribusi N p ( , 1n ) , (n 1)S
akan berdistribusi W(n 1, ), serta dan S adalah
saling bebas.

Kasus varians tidak diketahui


(Multivariat)

Beberapa sifat tambahan statistik-T2 :


Kita harus mempunyai n 1 > p. Jika tidak, maka S
akan singular dan statistik-T2 tidak dapat dihitung.
Dalam kasus satu-sampel maupun dua-sampel,
derajat bebas untuk statistik-T2 akan sama dengan
uji-t univariat, yaitu v = n 1 untuk kasus satusampel, serta v = n1 + n2 2 untuk kasus duasampel.

Kasus varians tidak diketahui


(Multivariat)

Hipotesis alternatif H1 adalah dua-pihak.


Oleh karena statistik-T2 bekerja dalam ruang
multidimensi, maka di sini tidak akan
dipertimbangkan hipotesis alternatif satu-pihak.
Walaupun hipotesis alternatif H1: 0 pada
dasarnya merupakan uji dua-pihak, namun
demikian daerah kritisnya adalah satu-pihak
Artinya hipotesis nol akan ditolak pada saat
diperoleh T2 yang relatif besar

Kasus varians tidak diketahui


(Multivariat)

2
Dalam kasus univariat, tn 1 = F1,n 1 . Statistik-T2 juga dapat
dikonversikan ke dalam statistik-F sebagai berikut:

v p +1 2
T p ,v = F p ,v p +1
vp

Perlu dicatat bahwa p dimensi (banyaknya variabel) dari


statistik-T2 akan menjadi parameter derajat bebas pertama
dari statistik-F.
Banyaknya derajat bebas dari T2 dinyatakan dengan v, dan
transformasi F diberikan dalam bentuk umum v, karena
aplikasi dari T2 lainnya akan mempunyai v yang berbeda
dengan n 1.

Kasus varians tidak diketahui


(Multivariat)

Jika hasil pengujian membawa kepada penolakan


terhadap H0: = 0, maka pertanyaan selanjutnya
yang akan muncul adalah variabel mana yang
memberikan kontribusi penting terhadap terjadinya
penolakan H0 tersebut.
Masalah ini dapat ditangani dengan membentuk
selang kepercayaan simultan yang didasarkan
pada statistik Hotelling-T2 (interval T2) untuk sampel
acak y1, y2, , yn yang berasal dari populasi
Np(, ) yang didefiniskan oleh

Kasus varians tidak diketahui


(Multivariat)
1 : y1

p(n 1)
s11
Fp ,n p ( )
n
(n p)

2 : y2

s22
p( n 1)
Fp ,n p ( )
(n p )
n
M

p : yp

s pp
p(n 1)
Fp ,n p ( )
n
(n p)

Contoh 5.2:

Dalam Tabel 3.3, diketahui bahwa n = 10


observasi dan p = 3 variabel. Nilai rata-rata yang
dihipotesiskan untuk variabel y1 = 15.0, y2 = 6.0,
dan y3 = 2.85, sehingga hipotesis nolnya dapat
dinyatakan sebagai:
15.0

H 0 : = 6.0
2.85

Contoh 5.2:

Dari hasil perhitungan diperoleh informasi untuk y


dan S sebagai berikut:
28.1

y = 7.18 ,
3.09

140.54 49.68 1.94


S = 49.68 72.25 3.68
1.94 3.68 0.25

Contoh 5.2:

Untuk menguji hipotesis H0 akan digunakan statistikT2 sebagai berikut:


T 2 = n ( y 0 ) S 1 ( y 0 )
28.1 15.0

= 10 7.18 6.0
3.09 2.85

= 24.559

140.54 49.68 1.94 28.1 15.0

49.68
72.25
3.68
7.18

6.0

1.94 3.68 0.25 3.09 2.85

2
T0.05,3,9
= 16.766
= 16.766 ,

Dari Tabel A7, diperoleh nilai kritis


2
Oleh karena T2 = 24.559 > T0.05,3,9
maka hipotesis nol di atas adalah ditolak.

Contoh 5.2:
1 : y1

p ( n 1)
s
140.5444
Fp , n p ( ) 11 = 28.100 16.766
(n p)
n
10

= (23.2457; 32.9542)

2 : y2

p ( n 1)
s
72.2484
Fp ,n p ( ) 22 = 7.180 16.766
(n p )
n
10

= (3.6996; 10.6604)

3 : y3

s33
p (n 1)
0.2501
Fp ,n p ( )
= 3.089 16.766
(n p )
n
10

= (2.8842; 3.2938)

Contoh 5.2:

Dari hasil di atas terlihat bahwa selang kepercayaan simultan


untuk 1, 2, dan 3 semuanya tidak mencakup nilai nol.
Akan tetapi tidak semua selang kepercayaan tersebut
mencakup nilai yang rata-rata yang dihipotesiskan.
Sebagai contoh, misalnya untuk variabel y1, terlihat bahwa
batas bawah dan batas atasnya masing-masing adalah
23.2457 dan 32.9542,
Sementara nilai rata-rata yang dihipotesiskan untuk y1 adalah
15.000, begitu juga untuk variabel y3.
Sedangkan untuk variabel y2, selang kepercayaan yang
terbentuk mencakup nilai dari rata-rata yang dihipotesiskan.

Perbandingan 2 Vektor Rataan


(Univariat)

y11 , y12 ,..., y1n1

N ( 1 , 12 )

y21 , y22 ,..., y2 n1

N ( 2 , 22 )

Diasumsikan bahwa kedua sampel itu saling bebas


dan memenuhi syarat bahwa 12 = 22 = 2 , dimana
2 tidak diketahui.
Asumsi mengenai independensi dan bervarians
sama sangat diperlukan agar statistik-t dalam
Persamaan (5.8) akan mengikuti distribusi-t.

Perbandingan 2 Vektor Rataan


(Univariat)

Dari kedua sampel tersebut akan dihitung


beberapa besaran yang diperlukan, yaitu y1 dan y2
SS1 = i =1 ( y1i y1 ) = ( n1 1) s12
n1

SS2 = i =1 ( y2i y2 ) = ( n2 1) s22


n2

2
2
SS
+
SS
(
n

1)
s
+
(
n

1)
s
2
2
1
2
2
sgab
= 1
= 1
n1 + n2 2
n1 + n2 2

Perbandingan 2 Vektor Rataan


(Univariat)

2
2
Diketahui bahwa E ( sgab
=

)
Untuk menguji hipotesis bahwa H0: 1 = 2 vs H1: 1
2, maka akan digunakan statistik uji

y1 y2
t=
1 1
sgab
+
n1 n2

yang akan mengikuti distribusi-t dengan derajat


bebas n1 + n2 2 pada saat H0 benar.
H0 akan ditolak pada saat t t / 2,n + n 2
1

Perbandingan 2 Vektor Rataan


(Multivariat)

y 11 , y 12 , ..., y 1 n1

N p ( 1 , 1 )

y 21 , y 22 ,..., y 2 n1

N p (2 , 2 )

Untuk kasus dimana p buah variabel diukur pada


setiap unit sampling dalam dua sampel. Disini akan
diuji suatu hipotesis
H 0 : 1 = 2

melawan

H1 : 1 2

Perbandingan 2 Vektor Rataan


(Multivariat)

Diasumsikan bahwa kedua sampel itu saling bebas


dan memenuhi syarat bahwa ,
1 = 2 =
dimana tidak diketahui.
Asumsi mengenai independensi dan bervarians
sama sangat diperlukan agar statistik-T2 dalam
Persamaan (5.9) akan mengikuti distribusi-T2.

Perbandingan 2 Vektor Rataan


(Multivariat)

Vektor rata-rata sampel 1:

y1 = i =1 y1i / n1

Vektor rata-rata sampel 2:

y 2 = i =1 y 2 i / n2

n1

n2

Matriks jumlah kuadrat dan perkalian silang untuk


kedua sampel
n1

W1 = ( y1i y1 )( y1i y1 ) ' = ( n1 1) S1


i =1
n2

W2 = ( y 2 i y 2 )( y 2 i y 2 ) ' = ( n2 1) S 2
i =1

Perbandingan 2 Vektor Rataan


(Multivariat)

Oleh karena (n1 1)S1 merupakan penaksir takbias


bagi (n1 1)1 dan (n2 1)S2 merupakan penaksir
takbias bagi (n2 1)2, maka kita dapat
menggabungkannya untuk memperoleh penaksir
takbias bagi matriks kovarians populasi , yaitu
1
S gab =
( W1 + W2 )
n1 + n2 2
1
=
[ ( n1 1) S1 + ( n2 1) S 2]
n1 + n2 2

Perbandingan 2 Vektor Rataan


(Multivariat)

Jadi E(Sgab) = . Kuadrat dari statistik-t univariat


dalam (5.8) dapat dinyatakan sebagai
1
n1n2
2
t =
( y1 y2 ) ( sgab ) ( y1 y2 )
n1 + n2
2

Bentuk di atas dapat diperluas pada p buah


variabel dengan mensubstitusikan
( y1 y 2 ) ke ( y1 y2 )
2
Sgab
ke
sgab

Perbandingan 2 Vektor Rataan


(Multivariat)

Sehingga diperoleh
n1n2
1
T =
( y1 y 2 ) ' Sgab
( y1 y 2 )
n1 + n2
2

yang akan mengikuti distribusi Tp2,n1 + n2 2 pada saat


H0 benar. Untuk dapat melakukan pengujian
hipotesis ini, langkah-langkahnya adalah kumpulkan
data untuk dua sampel, hitung statistik-T2 dalam
(5.9), kemudian tolak hipotesis H0 jika

T T
2

2
, p , n1 + n2 2

Perbandingan 2 Vektor Rataan


(Multivariat)

Statistik-T2 dalam (5.9) dapat dinyatakan dalam


bentuk karakteristik sebagai jarak dibakukan
antara y1 dan y 2 :
1 1

T = ( y1 y 2 ) ' + S gab
n1 n2

( y1 y 2 )

dimana (1/n1 + 1/n2)Sgab adalah matriks kovarians


sampel untuk ( y1 y 2 ) dan Sgab adalah saling
bebas dengan ( y1 y 2 ) sebab sampling berasal
dari populasi normal multivariat

Perbandingan 2 Vektor Rataan


(Multivariat)

Berikut ini adalah beberapa sifat penting


dari statistik-T2:
Diperlukan syarat bahwa n1 + n2 2 > p supaya
Sgab bersifat nonsingular.
Pada saat T2 besar maka hasil pengujian
cenderung akan mendukung H1, sedangkan untuk
nilai T2 kecil akan memberikan hasil pengujian yang
cenderung mendukung H0.

Perbandingan 2 Vektor Rataan


(Multivariat)

Oleh karena batas bawah dari T2 adalah nol dan


tidak mempunyai batas atas, maka densitas dari T2
adalah miring. Dalam kenyataannya memang T2
dapat dihubungkan secara langsung ke statistik-F
yang juga berdistribusi miring.
Derajat bebas untuk T2 adalah n1 + n2 2 yang
berarti sama dengan derajat bebas untuk statistik-t
univariat.

Perbandingan 2 Vektor Rataan


(Multivariat)

Hipotesis alternatif H1 :1 2 merupakan uji duapihak. Akan tetapi daerah kritisnya adalah yang
merupakan uji satu-pihak.
Statistik-T2 dapat ditransformasikan ke statistik-F
dengan menggunakan Persamaan (5.7):

n1 + n2 p 1 2
T = Fp ,n1 + n2 p 1
( n1 + n2 2) p
dimana p dimensi dari statistik-T2 menjadi
parameter derajat bebas pertama untuk statistik-F.

Perbandingan 2 Vektor Rataan


(Multivariat)

Dimungkinkan untuk membentuk selang


kepercayaan simultan untuk komponen-komponen di
dalam vektor 1 2.
Selang kepercayaan ini dibentuk dengan cara
mempertimbangkan seluruh kombinasi linear yang
mungkin dari selisih dalam vektor rata-rata.
Diasumsikan bahwa data berasal dari populasi
yang berdistribusi normal multivariat dan matriks
kovarians sama.

Perbandingan 2 Vektor Rataan


(Multivariat)

Untuk membentuk 100(1 )% selang


kepercayaan ini, misalkan diketahui bahwa
c = ( n1 + n2 2 ) p / ( n1 + n2 p 1) F , p ,n1 + n2 p 1
2

Kemudian, dengan peluang sebesar 1 maka


seleng kepercayaannya menjadi:
1 1
a`( y1 y 2 ) c a` + S gaba
n1 n2

Perbandingan 2 Vektor Rataan


(Multivariat)

Secara khusus, selang kepercayaan untuk 1i 2i


akan diberikan oleh
1 1
( y1i y2i ) c + S gabii
n1 n2

Selain itu, dapat juga dibentuk selang kepercayaan


100(1 )% Bonferonni untuk selisih rata-rata dari
p buah populasi yang diberikan oleh
1 1
1i 2i : ( x1i x2i ) tn1 +n2 2 + sgabii
2 p n1 n2

Contoh 5.3:

Empat jenis uji psikolgi diberikan pada 32 laki-laki


dan 32 wanita. Hasil pengujian tersebut disajikan
pada Tabel 5.1. Empat buah variabel yang diamati
itu adalah
y1 = pictorial inconsistencies;
y2 = tool recognition;
y3 = paper form board; serta
y4 = vocabulary.

Contoh 5.3:

Vektor rata-rata untuk sampel 1 dan 2:


12.34
13.91

y2 =
16.66

21.94

15.97
15.91

y1 =
27.19

22.75

Matriks varians-kovarians untuk sampel 1 dan 2:

5.192 4.545

4.545 13.18

S1 =
6.522 6.760

5.250 6.266

6.522 5.250

6.760 6.266
28.67 14.47

14.47 16.65

9.136 7.549
7.549 18.60
S2 =
4.864 10.22

4.151 5.446

4.864 4.151
10.22 5.446
30.04 13.49

13.49 28.00

Contoh 5.3:

Matriks varians-kovarians gabungan:


S gab =

1
[(32 1)S1 + (32 1)S 2 ]
32 + 32 2

7.164
6.047
=
5.693

4.701

6.047 5.693 4.701


15.89 8.492 5.856
8.492 29.36 13.89

5.856 13.98 22.32

Nilai statistik-T2:
T2 =

n1n2
1
( y1 y 2 ) ' Sgab
( y1 y 2 ) = 97.6015
n1 + n2

Contoh 5.3:

Melalui proses interpolasi dalam Tabel A7,


2
=, 15.373
diperoleh T0.01,4,62
dengan demikian hipotesis H 0 : 1 = 2 ditolak.
95% selang kepercayaan simultan 1i 2i, untuk i
= 1, 2, 3, dan 4 yang dihitung melalui Persamaan
(5.13). Hasilnya adalah
1 1
1
1
( y11 y21 ) c + S gabii = 3.625 10.6258 + 7.1643
32 32
n1 n2
1.4437 11 21 5.8062

Contoh 5.3:
1 1
1
1
y
y
c
2.000
10.6258

+
S
=

+
( 12 22 )

gab22

15.8941
32 32
n1 n2
1.2489 12 22 5.2489
1 1
1
1
( y13 y23 ) c + S gab33 = 10.531 10.6258 + 29.3564
32 32
n1 n2
6.1158 13 23 14.9467
1 1
1
1
y

c
+
S
=
0.8125

10.6258
+
( 14 24 )

gab44

22.3206
32 32
n1 n2
3.0376 14 24 4.6626

Contoh 5.3:

Dari keempat selang kepercayaan simultan yang


terbentuk di atas, terlihat bahwa terdapat dua
selang yang mencakup nilai nol, dan dua selang
lainnya tidak mencakup nol.
Selang kepercayaan simultan yang tidak mencakup
nol adalah yang berhubungan dengan variabel y1
dan y3,
Selang kepercayaan yang mencakup nilai nol adl
yg berhubungan dengan variabel y2 dan y4.

Contoh 5.3:

Dengan demikian dapat dikatakan bahwa variabel


y1 dan y3 merupakan variabel yang memberikan
kontribusi terhadap terjadinya penolakan pada
hipotesis nol.
Variabel y2 dan y4 menunjukan bahwa secara ratarata untuk kedua variabel tersebut pada kelompok
laki-laki dan wanita adalah sama.

Uji Rasio Kemungkinan

Pada bagian sebelumnya telah diperkenalkan statistikT2 sebagai analogi dari jarak kuadrat univariat, t2.
Ada prinsip-prinsip yang lebih umum untuk membentuk
prosedur pengujian yang disebut dengan metode rasio
kemungkinan (likelihood ratio method, dimana statistikT2 dapat diturunkan sebagai uji rasio kemungkinan dari
H0: = 0.
Uji rasio kemungkinan mempunyai beberapa sifat yang
optimum pada sampel berukuran besar, dan akan lebih
tepat digunakan dengan asumsi bahwa data mengikuti
distribusi normal multivariat.

Uji Rasio Kemungkinan

Pendekatan kemungkinan maksimum banyak


digunakan untuk proses penaksiran parameter.
Fungsi kemungkinan adalah densitas gabungan dari
y1, y2, , yn.
Nilai dari parameter yang memaksimumkan fungsi
kemungkinan disebut sebagai penaksir
kemungkinan maksimum yang diberikan oleh
max L ( , ) =
,

1
(2 )

np / 2

n/2

e np / 2

Uji Rasio Kemungkinan

Diketahui bahwa:
n
1
= ( y y )( y y )`

i
i
n i =1

1 n
= y = y i
n i =1

adalah penaksir kemungkinan maksimum. Perlu


diketahui bahwa penaksir kemungkinan maksimum
dan dipilih sedemikian rupa sehingga mampu
menjelaskan dengan baik nilai pengamatan dari suatu
sampel acak.

Uji Rasio Kemungkinan

Untuk kasus pengujian satu vektor rata-rata,


dimana hipotesis yang akan diuji adalah H0: = 0
melawan H1: 0.
Di bawah H0: = 0, maka fungsi kemungkinannya
adalah
L (0 , ) =

1
(2 ) np / 2 | |n /2

1 n

1
exp ( y i 0 )` ( y i 0 )
2 i =1

Uji Rasio Kemungkinan:

Maksimum dari fungsi kemungkinan dalam


persamaan di atas diberikan oleh:
max L ( 0 , ) =
,

(2 ) np / 2
0

np /2
e
n/ 2

dimana:
n
1
= ( y )( y )`

i
i
0
0
0
n i =1

Uji Rasio Kemungkinan:

Kemudian akan dibandingkan maksimum dari L(0,


) dengan maksimum tak-terbatas L(, ).
Perbandingan disebut juga sebagai statistik uji rasio
kemungkinan (likelihood ratio tests) yang
didefiniskan sebagai:

=
=
max L(, )
,

max L( 0 , )

n /2

Uji Rasio Kemungkinan:

Statistik yang ekivalen n/2 = 0 disebut


sebagai Wilks lambda.
Apabila nilai pengamatan dari rasio kemungkinan
ini terlalu kecil, maka hipotesis H0: = 0 akan
ditolak.
Uji rasio kemungkinan H0: = 0 melawan H0:
0 akan menolak jika:

n/2

( y i y )( y i y )`

i =1

`
y

( i 0 )( i 0 )

i =1

n/2

< C

Uji Rasio Kemungkinan

Statistik-T2 yang diberikan dalam Persamaan (5.9)


dengan dengan uji rasio kemungkinan pada Persamaan
(5.18) dapat dihubungkan melalui persamaan berikut:

T
2/ n = 1 +

1)
n

Sekali lagi, metode rasio kemungkinan dari suatu


pengujian hipotesis menggunakan rasio antara nilai
maksimum dari fungsi kemungkinan dengan
mengasumsikan bahwa H0 benar dengan maksimum
dari fungsi kemungkinan di bawah H1.

Uji Rasio Kemungkinan:

Uji rasio kemungkinan ini mempunyai kuasa uji yang


baik, dan kadang-kadang mempunyai kuasa yang
optimum dibandingkan dengan alternatif lainnya.
Dengan cara yang sama, ketika diterapkan pada
sampel normal multivariat dan untuk menguji
hipotesis H0 :1 = 2 , maka pendekatan rasio
kemungkinan akan membawa pada statistik-T2
Hotelling yang diberikan pada Persamaan (5.9).

Anda mungkin juga menyukai