Anda di halaman 1dari 9

5.4.

2 Multivariate Two-Sample 𝑻𝟐 -Test

Kita sekarang mempertimbangkan kasus di mana p variabel diukur pada setiap unit sampling
di dua sampel. Kita ingin menguji :

𝐻0 : 𝜇1 = 𝜇2 Vs 𝐻1 : 𝜇1 ≠ 𝜇2

Kita memperoleh sampel acak 𝑦11 , 𝑦12 , 𝑦13 , ... , 𝑦1𝑛 dari 𝑁𝑝 (𝜇1 , Σ1 ) dan sampel random
kedua 𝑦21 , 𝑦22 , 𝑦23 , ... , 𝑦2𝑛 dari 𝑁𝑝 (𝜇2 , Σ2 ). Kita asumsikan bahwa dua sampel bersifat
independen dan bahwa Σ1 = Σ2 = Σ, katakanlah Σ tidak diketahui. Asumsi-asumsi ini
diperlukan dalam rangka untuk 𝑇 2 - statistika di (5.9) untuk mencapai 𝑇 2 - distribusi.

Tes dari 𝐻0 : Σ1 = Σ2 diberikan di sesi 7.3.2. Untuk aproksimasi tes dari 𝐻0 : 𝜇1 = 𝜇2 yang
dapat digunakan ketika Σ1 ≠ Σ2 lihat Rencher (1998, Bagian 3.9).

1 1𝑖 𝑛 𝑦 2 2𝑖 𝑛 𝑦
Vektor mean sampel adalah 𝑦 ̅1 = ∑𝑖=1 ̅2 = ∑𝑖=1
dan 𝑦 , W 1 dan W 2 menjadi
𝑛1 𝑛2
matriks jumlah kuadrat dan produk silang untuk keduanya sampel:
𝑛1

𝑊1 = ∑(𝑦1𝑖 − 𝑦̅𝑖 ) (𝑦1𝑖 − 𝑦̅𝑖 )′ = (𝑛1 − 1)𝑆1


𝑖=1

𝑛2

𝑊2 = ∑(𝑦2𝑖 − 𝑦̅𝑖 ) (𝑦2𝑖 − 𝑦̅𝑖 )′ = (𝑛2 − 1)𝑆2


𝑖=1

Karena (𝑛1 − 1)𝑆1 adalah penduga yang tidak bias dari (𝑛1 − 1)Σ dan (𝑛2 − 1)𝑆2 adalah
penaksir tidak bias (𝑛2 − 1)Σ , kita dapat mengumpulkan mereka untuk memperoleh
penduga yang tidak bias matriks kovariansi populasi umum,:

1
𝑆𝑝1 = (𝑊 + 𝑊2 )
𝑛1 + 𝑛2 − 2 1
1
= 𝑛1+𝑛2−2 [(𝑛1 − 1)𝑆1 + (𝑛2 − 1)𝑆2 ]
Jadi 𝐸(𝑆𝑝1 ) = Σ

Kuadrat dari t -statistik univariat (5.8) dapat dinyatakan sebagai

n1n2
t2  ( y1  y 2 )( S p21 )( y1  y 2 )
n1  n2

Ini dapat digeneralisasikan ke p variabel dengan mensubstitusi 𝑦̅1 − 𝑦̅2 untuk y 1 - y 2 dan
S p1 S pl untuk S p21 untuk memperoleh

n1n2
T2  ( y1  y 2 )' ( S p11 )( y1  y 2 )
n1  n2
yang didistribusikan sebagai Tp2,n1n 22 ketika 𝐻0 : 𝜇1 = 𝜇2 benar. Untuk melaksanakan
2 2
uji, kami mengumpulkan dua sampel, menghitung T (5.9), dan menolak 𝐻0 jika T ≥
Tp2,n1n 22 . Nilai-nilai kritis dari T 2 ditemukan di Tabel A.7. Untuk tabel kekuatan dari T
2

-test (kemungkinan menolak 𝐻0 ketika itu salah) dan ilustrasi dari mereka gunakan, lihat
Rencher (1998, Bagian 3.10).

T 2 -statistic (5,9) dapat dinyatakan dalam bentuk karakteristik sebagai standar jarak antara
y1 dan y 2 :

1
 1 1 
T  ( y1  y 2 ) (  ) S p1  ( y1  y 2 )
2 '

 n1 n2 

1 1
dimana (  ) S p1 adalah matriks kovariansi sampel untuk y1  y 2 dan S p1 adalah
n1 n 2
independen dari y1  y 2 karena pengambilan sampel dari multivariat normal. Untuk sebuah
2
pembahasan ketahanan T untuk berangkat dari asumsi multivariat normalitas dan
homogenitas matriks kovarian (Σ1 = Σ2 ) , lihat Rencher (1998, Bagian 3.7).

Beberapa properti kunci dari dua sampel T 2 -tes diberikan dalam daftar berikut:

1. Diperlukan untuk 𝑛1 + 𝑛2 − 2 > 𝑝 untuk 𝑆𝑝1 menjadi nonsingular.


2
2. statistik T , tentu saja, skalar. Jumlah 3 p + p (p - 1 ) / 2 dalam 𝑦̅1 , 𝑦̅2 dan 𝑆𝑝1 telah
2
dikurangi menjadi skala tunggal dimana T besar jika bukti sampel mendukung
𝐻1 : 𝜇1 ≠ 𝜇2 dan kecil jika bukti mendukung 𝐻0 : 𝜇1 = 𝜇2 ; kami menolak 𝐻0 jika jarak
standar antara 𝑦̅1 dan 𝑦̅2 adalah besar.
2
3. Karena batas bawah dari T adalah nol dan tidak ada batas atas, densitas miring.
Bahkan, sebagaimana dicatat dalam (5.11), T 2 secara langsung berkaitan dengan F ,
yang merupakan a distribusi miring yang terkenal.
2
4. Untuk derajat kebebasan T kita memiliki 𝑛1 + 𝑛2 − 2, yang sama seperti untuk t -
statistic univariat yang sesuai (5.8).
5. Hipotesis alternatif 𝐻1 : 𝜇1 ≠ 𝜇2 adalah dua sisi. Wilayah kritis 𝑇 2 > 𝑇𝛼2 adalah satu
sisi, namun, seperti tipikal banyak tes multivariat.
6. 𝑇 2 -statistic dapat langsung diubah ke F-statistic menggunakan (5,7):

𝑛1 + 𝑛2 − 𝑝 − 1 2
𝑇 = 𝐹𝑝,𝑛1+𝑛2−𝑝−1
(𝑛1 + 𝑛2 − 2)𝑝
di mana lagi dimensi 𝑝 dari 𝑇 2 -statistic menjadi derajat pertama dari parameter
kebebasan untuk F -statistic.

Contoh 5.4.2

Empat tes psikologi diberikan kepada 32 pria dan 32 wanita. Data dicatat dalam Tabel 5.1
(Beall 1945). Variabel-variabelnya adalah
y 1 = inkonsistensi bergambar
y 3 = pengenalan alat
y 2 = papan bentuk kertas
y 4 = kosakata

Matriks kovarians sampel tidak menunjukkan adanya perbedaan dalam populasi. matriks
kovariansi lation. (Tes signifikansi untuk memeriksa asumsi ini dilakukan dalam Contoh
7.3.2, dan hipotesis H0 : Σ1 ≠ Σ2 tidak ditolak.) Kumpulan matriks kovariansinya adalah :
Dengan (5.9), kita dapat :

𝑛1𝑛2 −1 (𝑦
𝑇2 = (𝑦1 − 𝑦2 )′ 𝑆𝑝1 1 − 𝑦2 ) = 97.6015
𝑛1 + 𝑛2
2
Dari interpolasi pada Tabel A.7, kita memperoleh𝑇.01,4,62 = 15.373, dan kami karenanya
tolak 𝐻0 : 𝜇1 = 𝜇2 . Lihat Contoh 5.5 untuk diskusi tentang variabel mana yang berkontribusi
sebagian besar untuk pemisahan kedua kelompok.
5.4.3 Likelihood Ratio Tests

Pendekatan kemungkinan maksimum untuk estimasi diperkenalkan di Bagian 4.3.1. Sebagai


mencatat ada, fungsi kemungkinan adalah kepadatan gabungan dari y 1, y 2, ..., y n. Nilai dari
parameter yang memaksimalkan fungsi kemungkinan adalah kemungkinan maksimum
penduga.

Metode rasio kemungkinan konstruksi tes menggunakan rasio maksimal nilai fungsi
likelihood dengan asumsi 𝐻𝑜 bernilai true di bawah 𝐻1 , yang pada dasarnya tidak dibatasi.
Tes rasio kemungkinan biasanya memiliki kekuatan yang baik dan kadang-kadang memiliki
kekuatan optimal atas berbagai kelas alternatif.

Ketika diterapkan pada sampel normal multivariat dan 𝐻0 : 𝜇1 = 𝜇2 , kemungkinan


Pendekatan rasio mengarah langsung ke Hotelling’s 𝑇 2 -test di dalam (5.9). Demikian pula,
di satu- kasus sampel, 𝑇 2 -statistic di (5,5) adalah tes rasio kemungkinan. Jadi 𝑇 2 -test, yang
kami perkenalkan secara informal, adalah tes terbaik menurut kriteria tertentu.

5.5 TESTS ON INDIVIDUAL VARIABLES CONDITIONAL ON REJECTION OF


𝑯𝟎 BY THE 𝑻𝟐 -TEST

Jika hipotesis 𝐻0 : 𝜇1 = 𝜇2 ditolak, implikasinya adalah 𝜇1𝑗 ≠ 𝜇2𝑗 untuk setidaknya satu j = 1
, 2 , ..., p . Tetapi tidak ada jaminan bahwa 𝐻0 : 𝜇1𝑗 = 𝜇2𝑗 akan menjadi ditolak untuk
beberapa j dengan tes univariat. Namun, jika kita menganggap kombinasi linear variabel,
𝑧 = 𝑎′ 𝑦, maka ada setidaknya satu koefisien vektor yang :

𝑧̅1 − 𝑧̅2
𝑡(𝑎) =
√( 1 + 1 )𝑠𝑧2
𝑛1 𝑛2

akan menolak hipotesis yang sesuai 𝐻0 : 𝜇𝑧1 = 𝜇𝑧2 atau 𝐻0 : 𝑎′ 𝜇1 = 𝑎′ 𝜇2 2 . Oleh (3,54), 𝑧̅1 =
̅1 dan 𝑧̅2 = 𝑎′ 𝑦̅2 , dan dari (3.55) estimator varians 𝑠𝑧2 adalah estimator yang
𝑎′ 𝑦
dikumpulkan 𝑎′ 𝑆𝑝1 𝑎 . Jadi (5.12) dapat ditulis sebagai :
𝑎′ 𝑦
̅1 − 𝑎′ 𝑦̅2
𝑡(𝑎) =
√( 1 + 1 )𝑎′ 𝑆𝑝1 𝑎
𝑛1 𝑛2
Karena 𝑡(𝑎) bisa negatif, kita bekerja dengan 𝑡 2 (𝑎). Fungsi linear 𝑧 = 𝑎′𝑦 adalah
proyeksi y ke garis melalui titik asal. Kami mencari garis (arah) dimana perbedaan y 1 - y 2
dimaksimalkan ketika diproyeksikan. Perbedaan yang diproyeksikan a ( 𝑦 ̅1 - 𝑦̅2 ) [standar
oleh S pl a seperti pada (5.13)] akan kurang di arah lain dari itu sejajar dengan garis yang
menghubungkan 𝑦 ̅1 dan 𝑦̅2 . Nilai dari sebuah proyek ke ini garis, atau, setara,
2 (𝑎)
memaksimalkan 𝑡 dalam (5.13), adalah (ada kelipatan dari)

−1 ̅
𝑎 = 𝑆𝑝1 (𝑦1 − 𝑦
̅2)
Sejak 𝒂 dalam (5.14) memproyeksikan 𝑦 ̅1 - 𝑦̅2 ke garis sejajar dengan garis yang
menghubungkan 𝑦 ̅1 dan 𝑦̅2 , kami berharap bahwa 𝑡 2 (𝑎) = 𝑇2 , dan ini memang demikian
(lihat Soal 5.3).
−1 (𝑦
Ketika 𝑎 = 𝑆𝑝1 ̅1 − 𝑦̅2 ) , maka 𝑧 = 𝑎′𝑦 disebut fungsi diskriminan . Kadang vektor itu
sendiri dalam (5.14) secara longgar disebut sebagai fungsi diskriminan. Jika 𝐻0 : 𝜇1 = 𝜇2
ditolak oleh 𝑇 2 di (5,9), fungsi diskriminan 𝑎′𝑦 akan menyebabkan penolakan 𝐻0 : 𝑎′ 𝜇1 =
𝑎′ 𝜇2 menggunakan (5.13), dengan 𝑎 = 𝑆𝑝1 −1 (𝑦
̅1 − 𝑦̅2 ) . Kita dapat kemudian memeriksa
masing-masing 𝒂𝒋 dalam untuk indikasi kontribusi yang sesuai 𝒚𝒋 terhadap penolakan 𝐻0 .
Pemeriksaan tindak lanjut dari masing - masing j harus dilakukan saja jika 𝐻0 : 𝜇1 = 𝜇2
ditolak oleh 𝑇 2 . Fungsi diskriminan akan muncul lagi di Bagian 5.6.2 dan dalam Bab 8 dan
9.

Kami daftar ini dan prosedur lain yang dapat digunakan untuk memeriksa setiap variabel
melenguh penolakan 𝐻0 oleh dua sampel𝑇 2 -test:

1. Univariat t- test, satu untuk setiap variabel,


𝑦̅1𝑗 −𝑦̅2𝑗
𝑡𝑗 = 𝑗 = 1,2, … , 𝑝 (5.15)
(𝑛1+𝑛2)
√[ ]𝑠𝑗𝑗
𝑛1𝑛2

di mana 𝑠𝑗𝑗 adalah 𝑘𝑒 − 𝑗 elemen diagonal dari 𝑆𝑝1. Tolak 𝐻0 : 𝜇1𝑗 = 𝜇2𝑗 jika
| 𝑡𝑗 | > 𝑡 𝛼 ,𝑛1+𝑛2−2 . Untuk interval kepercayaan pada µ 1 j - µ 2 j , lihat Rencher
2𝑝
(1998, Sec- tion 3.6).
2. Untuk menyesuaikan tingkat- α yang dihasilkan dari melakukan tes p dalam (5.15),
kita bisa gunakan nilai penting Bonferroni 𝑡 𝛼 ,𝑛1+𝑛2−2 untuk (5.15) (Bonferroni
2𝑝
1936). SEBUAH nilai kritis 𝑡 𝛼 jauh lebih besar daripada 𝑡𝛼 , dan menghasilkan
2𝑝 2
keseluruhan 𝛼 level konservatif. Nilai kritis Bonferroni 𝑡 𝛼 ,𝑣 diberikan di Tabel A.8,
2𝑝
dari Bailey (1977).
3. Nilai kritis lain yang dapat digunakan dengan (5.15) adalah T α, p, n 1 + n 2 −2 , di
mana T α adalah akar kuadrat dari T 2 α dari Tabel A.7; yaitu, T α, p, n 1 + n 2 −2 = √
T 2 α, p, n 1 + n 2 −2 . Hal ini memungkinkan untuk semua variabel p yang akan diuji
serta semua kemungkinan binations, seperti pada (5.13), bahkan kombinasi linear
yang dipilih setelah melihat data. Akibatnya, penggunaan T α bahkan lebih
konservatif daripada menggunakan t α / 2 p ; bahwa adalah, T α, p, n 1 + n 2 −2 > t α /
2 p, n 1 + n 2 −2 .
4. Partial F - atau t- test [uji setiap variabel yang disesuaikan untuk variabel lain; Lihat
(5.32) di Bagian 5.8]
5. Koefisien fungsi diskriminan standar (lihat Bagian 8.5)
6. Korelasi antara variabel dan fungsi diskriminan (lihat tion 8.7.3) 7. Analisis
diskriminan bertahap (lihat Bagian 8.9)
7. Analisis diskriminan bertahap (lihat Bagian 8.9)
Tiga metode pertama adalah pendekatan univariat yang tidak menggunakan kovarian atau
korelasi antara variabel dalam perhitungan statistik uji. Empat terakhir metode multivariat
dalam arti bahwa struktur korelasi secara eksplisit diambil memperhitungkan dalam
perhitungan.

Metode 6, yang melibatkan korelasi antara masing-masing variabel dan diskriminan fungsi,
direkomendasikan dalam banyak teks dan paket perangkat lunak. Namun, Rencher (1988)
telah menunjukkan bahwa korelasi ini sebanding dengan t -atau F- test individu (lihat Bagian
8.7.3). Dengan demikian metode ini setara dengan metode 1 dan merupakan univariat bukan
pendekatan multivariat. Metode 7 sering digunakan untuk mengidentifikasi bagian dari
variabel penting atau bahkan untuk menentukan peringkat variabel berdasarkan urutan entri.
Tapi Rencher dan Larson (1980) telah menunjukkan bahwa metode bertahap memiliki risiko
tinggi memilih variabel palsu, kecuali ukuran sampel sangat besar.

Kami sekarang mempertimbangkan prosedur univariat 1, 2, dan 3. Probabilitas penolakan


satu atau lebih dari tes p univariat ketika H 0 benar disebut α keseluruhan atau tingkat
kesalahan eksperimen . Jika kita melakukan tes univariat saja, tanpa T 2-test, maka tes
berdasarkan t α / 2 p dan T α dalam prosedur 2 dan 3 bersifat konservatif (secara keseluruhan
α juga rendah), dan tes berdasarkan t α / 2 dalam prosedur 1 bersifat liberal (keseluruhan α
terlalu tinggi). Namun, ketika tes ini dilakukan hanya setelah penolakan oleh T 2-test (tes
tersebut kadang-kadang disebut tes yang dilindungi), tingkat kesalahan eksperimen berubah.
Tentunya tes akan menolak jarang (di bawah H 0) jika mereka dilakukan hanya jika T 2
menolak. Dengan demikian tes menggunakan t α / 2 p dan T α menjadi lebih konservatif, dan
tes menggunakan t α / 2 menjadi lebih diterima.

Hummel dan Sligo (1971) mempelajari tingkat kesalahan eksperimen untuk t univariat - tes
berikut penolakan H 0 oleh T 2 -tes (tes yang dilindungi). Menggunakan α = . 05, mereka
menemukan bahwa menggunakan t α / 2 untuk nilai kritis menghasilkan α secara keseluruhan
yang dapat diterima dekat dengan nominal .05. Bahkan, itu sedikit konservatif, membuat ini
menjadi univariat yang disukai tes (dalam batas-batas studi mereka). Mereka juga
membandingkan prosedur ini dengan prosedur melakukan tes univariat tanpa terlebih dahulu
T 2-test (tes tidak dilindungi). Untuk kasus ini, α keseluruhan terlalu tinggi, seperti yang
diharapkan. Tabel 5.2 memberikan cuplikan Hummel dan Hasil Sligo. Ukuran sampel untuk
masing-masing dari dua sampel; r 2 di umum adalah untuk setiap pasangan variabel.

Hummel dan Sligo menyarankan untuk melakukan multivariat T 2 -tes diikuti oleh t- tes
univariat . Prosedur ini tampaknya memiliki keseluruhan yang diinginkan α level dan jelas
akan memiliki kekuatan yang lebih baik daripada tes menggunakan T α atau t α / 2 p sebagai
kritis nilai. Tabel 5.2 juga menyoroti pentingnya menggunakan t- test univariat hanya jika
multivariat T 2 -tes signifikan. The inflated α 's menghasilkan jika t -tests digunakan tanpa
memperhatikan hasil dari T 2-test terlihat jelas. Jadi di antara yang tiga prosedur univariat
(prosedur 1, 2, dan 3), yang pertama tampaknya lebih disukai.

Di antara pendekatan multivariat (prosedur 4, 5, dan 7), kami lebih memilih yang kelima
prosedur, yang membandingkan (nilai absolut) koefisien dalam diskriminan berfungsi untuk
menemukan pengaruh masing-masing variabel dalam memisahkan kedua kelompok
pengamat. vations. Koefisien ini sering akan menceritakan kisah yang berbeda dari pengujian
univariat, karena tes univariat tidak memperhitungkan korelasi antar variabel ables atau
pengaruh masing-masing variabel pada T 2 di hadapan variabel lain. SEBUAH variabel
biasanya akan memiliki efek yang berbeda dengan adanya variabel lain selain itu dengan
sendirinya. Dalam fungsi diskriminan z = ay = a 1 y 1 + a 2 y 2 + ··· + a p y p , dimana a = S
−1 pl ( y 1 - y 2 ) , koefisien a 1 , a 2 , ..., a p menunjukkan relatif penting- tance dari variabel
dalam konteks multivariat, sesuatu t- tes univariat dapat- tidak. Jika variabel tidak sepadan
(serupa dalam skala dan varians), yang koefisien harus distandarisasi, seperti dalam Bagian
8.5; ini memungkinkan untuk lebih valid perbandingan antar variabel. Rencher dan Scott
(1990) memberikan dekomposisi informasi dalam koefisien fungsi diskriminan standar.
Untuk sebuah analisis rinci dari efek setiap variabel di hadapan variabel lain, lihat Rencher
(1993; 1998, Bagian 3.3.5 dan 3.5.3).

Contoh 5.5. Untuk data psikologis pada Tabel 5.1, kami memperoleh y 1 , y 2 , dan S pl
dalam Contoh 5.4.2. Vektor koefisien fungsi diskriminan diperoleh dari (5.14) sebagai

Dengan demikian kombinasi linear yang paling baik memisahkan kedua kelompok adalah
di mana y 1 dan y 3 tampaknya berkontribusi paling besar untuk pemisahan kedua kelompok.
(Setelah standardisasi, kontribusi relatif dari variabel agak berubah; lihat Jawaban untuk Soal
8.7 di Appendix B.)

Anda mungkin juga menyukai