Anda di halaman 1dari 167

Alauddin University Press

Irwan, S.Si., M.Si.


Irwan, S.Si., M.Si, lahir di Lisu, Kabupaten Barru pada Tahun 1978 Adnan Sauddin, S.Pd., M.Si.
bulan September tanggal 22. Menyelesaikan Pendidikan Magister
pada Jurusan Statistika Institut Teknologi Sepuluh November
Surabaya pada tahun 2006, Tahun 2003 menyelesaikan studi pada
Jurusan Pendidikan Matematika Universitas Negeri Makassar.
Selama mengikuti Pendidikan penulis terlibat pada beberapa
organisasi, asisten dosen, tim asisten di Laboratorium Komputer
Matematika.
Sejak tahun 2006, penulis mulai aktif mengajar di Jurusan
Matematika Fakultas Sains dan Teknologi Universitas Islam Negeri

STATISTIKA

S T A T I S T I K A
Alauddin Makassar hingga sekarang. Mengikuti berbagai pelatihan
profesional dan juga sebagai trainer-Pelatihan Modul Dasar BTL,
LSE, ICT bagi guru SMT/MTS mitra DBE3 USAID Indonesia-2008-
2009, fasilitator pada workshop pembelajaran PAKEM dan
penggunaan alat peraga matematika bagi guru SD/MI se-
kabupaten Bulukumba. Jabatan Struktural, Ketua Jurusan
Matematika, Sekretaris LPM UIN Alauddin Makassar.
MULTIVARIAT

M U L T I V A R I A T
Adnan Sauddin, lahir Teomokole pada Tahun 1974 bulan Mei
tanggal 17. Suatu daerah kepulauan (Pulau Kabaena) di Kabupaten
Bombana. Anak ke-16 dari enam belas bersaudara. Menyelesaikan
Pendidikan Magister pada Jurusan Statistika Institut Teknologi
Sepuluh November Surabaya pada tahun 2007, Tahun 2000
menyelesaikan studi pada Jurusan Pendidikan Matematika Institut
Keguruan dan Ilmu Pendidikan (tahun 1998 berubah menjadi
UNM). Selama mengikuti Pendidikan penulis terlibat pada
beberapa organisasi .
Sejak tahun 2000, penulis mulai aktif mengajar di Lembaga
Pendidikan -STMIK Balikpapan- dan berkesempatan mengikuti
berbagai pelatihan profesional. Pada tahun 2013 penulis hijrah ke
Sulawesi Selatan dan terdaftar sebaik pengajar pada Jurusan
Matematika Fakultas Sains dan Teknologi Universitas Islam Negeri
Alauddin Makassar hingga sekarang.
Irwan, S.Si., M.Si. & Adnan Sauddin, S.Pd., M.Si.

ISBN 602-328-456-6

9 786023 284566
Alauddin University Press

Alauddin University Press


STATISTIKA
MULTIVARIAT

Irwan, S.Si., M.Si.


Adnan Sauddin, S.Pd., M.Si.

Alauddin University Press


2021
STATISTIKA MULTIVARIAT
©Penulis
Penulis:
Irwan, S.Si., M.Si.
Adnan Sauddin, S.Pd., M.Si.
Editor:
Khalilah Nurfadilah, S.Si., M.Si.
Penata Letak & Desain Sampul:
AU Press Team
Diterbitkan pertama kali dalam Bahasa Indonesia
oleh Penerbit Alauddin University
Press November 2021 viii + 157 hlm;
15.5 x 23 cm
ISBN 978-602-328-456-6
Hak cipta dilindungi oleh undang-
undang Perpustakaan Nasional;
Katalog Dalam Terbitan (KDT)

Alauddin University Press


Jl. H. M. Yasin Limpo
No. 36, Kab. Gowa,
Sulawesi Selatan
SAMBUTAN REKTOR
UIN ALAUDDIN MAKASSAR

Alhamdulillah wa Syukrulillah atas segala rahmat Allah SWT


beserta salawat dan salam kepada Rasulnya Muhammad SAW,
mengiringi aktivitas keseharian kita dalam menjalankan tugas dan
tanggungjawab akademik dan peran-peran kehidupan lainnya sehari-
hari.
Publikasi karya akademik adalah salah satu ruh perguruan tinggi,
karena perguruan tinggi adalah ruang produksi ide dan gagasan yang
harus selalu diupdate dan diupgrade. Buku adalah salah satu produk
akademik yang kelahirannya, mesti diapresiasi setinggi-tingginya.
Karena dibalik proses lahirnya, ada kerja keras yang menguras waktu,
tenaga dan pikiran. Kerja keras dan upaya sungguh-sungguh untuk
menghadirkan sebuah karya akademik, adalah bukti nyata dedikasi
serta khidmat seorang insan universitas bagi perkembangan ilmu
pengetahuan.
Sebagai kampus yang memiliki visi menjadi pusat pencerahan dan
transformasi ipteks berbasis peradaban Islam, kehadiran buku terbitan
Alauddin University Press ini, diharapkan menjadi sumbangan
berharga bagi desiminasi ilmu pengetahun di lingkungan kampus
peradaban, sekaligus semakin memperkaya bahan bacaan bagi
penguatan integrasi keilmuan.
Buku ini tentu jauh dari kesempurnaan, sehingga kritik dan
masukan dari para pembaca untuk para penulis akan sangat
dinantikan. Karena dengan itu, iklim akademik kampus akan dinamis
dengan tradisi diskursif yang hidup.
Akhirnya, sebagai Rektor, saya mengapresiasi setinggi-tingginya
atas penerbitan buku yang menjadi bagian dari Program Penerbitan
100 buku Referensi UIN Alauddin Makassar tahun 2021 ini. Semoga
membawa kemaslahatan bagi warga kampus dan masyarakat secara
umum.

Gowa, 17 Agustus 2021


Rektor

Prof. H. Hamdan Juhannis, M.A., Ph.D.

iv
PENGANTAR PENULIS

Alhamdulillah, segala puji hanya untuk, dari-Nya segala ilmu dan


pengetahuan bersumber, maka kepadanya patut kita bersyukur
terhadap nikmat besar yang telah diberikan kepada makhluk-Nya dari
jenis manusia berupa akal. Saya berlindung kepada Allah Subhanahu
Wata’ala dari kejelakan yang berasal dari diri kami, dan buruknya
amalan. Aku memohon perlindungan kepada Allah ‘Azza Wa Jalla, agar
terhindar dari mengerjakan amalan-amalan buruk. Dan aku memohon
kepada Allah Jalla Wa ‘ala untuk dikokoh dalam aqidah islam yang
lurus dan juga dikokoh dalam ilmu yang bermanfaat.
Buku disusun dimaksudkan untuk memudahkan mahasiswa dalam
referensi tambahan terkait analisis Multivariat. Pembahasan dalam
buku ini memadukan antara penurunan rumus-rumus statistika
multivariate secara matematika dan penggunaan contoh kasus serta
pemanfaatan aplikasi computer menggunakan R programming dalam
menyelesaikan setiap kasus yang disajikan.

Penulis

Adnan Sauddin

v
DAFTAR ISI

SAMBUTAN REKTOR UIN ALAUDDIN MAKASSAR ............................... III


PENGANTAR PENULIS .......................................................................... V
DAFTAR ISI .......................................................................................... VII
BAB I KONSEP DASAR ANALISIS MULTIVARIAT .................................... 1
1. Data Multivariat ........................................................................... 1
2. Rata-Rata dan Variansi variabel Acak Univariat ........................ 3
3. Kovarinsi dan Korelasi Variabel Acak Bivariate ......................... 4
4. Teknik Grafik ................................................................................ 8
BAB II GEOMETRI SAMPEL DAN SAMPEL ACAK ................................. 11
1. Geometri Sample ...................................................................... 11
2. Sampel Acak, Nilai Ekspektasi Rata-Rata Sampel dan Matriks
Kovarians. ................................................................................. 15
3. Rata-Rata Sampel, Kovariansi, dan Korelasi Dalam Operasi
Matriks....................................................................................... 20
4. Nilai Sampel dari Kombinasi Linear Variabel ......................... 24
Latihan Soal ...................................................................................... 27
BAB III DISTRIBUSI NORMAL MULTIVARIAT ....................................... 29
1. Fungsi Padat Normal Multivariat ............................................. 29
2. Properti Variabel Acak Multivariat Normal .............................. 35

vii
3. Distribusi Sampel Multivariate Normal ................................... 39
4. Menilai Asumsi Normalitas Multivariat ................................... 44
5. Mendeteksi Data Pencilan dan Cleaning Data ....................... 52
6. Transformasi Normalitas .......................................................... 53
Latihan Soal ...................................................................................... 54
BAB IV INFERENSI VEKTOR RATA-RATA ............................................. 57
1. Uji µ Saat Σ Diketahui ........................................................... 57
2. Uji µ saat Σ tidak Diketahui .................................................. 60

3. Hotelling-T 2 dan Uji Likelihood Ratio ...................................... 67


4. Daerah Kepercayaan dan Perbandingan Simultan Komponen
Rata-Rata .................................................................................. 69
5. Inferensi Sample Besar Seputar Vektor Rata-Rata Populasi . 77
6. Inferensi Seputar Vektor Rata-Rata Untuk Data Missing ....... 78
Latihan Soal ...................................................................................... 82
BAB V MEMBANDINGKAN BEBERAPA RATA-RATA MULTIVARIAT...... 84
1. Perbandingan Berpasangan dan Rancangan Pengukuran
Berulang .................................................................................... 84
2. Membandingkan Vektor Rata-Rata Dua Populasi .................. 98
3. Membandingkan Beberapa Rata-Rata Populasi Multivariat
(Manova-Satu Arah) ................................................................ 109
4. Interval Kepercayaan Simultan untuk Efek Perlakuan ........ 128
5. Uji Kesamaan Matriks Kovariansi ......................................... 131
6. Multivariat Analisis Variansi Dua-Arah .................................. 134
Latihan Soal .................................................................................... 147
DAFTAR PUSTAKA .............................................................................152
INDEKS .............................................................................................154
TENTANG PENULIS ...........................................................................154

viii
BAB I
KONSEP DASAR ANALISIS MULTIVARIAT

1. Data Multivariat
Data multivariate merupakan data hasil pengamatan terhadap p ≥ 1
variabel sebanyak n kali. Nilai hasil pengamatan dari setiap variabel
disebut item atau unit eksperimen. Untuk menjelaskan struktur data
multivariat, digunakan symbol x ij yang menyatakan pengamatan ke- i
dari variabel ke − j , ditulis:
x ij = Nilai variabel ke- j pada pengamatan ke-i

Hasilnya, untuk n pengamatan dari p variabel dapat disusun dalam


bentuk:
Var 1 Var 2 ⋯ Var j ⋯ Var p
Item 1 x11 x12 ⋯ x1j ⋯ x1p
Item 2 x 21 x 21 ⋯ x2 j ⋯ x2p
⋮ ⋮ ⋮ ⋮ ⋮ ⋯ ⋮
Item i x i1 xi 1 ⋯ x ij ⋯ x ip
⋮ ⋮ ⋮ ⋮ ⋮ ⋯ ⋮
Item n x n1 x n1 ⋯ x nj ⋯ x np

1
Dimana susunan tersebut dapat disederhanakan dalam bentuk array,
yang disebut matriks X berukuran n × p , lihat persamaan (0.1).
 x11 x12 ⋯ x1 j ⋯ x1p 
 
x ⋯ x2 j ⋯ x 2p 
 21 x 22
 ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ 
X =  (0.1)
 x i1 x i 2 ⋯ x ij ⋯ x ip 
 
 ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ 
 
 x n1 xn 2 ⋯ xnj ⋯ x np 

Array X memuat semua data hasil pengamatan dari semua variabel.
Perhatikan matriks yang ditampilkan pada persamaan (0.1), bahwa:
 Jika kita pandang dari barisnya, maka xi = x i 1 , x i 2 , ⋯ , x ip
 Jika kita pandang dari kolomnya, maka x j = x 1 j , x 2 j , ⋯ , x nj

Contoh 1.1.
Pemilihan empat buah nota dari suatu toko dilakukan dalam rangka
untuk meneliti penjualan barang tertentu dari toko tersebut. Setiap
nota yang disediakan, jumlah barang tertentu tersebut yang terjual dan
tujuan dari setiap penjualan. Misalkan variabel pertama adalah total
penjualan (dalam Rupiah) dan variabel kedua adalah jumlah barang
tertentu yang terjual. Total empat pengamatan dilakukan.
Datanya dapat disusun sebagai berikut:
Variabel 1 (jumlah penjualan-dalam rupiah) : 42 52 48 58
Variabel 2 (Jumlah buku terjual) : 4 5 5 3
Dengan menggunakan notasi yang telah diperkenalkan sebelumnya,
maka data tersebut susunannya dalam
x 11 = 42 x 21 = 52 x 11 = 48 x 11 = 58
x 11 = 4 x 11 = 4 x 11 = 4 x 11 = 3

Bentuk array X adalah

2
2. Rata-Rata dan Variansi variabel Acak Univariat
 42 4
 
 52 5 
X = 
 48 4 
 58 3 
 
Untuk memudahkan pemahaman terhadap statistika multivariate,
berikut akan diberikan uraian yang berkaitan dengan matriks data X
dari sudut pandang statistika univariat.
Pandang elemen-elemen x 11 , x 21 , ⋯ , x n 1 dari matriks pengamatan X
pada persamaan (0.1), merupakan hasil pengamatan sebanyak n
kali dari variabel pertama. Dari data tersebut kita dapat menghitung
beberapa nilai statistik berikut:
Rata-Rata Sampel
Rumus umum untuk menghitung rata-rata setiap p variabel dengan n
pengamatan adalah jumlah seluruh pengamatan dibagi dengan
banyaknya pengamatan yang telah dilakukan, ditulis
n
1
xj = ∑ x ij
n i =1
; j = 1, 2, ⋯, p (0.2)

Variansi Sampel
Variansi sampel yang terkait dengan n pengamatan untuk variabel
pertama adalah keadaan setiap data terhadap rata-rata dan dapat
dihitung dengan rumus sebagai berikut:
n

∑ ( x i1 − x 1 )
1 2
s12 =
n i =1

Dimana x 1 merupakan rata-rata sampel dari xi1 . Dengan demikian,


secara umum variansi untuk p variabel dapat dihitung dengan rumus:

( x ij −x j )
n 2
1
s 2j = ∑
n i =1
; j = 1, 2, ⋯, p (0.3)

3
Untuk diketahui,
Pertama, kebanyakan penulis mendefinisikan variansi dengan
pembagin n − 1 .
Kedua, notasi s2 merupakan symbol dari variansi sampel yang dikenal.
Untuk hal tersebut data multivariate yang disusun dalam bentuk
matriks, bahwa diagonalnya, s jj ,

( x ij −x j )
n 2
1
s 2j = s jj = ∑
n i =−1
; j = 1, 2, ⋯, p (0.4)

Kuadrat dari variansi kita peroleh standar deviasi, yaitu:

( xij −x j )
n 2
1
sj = s jj = ∑
n i =1
; j = 1, 2, ⋯, p (0.5)

3. Kovarinsi dan Korelasi Variabel Acak Bivariate


Kovariansi Sampel
Perhatikan n pasangan pengamatan dari variabel 1 dan 2 berikut
 x 11   x 21   xn1 
     
 x  ,  x  , ⋯,  x 
 12   22   n 2 

x i1 dan x i 2 adalah pasangan pengamatan unit pengamatan ke- i


(i = 1, 2, ⋯ , n ) dari pasangan variabel 1 dan variabel 2. Ukuran yang
berkaitan antara variabel 2 dan variabel 1 secara linear menghasilkan
kovariansi sampel
n
1
s12 = ∑ ( x i1 − x1 )( x i 2 − x 2 )
n i =1

Bentuk umum dari kovariansi sampel adalah


n
1
sij = ∑ ( xij − xi )( xij − x j )
n i =1
(0.6)

4
Beberapa kondisi dari nilai-nilai variabel untuk kovariansi sampel,
1. Jika nilai pengamatan dari suatu variabel merupakan nilai yang
besar dan berkaitan dengan variabel lain dengan nilai yang besar
pula, maka nilai kovariansi antara kedua variabel tersebut positif.
Demikian halnya jika kedua variabel yang saling berkaitan memiliki
nilai yang kecil secara bersama-sama, maka s12 hasilnya adalah
positif atau nilai kovariansinya adalah positif.
2. Jika nilai dari salah satu variabel yang saling berkaitan memiliki
nilai-nilai pengamatan yang besar dan variabel yang lainnya
memiliki nilai pengamatan yang kecil, maka nilia dari s12 hasilnya
adalah negatif atau nilai kovariansinya adalah negatif.
3. Jika tidak ada kaitannya antara nilai bagi kedua variabel, s12 ,
diperkirakan nilainya akan nol atau nilai korelasinya diperkirakan
bernilai nol.
Korelasi Sampel
Ukuran yang menjelaskan keterkaitan secara linear antara dua
variabel tidak bergantung pada unit pengukuran. Rumusnya dituliskan
sebagai berikut:
n

sij ∑ ( xij − xi )( xij − xj )


i =1
rij = = (0.7)
∑ ( x ij −x i ) ∑ ( x ij −x j )
sii s jj n 2 n 2

i =1 i =1

Statistik deskriptif yang telah dijelaskan pada bagian di atas, jika


kesemuanya dihitung dari pengamatan yang dilakukan sebanyak n
kali pada variabel yang berjumlah p dapat disusun dalam bentuk
array.
Perhatikan matrik pengamatan pada persamaan (0.1) dapat disusun
ulang dalam bentuk vektor dari variabel p sebagai berikut

5
 x 11 x12 ⋯ x1 j ⋯ x 1p   x1′   y1′ 
     
x ⋯ x2j ⋯ x 2 p   x′   y′ 
 21 x 22   2  2
 ⋮ ⋮ ⋮ ⋮ ⋮ ⋮    ⋮   ⋮ 
X =  =   atau  
 
 xi1 x i 2 ⋯ x ij ⋯ x ip   x ′j   y ′j 
(0.8)
     
 ⋮ ⋮ ⋮ ⋮ ⋮ ⋮   ⋮   ⋮ 
     
 x n 1 x n 2 ⋯ x nj ⋯ x np 
  x p′   y p′ 

Sehingga nilai statistik deskriptifnya dapat dituliskan sebagai berikut


1. Rata-rata sampel
 x1′ 
 
 x′ 
 2
 ⋮ 
x =   (0.9)
 x ′j 
 
 ⋮ 
 
 xp′ 

2. Variansi – Kovariansi sampel


 s11 s12 ⋯ s1p 
 
s s ⋯ s2 p 
Sn =  21 22
 ⋮ ⋮ ⋱ ⋮  (0.10)
s ⋯ s pp 
 p1 p 2
s

3. Korelasi Sampel
 1 r12 ⋯ r1p 
 
r 1 ⋯ r2p 
R =  21 (0.11)
 ⋮ ⋮ ⋱ ⋮ 
r ⋯ 1 
 p1 rp 2 
Untuk korelasi sampel, r , memenuhi keadaan berikut:
1. Nilai r berkisar antara 1 dan -1

6
2. r merupakan ukuran yang menyatakan kekuatan asosiasi linear,
maka;
a) Jika r = 0 , hal ini menyatakan tidak ada hubungan antara
setiap komponen
b) Jika r < 1 , hubungan negative
c) Jika r > 1 , hubungan positif
3. rij tidak mengalami perubahan jika pengukuran dari variabel ke- i
diubah ke yij = ax ij + b , dan nilai dari variabel ke- j diubah ke
y ij = cx ij + d , dimana tanda dari a, c bertanda sama.

Contoh 1.2
Perhatikan data yang diberikan pada contoh 1.1, setiap invoice
menghasilkan empat pasangan, total penjualan (dalam rupiah), dan
jumlah buku terjual. Tentukan array dari x , s, R .

Solusi 1.2.
Karena ada empat invoice, maka terdapat empat pengamatan
(pengukuran) pada setiap variabel. Dengan demikian
Rata-rata sampelnya adalah
4
1 1
x1 = ∑ xi1 = 4 ( 42 + 52 + 48 + 58 ) = 50
4 i =1
4
1 1
x2 = ∑
4 i =1
xi 2 = ( 4 + 5 + 4 + 3 ) = 4
4
 x1   50 
x =   =  
x 4
 2   
Variansi dan kovariansi sampelnya adalah
4

( )
1 2
s11 = ∑ x i1 −x1
4 i =1
 
( ) ( 52−50 ) +  = 34
2 2
1  42−50 +

= 
( ) ( 58−50 ) 
2 2
4
 48−50 +

7
4
∑( x )
1 2
s22 = − x2
4 i2
i =1

= ( 4 − 4 ) ( 5 − 4 ) ( 4 − 4 ) ( 3 − 4 )  = 0.5


1 2 2 2 2

+ + +
4
4
1
s12 = (
∑ x −x1 xi2 −x2
4 i =1 i1
)( )
1  ( 42 − 50 )( 4 − 4 ) + ( 52 − 50 )( 5 − 4 ) +
=  = −1.5
4  ( 48 − 50 )( 4 − 4 ) + ( 58 − 50 )( 3 − 4 ) 

S 12 = S 21

dan
 34 −1.5 
s =  
−1.5 0.5 
 
Korelasi sampelnya adalah
s12 −1.5
r12 = =
s11 s22 34 0.5

r12 = r21

atau
 1 −0.36 
R =  
 −0.36 1 

4. Teknik Grafik
Memetakan data hasil pengamatan pada koordinat kartesis 2-D
diistilahkan dengan kata “Plot”. Plot dari suatu pengamatan
merupakan hal yang penting sebagai analisis permulaan yang
sebaiknya dilakukan untuk melihat pola penyebaran dari sekumpulan
data hasil pengamatan pada sejumlah variabel, namun metode
tersebut banyak dilupakan. Meskipun tidak mungkin untuk

8
menggambarkan keseluruhan dari semua pengukuran yang dilakukan
terhadap variabel, plot untuk individual variabel dan variabel
berpasangan masih sangat berguna dan dapat memberikan banyak
informasi.
Untuk melihat pola asosiasi dari sekumpulan data dari hasil
pengukuran merupakan cara yang sangat bagus. Perhatikan pasangan
hasil pengukuran dari dua variabel berikut:
Variabel x 1 3 4 2 6 8 2 5

Variabel x 2 5 5.5 4 7 10 5 7.5

Data tersebut dapat diplot dalam dua dimensi (setiap sumbu mewakili
variabel). Plot yang dihasilkan dalam dua dimensi dikenal dengan
diagram pencar atau scatter plot.
Scatterplot of x2 vs x1

10

8
x2

2 3 4 5 6 7 8
x1

Gambar 1. Scatter plot variable x1 dan x2

9
BAB II
GEOMETRI SAMPEL DAN SAMPEL ACAK

1. Geometri Sample
Suatu pengamatan multivariate adalah kumpulan hasil pengamatan
pada p variabel yang berbeda yang diambil pada item yang sama.
Sebagaimana yang ditampilkan pada bab 1, jika n pengamatan telah
dilakukan, maka seluruh data yang diperoleh dapat disusun dalam
bentuk matriks berukuran n × p sebagai berikut:
 x11 x12 ⋯ x 1p 
 
x x 22 ⋯ x 2 p 
X =  21 (0.12)
( n×p )  ⋮ ⋮ ⋱ ⋮ 
x ⋯ x np 
 n1 n 2
x

Setiap baris dari matriks X menggambarkan pengamatan multivariate
(multi variabel). Karena keseluruhan pengukuran kebanyakannya
merupakan realitas dari sesuatu, maka hasil pengamatan tersebut
dinyatakan sebagai data sampel berukuran n dari suatu “populasi”
p − variasi ( p variabel).

Terdapat dua cara memandang susunan data matriks X , Pertama;


dengan memandang baris-baris dari matriks X yang merupakan
representasi dari n titik dalam ruang dimensi- p , dituliskan sebagai
berikut

11
 x11 x12 ⋯ x1p   x1′  ← Pengamatan ( ke − 1)
   
x x ⋯ x2p   x1′ 
X =  21 22 = (0.13)
( n×p )  ⋮ ⋮ ⋱ ⋮   ⋮ 
x ⋯ xnp   xn′  ←Pengamatan ( ke − n )
 n1 n2
x
  
Vektor baris xi′ merepresentasikan pengamatan ke- i , yang memuat
koordinat dari titik pengamatan, memuat titik-titik koordinat.
Contoh 3.1 (Menghitung Rata-rata Vektor)
Menghitung vektor rata-rata x dari matriks data
 4 1
 
X =  − 1 3 
 3 5
 

Plot data n = 3 dalam ruang dimensi- p =2, dan tempatkan x pada


diagram tersebut.
Titik pertama, x1, mempunyai koordinat x 1′ =  4,1  , dengan cara yang
sama untuk kedua titik-titik yang lain, yaitu x 2′ =  − 1.3  dan x 3′ =  3, 5 
. Hasilnya
4 −1 + 3
  2
 3   
x= =
 1 + 3 + 5   3 
 
 3 

12
Gambar 2. Plot data matriks X untuk n = 3 pada p = 2
Kedua, dengan memandang data sebagai vektor- p dalam ruang
dimensi- n , yaitu dengan mengambil elemen-elemen kolom dari
matriks data menjadi vektor koordinat. Misalkan
 x11 x21 ⋯ x 1p 
 
x x 22 ⋯ x2 p 
X =  21 =  y1 y2 ⋯ yp  (0.14)
( n×p )  ⋮ ⋮ ⋱ ⋮ 
x ⋯ xnp 
 n1 xn 2 
Koordinat dari titik pertama y1′ =  x 11 , x 21 , ⋯ x n 1  merupakan n
pengukuran pada variabel pertama. Secara umum titik ke- i ,
y i′ = [x 1i , x 2i , ⋯ , x ni ] ditentuk dengan n -pasangan dari semua
pengukuran pada variabel ke-i. Secara geometri, menggambarkan
y 1 , y 2 , ⋯ , y p sebagai vektor lebih sesuai dari pada titik, seperti diagram
pencar dalam dimensi- p

Contoh 3.2 (Menampilkan data sebagai vektor p dalam


dimensi n )
Plot data berikut sebagai vektor p = 2 dalam ruang n = 3 :
Perhatikan matriks X berikut

13
 4 1
 
X =  − 1 3 
 3 5
 

Dari data tersebut, y1′ =  4, − 1, 3  dan y 2′ =  1, 3, 5  , gambar vektor dari


keduanya ditampilkan dalam gambar berikut

Gambar 3. Plot data matriks X untuk n = 3 pada p = 2


Hal yang tidak begitu menguntungkan dalam menampilkan matriks
data secara geometri adalah keterbatasan dimensi yang dapat
ditampilkan, yaitu terbatas pada tiga dimensi. Sementara itu, pada
kenyataannya hampir semua pengamatan dari kejadian real selalu
mengikutkan lebih dari 3 variabel atau n > 3 .
Selanjutnya, bahwa memungkinkan bagi kita untuk memberikan
interpretasi secara geometri dari proses mendapatkan rata-rata
sampel. Hal tersebut dapat dilakukan dengan:
 Definisikan terlebih dahulu vektor 1n′ =  1,1, ⋯,1  berukuran n × 1 .
Dimana Vektor 1 tersebut membentuk sudut yang sama terhadap
setiap dari n sumbu koordinat,
 Perkalikan vektor 1 tersebut dengan 1 / n , yaitu ( 1 / n ) 1 .
 Karena vektor 1 membentuk sudut yang sama terhadap setiap
dari n sumbu koordinat, sehingga vektor ( 1 / n ) 1 mempunyai
panjang sama dengan 1 dalam arah sudut yang sama.

14
Perhatikan vektor yi′ = [x1i , x 2i , ⋯ , x ni ] , proyeksi yi′ pada vektor unit
(1 / )
n 1 adalah

 1  1 x + x 2i + ⋯ + x ni
yi′  1 1 = 1i = xi 1 (0.15)
 n  n n

Merupakan rata-rata sampel


x1i + x 2i + ⋯ + x ni 1
xi = =   y1′ 1
n  n 

Berkaitan dengan perkalian vektor 1 diperlukan untuk memberikan


proyeksi dari yi pada garis ditentukan oleh vektor 1 .

2. Sampel Acak, Nilai Ekspektasi Rata-Rata Sampel dan Matriks


Kovarians.
Dalam rangka mempelajari variabilitas statistik seperti x dan Sn
dengan tujuan membuat inferensi, kita perlu memuat asumsi seputar
variabel teramati yang nilainya disusun dalam bentuk matriks X.
Sebelum data dikumpulkan tak satupun nilai yang kita ketahui tentang
suatu keadaan. Andaikan kita merencanakan akan melakukan
pengamatan terhadap p variabel sebanyak n pengamatan, sebelumn
melakukan pengamatan atau pengukuran, tak satupun nilai statistic
ataupun parameter yang kita ketahui, secara umum dalam masalah
tersebut kita harus melakukan prediksi secara tepat. Akibatnya, data
yang kita kumpulkan harus benar-benar diperoleh secara adil,
biasanya kita kenal dengan dikumpulkan dengan cara acak atau
random-yaitu-sehingga setiap variabel yang kita ukur atau diamati kita
sebut dengan Variabel Acak.
Setiap kumpulan pengamatan atau pengukuran X j pada p variabel
merupakan vektor acak, yaitu elemen ke- i , j dalam matriks data
merupakan variabel acak X ij , dituliskan sampel acak sebagai berikut

15
 x11 x21 ⋯ x1p   x1′ 
   
x x22 ⋯ x2p   x′ 
X =  21 =  2 (0.16)
( n×p )  ⋮ ⋮ ⋱ ⋮   ⋮ 
 
x ⋯ xnp   x′ 
 n1 xn 2   n 

Jika vektor baris x1′ , x 2′ , ⋯ x n′ pada persamaan (0.16) mengambarkan


pengamatan independen dari distribusi gabungan umum dengan
fungsi padat f ( x ) = f ( x 1 , x 2 , ⋯ , x p ) , maka x1 , x 2 , ⋯ , xn disebut sampel
acak dari f ( x ) . Secara matematika, x1 , x 2 , ⋯ , xn merupakan sampel
acak jika fungsi padat gabungannya diberikan oleh hasil kali
f ( x 1 ) f ( x 2 ) ⋯ f ( x n ) , dimana f ( x i ) = f ( x i 1 , x i 2 , ⋯ , x ip ) merupakan
fungsi padat untuk vektor baris ke- j .
Ada dua hal penting yang berkaitan dengan definisi variabel acak
1. Pengukuran p variabel dalam satu percobaan, seperti
x i′ =  x i 1 , x i 2 , ⋯ , x ip  biasanya akan saling berkorelasi. Dalam
keadaan yang berbeda, pengukuran dari beberapa percobaan
yang berbeda, akan independen
2. Sifat independen dari pengukuran dari pengukuran ke
pengukuran mungkin tidak terpenuhi ketika variabel sama
sepanjang waktu.
Teorema 3.1.
Misalkan x1 , x 2 , ⋯ , xn merupakan sampel acak dari suatu distribusi
gabungan yang mempunyai vektor rata-rata µ dan matriks kovariansi
Σ . Maka x merupakan estimator tak bias dari µ , dan matriks

kovariansinya adalah 1 Σ
n
Yaitu,
1. E (X) = µ (0.17)

16
1
2. cov ( X ) = Σ (0.18)
n
Untuk matriks kovariansi Sn

( n − 1) 1
E ( Sn ) = Σ = Σ− Σ
n n
selanjutnya
 n 
3. E  S  = Σ (0.19)
 n − 1 n 

Sehingga  n ( n − 1 )  Sn merupakan estimator tak bias dari Σ, dengan


 1 
(bias ) = E ( Sn ) − Σ = −  Σ.
 n 

Bukti. Theorem 3.1


1. Ekspektasi parameter rata-rata.
Perhatikan bahwa,
 jika kita pandang matriks X pada persamaan (0.12) sebagai
kumpulan variabel dengan n pengamatan (pandang dari
X1 + X2 + ⋯ + Xn
barisnya), maka X =
n
 jika kita pandang matriks X pada persamaan (0.12) sebagai
kumpulan pengamatan dari p variabel (pandang dari kolom ),
X1 + X2 + ⋯ + Xp
maka X =
p

Dimana kedua hal tersebut tidak akan memberikan hasil yang


berbeda dari nilai rata-ratanya, yaitu jumlah total pengamatan dari
p variabel yang diamati sebanyak n pengamatan pada setiap
varibelnya adalah n x p.
Dengan demikian bentuk berikut berlaku

17
1 1 1 
E ( X ) = E  x1 + x2 + ⋯ + xn 
 n n n 
 1   1  1 
= E  x1  + E  x2  + ⋯ + E  xn 
 n   n   n 
1 1 1
= E ( x1 ) + E ( x2 ) + ⋯ + E ( xn )
n n n

1 1 1
= µ1 + µ2 + ⋯ + µn
n n n

2. Estimasi parameter kovariansi,

1 n ′
 1 
n

( X − µ )( X − µ )′ =  ∑ ( xi − µ )   ∑ ( x j − µ ) 
 n i =1  n j =1 
n n
1
=
n2
∑ ∑ ( xi − µ )( x j − µ )′
i =1 j = 1

Sehingga

1  
n n
cov ( X ) = E ( X − µ )( X − µ )′ =  ∑ ∑ E ( X − µ )( X − µ )′ 
n 2  i =1 j =1 

Untuk i ≠ j , setiap elemen dalam E ( X − µ )( X − µ )′ adalah sama


dengan nol karena elemen-elemen tersebut merupakan kovariansi
antara komponen Xi dan komponen X j , dimana kedua adalah
independen.
Oleh karena itu,

1  
n n
cov ( X ) =  ∑ ∑ E ( X − µ )( X − µ )′ 
n 2  i =1 j =1 

18
Akibatnya Σ = E ( Xi − µ )( Xi − µ )′ merupakan matriks kovariansi
populasi umum untuk setiap Xi , diperoleh
n
1  
cov ( X ) =
n2
∑  E ( Xi − µ )( Xi − µ )′ 
i =1
1
= (Σ + Σ + ⋯ + Σ)
n2
1  1 
= ( nΣ ) =  Σ
n 2  n 

3. Ekspektasi dari Sn ,
Untuk memperoleh nilai estimasi dari Sn , Pertama perhatikan
bahwa ( x ij − x i )( x ji − x j ) merupakan elemen ke- ( i, j ) dari

( Xi − x ) ( X j − x )′ ,

n n
∑ ( Xi − X )( Xi − X )′ = ∑ ( Xi Xi′ − Xi X′ − XXi′ + XX′ )
i =1 i =1
n n n n
= ∑ Xi Xi′ − ∑ Xi X ′ − ∑ XXi′ + ∑ XX ′
i =1 i =1 i =1 i =1
n
= ∑ Xi Xi′ − nXX′ − nXX′ + nXX ′
i =1
n
= ∑ Xi Xi′ − 2nXX′ + nXX′
i =1
n
= ∑ Xi Xi′ − nXX′
i =1

Dari hasil tersebut, nilai ekspektasinya adalah


 n  n

E  ∑ Xi Xi′ − nXX′  = ∑ E ( Xi Xi′ ) − nE ( XX′ )
 i =1  i =1

19
Untuk sembarang vektor acak V dengan E ( V ) = µv dan
cov ( V ) = Σ v , demikian halnya E ( VV ′ ) = Σ v + µ v µ v′ , akibatnya

E ( X i X i′ ) = Σ + µµ ′

dan
1
E ( XX ′ ) = Σ + µµ ′
n
n
Dengan ∑ E ( Xi Xi′ ) − nE ( XX ′ ) , diperoleh
i =1

n
1 
∑ E ( Xi Xi′ ) − nE ( XX′ ) = nΣ + µµ ′ − n  n Σ + µµ ′ 
i =1
= ( n − 1) Σ

 n


Dan selanjutnya, karena Sn = ( 1 n )  ∑ Xi Xi′ − nXX ′  , maka
 i =1 

  n 

 
E ( Sn ) = E  ( 1 n )  ∑ Xi Xi′ − nXX ′ 


  i =1 

1   n 


= E   ∑ Xi Xi′ − nXX ′ 

n   i =1 

1
= ( n − 1) Σ
n
( n − 1)
E ( Sn ) = Σ
n

3. Rata-Rata Sampel, Kovariansi, dan Korelasi Dalam Operasi Matriks


Pada bagian sebelumnya kita telah dijelaskan bagaimana
menampilkan data matriks X dengan menggunakan grafik dan telah
kita menghitung statistic deskriptif dari x dan S . Sebagai tambaha,
dan hal ini lebih memudahkan dalam proses komputasi, yaitu kita

20
dapat menghitung berbagai nilai statistic, x dan S secara langsung
pada X demgan menggunakan operasi matriks.
Perhatikan data matriks yang dijelaskan pada bab 1, dari data tersebut
x1i .1 + x 2i .1 + ⋯ + x ni .1 1
kita punya x i = = yi′1 , dengan demikian
n n
 y1′ 1 
 
 x1   n   x 11 x 12 ⋯ x 1n   1 
      
x   y2′ 1  x x 22 ⋯ x 2n   1 
  1
x =   =  n  =  21
2

 ⋮   ⋮  n ⋮ ⋮ ⋱ ⋮   ⋮ 
x    x
 p   y′ 1  x n 2 ⋮ x pn   1 
 p   p1  
 
 n 
atau
1
x = X ′1
n (0.20)
Yaitu, x dihitung dari transpose data matriks dengan mengalikannya
dengan vektor 1 dan mengalikan haislnya dengan 1 n .

Selanjutnya kita buat matriks rata-rata berukuran n × p dengan


mentranspos persamaan (0.20) dan mengalikannya dengan vektor 1
dari sisi sebelah kiri; yaitu
1
x= X ′1
n
1 ′
1x ′ = 1  X ′1 
 n 
1
= 11′ X
n

21
 x1 x 2 ⋯ xp 
 
x x ⋯ x p 
1x ′ =  1 2
⋮ ⋮ ⋱ ⋮ 
x x ⋯ x p 
 1 2  (0.21)
Lalu perkurangan persamaan (0.21) dari matriks data X menghasilkan
matriks simpangan (residual) berukuran n × p
 x11 − x1 x12 − x2 ⋯ x 1p − x p 
 
1 x − x x − x2 ⋯ x 2p − x p 
X − 11′ X =  21 1 22
 (0.22)
n  ⋮ ⋮ ⋱ ⋮ 
x − x x − x2 ⋯ xnp − x p 
 n1 1 n2 
Sekarang, matriks ( n − 1 ) S merupakan jumlah kuadrat dari hasil kali
transpose dari persamaan (0.22) dengan matriks dirinya sendiri, yaitu
 x11 − x 1 x12 − x 2 ⋯ x1p − x p 
 
x − x x − x ⋯ x − x 
( n − 1) S =  21 1 22 2 2p p
 ⋮ ⋮ ⋱ ⋮ 
 
x − x x − x ⋯ x − x 
 n 1 1 n2 2 np p 
 x11 − x1 x 12 − x 2 ⋯ x1p − x p 
 
x − x x − x ⋯ x − x 
×  21 1 22 2 2p p 
⋮ ⋮ ⋱ ⋮ 
 
x − x x − x ⋯ x − x 
 n 1 1 n2 2 np p 

 ′  
=  X − 1 11′ X   X − 1 11′ X 
 n   n 
 
=  X ′X − X 1 11′ X − 1 X ′1′ 1X − 1 X ′1′ 111′ X 
 n n n 2 
 1 1 1 
= X ′  I − 11′ − 11′ − 11′ 11′  X
 n n n2 
1  1 
S= X ′  I − 11′  X
( n − 1 )  n 
Setelah menghitung S , dari hasil tersebut kita dapat menghitung
secara langsung dari matriks korelasi sampel. R .

22
1
Definisikan matriks standar deviasi sampel D2 , lalu hitung inversnya,

(D )
−1
1 − 21
2 = D . Misalkan

 s11 0 ⋯ 0 

 
1
 0 s22 ⋯ 0  (0.23)
D = 2

( p×p )  ⋮ ⋮ ⋱ ⋮ 
 
 0 0 ⋯ s pp 
 

Kemudian
 1 
 0 ⋯ 0 
 s11 
 
 1 
 0 ⋯ 0 
= 
−12
D s22 
( p×p ) 
 ⋮ ⋮ ⋱ ⋮ 
 1 
 0 0 ⋯
 
 s pp 

karena
 s11 s12 ⋯ s1p 
 
s s ⋯ s2 p 
S =  21 22
 ⋮ ⋮ ⋱ ⋮ 
s ⋯ s pp 
 p1 p 2
s

Dan
 s11 s12 s1p 
 ⋯ 
 
 s11 s11 s11 s22 s s pp 
   r11 r12 ⋯ r1p 
 σ21 σ22 σ2 p   
 ⋯  r r ⋯ r2 p 
R =  s22 s11  =  21 22
 s22 s22 s22 s pp   ⋮ ⋮ ⋱ ⋮ 
  
 ⋮ ⋮ ⋱ ⋮  r ⋯ rpp 
 p1 p 2
  r
s p1 sp2 s pp 
 
 ⋯ 
 s pp σ11 s pp s22 s pp σpp 
 

Kita punya

23
−1 −12
R = D 2 SD (0.24)
1
Kalikan kedua ruas dari persamaan (0.24) dengan D2 , dan perhatikan
−1 1 1 −21
bahwa D 2 D2 = D2 D = I , sehingga
Dari persamaan (0.24), diperoleh
1 1
S = D2 RD2 (0.25)
4. Nilai Sampel dari Kombinasi Linear Variabel
Kombinasi linear telah diperkenal pada bab 2. Dalam produser
multivariabel, bentuk kombinasi linear umum kita tuliskan
c ′X = c1 x 1 + c 2 x 2 + ⋯ + c p x p

Yang nilai pengamatannya pada percobaan ke i adalah


c ′x i = c1x i 1 + c 2 x i 2 + ⋯ c p cip , i = 1, 2, ⋯ , n (0.26)

Dari n pengamatan pada persamaan (0.26) kita dapat menghitung


Rata-rata sample
1
c ′x = c ′ ( x1 + x 2 + ⋯ x n ) (0.27)
n

( c ′xi − c ′x ) = ( c ′ ( xi − x ) ) = c ′ ( xi − x )( xi − x )′ c ,
2 2
Karena maka
kita dapat menghitung variansi sample

( c ′x1 − c ′x ) + ( c ′x2 − c ′x ) + ⋯ + ( c ′x2 − c ′x )


2 2 2

var Sampel =
n −1
c ′ ( x1 − x )( x1 − x )′ c + ⋯ + c ′ ( xn − x )( xn − x )′ c
=
n −1
 
c ′  ( x1 − x )( x1 − x ) + ⋯ + ( xn − x )( xn − x )′  c

 
= 
n −1
Atau

24
a. Variansi sampel
c ′ Sc (0.28)
Selanjutnya, perhatikan kombinasi linear kedua
b ′ X = b1 x 1 + b2 x 2 + ⋯ b p x p

Yang nilai pengamatannya pada percobaan ke- j adalah


b ′ x i = b1x i 1 + b2 x i 2 + ⋯ + b p x ip (0.29)

Dengan mengikuti persamaan (0.27) dan (0.28) bahwa rata-rata


sampel dan variansi sampel dari hasil pengamatan adalah
Rata-Rata Sampel dari b′X = b′ x
Variansi Sampel dari b′X = b′Sb

Dari data hasil pengamatan tersebut juga dapat dihitung kovariansi,


yaitu
b ′ X d a n c ′X = b ′ S c (0.30)
Teorema 3.2.
Kombinasi linear
b ′X = b1x1 + b2 x2 + ⋯ + bp x p
c ′X = c1x1 + c2 x2 + ⋯ + c p x p

Mempunyai rata-rata sampel. variansi sampel, dan kovariansi sampel


yang berkaitan dengan x dan S secara berturut sebagai berikut
b ′ X = b ′x
c ′X = c ′ x
b ′X = b ′Sb
c ′X = c ′Sc
b ′X dan c ′X = b ′Sc (0.31)
Contoh 3.2 (Rata-Rata dan Kovariansi untuk Kombinasi Linear)
Perhatikan dua kombinasi linear dan nilai yang diturunkan untuk
jumlah pengamatan n = 3 ,

25
x  1 2 5
 11 x12 x13   
X =  x21 x 22 x 23  =  4 1 6 
 
x  4 0 4
 31 x 32 x 33   

Perhatikan dua kombinasi linear


X 
 1
b′X =  2 2 −1   X2  = 2X1 + 2X2 − X3
 
X 
 3 

Dan
X 
 1
c ′X =  1 −1 3   X2  = 1X1 − 1X2 + 3X 3
 
X 
 3 

Rata-rata, variansi dan kovariansi dapat dihitung secara langsung.


Pengamatan pada kedua kombinasi linear tersebut diperoleh dengan
menggantikan X1 , X 2 , dan X 3 dengan nilai-nilai pengamatannya.
Sebagai contoh, pengamatan n = 3 pada b ′ X adalah
b ′x1 = 2x11 + 2x12 − x13 = 2 ( 1 ) + 2 ( 2 ) − 1 ( 5 ) = 1
b ′x2 = 2x11 + 2x12 − x13 = 2 ( 4 ) + 2 ( 1 ) − 1( 6 ) = 4
b ′x 3 = 2x11 + 2x12 − x13 = 2 ( 4 ) + 2 ( 0 ) − 1( 4 ) = 4

Rata-rata sample, variansi secara dari kombinasi linear tersebut


secara berturut-turut adalah
(1 + 4 + 4 )
b ′x = =3
3
(1 − 3 ) + ( 4 − 3 ) + ( 4 − 3 )
2 2 2

b ′xb = =3
3 −1
Dengan cara yang sama, n = 3 pengamatan pada c ′X adalah

26
cx1 = x11 − x12 + 3x13 = 1( 1 ) − 1( 2 ) + 3 ( 5 ) = 14
c′x2 = x11 − x12 + 3x13 = 1( 4 ) − 1( 1 ) + 3 ( 6 ) = 21
c′x3 = x11 − x12 + 3x13 = 1( 4 ) − 1 ( 0 ) + 3 ( 4 ) = 16

Dan
( 14 + 21 + 16 )
b ′x = = 17
3
( 14 − 17 ) + ( 21 − 17 ) + ( 16 − 17 )
2 2 2

b ′xb = = 13
3 −1
Dan kovariansi sampel adalah
( 1 − 3 )( 14 − 7 ) + ( 4 − 3 )( 21 − 17 ) + ( 4 − 3 )( 16 − 17 ) 9
= =
3 −1 2

Kombinasi linear dapat dituliskan dalam bentuk umum, yaitu


 a11x1 a12x2 ⋯ a1px p   a11 a12 ⋯ a1p   x1 
    
a x a x ⋯ a2pxp  a21 a22 ⋯ a2p   x2 
 21 1 22 2 = = AX (0.32)
 ⋮ ⋮ ⋱ ⋮   ⋮ ⋮ ⋱ ⋮   ⋮ 

a a x ⋯ aqpx p   aq1 aq2 ⋯ aqp   xp 
 q1x1 q2 p    
Teorem 3.3.
q kombinasi linear AX dalam persamaan (0.32) mempunyai vektor
rata-rata Ax dan matriks kovarinsi sampel, A S A ′ .
Latihan Soal
1. Diberikan matriks
9 1
 
X =  5 3 
1 2
 

27
Gambar diagram pencar dalam dimensi-2. Tempat rata-rata
sampel pada diagram pencar
Gambarkan data dalam dimensi-3, dan plot vektor deviasi
y 1 − x 1 1 dan y 2 − x 2 1

28
BAB III
DISTRIBUSI NORMAL MULTIVARIAT

1. Fungsi Padat Normal Multivariat


Kebanyakan uji univarit dan interval kepercayaan didasarkan pada
distribusi normal univariat. Dengan cara yang sama, mayoritas
prosedur multivariate mempunyai distribusi normal multivariate. Untuk
memudahkan pemahaman konsep-konsep fungsi padat peluang
multivariate, pembahasan dilakukan dari pendekatan univariat.
Padat Normal Univariat
Fungsi padat normal multivariate merupakan bentuk umum dari padat
normal univariat untuk dimensi p ≥ 2 . perhatikan fungsi padat
peluang normal untuk univariat berikut:
2
1 x −µ 
−  i 

1 2 σ 
f (x ) = e ; −∞ < x < ∞ (0.33)
2πσ2
Jika x mempunyai fungsi sebagaimana yang ditampilkan pada
persamaan (0.33), maka hal tersebut dikatakan bahwa x berdistribusi
normal dan dinyatakan dengan N ( µ, σ ) . Jika fungsi ini dibuat
grafiknya, maka akan membentuk grafik seperti lonceng (Lihat Gambar
1) yang memperlihatkan luasan area dibawah kurva dalam standar
deviasi ± 3 dari rata-rata. Luasan area tersebut merepresentasikan
peluang untuk variabel acak X normal, yaitu:

29
f (x)
x

Gambar 1. Kurva Distribusi Normal Baku

P ( µ − σ ≤ X ≤ µ + σ ) = 0.68
P ( µ − 2σ ≤ X ≤ µ + 2σ ) = 0.95

Aturan penulisan untuk fungsi padat peluang dari variabel acak X yang
berdistribusi normal dengan rata-rata µ dan standar deviasi, σ, adalah

X ∼ N ( µ, σ )

Dengan demikian, jika dituliskan X ∼ N ( 10, 4 ) berarti, µ = 10 dan


σ = 2
Padat Normal Multivariat
Perhatikan model eksponen

 
2

 x − µ  = ( x − µ ) ( σ2 )
−1
(x − µ) (0.34)
 σ 
Pada persamaan (0.33) merupakan kuadrat jarak dari x terhadap µ
dalam unit standar deviasi.
Model pada persamaan (0.34) dapat ditulislkan dalam bentuk yang
lebih umum untuk vektor pengamatan berukuran p × 1 untuk
beberapa variabel, yaitu

( x − µ )′ ∑−1 ( x − µ ) (0.35)

Dimana, vektor µ berukuran p × 1 merupakan nilai ekspektasi dari


variabel acak X, dan matriks ∑ merupakan matriks variansi-kovariansi
dari variabel acak X. Jika diberikan matriks pengamatan

30
X =  X1, X1, ⋯ X p  , maka fungsi pada persamaan (0.33) dapat
dituliskan kembali dengan menggunakan vektor rata-rata dan matriks
variansi-kovariansi, sebagai berikut:
1
1 1 − ( x−µ )Σ−1 ( x−µ )′
f (x) = p
Σ 2
e 2 (0.36)
( 2π ) 2

Dimana −∞ < x i < ∞, i = 1, 2, ⋯ p dan dinyatakan sebagai fungsi


pada peluang berdimensi p ditulis

X ∼ N p ( µ,Σ )

Contoh 4.1
Misalkan kita akan menghitung fungsi padat normal dengan p = 2
dengan parameternya µ1 = E ( X1 ), µ2 = E ( X2 ) , σ11 = Var ( X1 ) ,
σ22 = Var ( X2 ), dan

σ12
ρ12 = = Kov ( X1, X2 )
σ11 σ22

Solusi 4.1
Berdasarkan teorema…, dari soal kita peroleh matriks kovariansi
σ σ12 
Σ =  11 
σ σ22 
 21 
dengan
1  σ22 −σ12 
Σ−1 =  
 −σ σ11 
σ11σ22 − 2
σ12  12 

Sebagaimana telah dijelaskan sebelumnya, koefisien korelasi ρ12


dapat dihitung dengan

31
σ12 = ρ12 σ11 σ22

Diperoleh σ11σ22 − σ12


2
= σ11σ22 ( 1 − ρ12
2
) dan jarak kuadrat menjadi
( x − µ )′ Σ−1 ( x − µ )
1
=  x1 − µ1, x 2 − µ2 
σ11σ22 ( 1 − ρ12
2
)
 σ22 −ρ12 σ11 σ22   x1 − µ1 
  
  x − µ 
−ρ σ σ
 12 11 22   2 2 
σ11

σ22 ( x1 − µ1 ) + σ11 ( x 2 − µ2 ) − 2ρ12 σ11 σ22 ( x1 − µ )( x 2 − µ )


2 2

=
σ11σ22 ( 1 − ρ12
2
)
 2 2
 x − µ  x − µ 
  x1 − µ   x2 − µ2 
− 2ρ12  1
1
=   +   
2 2

 

( 12 )  11   22 
1 − ρ2 
σ   σ  
 11 
σ  σ22 


(0.37)

Dari persamaan (0.36) untuk pada dari variabel normal dimensi- p ,


harus jelas bahwa jalur dari nilai x menghasilkan konstan yang tinggi
untuk pada bentuk ellips. Padat normal multivariate merupakan
konstan pada permukaan dimana kuadrat dari jarak
( x − µ )′ Σ−1 ( x − µ ) adalah konstan.
Jalur-Jalur tersebut disebut bentuk (Kontur-Contour):

( x − µ )′ Σ−1 ( x − µ ) = c 2 (0.38)

32
Teorema 4.1.
Jika Σ merupakan matriks definit positif, sedemikian hingga Σ−1 ,
maka
1 
Σe = λe akibatnya Σ−1e =  e 
λ 

Sehingga ( λ, e ) merupakan pasangan nilai eigen dan vektor eigen


1 
untuk Σ yang berkaitan dengan pasangan  , e  untuk Σ−1 . Σ−1 juga
 λ 
merupakan matriks definit positif.
Bukti.
Untuk matriks definit positif, Σ , dan e ≠ 0 suatu vektor eigen, kita
punya
e ′Σe = e ′ ( Σe ) = e ′ ( λe ) = λe ′e = λ > 0

Dan juga
e = Σ−1 ( Σe ) = Σ−1 ( λ e )

Atau

e = λΣ−1e
Untuk model terakhir dengan λ > 0 , hasilnya
1
Σ−1e = e
λ
1 
Selanjutnya,  , e  merupakan pasangan nilai eigen dan vektor eigen
λ 
untuk matriks Σ−1 . Demikian halnya dengan vektor x berukuran p×1

 p 1 

x ′Σ−1x = x ′  ∑  e e ′  x
 i i 
 i =1  λi  

33
λ − 1 ( x ′e )
2
Oleh karena setiap model i i
non-negatif. Jika x = 0 , maka
keadaan dari x ′ei = 0 untuk setiap i . Sehingga, jika x ≠ 0, maka
p
1
∑ λ ( x ′ei ) > 0
2

i =1 i

Sehingga Σ−1 juga definit positif.



Contoh 4.4 (Bentuk dari padat normal bivariate)
Kita akan menggambarkan sumbu bentuk padat peluang konstan
untuk distribusi normal bivariate dimana σ11 = σ22 .
Dari persamaan (0.38), sumbu-sumbu tersebut diberikan oleh nilai
eigen dan vektor eigen dari Σ .
Persamaan karakteristik Σ − λ I = 0 menjadi

σ11 − λ σ12
= ( σ11 − λ ) − σ12
2
0= 2
σ12 σ11 − λ
= ( λ − σ11 − σ12 )( λ − σ11 − σ12 )

Akibatnya, nilai eigen adalah λ1 = σ11 + σ12 dan λ2 = σ11 + σ12 . Vektor
eigen x1 ditentukan dari

 σ11 σ12   x 1  x 
    = (σ + σ )  1 
σ σ11   x 2  11 12  
 12    x 2 

atau
σ11x 1 + σ12x 2 = ( σ11 + σ12 ) x 1
σ12x 1 + σ11x 2 = ( σ11 + σ12 ) x 2

Persamaan terakhir menghasilkan x 1 = x 2 , dan setelah dinormalkan


pasangan nilai eigen dan vektor eigen pertama adalah

34
 1 
 
λ1 = σ11 + σ12 ; x1 =  1
2

 2


Dengan cara yang sama


 1 
 2 
λ2 = σ11 − σ12 ; x2 =  1 
 − 2 

σ λ = σ +σ
Ketika kovariansi 12 positif, 1 11 12 merupakan nilai eigen

terbesar, dan vektor eigen yang bersesuaian, menyimpan sejauh 45o


melalui µ′ =  µ1, µ2  .

Sumbu ellip dari padat konstan untuk distribusi normal bivariate


dengan σ11 = σ22 ditentukan oleh

 1   1 
 2
±c σ11 + σ22  1 
dan ±c σ11 − σ22  −21 
 
2
 2 

Kita tunjukkan bahwa persamaan (0.38), c 2 = χp2 ( α ) merupakan


persentil ke- ( 100α ) dari distribusi chi-kuadrat dengan derajat bebas p

menghasilkan kontur yang memuat ( 1 − α ) 100% ,

( x − µ )′ Σ−1 ( x − µ ) ≤ χp2 ( α ) (0.39)

Mempunyai peluang 1− α

2. Properti Variabel Acak Multivariat Normal


Berikut dijelaskan beberapa aturan dari vektor acak x berukuran p×1
dari distribusi normal multivariate N p ( µ, Σ ) :

Sifat linear dari kombinasi linear variabel dalam x

35
Teorema 4. 2.
Jika X berdistribusi N p ( µ, Σ ), maka sembarang kombinasi linear dari
variabel a ′X = a1x1 + a2x 2 + ⋯ + a p x p berdistribusi N p ( a ′µ, a ′Σa ) .

Teorema 4.3.
Jika a ′X = a1x1 + a2x 2 + ⋯ + a p x p berdistribusi N p ( a ′µ, a ′Σa ) untuk
setiap a , maka X berdistribusi N p ( µ, Σ ) .

Contoh 4.2. (Distribusi dari kombinasi linear komponen vektor


acak normal).
Perhatikan kombinasi linear a ′X dari vektor acak multivariate normal
ditentukan dengan memilih a ′ =  1, 0, 0, ⋯, 0  . Karena itu

 X1   µ1 
   
X  µ 
  
a ′X =  1 0 ⋯ 0   2
= ′    2
  ⋮ 
X1 Dan a µ =

1 0 ⋯ 0   ⋮  = µ1
   
X  µ 
 p   p 
Sehingga
 σ11 σ12 ⋯ σ1p   1 
  
σ σ22 ⋯ σ2p   0 
a ′Σa =  1 0 ⋯ 0   21 = σ11
  ⋮
 ⋮ ⋱ ⋮   ⋮ 
σ ⋯ σpp   0 
 p1
σ p1  
Teorema 4.3
Jika X ∼ N p ( µ, Σ ), q kombinasi linear

 a11X1 + ⋯ + a1p X p 
 
a X + ⋯ + a X 
 21 1 2p p 
A X =  ⋮ 

(q ×p )( p×1)
a X + ⋯ + a X 
 q1 1 qp p 

36
Berdistribusi normal Nq ( Aµ, AΣΑ )

Variabel terstandarkan (Standarized Variabel)

Distribusi Chi-Square
Distribusi chi-square menentukan variabilitas dari variansi sampel,
s 2 = s11, untuk sampel dari suatu populasi normal univariat. Hal
tersebut memainkan peran penting dalam kasus multivariate.
Contoh 4.3 (Distribusi dua kombinasi linear dari komponen
vektor acak normal)
Untuk X ∼ N 3 ( µ, Σ ) , tentukan distribusi dari

X 
 X1 − X 2   1 −1 0   1 
 =   X  = AX
X − X   0 1 −1   2 
 2 3     X 
 3 
Dengan teorem 4.3, distribusi dari AX adalah normal multivariate
dengan rata-rata
µ 
 1 −1 0   1   µ − µ2 
Aµ =   µ  =  1 
 
0 1 −1   2 µ − µ 
  µ  2 3 
 3 

Dan matriks kovariansi


σ σ12 σ13   1 0 
 1 −1 0   11

AΣΑ′ =      
  σ21 σ22 σ23   −1 1 
 0 1 −1   σ   
 31 σ32 σ33   0 −1 

 1 0 
 σ11 − σ12 σ12 − σ22 σ13 − σ23  
=    −1 1 
 
 σ12 − σ13 σ22 − σ23 σ23 − σ33   0 −1 
 

37
 σ11 − 2σ12 + σ22 σ12 + σ23 − σ22 − σ13 
=  
σ + 2σ23 − σ22 − σ13 σ22 − 2σ23 + σ33 
 12 

Teorema 4.3
Misalkan X ∼ N p ( µ, Σ ) dengan Σ > 0 Maka

a. ( x − µ )′ Σ−1 ( x − µ ) berdistribusi χp2 , dimana χp2 merupakan


distribusi chi-square dengan derajat bebas p

b. Distribusi X ∼ N p ( µ, Σ ) menyatakan peluang 1 − α pada daerah


padat ellips { x : ( x − µ )′ Σ −1
( x − µ ) ≤ χp2 ( α ) } dimana χp2 ( α )

merupakan persentil ke-100 α dari distribusi χp2 .

Sifat Normal Distribusi Marginal

Sifat Independen
Teorem 4. 3.

Jika X1 dan X 2 independen, maka kov ( X1, X2 ) = 0 ,

  
 X1 
 
  µ   Σ ⋮ Σ  
  1 
 11 12
 , maka X dan X adalah
Jika  ........  adalah Nq1 +q2   .......  ,  ....... ⋮ .......  
 X2    µ   Σ Σ  
1 2
    2   21 ⋮ 22  
independen jika dan hanya jika Σ12 = 0

38
Distribusi Bersyarat
Teorema 4.5
 X1   µ1 
   
Misalkan X =  .......  berdistribusi N p ( µ, Σ ) dengan  .......  ,
 X2   µ2 
   
 
 Σ11 ⋮ Σ12 
Σ =  ....... ⋮ .......  , dan Σ > 0 . Maka distribusi bersyarat dari
 X1 ,
 Σ21 ⋮ Σ22 
 
diberikan X 2 = x 2 adalah normal dan mempunyai

22 ( x2 − µ2 ) Dan Kovariansi = Σ11 − Σ12Σ22 Σ21


−1
Rata-Rata = µ1 + Σ12 Σ− 1

Perhatikan bahwa, kovariansi tidak bergantung pada nilai x2 dari


variabel pensyarat
Distribusi Jumlah dua Vektor
3. Distribusi Sampel Multivariate Normal
Pada bagian ini kita akan membahas tentang statistik X dan S
Estimasi Normal Multivariate
Ketika kita akan melakukan inferensi multivariat normal terhadap
poulasi berdasarkand data sampel, salah satu metode yang sering
digunakan untuk mendapatkan nilai estimasi dari parameter adalah
maksimum likelihood. Teknik ini cukup sederhana secara konsep,
vektor pengamatan x 1 , x 2 , ⋯ , x n yang telah dikumpulkan, dan nilai µ
dan Σ yang memaksimumkan pada gabungan dari X , disebut fungsi
likelihood.
Teorema 4.6
Misalkan x1 , x2 , ⋯ , xn merupakan sampel acak dari populasi normal
dengan rata-rata µ dan kovariansi Σ . Maka
µ̂ = x (0.40)

39
ˆ = 1 ∑ ( x − x )( x − x )′ = ( n − 1 ) S
n
Σ j j (0.41)
n j =1 n

Merupakan estimator maksimum likelihood dari µ dan Σ . Nilai


n
1
pengamatan, x dan ∑ ( x j − x )( x j − x )′ disebut pengestimasi dari
n j =1
µ dan Σ .

Dimana S adalah matriks kovariansi sampel.


Selanjutnya fungsi likelihood adalah
n
L ( µ, Σ; x1, x2 , ⋯, xn ) = ∏ f ( xi , µ, Σ )
i =1
1
− ( xi −µ )′ Σ−1 ( xi −µ )
n
1
= ∏ e 2

( )
p 12
i =1 2π Σ

1
1 − Σ( xi − µ )′ Σ−1 ( xi − µ )
L ( µ, Σ; x1, x2 , ⋯, xn ) = e 2 (0.42)
( )
np n 2
2π Σ

Sebelum membahas lebih lanjut estimasi parameter dengan metode


likelihood, berikut diberikan teori yang berkaitan dengan trace dari
suatu matriks.
Teorema 4.7
Misalkan A merupakan matriks simetri berukuran k × k dan x
merupakan vektor berukuran k × 1. Maka
1. x′Ax = tr ( x′Ax ) = tr ( Axx′ )
k
2. tr ( A ) = ∑ λi , dimana λi merupakan nilai eigen dari A
i =1

40
Perhatikan eksponen dari persamaan (0.42), yaitu
( xi − µ )′ Σ−1 ( xi − µ ) , dapat disederhakan menjadi
 
( xi − µ )′ Σ−1 ( xi − µ ) = tr  ( xi − µ )′ Σ−1 ( xi − µ ) 
  (0.43)
 −1 
= tr  Σ ( xi − µ )′ ( xi − µ ) 
 

Selanjutnya
n n
 
∑ ( xi − µ )′ Σ−1 ( xi − µ ) =∑ tr  ( xi − µ )′ Σ−1 ( xi − µ ) 
i =1 i =1
n
 
= ∑ tr  Σ−1 ( xi − µ )′ ( xi − µ ) 
i =1

n n
 
∑( xi − µ)′ Σ−1 ( xi − µ) =tr∑ Σ−1 ( xi − µ)′ ( xi − µ)  (0.44)
i =1 i =1

Karena trace dari suatu jumlahan matriks adalah sama dengan jumlah
trace dari setiap matriks. Kita dapat menambahkan dan
n
1
mengurangkan x = ∑ xj dalam setiap model ( xi − µ) dalam
n i =1
n
∑ ( xi − µ )( xi − µ )′ yang menghasilkan
i =1

n
1 1
− ∑( xi − x + x − µ)( xi − x + x − µ)′ =− C + D
2 i=1 2 (0.45)
1
=− C + nD
2
n n
Dimana C = ∑ ( xi − x )( xi − x )′ dan D = ∑ ( xi − µ )( xi − µ )′
i =1 i =1

41
n
Karena model hasil kali ∑ ( xi − x )( xi − µ )′ dan
i =1
n
∑ ( x − µ )( xi − µ )′ ; keduanya adalah nol Persamaan (0.45) menjadi
i =1

1
1 − B
L ( µ, Σ; x1, x2 , ⋯, xn ) = e 2 (0.46)
( )
np n 2
2π Σ

n
Dimana B = ∑ ( xi − x )( xi − x )′ + n ( x − µ )( x − µ )′
i =1

n
Karena Σ−1 adalah definit positif, model − ( x − µ )′ Σ−1 ( x − µ ) ≤ 0
2
n
− ( x −µ )′ Σ−1 ( x −µ )
dan 0 < e 2 ≤ 1, maksimum ketika pangkatnya sama
dengan 0. Oleh karena itu L maksimum ketiak µ̂ = x

Distribusi X dan S
n
1
Untuk distribusi dari x = ∑ x j , dapat dibagi dalam dua kasus,
n i =1

1. Ketika x didasarkan pada sampel acak x1 , x2 , ⋯ , xn dari distribusi


normal multivariate N p ( µ, Σ ) maka x ∼ N p µ, Σ ( n )
2. Ketika x didasarkan pada sampel acak x1 , x2 , ⋯ , xn dari suatu
distribusi nonnormal populasi multivariate dengan vektor rata-rata
µ dan matriks kovarinsi Σ , maka untuk n cukup besar, x
mendekati distribusi x ∼ N p µ, Σ ( n ) . Formalnya dikenal dengan
teorema limit central multivariate: Jika x merupakan vektor rata-
rata dari sampel acak x1 , x2 , ⋯ , xn dari suatu populasi dengan

42
vektor rata-rata µ dan mariks kovariansi Σ , maka saat n → ∞ ,
distribusi dari n ( x − µ ) mendekati N p ( 0, Σ )

p
Terdapat p variansi dalam S dan   kovariansi, untuk total
 2 

 p  p ( p − 1) p ( p + 1)
p +   = p + =
 2  2 2

p ( p − 1)
Entri berbeda. Distribusi gabungan dari variabel berbeda
2
dalam W = ( n − 1 ) S = ∑ ( xi − x )( xi − x )′ merupakan distribusi
i
Wishart, dinyatakan dengan
Wp ( n − 1, Σ )

Dimana ( n − 1) adalah derajat bebas.

Distribusi Wishart analog dengan distribusi chi-square multivariate,


dan penggunaannya sama. Suatu variabel acak χ2 didefinisikan
secara formal sebagai jumlah kuadrat dari standar normal independen
(univariat) variabel random:

( xi − µ )
n n 2

∑ zi2 = ∑ σ2
∼ χ2 ( n )
i =1 i =1

Jika µ digantikan dengan x , maka

( xi −x) ( n − 1)s2
n 2

∑ σ2
=
σ2
∼ χ2 ( n − 1 )
i =1

Dengan cara yang sama, definisi formal dari variabel acak wishart
adalah

43
n
∑ ( xi − µ )( xi − µ )′ ∼ Wp ( n , Σ ) (0.47)
i =1

Dimana x1 , x2 , ⋯ , xn secara independen berdistribusi N p ( µ, Σ ) . Ketika


µ digantikan dengan x , hasilnya adalah

n
( n − 1 ) S = ∑ ( xi − x )( xi − x )′ ∼ Wp ( n − 1, Σ ) (0.48)
i =1

Berikut ringkasan distribusi sampel:


Misalkan x1 , x2 , ⋯ , xn sampel acak berukuran n dari suatu distribusi
normal p variabel dengan rata-rata µ dan matriks kovariansi Σ .
Maka
 1 
1. X ∼ N p  µ,   Σ 
  n  

2. ( n − 1) S berdistribusi wishart dengan derajat bebas n − 1


3. X dan S independen
4. Menilai Asumsi Normalitas Multivariat
Ketika kita bekerja dengan beberapa variabel, memeriksa kenormalan
setiap variabel seharusnya bukan pendekatan yang bagus, karena
1. Variabel saling berkorelasi
2. Normalitas dari setiap variabel tidak menjamin gabungannya
normal
Mengevaluasi Normalitas Univariat
Pendekatan secara grafik untuk memerikan normalitas adalah plot
Q − Q yang membandingkan kuantil dari sampel dengan kuantil
populasi dari normal univariat. Jika titik-titik dekat-dekat dengan garis
lurus, tidak ada yang mengindikasikan adanya normalitas.

44
Misalkan diberikan data hasil pengamatan, x 1 , x 2 , ⋯ , x n untuk satu
karakteristik saja, X i . Misalkan x (1 ) ≤ x( 2 ) ≤ ⋯ ≤ x ( n ) data hasil
pengamatan yang telah susun secara terurut dari yang terkecil. x ( i )
merupakan quantil data. Ketika nilai x ( i ) berbeda, secara tepat
pengamatan i kurang dari atau sama dengan x ( i ) . Proporsi i n dari
sampel pada x ( i ) sering diperkirakan dengan ( i − 12 ) n .

Untuk distribusi normal standar, quantil q ( i ) didefinisikan dengan relasi

q( i )
1 i− 1
P  Z ≤ q ( i )  =
− 12 z 2
∫ dz = p( i ) = (0.49)
2
e
  2π n
−∞

p( i ) adalah peluang yang diperoleh dari nilai yang kurang dari atau

sama dengan q ( i ) dalam satu pengambilan dari populasi berdistribusi


normal.

Idenya adalah untuk melihat pasangan quantil (q(i ), x(i ) ) dengan


asosiasi yang sama peluang kumulatif ( i − 12 ) n . Jika data berasa dari

populasi yang berdistribusi normal, pasangan ( q( i ), x( i ) ) diperkirakan


akan berkaitan secara linear, karena σq( i ) + µ dekat dengan nilai
ekspektasi kuantil.
Contoh 4.4 (Mengkonstruksi QQ-Plot)
Sampel sebanyak n = 10 pengamatan, nilainya sebagaimana dalam table
berikut:
Pengamatan Level Peluang Quantil
(terurut) ( j − 12 ) Standar Normal
x(i ) q(i )
n

45
-1.00 0.05 -1.645
-0.10 0.15 -1.036
0.16 0.25 -0.674
0.41 0.35 -0.385
0.62 0.45 -0.125
0.80 0.55 0.125
1.26 0.65 0.385
1.54 0.75 0.674
1.71 0.85 -1.036
2.30 0.95 -1.645
0.385
1 −12 z 2
Sebagai contoh, P ( Z ≤ 0.385 ) = ∫ e dz = 0.65
−∞ 2π

Misalkan kita ingin mengkonstruksi Plot Q-Q dan memberikan


interpretasi terhadap apa yang nampak pada grafik tersebut. Plot Q-Q
untuk data diatas, dimana plot dari data yang telah diurutkan x ( i )
dengan quantile normal q ( i ) , sebagaimana ditunjukkan pada grafik

berikut. Pasangan titik-titik ( q( i ), x( i ) ) berada sangat dengan sepanjang


garis lurus, dan kita tidak ingin menolak hal yang menyatakan bahwa
data tersebut mempunyai distribusi normal-secara khusus dengan
ukuran sampel yang kecil n =10.

46
Gambar 4. Normal Q-Q Plot nilvai Ekspektasi v.s Nilai Pengamatan
Terstandar
Berikut langkah-langkah membuat plot Q − Q
1. Urutkan pengamatan asal, x (1), x ( 2 ), ⋯, x ( n ) dan peluang

( 1 − 21 ) ( 2 − 21 ) ( n − 21 )
yang bersesuaian , , ⋯, ;
n n n
2. Hitung quantil standar normal q(1), q( 2 ), ⋯, q(n ) ; dan

3. Plot pasangan pengamatan


(q(1), x(1) ), (q( 2 ), x(2 ) ), ⋯, (q(n ), x(n ) ),
Contoh 4.3 (Plot Q-Q untuk Data Radiasi)
Departemen pengontrolan kualitas dari suatu pabrik pembuat
microwave oven yang dibutuhkan oleh pemerintah untuk memonitor
jumlah radiasi yang dipancarkan ketika pintu oven tertutup.
Pengamatan pancaran radiasi melalui pintu tertutup dari n = 42 telah
diambil secara acak. Datanya sebagaimana ditampilkan pada table 4.2
b berikut

47
Plot Q-Q dari data radiasi dibuat dengan menggunakan software SPSS
V16. Perhatikan hasil plot tersebut, terdapat dua titik yang terletak
menyimpang sangat jauh dari titik yang lain dan dari garis luruh, yang
demikian disebut sebagai outlier. Maka dari hasil tersebut dapat kita
simpulkan data radiasi oven tidak normal.

Garis lurus dari plot Q-Q dapat diukur dengan menghitung koefisien
korelasi dari titik-titik dalam plot. Koefisien korelasi untuk plot Q-Q
didefinsikan dengan
n

∑ ( x ( j ) − x ) ( q( i ) − q )
i =1
rQ = (0.50)
n n

∑ ( x ( j ) − x ) ∑ ( q( i ) − q )
2 2

i =1 i =1

Secara formal penolakan hipotesis dari normal pada level signifikansi


α jika rQ berada dibawah nilai perkiraan, sebagaimana dalam table
berikut
Contoh 4.4 (uji koefisien korelasi untuk Normalitas)
Misalkan kita akan menghitung koefisien korelasi rQ dari contoh 4.3
dan uji untuk normalitas.
Dari contoh 4.3, diketahui x = 0.770 dan

48
10 10 10
∑( )
x ( i ) − x q( i ) = 8.584 , ∑( )
x ( i ) − x = 8.472 , dan ∑ q(2i ) = 8.795 .
i =1 i =1 i =1

Karena q = 0 (selalu),
8.584
rQ = = 0.994
8.472 8.795
Uji normalitas pada taraf signifikasni 10% memberikan patokan
rQ = 0.994 untuk dibandingkan dengan table …untuk n = 10 dan
α = 0.10 , nilai kritisnya adalah 0.9351. Oleh karena rQ = 0.994 >
0.9351, hipotesis yang menyatakan distribusinya tidak ditolak.

a. Mengevaluasi Normalitas Bivariate


Perhatikan himpunan kejadian bivariate x sehingga

( x − µ )′ Σ−1 ( x − µ ) ≤ χ22 ( 0.05 )


Mempunyai peluang 0.05. kita coba mengharapkan secara apa adanya
persentase yang sama, 50% dari sampel pengamatan untuk
menyimpang dari ellips diberikan oleh

{ semua x sehingga ( x − x )′ S −1
( x − x ) ≤ χ22 ( 0.05 ) }
Dimana µ kita estimasi denga x dan Σ−1 kita estimasi dengan S−1 .
Jika bukan, asumsi normalitas dicurigai
Contoh 4.3 (Pemeriksaan Normalitas Bivariat)
Meskipun bukan berasal dari sample acak, data yang memuat
pasangan hasil pengamatan ( x 1 = salse dan x 2 = profit) untuk 10
perusahaan terbesar didunia sebagaimana ditunjukkan pada contoh
4.1. Dari data tersebut, diberikan

49
 155.60   7476.45 303.63 
x =   , S= 
  303.62 26.19 

 14.70
  
Sehingga

1  26.19 −303.63 
S−1 =  
103, 623.12  −303.63 7476.45 
 0.000253 −0.002930 
=  

 −0.002930 0.072148 

Dari table, diperoleh χ22 ( 0.5 ) =1.39. Lalu, sembarang pengamatan


x′ =  x1, x2  memenuhi

 x 1 − 155.60  ′  0.000253 − 0.002930   x 1 − 155.60 


    
 x − 14.70   −0.002930 0.072148   x − 14.70  ≤ 1.39
 2     2 
Jatuh didalam kontur pengamatan 50%. Pengamatan lain jatuh diluar
kontur. Pengamatan yang lain selain dari yang disebut diatas jatuh
diluar kontru. Pasangan pengamatan pertama,
x x 2  ′ =  108.28 17.05  . Dalam kasus ini,
 1   

 108.28 − 155.60  ′  0.000253 − 0.002930   108.28 − 155.60 


    
 17.05 − 14.70   −0.002930 − 0.072148   17.05 − 14.70 
     
= 1.61 > 1.39
Dan titik ini jatuh diluar kontur 50%.

Metode formal lain yang dapat digunakan untuk menilai gabungan sifat
normal dari sekumpulan data adalah dengan memperhatikan jarak
kuadrat umum

d j2 = ( x j − x )′ S−1 ( x j − x ) , j = 1, 2, ⋯, n (0.51)

50
Dimana x1, x 2 , ⋯ , x n adalah sampel pengamatan.
Ketika populasi primernya merupakan multivariate normal dimana n
dan n − p lebih besar dari 25 atau 30, setiap dari kuadrat jarak akan
cenderung mengikuti variabel random chi-kuadrat. Walaupun jarak-
jarak tersebut tidak independent atau secara tepat berdistribusi chi-
kuadrat, namun cukup membantu untuk digambarkan plotnya. Plot
yang dihasilkan disebut plot chi-kuadrat atau Gamma Plot, karena
distribusi chi-kuadrat merupakan kasus khusus dari distribusi gamma.
Untuk mengkonstruksi plot chi-kuadrat
Langkah-Langkah Mengkonstruki Plot Chi-Kuarat
1. Urutkan data jarak dalam persamaan (0.51) dimulai dari
yang paling kecil hingga yang paling besar.
d12 ≤ d22 ≤ ⋯ ≤ dn2
  1  
2. Gambarkan pasangan qc.p 
 j −  n  , d j2  dimana
 
 2  
 1   1
qc.p 
 j −  n  merupakan kuantil ke- 100  j −  n

 2   2
dari distribusi chi-kuadrat dengan derajat bebas p .

Contoh 4.4 (Mengkonstruksi Plot Chi-Kuadrat)


Misalkan kita akan membuat plot chi-kuadrat dari jarak dalam contoh
4.3. Jarak diurutkan dan hubungkan dengan persentil chi-kuadrat
untuk p = 2 dan n = 10 sebagaimana ditampilkan pada table 4.4
berikut
j d j2  1 
qc.2 
 j −  10 

 2 
1 0.30 0.10
2 0.62 0.33
3 1.16 0.58
4 1.30 0.86
5 1.61 1.20
6 1.64 1.60

51
7 1.71 2.10
8 1.79 2.77
9 3.53 3.79
10 4.38 5.99
Hasil plotnya
S c a tte r pl o t o f d v s q

3
d

0
0 1 2 3 4 5 6
q

Gambar 5. Scatte plot data d v.s q


5. Mendeteksi Data Pencilan dan Cleaning Data
Kebanyakannya kumpulan data memuat satu atau lebih hasil
pengamatan yang berbeda keadaannya dari pengamatan yang lainnya
atau diistilah dengan unusual observartion atau dikenal dengan Data
pencilan (outlier). Data yang demikian biasanya berada pada posisi
sangat kecil atau sangat dari kumpulan pengamatan. Keadaan data
yang demikian sangat berpengaruh dalam analisis statistic.
Langkah-langkah mendeteksi outlier:
Buat dot plot untuk setiap data variabel
1. Buat scatter plot atau diagram pencar untuk setiap
pasangan variabel
2. Hitung nilai terstandar (standardized value)
z jk = ( x jk − x k ) skk untuk j = 1, 2, ⋯, n dan setiap
kolom k = 1, 2, ⋯, p . Uji nilai terstandar tersebut untuk
nilai terkecil atau terbesar

3. Hitung jarak kuadrat umum d j2 = ( x j − x )′ S−1 ( x j − x ) .


Uji jara-jarak tersebut untuk unusual nilai besar. Dalam

52
plot chi-kuadrat, titik-titik tersebut akan berada jauh dari
titik asal.

Dalam langkah ketiga, harus diinterpretasi relative terhadap ukuran


sampel dan jumlah variabel. Terdapat nilai terstandarkan sebanyak
n × p . Andaikan terdapat n = 100 dan p = 5 , maka ada 500 nilai.
Diharapkan 1 atau 2 dari data-data tersebut melebihi 3 atau kurang
dari -3, jika data berasal dari distribusi multivariate hal tersebut berarti
normal, dan 3.5 dicurigai sebagai data yang besar. Nilai terstandarkan
dihitung berdasarkan rata-rata dan variansi sampel.
6. Transformasi Normalitas
Asumsi dasar setiap teknik statistic adalah sifat normalitas, ika
sekumpulan data tidak mengikuti distribusi normal, apa yang harus
dilakukan atau langkah apa yang selanjutnya diambil? Alternative
pertama adalah menghilangkan data yang menyebabkan tidak normal,
namun cara ini tidak dianjurkan karena yang merusak kesimpulan atau
melahirkan kesimpulan yang tidak tepat. Alternative kedua adalah
membuat data “tidak normal” menjadi nampak “normal” atau hampir
normal dengan transformasi data.
Transformasi data adalah menampilkan data dalam bentuk yang
berbeda. Transformasi yang tepat yang dianjurkan adalah (1)
berdasarkan teori atau (2) berdasarkan data itu sendiri atau (3)
keduanya. Secara teoritis bahwa data yang dihitung lebih sering
cenderung normal dengan mengambil akar kuadrat. Dengan cara yang
sama transformasi logit untuk proporsi dan tranformasi z untuk
koefisien korelasi menghasilkan kuantitas yang mendekati distribusi
normal.
Berikut beberapa bentuk tranformasi
Skala Asal Skala Transformasi
1 Count, y y
2 Proporsi, p̂ 1  pˆ 
logit ( pˆ ) = log  
2  1 − pˆ 

53
3 Korelasi, r 1  1 + r 
Fisher z ( r ) = log  
2  1 − r 
Dalam kebanyakan kasus, pilihan transformasi untuk meningkatkan
pendekatan kenormalan data ternyata tidak mudah. Namun, adalah
satu satu teknik transformasi yang disebut dengan power
transformation yang dianjurkan untuk mengatasi kesulitan tersebut.
Power transformation terdefinisikan hanya pada variabel positif. Akan
tetapi, hal ini bukan merupakan pembatasan, karena satu konstanta
dapat ditambahkan ke setiap pengamatan dalam himpunan data jika
beberapa nilai adalah negative.
Misalkan x merepresentasikan pengamatan, maka power
transformasi merupakan pengurutan oleh parameter λ . suatu nilai
diberikan untuk λ yang menyebabkan transformasi tertentuk lebih
dekat.
Sebuah metode analisis diberikan untuk memilih power transformasi.
Box dan Cox melakukan perubahan pada power transformasi
 x λ − 1
 λ≠0
x ( ) = 
λ ;
(0.52)
 λ
 ln x ; λ=0

Dimana λ > 0 .
Diberikan pengamatan x 1, x 2 , … x n , solute Box-Cox untuk memmilih
pendekatan power λ adalah solusi yang meminimumkan rumus

n 1 
( )
n 2 n
(λ )
ℓ ( λ ) = − ln  ∑ x j − x ( )  + ( λ − 1)
∑ ln x j
λ
 (0.53)
2  n j =1
  j =1

Latihan Soal
4. 1. Perhatikan suatu distribusi normal bivariate dengan µ1 =1, µ2 = 3,
σ
11
= 3, σ 22 = 1 dan ρ12 =-0.8.

a. Tuliskan fungsi dari padat normal bivariate

54
b. Nyatakan jarak statistic kuadrat ( x − µ )′ Σ ( x − µ ) sebagai
suatu fungsi kuadrati dari x 1 dan x 2

4. 2. Misalkan X ∼ N 3 ( µ, Σ ) dengan µ′ =  −3,1, 4  dan

 1 −2 0 
 
Σ =  −2 5 0 
 0 0 2 
 
Mana dari variabel acak berikut yang independent?
a. X1 dan X 2

b. X 2 dan X 3

c. ( X1, X2 ) dan X3

X1 + X 2
d. dan X 3
2

e. X 2 dan X 2 − 5 X 1 − X 3
2

55
BAB IV
INFERENSI VEKTOR RATA-RATA

1. Uji µ Saat Σ Diketahui


Pengujian vektor rata-rata dengan asumsi Σ diketahui merupakan
pendahuluan untuk mengilustrasikan pengujian multivariate dan untuk
memberikan pengantar pemahaman kepada keadaan dimana Σ tidak
diketahui. Untuk memudahkan pemahaman, pertama akan
diperkenalkan kasus pada univariate, variabel x yang berdistribusi
N ( µ, σ ) .

Hipotesis yang akan diuji adalah rata-rata dari x adalah sama dengan
suatu nilai rata-rata yang ditentukan atau diberikan, yaitu µ0 lawan
hipotesis alternative yang tidak sama dengan µ0 , secara statistic dapat
dirumuskan sebagai berikut:
H 0 : µ = µ0 Lawan H 0 : µ ≠ µ0

57
Dimana H 0 merupakan hipotesis nol dan H 1 merupakan hipotesis
alternative, dua sisi. Jika diberikan data, X 1 , X 2 , ⋯ , X n , yang
menyatakan data variabel acak yang berasal dari populasi yang
berdistribusi normal, pendekatan uji statistic yang dapat digunakan
adalah
x − µ0 x − µ0
z = =
σx σ
n
yang berdistribusi N ( 0,1 ) Jika H 0 benar.

Uji Multivariate untuk H 0 : µ = µ0 ; σ Diketahui


Dalam kasus multivariate dimana mempunyai banyak variabel yang
diukur pada setiap unit sample, dan kita ingin menguji hipotesis suatu
nilai, µ0 dari setiap variabel, H 0 : µ = µ0 Lawan H 0 : µ ≠ µ0 , kita
punya
 µ1   µ01   µ1   µ01 
       
 µ   µ   µ   µ 
   
H 0 :   = 
2 02
, H1 :   ≠ 
2 02
,
  
⋮ ⋮    
⋮ ⋮ 
       
 µp   µ0p   µp   µ0p 

Dimana, setiap µ0 j merupakan nilai yang ditentukan sebagai nilai target


oleh peneliti.
 Kesamaan vektor dalam H 0 mengakibatkan µ j = µ0 j untuk setiap
j = 1, 2, ⋯, p
 Sedangkan ketaksamaan vektor dalam H 1 mengakibatkan paling sedikit
satu dari µ j ≠ µ0 j , untuk kemudian kita menolak H 0 .
Untuk menguji H 0 , andaikan sampel acak dari n vektor pengamatan,
x1 , x 2 , ⋯ , xn dari populasi yang berdistribusi normal, N p ( µ, Σ ) ,

58
n
1
dengan Σ diketahui, dan menghitung x = ∑ Xi dari data yang telah
n i =1
dikumpulkan sebelumnya. Uji statistic yang bersesuaian adalah

Z 2 = n ( x − µ0 )′ Σ ( x − µ0 ) (0.54)

Jika H 0 benar, Z 2 berdistribusi χp2 , oleh karena itu kita tolak H 0 jika
Z 2 > χα2 ,p .

Contoh 3.1
Dalam Table 3.1, tinggi dan berat dari 20 orang mahasiswa laki-laki.
Misalkan diasumsikan bahwa sampel ini berasal dari bivariate normal
N 2 ( µ, Σ ) , dimana

 20 100 
 
 100 1000 
Andaikan kita ingin menguji H 0 :   (70,170) . Dari contoh 3.21
x 1  71.45 dan x 2  164.7. Selanjutnya kita punya

Z 2 = n ( y − µ )′ Σ−1 ( y − µ )
 71.45 − 70 ′  20 −1
100   71.45 − 70 
= ( 20 )      
 164.7 − 170   100 1000  
 164.7 − 170 
 0.1 −0.01  1.45 
= ( 20 ) ( 1.45 −5.3 )    
 −0.01 0.002  −5.3 
= 8.4026

Gunakan α =0.05, 2
χ0.05,2 = 5.99 dan oleh karena itu tolak

H 0 : µ = ( 70,170 )′ karena Z 2 = 8.4026 > 5.99

Perhatikan bahwa uji statistic sensitive terhapad struktur kovariansi.


Jika Kov ( x 1 , x 2 ) negative, y 2 akan cenderung naik ketika y1 naik, dan
gambar ellips akan arahnya akan berubah.

59
2. Uji µ saat Σ tidak Diketahui
Pada bagian ini akan dibagi pembahasan menjadi dua bagian, yaitu
pengujian untuk satu sampel lalu pengujian untuk dua sampel. Ada
dua alasan:
1. Prinsip-prinsip umum kebanyakannya lebih mudah
mengilustrasikan dalam satu sampel dibanding dua sampel
2. Beberapa test yang banyak digunakan adalah untuk kasus satu
sampel.
Sebelum membahas lebih lanjut tentang bagaimana menguji hipotesis
berkaitan dengan masalah ini, terlebih dahulu kita tinjau kembali
masalah univiariat yang berkenaan dengan kasus ini.
Andaikan kita telah mengumpulan data sampel acak, yaitu x 1 , x 2 , ⋯ , x n
yang diperoleh dari populasi yang berdistribusi normal, N ( µ, σ 2 ) .
Estimator dari µ adalah x dan estimator dari σ 2 adalah s 2 , yaitu
n n
1 1
∑ x i dan s 2 = n − 1 ∑ ( x i − x )
2
x =
n i =1 i =1

Untuk menguji hipotesis


H 0 : µ = µ0 lawan H 1 : µ ≠ µ0

Kita gunakan uji t-student dengan rumus

x − µ0 n ( x − µ0 )
t = = (0.55)
s n s

Jika H 0 benar, t berdistribusi tn −1 , dimana n − 1 merupakan derajat


bebas.
Keputusan statistika yang dapat kita ambil adalah, tolak H 0 jika

60
n (x − µ )
≥ tα /2,n −1
s

atau
Tidak tolak H 0 jika

n (x − µ )
≤ tα /2,n −1
s

Kedua bentuk diatas ekuivalen dengan interval kepercayaan


 s 
 µ0 berada dalam 100(1 − α)% CI x ± tα /2;n −1 
 n 
atau
2 2
x − tα /2;n −1 ≤ µ0 ≤ x + tα /2;n −1 ≤ µ0 (0.56)
n n
Dimana t α / 2,n − 1 merupakan nilai kritis dari table t.

x − µ0
Bentuk t = pada persamaan (0.55) merupakan bentuk
s n
karakteristik dari statistic-t, yang merepresentasikan jarak sampel
terstandarkan antara x dan µ0 .

Uji Hotelling-T 2 untuk H 0 :    0 ; Σ tidak diketahui


Diberikan hasil pengamatan suatu sampel acak x1 , x 2 , ⋯ , xn berasal
dari populasi yang berdistribusi N p ( µ, Σ ), dimana xi memuat p
pengukuran pada unit sampel ke- i .
Dalam rangka pengujian hipotesis
H 0 : µ = µ 0 lawan H 1 : µ ≠ µ 0

61
Digunakan rumus yang merupakan perluasan dari statistic- t kasus
univariat. Dalam bentuk kuadrat, bentuk univariat statistic- t dapat
dituliskan

n ( x − µ0 )
2

t =
2
= n ( x − µ0 ) ( s 2 ) ( x − µ0 ) . (0.57)
s2
Pada persamaan (0.57), gantikan ( x − µ0 ) dan s 2 dengan ( x − µ )
dan S , diperoleh uji statistika

T 2 = n ( x − µ )′ S−1 ( x − µ ) . (0.58)
dimana
 µ10 
 
n n µ 
∑ ( Xi − X )( Xi − X )′ dan µ0 =  ⋮ 
1 1
= ∑ Xi , S =
20
x n n − 1  
( p×1) i =1 ( p×p ) i =1
µ 
 p 0 

Statistik T 2 disebut Hotelling’s T 2 .


Bentuk karakteristik dari statistic T 2 adalah

 S −1
T 2 = ( x − µ )′   ( x − µ ) . (0.59)
 n 

Bentuk karateristik mempunyai dua fitur:


1. S n merupakan matriks kovariansi sampel X dan matriks
terstandarkan dalam fungsi jarak
2. Karena x1 , x 2 , ⋯ , xn berdistribusi N p ( µ, Σ ) , demikian halnya
 1 
dengan X ∼ N p  µ, Σ  , ( n − 1 ) S ∼ W ( n − 1, Σ ) dan X dan S
 n 
independen.
Perhatikan persamaan (0.57), statistic-t merepresentasikan jumlah
standar deviasi x dari µ0 . Hal yang sama nampak pada statistic T 2 ,

62
akan tetapi dalam interpretasinya tidak mudah. Jika kita tambahkan
variabel, jaraka dalam persamaan (0.59) akan meningkat.
Untuk melakukan pengujian hipotesis, kita harus membandingkan nilai
hasil perhitungan dari T 2 dengan nilai table. Jika suatu pengujian
untuk menolak H 0 : µ = µ 0 , pertanyaan yang harus diajukan adalah,
variabel apa atau variabel mana yang memberikan kontribusi lebih
untuk suatu penolakan.
Berikut beberapa hal yang berkaitan dengan uji-T 2 :
1. Jumlah pengamatan terhadap jumlah variabel seharusnya, n > p
. Untuk kondisi yang lain, akan menghasilkan S yang singular dan
akibatnya T 2 tidak dapat dihitung
2. Kasus satu sampel maupun dua sampel, derajat bebas untuk
statistic T 2 akan sama, yaitu; v = n − 1 untuk satu sampel, dan
v = n 1 + n 2 − 1 untuk dua sampel.
3. Hipotesis alternative adalah uji dua-sisi. Karena ruang adalah
multidimensi. Pengujian satu sisi tidak pertimbangkan, semisal
µ > µ 0 . Namun demikian, daerah kritisnya tetap satu-sisi
(Penolakan untuk nilai T 2 yang besar). Hal ini merupakan
karakteristik dari kebanyakan uji multivariate.
4. Dalam kasus univariat, t n2−1 = F1,n −1 . Statistik T 2 juga dapat
dikonversi ke statistic-F sebagai berikut:
v − p +1 2
Tp,v = Fp,v −p +1 (0.60)
vp

Berikut cara membaca table T 2


1. Kolom pertama dari table memuat nilai kuadrat dari table t ; yaitu
Tα2,1,v = t α2 /2,v . Untuk p = 1 T 2 menjadi t 2 .

2. Baris terakhir memuat nilai kritis χ2 , yaitu Tp2,∞ = χp2

63
Contoh 2.
Misalkan matriks data untuk suatu sampel acak berukuran n = 3 dari
populasi normal bivariate adalah
 6 9
 
X =  10 6 
 8 3
 

Uji T 2 untuk µ 0′ =  9, 5  . Apa distribusi sampel dari T 2 dalam contoh


ini?
Solusi : Dari soal, kita dapat menghitung
 6 + 10 + 8 
 x1    8
   
x= = 3  =  
 x 2   9+6+3   6 
 
 3 
dan

(6 − 8) + ( 10 − 8 ) + ( 8 − 8 )
2 2 2

s11 = =4
3
( 6 − 8 )( 9 − 6 ) + ( 10 − 8 )( 6 − 6 ) + ( 8 − 8 )( 3 − 6 )
s12 = = −3
3
(9 − 6) + (6 − 6) + (3 − 6)
2 2 2

s22 = =9
3
 4 −3 
Dengan demikian S =  
−3 9 
 
Selanjutnya
1  4 −3  1 1 
S−1 =   = 3 9 
( 4 )( 9 ) − ( −3 )( −3 )  −3 9   19 4 
27 

Dan, dari persamaan (0.58), T 2 = n ( x − µ )′ S−1 ( x − µ ) . diperoleh

64
1 1  8 − 9 − 2 
T 2 = 3  8 − 9 6 − 5   13 9    = 3  −1 1   9  = 7
  4  6 − 5    1  9
 9 27     27 

( 3 − 1)2
Sebelumnya, sampel terpilih, T 2 berdistribusi F = 4F2,1
( 3 − 2 ) 2,3−2

Contoh 3. (Pengujian Vektor Rata-rata dengan T 2 )


Keringat dari 20 wanita sehat telah dianalisis. Tiga komponen, X1 =
rata keringat, X 2 = mengandung sodium, dan X 3 = mengandung
potassium, telah diukur, dan hasil. Datanya sebagaimana ditampilkan
dalam table 5.1
Individual X1 X2 X3
1 3.7 48.5 9.3
2 5.7 65.1 8.0
3 3.8 47.2 10.9
4 3.2 53.2 12.0
5 3.1 55.5 9.7
6 4.6 36.1 7.9
7 2.4 24.8 14.0
8 7.2 33.1 7.6
9 6.7 47.4 8.5
10 5.4 54.1 11.3
11 3.9 36.9 12.7
12 4.5 58.8 12.3
13 3.5 27.8 9.8
14 4.5 40.2 8.4
15 1.5 13.5 10.1
16 8.5 56.4 7.1
17 4.5 71.6 8.2
18 6.5 52.8 10.9
19 4.1 44.1 11.2
20 5.5 40.9 9.4

65
Uji hipotesis
H 0 : µ ′=  4, 50,10  H 1 : µ ′ ≠  4, 50,10 
lawan
Pada level signifikansi α = 0.01 .
Solusi. Hitung statistik berikut
 4.640   2.879 10.010 −1.810 
   
x =  45.400  , S =  10.010 199.788 −5.640 
 9.965   −1.810 −5.640 3.628 
   
dan
 0.586 −0.022 0.258 
 
S−1
=  −0.022 0.006 −0.002 
 0.258 −0.002 0.402 
 
Hitung

T 2 = 20  4.640 − 4 45.400 − 50 9.965 − 10 


 
 0.586 −0.022 0.258   4.640 − 4 
  
 −0.022 0.006 −0.002   45.400 − 50 
  
 0.258 −0.002 0.402   9.965 − 10 
   
 0.467 
 
= 20  0.640 −4.600 −0.035   −0.042 
 
 0.160 
 
= 9.74

Bandingkan hasil perhitung T = 9.74 dengan nilai kritis


2

(n − 1) p 19 ( 3 )
F = F3,17,0.10 = 3.353 ( 2.44 ) = 8.18
( n − p ) p,n − p,0.01 17

Dari hasil tersebut nampak bahwa, T 2 = 9.74 > 8.18, Akibatnya kita
tolak H 0 pada leve signifikansi 10%.

66
3. Hotelling-T 2 dan Uji Likelihood Ratio
Pada bagian sebelumnya telah dijelaskan statistic T 2 dengan analogi
univariat jarak kuadrat t 2 . Terdapat prinsip umum untuk
mengkonstruksi prosedur uji yang disebut uji likelihood ratio, dan
statistic T 2 dapat diturunkan dari uji likelihood ratio dari H 0 : µ = µ 0 .
Lihat Persamaan (0.61) bahwa maksimum dari likelihood normal
multivariate seperti µ dan Σ diberikan oleh

1
max L ( µ, Σ ) = e −np /2 (0.61)
n /2
( 2π )
np /2
µ,Σ Σ

dimana
n n
1 1
Σ= ∑ ( xi − x )( xi − x )′ dan µˆ = x = ∑ xi
n i =1 n i =1

Merupakan estimasi maksimum likelihood.


Dibawah hipotesis H 0 : µ = µ0 , fungsi likelihood normal
n

− ∑ ( xi −µ0 ) Σ−1 ( xi −µ0 )
1
1
L ( µ0 , Σ ) = e 2 i =1

( 2π )
np /2 n /2
Σ

Nilai µ0 merupakan nilai konstans, tapi Σ dapat bervariasi untuk


mendapatkan nilai yang “lebih mirip”, nilainya dapat diperoleh dengan
memaksimumkan fungsi likelihood, L ( µ 0 , Σ ) terhadap Σ .

Langkah berikut, sebagaimana langkah pada persamaan (0.61)


eksponen dalam L ( µ 0 , Σ ) dapat dituliskan sebagai

67
n n
1 1  
− ∑ ( x − µ0 )′ Σ−1 ( xi − µ0 ) = − 2 ∑ tr  Σ−1 ( xi − µ0 )′ ( xi − µ0 ) 
2 i =1 i i =1
1  −1  
n
= − tr  Σ  ∑ ( xi − µ0 )′ ( xi − µ0 )  
2   i =1  
Dengan menerapkan Teorema 4.7, kita punya
1
max L ( µ0 , Σ ) = e −np /2 (0.62)
Σ n /2
( 2π )
np /2
Σ0

n
1
Dengan Σ0 = ∑ ( x − µ )( x − µ )′
n i =1

Dengan menggunakan (0.61) dan (0.62) , kita peroleh bentuk


likelihood ratio

max L ( µ0 , Σ )  Σ n /2
 
LR = Λ = Σ
=   (0.63)
max L ( µ, Σ )  Σ0 
µ,Σ  
 Σ 
 
Statistic yang ekuivalen dengan persamaan (0.63), Λ 2/ n
=  
 Σ0 
 
disebut Wilks’ Lambda. Jika nilai teramati dari likelihood ratio terlalu
kecil, akibatnya hipotesis H 0 : µ = µ0 tidak mungkin sesuai, oleh
karena itu hipotesis ditolak. Kasus khusus, Uji likelihood ratio dari
H 0 : µ = µ0 lawan H1 : µ ≠ µ0 tolak H 0 jika

 n n /2
 Σ  n /2  ∑ ( xi − x )( xi − x )′ 
  
Λ =   = 
i =1
 < cα (0.64)
 Σ0   n 
  

 ∑ ( xi − µ0 )( xi − µ0 )′ 
 i =1 

Dimana cα merupakan persentil 100 α bawah distribusi Λ.

68
Teorema 1.
Misalkan X 1 , X 2 , ⋯ , X n sampel acak dari suatu populasi berdistibusi
normal, N p ( µ, Σ ) . Maka uji pada persamaan (0.58) didasarkan pada
T 2 ekuivalen terhadap uji likelihood ratio dari
H 0 : µ = µ 0 lawan H 1 : µ ≠ µ 0

Karena
−1
 T 2 
Λ2/n =  1 + 
 ( n − 1 ) 

4. Daerah Kepercayaan dan Perbandingan Simultan Komponen Rata-


Rata
Untuk melakukan inferensi dari suatu sampel, kita perlu memperluas
konsep interval kepercayaan dari masalah univariat ke masalah
daerah kepercayaan multivariate. Misalkan θ merupakan vektor
parameter populasi yang tidak diketahui dan Θ merupakan himpunan
semua nilai yang mungkin dari θ. Daerah kepercayaan merupakan
suatu nilai θ yang mungkin. Daerah ini ditentukan dengan data, dan
kita nyatakan D ( X ), dimana X =  x1, x2 , ⋯, xn  ′ merupakan data yang
disusun secara matriks.
Daerah D ( X ), dikatakan mempunyai daerah kepercayaan
100 ( 1 − α ) %,

P  D (X ) benar untuk θ  = 1 − α (0.65)


Merupakan peluang untuk keadaan θ benar dimana nilainya tidak
diketahui.
Daerah kepercayaan untuk µ dari populasi berdistribusi dengan
jumlah variabel p

69
 (n − 1) p 
P  n ( X − µ )′ S−1 ( X − µ ) ≤ Fp,n −p ( α )  = 1 − α
 (n − − ) 
Apapun nilai dari µ dan Σ. Dengan kata lain, X akan berada didalam

 ( n − 1) p 1/2
 F ( α ) 
 ( n − p ) p,n −p 
 
Dari µ , dengan peluang dengan syarat bahwa jarak sebagaimana
digambarkan dalam model nS−1 . Untuk sampel tertentu, x dan S
dapat dihitung, dan ketaksamaan
(n − 1) p
n ( X − µ )′ S−1 ( X − µ ) ≤ F (α ) akan mendefinisikan
( n − p ) p,n − p
daerah D ( X ) dalam ruang semua nilai parameter yang mungkin.
Dalam kasus ini, daerah akan berupa ellipsoid pada titik tengah x .
Suatu daerah kepercayaan 100 ( 1 − α ) % untuk rata-rata dari distribusi
normal berdimensi- p merupakan ellips yang ditentukan oleh semua
nilai µ sehingga

p ( n − 1)
n ( x − µ )′ S−1 ( x − µ ) ≤ Fp,n − p, α (0.66)
n−p
n n
1
1
( xi − x )( xi − x )′
∑ xi , (n − 1) ∑
Dimana x = S= dan
n i =1 i =1

x 1 , x 2 , ⋯ , x n adalah sampel teramati.

Untuk menentukan apakah sembarang µ0 menyimpang dari daerah


kepercayaan atau tidak, perlu dilakukan jarak kuadrat umum
p ( n − 1)
n ( x − µ0 )′ S−1 ( x − µ0 ) dan bandingkan dengan Fp,n −p, α . Jika
n−p

70
p ( n − 1)
jarak kuadrat lebih besar dari Fp,n −p, α , µ0 tidak berada dalam
n−p
daerah kepercayaan.
Untuk p ≥ 4 , kita tidak dapat menggambarkan grafik dari daerah
kepercayaan untuk µ . Namun demikian, kita dapat menghitung sumbu
dari ellips kepercayaan dan yang berkaitan dengan panjangnya.
Dengan menentukan nilai eigen dan vektor eigen dari S.
Panjang dan arah sumbu dari
p ( n − 1)
n ( x − µ )′ S−1 ( x − µ ) ≤ Fp,n − p, α
n−p

Ditentukan dengan

c p ( n − 1)
λi = λi Fp,n −p,α
n n (n − p )

Unit sepanjang vektor eigen ei ,

p(n− 1)
± λi F e , dimana Sei = λi ei , i = 1,2, ⋯, p (0.67)
n ( n − p ) p,n −p,α i

Contoh 4.3 (mengkonstruksi elips kepercayaan untuk µ )


Data radiasi dari oven microware pada contoh 4.10 dan 4.17. Misalkan
x1 = 4
Pengukuran radiasi dengan pintu tertutup

Dan
x2 = 4
Pengukuran radiasi dengan pintu tertutup

Untuk n = 42 pasangan dari pengamatan yang telah


ditransformasikan, diperoleh
 0.564   0.0144 0.0117   203.018 −163.391 
x =   S= 
 
 S−1 = 


 −169.391 200.228 
0.603 0.0117 0.0146
  ,   ,  

71
Dengan nilai eigen dan vektor eigen dari S adalah
λ1 = 0.026, e1′ =  0.704 0.710 
 
λ2 = 0.002, e1′ =  0.710 0.704 
 
Elips kepercayaan 95% untuk µ memuat semua nilai ( µ1 , µ2 ) yang
memenuhi
42  0.564 − µ1 0.603 − µ2 
 
 203.018 −163.391   0.564 − µ1 
  
 −163.391 200.228   0.603 − µ 
   2 

2 ( 41 )
≤ F2,40,( 0.05 )
40
F2,40,( 0.05 ) = 3.23,
Atau, karena

42 ( 203.018 )( 0.564 − µ1 ) +
2

42 ( 200.228 )( 0.603 − µ2 )
2

−84 ( 163.391 )( 0.564 − µ1 )( 0.603 − µ2 ) ≤ 6.62

µ ′ =  0.562 0.589 
Untuk melihat apakah   di dalam daerah
kepercayaan atau tidak, kita hitung

42 ( 203.018 )( 0.564 − 0.562 )


2

+42 ( 200.228 )( 0.603 − 0.589 )


2

−84 ( 163.391 )( 0.564 − 0.562 )


( 0.603 − 0.589 ) = 1.30 ≤ 6.62
kita simpulkan bahwa µ ′ =  0.562 0.589  berada dalam daerah
0.562  
kepercayaan. Secara ekuivalen, suatu pengujian dari H 0 : µ =  
 0.589 
 

72
 0.562 
tidak seharusnya ditolak, dengan H 1 : µ ≠  
 pada level
 0.589

signifikansi α = 0.05 .
Ellipsoid kepecayaan gabungan sebagaimana gambar 5.1. Titik pusat
pada x ′ =  0.564 0.603  , dan panjang setengahnya dari sumbu mayor
dan minor diberikan oleh
p ( n − 1) 2 ( 41 )
λ1 Fp,n − p, α = 0.026 ( 3.23 ) = 0.064
n (n − p ) 42 ( 40 )

Dan
p ( n − 1) 2 ( 41 )
λ2 Fp,n −p,α = 0.002 ( 3.23 ) = 0.018
n (n − p ) 42 ( 40 )

Secara berurutan. Sumbu-sumbu yang menyimpang sepanjang


e1′ =  0.704 0.710  dan e2′ =  −0.710 0.704  ketika vektor-vektor
   
tersebut ditempatkan pada grafik dengan x sebagai titik asal. Suatu
indikasi penyimpangan elip kepercayaan diberikan oleh rasio panjang
sumbu mayor dan minor.
Rasio tersebut adalah
p ( n − 1)
2 λ1 Fp,n −p,α
n (n − p ) λ1 0.161
= = = 3.6
p ( n − 1) λ2 0.045
2 λ2 Fp,n −p,α
n (n − p )

73
Prosedur Uji Hipotesis menggunakan Uji Hotelling
1. Kumpulkan Data sampel
2. Hitung nilai statistic uji Hotelling dengan rumus:
T 2 = n ( x − µ )′ S−1 ( x − µ ) .

3. Pilih level uji, α


4. Tentukan nilai Hotelling berdasarkan nilai level uji
( n − 1) p
F (α )
( n − p ) p,n − p
5. Bandingkan Nilai statistic uji hoteling berdasarkan hasil
perhitungan dengan nilai hoteling table berdasarkan level
uji yang dipilih
6. Keputusan Statistik, Tolak H0, jika statistic likelihood
ratio, Λ ,
 n n /2

 Σ 

n /2
 ∑ ( xi − x )( xi − x )′ 

  i =1 
Λ =   =   < cα
 Σ0   n 
   ′
∑ ( xi − µ0 )( xi − µ0 ) 
 i =1 

74
yang berdistribusi
(n − 1) p
n ( X − µ )′ S−1 ( X − µ ) ≤ F (α )
( n − p ) p,n − p
7. Buat Kesimpulan Berdasarkan langkah (5)
a. Perbandingan berganda metode Banferroni
Andaikan bahwa, sebelum mengumpulkan data, pernyataan
kepercayaan seputar m kombinasi linear a 1′µ, a 2′ µ, ⋯ , a m′ µ perlua
ditetapkan. Misalkan C i menyatakan pernyataan kepercayaan sekitar
nilai dari ai′µ dengan P C i benar  = 1 − αi , i = 1, 2, ⋯ , m . Perhatikan,

P  semua C i benar  = 1 − P  Paling sedikit satu C i Salah 


m
≥ 1 − ∑ P (C i salah )
i =1
m
= 1 − ∑ ( 1 − P (C i benar ) )
i =1

P  semua C i benar  = 1 − ( α1 + α2 + ⋯ + αm ) (0.68)

Misalkan kita akan mengembangkan estimasi interval bersama-sama


untuk membatasi himpunan yang memuat komponen µi dari µ.
Informasi yang kurang pada komponen-komponen yang relative
penting, pertimbangkan individual interval- t .
si
x i ± tn −1; αi ; i = 1,2, ⋯, m
( ) 2 n

Dimana αi = α m. Karena P  Xi ± tn−1;( α 2m) sii n Memuat µi  = 1 − α m,


 
i = 1,2,..., m , kita punya, Dari persamaan (0.68)
 

α α α 
P  Xi ± tn −1;α sii n memuat µi , semua i  ≥ 1 −  + + ⋯ + 
 1m   m m m 
 m model

= 1−α

75
Oleh karena itu, dengan satu level kepercayaan keseluruhan lebih
besar daripada atau sama dengan 1 − α , kita dapat membuat m = p
pernyataan:

s11 s11
x1 − tn −1; α ≤ µ1 ≤ x1 + tn −1; α
2p n 2p n
⋮ ⋮ ⋮ (0.69)
s pp s pp
x p − tn −1; α ≤ µp ≤ x p + tn −1; α
2p n 2p n
Contoh (Mengkonstruksi Interval Kepercayaan simultan
Banferroni dan membandingkannya dengan Interval-T 2 )
Perhatikan kembali contoh data radiasi oven. Kita membuat interval
kepercayaan banferoni simultan 95% untuk rata-rata µ1 dan µ2 , dari
keempat kaki dari pintu-tertutup dan pintu-terbuka ukuran dengan
αi = 0.05 2 , i = 1, 2.

Gunakan hasil pada contoh…perhatikan bahwa n = 42 dan


t41 ( 0.05 2 ( 2 ) ) = t41 ( 0.0125 ) = 2.327 untuk mendapatkan

s11 0.0144
x1 ± t41 ( 0.0125 ) = 0.564 ± 2.327
n 42 atau 0.521 ≤ µ ≤ 0.607
1

s22 0.0146 0.560 ≤ µ2 ≤ 0.646


x2 ± t41 ( 0.0125 ) = 0.603 ± 2.327 atau
n 42
Inteval Banferoni untuk kombinasi linear a′µ dan analog dengan
interval - T 2 , mempunyai bentuk yang sama:
a ′Sa
a ′X ± ( nilai kritis )
n
α
Akibatnyanya, dalam setiap interval dimana αi = ,
m

76
panjang interval Banferroni tn −1 ( α / 2m )
= (0.70)
Panjang interval T 2 p ( n − 1)
Fp,n −p ( α )
n −p
Tidak bergantung pada besar acak X dan S

5. Inferensi Sample Besar Seputar Vektor Rata-Rata Populasi


Ketika sampel diambil mempunyai ukuran yang besar, uji hipotesis dan
daerah kepercayaan untuk µ dapat dikonstruksi tanpa asumsi
populasi berdistribusi normal.
Hal yang dianjutkan berkaitan dengan sampel yang berukuran besar
mungkin secara partial kehilangan informasi oleh hanya pada
penggunaan nilai-nilai statistic seperti X dan S .
Semua inferensi seputar µ yang berasal dari sampel yang berukuran
besar didasarkan pada distribusi chi-kuadrat, χ2 , dari persamaan 4-
28 diketahui bahwa
−1
( X − µ )′ ( n −1S ) ( X − µ ) = n ( X − µ )′ ( S ) ( X − µ )
−1

Didekati dengan χ2 dengan fungsi padat peluang


 
P  n ( X − µ )′ ( S ) ( X − µ ) ≤ χp2 ( α )  = 1 − α
−1
(0.71)
 

Dimana χp2 ( α ) persentil ke ( 100α ) dari distribusi χp2 .

Teorema 5.11
Misalkan X 1, X 2 , ⋯ , X n sampel acak dari populasi dengan rata-rata µ
dan matriks kovariansi Σ definit positif. Ketika n − p besar, hipotesis
H 0 : µ = µ 0 ditolak pada taraf signifikansi α yang dipilih. Jika
pengamatan

n ( x − µ0 )′ S−1 ( x − µ0 ) χp2 ( α )

77
Dimana Dimana χp2 ( α ) persentil ke ( 100α ) dari distribusi χp2 dengan
fpp
6. Inferensi Seputar Vektor Rata-Rata Untuk Data Missing
Dalam hal pengamatan yang dilakukan dalam suatu survey atau
pengukuran, terkadang diketemukan fakta terjadi data yang tidak
terekam atau tersimpan, yang demikian dikenal dengan Data Missing
atau Pengamatan Missing.
Pendekatan umum untuk menghitung estimasi dengan maksimum
likelihood dari data yang tidak lengkap diperkenalkan oleh Dempster,
Laird, dan Robin. Teknik yang mereka perkenalkan disebut Algoritma-
EM yang memuat perhitung secara iterative dalam dua langkah yang
disebut dengan prediksi dan estimasi.
1. Langkah prediski; Diberikan beberapa estimasi θɶ dari parameter
yang tidak diketahui, prediksi dari pengamatan yang pada statistic
sufficient
2. Langkah Estimasi; Gunakan prediksi statistic sufficient untuk
menghitung estimasi revisi dari parameter.
Ulangi perhitungan dari satu langkah ke langkah selanjut hingga
mendapatkan estimasi revisi yang tidak terlalu berbeda dari estimasi
yang diperoleh dari iterasi sebelumnya.
Diberikan pengamatan X 1 , X 2, ⋯ , X n merupakan sampel acak dari
populasi yang berdistribusi normal sebanyak p variabel. Algoritma –
EM didasarkan pada statistic data lengkap
n n
T1 = ∑ x j = nx dan T2 = ∑ x j x′j = ( n − 1 ) S + nxx ′
j =1 j =1

Diasumsikan bawah parameter populasi µ dan Σ tidak diketahui dan


harus diestimasi

78
Langkah Prediksi. Untuk setiap vektor x j dengan nilai missing,
misalkan x(j1) menyatakan komponen missing dan x(j2 ) komponen yang
ada. Selanjutny, x ′j =  x(j1 ), x(j2 ) 
 

Diberikan estimasi µɶ dan Σ dari langkah estimasi, gunakan rata-rata


x( ) , diberikan x( )
1 2
dari syarat distribusi normal dari untuk
mengestimasi nilai missing.

x
1 1
(
ɶ(j ) = E X(j ) | x(j ); µ,
2
ɶ Σ =µ ) 2
(
ɶ ( 1 ) + Σ12 Σ22 x(j ) − x
ɶ(j )
2
) (0.72)

Estimasi kontribusi dari x(j1) pada T1

Selanjutnya, kontribusi estimasi dari x(j1) pada T2

( 1) ( 1)
xj xj (
( 1 ) ( 1) (2)
= E X j X j ′ | x j ; µ, ) ɶ(j )x
ɶ Σ = Σ11 + Σ12 Σ22 Σ21 + x
1 ( 1)
ɶj ′ (0.73)

Dan
(1) ( 2 )
xj xj (
( 1) ( 2 ) (2 )
= E X j X j ′ | x j ; µ, )
ɶ(j )x(j )′
ɶ Σ =x
1 2

Langkah estimasi; Hitung estimasi maksimum likelihood revisi

T1 1
ɶ=
µ ɶ ɶ′
, Σ = T2 − µµ (0.74)
n n
Untuk memudahkan pemahaman tentang algoritma-EM, perhatikan
contoh berikut
Contoh (Ilustrasi Algoritma-EM)
Estimasi rata-rata populasi normal µ dan matriks kovariansi Σ
menggunakan data yang tidak lengkap.

79
− 0 3
 
7 2 6 
X = 
5 1 2 
− − 5 
 
Dari matriks data tersebut, diketahui n = 4 dan p = 3 dan bagian dari
vektor pengamatan x1 dan x 4 missing.
Dari sampel awal, dapat dihitung nilai statistik
7 +5 0 +2 +1 3 +6 +2 +5
ɶ1 =
µ = 6, µ
ɶ2 = = 1, µ
ɶ3 = = 4,
2 3 4
Selanjutnya hitung estimasi matriks kovariansi. Konstruksi estimasi
tersebut menggunakan pembagi n karena algoritma merupakan hasil
dari maksimum likelihood,

(6 − 6) + (7 − 6) + (5 − 6) + (6 − 6)
2 2 2 2
1
σɶ11 = =
4 2

( 0 − 1) + ( 2 − 1) + (1 − 1) + (1 − 1)
2 2 2 2
1
σɶ22 = =
4 2
( 6 − 6 )( 0 − 1) + ( 7 − 6 )( 2 − 1) +
( 5 − 6 )( 1 − 1) + ( 6 − 6 )( 1 − 1) 1
σɶ12 = =
4 4
3
σɶ23 =
4
σɶ13 = 1

Komponen pertama dari vektor x1 adalah missing, sehingga kita partisi


ɶ dan Σ sebagai
µ

80
 µɶ 
 1  µɶ(1 ) 
ɶ =  µɶ2  =  2 
µ
 µɶ   µɶ( ) 
 
 3  ,
 σɶ σɶ σɶ13 
 11 12  Σ11 Σ12 
Σ =  σɶ12 σɶ22 σɶ23  =  

 σɶ σɶ  21 22 
σɶ33 
Σ Σ

 13 23 
dan prediksi
−1  x − µɶ2 
xɶ11 = µɶ1 + Σ12 Σ12  12 
 x 13 − µɶ3 

−1
 1   1 3   0 − 1 
= 6 +  ,1   23 54   

 4   4 2   3 − 4 
= 5.73
−1
2
x 11 = σɶ11 − Σ12 Σ12 Σ21 + xɶ11
2

−1
1 1  
1 3 1
= −  ,1   23 4
5
 4  + ( 5.73 )2
1
2  4  
4 2   
= 32.99

x 11  x12 , x 13  = xɶ11  x 12,x13  = 5.73  0, 3  =  0, 17.18 

Untuk dua komponen missing yang lainnya, x 4 partisi µɶ dan Σ


sebagai
 µɶ   σɶ 
 1  µɶ(1 )   11 σɶ12 σɶ13   Σ11 Σ12 
ɶ =  µɶ2  =  2 
µ Σ =  σɶ12 σɶ22 σɶ23  = 
 

 µɶ   µɶ( )   σɶ   Σ21 Σ22 
  σɶ σɶ
 3  ,  13 23 33 

dan prediksi

81
 x 41  X  
  = E   41  x = 5; µ, ɶ Σ 
    X 

43
 x 42    42 
 µɶ  −1
=  1  + Σ12 Σ22 ( x 43 − µɶ3 )
µɶ
 2 
 6   1   5 −1
=   +  3    ( 5 − 4 )
 
   4   2 
1
 6.4 
=  

 1.3 

Untuk kontribusi pada T1 .

Latihan Soal
5. 1. (a) Evaluasi T 2 untuk menguji H 0 : µ ′ =  7 11  dengan
 
menggunakan data
 2 12 
 
8 9 
X =  

6 9 
 8 10 
 

(b) tentukan distribusi dari T 2 untuk keadaan (a)


( c) Gunakan (a) dan (b), untuk menguji H 0 pada taraf signifikansi
α = 0.05 , Kesimpulan apa yang anda dapat ambil?

5. 2. Gunakan data dalam 5.1. Periksa bahwa T 2 tidak mengalami perubahan


jika pengamatan x j , j = 1, 2, 3 diganti dengan Cx j , dimana
 1 −1 
C =  

 1 1 
Perhatikan bahwa pengamatan
 x − x j2 
Cx j =  j 1 

x + x
 j 1 j 2 

82
Menghasilkan matriks pengamatan

(6 − 9)
 ( 10 − 6 ) ( 8 − 3 )  ′
( 6 + 9 ) ( 10 + 6 ) ( 8 + 3 ) 

5. 3. (a) gunakan rumus pada persamaan (5-15) untuk mengevaluasi data
dalam latihan 5.1
(b) Gunakan data dalam latihan 5.1 untuk mengevaluasi Γ , juga evaluasi
lambda wilk

83
BAB V
MEMBANDINGKAN BEBERAPA
RATA-RATA MULTIVARIAT

1. Perbandingan Berpasangan dan Rancangan Pengukuran Berulang


Perbandingan Berpasangan
Pengukuran dari eksperimen yang berbeda biasanya disimpan dalam
himpunan yang berbeda dimaksudkan untuk melihat apakah respon
pada setiap himpunan data dari eksperimen-eksperimen tersebut
berbeda secara signifikans. Sebagai contoh, Kemanjuran suatu obat
herbal baru atau titik jenuh kampanye melalui iklan mungkin saja
ditentukan melalui perbandingan pengukuran sebelum “perlakuan”
(obat herbal atau iklan) dengan setelah “perlakuan”. Dalam situasi
yang lain, dua atau lebih perlakuan dapat dilakukan pada unit
eksperimen yang sama, dan respon dapat dibandingkan untuk menilai
efek dari perlakuan.
Satu pendekatan yang rasional untuk membandingkan dua perlakuan,
atau ada tidaknya efek dari suatu perlakuan, adalah dengan cara
melakukan kedua perlakuan pada unit yang identic. Pasangan respon
selanjutnya dimungkinkan untuk dianalisis dengan menghitung
perbedaan antara keduanya, cara yang demikian dimaksudkan untuk
mengeliminasi pengaruh variasi dari unit-ke-unit.
Sebelum kita membahas lebih lanjut terkait dengan perbandingan
berpasangan multivariate, kita ingatkan kembali perbandingan

84
berpasangan pada kasus univariate untuk memudahkan dalam
memahami masalah yang akan didiskusikan.
Misalkan Xi1 menyatakan respon pada perlakuan 1 (atau respon
sebelum perlakuan), dan misalkan Xi 2 menyatakan respon pada
perlakuan 2 (atau respon setelah perlakuan) untuk perlakuan ke- i .
Pasangan ( X i 1 , X i 2 ) merupakan hasil pengukuran pada unit ke- i
.Perbedaan antara keduanya adalah
Di = Xi1 − Xi2, i = 1,2, ⋯, n (0.75)
Distribusi dari data perbedaan antara kedua pengamatan diketahui
berdistribusi normal, N ( δ, σd2 ) dengan statistik

D −δ
t = (0.76)
Sd n

Dimana
n n
1 1
∑ ∑ ( Di − D )
2
D = Di dan sd2 = (0.77)
n i =1 n − 1 i =1

Berdistribusi t dengan derajat bebas n − 1 . Dengan suatu


konsukuensi, pada uji hipotesis pada level - α dari
H 0 : δ = 0 lawan H1 : δ ≠ 0
Diuji dengan membandingkan t dengan tn −1;( α 2 ) persentil ke-

100 ( α 2 ) dari distribusi- t dengan derajat bebas n − 1 . Interval


kepercayaan 100 ( 1 − α ) % untuk perbedaan rata-rata
δ = E ( X i 1 − X i 2 ) diberikan oleh persamaan berikut

sd sd
d − tn −1;( α 2 ) ≤ δ ≤ d + tn −1;( α 2 ) (0.78)
n n

85
Rangkuman Prosedur Pengujian Perbandingan rata-rata berpasangan
Univariat
Tujuan: Membandingkan dua rata-rata dari satu atau dua populasi
Asumsi
Langkah-Langkah Pengujian:
1. Hitung Selisih dari pengamatan satu dengan pengamatan kedua,
gunakan rumus pada persamaan 0.75
2. Hit ung statistic dari data selisih antara kedua data, dengan rumus 0.77
H :δ=0
3. Rumuskan Hipotesis yang akan diuji; 0
4. Hitung Nilai Statistik Uji, gunakan persamaan 0.76
5. Tentukan Nilai kritis, tn −1, α pada taraf signifikansi yang dipilih, α .
( 2)
6. Keputusan; Tolak H 0 : δ = 0 jika t > tn −1; α
( 2)

c. Perbandingan Berpasangan Multivariat


Dari kasus univariat untuk perbandingan berpasangan, kasus tersebut
dalam diperluas penggunaan ke masalah multivariate. Perbedaannya
terletak pada, p respon, dua perlakuan, dan n unit eksperimen. Kita
indentifikasi p respon dalam unit ke- i sebagai
X1 j 1 = Variabel 1 dibawah perlakuan 1
X1 j 2 = Variabel 2 dibawah perlakuan 1
⋮ ⋮
X1 jp = Variabel p dibawah perlakuan 1
X 2 j 1 = Variabel 1 dibawah perlakuan 2
X 2 j 2 = Variabel 2 dibawah perlakuan 2
⋮ ⋮
X 2 jp = Variabel p dibawah perlakuan p

dan p pasangan variabel acak berbeda menjadi

86
Di1 = X1j 1 − X2 j 1
Di 2 = X1j 2 − X2 j 2
(0.79)

Dip = X1jp − X2 jp

Misalkan Di′ =  D i 1 , Di 2 , ⋯ Dip  , dan asumsikan, untuk i = 1,2, ⋯, n , jika

 δ1 
 
δ 
E ( Di ) = δ =  2  dan cov ( Di ) = Σd (0.80)
 ⋮ 
δ 
 p 

Jika D1, D2, ⋯Dn merupakan vektor acak yang independen dan
berdistribusi normal, N p ( δ, Σd ) , maka inferensi sekitar vektor
perbedaan rata-rata δ dapat didasarkan pada statistic T 2 , yaitu

T 2 = n ( D − δ )′ Sd−1 ( D − δ ) (0.81)
dimana

n n
1 1
D= ∑ D j dan Sd = n − 1 ∑ ( Di − D )( Di − D )′ (0.82)
n i =1 i =1

Teorema 6.1.
Misalkan selisih D1, D2, ⋯Dn merupakan sampel acak dari populasi
N p ( δ, Σd ).
yang berdistribusi normal,
Maka

T 2 = n ( D − δ )′ Sd−1 ( D − δ )

87
berdistribusi
 (n − 1) p 
 
 ( n − p )  Fp,n − p
 

Untuk sembarang nilai δ dan Σ benar.

Suatu daerah kepercayaan 100 ( 1 − α ) untuk δ sedemikian hingga

(n − 1) p
( d − δ )′ Sd−1 ( d − δ ) ≤ Fp,n − p ( α ) (0.83)
n (n − p )

Demikian halnya dengan interval kepercayaan simultan 100 ( 1 − α )


untuk perbedaan rata-rata individual δi diberikan oleh

(n − 1) p sd2
δi : di ± F (α) i
(0.84)
( n − p ) n,n −p n

Dimana di merupakan elemen ke − i dari d dan sd2 merupakan elemen


i

diagonal ke- i dari Sd .

Untuk n − p cukup besar,  ( n − 1 ) p ( n − p )  Fp,n − p ( α ) = χp2 ( α ) dan


asumsi normal tidak dibutuhkan.
Interval kepercayaan simultan 100 ( 1 − α ) metode banferroni untuk
selisih individual rata-rata adalah

 α  s2
δi : di ± tn −1   di (0.85)
 2p  n

Dimana tn −1 ( α 2p ) merupakan persentil ke 100 ( α 2p ) dari distribusi


t dengan derajat bebas n − 1 .

88
Contoh 6.1. (Memeriksa perbedaan rata-rata dengan
pengamatan berpasangan)
Suatu perusahaan merencanakan perlakuan air buangan yang
diperlukan untuk memonitor buangannya ke sungai dan anak sungai
yang sesuai dengan peraturan. Perhatian tentang reliabilitas data dari
satu program monitoring diambil untuk diteliti pada dua laboratorium
untuk keperluang pengujian. Setengah dari sampel dikirim ke lab 1,
dan setengah yang lainnya dikirim ke lab 2. Pengukuran bio-chemical
oxygen deman (BOD) dan suspend solid (SS) telah dilakukan, untuk
sampel n = 11 terpisah, dari kedua lab tersebut. Berikut datanya
Sampel i Lab 1 Lab 2
x1j1 x1j1 x1j1 x1j1
1 6 27 25 15
2 6 23 28 13
3 18 64 36 22
4 8 44 35 29
5 11 30 15 31
6 34 75 44 64
7 28 26 42 30
8 71 124 54 64
9 43 54 34 56
10 33 30 29 20
11 20 14 39 21
Apakah hasil analisis kedua lab sama? Jika berbeda, apa
penyebabnya?
Statistik T2 untuk menguji hipotesis H 0 : δ ′ =  δ1 , δ2  =  0, 0 
dikonstruksi dari perbedaan pasangan pengamatan:
-19 -22 -18 -27 -4 -10 -14 17 9 4 -19
di1
12 10 42 15 -1 11 -4 60 -2 10 -7
di2
Dari selisih tersebut

89
 d   −9.36   199.26 88.38 
d =  1  =  , S = 
 d

 88.38 418.61 
 d2   13.27   
dan
 0.0055 −0.0012   −9.36 
T 2 = 11  −9.36 13.27     = 16.6
  −0.0012 0.0026   13.27 
   
Ambil α = 0.05, diperoleh
 p ( n − 1)   2 ( 10 ) 
 F  
 ( n − p )  p,n −p;( 0,05 ) =  9  F2,9 ( 0.05 ) = 9.47
   

Karena T 2 = 1 3.6 > 9 .47 , karena itu tolak H0 dan disimpulkan bahwa
terdapat selisih yang tidak nol antara pengukuran dari kedua lab
tersebut. Hal tersebut menunjukkan, dari inspeksi dari data, bahwa lab
1 cenderung menghasilkan pengukuran BOD yang rendah dan
pengukuran SS yang tinggi dibanding dengan lab 2. Interval
kepercayaan simultan 95% untuk selisih rata-rata δ1 dan δ2 dapat
dihitung dengan persamaan 0.83. Interval-interval tersebut adalah

( n − 1) p sd2 199.26
δ1 : d1 ± F (α) i
= −9.36 ± 9.47
( n − p ) p,n −p n 11

( n − 1) p sd2 418.61
δ1 : d1 ± F (α) i
= 13.27 ± 9.47
( n − p ) p,n −p n 11

Interval kepercayaan simultan 95% termasuk nol, Tolak H 0 pada level


signifikansi α = 0.05 . Kesimpulan apa yang dapat kita ambil?

Dalam contoh 6.1, peneliti secara actual membagi sampel ke dalam


dua bagian secara langsung untuk keperluan analisis kimia.
Kemudian, kedua laboratorium dimana sampel tersebut akan diteliti
kemungkinan bekerja pada kondisi yang tidak sama dapat terjadi,

90
kompetensi dari laboratorium, teknik pengukuran dan seterusnya akan
memberikan pengaruh terhadap hasil analisis.
Rangkuman Prosedur Pengujian Perbandingan rata-rata berpasangan
Multivariate
Tujuan: Membandingkan dua rata-rata dari satu atau dua populasi
Asumsi
Langkah-Langkah Pengujian:
1. Hitung Selisih dari pengamatan satu dengan pengamatan kedua,
gunakan rumus pada persamaan 0.79
2. Hitung statistic dari data selisih antara kedua data, dengan rumus 0.82
3. Rumuskan Hipotesis yang akan diuji; H 0 : δ = 0
4. Hitung Nilai Statistik Uji, gunakan persamaan 0.81
5. Tentukan Nilai kritis, tn −1;( α 2 ) pada taraf signifikansi yang dipilih, α .

6. Keputusan; Tolak H 0 : δ = 0 jika t > tn −1;( α /2 )


Akan tetapi, ketika peneliti dapat mengontrol penetapan perlakuan
pada unit eksperimen, pasangan unit eksperimen yang tepat dan
penetapan pengacakan perlakuan dapat mempertinggi hasil analisis
statistic. Artinya, penetapan kelompok unit eksperimen yang identic
secara acak dari perlakuan 1 pada suatu unit dan perlakuan 2 pada
unit yang lain akan sangat membantu dalam mengeliminasi sumber
variasi yang tak terkontrol. Pengacakan yang saling independen harus
diterapkan pada setiap pasangan, berikut proses:
Rancangan eksperimen untuk Perbandingan Berpasangan

91
Untuk perbandingan berpasangan, d sebagai rata-rata selisih dan Sd
sebagai variansi selisih, dan karena itu T 2 dapat dihitung dari sampel
penuh statistik x merupakan vektor berukuran 2p × 1 dari rata-rata
sampel untuk p variabel pada kedua perlakuan, yaitu
x ′ =  x 11 , x 12 , ⋯ , x 1 p , x 21 , x 22 , ⋯ , x 2 p  (0.86)
Dan S merupakan matriks berukuran 2p × 2p dari variansi –kovariansi
sampel, susunannya
 S11 S12 
 
 ( p×p ) ( p×p ) 
S= (0.87)
 S21 S22 
 ( p×p ) ( p×p ) 

Dari persamaan 0.87, matriks S11 memuat variansi-kovariansi sampel


untuk p variabel pada perlakuan pertama. Cara yang sama untuk S22
demikian halnya dengan S12 dan S21 .

Rancangan matriks
1 0 ⋯ 0 −1 0 ⋯ 
0
 
0 1 ⋯ 0 0 −1 ⋯ 
0
C =   (0.88)
( p×2 p ) ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ 
0 0 ⋯ 1 0 0 ⋯ −1 
 

kolom ( p +1 )

Membandingkan Percobaan untuk Rancangan Pengukuran Berulang


Situasi dimana m perlakuan dibandingkan dengan satu variabel
respon. Setiap subjek atau unit eksperimen menerima setiap
perlakuan sekali sepanjang satu periode waktu.
Pengamatan ke- i adalah

92
 Xi 1 
 
X 

Xi =  i2 
 , i = 1,2, ⋯, m
 ⋮ 
X 
 im 
Dimana Xi1 merupakan respon pada perlakuan ke- i pada unit ke j .
Pengukuran berulang merupakan fakta bahwa semua perlakuan
dilakukan pada setiap unit.
Untuk tujuan perbandingan, perhatikan kontras komponen dari
µ = Ε ( Xi )

 µ1 − µ2   1 −1 0 ⋯ 0   µ1 
    
µ −µ   1 0 −1 ⋯ 0   µ2 
 1 3 
=  = C1µ
 ⋮  ⋮ ⋮ ⋮ ⋱ 0   ⋮ 
  
µ − µ  1 0 0 ⋯ −1   µm 
 1 m    
Atau
 µ2 − µ1   −1 1 0 ⋯ 0 0   µ1 
    
 µ −µ   0 −1 1 ⋯ 0 0   µ2 
 3 2 
=  = C2µ
 ⋮   ⋮ ⋮ ⋮ ⋱ 0 0   ⋮ 
  
µ − µ   0 0 0 ⋯ −11   µm 
 m m −1    
C1 dan C2 disebut matriks kontras, karena baris m − 1 independen
secara linear dan masing-masing adalah vektor kontras
Ketika rata-rata perlakuan adalah sama. Secara umum hipotesis
bahwa tidak ada perbedaan dalam perlakuan menjadi Cµ = 0 untuk
sembarang kontras.

93
Pengujian Kesamaan Perlakuan dalam Rancangan Pengukuran
Berulang
1. Sampel pengamatan dari populasi yang berasal dari distribusi normal,
N m ( µ , Σ ) , dan misalkan C merupakan matriks konstras. Dengan
n n
1 1
x= ∑
n i =1
xi dan S = ∑ ( xi − x )( xi − x )′
n − 1 i =1
(0.89)

2. Hipotesis H0 : Cµ = 0 lawan H1 : Cµ ≠ 0
3. Taraf Signifikansi, α
4. Statistika Uji
T 2 = n ( Cx )′ ( CSC ′ ) Cx
−1

5. Daerah Kepercayaan untuk kontras C µ dengan µ sebagai rata-rata


populasi, himpunan semua C µ , yaitu
n ( Cx − Cµ )′ ( CSC′ ) ( Cx − Cµ ) ≤ G
−1
(0.90)
( n − 1 )( m − 1 )
Dimana G = F ( α ) dan x dan S
( n − m + 1 ) m −1,n −m +1
sebagaimana yang didefinisikan pada persamaan 0.89.
6. Interval kepercayaan simultan 100 ( 1 − α ) % untuk satu kontras c′µ
untuk sembarang vektor kontras,
( n − 1 )( m − 1) c ′Sc
c ′µ : c ′ x ± F
( n − m + 1) m −1,n −m +1 n
0.91
7. Keputusan, Tolak H 0 jika
T 2 = n ( Cx )′ ( CSC′ ) Cx > G
−1
(0.92)
Untuk G sebagaimana pada persamaan 0.90.
dimana Fm − 1,n − m + 1 ( α ) merupakan persentil atas 100 ( 1 − α ) % dari
distribusi F dengan m − 1 dan n − m + 1 sebagai derajat bebas.
Contoh 6.1. Pengembangan bius (anestesi)
dikembangkan pertama kali untuk meneliti efeknya terhadap binatang.
Dalam satu penelitian, 19 anjing diberikan pentobarbital. Setiap anjing

94
selanjutnya di berikan carbon dioxide, CO2, pada setiap dua level.
Selanjutnya ditambahkan halothane (H), kemudian diberikan lagi CO2.
Respon, heartbeats (denyut jantung) permilisecond, diukur atau
terdapat empat kombinasi perlakuan:

Perlakuan 1 = CO2 tekanan tinggi tanpa H


Perlakuan 2 = CO2 tekanan rendah tanpa H
Perlakuan 3 = CO2 tekanan tinggi dengan H
Perlakuan 4 = CO2 tekanan rendah dengan H
Kita akan menganalisis efek anestesi dari tekanan CO2 Halothane dari
rancangan pengukuran berulang
Solusi 6.2. Terdapat 3 kontras perlakuan yang mungkin untuk
diperhatikan dalam percobaan ini. Misalkan µ1 , µ2 , µ3 , µ4 merupakan
rata-rata respon untuk perlakuan 1, perlakuan 2, perlakuan 3 dan
perlakuan 4 yang bersesuaian. Selanjutnya
 Kontras Halothane mewakili 
 
( µ3 + µ4 ) − ( µ1 + µ2 ) =  selisih antara ada dan tidak 
 
 adanya halothane 
 Kontras CO mewakili 
 2 
( µ1 + µ3 ) − ( µ2 + µ4 ) =  selisih antara tekanan 
 
 tinggi dan rendak 
 Kontras mewakili pengaruh 


( µ1 + µ4 ) − ( µ2 + µ3 ) =  halothane pada tekanan CO2 
 
 "interaksi" 

dengan µ ′ =  µ1 , µ2 , µ3 , µ 4  dengan matriks kontras C adalah

95
 −1 −1 1 1 

C =  1 −1 1 −1 

 1 −1 −1 1 
 

Tabel 6.2 Data Tidurnya Anjing


Anjing Perlakuan
1 2 3 4
1 426 609 556 600
2 253 236 392 395
3 359 433 349 357
4 432 431 522 600
5 405 426 513 513
6 324 438 507 539
7 310 312 410 456
8 326 326 350 504
9 375 447 547 548
10 286 286 403 422
11 349 382 473 497
12 429 410 488 547
13 348 377 447 514
14 412 473 472 446
15 347 326 455 468
16 434 458 637 524
17 364 367 432 469
18 320 395 508 531
19 397 556 645 625

Dari Table 6.2, diperoleh

96
 368.21 
 
 404.63 
x=    dan
479.26 
 
 502.89 
 
 2819.29 
 
 3568.42 7962.14 
S =  

 2943.49 5303.98 6851.32 
 2295.35 4065.44 4499.63 4878.99 
 
Dari matriks kontras dan nilai vektor rata-rata serta matrik variansi,
diperoleh
 209.31   9432.32 1098.92 927.62 
   
Cx =  −60.05  ; CSC′ =  1098.92 5195.84 914.54 
 
 −12.79   927.62 914.54 7557.44 
   
dan

T 2 = n ( Cx )′ ( CSC′ ) ( Cx ) = 10 ( 6.11 ) = 166


−1

Untuk α =0.05.
( n − 1 )( m − 1) 18 ( 3 )
Fm −1,n −m +1 ( α ) = F3,16 ( 0.05 )
( n − m + 1) 16
18 ( 3 )
= ( 3.24 )
16
= 10.94

Untuk T 2 = 116 > 10.94 , tolak H 0 : C µ = 0 (tidak ada efek perlakuan)


Untuk melihat apakah kontraks berkaitan dengan penolakan hipotesis
null, untuk mengetahui hal tersebut, berikut penjelasannya.
Konstruksi interval kepecayaan simultan pada taraf kepercayaan 95%
untuk keseluruhan kontras, Kontras

97
c1′ µ = ( µ3 + µ4 ) − ( µ1 + µ2 ) = Pengaruh halothane

Diestimasi dengan interval


18 ( 3 ) c1′ Sc1
( x 3 + x 4 ) − ( x1 + x 2 ) ± F3,16 ( 0.05 )
16 19
9432.32
= 209.31 ± 10.94
19
= 209.31 ± 73.70
Dimana c1′ adalah baris pertama dari matriks C . Dengan cara yang
sama untuk kontras yang lain diestimasi dengan
( µ1 + µ3 ) − ( µ2 + µ4 ) = Pengaruh halothane CO 2

Diestimasi dengan interval

5195.84
−60.05 ± 10.94 = −60.05 ± 54.70
19
( µ1 + µ4 ) − ( µ2 + µ3 ) = Interaksi H-CO 2

Diestimasi dengan interval

7557.44
−12.79 ± 10.94 = −12.79 ± 65.97
19
Interval kepercayaan pertama, menyatakan ada efek halothane

2. Membandingkan Vektor Rata-Rata Dua Populasi


Statistic-T 2 untuk menguji kesamaan vektor rata-rata dari dua
populasi multivariate dapat dikembangkan dari prosedur univariat.
Statistik-T 2 tepat untuk membandingkan respon dari satu himpunan
perlakuan (populasi 1) dengan repson lain yan independen (populasi
2). Perbandingan dapat dibuat tanpa secara eksplisit mengontrol
variabilitas unit-ke-unit, sebagaimana kasus perbandingan
berpasangan.

98
Perhatikan sampel acak beukuran n1 dari populasi 1 dan sampel acak
berukuran n 2 dari populasi 2. Pengamatan pada p variabel disusun
sebagai berikut
Sampel Ringkasan Statisik
Populasi 1 1 1
n
1
n
( x1j − x1 )( x1j − x1 )′
1

x11 , x12 , ⋯ x1n


1
x1 = ∑
n1 j =1
x1 j S1 = ∑
n1 − 1 j =1
Populasi 2 1
n1
1
n
( x2 j − x2 )( x2 j − x2 )′
1

x11 , x12 , ⋯ x1n x2 =


n2
∑ x2 j S2 = ∑
n2 − 1 j =1
2
j =1

Akan dibuat inferensi seputar


( vektor rata-rata Pop 1 ) − ( vektor rata-rata Pop 2 ) = µ1 − µ 2

Asumsi berkenaan dengan Struktur Data


1. Sampel X11 , X12 , ⋯ X1n1 adalah sampel acak berukuran n1 dari
populasi p variabel dengan vektor rata-rata µ1 dan matriks
kovariansi Σ1 .

2. Sampel X11 , X12 , ⋯ X1n2 adalah sampel acak berukuran n 2 dari


populasi p variabel dengan vektor rata-rata µ2 dan matriks
kovariansi Σ2 .
3. X11 , X12 , ⋯ X1n dan X11 , X12 , ⋯ X1n independen
1 2

Asumsi Ketika dan Kecil


1. Kedua populasi berdistribusi normal multivariate
2. Σ1 = Σ2

Asumsi kedua, bahwa Σ1 = Σ2 , harus lebih kuat dibanding univariat.


Asumsikan pula bahwa beberapa pasangan variansi dan kovariansi
sangat dekat kesamaannya.

99
n1
Ketika Σ1 = Σ2 = Σ , ∑ ( x1j − x1 )( x1j − x1 )′ adalah estimasi dari
j =1
n2
( n1 − 1 )Σ dan ∑ ( x2 j − x2 )( x2 j − x2 )′ merupakan estimasi dari
j =1

(n2 − 1)Σ . Akibatnya, kita dapat menyatukan (pool) informasi dalam


kedua sampel dalam rangka mengestimasi kovariansi umum Σ .
perhitungannya
n1 n1

∑ ( x1j − x1 )( x1 j − x1 )′ + ∑ ( x2 j − x2 )( x2 j − x2 )′
j =1 j =1
Sp =
n1 + n2 − 2

n1 − 1 n2 − 1
= S1 + S2 (0.93)
n1 + n2 − 2 n1 + n2 − 2
n
Karena ∑ ( x1j − x1 )( x1j − x1 )′ mempunyai derajat bebas n 1 − 1 dan
j =1
n

∑ ( x2 j − x2 )( x2 j − x2 )′ dengan derajat bebas n 2 − 1 . Pembagi pada


j =1

persaman 0.93 diperoleh dari kombinasi dua derajat bebas.


Untuk menguji hipotesis bahwa µ1 − µ2 = δ0 ,

karena asumsinya adalah independen, maka cov ( X 1 , X 2 ) = 0 ,


akibatnya

cov ( X1 − X2 ) = cov ( X1 ) + cov ( X2 )


1 1
= Σ+ Σ (0.94)
n1 n2
1 1 
=  +  Σ
 n1 n2 

100
Karena S p estimasi dari Σ , nampak bahwa

1  1 
 + 1  S merupakan estimasi dari  + 1  Σ
 n  p  n 
1 n2  1 n2 
Uji likelihood ratio dari
H 0 : µ1 − µ2 = δ0

Didasarkan pada kuadrat statistic jarak, T 2 . Tolak H 0 jika

 1  −1
T 2 = ( x1 − x2 − δ0 )′   + 1  S  ( x − x − δ ) > c 2
  n  p 1 2 0
 1 n2  
0.95
Dimana jarak kritis c2 ditentukan dari distribusi dua-sampel statistic-
T2 .
Teorema 6.1
Jika X11 , X12 , ⋯, X1n1 merupakan sampel acak berukuran n1 dari
populasi berdistribusi normal, N p ( µ1 , Σ ) dan sampel acak berukuran
n2 yaitu, X21 , X22 , ⋯, X2n1 , independen dari populasi berdistrusi
N p ( µ 2 , Σ ) , maka

 1   −1
T 2 = ( x1 − x2 − δ0 )′   + 1  S  ( x − x − δ )
  n p
 1 n2  
1 2 0

berdistribusi
( n1 + n2 − 2 ) p
Fp,n
( n1 + n2 − p − 1 ) 1 + n2 − p −1

akibatnya

101
−1
 1 1 
( x1 − x2 − ( µ1 − µ2 ) )′   +  Sp 

  n1 n2   (0.96)
( x1 − x2 − ( µ1 − µ2 ) ≤ c2 ) = 1 − α
dimana
( n1 + n 2 − 2 ) p
c2 = Fp,n (α )
( n1 + n2 − p − 1 ) 1 + n 2 − p −1
.

Contoh 6.3. (Mengkonstruksi Daerah Kepercayaan untuk selisih


dua vektor rata-rata.).
50 buah sabungan batangan dibuat dengan dua cara. Dua
karakteristik, X1 = busa dan X 2 = kelembutan. Ringkasan statistic
untuk batang dihasilkan dengan metode 1 dan metode 2 adalah
 8.3  2 1
x1 =  ,
 S1 =  

 4.1   1 6 
 10.2  2 1
x2 =  ,
 S2 =  
 3.9  1 4 
 
Menghasil suatu daerah kepercayaan 95% untuk µ1 − µ2 .

Pertama, perhatikan bahwa S1 dan S2 hampir sama, sehingga cukup


beralasan untuk digabungkan. Karena itu,
49 49 2 1
Sp = S1 + S2  
98 98 1 5
 
Demikian halnya
 −1.9 
x1 − x2 =  

 0.2 

102
Sehingga daerah kepercayaan adalah terpusat pada [-1.9, 0.2]’. Nilai
eigen dan vektor eigen dari S p diperoleh dari persamaan

2−λ 1
0 = Sp − λ I = = λ 2 − 7λ + 9
1 5−λ

Sehingga, λ = ( 7 ± 49 − 36 ) 2 . Akibatanya, λ1 =5.303 dan λ2


=1.697, dan vektor eigen yang bersesuaian, e1 dan e2 ditentukan dari

S p e i = λi e i , i = 1,2

adalah
 0.290   0.957 
e1 =   dan e = 
 2

 −0.290 
 0.957   

 + 1 c 2 =  1 + 1  ( 98 )( 2 ) F ( 0.05 ) = 0.25


1 

 n
1 n2   50 50  ( 97 ) 2,97

Karena F2,97 ( 0.05 ) = 3.1 , daerah kepercayaan diperluas

1 1
λi  + c2 = λi 0.25
 n1 n2 

103
Unit sepanjang eigen vektor ei . atau 1.15 unit dalam arah e1 dan 0.65
unit dalam arah e2 .

Interval Kepercayaan Simultan


Dimungkinkan untuk menurunkan interval kepercayaan simultan
untuk komponen dari vektor µ1 − µ2 . Interval kepercayaan tersebut
dikembangkan dari mempertimbangk seluruh kombinasi linear dari
perbedaan dalam vektor rata-rata. Asumsinya adalah populasi
multivariate berasan dari populasi yang berdistribusi normal dengan
kovariansi umum Σ .
Teorema 6.2
Misalkan
c 2 =  ( n1 + n2 − 2 ) p ( n1 + n2 − p − 1 )  Fp,n +n − p −1 ( α )
 1 2

dengan peluang 1 − α .
1 1
a ′ ( X1 − X2 ) ± c a ′  +  Sp a
 n1 n2 

Akan meliputi a ′ ( µ1 − µ2 ) untuk semua a . Untuk suatu ( µ1 j − µ2i )


akan meliputi
1 1
( X1 j − X2 j ) ± c  +  Si1.p untuk j = 1,2, ⋯, p
 n1 n2 

Keadaan Dua Sampel Ketika Σ1 ≠ Σ2


Untuk kasus dimana Σ1 ≠ Σ2 , sulit untuk mendapatkan ukuran
“jarak” seperti T 2 , yang distribusinya tidak bergantung pada Σ1 , Σ2
yang tidak diketahui. Uji Bartlet digunakan untuk menguji kesamaan
dari Σ1 dan Σ2 dalam model variasi yang umum. Hal yang kurang
menguntungkan adalah ketika populasinya bukan dari distribusi

104
normal. Distribusi yang tidak normal dan kovariansi yang tidak sama
tidak dapat dipisahkan dengan uji Bartlet.
Suatu metode pengujian kesamaan dua matriks kovariansi yang
kurang sensitive terhadap asumsi normal multivariate telah
dikemukakan oleh Tiku dan Balakrisnan.
Teorema 6.3.
Misalkan sampel berukuran n1 − p dan n2 − p besar. Lalu, suatu
ellipsoid kepercayaan dengan pendekatan 100 ( 1 − α ) % untuk
µ1 − µ 2 memenuhi

1  −1
 x1 − x2 − ( µ1 − µ2 )  ′  S + 1 S 
  n 1 n 2 
 1 2 
 x1 − x2 − ( µ1 − µ2 )  ≤ χp2 ( α )
 
Dimana χp2 ( α ) adalah persentil ke- ( 100α ) dari distribusi chi-kuadrat
dengan derajat bebas p .
Demikian halnya interval kepercayaan simultan 100 ( 1 − α ) % untuk
semua kombinasi linear a ′ ( µ1 − µ2 ) diberikan oleh

a ′ ( µ1 − µ 2 ) dibawah
1 1 
a ′ ( x1 − x2 ) ± χp2 ( α ) a ′  S1 + S2  a
 n1 n2 

Contoh 6.4. (Prosedur inferensi tentang selisih dalam rata-rata)


Kita akan menganalisis data konsumsi litrik. Pertama hitung

1 1 1  13825.3 23823.4  1  8632.0 19616.7 


S1 + S2 = + 
n1 n2 45  23823.4 73107.4  55  19616.7 55964.5 
 
 464.17 886.08 
=  

886.08 2642.15
 

105
Interval kepercayaan simultan 96% untuk kombinasi linear
 µ − µ21 
a ′ ( µ1 − µ2 ) =  1, 0   11  = µ −µ

 µ12 − µ22 
11 21

dan
 µ − µ21 
a ′ ( µ1 − µ2 ) =  0,1   11  = µ −µ

µ − µ 12 22
 12 22 
adalah

µ11 − µ21 : 74.4 ± 5.99 464.17 atau ( 21.7,127.1)


µ12 − µ22 : 201.6 ± 5.99 2642.15 atau ( 75.8, 327.4 )
Untuk menguji hipotesis H 0 : µ1 − µ 2 = 0 gunakan statistic-T 2 ,
yaitu
 1  −1
T =  x1 − x2  ′
2  S1 + 1 S2   x1 − x2 
n
 1 n1   
 204.4 − 130.0  ′  464.17 886.08   204.4 − 130.0 
− 1

=   
 
 
 


 556.6 − 355.0   886.08 2642.15   556.6 − 355.0 
 59.874 −20.080   74.4 
=  74.4 201.6  ( 10−4 )  
 

 
 −10.080 10.519   201.6 
= 15.66
χp2 ( 0.05 ) = 5.99
Untuk α =0.05, nilai kritisanya adalah dan
T 2
= 15.66 > χ22 ( 0.05 ) = 5.99 , Keputusannya tolak H0

Untuk memudahkan pemahaman, perhatikan contoh berikut:

106
2
Contoh 6.5 (Aproksimasi Distribusi T untuk Σ 1 ≠ Σ 2 )
Diberikan berapa nilai statistic dari suatu data sampel, aproksimasi
distribusi T 2 untuk kasus matriks kovariansi tidak sama.
Pertama,
1 1  13825.2 23825.4   307.227 529.409 
S1 =   =  

n1 45  23823.4 73107.4  
529.409 1624.609 

1 1  8632.0 19616.6   156.945 356.667 


 
S2 = =
n2 55  19616.7 55964.5   356.667 1017.536 
 
dan
1  −1  59.874 −20.080 
 S1 + 1 S2  = ( 10−4 )  
n n2   −10.080 10.519 
 1  
akibatnya

1  1 1  −1  307.227 529.409   59.874 −20.080 


S1  S1 + S2  =   ( 10−4 )  
n1  n1 n2    −20.080 10.519 
 529.409 1624.609   
 0.776 −20.060 
=  
 −0.092 0.646 

dan
2
  1  − 1   0.776 − 20.060   0.776 − 20.060 
 1 1
 S1  S1 + S 2   =    
 n 1
 
 
 − 0.092 0.646   − 0.092 0.646 
 n1 n2    
 0.608 − 0.085 
=  
− 0.131 0.423 
 
Demikian halnya dengan
1  1 1 −1  156.945 356.667   59.874 − 20.080 
S1  S1 + S2  =   ( 10 − 4 )  
n  356.667 1017.536   − 20.080 10.519 
n2  1 n 2     
 0.224 − 0.060 

=  
0.092 0.354 
 

107
dan
2
  1  − 1   0.224 − 0.060   0.224 − 0.060 
 1 1

 S1  S1 + S2  
 =  



 
 n 2  n1 n2    0.092 0.354   0.092 0.354 
 0.055 0.035 
=  

 0.053 0.131 
selanjutnya
   2  2  
1    1  1 1 −1  
   1  1 1 −1   
tr  S1  S1 + 
S2    + tr  S1  S1 + S2     
n1     n1  n1 n2      n1  n1 n2    
     
1
= {( 0.608 + 0.423 ) + ( 0.776 + 0.646 )} = 0.0678
45
   2  2  
1    1  1 1 −1  
   1  1 1 −1   

tr  S1  S1 +     
S2   + tr  S1  S1 + S2      
n2   n  n1 n2    
  n1  n1 n2    
   1    
1
= {( 0.055 + 0.131) + ( 0.224 + 0.354 ) } = 0.009
55
Estimasi derajat bebas v adalah
2 + 22
v = = 77.6
0.0678 + 0.0095
Dan nilai kritis untuk α = 0.05 adalah
vp 77.6 × 2
Fp,v − p +1 ( 0.05 ) = F ( 0.05 )
v −p +1 77.6 − 2 + 1 2,77.6−2 +1
155.2
= 3.12 = 6.32
76.6
Nilai statistic T 2 dari data hasil pengamatan adalah 15.66 sehingga
hipotesis ditolak pada level 5%

108
3. Membandingkan Beberapa Rata-Rata Populasi Multivariat
(Manova-Satu Arah)
Kenyataan dari kebanyakan penelitian lebih sering kita
membandingkan lebih dari dua populasi. Sample acak yang
dikumpulkan dari setiap h populasi, disusun sebagai berikut
Populasi 1: x11, x12 , ⋯, x1n
1
Populasi 2: x11, x12 , ⋯, x1n
2
(0.97)
⋮ ⋮
Populasi h: xh 1, xh 2 , ⋯, xhn
h

Manova digunakan untuk menyelidiki apakah vetkor rata-rata populasi


sama atau tidak, jika tidak, komponen rata-rata yang sama yang
berbeda secara signifikan
Asumsi Terkait Struktur Data untuk Manova Satu-Arah
1. xl 1, xl 2 , ⋯, xl nl merupakan sampel acak berukuran nl dari suatu
populasi dengan µl ; l = 1,2, ⋯, h
2. Semua populasi mempunyai matriks kovarians Σ .
3. Setiap populasi merupakan normal multivariate
Asumsi ketiga dapat dikaitkan dengan teorema limit memusat ketika
ukuran sampel cukup besar.
Untuk memudahkan pemahaman, berikut akan dijelaskan analisis
variansi (Anova) yang berkaitan dengan analisis univariat
Ringkasan ANOVA Univariat
Asumsi dalam kasus univariat
1. x i 1 , x i 2 , ⋯, x i n sampel acak dari populasi yang berdisitrubi
i

normal, N ( µi , σ ) berukuran.
2. Sampel acak saling independen.
Meskipun hipotesis nol dari kesamaan rata-rata dapat dituliskan
sebagai µ1 = µ2 = ⋯ = µh , hal tersebut biasanya berkenaan dengan
µi sebagai jumlah dari semua komponen rata-rata, seperti µ dan

109
suatu komponen berkaitan dengan populasi tertentu. Sebagai contoh,
kita dapat menuliskan µi = µ + ( µi − µ ) atau µi = µ + τi dimana
τi = µi − µ .

Populasi biasanya berkaitan pada himpunan berbeda dari kondisi


eksperimen, dan oleh karena itu tepat untuk melakukan investigasi
deviasi τi yang berkaitan dengan populasi ke- i (perlakuan).

µi = µ + τi (0.98)
 Rata-rata 
 Rata-rata   
 Efek perlakuan 
 populasi ke-i   keseluruhan  
 populasi ke-i 

Hipotesis nol adalah


H 0 : τ1 = τ 2 = ⋯ = τ h = 0

Respon x lj , berdistribusi N ( µ + τi , σ 2 ) , dapat dituliskan dalam


bentuk
y ij = µ + τ i + εij (0.99)

Dimana y ij variabel respon, µ rata-rata keseluruh, τi efek perlakuan


dan εij ∼ NID ( 0, σ 2 ) variabel acak. Untuk mendefinisikan secara unik
parameter dan estimasi kuadrat terkecilnya, konstrain
h
∑ n i τi =0
i =1

Dekomposisi dari persamaan 0.99, analisis variansi didasarkan pada


data pengamatan,
x ij = x + ( x i − x ) + ( x ij − xi ) (0.100)
Dimana x adalah estimator dari µ , τˆi = ( x i − x ) estimator dari τi ,
dan ( x ij − x i ) estimator dari εij .

Dekomposisi jumlah kuadrat dijelaskan sebagai berikut, perkurangkan


kedua sisi dengan x dan ambil kuadrat dari persamaan (0.100)

110
( xij − x ) = ( x + ( x i − x ) + ( x ij − x i ) − x )
2 2

( xij − x ) = ( ( x i − x ) + ( x ij − x i ) )
2 2

( xij − x ) = ( x i − x ) + ( x ij − x i ) + 2 ( x i − x ) ( x ij − x i )
2 2 2

Ambil jumlah dari persamaan terakhir untuk i ,

∑ {( xi − x ) }
j n

∑ ( x ij ) + ( x ij − x i ) + 2 ( x i − x ) ( x ij − x i )
2 2 2
−x =
i =1 i =1
n n n
+∑ ( x ij − x i ) + ∑ 2 ( x i − x )( x ij − xi )
2
∑ ( xi − x )
2
=
i =1 i =1 i =1
n

∑ ( x ij − x i ) +n ( x i − x )
2 2
=
i =1

Lalu ambil jumlahan dari persamaan terakhir di atas j


m m
∑ ( xij −x ) = ∑ ( xij − xi )
2 2
+m ( xi − x )
2

j =1 j =1
n m n m n
∑ ∑ ( xij − x ) ∑ ∑ ( xij − xi ) +∑ m ( xi − x )
2 2 2
=
i =1 j =1 i =1 j =1 i =n

Persaman terakhir merupakan jumlah kuadrat


n m n m n

∑ ∑ ( xij − x ) ∑ ∑ ( xij − xi ) +∑ m ( xi − x )
2 2 2
= (0.101)
i =1 j =1 i =1 j =1 i =n

Dimana
n m

∑ ∑ ( xij − x )
2
adalah jumlah kuadrat total terkoreksi,
i =1 j =1
n m

∑∑ ( xij − xi )
2
adalah jumlah kuadrat perlakuan, jumlah kuadrat
i =1 j =1

antara sampel (SS Between)

111
n

∑ m ( xi − x )
2
adalah jumlah kuadrat respon (jumlah kuadrat antara
i =1
responde ( SS Within)
Atau
n m

∑ ∑ x ij2 = ( n1 + n2 + ⋯ + nn ) x 2 +
i =1 j =1
n n m
(0.102)
∑ ni ( x i − x ) +∑ ∑ ( x ij − x i )
2 2

i =1 i =1 j =1

Contoh 6.5 (dekomposisi Jumlah kuadrat untuk ANOVA


univariat)
Perhatikan sampel independen berikut:
Populas 1 : 9, 6, 9
Populasi 2 : 0, 2
Populasi 3 : 3, 1, 2
Karena itu, statistic dari setiap sampel untuk setiap populasi dapat
dihitung yang hasilnya sebagai berikut:

3 +1+2 (9 + 6 + 9 + 0 + 2 + 3 + 1 + 3)
x3 = = 2 dan x = =4
3 8
Diperoleh bahwa
3 = x 31 = x + ( x 3 − x ) + ( x 31 − x 3 )
= 4 + (2 − 4 ) + ( 3 − 2)
= 4 + ( −2 ) + 1

1 = x 32 = x + ( x 3 − x ) + ( x 32 − x 3 )
= 4 + ( 2 − 4 ) + (1 − 2 )
= 4 + ( −2 ) + ( −1 )

112
2 = x 33 = x + ( x 3 − x ) + ( x 33 − x 3 )
= 4 + (2 − 4) + (2 − 2)
= 4 + ( −2 ) + 0

dan

9+6+9 (9 + 6 + 9 + 0 + 2 + 3 + 1 + 3)
x1 = = 8 dan x = =4
3 8

0+2 (9 + 6 + 9 + 0 + 2 + 3 + 1 + 3)
x2 = = 1 dan x = =4
2 8
Lakukan hal yang sama untuk setiap pengamatan sebagaimana pada
populasi 3. Dengan menerapkanny pada persamaan (0.100), diperoleh
array
x ij = x + ( x i − x ) + ( x ij − xi )
9 6 9 4 4 4  4 4 4   1 −2 1 
    
0 2  = 4 4  +  −3 −3  +  −1 1 
       
3 1 2  4 4 4   −2 −2 −2   1 −1 0 
       
Pengamatan = Rata-Rata + Efek Perlakuan+ Residual
( x ij ) (x ) ( xi −x ) ( xij −xi )

Pertanyaan akan kesamaan dari rata-rata terjawab dengan menilai


apakah kontribusi dari array perlakuan relative besar terhadap residual
atau tidak. Estimasi
g
τˆi = ( x i − x ) dari τi selalu memenuhi ∑ ni τˆi = 0.
i =1

Dibawah hipotesis H 0 setiap τˆi selalu nol.

Jika kontribusi perlakuan besar, H 0 harus ditolak. Ukuran dari suatu


array merupakan besar dengan menyusun baris dari array ke dalam
bentuk vektor dan menghitung panjang kuadrat. Besaran tersebut
disebut dengan jumlah kuadrat (JK). Untuk pengamatan, kita kontruksi

113
vektor y ′ =  9, 6, 9, 0, 2, 3, 1, 2  . Panjang kuadratnya adalah
JK pmngt = 92 + 62 + 92 + 02 + 22 + 32 + 12 + 22 = 216

Dengan cara yang sama untuk,

JK rt = 42 + 42 + 42 + 42 + 42 + 42 + 42 + 42 = 8 ( 42 ) = 128

SS prlk = 42 + 42 + 42 + ( −3 ) + ( −3 ) + ( −2 ) + ( −2 ) + ( −2 ) 2
2 2 2 2

= 3 ( 42 ) + 2 ( −3 ) + 3 ( −2 ) = 78
2 2

Dan jumlah kuadrat residual (JKR)

SS JKR = 12 + ( − 2 ) + 12 + ( − 1 ) + 12 + 12 + ( − 1 ) + 02 = 10
2 2 2

Jumlah kuadrat memenuhi beberapa dekomposisi, (0.100), sebagai


pengamatan, akibatnya
SS pmngt = SS rt + SS tr + SS res

Atau 216=128+78+10. Pecah menjadi jumlah kuadrat dalam


komponene rata-rata, perlakuan dan residual. Suatu analisi variansi
dihasilkan dengan membandingkan ukuran relative dari SS tr dan SS res
. Jika H 0 benar, hitung variansi dari SS tr dan SS res harusnya di
perkirakan sama.

Dari persamaan (0.102), menjelaskan kepada kita bahwa array


merepresentasikan rata-rata, efek perlakuan, dan residual adalah
orthogonal. Array-array tersebut, merupakan sebuah vektor
pengamatan, y ′ =  x 11, ⋯ , x1n1 , x 21, ⋯ , x nmn  yang tegak lurus.
Akibatnya,
SS pmngt − S rt − SS tr = SS res

114
Sebagai ringkasannya, kita punya derajat bebas untuk JK rata-rata
adalah 1, JK perlakuan derajat bebasnya adalah n-1, JK untuk residual
adalah m-n. jumlah derajat bebas secara keseluruhan adalah n.
Menghitung jumlah kuadrat dan derajat bebas yang berkaitan setiap
jumlah kuadrat tersebut diterangkan dalam table berikut:
Tabel ANOVA untuk membandingkan Rara-rata populasi Univariat
Sumber variasi Jumlah Kuadrat df
Perlakuan n n −1
∑ ni ( x i − x )
2
SStr =
i =1
Residual n m n

∑ ∑ ( xij − xi ) ∑ ni − n
2
SStr =
i =1 j =1 i =1

Total n m n

∑ ∑ ( xij − xi ) ∑ ni − 1
2
SStot =
i =1 j =1 i =1

Statistik uji yang digunakan adalah Uji-F


 

 SS   
 
 

S S res 
F =  tr
 
 ( n − 1 )   n



∑ n i − g 
i=1

Dengan taraf signifikansi α . Tolak H 0 jika

Fhit > Fn −1, ∑ n


i −n (α )
Dimana, Fn −1, ∑ ni −n ( α ) merupakan persentil ke- ( 100α ) dari uji-F
dengan n − 1 dan ∑ ni −n sebagai derajat bebas. Hal tersebut sama
dengan menolak H 0 untuk nilai SStr SS res yang besar atau nilai
1 − SS tr SS res yang besar. Statistik yang tepat untuk multivariate
umum menolak H 0 untuk nilai kecil dari perbandigan

1 Sres
= (0.103)
1 + SStr SSres SS res + SStr

115
Contoh 6.6 (Table Anova Univariat dan Uji –F untuk Efek
Perlakuan)
Gunakan nilai dan informasi pada contoh 6.5, Kita punya table ANOVA:
Sumber Variasi Jumlah Kuadrat Derajat Bebas
Perlakuan SS tr = 78 n − 1 = 3-1 =2
Residual SS res = 10 n

∑ ni − n = (3 + 2 + 3) -3 = 5
i =1

Total SStot =88 n

∑ ni − 1 = (3 + 2 + 3) -1 = 7
i =1

Akibatnya,
SStr ( n − 1) 78 2
F = = = 19.5
SSres ( ∑ ni − n ) 10 5

Karena, F = 19.5 > F2,5 (0.01) = 13.27, tolak H 0 : τ1 = τ 2 = τ 3 = 0


(tidak ada efek perlakuan) pada taraf signifikansi 0.01.

a. Multivariat Analisis Variansi (MANOVA)


Sejalanan dengan reparameterisasi untuk kasus univariat, model
MANOVA dapat ditentukan dengan mengunakan hal tersebut:
Sampel
1 2 3 ⋯ k
x 11 x 21 x 31 ⋯ xk1
x 12 x 21 x 32 ⋯ xk2
⋮ ⋮ ⋮ ⋮
x 1n x 2n x 3n ⋯ x kn
Total x 1. x 2. x 3. ⋯ xk.
Rata-rata x 1. x 2. x 3. ⋯ xk.

116
n
Total Sampel ke- i : yi. = ∑ x ij
j =1

k n
Total Keseluruh : x.. = ∑ ∑ x ij
i =1 j =1

xi .
Rata-rata sample ke- i : xi . =
n.
x ..
Rata-rata Keseluruhan: xij =
kn
Model Manova untuk Membandingkan Vektor Rata-Rata Populasi
X ij = µ + τ i + εij ; j = 1, 2, ⋯, m dan i = 1, 2, ⋯, n 0.104
Dimana variabel εij ∼ NID p (0, Σ) . Parameter vektor µ merupakan
n
rata-rata total, τ i merupakan efek perlakuan ke- i dengan ∑ ni τ i =0
i =1
.
Dalam model variabel ke- p dalam X ij menjadi

 x ij 1   µ1   τi1   εij 1 
       
 x   µ   τ   ε 
 ij 2  =  2  +  i 2  +  ij 2 
 ⋮   ⋮   ⋮   ⋮ 
       
 xijp   µp   τip   εijp 

Sehingga model untuk variabel ke- r dalam setiap vektor yij adalah

y ijr = µr + τ ir + εijr

Perhatikan model pada persamaan 0.104, setiap komponen dari


vektor pengamatan, X ij sesuai dengan model univariat pada
persamaan 0.99. Error untuk komponen X ij adalah saling berkorelasi,
tapi matriks kovariansi Σ adalah sama untuk semua populasi.

117
Vektor pengamatan dimungkin untuk didekomposisi dengan model.
yaitu
x ij = x + ( x i − x ) + ( x ij − xi ) (0.105)
Dimana xij merupakan vektor pengamatan ke- i untuk perlakuan ke- j
, x estimator rata-rata total sampel, xi − x adalah estimator dari τ ,
dan xij − xi merupakan estimator dari parameter residual.

Dekomposisi dari persamaan (0.105) sama dengan kasus univariat.


Pertama, perhatikan hasil kali

( xij − x )( xij − x )′

Dapat dituliskan sebagai

( xij − x )( xij − x )′ = ( xij − xi + xi − x )( xij − xi + xi − x )′


=  ( xij − xi ) + ( xi − x )   ( xij − xi ) + ( xi − x )  ′
= ( xij − xi )( xij − xi )′ + ( xij − xi ) ( xi − x )′
+ ( xi − x ) ( xij − xi )′ + ( xi − x )( xi − x )′

Ambil jumlahan dari kedua ruas dari persamaan diatas,


n m n m

∑ ∑ ( xij − x )( xij − x )′ = ∑ ∑ ( xij − xi )( xij − xi )′


i =1 j =1 i =1 j =1
n m
+∑ ∑ ( xij − xi ) ( xi − x )′
i =1 j =1
n m
+∑ ∑ ( xi − x ) ( xij − xi )′
i =1 j =1
n m
+∑ ∑ ( xi − x )( xi − x )′
i =1 j =1

m
Karena ∑ ( xij − xi ) = 0 , maka
j =1

118
n m n m

∑ ∑ ( xij − x )( xij − x )′ = ∑ ∑ ( xij − xi )( xij − xi )′


i =1 j =1 i =1 j =1
n m
+∑ ∑ ( xi − x )( xi − x )′
i =1 j =1

n m n

∑ ∑ ( xij − x )( xij − x )′ = ∑ m ( xi − x )( xi − x )′
i =1 j =1 i =1
n m
(0.106)
+∑ ∑ ( xij − xi )( xij − xi )′
i =1 j =1

dimana
n m

∑ ∑ ( xij − x )( xij − x )′ merupakan jumlah kuadrat total dan hasil


i =1 j =1
kali
n

∑ m ( xi − x )( xi − x )′ merupakan jumlah kuadrat perlakuan dan hasil


i =1
kali (Between)
n m

∑ ∑ ( xij − xi )( xij − xi )′ merupakan jumlah kuadrat residual (within)


i =1 j =1

Matriks Jumlah kuadrat residual (within) dapat dituliskan sebagai


n m
W = ∑ ∑ ( x ij − xi )( x i j − x i )′ (0.107)
i=1 j=1
= (n 1 − 1 )S1 + (n 2 − 1 )S2 + ⋯ + (n n − 1 )Sn

Dimana Sn matriks kovariansi sampel untuk sampel ke i .

Uji Wilk
Hipotesis yang akan diuji adalah, hipotesis yang berkaitan dengan
tidak ada efek perlakuan, dirumus sebagai berikut
H 0 : τ1 = τ 2 = ⋯ = τ n = 0

119
Diuji dengan mempertimbangkan ukuran relative perlakuan dan
jumlah kuadrat residual dan hasilkali silang. Secara formal, ringkasan
perhitungan uji statistic dalam table MANOVA.
Tabel Manova untuk membandingkan Vektor rata-rata populasi.
Sumber Matriks Jumlah Kuadrat dan Derajat
Variansi Hasil Kali Silang (SSP) bebas
Perlakua n n −1
n B= ∑ m ( xi − x )( xi − x )′
i =1
Residual n m n
W= ∑ ∑ ( xij − xi )( xij − xi )′ ∑ ni − n
i =1 j =1 i =1

Total n m n
B+W = ∑ ∑ ( xij − x )( xij − x )′ ∑ ni − 1
i =1 j =1 i =1

Tolak H 0 jika rasio dari variansi umum terlalu kecil,


n m

W
∑ ∑ ( xij − xi )( xij − xi )′
i =1 j =1
Γ= = (0.108)
B+W n m

∑ ∑ ( xij − x )( xij − x )′
i =1 j =1

Persamaan (0.108), dikemukakan pertama kalinya oleh Wilks.,


berkaitan dengan bentuk persamaan (0.103) uji-F dari uji H 0 : tidak
ada efek perlakuan dalam kasus univariat. Lambda Wilk mempunyai
sifat yang mirip dengan kriteria rasio likelihood. Distribusi eksak dari Γ
dapat diturunkan untuk kasus khusus yang ditampilkan dalam table
berikut. Untuk kasus lain, sampel berukuran besar, sebagai modifikasi
dari Γ , gunakan bartlet dapat digunakan untuk menguji H 0 .

120
Tabel 6.1 Distribusi Lambda Wilk
Jumlah Variabel Jumlah Group Distribusi sampel untuk data multivariate
p=1 n ≥2  ∑ ni − n   1 − Γ 
    ∼ Fn −1, ∑ n −n
 n − 1   Γ  i

 ∑ ni − n − 1   1 − Γ  ∼ F
p=2 n ≥2   
 
   2( n −1),1( ∑ ni −n −1)
 n −1  Γ 
p ≥1 n =2  ∑ ni − p − 1   1 − Γ 
    ∼ Fp, ∑ n −p−1
 p  Γ  i

p ≥1 n =3  ∑ ni − p − 1   1 − Γ 
 
  
  ∼ F2p,2( ∑ ni −p −2 )
 p  Γ 

Bartlet Menunjukkan bahwa jika H 0 benar dan ∑ ni = n besar,


 ( p + n )   ( p + n )   W 
−  n − 1 − 
 ln Γ = −  n − 1 −  ln   (0.109)
 2   2   B + W 

Mempunyai disitrbusi chi-square dengan derajat bebas p ( n − 1 ) .


Akibatnya, untuk ∑ n i = n besar, tolak H 0 pada level signifikansi

 ( p + n )   W 
−  n − 1 −  ln   > χp ( n −1) ( α )
2
 2   B + W 
0.110
Dimana χp2( n −1) ( α ) adalah persentil ke- ( 100α ) dari distribusi chi-
kuadrat dengan derajat bebas p ( n − 1 ) .

Contoh 6.6 (Table Manova dan Lambda Wilks untuk Menguji


Kesamaan Tiga Vektor Rata-Rata)
Andaikan bahwa suatu variabel tambahan telah diamati bersama
dengan variabel yang ditampilkan pada contoh 6.4 Ukuran sampelnya

121
adalah n 1 = 3 n2 = 2, n 3 = 3. Susun pasangan hasil pengamatan X ij
dalam bentuk baris, diperoleh
 9     
  6   9 

   2   7 

8 1 2 4
  3   
 
 dengan x1 =   , x2 =   ; x3 =   ; x4 =  

  
0  2 
  
 4   2   8   5 
  4    
  0  
  3   1   2 
      
8     7 


  9  

Pada contoh sebelumnya kita telah menghitung jumlah total rata-rata,


efek perlakuan, dan residual dari univariat ANOVA. Yaitu
9 6 9 4 4 4  4 4 4   1 −2 1 
    
0 2  = 4 4  +  −3 −3  +  −1 1 
       
3 1 2  4 4 4   −2 −2 −2   1 −1 0 
       
Pengamatan = Rata-Rata + Efek Perlakuan+ Residual
( x ij ) (x ) ( xi −x ) ( xij −xi )

dan
SS pgmt = SSrt + SStr + SSres
216 = 128 + 78 + 10
Total SS = SS pgmt − SS rt = 216 − 126 = 88

Lakukan perhitung yang sama pada varibel kedua, hasilnya


 3 2 7   5 5 5   −1 −1 −1   −1 −2 3 
       
 4 0 0  =  5 5  +  −3 −3  +  2 −2 
        
 8 9 7   5 5 5   3 3 
3   0  1 −1 
    
dan
SS pgmt = SSrt + SStr + SSres
272 = 200 + 48 + 24

Total SS = SS pgmt − SS rt = 272 − 200 = 72

122
Kedua analisis komponen tunggal tersebut harus diperbesar dengan
jumlah elemen hasil kali dalam rangka melengkapkan elemen-elemen
dalam table MANOVA. Tampilkan baris demi baris dalam array untuk
dua variabel, diperoleh hasil kali

Rata-rata : 4(5)+4(5)+…+4(50=8(4)(5) =160


Perlakuan : 3(4)(-1)+2(-3)(-3)+3(-2)(-3)=-12
Residual : 1(-1)+(-2)(-2)+1(2)+(-1)(2)+…+0(-1) = 1
Total : 9(3)+6(2)+9(7)+0(4)+…+2(7)=149

Total (terkoreksi) hasil kali = (total hasil kali) – (rata-rata hasil kali)
= 149-160 =-11
Selanjutnya, table MANOVA:
Matriks Jumlah
Sumber Variansi Kuadrat dan Hasil Derajat Bebas
Kali
 78 − 12 
Perlakuan   3–1=2
 − 12 48 
 
 10 1 
Residual   3+2+3-3=5
 1 24 
 
 88 − 11 
Total (Koreksi)   7
 − 11 72 
 

Persamaan 0.106 menyatakan bahwa


 88 −11   78 −12   10 1 
  =    
 −11 72   −12 48  +  1 24 
     
Gunakan persamaan (0.108) diperoleh

123
10 1
W 1 24
Γ = =
B + W 88 − 11
− 11 72

10 ( 24 ) − ( 1 )
2
239
= = = 0.0385
88 ( 72 ) − ( −11 )
2 6215

Karena p = 2 dan n = 3, mengindikasikan bahwa uji eksak (asumsi


normal dan matriks kovariansi sama) dari H 0 : τ 1 = τ 2 = τ 3 = 0
(tidak ada efek perlakuan) lawan H 1 : paling sedikit terdapat satu
τ i ≠ 0 . Untuk melakukan uji, bandingkan uji statistik

 1 − Γ   ∑ ni − n − 1   1 − 0.0385   8 − 3 − 1 
    =     = 8.19
   −    
 − 
 Γ  n 1   0.0385  3 1
Dengan suatu titik persentase dari distribusi-F mempunyai
v1 = 2 ( n − 1 ) = 4 dan v2 = 2 ( ∑ ni − n − 1 ) = 8 . Karena
8.19 > F4,8 ( 0.01 ) = 7.01 , tolak H 0 pada taraf signifikansi dan
disimpulkan bahwa terdapat perbedaan dalam perlakuan

Contoh 6.7 (Analisis Multivariat Data Perawat Pribadi)


Departemen kesehatan membayar rumah perawat pribadi untuk
penyediaan layanan. Departemen kesehatan mengembangkan
sekumpulan rumusan untuk tariff dari setip fasilitas, didasarkan pada
factor; level perawatan, upah minimum propinsi, dan upah minimum
regional.
Perawat pribadi dapat diklasifikasi pada basis kepemilikan (pribadi,
organisasi non-profit, dan pemerintah) dan sertifikasi (Keahlian
perawat, intermediasi fasilitas keperdulin (ketersediaan), atau
kombinasi dari dua).

124
Satu tujuan dari penelitian tersebut adalah meneliti efek kepemilikan
atau sertifikasi (atau kedua) terhadap biaya. Terdapat empat biaya,
Basis hari-per pasien dan diukur dalam jam perpasien perhari,
variabelnya adalah X1 biaya gaji perawat, X 2 biaya makanan, X 3 biaya
operational perencanaa dan perawatan, X 4 biaya penjaga rumah dan
laundry. Total pengamatan yang telah dilakukan sebanyak n = 516
pada setiap dari p = 4 variabel biaya.
Ringkasan statistic untuk setiap g = 3 diberikan pada table berikut
Kelompok Jumlah Vektor rata-rata
Pengamatan sampel
i = 1 (Pribadi) n1 = 271  2.066 
 
 0.480 
x1 =   
0.082 
 
 0.260 
 
i = 2 (Non-Provit) n 2 = 138  2.167 
 
 0.596 
x2 =  

 0.124 
 0.418 
 
i = 3 (Pemerintah) n 3 = 107  2.273 
 
 0.521 

x3  
0.125 
 
 0.383 
 
n

∑ n1 = 516
i =1

 0.291   0.561 
   
 −0.001 0.011   0.011 0.025 
S1 =   ; S =
 1 


 0.002 0.000 0.001   0.001 0.004 0.005 
 0.010 0.003 0.000 0.010   0.037 0.007 0.002 0.019 
   

125
 0.261 
 
 0.030 0.017 

S3 =  
0.003 −0.000 0.004 
 
 0.018 0.006 0.001 0.013 
 

Karena Si nampak hampir sama, dihitung gabungannya (pooled)

W = ( n1 − 1 ) S1 + ( n2 − 1 ) S2 + ( n 3 − 1 ) S3
 182.962 
 
 4.408 8.200 
=  

 1.695 0.633 1.484 
 9.581 2.428 0.394 6.538 
 

juga
 2.136 
 
n1x1 + n2 x2 + n3 x3  0.519 
x= =  

n1 + n2 + n3  0.102 
 0.380 
 

dan

 3.475 
 
3  1.111 1.225 
B = ∑ n1 ( x1 − x )( x1 − x )′ =  

i =1  0.821 0.453 0.235 
 0.584 0.610 0.230 0.304 
 

Untuk menguji H 0 : τ 1 = τ 2 = τ 3 (tidak ada efek kepemilikan) atau


sama, tidak ada perbedaan biaya antara tidak jenis kepemilikan,
pribadi, non-profit, pemerintah).
Untuk g = 3 , dengan menggunakan computer, diperoleh

126
W
Γ= = 0.7714
B+W

dan

 ∑ ni − p − 2   1 − Γ   516 − 4 − 2   1 − 0.7714 
    =  
 
 = 17.67
 p   Γ  
 4  0.7714 
Misalkan taraf signifikansi α =0.01 sedemikian hingga F2( 4 ),2( 510 ) ( 0.01 )
= χ82 ( 0.01 ) 8 = 2.51 . Karena 17.67 > F8,1020 ( 0.01 ) = 2.51 , tolak H 0 pada
taraf signifikansi 0.01 dan disimpulkan bahwa rata-rata biaya berbeda,
bergantung pada jenis kepemilikan.

Uji Roy
Dalam pendekatan gabungan-irisan, kita mencari kombinasi linear
z ij = a ′y ij yang memaksimumkan sebaran dari transformasi rata-rata
z i . = a ′y i . relative terhadap variasi didalam sebaran sampel dari titik.
Kemudian kita mencari vektor yang memaksimumkan
a
n ∑ ( zi . − z.. ) (a − 1 )
2

i =1
F = (0.111)
a b

∑ ∑ ( zij − zi. ) (ab − a )


2

i =1 j =1

Persamaan 0.111 dapat dituliskan dalam bentuk


a ′Wa ( a − 1 ) W
F = = (0.112)
a ′Ba ( ab − a ) ( W + B)
Persamaan terakhir maksimum dengan a 1 , nilai eigen yang berkaitan
dengan λ1 , nilai eigen yang terbesar dari B−1W , kita punya

127
a (b − 1 )
max F = λ1 (0.113)
a a −1
Untuk menguji H 0 yang didasarkan pada λ1 , Uji akar terbesar Roy,
yaitu
λ1
θ= (0.114)
1 + λ1

Nilai kritis dari θ diberikan dalam table. Tolak H 0 jika θ ≥ θα,s ,m , N

dimana,
s = min ( vW , p ) , m = 1
2
( vW − p − 1) , N = 1
2
( vB − p − 1)

4. Interval Kepercayaan Simultan untuk Efek Perlakuan


Ketika hipotesis tentang kesamaan efek perlakuan ditolak, efek-efek
mengarah pada bagaiamanan keadaan dari hipotesis yang ditolak.
Perbandingan pairwise, pendekatan Banferroni dapat digunakan untuk
mengkonstruksi interval kepercayaan simultan untuk komponen
perbedaan τ j − τ i . interval-interval tersebut lebih pendek dibanding
seluruh konstras yang diperoleh, dan membutuhkan nilai kritis hanya
untuk statistic-t univariat.
Misalkan τij komponen ke- i dari τ j , Karena τ j diestimasi dengan
τˆj = xk − x

τˆij = x ij − x j (0.115)
Dan τˆij − τˆkj = xij − xkj adalah selisih antara dua rata-rata sampel
independen. Interval kepercayaan untuk dua sampel didasarkan pada
statistic-t adalah valid dengan perubahan pada α . Perhatikan bahwa
1 1
var ( τˆki − τˆli ) = var ( Xki − Xli ) =  +  σii
 nk nl 

128
Dimana σii elemen diagonal dari Σ . estimasi dari var ( X ki − X li )
adalah
1 1 w
var ( Xki − Xli ) =  +  ii
 nk nl  n − g
Dimana w ii elemen diagonal dari W dan n = n 1 + n 2 + ⋯ + n g .
Terdapat p variabel dan g ( g − 1 ) 2 pasangan berbeda, sehingga
interval-t dua sampel akan dikerjakan dalam nilai kritis tn −g ( α 2m ) ,
dimana
pg ( g − 1 )
m= (0.116)
2
Adalah jumlah pernyataan kepercayaan simultan.
Teorema 6.5
g
Misalkan n = ∑ nk untuk model pada persamaan…, dengan
k =1
kepercayaan paling sedikit ( 1 − α ) ,

  wii  1
τ ki − τli dibawah x ki − x li ± tn −g 
α 1 
  + 
 pg ( g − 1 )  n − g  nk nl 

Untuk semua komponen i = 1, 2, ⋯, p dan perbedaan semua


l < k = 1, ⋯ g dimana w ii adalah elemen diagonal W

Contoh berikut menggambarkan bagaimana mengkonstruksi estimasi


interval kepercayaan untuk perbedaan berpasangan dalam rata-rata
perlakuan menggunakan data perawatan-pribadi sebagaimana
disajikan dalam contoh 6.7.

129
Contoh 6.8 (Interval kepercayaan untuk perbedaan perlakuan-
Perawat-Rumah).
Dari contoh sebelumnya (6.7), bahwa biaya rata-rata untuk perawat
rumah yang berbeda, bergantung pada jenis kepemilikan. Gunakan
hasil pada contoh 6.7 untuk mengestimasi perbedaan. Suatu
perbandingan dari variabel X 3 , biaya rencan operasional dan
perawatan tenaga kerja, antara kepemilikan pribadi dan pemerintah
dapat dibuat estimasi τ13 − τ 33 . Dengan menggunakan persamaan
(0.105) dan informasi yang ada pada contoh sebelumnya, kita punya
 −0.070   0.137 
   
 −0.039   0.002 
τˆ1 = ( x1 − x ) =   ; τˆ = ( x − x ) =

 
 0.023 
 −0.020 
3 3
 
 −0.020   0.003 
   
 182.962 
 
 4.408 8.200 

W= 
1.695 0.633 1.484 
 
 9.581 2.428 0.394 6.538 
 
Akibatnya,
τˆ13 − τˆ33 = − 0.020 − 0.023 = 0.043

dan n = 271 + 138 + 107 = 516 sehingga


1 1 w  1 1  1.848
 +  33 =  +  = 0.00614
 n1 n3  n − g  271 107  516 − 3
Karena p = 4 dan g = 3 , untuk pernyataan kepercayaan simultan
95% diperlukan t513 ( 0.05 4 ( 3 ) 2 ) = 2.87 . pernyataan kepercayaan
simultan 95% adalah

130
τ13 − τ 33 dibawah
1 1 w
τˆ13 − τˆ33 ± t513 ( 0.00208 )  +  33
 n1 n3  n − g

= − 0.043 ± 2.87 ( 0.00614 )


= − 0.043 ± 0.018
Disimpulkan bahwa rata-rata perawatan dan biaya tenaga kerja untuk
kepemilikan pemerintah lebih tinggi sekitar 0.025 hingga 0.061 per
pasien per hari di banding untuk kepemilikan pribadi. Dengan
kepercayaan yang sama, 95%, dikatakan bahwa
τ13 − τ 23 dibawah
1 1 w
τˆ13 − τˆ23 ± t513 ( 0.00208 )  +  23
 n1 n3  n − g

= ( − 0.058, − 0.026 )

dan
τ 223 − τ 33 dibawah
1 1 w
τˆ23 − τˆ33 ± t513 ( 0.00208 )  +  33
 n2 n3  n − g

= ( − 0.021, 0.019 )

5. Uji Kesamaan Matriks Kovariansi


Salah satu asumsi yang dibuat ketika membandikan dua atau lebih
vektor rata-rata multivariate adalah matriks kovariansi dari populasi
yang secara pontensil berbeda adalah sama. Sebelum
menggabungkan variansi antara sampel untuk membentuk matrisk
kovariansi gabungan ketika membanding vektor kovariansi, hal
tersebut dapat bermanfaat ketika pengujian kesamaan matriks
kovariansi. Satu uji yang umum digunakan untuk kesamaan matriks
kovariansi adalah Uji Box-M.

131
dengan g populasi, hipotesis nolnya adalah
H 0 : Σ1 = Σ 2 = ⋯ = Σ g = Σ (0.117)
dimana Σl adalah matriks kovariansi untuk populasi ke- l , l = 1, 2, ⋯, g
dan Σ adalah asumsi awal dari matriks kovariansi. Hipotesis
altenatifnya adalah paling sedikit dua diantara matriks kovarians tidak
sama.
Andaikan bahwa populasinya berdistribusi normal multivariate, suatu
uji likelihood rasio untuk menguji hipotesis diberikan oleh
( nl −1 )
 S  2

ϒ = ∏  l  (0.118)


l  ( Sp ) 
 
dimana nl ukuran sampel untuk kelompok ke- l , Sl adalah matriks
kovariansi sampel kelompok ke- l dan Sp adalah matriks kovariansi
gabungan dengan rumus
1
Sp = − {( n1 − 1) S1 + ( n2 − 1) S2 + ⋯ + ( ng − l ) Sg } (0.119)
∑( nl − 1)
l

Uji Box didasarkan pada pendakatan χ 2 pada distribusi sampel


−2ln ϒ . Penetapan −2ln ϒ = M (Statistik M-Box) diberikan oleh

   
M =  ∑( nl − 1)  ln Sp −  ∑( nl − 1)  ln Sl (0.120)
   
 l   l 
Jika hipotesis nol benar, sample individual matriks kovariansi tidak
mengekspektasi pada perbedaan yang terlalu besar dan, akibatnya
tidak ada perbedaan dari matriks kovariansi matriks gabungan.

132
Uji Box Untuk kesamaan Matriks kovariansi
Diberikan
 
 1 1   2p2 + 3p − 1 

u = ∑ −   (0.121)
  6 ( p + 1)( g − 1) 
 l ( nl − 1 ) ∑ l
( n − 1 )   
 l 
Dimana p adalah jumlah variabel dan g adalah jumlah kelompok.
Maka
  
C = ( 1 − u) M = ( 1 −u )  ∑( nl −1)  ln Sp − ∑( nl −1) ln Sl   (0.122)

 
 l  l 
Berdistribusi chi-kuadrat dengan
1 1 1
v =g p ( p + 1 ) − p ( p + 1 ) = p ( p + 1 )( g − 1 ) (0.123)
2 2 2
Sebagai derajat bebas. Pada taraf signifikansi α , tolak H0 jika
C > χ p2
( p + 1 )( g − 1 ) 2 (α )

Contoh 6.9. (Pengujian Kesamaan matriks kovariansi-Rumah


Perawat)
Dengan menggunakan data dan informasi pada contoh 6.7, 6.78,
matriks kovariansi untuk p = 4 variabel biaya yang berkaitan dengan
g = 3 telah dihitung. Andaikan bahwa data normal multivariate, kita
akan menguji hipotesis H 0 : Σ 1 = Σ 2 = Σ 3 = Σ .
Gunakan informasi pada contoh 6.8, bahwa n1 = 271, n2 =138, n3 =
107 dan S1 = 2.783 × 10−8 , S2 = 89.539 ×10−8 , S3 = 14.579 ×10−8
dan Sp = 17.397 × 10−8 . Ambil logaritma asli dari setiap matriks
kovarians sampel yang diberikan, -17,397, -13, 926, -15741 dan -
15,564 secara berturut-turut.
Selanjutnya hitung

133
  2 ( 4 ) + 2 ( 4 ) − 1 
2
 1 1 1 1
u =  + + + 
 270 137 106 270 + 137 + 106   6 ( 4 + 1 )( 3 − 1 ) 
 
= 0.0133
M =  270 + 137 + 106  ( −15.564 ) −
 270 ( −17.397 ) + 137 ( 13.926 ) + 106 ( −15.741 ) 
 
= 289.3
dan C=(1-0.0133)289.3 =285.5. Rujuk C pada table chi-kuadrat
dengan v = 4 ( 4 + 1)( 3 − 1) / 2 = 20 . Hal tersebut menjelaskan kepada
kita bahwa H 0 ditolak pada semua level signifikansi. Kesimpulannya,
bahwa matriks kovariansi dari variabel biaya berkaitan dengan tiga
populasi dari rumah perawat adalah tidak sama.

6. Multivariat Analisis Variansi Dua-Arah


Dengan menggunakan pendekatan penjelasan dari MANOVA satu
arah, kita juga akan membahas MANOVA dua arah dengan cara yang
sama
Model Efek-Tetap Univariat Dua-Arah dengan Interaksi
Kita asumsikan bahwa pengukuran dilakukan pada beberapa level dari
dua factor. Misalkan dua eksperimen dengan level-levelnya, factor 1
dan factor 2. Andaikan bahwa terdapat a level pada factor 1 dan b
level pada factor dua, dan bahwa pengamatan sebanyak n yang saling
independen telah dilakukan pada setiap kombinasi level ab .
Pengamatan ke- k pada level i factor 1 dan pengamatan level ke- j
pada factor 2 dengan Xijk , model dua-arah univariat adalah

Xijk = µ + τi + βj + γij + εijk (0.124)


Untuk i = 1, 2, ⋯ , a , j = 1, 2, ⋯, b dan k = 1, 2, ⋯, n

134
a b a b
Dimana ∑ τi = ∑ βj = ∑ γij = ∑ γij = 0 dan εijk ∼ NIID ( 0, σ 2 ) . dari
i =1 j =1 i =1 j =1

model µ merupakan rata-rata keseluruhan, τ i


efek factor 1, βj efek
factor 2 dan γij efek factor interaksi factor 1 dan factor 2.

Eskpektasi respon pada level ke i factor 1 dan level ke- j factor 2


adalah

X ijk = µˆ + τˆi + βˆj + γˆij (0.125)


Analogi dengan persamaan (0.125), setiap pengamatan dapat
didekomposisi sebagai
xijk = x + ( xi − x ) + ( x j − x ) +
(0.126)
( xij − xi. − x.j + x ) + ( xijk − xijk )
dimana x rata-rata keseluruhan, x i. rata-rata level ke- i factor 1, x.j
rata-rata level ke- j factor 2 dan xij level ke- i factor 1 dan level- j
factor 2. Perkurangkan kedua ruang dengan x lalu kuadratkan serta
jumlah, diperoleh
 x + ( xi − x ) + ( x j − x ) 
 − x
( xijk − x ) =  
+ ( xij − xi. − x. j + x ) + ( xijk − xijk )

( xijk − x ) = ( xi − x ) + ( x j − x ) + ( xij − xi. − x. j + x )
+ ( xijk − xijk )

 ( x − x ) + ( x − x ) + ( x − x − x + x )
2

( x ijk ) =  i
2 j ij i. .j
−x 
 + ( x ijk − x ijk ) 
 
Lalu ambil jumlah dari kuadrat residual

135
2
( xi − x ) + ( x j − x ) 
a b n a b
 n

∑∑∑( xijk − x ) = ∑∑∑  + ( xij − xi. − x.j + x )
2

i =1 j =1 k =1 
 
i =1 j =1 k
 + ( xijk − xijk ) 
 

a b n
Karena ∑ ∑ ∑ ( xi − x )( x j − x ) = 0 maka
i =1 j =1 k =1

a b n a b n a b n
∑ ∑ ∑ ( x ijk − x ) ∑ ∑ ∑ (xi − x ) + ∑ ∑ ∑ (x j − x )
2 2
=
i =1 j = 1 k i = 1 j =1 k = 1 i =1 j =1 k
a b n a b n
+∑ ∑ ∑ ( x ij − x i. − x . j + x ) + ∑ ∑ ∑ ( x ijk − x ijk )
2 2

i = 1 j =1 k i = 1 j =1 k

a b n a b
∑ ∑ ∑ ( x ijk − x ) ∑ bn ( x i. − x ) ∑ an ( x . j − x )
2 2 2
= +
i =1 j =1 k =1 i =1 j =1
a b
+ ∑ ∑ n ( x ij − x i. − x . j + x ) (0.127)
2

i = 1 j =1
a b n
+ ∑ ∑ ∑ ( x ijk − x ij )
2

i = 1 j =1 k = 1

Atau
S S to t = S S 1 + S S 2 + S S 1 2 + S S res

Derajat bebas yang terkait dengan setiap jumlah pada persamaan


(0.127) adalah
abn − 1 = (a − 1) + (b − 1) + (a − 1)(b − 1) + ab ( n − 1) (0.128)
Table Anova dari hasil tersebut adalah:

136
Table Anova untuk membandingkan efek dua factor dan interaksinya
Sumber Jumlah Kuadrat df MS F
Variasi
Faktor 1 a SS1/ SS1 (a − 1 )
∑ bn ( xi. − x )
2
SS1 =
i =1
(a − 1) (a − 1) SSres ab ( n − 1 )

SS 2 ( a − 1 )
Faktor 2
SS2 = ∑ an ( x.j
b
−x )
2 (b − 1 ) SS2/
SSres ab ( n − 1 )
j =1 (b − 1 )
Interaksi SS12 = (a − 1)(b − 1) SS12/ SS12 ( a − 1 )
SSres ab ( n − 1 )
a b
∑ ∑ n ( x ij − x i. − x. j +x )
2 (a − 1)(b − 1)
i =1 j =1

Residual SSres = ab ( n − 1) SSres/


a b n
ab ( n − 1)
∑ ∑ ∑ ( xijk − x ij )
2

i =1 j =1 k =1
Total SStot = abn − 1 SStot/
a b n abn − 1
∑ ∑ ∑ ( xijk − x )
2

i =1 j =1 k =1

Multivariat Model Efek Dua-Arah dengan Interaksi


Analog dengan model efek-tetap dua-arah untuk suatu vektor yang
memuat p komponen,

Xijk = µ + τi + βj + γij + εijk (0.129)

Untuk i = 1, 2, ⋯ , a , j = 1, 2, ⋯, b dan k = 1, 2, ⋯, n
a b a b
Dimana ∑ τ i = ∑ βj = ∑ γij = ∑ γij 0. Semua vektor tersebut
i=1 j =1 i=1 j =1

berukuran p ×1, dan εijk ∼ NIID ( 0, Σ) . dari model µ merupakan


rata-rata keseluruhan, τ i
efek factor 1, βj efek factor 2 dan γij efek
factor interaksi factor 1 dan factor 2.

137
Eskpektasi respon pada level ke i factor 1 dan level ke- j factor 2
adalah
ˆ + τˆi + βˆ j + γˆij
Xijk = µ (0.130)
Analogi dengan persamaan (0.125), setiap pengamatan dapat
didekomposisi sebagai
xijk = x + ( xi − x ) + ( x j − x ) +
(0.131)
( xij − xi. − x.j + x ) + ( xijk − xijk )
Dimana x rata-rata keseluruhan, x i. rata-rata level ke- i factor 1, x.j
rata-rata level ke- j factor 2 dan xij level ke- i factor 1 dan level- j
factor 2. Perkurangkan kedua ruang dengan x lalu kuadratkan serta
jumlah, diperoleh
( x − x ) + ( x − x ) + ( x − x − x + x )
( xijk − x )( xijk − x )′ =  i

j ij i. .j 

+ ( xijk − xijk ) 
 
( xi − x ) + ( x j − x ) + ( xij − xi. − x.j + x )′
 
 + ( xijk − xijk ) 

Lalu ambil jumlah dari kuadrat residual dan Karena
a b n

∑ ∑ ∑ ( xi − x ) ( x j − x ) = 0 maka
i =1 j =1 k =1

a b n a

∑ ∑ ∑ ( xijk − x )( xijk − x )′ = ∑ bn ( xi. − x )( xi. − x )′


i =1 j =1 k =1 i =1
b
+∑ an ( x. j − x )( x. j − x )′
j =1 (0.132)
a b
+∑ ∑ n ( xij − xi. − x. j + x )( xij − xi. − x. j + x )′
i =1 j =1
a b n
+∑ ∑ ∑ ( xijk − xij )( xijk − xij )′
i =1 j =1 k =1

atau

138
S S to t = S S 1 + S S 2 + S S 1 2 + S S res

Derajat bebas yang terkait dengan setiap jumlah pada persamaan


(0.127) adalah
abn − 1 = (a − 1) + (b − 1) + (a − 1)(b − 1) + ab ( n − 1) (0.133)

139
Table Anova dari hasil tersebut adalah:
Sumber Jumlah Kuadrat df MS F
Variasi
a SS1 ( a − 1 )
Faktor 1 SS1 = ∑ bn ( xi. − x )
2
(a − 1) SS1/ (a − 1)
SSres ab ( n − 1 )
i =1

b SS 2 (a − 1 )
∑ an ( x.j − x ) (b − 1 ) SS2/ (b − 1 )
2
Faktor 2 SS2 =
j =1
SSres ab ( n − 1 )

a b SS12/ SS12 (a − 1 )
Interaksi SS12 = ∑ ∑ n ( xij − xi. − x. j + x )
2
(a − 1)(b − 1)
i =1 j =1 (a − 1)(b − 1) SSres ab ( n − 1 )

a b n

∑ ∑ ∑ ( xijk − xij ) ab ( n − 1) SSres/ ab ( n − 1)


2
Residual SSres =
i =1 j =1 k =1

a b n

∑ ∑ ∑ ( xijk − x )
2
Total SStot = abn − 1 SStot/ abn − 1
i =1 j =1 k =1

140
Uji (likelihood rasio) dari hipotesis
H 0 : γ 11 = γ 12 = ⋯ = γ ab = 0 (0.134)
Lawan
H1 : Paling sedikit terdapat satu tidak sama dengan nol
Dilakukan dengan menolak H0 untuk nilai kecil dari rasio

SSPres
Γ= (0.135)
SSPint + SSPres

Untuk sample besar, Lambda Wilk dapat didekati dengan distribusi chi-
kuadrat. Menggunakan Bartlet untuk menaikkan kesuaian dengan chi-
kuadrat, tolak H 0 jika

 p + 1 − ( a − 1 )(b − 1 ) 
−  ab ( n − 1 ) =  ln Γ > χ2
 (a −1)(b −1) p ( )
α (0.136)
 2 
Dimana Γ diberikan dalam persamaan (0.135) dan χ(2a −1 )(b −1 )p ( α )

persentil ke ( 100α ) dari distribusi chi-kuadrat dengan derajat bebas


(a − 1)(b − 1) p
Dalam model multivariate, pengujian terhadap efek factor utama
dilakukan setelah melakukan pengujian terhadap factor interaksi.
Contoh 6.10 (Analisis Multivariat dua-arah dari variansi data
Pita Film)
Syarat optimum yang ditekan pada pita film telah diuji menggunakan
suatu teknologi yang disebut operasi evolusioner. Dalam pembicaraan
ini, tiga respon X 1 = tahan arah (basah), X 2 =kehalusan permukaan,
X 3 = kedap cahaya, dimana ketiga diukur dalam dua level, rata-rata
dan jumlah aditif. Pengukuran dilakukan sebanyak 5 kali pada setiap
kombinasi factor. Datanya ditampilkan pada table berikut:

141
Faktor 1: Jumlah Aditif
Low High
x1 x 2 x 3 x1 x 2 x 3

6.5 9.5 4.4 6.9 9.1 5.7


Rata-rata Perubahan

6.2 9.9 6.4 7.2 10.0 2.0


Low 5.8 9.6 3.0 6.9 9.9 3.9
6.5 9.6 4.1 6.1 9.5 1.9
Extrude

6.5 9.2 0.8 6.3 9.4 5.7


6.7 9.1 2.8 7.1 9.2 8.4
6.6 9.3 4.1 7.0 8.8 5.2
High 7.2 8.3 3.8 7.2 9.7 6.9
7.1 8.4 1.6 7.5 10.1 2.7
6.8 8.5 3.4 7.6 9.2 1.9

ANOVA: Tear; Gloss; Opacity versus Extrusion; Additive

MANOVA for Extrusion


s = 1 m = 0,5 n = 6,0

Test DF
Criterion Statistic F Num Denom P
Wilks' 0,38186 7,554 3 14 0,003
Lawley-Hotelling 1,61877 7,554 3 14 0,003
Pillai's 0,61814 7,554 3 14 0,003
Roy's 1,61877

SSCP Matrix for Extrusion

Tear Gloss Opacity


Tear 1,740 -1,504 0,8555
Gloss -1,504 1,301 -0,7395
Opacity 0,855 -0,739 0,4205

SSCP Matrix for Error

Tear Gloss Opacity


Tear 1,764 0,0200 -3,070
Gloss 0,020 2,6280 -0,552

142
Opacity -3,070 -0,5520 64,924

Partial Correlations for the Error SSCP Matrix

Tear Gloss Opacity


Tear 1,00000 0,00929 -0,28687
Gloss 0,00929 1,00000 -0,04226
Opacity -0,28687 -0,04226 1,00000

EIGEN Analysis for Extrusion

Eigenvalue 1,619 0,00000 0,00000


Proportion 1,000 0,00000 0,00000
Cumulative 1,000 1,00000 1,00000

Eigenvector 1 2 3
Tear 0,6541 0,4315 0,0604
Gloss -0,3385 0,5163 0,0012
Opacity 0,0359 0,0302 -0,1209

MANOVA for Additive


s = 1 m = 0,5 n = 6,0

Test DF
Criterion Statistic F Num Denom P
Wilks' 0,52303 4,256 3 14 0,025
Lawley-Hotelling 0,91192 4,256 3 14 0,025
Pillai's 0,47697 4,256 3 14 0,025
Roy's 0,91192

SSCP Matrix for Additive

Tear Gloss Opacity


Tear 0,7605 0,6825 1,931
Gloss 0,6825 0,6125 1,732
Opacity 1,9305 1,7325 4,901

EIGEN Analysis for Additive

Eigenvalue 0,9119 0,00000 0,00000

143
Proportion 1,0000 0,00000 0,00000
Cumulative 1,0000 1,00000 1,00000

Eigenvector 1 2 3
Tear -0,6330 0,4480 -0,1276
Gloss -0,3214 -0,4992 -0,1694
Opacity -0,0684 0,0000 0,1102

MANOVA for Extrusion*Additive


s = 1 m = 0,5 n = 6,0
Test DF
Criterion Statistic F Num Denom P
Wilks' 0,77711 1,339 3 14 0,302
Lawley-Hotelling 0,28683 1,339 3 14 0,302
Pillai's 0,22289 1,339 3 14 0,302
Roy's 0,28683

SSCP Matrix for Extrusion*Additive

Tear Gloss Opacity


Tear 0,000500 0,01650 0,04450
Gloss 0,016500 0,54450 1,46850
Opacity 0,044500 1,46850 3,96050

EIGEN Analysis for Extrusion*Additive

Eigenvalue 0,2868 0,00000 0,00000


Proportion 1,0000 0,00000 0,00000
Cumulative 1,0000 1,00000 1,00000

Eigenvector 1 2 3
Tear -0,1364 0,1806 0,7527
Gloss -0,5376 -0,3028 -0,0228
Opacity -0,0683 0,1102 -0,0000

Untuk uji interaksi, hitung


SSPres 275.7098
Γ= = = 0.7771
SSPint + SSPres 354.7906

Untuk ( a − 1)(b − 1) = 1

144
 1 − Γ  ( ab ( n − 1 ) − p + 1 ) 2
F =  
 Γ  ( ( a − 1 )(b − 1 ) − p + 1 ) 2

Berdistribusi-F dengan v1 = ( a − 1)(b − 1) − p + 1 dan


v2 = ab ( n − 1) − p + 1 . Sebagai contoh

 1 − 0.7771  ( 2 ( 2 )( 4 ) − 3 + 1) 2
F =   = 1.34
 0.7771  ( 1 ( 1 ) 0.3 + 1 ) 2
v1 = ( 1 ( 1 ) − 3 1 ) = 3
v2 = ( 2 ( 2 )( 4 ) − 3 + 1 ) = 14

dan F3,14 ( 0.05 ) = 3.34 . Karena F = 1.34 < F3,14 ( 0.05 ) = 3.34 ,

keputusannya adalah tidak tolak hipotesis H0 atau tidak ada interaksi


factor.
Perhatikan bahwa pendekatan statistic chi-kuadrat untuk uji ini adalah
sesuai dengan persamaan (0.136), yaitu
 p + 1 − (a − 1 )(b − 1 ) 
−  ab ( n − 1 ) =  ln Γ

 2 
 ( 3 + 1 − 1 (1)) 
−  2 ( 2 )( 4 ) =  ln ( 0.7771 )

 2 
= 3.66

Karena χ32 ( 0.05 ) = 7.81 , kita dapat mengambil kesimpulan yang sama
sebagaimana yang disajikan dalam uji-F.
Untuk menguji efek factor 1 dan factor 2, hitung
SSPres 275.7098
Γ= = = 0.3819
SSPfac1 + SSPres 722.0212

dan

145
SSPres 275.7098
Γ= = = 0.5230
SSPfac2 + SSPres 527.1347

Untuk derajat bebas dari kedua factor tersebut adalah a − 1 dan


b − 1,

 1 − Γ  ( ab ( n − 1 ) − p + 1 ) 2
F1 =  
 Γ  ( ( a − 1 ) − p + 1 ) 2

Berdistribusi F dengan derajat bebas


v1 = ( ( a − 1) − p + 1) dan v2 = ( ab ( n − 1) − p + 1)
dan
 1 − Γ  ( ab ( n − 1 ) − p + 1 ) 2
F1 =  
 Γ  ( (b − 1 ) − p + 1 ) 2

Berdistribusi F dengan derajat bebas


v1 = ( (b − 1) − p + 1) dan v2 = ( ab ( n − 1) − p + 1)
Dalam kasus di atas,
 1 − 0.3819  ( 16 − 3 + 1 ) 2
F1 =   = 7.55
 0.3819  ( 1 − 3 + 1 ) 2

 1 − 0.5230  ( 16 − 3 + 1 ) 2
F2 =   = 4.26
 0.5230  ( 1 − 3 + 1 ) 2

dan
v1 = 1 − 3 + 1 = 3 ; v2 = ( 16 − 3 + 1) = 14

dari perhitungan sebelumnya, F3,14 ( 0.05 ) = 3.34 . Karena


F1 = 7.55 > F3,14 ( 0.05 ) = 3.34 . Keputusannya adalah tolak H0 pada
taraf signifikansi 0.05. Dengan cara yang sama

146
F2 = 4.26 > F3,14 ( 0.05 ) = 3.34 , keputusannya adalah tolak H0 pada
taraf signinfikansi 0.05.
Latihan Soal
6. 1.Konstruksi dan Gambarkan gabugan daerah kepercayaan 95%
untuk perbedaan vektor rata-rata menggunakan data pada contoh
6.1. Perhatikan bahwa titik δ = 0 jatuh diluar kontur 95%. Apakah
sesuai dengan H0 : δ = 0 yang dijelaskan dalam contoh 6.1?
Jelaskan
6. 2. Gunakan informasi dalam contoh 6.1. Konstruksi interval
kepercayaan simultan Banferroni untuk komponen perbedaan
rata-rata vektor δ . Bandingkan panjang tersebut dengan panjang
interval pada contoh.
6. 3.Seorang peneliti memperhatikan tiga indikasi pengukuran
kerusakan serangan jantung. Nilai dari indikasi-indikasi tersebut
untuk n = 40 pasien serangan jantung yang datang ke rumah
sakit menghasilkan rangkuman statistic berikut
 46.1   101.3 63.0 71.0 
   
x =  57.3  dan S =  63.0 80.2 55.6 
 
 50.4   71.0 55.6 97.4 
   
(a) Dari ketiga indikasi tersebut dievaluasi untuk setiap pasien.
Uji kesamaan rata-rata indikasi dengan menggunakan
persamaan 0.92. dengan α = 0.05
(b) Buat keputusan dari perbedaan pasangan rata-rata indikasi
menggunakan interval kepercayaan simultasn 95%.
6. 4.Gunakan data perlakuan (2) dan perlakuan (3) dalam latihan 6.6
Untuk
(a) Hitung Sp

(b) Uji hipotesis H0 : µ1 − µ2 = 0 lakukan untuk dua sampel


dengan α = 0.01

147
(c) Konstruksi interval kepercayaan simultan 95% untuk
perbedaan µ2i − µ3i , untuk i = 1, 2
6. 5.Gunakan ringkasan statistic pada latihan 6.3, untuk menghitung
T 2 dan uji hipotesis H0 : µ1 − µ2 = 0 , dengan asumsi bahwa

Σ1 = Σ2 . Nyatakan α = 0.05 . Tentukan kombinasi linear dari


komponen rata-rata yang memberikan peran lebih dalam
penolakan H0 : µ1 − µ2 = 0 .
6. 6.Pengamatan pada dua respon telah dilakukan untuk tiga
 x1 
perlakuan. Vektor pengamatan   adalah

 x 2 
6 5 8 4 7
Perlakuan 1:   ,   ,   ,   ,  
 7   9   6   9   9 
3 1 2
Perlakuan 2:   ,   ,  
 3   6   3 
 2  5  3  2
Perlakuan 3:   ,   ,   ,  
 3   1   1   3 
(a) Pecah pengamatan tersebut menjadi komponen rata-rata,
perlakuan, dan residual. Konstruksi array yang berkaitan untuk
setiap variabel.
(b) Gunakan transformasi pada bagian (a), konstruksi table
MANOVA satu arah
(c) Evaluasi lambda wilk, dan gunakan table 6.3 untuk
menguji efek perlakuan, untuk α = 0.01 . Ulangi pengujian
dengan menggunakan pendekatan chi-kuadrat dengan
Perbaikan Bartlet. Bandingkan kesimpulannya.
6. 7.MANOVA dua arah tanpa pengulangan). Perhatikan pengamatan
pada dua respon, x1 dan x2 , sebagaimana ditampilkan dalam
bentuk table dua arah

148
Faktor 2
Level 1 Level 2 Level 3 Level 4
Level 1  6  4 8  2
       
 8  6  12   6
       
Faktor 1

Level 2  3  −3  4  −4 
       
 8  2  3  3
       
Level 3  −3  −4   3  −4 
       
 2  −5   −3  −6 
       
Dengan tanpa pengulangan, model MANOVA dua-aray adalah
Xlk = µ + τl + βk + εlk
(a) Dekomposisi pengamatan untuk setiap dua variabel sebagai
xlk = x + ( xl. − x ) + ( x.k − x ) + ( xlk − xl. − x.k + x )
(b) Hitung jumlah kuadrat
SStot = SSrt + SS f 1 + SS f 2 + SSres
Dan hasil kali
SCPtot = SCPrt + SCPf 1 + SCPf 2 + SCPres

Dari dua hal tersebut, susun matriks SSPtot , SSPf 1, SSPf 2, dan
SSPres dengan derajat bebas ab − 1, a − 1, b − 1, dan
(a − 1)(b − 1)
(c) Tuangkan seluruh hasil perhitungan pada bagian (b) dalam table
MANOVA.
(d) Dari table MANOVA pada bagian (c), uji efek factor 1 dan factor 2
pada taraf signifikansi α = 0.01
6. 8.Suatu eksperimen dengan pengamatan berulang dari data pada
latihan 6.7 dan hasilnya sebagaimana data berikut

149
Faktor 2
Level 1 Level 2 Level 3 Level 4
Level 1  6  4 8  2
       
 8  6  12   6
       
Faktor 1

Level 2  3  −3  4  −4 
       
 8  2  3  3
       
Level 3  −3  −4   3  −4 
       
 2  −5   −3  −6 
       
(a) Gunakan data tersebut untuk mendekomposisi setiap dari dua
pengukuran dalam vektor pengamatan sebagai
xlk = x + ( xl. − x ) + ( x.k − x ) + ( xlk − xl. − x.k + x )
(b) Kombinasikan dengan hasil yang diperoleh pada latihan 6.7
untuk mendapatkan table MANOVA dua arah
(c) Dari hasil yang diperoleh pada bagian ( c ), uji factor interaksi,
dan jika tidak ada pengaruhnya, lanjutkan dengan uji factor
utama 1, dan factor utama 2. Gunakan rasio likelihood dengan
α = 0.05
(d) Jika efek utama, tapi bukan efek inteaksi, ada, uji efek utama
dengan mengkonstruksi interval kepercayaan simultan
Banferroni untuk perbedaan komponene dari parameter factor
efek.
6. 9.Merujuk pada latihan 6.7.
(a) Uji dengan pendekatan chi-kuadrat (ratio likelihood) untuk
efek factor 1 dan factor 2 dengan taraf signifikansi α = 0.05.
Bandingkan hasil-hasil tersebut dengan hasil untuk uji-F .
jelaskan perbedaannya
Gunakan persamaan 6.70, konstruksi interval kepercayaan
simultan 95% dalam parameter efek factor 1 untuk ketiga
pasangan respon. Interpretasi interval tersebut. Ulangi
perhitungan untuk parameter efek factor 2.

150
DAFTAR PUSTAKA

Chen, Zexun. "Multivariate Gaussian and Student-t process regression


for multi-output prediction." Neural Computing and
Applications 32.8 (2020): 3005-3028.
Demšar, Janez. "Statistical comparisons of classifiers over multiple
data sets." Journal of Machine Learning Research (2006).
Fletcher, Jonathan. "Model comparison tests of linear factor models in
U.K. stock returns." Finance Research Letters 28 (2019): 281-
291.
Hahs-Vaughn, Debbie L. Applied Multivariate Statistical Concepts. New
York, NY : Routledge: TaylorFrancis, 2017.
Hair, Joshep F, et al. Multivariate Data Analysis. Seventh Edition. New
Jersey: John Wiley & Sons, 2012.
Harris, Richard J. A Primer of Multivariate Statistics. Third Edition. New
Jersey: Lawrence Erlbaum Associates, 2001.
Le Maître, Anne. "Multivariate comparison of variance in R." Methods in
Ecology and Evolution (2019): 1380-1392.
Markowitz, Jeffrey S. "SpringerBriefs in Public Health." Markowitz,
Jeffrey S. Multivariate Analysis . New York: Springer, 2018. 71-
81.
Midway, Stephen. "Comparing multiple comparisons: practical
guidance for choosing the best multiple comparisons test."
PeerJ 8 (2020): e10387.

152
Rencher, Alvin C and William F Christensen. Method of Multivariate
Analysis. Third Edition. New Jersey: John Wiley & Sons Inc,
2012.
Seber, George A.F. A Matrix Handbook for Statisticians. New York: A
John Wiley & Sons. Inc, 2007.
Tabachnick, Barbara G and Linda S Fidell. Using Multivariate Statistics.
Sixth Edition. New Jersey: Pearson, 2013.
Timm, Neil H. Applied Multivariate Analysis. New York: Springer, 2002.
Wichern, Dean W and Richard A Johnson. Applied Multivariate
Statistical Analysis. Sixth Edition. New Jersey: Pearson Prentice
Hall, 2007.

153
INDEKS

Acak, 3, 4, 15, 35 100, 101, 109, 111, 128,


analisis variansi, 109, 110 134
bartlet, 120 Interaksi, 134, 136, 137, 139
Berdistribusi, 37, 85, 132, Interval kepercayaan, 85, 88,
144, 145 90, 94, 98, 103, 105, 128,
Bivariate, 4, 49 129
chi-kuadrat, 35, 51, 53, 77, Interval Kepercayaan, 76, 103,
104, 121, 132, 133, 140, 128
144, 147, 149 item, 1
Data, 1, 9, 47, 52, 71, 78 jumlah kuadrat, 22, 43, 110,
Data multivariate, 1 111, 113, 114, 119, 148
definit positif, 33, 34, 42, 77 Jumlah kuadrat residual, 119
dekomposisi, 111, 114 koefisien korelasi, 31, 48, 53
derajat bebas, 35, 38, 43, 44, komponen, 7, 18, 36, 37, 65,
51, 60, 63, 85, 88, 94, 100, 75, 79, 81, 93, 103, 108,
104, 108, 114, 115, 121, 109, 117, 122, 128, 129,
133, 140, 145, 148 137, 146, 147
Dua-Arah, 134, 137 Korelasi, 4, 5, 6, 8, 20, 54
efek, 84, 95, 97, 98, 110, 114, korelasi sampel, 6, 22
116, 117, 119, 120, 121, Kovariansi, 4, 6, 20, 25, 131
123, 124, 126, 128, 134, Kovarinsi, 4
136, 137, 140, 144, 147, kuadrat residual, 113, 119,
148, 149 135, 138
Efek, 115, 128, 134, 137 Lambda Wilk, 120, 140
eksperimen, 1, 84, 86, 91, 92, likelihood rasio, 140
109, 134, 148 Manova, 108, 109, 117, 119,
factor interaksi, 134, 137, 140, 121
149 MANOVA, 116, 119, 122, 123,
independen, 16, 18, 38, 43, 134, 141, 142, 143, 147,
44, 62, 87, 91, 93, 98, 99, 148, 149

154
matriks, 2, 3, 4, 11, 12, 13, 14, 119, 121, 122, 124, 127,
15, 16, 17, 19, 20, 21, 22, 128, 129, 130, 131, 134,
23, 27, 30, 31, 33, 37, 40, 135, 137, 140, 146, 147
41, 42, 44, 62, 64, 69, 77, respon, 84, 85, 86, 92, 93, 95,
79, 80, 83 98, 110, 111, 134, 137,
Membandingkan, 84, 86, 91, 140, 147, 149
92, 98, 108, 117 Selisih, 86, 91
Model, 30, 117, 134, 137 Simultan, 69, 103, 128
nilai eigen, 33, 34, 35, 40, 71, taraf signifikansi, 77, 82, 86,
72 91, 115, 116, 124, 127,
nilai statistik, 3, 80 133, 145, 148, 149
Nilai Statistik Uji, 86, 91 uji Bartlet, 104
pengamatan, 1, 2, 3, 4, 5, 7, 8, Uji Box, 131, 132
11, 12, 14, 15, 16, 24, 25, uji hipotesis, 77, 85, 147
26, 30, 39, 40, 45, 47, 49, uji likelihood rasio, 131
50, 51, 52, 54, 58, 61, 63, Uji Roy, 127
71, 77, 78, 80, 82, 83 Uji Wilk, 119
Perbandingan, 69, 75, 84, 86, ukuran relative, 114, 119
91, 98, 128 unit eksperimen., 1
perlakuan, 84, 85, 86, 89, 91, variable, 1, 2, 3, 4, 5, 7, 9, 11,
92, 93, 94, 95, 97, 98, 109, 13, 15, 16, 29, 30, 32, 35,
110, 111, 113, 114, 116, 36, 39, 43, 44, 51, 52, 53,
117, 119, 120, 121, 123, 54, 55, 57, 58, 63, 69, 78
124, 128, 129, 146, 147 Variansi, 3, 6, 7, 25
persentil, 35, 38, 51, 68, 77, Variansi Dua-Arah, 134
78, 85, 88, 94, 104, 115, Variansi sampel, 3, 25
121, 140 variansi-kovariansi, 30
Prosedur Pengujian, 86 variasi, 11, 84, 91, 104, 114,
Rancangan Pengukuran 127
Berulang, 84, 92, 93 vektor, 5, 12, 13, 14, 15, 16,
rata-rata, 3, 12, 14, 15, 16, 21, 20, 21, 27, 28, 30, 33, 34,
25, 27, 28, 29, 30, 31, 37, 35, 36, 37, 39, 40, 42, 57,
39, 42, 44, 53, 57, 70, 76, 58, 69, 71, 72, 73, 79, 80
77, 79, 85, 86, 87, 88, 89, vektor eigen, 33, 34, 35, 71, 72
90, 91, 92, 93, 94, 95, 97, Wilks, 68, 120, 121, 141, 142,
98, 99, 101, 103, 105, 108, 143
109, 110, 113, 114, 117,

155
TENTANG PENULIS

Irwan, S.Si., M.Si, lahir di Lisu-Kabupaten Barru pada


Tahun 1978 bulan September tanggal 22.
Menyelesaikan Pendidikan magister pada Jurusan
Statistika Institut Teknologi Sepuluh November
Surabaya pada Tahun 2006, Tahun 2003
menyelesaikan studi pada Jurusan Matematika
Universitas Negeri Makassar. Selama mengikuti
Pendidikan penulis terlibat pada beberapa organisasi,
asisten dosen, tim asisten di Laboratorium Komputer Matematika.
Sejak Tahun 2006, penulis mulai aktif mengajar di Jurusan
Matematika Fakultas Sains dan Teknologi Univeristas Islam Negeri
Makassar hingga sekarang. Mengikuti berbagai pelatihan professional
dan juga sebagai trainer-Pelatihan Modul Dasar BTL, LSE, ICT bagi guru
SMT/MTS mitra DBE3 USAID Indonesia-2008-2009, fasilitator pada
workshop pembelajaran PAKEM dan penggunaan alat peraga
matematika bagi guru SD/MI se-kabupaten Bulukumba.
Jabatan Struktural- Ketua Jurusan Matematika, Sekretaris LPM UIN
Alauddin Makassar.

156
Adnan Sauddin, lahir Teomokole pada Tahun 1974
bulan Mei tanggal 17. Suatu daerah kepulauan
(Pulau Kabaena) di Kabupaten Bombana. Anak ke-
16 dari enambelas bersaudara.
Menyelesaikan Pendidikan magister pada Jurusan
Statistika Institut Teknologi Sepuluh November
Surabaya pada Tahun 2007, Tahun 2000
menyelesaikan studi pada Jurusan Pendidikan Matematika Institut
Keguruan dan Ilmu Pendidikan (Tahun 1998 berubah menjadi UNM).
Selama mengikuti Pendidikan penulis terlibat pada beberapa
organisasi .
Sejak Tahun 2000, penulis mulai aktif mengajar di Lembaga
Pendidikan-STMIK Balikpapan-dan berkesempatan mengiktui berbagai
pelatihan professional. Pada Tahun 2013 penulis hijrah ke Sulawesi
selatan dan terdaftar sebaik pengajar pada Jurusan Matematika
Fakultas Sains dan Teknologi Univeristas Islam Negeri Makassar
hingga sekarang.

157
Alauddin University Press
Irwan, S.Si., M.Si.
Irwan, S.Si., M.Si, lahir di Lisu, Kabupaten Barru pada Tahun 1978 Adnan Sauddin, S.Pd., M.Si.
bulan September tanggal 22. Menyelesaikan Pendidikan Magister
pada Jurusan Statistika Institut Teknologi Sepuluh November
Surabaya pada tahun 2006, Tahun 2003 menyelesaikan studi pada
Jurusan Pendidikan Matematika Universitas Negeri Makassar.
Selama mengikuti Pendidikan penulis terlibat pada beberapa
organisasi, asisten dosen, tim asisten di Laboratorium Komputer
Matematika.
Sejak tahun 2006, penulis mulai aktif mengajar di Jurusan
Matematika Fakultas Sains dan Teknologi Universitas Islam Negeri

STATISTIKA

S T A T I S T I K A
Alauddin Makassar hingga sekarang. Mengikuti berbagai pelatihan
profesional dan juga sebagai trainer-Pelatihan Modul Dasar BTL,
LSE, ICT bagi guru SMT/MTS mitra DBE3 USAID Indonesia-2008-
2009, fasilitator pada workshop pembelajaran PAKEM dan
penggunaan alat peraga matematika bagi guru SD/MI se-
kabupaten Bulukumba. Jabatan Struktural, Ketua Jurusan
Matematika, Sekretaris LPM UIN Alauddin Makassar.
MULTIVARIAT

M U L T I V A R I A T
Adnan Sauddin, lahir Teomokole pada Tahun 1974 bulan Mei
tanggal 17. Suatu daerah kepulauan (Pulau Kabaena) di Kabupaten
Bombana. Anak ke-16 dari enam belas bersaudara. Menyelesaikan
Pendidikan Magister pada Jurusan Statistika Institut Teknologi
Sepuluh November Surabaya pada tahun 2007, Tahun 2000
menyelesaikan studi pada Jurusan Pendidikan Matematika Institut
Keguruan dan Ilmu Pendidikan (tahun 1998 berubah menjadi
UNM). Selama mengikuti Pendidikan penulis terlibat pada
beberapa organisasi .
Sejak tahun 2000, penulis mulai aktif mengajar di Lembaga
Pendidikan -STMIK Balikpapan- dan berkesempatan mengikuti
berbagai pelatihan profesional. Pada tahun 2013 penulis hijrah ke
Sulawesi Selatan dan terdaftar sebaik pengajar pada Jurusan
Matematika Fakultas Sains dan Teknologi Universitas Islam Negeri
Alauddin Makassar hingga sekarang.
Irwan, S.Si., M.Si. & Adnan Sauddin, S.Pd., M.Si.

ISBN 602-328-456-6

9 786023 284566
Alauddin University Press

Alauddin University Press

Anda mungkin juga menyukai