Anda di halaman 1dari 122

Pertemuan 1

ANALISIS PEUBAH
GANDA
(Multivariate Analysis)
DR. AZKA UBAIDILLAH
Cakupan 1.
2.
Aspek-aspek Analisis Multivariat (Peubah Ganda) dan Review Aljabar Matriks
Geometri Sampel dan Random Sampling

Materi 3.
4.
Inferensia vektor rata-rata suatu populasi
Inferensia vektor rata-rata pada data berpasangan, pengukuran berulang dan
dua populasi independent
5. One-way MANOVA
6. Two-way MANOVA
7. MANCOVA
8. Analisis Komponen Utama
9. Analisis Faktor
10.Analisis Peubah Ganda Metode Grafik (Biplot, Correspondence Analysis)
11.Analisis Cluster
12.Analisis Korelasi Kanonik
13.Analisis Diskriminan
Referensi
 Johnson, Richard A and Dean W. Wichern. Applied Multivariate
Statistical Analysis, fifth ed. Prentice-Hall, Inc. New Jersey. 2002.
 Dillon, William R and Matthew Goldstein. Multivariate Analysis
Methods and Applications. John Wiley & Sons, Inc. Canada. 1984.
 Hair Jr, Joseph F, et all. Multivariate Data Analysis, fifth ed.
Prentice-Hall, Inc. New Jersey. 1998.
 Hardle, W and Simar, L. Applied Multivariate Statistical Analysis,
second ed. Springer-Verlag. 2007
Analisis Peubah Ganda
Pengertian :
Adalah suatu metode Statistika yang digunakan
untuk menganalisa data dari beberapa variabel
yang diukur secara simultan untuk menerangkan
fenomena kompleks yang mungkin hanya bisa
diterangkan dengan mengumpulkan dan analisa data
dari berbagai variabel yang simultan.
Tujuan Analisis Peubah Ganda (1)
 Reduksi Data dan menyederhanakan model/struktural
Fenomena yang diteliti terwakilkan sesederhana [mungkin] tanpa banyak kehilangan informasi
yang berharga, serta diharapkan dapat membuat interpretasinya menjadi lebih mudah.
 Pengelompokkan/Klasifikasi
Mengklasifikasikan objek atau individu dalam kelompok-kelompok tertentu berdasarkan
ke”mirip”an sejumlah karakteristik tertentu yang diukur.
 Menyelidiki hubungan/keterkaitan antar variabel
apakah seluruh variabel saling bebas?
apakah satu atau lebih bergantung pada variabel lainnya? Jika ya, bagaimana bentuk
hubungan tersebut?
Tujuan Analisis Peubah Ganda (2)
 Prediksi
Hubungan antar variabel harus ditentukan untuk keperluan
mempredikdi suatu nilai dari satu atau lebih variabel berdasarkan
pada pengamatan pada variabel lainnya
 Membentuk dan menguji hipotesis
Menyatakan hipotesis statitik yang dirumuskan dalam bentuk
parameter dari populasi multivariat, kemudian dilakukan
pengujian hipotesis tersebut
Klasifikasi Analisis Peubah Ganda
 Teknik dependensi, dapat didefinisikan sebagai
variabel mana saja yang merupakan penjelas dan yang
mana yang dijelaskan
 Sedangkan teknik interdependensi tidak ada satu
variabel atau sekelompok variabel yang didefinisikan sbg
variabel bebas atau tak bebas (hanya var X atau Y saja),
variabel di dalam gugus data dilibatkan secara simultan
Teknik Dependensi
Variabel Dependen
Variabel Independen Satu >1
Metrik Non Metrik Metrik Non Metrik
An. Diskriminan
Metrik Regresi Korelasi Kanonik An. DIskrminan Multipel
Reg-Log
Satu
An. DIskrminan Multipel
Non Metrik Uji t An. Diskriminan diskrit MANOVA
Diskrit
An. Diskriminan
Metrik RLB Korelasi Kanonik An. DIskrminan Multipel
Reg-Log
> Satu
An. Diskriminan diskrit An. DIskrminan Multipel
Non Metrik ANOVA MANOVA
An. Konjoint Diskrit
Teknik Interdependensi
Jenis Data
Banyaknya Variabel
Metrik Non Metrik
Tabel Kontingensi 2 arah
Dua Korelasi Sederhana
Model Log Linier
AKU Tabel Kontingensi 2 arah
Lebih dari 2 An.Faktor Model Log Linier
An. Kluster An.Korespondensi
Organisasi Data
Ilustrasi pengukuran karakteristik atau variabel (biasa disebut data) dapat
ditampilkan dalam berbagai cara:
• Tabel
• Matirks
• Grafik, plot data
• Verbal
Data multivariate yang dikumpulkan, dengan cara memilih sejumlah p≥1
variabel atau karakteristik untuk dicatat dari objek amatannya, bisa digunakan
notasi untuk menyatakan nilai dari variabel ke-k pada amatan yang ke-j
Ilustrasi Susunan Data

Matriks Data n × p
Ilustrasi Data
Ukuran Statistik Deskriptif -> ukuran pemusatan, ukuran penyebaran/variasi, ukuran
keeratan hubungan.
Misalkan adalah n buah pengukuran pada variabel pertama, maka
rata-rata sampel dari variabel tsb dinotasikan sebagai :

Rata-rata sampel yang dihitung dari n amatan untuk setiap p variabel, secara umum
dapat dinotasikan:
Ilustrasi Data
Ukuran penyebaran/variasi
Varians/Ragam sampel dari dinotasikan sebagai :

Perlu diperhatikan:
• Untuk sampel kecil, penggunaan pembagi (n-1) lebih tepat dibandingkan
dengan n.
• Dalam analisis Multivariat, varians sampel berada dalam diagonal utama dari
matriks ragam peragam.
Ilustrasi Data
Varians/Ragam sampel dari dinotasikan sebagai :

Covarians/Peragam sampel dari dinotasikan sebagai :

Matriks Ragam-Peragam sampel dari dinotasikan sebagai :


Ilustrasi Data
Statistik deskriptif yang banyak digunakan dalam analisis multivariate adalah
koefisien korelasi sebagai ukuran hubungan linier antara dua variabel:

Matriks Korelasi:
Aljabar Matriks dan
Vektor Acak
DR. AZKA UBAIDILLAH
Konsep Jarak (Distance Concept)
 Konsep Jarak (distance) digunakan untuk mengkaji sebaran tiap
amatan terhadap ukuran pemusatan data, deteksi outlier, maupun
kesamaan karakteristik.
 Ukuran Jarak (distance):
1. Euclidean Distance
2. Mahalanobis Distance
Euclidian Distance (1)
 Setiap koordinat berkontribusi sama dalam jarak
 Semakin besar ukuran, semakin besar jarak
 Tidak memperhitungkan hubungan antar variabel
 Tidak robust
 Kurang cocok jika ternyata nilai amatan yang digambarkan
memiliki fluktuasi ataupun arah yang sangat beragam.
Euclidian Distance (2)
 Misalnya P=(x1,x2),merupakan nilai dua amatan yang digambarkan dalam
sumbu koordinat ,maka jarak P terhadap titik pusat 0= (0,0) adalah:

 Selanjutnya dapat dibuat bentuk umum:


untuk ¿
untuk
Mahalanobis Distance
 Memperhatikan keragaman nilai amatan (variasi)
 Disebut sebagai ”ukuran jarak secara statistik”
Euclidean vs Mahalanobis Distance

Euclidian Distance Mahalanobis Distance


Vektor
 DEFINISI
 PANJANG VEKTOR
 SUDUT ANTARA 2 VEKTOR
 VEKTOR ORTHOGONAL
 TURUNAN VEKTOR
Panjang Vektor (Norm)
Definisi:
Panjang vektor A sering disebut norm a disimbolkan dengan . Dari
teorema phitagoras terlihat bahwa sebuah vektor

akan mempunyai panjang:


Panjang Vektor (Norm)
Sebuah vektor 𝐚 berukuran memiliki panjang (norm) yang
didefinisikan sebagai :

Dan vektor normal dari a adalah:


Perkalian Titik (Dot Product) (1)
Jika u dan v adalah vektor-vektor dalam ruang berdimensi 2 atau 3
dan θ adalah sudut antara u dan v, maka hasil kali titik u.v
didefinisikan:

jika u ≠ 0 dan v ≠ 0,

jika u = 0 dan v = 0
Perkalian Titik (Dot Product) (2)
Misal u = (u1, u2, u3) dan v = (v1, v2, v3) adalah dua vektor tak nol. Jika θ adalah sudut
antara u dan v, maka hukum cosinus menghasilkan:

z
P(u1, u2, u3)
u
Q(v1, v2, v3)
v
y
x
VEKTOR ORTOGONAL
 Vektor-vektor yang tegak lurus disebut juga vektor-vektor ortogonal
 Dua vektor u dan v tegak lurus/ortogonal jika dan hanya jika
u.v = 0, ditulis u┴v.
 u dan v ortogonal jika dan hanya jika cos θ = 0, dimana θ adalah
sudut antara u dan v. Jika u dan v saling tegak lurus, yaitu θ = π/2
atau θ = 90°.
NORMALISASI VEKTOR
Norm suatu Vektor
Catatan: jika atau jika u.u = 1, maka u disebut vektor satuan
atau dikatakan dinormalisasi.
Setiap vektor satuan bukan nol, dapat dikalikan dengan kebalikan
(resiprokal) dari panjangnya untuk mendapat vektor satuan

yg merupakan kelipatan positif dari v. Proses ini disebut normalisasi v


KOMBINASI LINEAR
Misalkan V adalah suatu ruang vektor atas medan K. Vektor v dalam V
adalah kombinasi linear dari vektor-vektor u1, u2, ..., um dalam V jika
terdapat skalar-skalar a1, a2, ...am dalam K sedemikian rupa sehingga
v = a1u1+a2u2+ ...+amum
Atau
v adalah kombinasi linear dari u1, u2, ..., um jika terdapat solusi bagi
persamaan
v = a1u1+a2u2+ ...+amum
dimana a1, a2, ...am adalah skalar-skalar yg tidak diketahui.
KOMBINASI LINEAR
Contoh:
v = (3,7,-4) pada R3 adalah kombinasi linear dari vektor-vektor: u1 = (1,2,3),

u2 = (2,3,7), u3 = (3,5,6), maka tentukan skalar-skalar x,y,z sedemikian rupa


sehingga v = a1u1+a2u2+ ...+amum, yaitu:

Dengan solusi a=2, b=-4 dan c=3. Jika tidak terdapat solusi, maka bukan
kombinasi linear.
Bebas Linier (1)
DEFINISI: Jika S = {u1,u2, ...um } adalah suatu himpunan vektor-vektor
tak kosong, maka persamaan vektor
a1u1+a2u2+ ...+amum= 0
mempunyai paling tidak satu penyelesaian, yaitu
a1= 0, a2= 0, ..., am=0.
Jika ini adalah satu-satunya penyelesaian, maka S disebut suatu
himpunan yang bebas secara linear. Jika ada penyelesaian-
penyelesaian lainnya, maka S disebut himpunan yang tak bebas
secara linear.
Bebas Linier
TEOREMA: Suatu himpunan S = {u1,u2, ...um } dengan beberapa vektor
disebut:
a. Tak bebas secara linear jika dan hanya jika paling tidak salah satu
vektor dalam S dapat dinyatakan sebagai suatu kombinasi linear
dari vektor-vektor lainnya dlm S.
b. Bebas secara linear jika dan hanya jika tidak ada vektor dalam S
yang dapat dinyatakan sebagai suatu kombinasi linear dari vektor-
vektor lain dalam S.
Matriks
Secara umum matriks dapat dituliskan sbb :

m, n adalah bilangan bulat ≥ 1.


aij = elemen-elemen dari matriks (i = 1, 2.......m).. (j = 1, 2 .......n)
m  banyak baris
n  banyaknya kolom
Matriks biasanya ditulis dengan notasi (A)
Macam-macam matriks
Matriks bujur sangkar, bila m = n

Elemen-elemen a11, a22, .........., ann disebut “elemen-elemen


diagonal utama”
Macam matriks
Matriks baris, bila m = 1

[ A ]mx1
Matriks kolom, bila n = 1

[ A ]1x n
Macam matriks
Matriks nol, bila aij =0:
TYPE MATRIKS BUJUR SANGKAR
Matriks Diagonal,
Jika semua elemen sama dengan nol, kecuali
elemen-elemen diagonal utamanya.

aij = 0
aii ≠ 0
TYPE MATRIKS BUJUR SANGKAR

Matriks Satuan (unit matrix).


Jika elemen-elemen diagonal sama dengan 1 dan elemen-elemen
yang lain sama dengan nol.

= [I]

Disebut juga matriks identitas = [ I ]


TYPE MATRIKS BUJUR SANGKAR
Matriks simetris, jika aij = aji

Matriks skew-simetris, jika aij = - aji


OPERASI MATRIKS
Kesamaan matriks
Dua matriks [A] dan [B] dikatakan sama bila elemen matriks
aij = bij
[ A ] dan [ B ] harus mempunyai orde yang sama.
OPERASI MATRIKS
Penjumlahan matriks
Bila [A] dan [B] punya orde yang sama, maka kedua matriks tersebut
bisa dijumlahkan menjadi matriks [C]
[C] = [A] + [B]
cij = aij + bij
Sifat-sifat penjumlahan Matriks
[A]+[B]=[B]+[A] → Komutatif
[ A ] + [ B ] + [ C ] = ([ A ] + [ B ]) + [ C ] → Assosiatif
EXAMPLE :

[A] = [B] =

[C] =

[C] =
OPERASI MATRIKS
Perkalian dengan skalar :
 Suatu matriks [A] dapat dikalikan dengan bil.skalar k
menghasilkan suatu matriks
[D] = k [A]
dij = k . aij

 Sifat-sifat perkalian skalar matriks:


k ( [A] + [B] ) = k [A] + k [B]
k ( [A] + [B] ) = ( [A] + [B] ) k
EXAMPLE :

; k = -2
OPERASI MATRIKS
Perkalian matriks
Matriks [A]mxp dan [B]pxn dapat dikalikan menghasilkan
matriks baru
[E]mxn = [A]mxp [B]pxn

dimana :
i = 1, 2, … m ; j = 1, 2, … n ; k = 1, 2, … p
EXAMPLE :

;
Sifat-sifat perkalian matriks :
 [A] ( [B] + [C] ) = [A] [B] + [A] [C] ; sifat distributif
 [A] ( [B] [C] ) = ( [A] [B] ) [C] ; sifat assosiatif
 [A] [B] ≠ [B] [A]
 [A] [B] = [A] [C] ; belum tentu [B] = [C]
Perkalian Kronecker
Perkalian Kronecker C dengan D dinotasikan:

Yaitu dengan mengalikan setiap unsur matriks C dengan matriks D,


dan kemudian membuat matriks gabungannya.
TRANSPOSE
MATRIKS

Jika matriks [A] dengan orde m x n

Transpose matriks [A] = [A]T


adalah matriks berorde n x m dengan baris dan kolom matriks [A]
menjadi kolom dan baris matrix [A]T

EXAMPLE :
Sifat-sifat dari transpose matriks
 ( [A]T )T = [A]

 ( k [A] )T = k [A]T

 ( [A] + [B] )T = [A]T + [B]T

 ( [A] [B] )T = [B]T [A]T


DETERMINAN MATRIX BUJUR
SANGKAR
[A]2x2 =

Co-factor bij = ( –1) i+j Minor bij


INVERS MATRIKS BUJUR
SANGKAR
 Matriks tidak bisa dibagi dengan matriks lainnya. Maka, digunakan
INVERSE dari matriks tersebut.
 Apabila [A] dan [B] adalah matriks bujur sangkar, dan [A] [B] = [I] =
[B] [A], maka
 matriks [B] disebut inverse dari matrix [A], dan
 matriks [A] adalah inverse dari matriks [B].
 Selanjutnya [A] disebut matriks NON SINGULAR
 Bila [A] tidak punya inverse disebut matriks SINGULAR.
 Inverse dari matriks [A] biasa ditulis [A]-1
EXAMPLE :

[A] = ; [A]-1 =

[A] [A]-1 = =[I]

Catatan :
Untuk mencari inverse suatu matrix dapat dipakai beberapa
metoda, antara lain : metode ad-joint, metode pemisahan,
metode Gauss-Jordan, metode Cholesky, dsb.
PARTISI MATRIKS

Suatu matriks bisa dipartisikan menjadi SUB-MATRIKS dengan cara hanya


mengikutkan beberapa baris atau kolom dari matriks aslinya.
Aturan-aturan yang dipakai untuk mengoperasikan matriks partisi persis sama
dengan mengoperasikan matriks biasa

dimana ;
EXAMPLE :

sehingga ;
MATRIKS ORTHOGONAL
Matriks P berdimensi , dikatakan orthogonal jika ,
sehingga

TEOREMA
Misalkan P dan Q matriks orthogonal dan A adalah
sembarang matriks , maka
(a) |P| = ±1
(b) |P’AP| = |A|
(c) PQ adalah matriks orthogonal
TRACE
MATRIKS
Trace Matriks A berdimensi , didefinisikan sebagai

Sifat Operasi trace:

(a) tr (A±B)=tr (A) ±tr (B)


(b) tr (CD)=tr (DC), implikasinya tr (C’C)=tr (CC’)=
RANK MATRIKS
RANK MATRIKS Matriks A (nxp) adalah maksimum banyaknya baris atau
kolom yang bebas linear atau ordo terbesar matrik A atau minornya yang
determinannya tidak sama dengan nol
Sifat-sifat:
0≤r(A) ≤min (p,n)
r(A)=r(A’)
Matriks Singular dan Nonsingular
Matriks A ukuran n x n dikatakan singular jika semua baris atau kolomnya
saling bebas linier ->Determinannya sama dengan 0.
Akar Ciri dan Vektor Ciri
Untuk matriks A berukuran pxp maka pasangan‐pasangan ( ),…,( )
dikatakan sebagai pasangan akar ciri dan vektor ciri jika berlaku:
|A – λI|=0 , dimana I matriks identitas berukuran pxp
 A = , dst , A =
BENTUK KUADRAT

Misal A adalah matrik berukuran n x n dan x adalah vektor


peubah berukuran n x 1 maka:
MATRIKS DEFINIT POSITIF, SEMI DEF.
POSITIFF
Matriks simetrik berukuran n x n bersifat:
 Definit positif jika
x’Ax > 0 untuk sembarang vektor x ≠ 0, semua nilai akar cirinya (+)
 Semidefinit positif jika
x’Ax ≥ 0 untuk sembarang vektor x ≠ 0, nilai akar cirinya(+) dan 0
 Kalau Matriks A bersifat simetris, maka akar ciri dari A adalah riil
dan memiliki vektor ciri yang saling bebas (ortogonal).
RANDOM VEKTOR &
MATIKS
Random vektor : vektor yang elemennya merupakan random variable
Random matriks : matriks yang elemennya merupakan random vektor

Merupakan Random mariks berukuran


, maka nilai ekpektasi dari setiap nilai X
VEKTOR RATA-RATA & MATRIKS
VAR-COV
MATRIKS KORELASI
MATRIKS KORELASI (2)
Latihan
Exercise: 2.1, 2.5, 2.6, 2.7, 2.8, 2.9,2.21,
2.24, 2.25, 2.32, 2.33, 2.41, 2.42
Sample Geometry and
Random Sampling
DR. AZKA UBAIDILLAH
Outline
A. Sample Geometry
B. Random Sample and Expected Value
C. Generalized Variance
D. Matrix operation for Mean, Covariance and Correlation
Matrix
D. Linear Combination of Random Sample Matrix
A. Geometri nilai-nilai sampel

Data sampel dapat dinyatakan dalam bentuk matriks sbb:

Observasi
multivariate
saling bebas
 Centroid of the population adalah titik yang merupakan rata-rata populasi
data dari p variables,
 Centroid of the sample adalah titik yang merupakan rata-rata sampel data dari
p variables.
 Misal untuk sebuah sampel dari 2 variabel dan 3 amatan :

dan x2
centroid of
x11,x12 the sample
_x•1,x
_ •2
x21,x22 x31,x32

x1
pada p = 2 variabel or ‘row’ space ( nilai baris digunakan sbg
penunjuk koordinat)
Untuk data yang sama

diplot dalam ‘column’ space (nilai kolom sebagai penunjuk


koordinat), menjadi:
3

centroid of
x11,x21 ,x31 the sample

_ _ _ 2
x1•,x2•,x3• x12,x22 ,x32
Misalkan data adalah sbb:

Pada row space dengan p = 2 maka plot data dalam scatter diagram

x2
x21,x22
centroid of
(1,7) the sample

x11,x12

x1
Untuk data yang sama:

Pada column space dengan n = 2 plot dimensi maka

2
x12,x22

centroid of
the sample
(4,4)

1
x11,x21
Misal diperoleh data sbb:

pada row space dengan p = 3 dimensi scatter diagram

x3

x31,x32,x33
centroid of
x11,x12,x13
the sample
(-1,4,5)

x21,x22,x23 x1

x2
Untuk data yang sama:

Pada column space dengan n = 3 dimensi scatter diagram

x13,x23,x33

(4,3,1)
x12,x22,x32 1
titik pusat data (4,3,1).
2
x11,x21,x31
Dengan column space akan diperoleh suatu penggambaran geometri dari
pemusatan data. Dimisalkan kita memiliki plot sebuah vektor satuan
berukuran n x 1:

Pada ruang dimensi 3 (n =


3):
1,1,1

2
Vektor tsb memiliki besar sudut yang sama dengan masing-
masing sumbu koordinat, sehingga normalisasi vektor tsb
adalah:
Dimisalkan beberapa vektor yi (representasi dari berbagai nilai sampel
dari random variable X). ~

Pada n = 3 dimensi, x1,x2,x3


diketahui:

2
Proyeksi yi pada unit vektor didefinisikan sebagai
~

Pada n = 3 dimensions ,
diketahui:
y
~i

1 1
~

2
_
Penggunaan vektor satuan sebagai pengali xi , karena proyeksi yi pada
garis 1!
~ ~
Menggunakan teorema Pythagoras, panjang vektor yang tegaklurus
dengan proyeksi y pada 1 adalah . ~

Pada n = 3 dimensions ,
diketahui:

y
~i

1 1
~

2
sehingga vektor deviasi (atau
selisih thd rata-rata) adalah:
Contoh:

dengan vektor rata-ratanya:

_ _ _
x1 = -1.0, x2 = 4.0, dan x3 = 5.0.
sehingga
_
Note xi1 ~ d i =1 ,…,p .
i
~
Jika dilakukan dekomposisi nilai y
Memperhatikan vektor deviasi yang diperoleh

kemudian kita plot nilai vektor deviasi (or residual) tsb (tanpa mengubah
arah/panjangnya )
3

2
Maka jika kita kuadratkan atau panjang vektor deviasi tsb adalah :

Kuadrat panjang vektor sum of the squared


deviasi deviations

dan diketahui varians sampel adalah:

sehingga dapat ditunjukkan bahwa kuadrat panjang vektor


deviasi proporsional thd nilai varians variabelnya ( semakin
panjang vektor, nilainya semakin bervariasi, vice versa)
Kemudian, perkalian dua vektor std deviasi akan diperoleh :

Misalkan, sudut antara dua vektor deviasi adalah qik , maka

sehingga:
atau dengan cara lain

dan

sehingga
sehingga,
Contoh:

dengan hasil vektor deviasinya adalah

Definisikan matrik covarian dan korelasi sampelnya.


Diketahui:
dan:
maka:

dan
B. Random Samples and the Expected Values dari m dan S
~
Misal dari sejumlah pengamatan sejumlah n sampel dengan p variabel,
dengan setiap sel merupakan random varibel Xjk. Sehingga setiap Xj pada
variabel p merupakan random vektor,

Observasi
multivariate
yang saling
bebas

Konsep ini yang kemudian disebut dengan random sample.


Random Sample dalam suatu vektor
- merepresentasikan observasinya saling independent
- dengan bentuk distribusi peluang bersama nya adalah

sehingga

merupakan random sample dari

Observasi tsb memiliki fungsi peluang bersama:


Perhatikan 2 konsep mengenai random sampel
 Nilai dari p variabel untuk sekali percobaan

akan selalu berhubungan. Adapun nilai dari percobaan (observasi)


yang lain [harus] independent.
 Namun indepedensi dari nilai amatan untuk percobaan yang berbeda
akan terlanggar, jika datanya merupakan data yang memiliki
komponen serial (urutan)
Note: m dan S memiliki beberpa properties, apapun distribusi gabungan
dari random variablesnya.
Misal

merupakan random sample dari sutau distribusi gabungan tertentu dengan


vektor rata-rata m and covariance matrix S. Maka:

- x adalah penduga tak bias dari m, i.e., E(x) = m, dan


_
matriks covariannya adalaha _
- Nilai ekspektasi Matriks covarians sampel Sn :

bias

shg, Sn merupakan penduga yang bias dari S, namun


Sehingga matriks var-cov S penduga tak bias dapat didefinisikan sebagai:

dengan elemen ke-(i,k) adalah


Contoh:

Matriks S yang tak bias adalah


Dan nilai matriks tsb tidak memberikan efek pada penghitungan nilai
matriks korelasi sampelnya
C. Generalized Variance pada P Dimensi

Dimisalkan matriks varian covarians adalah

Generalized Sample Variance adalah |S|, yaitu determinan dari matriks S.


Penghitungan nilai GV, akan menghilangkan informasi mengenai nilai Var-
Cov data
Namun, berdasarkan geometri of |S| pada dua dimensi, akan diperoleh 2
ukuran deviasi varibelnya

daerah diatas memiliki luas :


Dengan sin2(q) + cos2(q) = 1, maka luas trapezoid tsb adalah

dari sebelumnya, diketahui

dan cos(q) = r12.


sehingga dengan subtitusi

dan diketahui :

Maka
sehingga secara umum nilai Generalized Variance sampel adalah

sehingga generalized variance sampel (untuk suatu set data) proporsional


dengan ukuran luas dikuadratkan (vol kuadrat) dari bangun yang dibentuk
oleh vektor deviasi sebanyak p .

Catatan:

- GV sampel membesar, jika ada vektor deviasi yang memanjang, yang


menyatakan variasi di dalam variabel juga memebesar
- GV sampel membesar, jika arah dari 2 vektor deviasi semakin membesar
(korelasinya mengecil)
Sehingga dapat di ilustrasikan GV sampel berubah saat terjadi perubahan
panjang dari vektor deviasi d2 (variasi dalam variabel tsb juga berubah):

3 3

1 1

2 2

Vektor deviasi d2 bertambah panjang c kali , c >1


GV mengecil karena d2 dan d3 , sudutnya mengecil, semakin mirip

3 3

1 1

2 2
q23 = 900, i.e., d2 dan d3 00< q23 < 900, i.e., d2 dan d3 bergerak
orthogonal (x2 and x3 tidak pada sudut yang searah (x2 dan
berkorelasi) berkorelasi positif)
Result:

GV=0, jika dan hanya jika minimal ada 1 vektor


deviasi terletak pada vektor devaisi lainnya
(berimpit), atau:

• Sebuah vektor deviasi merupakan kombinasi


linear dari vektor deviasi yang lain
• Sebuah variabel tepat berkorelasi dengan sebuah
kombinasi linier dengan variabel lainnya
• Rank matrik datanya tidak penuh
• Deteminan Matrik Var-Cov sama dengan 0
Contoh: Misalkan kita memiliki 3 set data dengan titik pemusatan (3, 3) dan
generalized variance |S| = 9.0 yang sama:

Data Set A
Data Set B
Data Set C
Nilai Generalized Variance juga tergantung pada:
- Varians-covarians matriks variabel yang

distandarkan, i.e., |R|

- total varians sampel , i.e., Mengabaikan perbedaan variasi


nilai variabel per individu

Mengabaikan korelasi antar 2


variabel
D. Operasi Matriks untuk penghitungan Matriks rata-rata, varians-covarians
dan korelasi sampel
Misalkan diberikan sebuah matriks X

maka
Maka juga dapat didefinisikan sebuah matriks rata-rata berukuran n x p

Sehingga jika matriks data dikurangi dengan matrisk diatas adalan


diperoleh: ~

yang merupakan matriks deviasi berukuran n x p


dan hasil perkalian cross product nilai (n – 1) dan matriks S adalah:
Sehingga matriks var-cov sampel yang tidak bias adalah

hampir mirip dengan definisi matrik var-cov sampel yang bias


Jika berikan nilai 0 pada elemen di luar diagonal utama pada matriks Var-
Cov sampel dan menarik akar dari elemennya, maka akan diperoleh matriks
standar deviasi sebagai berikut:

dan inverse matriks nya :


Karena matriks Var-Cov adalah:

dan matriks korelasinya:


maka

sehingga hal tsb menunjukkan bahwa matriks variance-covariance S


merupakan fungsi dari matriks korelasi :
E. Nilai sampel yang saling berkombinasi linier dalam suatu variabel

Misalkan dalam suatu kombinasi linier dari p variables

dengan nilai observasi pada amatan ke-j adalah

maka dapat diperoleh untuk n pengamatan


Dan jika dimisalkan kombinasi kedua dari p variabel adalah:

dan nilai amatan ke –j adalah :

maka kedua kombinasi linier tsb akan memiliki


Atau
Jika kita misalkan sebuah matriks A berukuran q x p dengan baris ke –k berisi
kombinasi linier dari p variabel, maka untuk q kombinasi linier akan memiliki
Tugas Kelompok

Kerjakan Exercise 3.1 sampai


3.20 di Buku Jhonson 6th edition.
Setiap kelompok memilih 4 soal
yang berbeda dari kelompok
lainnya.

Anda mungkin juga menyukai