Kepadatan normal multivariat merupakan generalisasi dari densitas normal univariat untuk p ≥ 2
dimensi. Ingat bahwa distribusi normal univariat, dengan mean μ dan variance σ2, memiliki fungsi
kepadatan probabilitas
Gambar 4.1 Sebuah kepadatan normal dengan mean μ dan varians σ2 dan daerah yang dipilih di bawah
kurva.
Sebuah plot fungsi ini menghasilkan umumnya kurva berbentuk lonceng yang ditunjukkan pada
Gambar 4.1. Juga ditunjukkan pada gambar adalah daerah perkiraan di bawah kurva dalam ± 1 standar
deviasi dan ± 2 standar deviasi dari mean. Daerah ini merupakan probabilitas, dan dengan demikian,
untuk variabel acak normal X,
P( μ – σ ≤ X ≤ μ + σ ) = 0.68
P(μ – 2σ ≤ X ≤ μ + 2σ ) = 0.95
Hal ini mudah untuk menunjukkan fungsi kepadatan normal dengan mean μ dan varians σ2 oleh N (μ,
σ2 ). Oleh karena itu, N (10, 4) mengacu pada fungsi dalam (4-1) dengan μ = 10 dan σ = 2. Notasi ini
akan diperluas ke kasus multivariat.
Istilah
2
x
( x )( ) ( x )
2 1
(4.2)
dalam eksponen dari univariat fungsi densitas normal mengukur kuadrat jarak dari x ke μ dalam satuan
deviasi standar. Hal ini dapat digeneralisasi untuk px1 vektor pengamatan x pada beberapa variabel
seperti
(x – μ )’ Σ-1 (x – μ ) ( 4.3)
Rataan px1 vektor μ merupakan nilai yang diharapkan dari random vektor X, dan pxp matriks Σ
adalah matriks varians-kovarians X. Mengasumsikan bahwa matriks Σ simetris adalah definit positif,
sehingga persamaan (4-3) merupakan kuadrat dari generalisasi jarak dari x ke μ.
Kepadatan yang normal multivariat diperoleh dengan mengganti jarak univariat dalam (4-2) oleh
generalisasi jarak multivariat (4-3) dalam fungsi kepadatan (4-1). Ketika penggantian ini dibuat,
konstanta normalisasi univariat (2π)-1/2 (σ2 )-1/2 harus diubah ke sebuah konstanta yang lebih umum
yang membuat volume bawah permukaan multivariat fungsi kepadatan kesatuan untuk setiap p. Dalam
kasus multivariat, probabilitas diwakili oleh volume di bawah permukaan atas wilayah yg
didefinisikan oleh interval nilai xi. Hal ini dapat ditunjukkan dg konstan (2π)-p/2 │Σ│-1/2, dan akibatnya,
kepadatan normal p-dimensi untuk vektor acak X' = [X 1, X2 , … , Xp] memiliki bentuk
1 1
f ( x) 1/ 2
e ( x )' ( x ) / 2
(4.4)
( 2 ) p/2
Akan menunjukkan p-dimensi kerapatan normal oleh Np (p., I), yang analog dengan kepadatan
normal dalam kasus univariat.
Mari kita mengevaluasi p = 2-variate kepadatan normal dalam hal parameter individual
Adalah
Selanjutnya, karena │Σ│= 12 22 122 11 22 (1 122 ) , bias mengganti untuk Σ-1 dan │Σ│di (4.4)
untuk mendapatkan ekspresi untuk bivariat yang (p = 2) densitas normal melibatkan parameter
individu μ1, μ2, σ11, σ22, ρ12 :
Persamaan (4-6) agak rumit, dan bentuk umum dalam (4-4) lebih informatif dalam banyak cara. Di sisi
lain, persamaan (4-6) berguna untuk membahas sifat tertentu dari distribusi normal. Sebagai contoh,
jika variabel acak X1 dan X2 tidak berkorelasi, sehingga ρ12 = 0, kepadatan bersama dapat ditulis
sebagai hasil dari dua univariat kepadatan normal masing-masing bentuk (4-1).
Dua distribusi bivariat dengan σ11 = σ22 ditunjukkan pada Gambar 4.2. Pada Gambar 4.2 (a), X1 dan X2
independen (ρ12 = 0). Pada Gambar 4.2 (b), ρ12 = 0.75.
Gambar 4.2 Dua bivariat distribusi normal.(a) σ11 = σ22 dan ρ12 = 0. (b) σ11 = σ22 dan ρ12 = 0.75
Dari persamaan (4-4) untuk kepadatan variabel yang normal p-dimensi, harus jelas bahwa jalur x nilai
menghasilkan ketinggian konstan untuk kepadatan ellipsoids. Artinya, densitas normal multivariat
konstan pada permukaan dimana kuadrat jarak (x – μ )’ Σ-1 (x – μ ) konstan.
Bentuk ini disebut kontur:
Sumbu masing-masing ellipsoid kepadatan konstan dalam vektor eigen dari Σ-1 , dan panjangnya
sebanding dengan invers dari akar kuadrat dari nilai eigen dari Σ-1.
Result 4.1
Jadi (λ,e ) adalah pasangan eigen-vektor eigen untuk Σ sesuai dengan pasangan (1/λ , e) untuk Σ-1 .
Juga, Σ-1 adalah definit positif.
Bukti
Untuk Σ definit positif dan e ≠ 0 vektor eigen , memiliki 0 < e’ Σe = e’ (Σe) = e’(λe) = λe’e = λ.
Tambahan pula, e = Σ-1 (Σe) = Σ-1 (λe), atau e = λ Σ-1e, dan dibagi dengan λ > 0 memberikan Σ-1e =
(1/λ)e. dengan demikian (1/λ, e) adalah pasangan nilai eigen – vector eigen untuk Σ-1. Juga, untuk x
sembarang px1, dengan (2.21)
karena setiap istilah i1 ( x ' ei ) 2 adalah tidak negatif. Tambahan lagi, x’ei = 0 untuk semua i hanya
p
jika x = 0. Jadi x ≠ 0 menunjukkan bahwa (1 / )( x' e )
i 1
i i
2
0 , dan dapat dikatakan bahwa Σ-1
Kontur kerapatan konstan untuk distribusi normal p-dimensi yang ellipsoids didefinisikan oleh x
sedemikian rupa sehingga
Ellipsoids ini berpusat di μ dan memiliki sumbu c i ei , dimana Σei = λiei untuk i = 1,2, ... , p.
Sebuah kontur kerapatan konstan untuk distribusi normal bivariat dengan σ11 = σ22 diperoleh dalam
contoh berikut.
Contoh 4.2 (Kontur densitas normal bivariat )
Akan diperoleh sumbu kontur kerapatan probabilitas konstan untuk distribusi normal bivariat ketika
σ11 = σ22. Dari (4-7), sumbu ini diberikan oleh nilai eigen dan vektor eigen dari Σ.
11 12
0 ( 11 ) 2 12
2
( 11 12 )( 11 12 )
12 11
Akibatnya, nilai-nilai eigen adalah λ1 = σ11 + σ12 dan λ2 = σ11 - σ12 . Eigenvector ei ditentukan dari
11 12 e1 e
( 11 12 ) 1
12 11 e2 e2
Persamaan-persamaan ini menyiratkan bahwa e1 = e2 , dan setelah normalisasi, pasangan pertama nilai
eigen-vektor eigen adalah
1
2
e1
λ1 = σ11 + σ12, 1
2
Ketika kovarians (korelasi) adalah negatif, λ2 = σ11 - σ12 akan menjadi nilai eigen terbesar, dan sumbu
utama elips konstan-density akan terletak di sepanjang garis pada sudut kanan garis 450 melalui μ.
(Hasil ini berlaku hanya untuk σ11 = σ22 ).
Untuk meringkas, sumbu elips kerapatan konstan untuk distribusi normal bivariat dengan σ11 = σ22
ditentukan oleh
1 1
2
c 11 12 c 11 12 2
1 dan 1
2 2
persentil atas distribusi chi-kuadrat dengan p derajat kebebasan, menyebabkan kontur yang
mengandung (1 - α) x 100% dari probabilitas. Secara khusus, berikut ini berlaku untuk distribusi
normal p-dimensi:
( x )' 1 ( x ) 2p ( ) (4.8)
mempunyai peluang (1 - α)
Kontur konstan-density yang mengandung 50% dan 90% dari kemungkinan di bawah permukaan yang
normal bivariat pada Gambar 4.2 digambarkan pada Gambar 4.4.
Gambar 4.4 50% dan 90% kontur untuk distribusi bivariat normal pada Gambar 4.2.
P-variate kepadatan normal dalam (4-4) memiliki nilai maksimum ketika jarak kuadrat dalam (4-3)
adalah nol, yaitu, ketika x = μ. Dengan demikian, μ adalah titik kepadatan maksimum, atau mode,
serta nilai yang diharapkan dari X, atau mean. Fakta bahwa μ adalah rata-rata dari distribusi normal
multivariat berikut dari simetri ditunjukkan oleh kontur konstan-density: Kontur ini berpusat, atau
seimbang, di μ.
Berikut ini adalah untuk vektor acak X memiliki distribusi normal multivariat:
Result 4.2. Jika X berdistribusi Np(μ, Σ ), maka kombinasi linier dari variabel a’X = a1X1 + a2X2 + …
+ apXp didistribusikan sebagai N( a’μ, a’Σa ). Juga, jika a’X didistribusikan sebagai N( a’μ, a’Σa )
untuk setiap a, maka X harus Np(μ, Σ ).
Bukti. Nilai yang diharapkan dan varians dari a’X mengikuti dari (2-43). Membuktikan bahwa a’X
terdistribusi normal jika X adalah multivariat normal lebih sulit. Dapat ditemukan bukti [1]. Bagian
kedua dari hasil 4.2 juga ditunjukkan dalam [1].
Contoh 4.3 (Distribusi kombinasi linear dari komponen vektor random normal)
Pertimbangkan linear kombinasi a’X vektor acak normal multivariat ditentukan oleh pilihan
a’ = [1,0, ..., 0]. Karena
memiliki
dan maka dari hasil 4.2 yang X1 didistribusikan sebagai N( μ1 ,σ11 ). Secara umum, distribusi marginal
dari setiap komponen Xi dari X adalah N (μi, σii).
Result 4.3
Contoh 4.4. (Distribusi dua kombinasi linear dari komponen vektor random normal)
Atau, rata-rata (mean) vektor Aμ dan matriks kovariansi AΣA’ dapat diverifikasi dengan perhitungan
langsung mean dan covariances dari dua variabel acak Y1 = X1 – X2 dan Y2 = X2 – X3.
Result 4.4. Semua subset dari X terdistribusi secara normal. Jika masing-masing partisi X, vector
mean μ , dan kovarians matriks nya Σ sebagai
Maka X1 didistribusikan sebagai Nq (μ1, Σ11 ).
X1
Jika X didistribusikan sebagai N5 (μ,Σ ) , dapatkan distribusi . Ditetapkan
X 2
dan perhatikan bahwa dengan hal ini, X, μ, dan Σ masing-masing dapat disusun kembali dan dipartisi
sebagai
Atau
X
X1 2
X4
Result 4.5.
a Jika ( qXx11) dan ( X 2 saling bebas, maka Cov (X1, X2) = 0, matriks q1xq2 nol.
q x 1)
1 2
b Jika adalah
,
c Jika X1 dan X2 yang independen dan didistribusikan masing-masing sebagai Nq1 (μ1, Σ11 ) dan Nq2
Diketahui ( 3X
x1) berdistribusi normal N3 (μ,Σ ) dengan
4 1 0
1 3 0
0 0 2
Karena X1 dan X2 mempunyai kovarian σ12 = 1, dua variable tersebut tidak independen. Akan tetapi
,partisi X dan Σ sebagai berikut
X1 0
Lihat bahwa X 1 dan X3 mempunyai matriks kovarian 12 0 . Karena itu, (X1, X2) dan X3
X 2
independen dg Result 4.5. Ini berarti X3 independen pada X1 dan juga X2.
Distribusi normal bivariat yang ρ12 = 0 (korelasi nol ), kasus khusus hasil 4.5 dengan q1 = q2 = 1.
, ,
dan │Σ22│ > 0 . Maka distribusi bersyarat X1, diberikan bahwa X2 = x2 ,adalah normal dan
mempunyai
Mean 1 12 22
1
( x2 2 ) dan 1
Co var ian 11 12 22 21
Perhatikan bahwa kovarians tidak tergantung pada nilai x2 variabel bersyarat.
Kepadatan bersyarat dari X1, mengingat bahwa X2 = x2 untuk distribusi bivariat, didefinisikan oleh
f ( x1 , x2 )
f(x1│x2) = {kepadatan bersyarat dari X1 diberikan bahwa X2 = x2} =
f ( x2 )
dimana f(x2) adalah distribusi marginal dari x2. Jika f(x1,x2) adalah kepadatan bivariat normal ,
tunjukkan bahwa f(x1│x2) adalah
2
N 1 12 x2 2 , 11 12
22 22
Disini σ11 – σ122/σ22 = σ11(1 – ρ122 ). Dua istilah yang melibatkan x1 – μ1 eksponen kepadatan bivariat
normal [lihat Persamaan (4-6)] menjadi, selain dari konstanta perkalian -1/2 (1 – ρ122),
Dengan demikian, dengan notasi yg biasanya , distribusi bersyarat dari X1 mengingat bahwa
( 4.9)
1
3. Kovarians bersyarat, 11 12 22 21 , tidak tergantung pada nilai (s) dari variabel bersyarat
(s).
Distribusi chi-kuadrat menentukan variabilitas sampel varians s2 = s11 untuk sampel dari populasi
normal univariat. Hal ini juga memainkan peran mendasar dalam kasus multivariat.
Hasil 4.7 memberikan interpretasi jarak statistik kuadrat. Ketika X didistribusikan sebagai Np(μ,Σ),
(X – μ)’Σ-1(X – μ)
Adalah jarak statistik kuadrat dari X ke mean populasi vektor μ. Jika salah satu komponen memiliki
varians yang jauh lebih besar daripada yang lain, akan memberikan kontribusi kurang (lebih sedikit)
untuk jarak kuadrat. Selain itu, dua variabel acak sangat berkorelasi akan memberikan kontribusi
kurang dari dua variabel yang hampir tidak berkorelasi. Pada dasarnya, penggunaan kebalikan dari
matriks kovarians, (1) standarisasi semua variabel dan (2) menghilangkan efek korelasi. Dari bukti
Hasil 4.7,
(X – μ)’Σ-1(X – μ) = Z1 Z 2 ... Z p
2 2 2
Result 4.8. Diberikan X1, X2, ..., Xn saling independen dengan Xj didistribusikan sebagai Np (μj, Σ).
(Perhatikan bahwa setiap Xj memiliki matriks kovarians sama Σ.) Maka
n n 2
Didistribusikan sebagai N p c j j , c j . Tambahan pula, V1 dan V2 = b1X1 + b2X2 + … +
j 1 j 1
bnXn adalah multivariate normal gabungan dengan matriks kovarian
n
karena itu, V1 dan V2 independen jika b’c = c j b j = 0
j 1
Contoh 4.8 hal 166 (kombinasi linier dari vektor acak) Diberikan X1, X2, X3, dan X4 akan
independen dan didistribusikan identik ,vektor acak 3x1 dengan
3 3 1 1
1 1 0
μ= dan Σ=
1
1
1 0 2
Kami pertama mempertimbangkan kombinasi a'X1 linear dari tiga komponen X1. Ini adalah variabel
random dengan mean
a’μ = 3a1 – a2 + a3 dan varians a’Σa = 3a12 a22 2a32 2a1a2 2a1a3
Artinya, kombinasi linear a’X1 komponen vektor random adalah variabel acak tunggal yang terdiri
dari sejumlah istilah yang setiap konstanta kali variabel .
Hal ini sangat berbeda dari kombinasi linear dari vektor acak,
1 1 1 1
X1 X 2 X 3 X 4 dan X1 + X2 + X3 – 3X4
2 2 2 2
Cari vektor mean dan matriks kovarians untuk setiap kombinasi linear dari vektor dan juga kovarians
antara mereka.
Dengan Hasil 4,8 dengan c1 = c2 = c3 = c4 = ½, kombinasi linear pertama memiliki rata-rata vektor
6
2
(c1 + c2 + c3 + c4)μ = 2μ =
2
3 1 1
1 0
dan matriks kovarian (c c c c ) Σ = 1 x Σ =
2
1
2
2
2
3
2
4
1
1 0 2
Untuk kombinasi linear kedua vektor acak, kami menerapkan Hasil 4,8 dengan b1 = b2 = b3 = 1dan b4 =
- 3 untuk mendapatkan rata-rata vector
0
0
(b1 + b2 + b3 + b4)μ = 0μ =
0
36 12 12
12 0
dan matriks kovarian (b b b b ) Σ = 12 x Σ =
2
1
2
2
2
3
2
4
12
12 0 24
Akhirnya, matriks kovarians untuk dua kombinasi linear dari vektor acak adalah
0 0 0
0 0
(c1b1 + c2b2 + c3b3 + c4b4 )Σ = 0Σ =
0
0
0 0
Setiap komponen dari kombinasi linear pertama vektor acak memiliki nol kovarians dengan setiap
komponen dari kombinasi linear kedua vektor acak. Jika, setiap X memiliki distribusi normal
trivariate, maka dua kombinasi linear memiliki distribusi gabungan normal enam variate , dan dua
kombinasi linear dari vektor independen.