Disusun oleh:
5.1 Perkenalan
Penggunaan variabel acak dan distribusi probabilitasnya telah dibahas sebagai cara untuk
mengekspresikan model matematika untuk fisik non deterministik fenomena. Variabel acak
dapat dikaitkan dengan beberapa karakteristik numerik dari populasi item yang nyata atau
konseptual, dan fkp mewakili distribusi populasi atas kemungkinan nilai karakteristik. Cukup
seringkali kepadatan populasi yang sebenarnya mungkin tidak diketahui. Salah satu
kemungkinan dalam kasus ini adalah untuk mempertimbangkan keluarga fungsi kepadatan
yang diindeks oleh parameter yang tidak diketahui sebagai suatu model yang mungkin dan
kemudian berkonsentrasi pada pemilihan nilai untuk parameter. Penekanan utama dalam
statistik adalah mengembangkan perkiraan parameter yang tidak diketahui berdasarkan data
sampel. Dalam beberapa kasus, parameter dapat mewakili suatu fisik secara kuantitas
bermakna, seperti nilai rata-rata atau rata-rata populasi. Jadi, hal itu bermanfaat untuk
mendefinisikan dan mempelajari berbagai properti variabel acak tersebut semoga bermanfaat
dalam merepresentasikan dan menafsirkan populasi asli, juga berguna dalam memperkirakan
atau memilih model yang sesuai. Dalam beberapa kasus, khusus properti model (seperti
properti tanpa memori dari eksponensial distribusi) mungkin cukup membantu dalam
menunjukkan jenis asumsi fisik yang akan sesuai dengan model itu, meskipun implikasi dari
model biasanya kurang jelas.
5.2 Sifat-Sifat Nilai Harapan
Seperti disebutkan di Bab 2, sering kali perlu mempertimbangkan nilai harapan dari
beberapa fungsi dari satu atau lebih variabel acak. Misalnya, studi mungkin melibatkan vektor
k variabel acak, 𝑋 = (𝑋1 , 𝑋2 , … , 𝑋𝑘 ), dan kami berharap untuk mengetahui nilai yang
diharapkan dari beberapa fungsi 𝑋, dikatakan 𝑌 = 𝑢(𝑋). Kita bisa menggunakan notasi
standar𝐸(𝑌), atau kemungkinan lain adalah 𝐸[𝑢(𝑋)], atau 𝐸𝑥 [𝑢(𝑋)], dimana subskrip
menekankan bahwa penjumlahan atau integral digunakan untuk mengevaluasi nilai harapan
yang diambil relatif terhadap gabungan fkp dari 𝑋. Teorema berikut menegaskan bahwa kedua
pendekatan tersebut menghasilkan hasil yang sama.
Teorema 5.2.1 Jika 𝑋 = (𝑋1 , 𝑋2 , … , 𝑋𝑘 ) memiliki suati gabungan fkp 𝑓 (𝑥1 , … , 𝑥𝑘 ), dan jika
𝑌 = 𝑢(𝑋1 , … , 𝑋𝑘 ) adalah suatu fungsi dari 𝑋, maka 𝐸 (𝑌) = 𝐸𝑥 [𝑢(𝑋1 , … , 𝑋𝑘 )], di mana
𝐸𝑥 [𝑢(𝑋1 , … , 𝑋𝑘 )] = ∑𝑥1 … ∑𝑥𝑘 𝑢(𝑥1 , … , 𝑥𝑘 ) 𝑓 (𝑥1 , … , 𝑥𝑘 ) (5.2.1)
Jika 𝑋 diskrit, dan
∞ ∞
𝐸𝑥 [𝑢(𝑋1 , … , 𝑋𝑘 )] = ∫ … ∫ 𝑢(𝑥1 , … , 𝑥𝑘 )𝑓 (𝑥1 , … , 𝑥𝑘 ) 𝑑𝑥1 , … , 𝑑𝑥𝑘
−∞ −∞
Perhatikan bahwa nilai harapan di sisi kiri persamaan (5.2.3) adalah relatif terhadap fkp
gabungan dari 𝑋 = (𝑋1 , 𝑋2 ), sedangkan suku-suku di sisi kanan bisa relatif baik terhadap fkp
bersama atau fkp marginal. Jadi, pernyataan persamaan yang lebih tepat(5.2.3) akan menjadi
𝐸𝑥 (𝑋1 + 𝑋2 ) = 𝐸𝑥 (𝑋1 ) + 𝐸𝑥 (𝑋2 )
Fungsi lain yang umum ditemui dari variabel acak adalah product(perkalian).
Teorema 5.2.3 Jika X dan Y adalah variabel acak independen dan g(x) dan h(y) adalah fungsi,
kemudian
𝐸 [𝑔(𝑋)ℎ(𝑌)] = 𝐸 [𝑔(𝑋)]𝐸[ℎ(𝑌)] (5.2.5)
Bukti:
Di kasus kontinu,
∞ ∞
𝐸 [𝑔(𝑋)ℎ(𝑌)] = ∫ ∫ 𝑔(𝑥 )ℎ(𝑦)𝑓(𝑥, 𝑦)𝑑𝑥 𝑑𝑦
−∞ −∞
∞ ∞
= ∫−∞ ∫−∞ 𝑔(𝑥 )ℎ(𝑦)𝑓1 (𝑥 )𝑓2 (𝑦)𝑑𝑥 𝑑𝑦
∞ ∞
= [∫−∞ 𝑔(𝑥 )𝑓1(𝑥 )𝑑𝑥 ][∫−∞ ℎ (𝑦)𝑓2(𝑦) 𝑑𝑦]
= 𝐸 [𝑔(𝑋)]𝐸 [ℎ(𝑌)]
Mungkin untuk menggeneralisasi teorema ini ke lebih dari dua variabel, Secara khusus, jika
𝑋1 , … , 𝑋𝑘 adalah variabel acak independen, dan 𝑢1 (𝑥1 ),
..., u, (x) adalah fungsi, lalu 𝑢1 (𝑥1 ), … , 𝑢𝑘 (𝑥𝑘 ) adalah fungsi, maka
𝐸[𝑢1 (𝑋1 ) … 𝑢𝑘 (𝑋𝑘 )] = 𝐸[𝑢1 (𝑋1 )] … 𝐸[𝑢𝑘 (𝑋𝑘 )]]
Nilai-nilai tertentu yang diharapkan memberikan informasi tentang hubungan antara dua
variabel.
Definisi 5.2.1
Kovariansi dari pasangan variabel acak 𝑋 dan 𝑌ditentukan oleh
𝐶𝑜𝑣 (𝑋, 𝑌) = 𝐸[(𝑋 − 𝜇𝑥 )(𝑌 − 𝜇𝑦 )]
Notasi umum lainya untuk kovarian adalah 𝜎𝑥𝑦 . (5.2.7)
Beberapa properti yang berguna dalam menangani kovarian diberikan di teorema.
Teorema 5.2.4 Jika 𝑋 dan 𝑌 adalah variabel aacak dan 𝑎 dan 𝑏 adalah konstanta, maka
𝐶𝑜𝑣(𝑎𝑋𝑏𝑌) = 𝑎𝑏 𝐶𝑜𝑣(𝑋, 𝑌0 (5.2.8)
𝐶𝑜𝑣(𝑋 + 𝑎, 𝑌 + 𝑏) = 𝐶𝑜𝑣(𝑋, 𝑌) (5.2.9)
𝐶𝑜𝑣(𝑋, 𝑎𝑋 + 𝑏) = 𝑎 𝑉𝑎𝑟(𝑋) (5.2.10)
Bukti
Lihat latihan 26.
Teorema 5.2.5 Jika 𝑋 dan 𝑌 adalah variabel acak, maka
𝐶𝑜𝑣(𝑋, 𝑌) = 𝐸 (𝑋𝑌) − 𝐸(𝑋)𝐸(𝑌) (5.2.11)
Dan 𝐶𝑜𝑣 (𝑋, 𝑌) = 0di mana 𝑋 dan 𝑌 adalah independen.
Bukti
Contoh 5.2.1
Misal jika 𝑌~𝐵𝐼𝑁 (𝑛, 𝑝). Karena variabel acak binomial mewakili jumlah keberhasilan dalam
percobaan independen n dari percobaan Bernoulli, 𝑌 adalah berdístribusi sebagai suatu jumlah,
𝑌 = ∑𝑛𝑖=1 𝑋𝑖 , 𝑣𝑎𝑟𝑖𝑎𝑏𝑒𝑙 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑒𝑛 𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖, 𝑋𝑖 ~𝐵𝐼𝑁(1, 𝑝)
Berdasarkan persamaan (5.2.4) dan (5.2.15) mean dan varians dari 𝑌 adalah
𝐸 (𝑌) = 𝑛𝑝 dan 𝑉𝑎𝑟 (𝑌) = 𝑛𝑝𝑞, karena mean dan varians dari suatu variabel Bernoulli
adalah 𝐸 (𝑋𝑖 ) = 𝑝 dan 𝑉𝑎𝑟 (𝑋𝑖 ) = 𝑝𝑞. Ini agak lebih mudah daripada pendekatannya yang
digunakan dalam Bab 3.
Contoh 5.2.2
Pendekatan contoh sebelumnya juga dapat digunakan jika 𝑌~𝐻𝑌𝑃 (𝑛, 𝑀, 𝑁), tetapi
penurunannya lebih sulit karena penarikan bergantung pada pengambilan sampel dilakukan
tanpa penggantian Misalnya, anggaplah satu set komponen 𝑁, berisi 𝑀 yang defective, dan 𝑛
komponen ditarik secara acak tanpa penggantian. Jika 𝑋𝑖 mewakili jumlah komponen yang
rusak (baik 0 atau 1) didapat pada undian ke-i, maka 𝑋1 , 𝑋2 ,…, 𝑋𝑛 merupakan variabel
dependen Bernoulli.
Pertimbangkan pasangannya (𝑋1 , 𝑋2 ). Tidak sulit untuk melihat bahwa distribusi marjinal
dari variabel pertama adalah , 𝑋1 ~𝐵𝐼𝑁(1, 𝑝1 ) dimana 𝑝1 = 𝑀 / 𝑁, dan bersyarat
𝑥1 = 𝑥1 , 𝑋2 ~𝐵𝐼𝑁(1, 𝑝2 ), di mana 𝑝2 = (𝑀 − 𝑥1 ) / (𝑁 − 1). Jadi, fkp gabungan dari
(𝑋1 , 𝑋2 ) adalah
𝑥 1−𝑥1 𝑥2 1−𝑥2
𝑓 (𝑥1 , 𝑥2 ) = 𝑝1 1 𝑞1 𝑝2 𝑞2 𝑥1 = 0,1 (5.2.16)
Dari mana kita mendapatkan kovarian,
𝑀 𝑀 1
𝐶𝑜𝑣 (𝑋1 , 𝑋2 )= − (1 − ) (5.2.17)
𝑁 𝑁 𝑁−1
𝑀
𝐸 (𝑋𝑖 ) = (5.2.18)
𝑁
dan
𝑀 𝑀
𝑉𝑎𝑟(𝑋𝑖 ) = (1 − ) (5.2.19)
𝑁 𝑁
Dalam kasus persamaan (5.2.21), ada n suku bentuk (5.2.19) dan 𝑛 (𝑛 − 1) dari bentuk
(5.2.17), dan hasilnya mengikuti setelah penyederhanaan.
Perhatikan bahwa mean dan varians dari distribusi hipergeometrik memiliki bentuk yang mirip
dengan mean dan varians binomial, dengan 𝑝 diganti dengan 𝑀 / 𝑁, kecuali untuk faktor
terakhir dalam varians, (𝑁 − 𝑛) / (𝑁 − 1), yang disebut sebagai istilah pengali berhingga.
Karena variabel acak hipergeometrik, 𝑌, mewakili jumlah cacat yang diperoleh saat
pengambilan sampel dari populasi yang terbatas tanpa penggantian, jelas bahwa 𝑉𝑎𝑟 (𝑌) harus
Misalkan 𝑋𝑜 ∈ [𝑎, 𝑏], maka untuk nilai-nilai x disekitar 𝑥𝑜 dan 𝑥 ∈ [𝑎, 𝑏], 𝑓(𝑥) dapat diperluas
(diekspansi) ke dalam deret Taylor:
(𝑥 − 𝑥0 ) ′ (𝑥 − 𝑥0 )2 ′′ (𝑥 − 𝑥0 )𝑚 (𝑚)
𝑓 (𝑥 ) = 𝑓(𝑥0 ) + 𝑓 (𝑥0 ) + 𝑓 (𝑥0 ) + ⋯ + 𝑓 (𝑥0 ) + ⋯
1! 2! 𝑚!
Persamaan di atas merupakan penjumlahan dari suku-suku (term) yang disebut deret
ℎ ′ ℎ2 ′′ ℎ3 ′′′ ℎ
𝑓(𝑥 ) = 𝑓 (𝑥0 ) + 𝑓 𝑥0 + 𝑓 𝑥0 + 𝑓 (𝑥0 ) + ⋯ 𝑓 (𝑚)(𝑥0 ) + ⋯
( ) ( )
1! 2! 3! 𝑚!
5.3 Korelasi
Pengertian Korelasi
Korelasi merupakan istilah yang digunakan untuk mengukur kekuatan hubungan antarvariabel.
Analisis korelasi adalah cara untuk mengetahui ada atau tidak adanya hubungan antarvariabel.
Kekuatan hubungan antar variabel dapat dilihat dari hasil nilai koefisien korelasi. Koefisien
korelasi (KK) merupakan indeks atau bilangan yang digunakan untuk mengukur keeratan
(kuat, lemah, atau tidak ada) hubungan antarvariabel. Koefisien korelasi ini memiliki nilai
antara -1 dan +1 (-1≤ KK ≤ +1), dengan arti yaitu:
1. Jika KK bernilai positif, maka variabel-variabel berkorelasi positif. Semakin dekat nilai KK
ini ke +1 semakin kuat korelasinya, demikian pula sebaliknya.
2. Jika KK bernilai negatif, maka variabel-variabel berkorelasi negatif. Semakin dekat nilai KK
ini ke -1 semakin kuat korelasinya, demikian pula sebaliknya.
4. Jika KK bernilai +1 atau -1, maka variabel menunjukkan korelasi positif atau negatif yang
sempurna.
Keeratan hubungan atau korelasi antarvariabel diberikan nilai – nilai dari KK sebagai patokan.
Berikut ini adalah patokan dari nilai KK tersebut.
6. 0,90 < KK < 1,00, korelasi sangat tinggi; kuat sekali; dapat diandalkan.
7. KK = 1, korelasi sempurna.
Koefisien korelasi ini digunakan untuk mengukur keeratan hubungan antara dua variabel yang
datanya berbentuk data ordinal (data bertingkat/data ranking). Disimbolkan dengan “𝑟𝑠 ” dan
dirumuskan:
6 ∑ 𝑑2
𝑟𝑠 = 1 − 3
𝑛 −𝑛
Keterangan:
𝑥2
𝐶=√
𝑥2 + 𝑛
Keterangan:
𝑥 2 = 𝑘𝑎𝑖 𝑘𝑢𝑎𝑑𝑟𝑎𝑡
Koefisien penentu (KP) atau koefisien determinasi yang artinya penyebab perubahan pada
variabel Y yang datang dari variabel X, sebesar kuadrat koefisien korelasinya. Koefisien penetu
ini menjelaskan besarnya pengaruh nilai suatu variabel (variabel X) terhadap naik/turunnya
(variasi) nilai variabel lainnya (variabel Y). Dirumuskan:
𝐾𝑃 = 𝑅 = 𝑟 2 𝑥 100%
Pentingnya rata-rata dan variansi dalam mencirikan distribusi variabel acak dibahas
sebelumnya, dan kovarians digambarkan sebagai ukuran ketergantungan yang berguna antara
dua variabel acak. Ini ditunjukkan pada Teorema 5.2.5 bahwa 𝐶𝑜𝑣(𝑋, 𝑌) = 0 setiap kali 𝑋 dan
𝑌 tidak bergantung atau berdiri sendiri. Sebaliknya, secara umum, tidak benar.
Contoh 5.3.1
1
Pertimbangkan sepasang variabel acak diskrit 𝑋 dan 𝑌 dengan bersama fkp 𝑓 (𝑥, 𝑦) = 4 jika
1 1
(𝑥, 𝑦) = (0,1), (1,0), (0,1) atau (−1,0). Fkp dari marjinal 𝑋 adalah 𝑓𝑥 (±1) = , 𝑓𝑥 (0) = ,
4 2
dan 𝑓𝑥 (0) = 0 sebaliknya. Fkp dari Y sama. Dengan demikian, 𝐸(𝑋) = − 1(1/4) +
0(1/2) + 1(1/4) = 0. Karena 𝑥𝑦 = 0 setiap kali 𝑓(𝑥, 𝑦) > 0, ini mengikuti 𝐸(𝑋𝑌) = 0.
Akibatnya, 𝐶𝑜𝑣(𝑋, 𝑌) = 𝐸(𝑋𝑌) − 𝐸(𝑋)𝐸(𝑌) = 0. Namun, 𝑓(0,0) = 0 ≠ 𝑓𝑋 (0)𝑓𝑌 (0),
sehingga 𝑋 dan 𝑌 bergantung atau dependen. Secara umum, kita dapat menyimpulkan bahwa
𝑋 dan 𝑌 bergantung atau dependen jika 𝐶𝑜𝑣(𝑋, 𝑌) ≠ 0, tetapi 𝐶𝑜𝑣(𝑋, 𝑌) = 0 tidak selalu
menyiratkan bahwa 𝑋 dan 𝑌 adalah bebas atau independen.
Definisi 5.3.1
Jika 𝑋 dan 𝑌 adalah variabel acak dengan variansi 𝜎𝑋2 dan 𝜎𝑌2 dan kovarians 𝜎𝑋𝑌 = 𝐶𝑜𝑣(𝑋, 𝑌),
maka koefisien korelasi dari X dan Y adalah
𝜎
𝜌 = 𝜎 𝑋𝑌 (5.3.1)
𝜎 𝑋 𝑌
Variabel acak 𝑋 dan 𝑌 dikatakan tidak berkorelasi jika 𝜌 = 0; sebaliknya mereka dikatakan
berkorelasi. Notasi subskrip, 𝜌𝑋𝑌 , juga kadang-kadang digunakan. Teorema berikut
memberikan beberapa sifat penting dari koefisien korelasi.
Teorema 5.3.1
Jika 𝜌 adalah koefisien korelasi dari 𝑋 dan 𝑌, maka
−1 ≤ 𝜌 ≤ 1
(5.3.2)
Dan
𝜌 = ±1 jika dan hanya jika 𝑌 = 𝑎𝑋 + 𝑏 dengan probabilitas 1 untuk 𝑎 ≠ 0 dan 𝑏
(5.3.3)
Pembuktian
Agar lebih mudah dipahami kita gunakan notasi yang disederhanakan 𝜇1 = 𝜇𝑋 , 𝜇2 = 𝜇𝑌 , 𝜎1 =
𝜎𝑋 , 𝜎2 = 𝜎𝑌 , dan 𝜎12 = 𝜎𝑋𝑌 .
Untuk menunjukkan persamaan (5.3.2), misalkan
𝑌 𝑋
𝑊= −𝜌
𝜎2 𝜎1
Jadi
1 2 𝜌 2 𝜎
𝑉𝑎𝑟(𝑊 ) = (𝜎 ) 𝜎22 + (𝜎 ) 𝜎12 − 2𝜌 𝜎 12
2 1 𝜎 1 2
= 1 + 𝜌 2 − 2𝜌 2
= 1 − 𝜌2 ≥ 0
Karena 𝑉𝑎𝑟(𝑊 ) ≥ 0.
𝑋𝜌 𝜇2 𝜇1 𝜌 𝜌𝜎2 𝜌𝜎2
= − , atau 𝑌 = 𝑎𝑋 + 𝑏 dimana 𝑎 = dan 𝑏 = 𝜇2 − 𝜇1 . Di sisi lain, jika 𝑌 =
𝜎1 𝜎2 𝜎1 𝜎1 𝜎1
𝑎𝑋 + 𝑏, maka oleh Theorema 2.4.3 dan 5.2.4, 𝜎22 = 𝜎 2 𝜎12 dan 𝜎12 = 𝑎𝜎12 , dalam hal ini 𝜌 =
𝑎
|𝑎|
, sehingga 𝜌 = 1 jika 𝑎 > 0 dan 𝜌 = −1 jika 𝑎 < 0. ∎
Contoh 5.3.2
1
Pertimbangkan variabel acak 𝑋 dan 𝑌 dengan fkp dari bentuk 𝑓(𝑥, 𝑦) = jika (𝑥, 𝑦) ∈ 𝐶,
20
Gambar 5.1
Wilayah yang terkait dengan 0 < 𝑥 < 10 dan 𝑥 − 1 < 𝑦 < 𝑥 + 1
Meskipun 𝑌 bukan fungsi dari 𝑋, distribusi bersama 𝑋 dan 𝑌 "berkerumun" di sekitar garis
𝑦 = 𝑥, dan kita harus mengharapkan 𝜌 berada di dekat 1.
(10)2 25 (10)2 (2)2 26
Variansi dari 𝑋 adalah 𝜎12 = = , variansi dari 𝑌 adalah 𝜎22 = + = dan
12 3 12 12 3
25
kovarians adalah 𝜎12 = 𝐸 (𝑋𝑌) − 𝐸 (𝑋)𝐸(𝑌) = . Dengan demikian, koefisiennya korelasi
3
25
25
adalah 𝜌 = 3
25 26
= √26 = 0.981 dimana, seperti yang diharapkan mendekati 1.
√ √
3 3
Sangat memungkinkan untuk memperpanjang gagasan ekspektasi dan varian pada kerangka
bersyarat.
Definisi 5.4.1
Jika 𝑋 dan 𝑌 didistribusikan bersama variabel acak, maka ekspektasi bersyarat dari 𝑌 yang
diberikan 𝑋 = 𝑥 diberikan oleh
Notasi umum lainnya untuk ekspektasi bersyarat adalah 𝐸𝑦|𝑥 (𝑌) 𝑑𝑎𝑛 𝐸(𝑌|𝑋 = 𝑥).
Contoh 5.4.1
Anggap contoh 4.5.2, dimana partikel udara tertentu mendarat secara acak (𝑋, 𝑌) pada bidang
segitiga. Pada contoh ini, fkp bersyarat dari Y yang diberikan X = x adalah :
2 𝑥
𝑓 (𝑦|𝑥) = 0 < 𝑦 <
𝑥 2
𝑥/2 2
𝐸 (𝑌 | 𝑥) = ∫0 𝑦 ( ) 𝑑𝑦
𝑥
(2/𝑥) (𝑥/2)2
= 2
𝑥
= ,0 < 𝑥 < 2
4
Jika kita mencoba untuk “memprediksi” nilai koordinat vertikal dari (𝑋, 𝑌), maka 𝐸(𝑌 | 𝑥)
harus lebih berguna daripada ekspektasi marjinal 𝐸(𝑌), karena itu gunakan informasi tentang
koordinat horizontal. Tentu saja, ini mengasumsikan bahwa informasi tersebut tersedia.
Perhatikan bahwa ekspektasi bersyarat dari Y yang diberikan X = x adalah fungsi dari x,
katakanlah 𝑢(𝑥) = 𝐸(𝑌 | 𝑥). Teorema berikut mengatakan bahwa, secara umum variabel
acak 𝑢(𝑋) = 𝐸(𝑌 | 𝑋) memiliki ekspektasi marjinal 𝑌, 𝐸(𝑌).
Teorema 5.4.1
Bukti
∞
𝐸[𝐸(𝑌 | 𝑋)] = ∫−∞ 𝐸 (𝑌 | 𝑥) 𝑓1(𝑥) 𝑑𝑥
∞ ∞
= ∫−∞ ∫−∞ 𝑦𝑓(𝑦|𝑥) 𝑓1(𝑥) 𝑑𝑦 𝑑𝑥
∞ ∞
= ∫−∞ 𝑦 ∫−∞ 𝑓(𝑥, 𝑦) 𝑑𝑥 𝑑𝑦
∞
= ∫−∞ 𝑦 𝑓2(𝑦) 𝑑𝑦
= 𝐸(𝑌)
Dalam contoh sebelumnya, misalkan kita ingin mengetahui ekspektasi marjinal E(Y). Salah
satu kemungkinan adalah menggunakan teorema sebelumnya, dengan 𝐸(𝑌 𝐼 𝑥) = 𝑥/4 dan
𝑓1(𝑥) = 𝑥/2 untuk 0 < 𝑥 < 2. Khususnya,
2 𝑥 𝑥 1
𝐸(𝑌) = 𝐸[𝐸(𝑌 | 𝑋)] = ∫0 ( 4 ) ( 2 ) 𝑑𝑥 = 3
Contoh 5.4.2
Misalkan jumlah kata yang salah eja dalam makalah semester siswa adalah variabel acak X
yang didistribusikan oleh Poisson dengan rata- rata 𝐸(𝑋) = 20. Teman sekamar siswa
diminta untuk mengoreksi makalah tersebut dengan harapan menemukan kesalahan ejaan.
Rata-rata, teman sekamar menemukan 85% dari kesalahan tersebut, jika kesalahan x ada di
dalam makalah, maka masuk akal untuk mempertimbangkan jumlah kesalahan ejaan yang
ditemukan sebagai variabel binominal dengan parameter 𝑛 = 𝑥 dan p = .85. Dengan kata lain,
syarat 𝑋 = 𝑥, 𝑌 ~ 𝐵𝐼𝑁(𝑥, .85), dan karena, secara umum, rata-rata distribusi binominal
adalah np, ekspektasi bersyarat adalah 𝐸(𝑌 | 𝑥) = .85𝑥. Dengan demikian, perkiraan jumlah
kesalahan ejaan yang ditemukan oleh teman sekamar akan menjadi 𝐸(𝑌) = 𝐸[𝐸(𝑌 | 𝑋)] =
𝐸(.85𝑋) = .85𝐸(𝑋) = 17.
Teorema 5.4.2
Jika X dan Y adalah variabel acak independen, maka E(Y | x) = E(Y) dan E(X | y) = E(X).
∞
𝐸(𝑌 | 𝑥) = ∫−∞ 𝑦 𝑓 (𝑦 | 𝑥) 𝑑𝑦
∞
= ∫−∞ 𝑦 𝑓 2(𝑦) 𝑑𝑦
= 𝐸(𝑌)
Hal ini juga berguna untuk mempelajari varian distribusi bersyarat, yang biasanya disebut
sebagai varian bersyarat.
Definisi 5.4.2
Teorema 5.4.3
Bukti
= {𝐸(𝑌 2 ) − 𝐸𝑋 [𝐸(𝑌|𝑋)]2 }
= 𝑉𝑎𝑟(𝑌) − 𝑉𝑎𝑟𝑥[𝐸(𝑌|𝑋)] ∎
Teorema ini menunjukkan bahwa, rata-rata (lebih dari X), varian bersyarat akan lebih kecil
daripada varian tak bersyarat. Tentu saja, mereka akan sama jika X dan Y independen, karena
𝐸(𝑌|𝑋) tidak akan menjadi fungsi X, dan 𝑉𝑎𝑟{𝐸(𝑌|𝑋)] akan menjadi nol. Jika seseorang
tertarik untuk memperkirakan rata-rata tinggi individu, 𝐸(𝑌), maka teorema menyarankan
bahwa mungkin lebih mudah untuk memperkirakan tinggi individu (bersyarat) jika kamu
mengetahui berat badan orang tersebut, karena populasi tak bersyarat dari ketinggian memiliki
varian yang lebih besar daripada berkurangnya semua populasi individu dengan berat tetap, 𝑥.
Fakta ini mengarah ke area penting analisis regersi, dimana informasi tentang satu variabel
digunakan untuk membantu memahami variabel terkait.
Argumen yang serupa dengan Teorema 5.4.1 menghasilkan teorema lebih umum seperti
berikut:
Teorema 5.4.4
Jika 𝑋 dan 𝑌 didistribusikan bersama variabel acak dan ℎ(𝑥, 𝑦) adalah fungsi, maka
Teorema ini mengatakan bahwa ekspektasi bersama, seperti persamaan pada sisi kiri (5.4.7),
dapat diselesaikan dengan terlebih dahulu menemukan ekspektasi bersyarat 𝐸[ℎ(𝑥, 𝑌) | 𝑥], dan
kemudian menemukan ekspektasi relatifnya terhadap distribusi marjinal dari 𝑋. Teorema ini
sangat berguna dalam aplikasi tertentu ketika digunakan bersama dengan teorema selanjutnya
yang dinyatakan tanpa bukti.
Teorema 5.4.5
Jika X dan Y didistribusikan bersama variabel acak, dan g(x) adalah fungsi, maka
Contoh 5.4.3
Jika (𝑋, 𝑌)~ 𝑀𝑈𝐿𝑇(𝑛, 𝑝1 , 𝑝2 ), maka dengan derivasi langsung mengikuti 𝑋 ~ 𝐵𝐼𝑁 (𝑛, 𝑝1 ),
𝑝
𝑌 ~ 𝐵𝐼𝑁(𝑛, 𝑝2 ), dan bersyarat pada 𝑋 = 𝑥, 𝑌|𝑥 ~ 𝐵𝐼𝑁(𝑛 − 𝑥, 𝑝), dimana 𝑝 = 1 – 2𝑝 . Rata-rata
1
dan varian dari X dan Y mengikuti dari hasil pada bagian 5.2. Perhatikan juga bahwa
𝐸(𝑌 | 𝑥) = (𝑛– 𝑥)𝑝2 /(1 − 𝑝1 ).
Dua teorema sebelumnya dapat digunakan untuk menemukan kovarian dari X dan Y.
Khususnya,
𝑋(𝑛 − 𝑋)𝑝2
= 𝐸[ ]
1 − 𝑝1
𝑝2
= [1 − 𝑝1] [𝑛𝐸(𝑋) – 𝐸(𝑋 2 )]
Jika kita mengganti 𝐸 (𝑋) = 𝑛𝑃1 dan 𝐸(𝑋 2 ) = 𝑉𝑎𝑟(𝑋) + (𝑛𝑝1 )2 = 𝑛𝑝1 [1 + (𝑛 − 1)𝑝1 ] dan
menyederhanakannya, maka hasilnya adalah
𝐸 (𝑋 𝑌) = 𝑛(𝑛 − 1)𝑝1 𝑝2
Sehingga,
= −𝑛𝑝1 𝑝2
Seperti pada teorema 5.3.1, kita mengadopsi notasi yang nyaman µ1 = 𝐸 (𝑋), µ2 = 𝐸(𝑌),
𝜎12 = 𝑉𝑎𝑟(𝑋),dan 𝜎22 = 𝑉𝑎𝑟(𝑌).
Teorema 5.4.6
𝜎
𝐸(𝑌 | 𝑥) = µ2 + 𝜌 𝜎2 (𝑥 − µ2 ) (5.4.9)
1
dan
Bukti
dan
= 𝐸 [(𝑋 − µ1)𝑌]– 0
= 𝐸𝑋 {𝐸 [(𝑋 − µ1)𝑌|𝑋 ]}
= 𝑎𝜎12
Jadi,
𝜎𝑋𝑌 𝜎2 𝜎2
𝑎 = = 𝜌 dan 𝑏 = µ2 − 𝜌 µ1
𝜎12 𝜎1 𝜎1
𝜎2
𝐸𝑋 [𝑉𝐴𝑅(𝑌 |𝑋)] = 𝑉𝑎𝑟(𝑌) − 𝑉𝑎𝑟𝑋 [µ2 + 𝜌 𝜎1
(𝑋 − µ1 )]
𝜎22 𝜎12
= 𝑉𝑎𝑟(𝑌)– 𝜌 2 𝜎12
= 𝜎22 (1 – 𝜌 2 )
Jadi, jumlah penurunan dalam varian populasi bersyarat dibandingkan dengan populasi tidak
bersyarat tergantung pada korelasinya, 𝜌, diantara beberapa variabel.
Hal yang penting sekarang akan dibahas dimana 𝐸(𝑌|𝑥) adalah sebuah fungsi linier dari 𝑥 dan
𝑉𝑎𝑟(𝑌|𝑥) tidak tergantung pada 𝑥.
Sepasang variable acak terus menerus 𝑋 𝑑𝑎𝑛 𝑌 dikatakan mempunyai distribusi bivariat
normal jika mempunyai bentuk gabungan fkp.
1 1 𝑥 − 𝜇1 2 𝑥 − 𝜇1 𝑦 − 𝜇2 𝑦 − 𝜇2 2
𝑓(𝑥, 𝑦) = × 𝑒𝑥𝑝 {− [( ) − 2𝜌 ( )( )+ ( ) ]}
2𝜋𝜎1 𝜎2 √1 − 𝜌2 2(1− 𝜌2 ) 𝜎1 𝜎1 𝜎2 𝜎2
yang tergantung pada lima parameter, −∞ < µ1 < ∞, −∞ < µ2 < ∞, 𝜎1 > 0, 𝜎2 > 0, dan
−1 < 𝜌 < 1.
Teorema berikut mengatakan bahwa fkp marginal adalah normal dan notasi yang digunakan
untuk parameter sudah tepat.
Teorema 5.4.7
Bukti
∞ ∞
∫−∞ 𝑦 ∫−∞ 𝑓(𝑥, 𝑦) 𝑑𝑥 𝑑𝑦 = 1
Tertulis di bagian 5.2 bahwa variable acak bebas tidak saling berhubungan. Dengan kata lain,
jika 𝑋 dan 𝑌 bersifat bebas, maka 𝜌 = 0. perhatikan bahwa gabungan fkp diatas, (5.4.11),
faktor-faktor kedalam produk fkp marginal jika 𝜌 = 0. akan tetapi, untuk variabel bivariat
normal, istilah ‘tidak berkorelasi’ bisa digunakan secara bergantian, meskipun hal ini tidak
benar untuk distribusi bivariat umum.
Teorema 5.4.8
1. Bersyarat pada 𝑋 = 𝑥,
𝜎2
𝑌|𝑥 ~ 𝑁 [𝜇2 + ρ (𝑥 − 𝜇1 ), 𝜎22 (1 − 𝜌 2 )]
𝜎1
2. Bersyarat pada 𝑌 = 𝑦,
𝜎1
𝑋|𝑦 ~ 𝑁 [𝜇1 + ρ (𝑦 − 𝜇2 ), 𝜎12 (1 − 𝜌 2 )]
𝜎2
Bukti
Teorema ini menunjukan bahwa kedua ekspektasi bersyarat tersebut adalah fungsi-fungsi linier
dari variable bersyarat, dan kedua varian bersyarat tersebut. Jika ρ dekat ke angka nol, maka
varian bersyarat adalah mendekati varian marginal. Dan jika ρ dekat ke angka ±1, maka varian
bersyarat ini dekat dengan angka nol.
Seperti yang ditulis sebelumnya dalam bab ini, ekspektasi bersyarat, berupa 𝐸(𝑌|𝑥), adalah
fungsi dari 𝑥 yang, ketika diaplikasikan ke 𝑋, mempunyai nilai yang diharapkan yang sama
seperti 𝑌. Fungsi ini kadang-kadang merujuk sebagai fungsi regresi, dan grafik dari 𝐸(𝑌 | 𝑥)
disebut sebagai kurva regresi dari 𝑌 pada 𝑋 = 𝑥. Teorema sebelumnya menegaskan bahwa
untuk variable-variable bivariate formal, kita memiliki fungsi regresi linier. Hal ini mengikuti
Dalil 5.4.3 yang variannya dari 𝐸(𝑌 | 𝑋) adalah kurang dari atau sama dengan 𝑌, dan dengan
demikian fungsi regresi, secara umum, harus menjadi penduga yang lebih baik dari 𝜇2 = 𝐸 (𝑌)
daripada 𝑌 itu sendiri. Tentu saja, ini akan dijelaskan oleh fakta bahwa distribusi marginal dari
𝑌 tidak menggunakan informasi tentang 𝑋, sedangkan distribusi bersyarat dari 𝑌 diberikan 𝑋 =
𝑥.
Konsep dari fungsi pembangkit momen dapat digeneralisasikan menjadi 𝑘-dimensional suatu
variabel acak
Definisi 5.5.1
FPM gabungan memiliki sifat serupa dengan FPM univariat. Momen campuran seperti
𝐸[𝑋𝑖𝑟 𝑋𝑗𝑠 ] dapat diperoleh dengan membedakan gabungan 𝑡𝑖 , dan 𝑠 kali terhadap 𝑡𝑗 dan
kemudian mengatur semua 𝑡𝑖 = 0. FPM gabungan juga secara unik menentukan distribusi
gabungan dari variable 𝑋1 , … , 𝑋𝑘 .
Perhatikan bahwa itu juga mungkin untuk memperoleh FPM dari distribusi marjinal dari FPM
gabungan. Sebagai contoh,
Teorema 5.5.1
Jika 𝑀𝑋,𝑌 (𝑡1 , 𝑡2 ) ada, maka variabel acak 𝑋 dan 𝑌 independen jika dan hanya jika
Contoh 5.5.1
Seandainya
𝑋 = (𝑋1 , … , 𝑋𝑘 )~ 𝑀𝑈𝐿𝑇(𝑛, 𝑝1 , … , 𝑝𝑘 )
Gabungan FPM dari distribusi multinomial bisa dievaluasi sepanjang garis yang mengikuti
distribusi binomial untuk memperolehnya
𝑀𝑋 (𝑡) = 𝐸 [exp (∑ 𝑡𝑖 𝑋𝑖 )]
𝑖=1
𝑛 𝑥𝑘+1
= ∑… ∑ (𝜌1 𝑒 𝑡1 )𝑥1 … (𝜌𝑘 𝑒 𝑡𝑘 )𝑥𝑘𝜌𝑘+1
𝑥1 ! … 𝑥𝑘+1 !
= (𝑝1 𝑒 𝑡1 + … + 𝑝𝑘 𝑒 𝑡𝑘 + 𝑝𝑘+1 ) 𝑛
dimana 𝑝𝑘+1 = 1 – 𝑝1 − ⋯ – 𝑝𝑘
Secara jelas, distribusi marjinal gabungan juga merupakan multinomial, contohnya, jika
= [𝑝1 𝑒 𝑡1 + 𝑝2 𝑒 𝑡2 + 𝑝3 + (1 – 𝑝1 – 𝑝2 – 𝑝3 )]𝑛
= [𝑝1 𝑒 𝑡1 + 𝑝2 𝑒 𝑡2 + 1– 𝑝1 – 𝑝2 ]𝑛
maka
Contoh 5.5.2
Pertimbangan sepasang variabel acak normal bivariat dengan mean 𝜇1 dan 𝜇2 , varians
𝜎12 𝑑𝑎𝑛 𝜎22 dan korelasi koefisien 𝜌. Dengan kata lain, (𝑋, 𝑌) ~ 𝐵𝑉𝑁(𝜇1 , 𝜇2 , 𝜎12 , 𝜎22 , 𝜌). FPM
∞ ∞
gabungan dari X dan Y bisa dievaluasi secara langsung dengan integrasi: ∫−∞ ∫−∞ 𝑒𝑥𝑝 (𝑡1 𝑥 +
𝑡2 𝑦)𝑓(𝑥, 𝑦) 𝑑𝑥 𝑑𝑦 dengan 𝑓(𝑥, 𝑦) diberikan oleh persamaan (5.4.11). Pendekatan langsung
agak membosankan, maka kami memanfaatkan beberapa hasil pada expektasi bersyarat. Secara
khusus, dari teorema 5.4.4 dan 5.4.5, mengikuti jika:
= 𝐸𝑋 {𝐸[exp(𝑡1 𝑋 + 𝑡2 𝑌) | 𝑋]}
𝜎
𝑌 | 𝑥 ~ 𝑁 [𝜇2 + 𝜌 𝜎2 (𝑥 − 𝜇1 ), 𝜎22 (1 − 𝜌 2 )]
1
sehingga
𝜎2
𝐸[𝑒𝑥𝑝 (𝑡2 𝑌) | 𝑋 = 𝑥] = 𝑒𝑥𝑝 {[𝜇2 + 𝜌 (𝑥 − 𝜇1 )] 𝑡2 + 𝜎22 (1 − 𝜌 2)𝑡22 /2}
𝜎1
1
𝑀𝑋,𝑌 (𝑡1, 𝑡2 ) = exp [𝜇1 𝑡1 + 𝜇2 𝑡2 + (𝜎12 𝑡12 + 𝜎22 𝑡22 + 2𝜌𝜎1 𝜎2 𝑡1 𝑡2 )] (5.5.6)
2
RINGKASAN
Tujuan utama dari bab ini adalah mengembangkan materi umum yang melibatkan nilai yang
diharapkan dari dan fungsi variabel acak. Jumlah dan hasil kali merupakan fungsi yang penting
dari variabel acak yang diberikan perhatian khusus.. sebagai contoh, ditunjukkan jika nilai yang
diharapkan dari sebuah jumlah merupakan jumlah dari nilai yang diharapkan (marjinal). Jika
variabel acak independen, maka nilai yang diharapkan dari sebuah produk adalah produk dari
nilai yang diharapkan (marjinal) dan varian dari sebuah jumlah merupakan jumlah dari varian
(marjinal).