Disusun oleh:
5.1 Perkenalan
Penggunaan variabel acak dan distribusi probabilitasnya telah dibahas sebagai cara untuk
mengekspresikan model matematika untuk fisik non deterministik fenomena. Variabel acak
dapat dikaitkan dengan beberapa karakteristik numerik dari populasi item yang nyata atau
konseptual, dan fkp mewakili distribusi populasi atas kemungkinan nilai karakteristik. Cukup
seringkali kepadatan populasi yang sebenarnya mungkin tidak diketahui. Salah satu
kemungkinan dalam kasus ini adalah untuk mempertimbangkan keluarga fungsi kepadatan
yang diindeks oleh parameter yang tidak diketahui sebagai suatu model yang mungkin dan
kemudian berkonsentrasi pada pemilihan nilai untuk parameter. Penekanan utama dalam
statistik adalah mengembangkan perkiraan parameter yang tidak diketahui berdasarkan data
sampel. Dalam beberapa kasus, parameter dapat mewakili suatu fisik secara kuantitas
bermakna, seperti nilai rata-rata atau rata-rata populasi. Jadi, hal itu bermanfaat untuk
mendefinisikan dan mempelajari berbagai properti variabel acak tersebut semoga bermanfaat
dalam merepresentasikan dan menafsirkan populasi asli, juga berguna dalam memperkirakan
atau memilih model yang sesuai. Dalam beberapa kasus, khusus properti model (seperti
properti tanpa memori dari eksponensial distribusi) mungkin cukup membantu dalam
menunjukkan jenis asumsi fisik yang akan sesuai dengan model itu, meskipun implikasi dari
model biasanya kurang jelas.
5.2 Sifat-Sifat Nilai Harapan
Seperti disebutkan di Bab 2, sering kali perlu mempertimbangkan nilai harapan dari
beberapa fungsi dari satu atau lebih variabel acak. Misalnya, studi mungkin melibatkan
vektor k variabel acak, 𝑋 = (𝑋1, 𝑋2, … , 𝑋𝑘), dan kami berharap untuk mengetahui nilai yang
diharapkan dari beberapa fungsi 𝑋, dikatakan 𝑌 = 𝑢(𝑋). Kita bisa menggunakan notasi
standar𝐸(𝑌), atau kemungkinan lain adalah 𝐸[𝑢(𝑋)], atau 𝐸𝑥[𝑢(𝑋)], dimana subskrip
menekankan bahwa penjumlahan atau integral digunakan untuk mengevaluasi nilai harapan
yang diambil relatif terhadap gabungan fkp dari 𝑋. Teorema berikut menegaskan bahwa
kedua pendekatan tersebut menghasilkan hasil yang sama.
Teorema 5.2.1 Jika 𝑋 = (𝑋1, 𝑋2, … , 𝑋𝑘) memiliki suati gabungan fkp 𝑓(𝑥1, … , 𝑥𝑘), dan jika
𝑌 = 𝑢(𝑋1, … , 𝑋𝑘) adalah suatu fungsi dari 𝑋, maka 𝐸(𝑌) = 𝐸𝑥[𝑢(𝑋1, … , 𝑋𝑘)], di mana
𝐸𝑥[𝑢(𝑋1, … , 𝑋𝑘)] = ∑𝑥1 … ∑𝑥𝑘 𝑢(𝑥1, … , 𝑥𝑘) 𝑓(𝑥1, … , 𝑥𝑘) (5.2.1)
Jika 𝑋 diskrit, dan
∞ ∞
𝐸𝑥[𝑢(𝑋1, … , 𝑋𝑘)] = ∫ … ∫ 𝑢(𝑥1, … , 𝑥𝑘)𝑓(𝑥1, … , 𝑥𝑘) 𝑑𝑥1, … , 𝑑𝑥𝑘
−∞ −∞
Perhatikan bahwa nilai harapan di sisi kiri persamaan (5.2.3) adalah relatif terhadap fkp
gabungan dari 𝑋 = (𝑋1, 𝑋2), sedangkan suku-suku di sisi kanan bisa relatif baik terhadap fkp
bersama atau fkp marginal. Jadi, pernyataan persamaan yang lebih tepat(5.2.3) akan menjadi
𝐸𝑥(𝑋1 + 𝑋2) = 𝐸𝑥(𝑋1) + 𝐸𝑥(𝑋2)
Fungsi lain yang umum ditemui dari variabel acak adalah product(perkalian).
Teorema 5.2.3 Jika X dan Y adalah variabel acak independen dan g(x) dan h(y) adalah fungsi,
kemudian
𝐸[𝑔(𝑋)ℎ(𝑌)] = 𝐸[𝑔(𝑋)]𝐸[ℎ(𝑌)] (5.2.5)
Bukti:
Di kasus kontinu,
∞ ∞
𝐸[𝑔(𝑋)ℎ(𝑌)] = ∫ ∫ 𝑔(𝑥)ℎ(𝑦)𝑓(𝑥, 𝑦)𝑑𝑥 𝑑𝑦
−∞ −∞
∞ ∞
= 𝑔(𝑥)ℎ(𝑦)𝑓 (𝑥)𝑓 (𝑦)𝑑𝑥 𝑑𝑦
∫−∞ ∫−∞ 1 2
∞ ∞
=[ 𝑔(𝑥)𝑓 (𝑥)𝑑𝑥][ ℎ(𝑦)𝑓 (𝑦) 𝑑𝑦]
∫−∞ 1 ∫−∞ 2
= 𝐸[𝑔(𝑋)]𝐸[ℎ(𝑌)]
Mungkin untuk menggeneralisasi teorema ini ke lebih dari dua variabel, Secara khusus, jika
𝑋1, … , 𝑋𝑘 adalah variabel acak independen, dan 𝑢1(𝑥1),
..., u, (x) adalah fungsi, lalu 𝑢1(𝑥1), … , 𝑢𝑘(𝑥𝑘) adalah fungsi, maka
𝐸[𝑢1(𝑋1) … 𝑢𝑘(𝑋𝑘)] = 𝐸[𝑢1(𝑋1)] … 𝐸[𝑢𝑘(𝑋𝑘)]]
Nilai-nilai tertentu yang diharapkan memberikan informasi tentang hubungan antara dua
variabel.
Definisi 5.2.1
Kovariansi dari pasangan variabel acak 𝑋 dan 𝑌ditentukan oleh
𝐶𝑜𝑣 (𝑋, 𝑌) = 𝐸[(𝑋 − 𝜇𝑥)(𝑌 − 𝜇𝑦)]
Notasi umum lainya untuk kovarian adalah 𝜎𝑥𝑦. (5.2.7)
Beberapa properti yang berguna dalam menangani kovarian diberikan di teorema.
Teorema 5.2.4 Jika 𝑋 dan 𝑌 adalah variabel aacak dan 𝑎 dan 𝑏 adalah konstanta, maka
𝐶𝑜𝑣(𝑎𝑋𝑏𝑌) = 𝑎𝑏 𝐶𝑜𝑣(𝑋, 𝑌0 (5.2.8)
𝐶𝑜𝑣(𝑋 + 𝑎, 𝑌 + 𝑏) = 𝐶𝑜𝑣(𝑋, 𝑌) (5.2.9)
𝐶𝑜𝑣(𝑋, 𝑎𝑋 + 𝑏) = 𝑎 𝑉𝑎𝑟(𝑋) (5.2.10)
Bukti
Lihat latihan 26.
Teorema 5.2.5 Jika 𝑋 dan 𝑌 adalah variabel acak, maka
𝐶𝑜𝑣(𝑋, 𝑌) = 𝐸(𝑋𝑌) − 𝐸(𝑋)𝐸(𝑌) (5.2.11)
Dan 𝐶𝑜𝑣 (𝑋, 𝑌) = 0di mana 𝑋 dan 𝑌 adalah independen.
Bukti
Contoh 5.2.1
Misal jika 𝑌~𝐵𝐼𝑁(𝑛, 𝑝). Karena variabel acak binomial mewakili jumlah keberhasilan dalam
percobaan independen n dari percobaan Bernoulli, 𝑌 adalah berdístribusi sebagai suatu jumlah,
𝑛
𝑌= 𝑖=1 𝑋𝑖 , 𝑣𝑎𝑟𝑖𝑎𝑏𝑒𝑙 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑒𝑛 𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖, 𝑋𝑖~𝐵𝐼𝑁(1, 𝑝)
Berdasarkan persamaan (5.2.4) dan (5.2.15) mean dan varians dari 𝑌 adalah
𝐸 (𝑌) = 𝑛𝑝 dan 𝑉𝑎𝑟 (𝑌) = 𝑛𝑝𝑞, karena mean dan varians dari suatu variabel Bernoulli
adalah 𝐸 (𝑋𝑖) = 𝑝 dan 𝑉𝑎𝑟 (𝑋𝑖) = 𝑝𝑞. Ini agak lebih mudah daripada pendekatannya yang
digunakan dalam Bab 3.
Contoh 5.2.2
Pendekatan contoh sebelumnya juga dapat digunakan jika 𝑌~𝐻𝑌𝑃 (𝑛, 𝑀, 𝑁), tetapi
penurunannya lebih sulit karena penarikan bergantung pada pengambilan sampel dilakukan
tanpa penggantian Misalnya, anggaplah satu set komponen 𝑁, berisi 𝑀 yang defective, dan 𝑛
komponen ditarik secara acak tanpa penggantian. Jika 𝑋𝑖 mewakili jumlah komponen yang
rusak (baik 0 atau 1) didapat pada undian ke-i, maka 𝑋1, 𝑋2,…, 𝑋𝑛 merupakan variabel
dependen Bernoulli.
Pertimbangkan pasangannya (𝑋1, 𝑋2). Tidak sulit untuk melihat bahwa distribusi marjinal
dari variabel pertama adalah , 𝑋1~𝐵𝐼𝑁(1, 𝑝1) dimana 𝑝1 = 𝑀 / 𝑁, dan bersyarat
𝑥1 = 𝑥1, 𝑋2~𝐵𝐼𝑁(1, 𝑝2), di mana 𝑝2 = (𝑀 − 𝑥1) / (𝑁 − 1). Jadi, fkp gabungan dari
(𝑋1, 𝑋2) adalah
𝑓(𝑥1, 𝑥2) = 𝑝𝑥1𝑞1−𝑥1𝑝𝑥2𝑞1−𝑥2 𝑥1 = 0,1 (5.2.16)
1 1 2 2
Sebenarnya, dapat ditunjukkan bahwa untuk sembarang pasangan (𝑋𝑖, 𝑋𝑗) dengan 𝑖 ≠
𝑗, 𝐶𝑜𝑣 (𝑋𝑖, 𝑋𝑗) adalah diberikan oleh persamaan (5.2.17), dan untuk setiap 𝑖,
𝑀
𝐸( 𝑋 ) = (5.2.18)
𝑖 𝑁
dan
𝑀 𝑀
𝑉𝑎𝑟(𝑋 ) = (1 − ) (5.2.19)
𝑖 𝑁 𝑁
Dalam kasus persamaan (5.2.21), ada n suku bentuk (5.2.19) dan 𝑛 (𝑛 − 1) dari bentuk
(5.2.17), dan hasilnya mengikuti setelah penyederhanaan.
Perhatikan bahwa mean dan varians dari distribusi hipergeometrik memiliki bentuk yang
mirip dengan mean dan varians binomial, dengan 𝑝 diganti dengan 𝑀 / 𝑁, kecuali untuk
faktor terakhir dalam varians, (𝑁 − 𝑛) / (𝑁 − 1), yang disebut sebagai istilah pengali
berhingga. Karena variabel acak hipergeometrik, 𝑌, mewakili jumlah cacat yang diperoleh
saat pengambilan sampel dari populasi yang terbatas tanpa penggantian, jelas bahwa 𝑉𝑎𝑟 (𝑌)
harus
Misalkan fungsi 𝐻 (𝑥, 𝑦) memiliki turunan parsial dalam persegi panjang terbuka
mengandung (𝜇1 , 𝜇2) Menggunakan pendekatan Taylor, kami mendapatkan yang berikut
rumus perkiraan untuk mean dan varians dari 𝐻 (𝑋, 𝑌)
Misalkan 𝑋𝑜 ∈ [𝑎, 𝑏], maka untuk nilai-nilai x disekitar 𝑥𝑜 dan 𝑥 ∈ [𝑎, 𝑏], 𝑓(𝑥) dapat diperluas
(diekspansi) ke dalam deret Taylor:
(𝑥 − 𝑥0) ′ (𝑥 − (𝑥 −
𝑓( 𝑥 ) = 𝑓( 𝑥 0 ) + 𝑓 (𝑥0) + 𝑓′′(𝑥0) + ⋯ + 𝑥0)𝑚 𝑓(𝑚)(𝑥0) + ⋯
1! 𝑥0)2
2! 𝑚!
Persamaan di atas merupakan penjumlahan dari suku-suku (term) yang disebut deret
5.3 Korelasi
Pengertian Korelasi
Korelasi merupakan istilah yang digunakan untuk mengukur kekuatan hubungan
antarvariabel. Analisis korelasi adalah cara untuk mengetahui ada atau tidak adanya
hubungan antarvariabel. Kekuatan hubungan antar variabel dapat dilihat dari hasil nilai
koefisien korelasi. Koefisien korelasi (KK) merupakan indeks atau bilangan yang
digunakan untuk mengukur keeratan
(kuat, lemah, atau tidak ada) hubungan antarvariabel. Koefisien korelasi ini memiliki nilai
antara -1 dan +1 (-1≤ KK ≤ +1), dengan arti yaitu:
1. Jika KK bernilai positif, maka variabel-variabel berkorelasi positif. Semakin dekat nilai
KK ini ke +1 semakin kuat korelasinya, demikian pula sebaliknya.
2. Jika KK bernilai negatif, maka variabel-variabel berkorelasi negatif. Semakin dekat nilai
KK ini ke -1 semakin kuat korelasinya, demikian pula sebaliknya.
4. Jika KK bernilai +1 atau -1, maka variabel menunjukkan korelasi positif atau negatif yang
sempurna.
Keeratan hubungan atau korelasi antarvariabel diberikan nilai – nilai dari KK sebagai patokan.
Berikut ini adalah patokan dari nilai KK tersebut.
6. 0,90 < KK < 1,00, korelasi sangat tinggi; kuat sekali; dapat diandalkan.
7. KK = 1, korelasi sempurna.
Koefisien korelasi ini digunakan untuk mengukur keeratan hubungan antara dua variabel
yang datanya berbentuk data ordinal (data bertingkat/data ranking). Disimbolkan dengan “𝑟𝑠”
dan dirumuskan:
6 ∑ 𝑑2
𝑟𝑠 = 1 −
𝑛3 − 𝑛
Keterangan:
n = banyaknya pasangan
data
C. Koefisien Korelasi Kontingensi
Koefisien korelasi kontingensi ini digunakan untuk mengukur keeratan hubungan antara dua
variabel yang datanya berbentuk data nominal (data kualitatif). Disimbolkan dengan “C” dan
dirumuskan:
𝐶= 𝑥2
√ 𝑥2 + 𝑛
Keterangan:
𝑥2 = 𝑘𝑎𝑖 𝑘𝑢𝑎𝑑𝑟𝑎𝑡
Koefisien penentu (KP) atau koefisien determinasi yang artinya penyebab perubahan pada
variabel Y yang datang dari variabel X, sebesar kuadrat koefisien korelasinya. Koefisien
penetu ini menjelaskan besarnya pengaruh nilai suatu variabel (variabel X) terhadap
naik/turunnya (variasi) nilai variabel lainnya (variabel Y). Dirumuskan:
𝐾𝑃 = 𝑅 = 𝑟2 𝑥 100%
Pentingnya rata-rata dan variansi dalam mencirikan distribusi variabel acak dibahas
sebelumnya, dan kovarians digambarkan sebagai ukuran ketergantungan yang berguna antara
dua variabel acak. Ini ditunjukkan pada Teorema 5.2.5 bahwa 𝐶𝑜𝑣(𝑋, 𝑌) = 0 setiap kali 𝑋
dan
𝑌 tidak bergantung atau berdiri sendiri. Sebaliknya, secara umum, tidak benar.
Contoh 5.3.1
1
Pertimbangkan sepasang variabel acak diskrit 𝑋 dan 𝑌 dengan bersama fkp 𝑓(𝑥, 𝑦) = jika
4
1 1
(𝑥, 𝑦) = (0,1), (1,0), (0,1) atau (−1,0). Fkp dari marjinal 𝑋 adalah 𝑓 (±1) = , 𝑓 (0) = ,
𝑥 4 𝑥 2
dan 𝑓𝑥(0) = 0 sebaliknya. Fkp dari Y sama. Dengan demikian, 𝐸(𝑋) = − 1(1/4) +
0(1/2) + 1(1/4) = 0. Karena 𝑥𝑦 = 0 setiap kali 𝑓(𝑥, 𝑦) > 0, ini mengikuti 𝐸(𝑋𝑌) = 0.
Akibatnya, 𝐶𝑜𝑣(𝑋, 𝑌) = 𝐸(𝑋𝑌) − 𝐸(𝑋)𝐸(𝑌) = 0. Namun, 𝑓(0,0) = 0 ≠ 𝑓𝑋(0)𝑓𝑌(0),
sehingga 𝑋 dan 𝑌 bergantung atau dependen. Secara umum, kita dapat menyimpulkan bahwa
𝑋 dan 𝑌 bergantung atau dependen jika 𝐶𝑜𝑣(𝑋, 𝑌) ≠ 0, tetapi 𝐶𝑜𝑣(𝑋, 𝑌) = 0 tidak selalu
menyiratkan bahwa 𝑋 dan 𝑌 adalah bebas atau independen.
Definisi 5.3.1
𝜌= 𝜎𝑋𝑌
(5.3.1)
𝜎𝑋𝜎𝑌
Variabel acak 𝑋 dan 𝑌 dikatakan tidak berkorelasi jika 𝜌 = 0; sebaliknya mereka dikatakan
berkorelasi. Notasi subskrip, 𝜌𝑋𝑌, juga kadang-kadang digunakan. Teorema berikut
memberikan beberapa sifat penting dari koefisien korelasi.
Teorema 5.3.1
Jika 𝜌 adalah koefisien korelasi dari 𝑋 dan 𝑌, maka
−1 ≤ 𝜌 ≤ 1
(5.3.2)
Dan
𝜌 = ±1 jika dan hanya jika 𝑌 = 𝑎𝑋 + 𝑏 dengan probabilitas 1 untuk 𝑎 ≠ 0 dan 𝑏
(5.3.3)
Pembuktian
Agar lebih mudah dipahami kita gunakan notasi yang disederhanakan 𝜇1 = 𝜇𝑋, 𝜇2 = 𝜇𝑌, 𝜎1 =
𝜎𝑋, 𝜎2 = 𝜎𝑌, dan 𝜎12 = 𝜎𝑋𝑌.
Untuk menunjukkan persamaan (5.3.2), misalkan
𝑌 𝑋
𝑊 = −𝜌
𝜎2 𝜎1
Jadi
2
1 2 2
( ) 𝜌 𝜎12
2
𝑉𝑎𝑟 = ( ) 𝜎 + ( ) 𝜎1 − 2𝜌
𝜎 2 𝜎 𝜎1𝜎2
𝑊 2 1
= 1 + 𝜌2 − 2𝜌2
= 1 − 𝜌2 ≥ 0
Karena 𝑉𝑎𝑟(𝑊) ≥ 0.
Contoh 5.3.2
Pertimbangkan variabel acak 𝑋 dan 𝑌 dengan fkp dari bentuk 𝑓(𝑥, 𝑦) 1
jika (𝑥, 𝑦) ∈ 𝐶,
20
=
Gambar 5.1
Wilayah yang terkait dengan 0 < 𝑥 < 10 dan 𝑥 − 1 < 𝑦 < 𝑥 + 1
Meskipun 𝑌 bukan fungsi dari 𝑋, distribusi bersama 𝑋 dan 𝑌 "berkerumun" di sekitar garis
𝑦 = 𝑥, dan kita harus mengharapkan 𝜌 berada di dekat 1.
(10)2 25
2
Variansi dari 𝑋 adalah 𝜎 = = (10)2 (2)2 26
𝑌 adalah 𝜎2 = + = dan
1 , variansi dari 2
12 3 12 12 3
3 3
Sangat memungkinkan untuk memperpanjang gagasan ekspektasi dan varian pada kerangka
bersyarat.
Definisi 5.4.1
Jika 𝑋 dan 𝑌 didistribusikan bersama variabel acak, maka ekspektasi bersyarat dari 𝑌 yang
diberikan 𝑋 = 𝑥 diberikan oleh
Notasi umum lainnya untuk ekspektasi bersyarat adalah 𝐸𝑦|𝑥(𝑌) 𝑑𝑎𝑛 𝐸(𝑌|𝑋 = 𝑥).
Contoh 5.4.1
Anggap contoh 4.5.2, dimana partikel udara tertentu mendarat secara acak (𝑋, 𝑌) pada bidang
segitiga. Pada contoh ini, fkp bersyarat dari Y yang diberikan X = x adalah :
2 𝑥
𝑓 (𝑦|𝑥) = 0 < 𝑦 <
𝑥 2
𝐸 (𝑌 | 𝑥) = 𝑥/2 2
∫0 𝑦 ( ) 𝑑𝑦
𝑥
(2/𝑥) (𝑥/2)2
= 2
𝑥
= ,0 < 𝑥 < 2
4
Jika kita mencoba untuk “memprediksi” nilai koordinat vertikal dari (𝑋, 𝑌), maka 𝐸(𝑌 | 𝑥)
harus lebih berguna daripada ekspektasi marjinal 𝐸(𝑌), karena itu gunakan informasi tentang
koordinat horizontal. Tentu saja, ini mengasumsikan bahwa informasi tersebut tersedia.
Perhatikan bahwa ekspektasi bersyarat dari Y yang diberikan X = x adalah fungsi dari x,
katakanlah 𝑢(𝑥) = 𝐸(𝑌 | 𝑥). Teorema berikut mengatakan bahwa, secara umum variabel
acak 𝑢(𝑋) = 𝐸(𝑌 | 𝑋) memiliki ekspektasi marjinal 𝑌, 𝐸(𝑌).
Teorema 5.4.1
Bukti
𝐸[𝐸(𝑌 | 𝑋)] = ∞
∫− 𝐸(𝑌 | 𝑥) 𝑓1(𝑥) 𝑑𝑥
∞
∞ ∞
= ∫−∞ ∫−∞ 𝑦𝑓(𝑦|𝑥) 𝑓1(𝑥) 𝑑𝑦 𝑑𝑥
∞ ∞
= ∫−∞ 𝑦 ∫−∞ 𝑓(𝑥, 𝑦) 𝑑𝑥 𝑑𝑦
∞
= ∫−∞ 𝑦 𝑓2(𝑦) 𝑑𝑦
= 𝐸(𝑌)
Dalam contoh sebelumnya, misalkan kita ingin mengetahui ekspektasi marjinal E(Y). Salah
satu kemungkinan adalah menggunakan teorema sebelumnya, dengan 𝐸(𝑌 𝐼 𝑥) = 𝑥/4 dan
𝑓1(𝑥) = 𝑥/2 untuk 0 < 𝑥 < 2. Khususnya,
Contoh 5.4.2
Misalkan jumlah kata yang salah eja dalam makalah semester siswa adalah variabel acak X
yang didistribusikan oleh Poisson dengan rata- rata 𝐸(𝑋) = 20. Teman sekamar siswa
diminta untuk mengoreksi makalah tersebut dengan harapan menemukan kesalahan ejaan.
Rata-rata, teman sekamar menemukan 85% dari kesalahan tersebut, jika kesalahan x ada di
dalam makalah, maka masuk akal untuk mempertimbangkan jumlah kesalahan ejaan yang
ditemukan sebagai variabel binominal dengan parameter 𝑛 = 𝑥 dan p = .85. Dengan kata lain,
syarat 𝑋 = 𝑥, 𝑌 ~ 𝐵𝐼𝑁(𝑥, .85), dan karena, secara umum, rata-rata distribusi binominal
adalah np, ekspektasi bersyarat adalah 𝐸(𝑌 | 𝑥) = .85𝑥. Dengan demikian, perkiraan jumlah
kesalahan ejaan yang ditemukan oleh teman sekamar akan menjadi 𝐸(𝑌) = 𝐸[𝐸(𝑌 | 𝑋)] =
𝐸(.85𝑋) = .85𝐸(𝑋) = 17.
Teorema 5.4.2
Jika X dan Y adalah variabel acak independen, maka E(Y | x) = E(Y) dan E(X | y) = E(X).
𝐸(𝑌 | 𝑥) = ∞
∫− 𝑦 𝑓(𝑦 | 𝑥) 𝑑𝑦
∞
∞
= ∫−∞ 𝑦 𝑓 2(𝑦) 𝑑𝑦
= 𝐸(𝑌)
Hal ini juga berguna untuk mempelajari varian distribusi bersyarat, yang biasanya disebut
sebagai varian bersyarat.
Definisi 5.4.2
Teorema 5.4.3
Bukti
= {𝐸(𝑌2) − 𝐸𝑋[𝐸(𝑌|𝑋)]2}
= 𝑉𝑎𝑟(𝑌) − 𝑉𝑎𝑟𝑥[𝐸(𝑌|𝑋)] ∎
Teorema ini menunjukkan bahwa, rata-rata (lebih dari X), varian bersyarat akan lebih kecil
daripada varian tak bersyarat. Tentu saja, mereka akan sama jika X dan Y independen, karena
𝐸(𝑌|𝑋) tidak akan menjadi fungsi X, dan 𝑉𝑎𝑟{𝐸(𝑌|𝑋)] akan menjadi nol. Jika seseorang
tertarik untuk memperkirakan rata-rata tinggi individu, 𝐸(𝑌), maka teorema menyarankan
bahwa mungkin lebih mudah untuk memperkirakan tinggi individu (bersyarat) jika kamu
mengetahui berat badan orang tersebut, karena populasi tak bersyarat dari ketinggian
memiliki varian yang lebih besar daripada berkurangnya semua populasi individu dengan
berat tetap, 𝑥. Fakta ini mengarah ke area penting analisis regersi, dimana informasi tentang
satu variabel digunakan untuk membantu memahami variabel terkait.
Argumen yang serupa dengan Teorema 5.4.1 menghasilkan teorema lebih umum seperti
berikut:
Teorema 5.4.4
Jika 𝑋 dan 𝑌 didistribusikan bersama variabel acak dan ℎ(𝑥, 𝑦) adalah fungsi, maka
Teorema ini mengatakan bahwa ekspektasi bersama, seperti persamaan pada sisi kiri (5.4.7),
dapat diselesaikan dengan terlebih dahulu menemukan ekspektasi bersyarat 𝐸[ℎ(𝑥, 𝑌) | 𝑥],
dan kemudian menemukan ekspektasi relatifnya terhadap distribusi marjinal dari 𝑋. Teorema
ini sangat berguna dalam aplikasi tertentu ketika digunakan bersama dengan teorema
selanjutnya yang dinyatakan tanpa bukti.
Teorema 5.4.5
Jika X dan Y didistribusikan bersama variabel acak, dan g(x) adalah fungsi, maka
Contoh 5.4.3
Jika (𝑋, 𝑌)~ 𝑀𝑈𝐿𝑇(𝑛, 𝑝1, 𝑝2), maka dengan derivasi langsung mengikuti 𝑋 ~ 𝐵𝐼𝑁(𝑛, 𝑝1),
𝑌 ~ 𝐵𝐼𝑁(𝑛, 𝑝2 ), dan bersyarat pada 𝑋 = 𝑥, 𝑌|𝑥 ~ 𝐵𝐼𝑁(𝑛 − 𝑥, 𝑝), dimana 𝑝 = 𝑝2
. Rata-rata
1 – 𝑝1
dan varian dari X dan Y mengikuti dari hasil pada bagian 5.2. Perhatikan juga bahwa
𝐸(𝑌 | 𝑥) = (𝑛– 𝑥)𝑝2/(1 − 𝑝1).
Dua teorema sebelumnya dapat digunakan untuk menemukan kovarian dari X dan Y.
Khususnya,
𝑋(𝑛 − 𝑋)𝑝2
=𝐸[ 1 − 𝑝1 ]
𝑝2
= [1 − 𝑝1] [𝑛𝐸(𝑋) – 𝐸(𝑋2)]
Jika kita mengganti 𝐸(𝑋) = 𝑛𝑃1 dan 𝐸(𝑋2) = 𝑉𝑎𝑟(𝑋) + (𝑛𝑝1)2 = 𝑛𝑝1[1 + (𝑛 − 1)𝑝1] dan
menyederhanakannya, maka hasilnya adalah
Sehingga,
= −𝑛𝑝1𝑝2
Seperti pada teorema 5.3.1, kita mengadopsi notasi yang nyaman µ1 = 𝐸(𝑋), µ2 = 𝐸(𝑌),
𝜎2 = 𝑉𝑎𝑟(𝑋),dan 𝜎2 = 𝑉𝑎𝑟(𝑌).
1 2
Teorema 5.4.6
𝐸(𝑌 | 𝑥) = µ2 + 𝜌
𝜎2
(𝑥 − µ2 ) (5.4.9)
𝜎1
dan
𝐸𝑥[𝑉𝑎𝑟𝑌|𝑋)] = 𝜎2 (1 − 𝑝2 (5.4.10)
2
Bukti
dan
= 𝐸[(𝑋 − µ1)𝑌]– 0
= 𝐸𝑋{𝐸[(𝑋 − µ1)𝑌|𝑋]}
= 𝐸𝑋[(𝑋 − µ1)𝐸(𝑌|𝑋)]
= 𝑎𝜎2
1
Jadi,
𝜎2 𝜎2
𝜎𝑋𝑌 = 𝜌 dan 𝑏 = µ2 − 𝜌 µ
𝑎 = 1 𝜎1 𝜎1 1
�
𝐸𝑋 𝜎2
[𝑉𝐴𝑅(𝑌|𝑋)] = 𝑉𝑎𝑟(𝑌) − 𝑉𝑎𝑟𝑋 [µ2 + 𝜌 (𝑋 − µ1)]
𝜎1
2 2
= 𝑉𝑎𝑟(𝑌)– 𝜌2 2𝜎 1
1
�
= 𝜎2(1 – 𝜌2)
2
Jadi, jumlah penurunan dalam varian populasi bersyarat dibandingkan dengan populasi tidak
bersyarat tergantung pada korelasinya, 𝜌, diantara beberapa variabel.
Hal yang penting sekarang akan dibahas dimana 𝐸(𝑌|𝑥) adalah sebuah fungsi linier dari 𝑥 dan
𝑉𝑎𝑟(𝑌|𝑥) tidak tergantung pada 𝑥.
Sepasang variable acak terus menerus 𝑋 𝑑𝑎𝑛 𝑌 dikatakan mempunyai distribusi bivariat
normal jika mempunyai bentuk gabungan fkp.
1 1 𝑥 − 𝜇1
𝑓(𝑥, 𝑦) = × 𝑒𝑥𝑝 {− [( 2
) 2− 2𝜌 ( 𝑥 − 𝜇1 𝑦 − 𝜇2 𝑦 − 𝜇2
2𝜋𝜎
𝜌2 𝜎 √1 − 2(1− 𝜌2) 𝜎1 𝜎 )( 𝜎2 ) + ( 𝜎2 ) ]}
1
1 2
yang tergantung pada lima parameter, −∞ < µ1 < ∞, −∞ < µ2 < ∞, 𝜎1 > 0, 𝜎2 > 0, dan
−1 < 𝜌 < 1.
Teorema berikut mengatakan bahwa fkp marginal adalah normal dan notasi yang digunakan
untuk parameter sudah tepat.
Teorema 5.4.7
Bukti
Tertulis di bagian 5.2 bahwa variable acak bebas tidak saling berhubungan. Dengan kata lain,
jika 𝑋 dan 𝑌 bersifat bebas, maka 𝜌 = 0. perhatikan bahwa gabungan fkp diatas, (5.4.11),
faktor-faktor kedalam produk fkp marginal jika 𝜌 = 0. akan tetapi, untuk variabel bivariat
normal, istilah ‘tidak berkorelasi’ bisa digunakan secara bergantian, meskipun hal ini tidak
benar untuk distribusi bivariat umum.
Teorema 5.4.8
1. Bersyarat pada 𝑋 = 𝑥,
𝑌|𝑥 ~ 𝑁 [𝜇2
+ρ (𝑥 − 𝜇1 ), 𝜎2(1 − 𝜌2)]
𝜎2
𝜎1 2
2. Bersyarat pada 𝑌 = 𝑦,
𝜎2
Bukti
Teorema ini menunjukan bahwa kedua ekspektasi bersyarat tersebut adalah fungsi-fungsi
linier dari variable bersyarat, dan kedua varian bersyarat tersebut. Jika ρ dekat ke angka nol,
maka varian bersyarat adalah mendekati varian marginal. Dan jika ρ dekat ke angka ±1, maka
varian bersyarat ini dekat dengan angka nol.
Seperti yang ditulis sebelumnya dalam bab ini, ekspektasi bersyarat, berupa 𝐸(𝑌|𝑥), adalah
fungsi dari 𝑥 yang, ketika diaplikasikan ke 𝑋, mempunyai nilai yang diharapkan yang sama
seperti 𝑌. Fungsi ini kadang-kadang merujuk sebagai fungsi regresi, dan grafik dari 𝐸(𝑌 | 𝑥)
disebut sebagai kurva regresi dari 𝑌 pada 𝑋 = 𝑥. Teorema sebelumnya menegaskan bahwa
untuk variable-variable bivariate formal, kita memiliki fungsi regresi linier. Hal ini mengikuti
Dalil 5.4.3 yang variannya dari 𝐸(𝑌 | 𝑋) adalah kurang dari atau sama dengan 𝑌, dan dengan
demikian fungsi regresi, secara umum, harus menjadi penduga yang lebih baik dari 𝜇2 =
𝐸(𝑌) daripada 𝑌 itu sendiri. Tentu saja, ini akan dijelaskan oleh fakta bahwa distribusi
marginal dari
𝑌 tidak menggunakan informasi tentang 𝑋, sedangkan distribusi bersyarat dari 𝑌 diberikan 𝑋 =
𝑥.
Konsep dari fungsi pembangkit momen dapat digeneralisasikan menjadi 𝑘-dimensional suatu
variabel acak
Definisi 5.5.1
FPM gabungan memiliki sifat serupa dengan FPM univariat. Momen campuran seperti
𝐸[𝑋 𝑟 𝑋 𝑠 ] dapat diperoleh dengan membedakan gabungan 𝑡𝑖, dan 𝑠 kali terhadap 𝑡𝑗 dan
𝑖 𝑗
kemudian mengatur semua 𝑡𝑖 = 0. FPM gabungan juga secara unik menentukan distribusi
gabungan dari variable 𝑋1, … , 𝑋𝑘.
Perhatikan bahwa itu juga mungkin untuk memperoleh FPM dari distribusi marjinal dari FPM
gabungan. Sebagai contoh,
Teorema 5.5.1
Jika 𝑀𝑋,𝑌(𝑡1, 𝑡2) ada, maka variabel acak 𝑋 dan 𝑌 independen jika dan hanya jika
Contoh 5.5.1
Seandainya
Gabungan FPM dari distribusi multinomial bisa dievaluasi sepanjang garis yang mengikuti
distribusi binomial untuk memperolehnya
= ∑… ∑ 𝑛
(𝜌 𝑒𝑡1)𝑥1… (𝜌 𝑒𝑡𝑘)𝑥𝑘𝜌𝑥𝑘+1
1 𝑘 𝑘+1
𝑥1! … 𝑥𝑘+1!
dimana 𝑝𝑘+1 = 1 – 𝑝1 − ⋯ – 𝑝𝑘
Secara jelas, distribusi marjinal gabungan juga merupakan multinomial, contohnya, jika
maka
Contoh 5.5.2
Pertimbangan sepasang variabel acak normal bivariat dengan mean 𝜇1 dan 𝜇2, varians
𝜎2 𝑑𝑎𝑛 𝜎2 dan korelasi koefisien 𝜌. Dengan kata lain, (𝑋, 𝑌) ~ 𝐵𝑉𝑁(𝜇1, 𝜇2, 𝜎2, 𝜎2, 𝜌). FPM
1 2 1 2
∞ ∞
gabungan dari X dan Y bisa dievaluasi secara langsung dengan integrasi: ∫−∞ ∫−∞ 𝑒𝑥𝑝 (𝑡1𝑥 +
𝑡2𝑦)𝑓(𝑥, 𝑦) 𝑑𝑥 𝑑𝑦 dengan 𝑓(𝑥, 𝑦) diberikan oleh persamaan (5.4.11). Pendekatan langsung
agak membosankan, maka kami memanfaatkan beberapa hasil pada expektasi bersyarat.
Secara khusus, dari teorema 5.4.4 dan 5.4.5, mengikuti jika:
= 𝐸𝑋{𝐸[exp(𝑡1 𝑋 + 𝑡2 𝑌) | 𝑋]}
𝑌 | 𝑥 ~ 𝑁 [𝜇 + 𝜌 𝜎2 (𝑥 − 𝜇 ), 𝜎2(1 − 𝜌2)]
2 𝜎1 1 2
sehingga
𝑀 (𝑡 , 1
𝑡 ) = exp [𝜇 + 𝜇 + (𝜎2𝑡2 + 𝜎2𝑡2 + 2𝜌𝜎 𝜎 𝑡 𝑡 )] (5.5.6)
𝑡 𝑡
𝑋,𝑌 1 2 1 1 2 2 1 1 2 2 1 2 1 2
2
RINGKASAN
Tujuan utama dari bab ini adalah mengembangkan materi umum yang melibatkan nilai yang
diharapkan dari dan fungsi variabel acak. Jumlah dan hasil kali merupakan fungsi yang
penting dari variabel acak yang diberikan perhatian khusus.. sebagai contoh, ditunjukkan jika
nilai yang diharapkan dari sebuah jumlah merupakan jumlah dari nilai yang diharapkan
(marjinal). Jika variabel acak independen, maka nilai yang diharapkan dari sebuah produk
adalah produk dari nilai yang diharapkan (marjinal) dan varian dari sebuah jumlah
merupakan jumlah dari varian (marjinal).