BAB IV
DISTRIBUSI BERSAMA
4.1 Pendahuluan
Dalam banyak aplikasi akan ada lebih dari satu peubah acak yang menarik.
Katakanlah . secara matematis, lebih mudah menganggap variabel
variabel ini sebagai komponen dari vektor yang
dapat mengasumsikan nilai dalam ruang Euclid.
Perhatikan, misalkan bahwa nilai x yang diamati mungkin adalah hasil dari pengukuran
masing-masing karakteristik k. Atau hasil dari mengukur satu karakteristik k kali.
Sehingga, dalam kasus terakhir, x dapat mewakili hasil dari percobaan berulang k dari
suatu percobaan yang fokus pada variabel tunggal. Seperti sebelumnya, kita akan
mengembangkan masalah diskrit dan kontinu secara terpisah.
Definisi 4.2.1
Pdf bersama dari peubah acak dimensi-k diskrit didefinisikan
sebagai
Example 4.3.1
Kembali pada Contoh 3.2.6 bahwa ada sebuah tempat penyimpanan berisikan 1000 biji
bunga dan 400 nya adalah biji bunga merah. Dari benih yang tersisa, 400 biji putih dan
200 pink. Jika 10 biji dipilij secara acak tanpa pengembalian, maka jumlah biji merah
adalah , jumlah biji putih adalah dalam sampel adalah peubah acak distribusi
bersama diskrit.
Pdf bersama pasangan diperoleh dengan mudah dengan cara
( )( )( )
( )
Untuk semua dan
Probabilitas diperoleh “tepat 2 merah, 5 putih, dan 3 pink” adalah
( )( )( )
( )
Perhatikan bahwa nilai dan ditentukan jumlah pink juga ditentukan. Katakanlah
sehingga cuku hanya mempertimbangkan satudua variabel saja.
Exercise 2
In Exercise 2 of the Chapter 3, a game consisted of rolling a die and tossing a coin. If X
denotes the number of spots showing on the dieplus the number of heads showing on tthe
coin. And if Y denotes just the number of spots showing on the die, tabulate the joint pdf of
X and Y.
Solutions:
Y,X 1 2 3 4 5 6 7
1 0 0 0 0
2 0 0 0 0
3 0 0 0 0
4 0 0
5 0 0 0 0 0
6 0 0 0 0 0
Exercise 3
Five cards are drawn without replacement from a regular deck of 52 cards. Lest X represent
the number of ace, Y the number of kings, and Z the number of queens obtained. Give the
probability of each of the following events:
Solutions:
(a)
( )( )
( )
(b)
( )( )
( )
(c)
( )( )( )
( )
(d)
(e)
|
(f)
( )( )
( )
(g)
( )( ) ( )( )
( ) ( )
(h)
( )( )
∑
( )
∑( )( )
,( ) ( ) ( )( ) ( )( )-
(i)
( )( )( )
( )
(j)
( )( )( )( )
( )
( )
dapat digeneralisasikan untuk diterapkan pada kasus dimana ada lebih dari 2 kategori hasil
yang menarik.
Misalkan bahwa suatu himpunan terdiri dari item yang jumlahnya berhingga N dan ada
kategori berbeda
Dan seterrusnya
Dipilih n item secara acak tanpa pengembalian dan misalkan dipilih
( )
Untuk semua
Dimana
Dan
Perhatikan bahwa disini hanya ada k peubah acak dan digunakan hanya sebagai notasi.
Permasalahan yang sesuai ketika pemilihan item dilakukan dengan pengembalian dapat
diselesaikan dengan bentuk yang lebih umum dari distribusi binomial yang biasa dikenal
sebagai distribusi multinomial.
DISTRIBUSI MULTINOMIAL
Misalkan ada kejadian saling lepas dan lengkap, katakan
yang dapat terjadi pada sebarang ujicoba dalam suatu percobaan. Dan misalkan
vektor
Untuk semua
Dimana
Daan
Dasar pemikiran dari persamaan pdf bersamanya yaitu sama dengan distribusi binomial.
Untuk memiliki tepat kejadian , diperlukan memiliki beberapa permutasi , ,
dan lainnya. Jumlah total dari permutasi tersebut adalah
Sama seperti distribusi binomial yang memberikan perkiraan untuk distribusi hypergeometri,
pada kondisi tertentu pdf MULT memperkirakan pdf HYP. Dalam contoh 4.2.1, kita
perkirakan nilai dari dengan pdf MULT dimana
Dan
Example 4.3.2
Dadu 4 sisi pada contoh 2.1.1 dilambungkan sebanyak 20 kali, dan jumlah masing-masing
kejadian di catat. Probabilitas diperoleh 1 adalah 4, 2nya 6 3nya 5, dan 4nya 5 dapat dihitung
dengan
( )
Jika kita hanya fokus pada pecatatan 1,3, dan bilangan genap, maka
Dan
( ) ( )
Fungsi-Fungsi yang didefinisikan oleh pdf HYP dan pdf MULT keduanya dijumlahkan 1
ketika dijumlahkan semua nkemungkinan nilai dan keduanya tidak
negatif. Ini diperlukan untuk mendefinisikan pdf diskrit.
Teorema 4.3.1
Fungsi adalah pdf bersama untuk beberapa vektor bernilai peubah acak
dan
∑ ∑
Dalam beberapa masalah dimensi 2, ini menunjukkan pdf bersama dalam bentuk tabel.
Terutama jika bentuk fungsi sederhananya untuk pdf tidak diketahui. Sebagai
ilustrasi, misalkan dan adaalah oeubah acak diskret dengan probabilitas bersama
diberikan pada tabel 4.1 nilai ini menunjukkan probabilitas dari distribusi
multinomial . Sebagai contoh, model ini akan diterapkan pada
Contoh 4.2.1 jika pengambilan sampel dengan pengembalian atau akan memperkirakan
model perluasan hipergeometri untuk kasus tanpa pengembalian. Terlebih dahulu perhatikan
bahwa:
∑ ∑
Seperti yang ditunjukkan oleh tabel. Ini mudah termasuk ketdakmungkinan hasil seperti (3,3)
dalam tabel dan menetapkan probabilitasnya nol.
Table 4.1
Sekarang kita tertarik pada probabilitas “Marginal” katakanlah , tanpa
menganggap untuk apa nilai mungkin diasumsikan. Relatif terhadap ruang sampel
bersama, memiliki dampak mempartisi kejadian, katakan A bahwa . Menghitung
probabilitas marginal
Sama dengan menghitung probabilitas total yang telah dibahas dalam 1.5. jika
menotasikan kejadian maka
Dan
∑ ( )
Seperti yang ditunjukkan oleh margin kanan dari baris atas tabel. Sama halnya kita
menghitung , dan seterusnya.
Nilai dari dierikan pada margin kannan untuk tiap nilai
yang mungkin. Jelas
∑ ∑∑
Sehingga adalah suatu pdf yang sah dan diacu sebagai pdf marginal dariv relatif
terhadap ruang sampel bersama asli. Serupa nilai numerik fungsi
Diberian pada margin bawah tabel, dan ini menyediakan sarana untuk menemukan pdf dari
dan dari
Definisi 4.2.2
Jika pasangan dari peubah acak diskrit memiliki pdf bersama maka pdf
Marginal dari dan
∑
Dan
∑
Karena dua fungsi diatas adalah pdf dari dan , notasi lain menjadi
Meskipuun pdf margnal dimotivasi oleh distribusi yang diajukan oleh tabel, seringkali
dimungkinkan untuk memperoleh rumus untuk
( ) ∑ ( )
( )
( )
Sehingga . Ini adalah apa yang telah kita harapkan, karena menghitung
jumlah terjadinya beberapa kejadian pada n ujicoba independen.
Untuk contoh biji bunga, dan . Jika kita tertarik hanya
pada jumlah biji bunga merah yang diperoleh, maka kita dapat menanam putih dan pink
bersamaan dan mengurangi massalah menjadi tipe masalah binomial.
Secara khusus, ( ). Serupa distribusi marginal adalah
( ). Tentu saja, probabilitas lain selain probabilitas marginal dapat dihitung dari pdf
bersamanya.
Jika X adalah dimensi-k peubah acak diskret dan A adalah suatu kejadian, maka
∑∑
Sebagai contoh, pada masalah biji bunga, kta mungkin ingin mengetahui probabilitas bahwa
jumlah biji bunga merah adalah kurang dari jumlah biji bunga putih. Dengan kata lain,
kejadian menariknya adalah . Jika pengambilan sampel dilakukan dengan
pengembalian, Tabel 4.1 di terapkan. Pasangan yang mungkin cocok untuk kejadian
adalah
Ini juga mungkin untuk menyatakan kejadian ini sebagai dimana A adalah daerah
bidang. Contoh:
{ | }
Pada pengaturan ini, langkahnya yaitu untuk menjumlahkan semua pasangan yang
tertutup dalam batas daerah A. Dalam contoh ini kita akan menjumlahkan semua pasangan
pada grafik berikut dari garis dimana batassan A ditunjukkan oleh Gambar 4.1
Sehingga
Probabilitas marginal dapat dinilai seperti pada bagian 2.2 dengan menjumlahkan semua pdf
marginalnya. Probabilitas bersama dari melibatkan himpunan dalam bentuk
Gambar 4.1
Definisi 4.2.3
CDF bersama
Fungsi distribusi kumulatif bersama dari k peubah acak didefinisikan oleh
perhatikan bahwa sifat ke-4 adalah kondisi montonitas yan merupakan versi dimensi dua dari
persamaan . Ini dibutuhkan untuk mencegah penuasan dari nilai
negatif sebagai probabilitas kejadian
Secara kkhusus
Example 4.3.3
Berdasarkan fungsi yang didefinisika sebagai berikut
{
Jika kita misalkan dan maka
Yang berarti bahwa sifat keempat tidak dipenuhi. Namun tidak sulit untuk memverifikasi
sifat ke-6 tidak menurun pada tiap varbael yang terpisah, dan semua sifat lain terpenuhi.
Sehingga, himpunan fungsi erdasarkan sifat ke-5 akan melanggar sifat 1.3.1 dari definisi
probabilitas.
Exercise 4
Rework Exercise 3 assuming thet the cards were drawn with replacement!
Solutions:
(a)
( ) ( )
(b)
( ) ( )
(c)
( ) ( ) ( )
(d)
(e)
|
(f)
( )( ) ( )
(g)
( ) ( ) ( ) ( )
(h)
∑( )( ) ( )
( )( ) ( ) ( )( ) ( ) ( )( ) ( )
(i)
( ) ( ) ( )
(j)
( ) ( ) ( )
Exercise 5
form
∑ ∑
Exercise 6
If X and Y are the discrete random variables witha joint pdf
∑∑
∑∑
∑ ∑
Exercise 7
Let and be discrete random variables with joint pdf given by the following
table:
1 2 3
1
2 0
3
Solutions:
(a) Pdf Marginal of dan
(b) Are dan independent ? Why or why not?
(c) Find
(d) Find
(e) Tabulate tho conditional pdf’s | and |
∫ ∫
Untuk semua
Seperti dalam kasus dimensi satu, pdf bersama dapat diperoleh dari penurunan
CDF bersama. Secara khusus,
Sebarang fungsi adalah pdf bersama peubah acak dimensi-k jika dan
hanya jika
Untuk semua
Dan
∫ ∫
Example 4.3.1
Misalkan konsentrasi dari zat tertentu dalam satu ujicoba pertama, dan
konsentrasi dari zat dalam ujicoba kedua. Asumsikan pdf bersamanya diberikan oleh
zero otherwise.CDF bersama diberikan oleh
∫ ∫
∫ ∫
didefinisikan berada pada wilayah tetapi ada 4 daerah lain yang harus
didefinisikan. Secara khuusus, lihat Figure 4.2 untuk melihat definisi pada 5
daerah.
Ini juga mungkin untuk mengevaluasi probabilitas bersama dengan mengintegralkan pdf
bersama untuk seluruh daerah. Sebagai contoh, kita akan
mencari probabilitas kedua ujicoba, “rata-rata konsentrasi kurang dari 0,5” kejadian ini dapat
ditunjukkan dengan * + atau lebih umum dengan
dimana , | +
Sehingga
0 1
∫∫
∫ ∫
dan kejadian
dimensi k dari A kita punya
∫ ∫
Secara khusus, mempertimbangkan CDF bersama dari suatu pasangan peubah acak
CDF dari
∫ .∫ /
∫
Sehingga untuk kasus kontinu, fungsi distribusinya dapat diintrepretasikan sebagai CDF
Marginal dari yang diberikan oleh dan keterkaitan pdf dengan adalah
jumlah yang terlampir dalam tanda kurung.
∫ ∫
Definisi 4.3.2
Jika paasangan dari peubah acak kontinu memiliki pdf bersama maka pdf
marginalnya dari adalah
∫
∫
Sehingga marginal dari adalah
∫
Definisi 4.3.3
Jika adalah peubah acak dimensi-k dengan CDF Bersama
maka CDF Marginal dari
( )
Example 4.3.2
Misalkan kontinu dengan pdf bersama
dan nol jika tidak. Dimana c adalah konstan. Pertama, perhatikan bahwa c=6. Misalkan
untuk menemukan marinal dari
Pdf nya diperoleh
∫ ∫
Untuk semua nilai . Maka masuk akal jika kita mengatakan pubah
acak independen.
Definisi 4.4.1
Peubah acak independen
Peubah acak dikatakan independen jika untuk setiap
Teorema 4.4.1
Peubah acak independen jika dan hanya jika memenuhi sifat
Dimana
Dan
Teorema 4.4.2
Dua peubah acak dengan pdf bersama independen jika dan hanya jika
1. “Support Set” { | }
2. Pdf bersama dapat difaktorkan menjadi hasil dari fungsi
Example 4.4.1
Pdf bersama pasangan
Example 4.4.2
Pasangan dengan pdf bersama
Dan nol jika tidak. Dalam kasus ini Support set nya { | } yang
dapat direpresentasikan sebagai dimana okeduanya berada pada interval terbula .
Namun, terema kedua tidak dipenuhi karena tidak dapa difaktorkan sebagai
. Sehingga dependen.
Example 4.4.3
Dua kompnen dalam roket dioperasikan independen, dan proabilitas masing-masing
komponen gagal pada peluncuran adalah p. Misalkan X menotasikan jumlah pelucuran yang
dibutuhkan untuk kegagalan komponen 1, dan Y jumlah peluncuran yang dibutuhkan untuk
mengetahui kegagalan komponen 2. Asumsikan ujicoba peluncuran independen, tiap variabel
sesuai dengan distribusi geometri, dan jika komponen yang diasumsikan
beroperasi independen, masuk akal jika model uuntuk pasangan variabel menjadi
∑∑
∑ ∑
∑ ∑
For
Exercise 17
For the random variables and of example 4.3.2:
a. Find the marginal
b. Find the marginal
c. Find the joint pdf of the pair
Solutions :
{
a. Pdf marginal
∫ ∫
∫
∫
for
b. ∫
∫
for
∫
∫
for
c. ∫
for
Exercise 18.
Consider a pair of continuous randpm variables X and Y with a joint CDF of the form
{
and zero otherwise. Find each of the following :
a. The joint pdf f(x,y)
b.
c.
d.
e.
f.
Solutions :
a.
For
( ( ))
For
( ( ))
( )
For
( ( ))
( )
For
Joint pdf {
b.
c. ∫ ∫
∫
∫ ( )
∫
+
d. * + ∫ ∫
∫ ( )+
∫ . ( ) ( )/
∫ ( )
∫ ( )
( )+
e. * +
( )
( )
Defenisi 4.5.1
Pdf bersyarat
Jika dan merupakan peubah acak diskrit atau kontinu dengan pdf bersama ,
kemudian pdf bersyarat dari bilamana didefinisikan sebagai berikut
∫ |
∫
Nilai penyebut di atas adalah total luas dimana pdf bersama pada dan pembilangya
merupakan jumlah luasan dimana (lihat pada gambar 4.4)
Hal ini dapat digunakan sebagai cara untuk menetapkan peluang dari suatu kejadian
di atas “irisan/potongan tipis” pada , dari suatu ruang contoh bersama dari
pasangan peubah acak .
Untuk melihat keabsahan persyaratan peluang, | haruslah memenuhi sifat pdf
pada peubah dengan tetap. Fakta bahwa | memenuhi bentuk
|
∫ | ∫
Teorema 4.5.1
Jika dan merupakan peubah acak dengan pdf bersama dan marginal pdf dari
dan , maka
| |
dan jika dan independen (saling bebas), maka
|
dan
|
Notasi lain sering digunakan untuk menyatakan pdf bersyarat. Sebagai contoh, jika dan
distribusi peubah acak bersama, pdf bersyarat dari dengan diketahui dapat dituliskan
sebagai | | atau barangkali cukup dengan | . Dalam banyak aplikasi, tidak akan
terjadi kebingungan jika kita hilangan penggunaan subskrip dan dukup dengan menggunakan
notasi yanglain sederhana | . Kadang juga untuk menyatakan “peubah acak bersyarat”
cukup digunakan | atau | .
Contoh 4.5.1
Misalkan variabel dan pada Contoh 4.4.3. pdf bersyarat dari dengan diketahui
yaitu
|
Perhatikan bahwa ini berarti untuk setiap pdf bersyarat dari bilamana
yaitu
| |
|
|
Contoh 4.5.2
Sebagian tanah datar berbentuk segitiga siku-siku dengan batas selatan dua mil panjang dan
batas timur satu mil panjang (Gambar 4.5)
Sebuah lahan benih yang dilihat dari suatu titik di udara menjadi perhatian. Kita
asumsikan: diketahui bahwa lahan benih dengan batas, koordinat dan seragam menyebar
di atas permukaan segitiga. Dengan kata lain, pasangan memiliki pdf bersama yang
konstan. Berdasarkan sifat ∫ ∫ , kita memiliki . Pdf
marjinal dari dan adalah
Dan nol untuk yang lainnya. Ini berarti bahwa dengan kondisi pada nilai ,
.
Salah satu interpretasi yang mungkin dari hasil ini ialah sebagai berikut. Misalkan kita
memperhatikan koordinat tetapi tidak dengan koordinat . Jika kita memperhatikan bahwa
, maka masuk akal untuk menggunakan informasi ini dalam menetapkan peluang dari
suatu kejadian relatif terhadap . Jadi, jika kita memperhatikan maka peluang
bersyarat bahwa adalah adalah interval tertentu, katakanlah yaitu
| ∫ |
∫
Secara matematis, tidak ada yang salah dengan peluang marjinal, akan tetapi ini tidak dapat
dijadikan sebagai informasi tentang peubah acak terkait. Pada contoh ini, pdf bersyarat
berubah menjadi seragam, tetapi tidak selalu demikian.
Contoh 4.5.3
Dengan memperhatikan densitas bersama yang telah dibahas pada Contoh 4.4.2,
Exercise 19
Let X and Y be continuous random variables with joint pdf of the form
Solutions :
a. ∫ ∫
∫ ∫
∫ ∫
∫ +
∫
+
b. ∫
∫
( )+
( ) ( )
for
∫
( )+
( )
for
c. Joint CDF
For
∫ ∫
For
∫ ∫ ∫ ( )+
∫
∫
For
∫ ∫
For
∫ ∫
For
∫ ∫
Joint CDF
d. |
for
e. |
for
Exercise 20
Suppose that X and Y have the joint pdf and zero otherwise.
Find each of the following :
a. The joint CDF
b. |
c. |
d. |
e. |
Solutions :
a. CDF
For
∫ ∫
∫
∫
+
For
∫ ∫
For
∫ ∫
Joint CDF
b. ∫
+
|
c. ∫
+
( )
d. * | + ∫
( )
∫
( )
∫
+
Exercise 21
b. ∫
∫
+
( )
for
c. |
for
d. ∫ ∫
∫ +
∫
∫ ∫
+ +
* ( )+ * ( )+
e.
f. Yes, because
Artinya, pengambilan sampel acak mengasumsikan bahwa sampel diambil sedemikian rupa
sehingga peubah acak untuk setiap percobaan yang saling bebas dan mengikuti populasi
umum pdf. Pada kasus ini, pdf bersama merupakan hasil dari marjinal densitas. Ini biasanya
juga merujuk pada himpunan nilai yang diamati atau data , yang diperoleh dari
percobaan sebagai sampel acak.
Ini juga merupakan praktik umum untuk merujuk pada set nilai yang diamati, atau data,
x1, x2, ..., x, yang diperoleh dari percobaan sebagai sampel acak.
Pada banya kasus, perlu untuk mendapatkan data pengamatan yang aktual dari suatu populasi
untuk membantu memvalidasi model yang diasumsikan atau untuk membantu memilih model
yang sesuai. Jika data tersebut dapat diasumsikan untuk menyatakan sampel acak, maka
persamaan
menjadi penghubung antara data yang diamati
dengan model matematika.
Contoh 4.6.1
Masa hidup bola lampu jenis tertentu diasumsikan mengikuti populasi pdf “eksponensial”
yang diberikan oleh
Dimana masa hidup bola lampu tersebut diukur dalam tahun. Jika sampel acak keduanya
diperoleh dari populasi ini, maka kita mempunyai
Sekarang misalkan jumlah masa hidup dari dua bola lampu berubah menjadi
tahun. Pertanyaannya adalah apakah hasil dari sampel ini masuk
akal ketika populasi densitas diberikan pada persamaan . Jika
tidak, maka mungkin model populasi yang berbeda lebih tepat. Pertanyaan jenis ini dapat
dijawab dengan menggunakan persamaan . Khususnya
dengan menganggap
∫ ∫
Teknik khusus untuk membuat kesimpulan berdasarkan data sampel akan ditekankan
pada bab-bab selanjutnya, dan sekarang kami tertarik untuk mengembangkan sifat
matematika yang diperlukan dalam melaksanakan prosedur statistik tersebut.
DISTRIBUSI EMPIRIS
Dimungkinakan untuk menggunakan aturan pada distribusi diskrit untuk mempelajari
model berkelanjutan spesifik. Contoh, misalkan merupakan sampel acak dengan
ukuran , masing-masing didistribusikan sebagai dimana masing-masing dan
merupakan populasi dari pdf sdan CDF. Untuk setiap bilangan real , misalkan
merupakan banyaknya peubah , pada sampel acak yang kurang atau sama dengan . Kita
dapat menganggap kejadian unuk sembarang sebagai “berhasil”, dan karena
peubah sampel acaknya saling bebas, hanya menghitung jumlah keberhasilan pada
percobaan Bernoulli saling bebas dengan peluang keberhasilan . Sehingga,
dengan Frekuensi relatif dari percobaan yang berhasil menjadi ,
yang mana dinotasikan dengan , merujuk pada CDF empiris. Sifat keteraturan statistik
yang telah dibahas pada bagian 1.2 menunjukkan bahwa harus dekat dengan
untuk yang besar. Jadi, untuk setiap model CDF, harus sesuai dengan CDF, ,
berdasarkan data dari .
Kita ambil himpunan data dari sampel acak ukuran dari dan
misalkan menjadi nilai terurut dari data tersebut. Maka CDF empiris
berdasarkan data tersebut dinyatakan sebagai
Contoh 4.6.2
Data berikut merupakan simulasi dari sampel berukuran dari distribusi pada Contoh
2.3.2, dimana CDF memiliki bentuk
Grafik dari dan diperlihatkan pada Gambar 4.6. Meskipun grafik CDF empiris,
merupakan fungsi, secara umum dapat digunakan untuk memperoleh seidaknya ide
awal bentuk CDF yang sesuai, Pada contoh ini , ukuran sampel barangkali
terlalu kecil menarik suatu kesimpulan, tetapi grafik pada Gambar 4.6 menunjukkan
kesepakatan yang baik.
Untuk menentukan distribusi yang sesuai untuk populasi, in akan sangat membantu jika
mempunyai estimasi numerik untuk populasi yang tidak diketahui parameternya. Contoh,
misalkan untuk mengestimasi populasi mean . Berdasarkan CDF empiris yaitu distribusi
diskrit dengan pdf, katakanlah , yang menetapkan nilain pada masing-masing nilai
data dan nol untuk yang lainnya. Mean dari distribusi ini adalah
∑ ( ) ( ) yang meyediakan estimasi dari Estimasi ini, yang
mana menyederhanakan rata-rata dari data aritmatika, yang disebut sebagai samplel rerata,
dinotasikan sebagai ̅ ∑ . Alasan ini dapat digunakan untuk mengestimasi parameter
lain yang belum diketahui nilainya. Contoh, estimasi populasi variansi menjadi variansi
̅ ̅
distribusi empiris, ∑ ̅ . Namun ternyata prosedur
seperti ini cenderung meremehkan variansi populasi. Poin ini akan dibahas pada Bab 8,
dimana ini akan ditampilkan bahwa versi modifikasi berikut tidak mengalami masalah ini.
̅
Sampel variansi didefinisikan sebagai ∑ . Ilutrasi lain melibatkan estimasi
proporsi populasi. Sebagai contoh, anggaplah sebuah penelitian berkaitan dengan apakah
individu dalam suatu populasi telah terkena penyakit menular tertentu. Katakanlah proporsi
, yang telah terbuka adalah parameter lain dari populasi . Jika individu dipilih secara acak
dari populasi dan adalah jumlah yang telah terpapar, maka proporsi sampel didefinisikan
sebagai ̂ . Ini dapat diperlakukan sebagai salah satu jenis sampel rata-rata istimewa.
Untuk individu ke- pada sampel, didefiniskan jika ia telah terpapar dan nol untu yang
lainnya. Data sesuai dengan yang diamati nilai sampel acak dari distribusi Bernoulli
dengan parameter dan
̅ ̂
HISTOGRAM
Biasanya akan lebih mudah dalam mempelajari distribusi peluang dalam bentuk pdf,
, daripada CDF. Ini membuat kita mempertimbangkan jenis distribusi empiris yang
berbeda, dikenal sebagai histogram. Meskipun konsep ini umumya dianggap sebagai metode
deskriptif murni dalam pengembangan peluang dan statistik yang lebih rendah, ini
memungkinkan untuk memberikan alasan dalam hal distribusi multinomial yang disajikan
pada bagian 4.2.
Andaikan sebuah data dapat pilih menjadi disjoin interval, katakanlah ;
Maka frekuensi relatif, , dengan pengamatan pada memberikan setidaknya
indikasi tentang kisaran nilai pdf, , mungkin memiliki lebih dari interval itu. Ini dapat
dibuat lebih tepat dengan mempertimbangkan keadian , dimana
terjadi jika dan hanya jika untuk sembarang variabel , dari sampel acak pada interval jika
dan terjadi jika tidak terletak pada . Jika merupakan banyakanya
variabel dari sampel acak pada , dan , maka ,
dimana
( ) ( ) ∫
Sekali lagi, karena keteraturan statistik, kita akan memperhatikan frekuensi relatif, ,
menjadi dekat dengan untuk yang besar. Biasanya dimungkinkan untuk memilih interval
sehingga peluang dari diabaikan. Sebenarnya, dalam praktiknya, ini dilakukan dengan
memilih interval setelah data diperoleh. Ini adalah praktik yang mudah meskipun secara
teoritis salah
Berikut ini merupakan hasil pengamatan yang mewakili masa hidup bola lampu dalam
beberapa bulan dari sampel acak dari 40 bagian listrik yang telah dipesan dari yang terkecil
hingga yang terbesar:
Dapat dilihat, sebagai contoh, bahwa perbandingan dari nilai sampel turun
sebelum bulan. Sehingga kita akan mengaproksimasikannya sekitar dari jumlah
populasi yang akan turun sebelum bulan dan seterusnya Tentu saja, keakuratan dari
estimasi atau aproksimasi dari ini akan bergatung pada ukuran sampel . Agar secara
langsung mendekati populasi pdf, buatlah sebuah persegi panjang di atas interval
dengan luasan , persegi panjang di atas interval dengan luasan dan
seterusnya. Untuk mencapai ini, tinggi dari persegi panjang tersebut haruslah diambil sebagai
pecahan yang diingingkan dibagi dengan panjang interval. Sehingga, tinggi dari persegi
panjang tersebut berada di atas interval menjadi , tinggi di atas interval
menjadi dan seterusnya. Hasilnya dapat dilihat pada Tabel 4.7,
yang kadang disebut sebagai histogram frekuensi relatif termodifikasi.
Kurva yang halus melalui bagian atas persegi panjang kemudian akan memberikan
perkiraan langsung pada populasi pdf. Jumlah dan panjang interval dapat disesuaikan dengan
mempertimbangkan faktor-faktor seperti ukuransampel atau rentang data. Namun, keputusan
tersebut murni subjektif, dan tidak ada aturan umum untuk melakukan ini.
Bentuk kurva dari histogram pada Gambar 4.7 tampak konsisten dengan pdf eksponensial
yaitu
( )
Dan grafik pdf tersebut juga ditujukkan pada gambar. Pada kasus ini, CDF nya yaitu
Data yang ada pada contoh ini, disimulasikan dari model , dan perbedaan
antara distribusi empiris dengan hasil model yang sebenarnya dari “kesalahan pengambilan
sampel” alami diikutsertakan. Ketika ukuran sampel meningkat, histogram atau distribusi
empiris harus mendekati model yang sebenarnya. Tentu saja dalam latihan, model yang
sebenarnya tidak diketahui.
Barangkali perlu diperhatikan bahwa Definisi 4.6.1
dari sampel acak tidak berlaku untuk kasus
“pengambilan acak” tanpa penggantian dari populasi terbatas. Terminilogi “pengambilan
sampel acak” digunakan dalam kasus ini untuk mencerminkan fakta bahwa pada setiap uji
coba unsur-unsur yang tersisa dalam populasi sama-sama memiliki kemungkinan untu
dipilih, tetapi uji coba tersebut tidak saling bebas dan teknik perhitungan yang biasa dibahas
sebelumnya tidak berlaku di sini. Terminologi sampel acak merujuk pada ide setiap
himpunan bagian dengan ukuran sampel dari suatu populasi memliki kemungkinan yang
sama untuk dipilih sebagai sampel. Defisini 4.6.1 relevan untuk ssampel yang berasal dari
populasi terbatas jika pengambilan sampel dilakukan dengan pergantian (atau ini akan dikira-
kira cocok jika populasinya cukup besar).
SUMMARY
Tujuan dari bab ini adalah untuk mengembangkan konsep peubah acak untuk percobaan
yang melibatkan dua atau lebih respon numerik. Pdf dan CDF bersama menyediakan cara
untuk menyatakan distribusi peluang bersama. Ketika peubah acak dipertimbangkan secara
individual, pdf marjinal dan CDF menyatakan distribusi peluangnya.
Ketika pdf bersama dapat difaktorkan ke dalam bentuk pdf marginal, maka peubah
acaknya saling bebas. Jika distribusi bersama dari peubah acaknya saling bergantung, maka
pdf bersyarat menyediakan cara untuk menyatakan bahwa ini ketergantungan.
Informasi tentang sifat dari model peluang yang sebenarnya dapat diperoleh dengan
melakukan percobaan yang saling bebas, dan memperoleh sebagai nilai dari peubah acak
yang diminati. Pengamatan ini merupakan sampel acak dari populasi yang nyata atau
konseptual. Informasi yang berguna tentang distribusi populasi dapat diperoleh dengan
metode deskriptif seperti CDF empiris atau histogram.