Anda di halaman 1dari 38

Bab 10

PENDUDUK, SAMPEL

& CONTOH

DISTRIBUSI

10.1 Eksperimen dan Populasi

Bagian 1 memberikan beberapa definisi dasar dan konsep statistik -


data,

percobaan, pengambilan sampel, populasi, sampel, ruang sampel dan


statistik-

tic. Di bagian ini, tautan dari ide-ide ini ke distribusi probabilitas

dan variabel acak dibuat eksplisit.

Ada dua aspek dalam gagasan percobaan. Ini adalah proses apa pun

yang menghasilkan data, dan, setidaknya dalam beberapa kasus,


menghasilkan sampel data,

dalam hal ini, ini juga dianggap sebagai pengambilan sampel dari suatu
populasi. Sini

populasi didefinisikan sebagai totalitas item yang kami minati.

Di sisi lain, ruang sampel percobaan mencantumkan semua


kemungkinan

hasil percobaan. Banyak upaya dicurahkan dalam Bagian 5 - 7 untuk

menetapkan properti variabel acak yang dapat didefinisikan ... pada

ruang sampel percobaan.

Dari perspektif ini, maka, percobaan menghasilkan nilai-nilai a

variabel acak, dan bahkan mungkin beberapa variabel acak. Nilai

dari variabel acak diasumsikan terjadi dengan probabilitas diketahui

percobaan yang diberikan, dan pengumpulan probabilitas ini merupakan


distribusi probabilitas variabel acak.

Menggabungkan dua aspek, kita melihat bahwa data yang dihasilkan


oleh eksperimen dapat

dianggap baik sebagai nilai-nilai variabel acak dan sebagai sampel data

dari suatu populasi. Lebih ringkasnya, kita dapat memperdebatkan


bahwa nilai-nilai itu terjadi pada

populasi dihasilkan oleh percobaan. Mengejar argumen ini

tahap lebih lanjut, kita dapat menyimpulkan bahwa nilai-nilai yang terjadi
dalam suatu populasi dapat

dianggap sebagai nilai-nilai variabel acak.

Ini adalah ide penting, tetapi dapat diperpanjang lebih jauh. Relatif

122BAB 10. POPULASI, SAMPEL & DISTRIBUSI SAMPLING

frekuensi yang nilainya muncul dalam populasi harus sama dengan

kemampuan nilai-nilai ini sebagai nilai-nilai variabel acak. Jadi, kita bisa
berdebat

bahwa suatu populasi “setara” (dalam pengertian ini) dengan variabel


acak. Ini

penalaran memungkinkan kita untuk menggunakan bahasa probabilitas


dan

kontribusi bersama dengan populasi dan frekuensi relatif populasi.

10.1.1 Contoh

1. Populasi hasil pemeriksaan Januari untuk ES1070 adalah

nilai beberapa variabel acak.

2. Jumlah mobil yang melewati titik pengamatan pada M60 secara


singkat

Interval waktu adalah nilai dari beberapa variabel acak.


3. Apakah rumah tangga di Inggris memiliki DVD player atau tidak
adalah nilainya

dari variabel acak.

Keterampilan ahli statistik terletak pada memutuskan mana yang tepat.

variabel dom untuk menggambarkan populasi yang mendasarinya. Ini


tidak selalu mudah,

dan biasanya seseorang mencoba menggunakan variabel acak dan


probabilitas yang terkenal

distribusi, setidaknya sebagai ... perkiraan pertama. Maka dari itu perlu
didiskusikan

Binomial, Geometris, Poisson, Seragam, Eksponensial, dan Normal


acak

variabel dalam kursus ini.

10.2

Populasi dan variabel acak

Diskusi di atas membantu kita untuk melihat mengapa nilai yang


diharapkan,

E [X], dari beberapa variabel acak X secara bersamaan

maksud teoritis

rata-rata distribusi probabilitas X

artinya populasi.

Hal yang sama berlaku untuk varians var [X] dari X: itu

varian teoretis

varians dari distribusi probabilitas X

varians populasi.

Karakteristik populasi seperti mean dan varians biasanya disebut pop-


parameter ulasi, tetapi mereka juga karakteristik dari distribusi
probabilitas

kontribusi X: Ada beberapa jenis parameter lain yang mungkin menarik


bagi kami

di - misalnya, frekuensi relatif populasi pada Contoh 3 bagian

10.3. SAMPEL DAN SAMPEL 123

10.1.1. Jika kita de ... ne X menjadi variabel acak mengambil nilai 1 jika
a

rumah tangga memiliki pemutar DVD, dan 0 sebaliknya, proporsi


populasi

menjadi parameter distribusi probabilitas sebagai = Pr (X = 1):

10.2.1 Tujuan Statistik

Sejauh menyangkut kursus ini, tujuan statistik adalah untuk belajar

karakteristik atau parameter populasi. Penting untuk diingat itu

nilai-nilai parameter ini tidak diketahui oleh kami, dan umumnya, kami
akan melakukannya

tidak pernah menemukan nilai-nilai mereka dengan tepat. Idenya adalah


untuk sedekat mungkin dengan kebenaran

mungkin, meskipun kebenaran mungkin tidak pernah diungkapkan


kepada kita. Yang kami bisa

lakukan dalam praktek adalah membuat penilaian yang masuk akal


berdasarkan bukti (data)

dan analisis data itu: proses ini disebut inferensi statistik. Begitu,

tujuan statistik adalah inferensi statistik pada populasi (tidak diketahui)

parameter lation.

10.3 Sampel dan Pengambilan Sampel

Sederhananya, kami menggunakan sampel data dari suatu populasi


untuk menarik kesimpulan
tentang parameter populasi yang tidak diketahui. Namun, argumen
dalam Sec-

tion 10.1 memperjelas bahwa gagasan pengambilan sampel dari suatu


populasi adalah

setara dengan pengambilan sampel dari distribusi probabilitas suatu ran

variabel dom.

Penting untuk dicatat bahwa cara sampel diperoleh

akan mempengaruhi inferensi tentang parameter populasi. Memang,


ditarik dengan buruk

10.3.1 Contoh

Misalkan penyidik tertarik pada jumlah utang yang dipegang oleh

siswa ketika mereka lulus dari universitas UK. Jika simpatisan

ples hanya lulusan siswa dari University of Manchester, ada bisa

tidak ada anggapan bahwa sampel tersebut mewakili semua lulusan UK

siswa.

10.3.2 Pengambilan sampel dari suatu populasi

Lebih mudah untuk memulai dengan membahas metode pengambilan


sampel yang tepat dari populasi.

ulasi, dan kemudian diskusikan kesetaraan dengan pengambilan sampel


dari probabilitas

distribusi. Tujuan kami untuk menghindari kesimpulan yang bias pada


umumnya adalah

miring untuk dipenuhi jika prosedur pengambilan sampel memuaskan


dua kondisi:

1. Setiap elemen populasi memiliki peluang yang sama untuk ditarik

untuk dimasukkan dalam sampel.


124BAB 10. POPULASI, SAMPEL & DISTRIBUSI SAMPLING

2. Setiap penarikan dari populasi tidak tergantung pada sebelumnya dan

undian yang berhasil.

Sampel yang memenuhi kondisi ini disebut sampel acak sederhana,

meskipun sering ini disingkat menjadi sampel acak.

Bagaimana kondisi ini direalisasikan secara fisik? Menggambar nama


dari a

topi adalah salah satu metode yang mungkin, meskipun tidak terlalu
praktis untuk populasi besar.

Mesin elektronik yang digunakan untuk membuat undian untuk Lotere


Nasional adalah

tampaknya dianggap cara yang adil untuk menggambar 6 atau 7 angka


dari 50. Penggunaannya

komputer untuk menggambar angka "pseudo-acak" juga merupakan


metode standar.

Ada beberapa komplikasi teknis yang terkait dengan deskripsi ini

pengambilan sampel acak. Salah satunya adalah bahwa dengan


populasi ... ukuran,

Sesi dapat dipenuhi hanya jika barang yang diambil dari populasi
"diganti"

setelah menggambar - ini adalah pengambilan sampel dengan


penggantian. Jadi, pengambilan sampel dengan-

penggantian keluar membuat peluang diambil dari populasi

berbeda di setiap undian. Namun, jika kita memiliki populasi "besar", dan
a
"Kecil" ukuran sampel relatif terhadap ukuran populasi, ada sedikit
praktis

perbedaan antara pengambilan sampel dengan dan pengambilan


sampel tanpa penggantian.

Perbedaan-perbedaan ini diabaikan dalam hal berikut.

10.3.3

Pengambilan sampel dari distribusi probabilitas

Sangat membantu untuk melihat contoh pengambilan sampel dari suatu


populasi: contohnya adalah

cukup sederhana untuk membuat tautan ke pengambilan sampel dari


distribusi probabilitas

transparan.

Populasi berisi 1000 elemen, tetapi hanya tiga nilai yang berbeda ok

saat ini dalam populasi ini, 0; 1; 2; dengan populasi frekuensi relatif p0;
p1; p2

masing-masing. Kita dapat menganggap populasi ini setara dengan


populasi

variabel dom X mengambil nilai 0; 1; 2 dengan probabilitas p0; p1; p2:


The

distribusi probabilitas X dapat direpresentasikan sebagai tabel

Nilai Probabilitas X

0 p0

1 hal

2 hal

Dalam populasi ini, 0 terjadi 1000p0 kali, 1 terjadi 1000p1 kali dan 2

terjadi 1000p2 kali. Jika kita memilih elemen dari populasi secara acak,
kami tidak tahu sebelumnya elemen mana yang akan digambar, tetapi
setiap elemen

memiliki peluang yang sama,

1000

; dipilih. Apa kemungkinannya bahwa a

0 nilai dipilih? Agaknya ini adalah rasio dari jumlah 00 ke

ukuran populasi:

1000p0

1000

= p0:

10.3. SAMPEL DAN SAMPEL 125

Argumen yang persis sama berlaku untuk memilih 1 atau 2;


menghasilkan seleksi

probabilitas p1 dan p2 masing-masing.

Jelas bahwa distribusi probabilitas dari apa yang bisa diambil

populasi adalah variabel acak X yang “menggambarkan” ini

populasi. Jadi, pantas untuk mendefinisikan ... variabel acak X1;


katakan, yang mana

menjelaskan apa yang mungkin diperoleh pada ... undian pertama dari
populasi ini.

Nilai-nilai yang mungkin dari X1 adalah tiga nilai berbeda dalam


populasi,

dan probabilitasnya sama dengan probabilitas menggambar nilai-nilai ini

dari populasi:

X1 memiliki distribusi probabilitas yang sama dengan X:


Dengan prinsip pengambilan sampel acak (sederhana), apa yang dapat
ditarik pada

undian kedua adalah independen dari ... undian pertama. Nilai yang
sama

tersedia untuk menggambar, dengan probabilitas yang sama. Apa yang


bisa ditarik pada

gambar kedua juga dijelaskan oleh variabel acak, X2; katakan, yang
mana

tidak tergantung pada X1 tetapi memiliki distribusi probabilitas yang


sama dengan X1:

X2 tidak tergantung pada X1; dan memiliki distribusi yang sama dengan
X.

Kita dapat melanjutkan dengan cara ini sampai n gambar dibuat,


dihasilkan

dalam sampel acak ukuran n: Masing-masing n variabel acak X1; :::; Xn

menggambarkan apa yang bisa ditarik adalah variabel acak independen

distribusi probabilitas yang sama dengan variabel acak X yang


menggambarkan

populasi. Untuk menggunakan frasa jargon, variabel acak sampel ini


adalah

didistribusikan secara independen dan identik.

Kita harus menerjemahkan proses pengambilan sampel dari populasi ke


sampel

pling dari distribusi probabilitas X: Yang harus kita lakukan adalah


mengatakan

bahwa apa yang mungkin diperoleh dalam sampel acak ukuran 1 dari
probabilitas

distribusi X adalah nilai-nilai variabel acak X1 dengan nilai yang sama


distribusi probabilitas sebagai X: Untuk sampel acak ukuran 2, apa yang
mungkin kita lakukan

dapatkan adalah nilai-nilai sepasang variabel acak independen X1; X2;


setiap

memiliki distribusi probabilitas yang sama dengan X: Untuk sampel


ukuran acak

n; apa yang mungkin kita dapatkan adalah nilai-nilai n variabel acak


independen

X1; :::; Xn; masing-masing memiliki distribusi probabilitas yang sama


dengan X:

Meskipun populasi tertentu digunakan sebagai contoh, orang dapat


melihat

bahwa deskripsi pengambilan sampel dari distribusi probabilitas yang


sesuai

bution menghasilkan properti yang berlaku secara umum. Khususnya,


bahkan berlaku

ketika variabel acak yang digunakan untuk menggambarkan suatu


populasi adalah kontinu

variabel acak.

Untuk meringkas, menggunakan bahasa sampling dari distribusi


probabilitas

bution,

sampel acak ukuran n dari distribusi probabilitas a

variabel acak X

126BAB 10. POPULASI, SAMPEL & DISTRIBUSI SAMPLING

terdiri dari variabel acak sampel X1; :::; Xn

yang saling independen

dan memiliki distribusi probabilitas yang sama dengan X;


X1; :::; Xn didistribusikan secara acak dan independen

variabel

X1; :::; Xn adalah i.i.d.

Penting untuk dicatat bahwa diskusi ini berkaitan dengan apa yang
mungkin terjadi

diperoleh dalam sampel acak. Sampel data terdiri dari nilai-nilai

x1; :::; xn dari variabel acak sampel X1; :::; Xn:

10.3.4 Contoh

1. Sampel acak ukuran 3 diambil dari populasi di atas. Itu

terdiri dari tiga variabel acak i.i.d X1; X2; X3: Misalkan bahwa

nilai dalam sampel data adalah 0,0,1: yaitu,

x1 = 0; x2 = 0; x3 = 1:

2. Mengejar contoh utang pascasarjana dari Bagian 10.3.1, anggaplah


itu

hutang pascasarjana dijelaskan oleh variabel acak X dengan normal

distribusi, sehingga X didistribusikan sebagai N

5000; 10002

XN

5000; 10002

Jika 10 siswa diambil secara acak dari populasi siswa


(mis. menggunakan sampel acak), hutang pada setiap penarikan juga
memiliki ini

distribusi. Sampel acak terdiri dari 10 variabel acak

X1; :::; X10; saling independen, dan setiap Xi biasanya didistribusikan

uted:

Xi N

5000; 10002

; i = 1; :::; 10:

Sampel data adalah nilai x1; :::; xn; sebagai contoh,

x1 = 5754: 0; x2 = 6088: 0; x3 = 5997: 5; x4 = 5572: 3; x5 = 4791: 9;

x6 = 4406: 9; x7 = 5366: 1; x8 = 6083: 3; x9 = 6507: 9; x10 = 4510: 7:

3. Versi alternatif dari Contoh 2. Misalkan X N

;2

dengan dan 2 tidak diketahui: maka sampel acak ukuran 10 terdiri

dari X1; :::; X10; saling independen, dan

Xi N

;2

; i = 1; :::; 10:

Jika kita mengira bahwa nilai sampel seperti yang ditunjukkan di atas, itu
menggoda untuk menggunakan data ini untuk membuat tebakan dan 2:
Bab 11

STATISTIK & SAMPLING

DISTRIBUSI

11.1 Statistik

Misalkan sampel acak ukuran n telah diperoleh dari probabilitas

distribusi bility dari variabel acak X: Ini memberikan n sampel variabel


acak

Ables X1; :::; Xn; dan sampel data terdiri dari nilai-nilai x1; :::; xn

variabel acak ini. Dalam Bagian 2, Statistik Deskriptif Dasar, the

mean sampel,

x=

Xn

i=1

xi

dianggap sebagai ukuran lokasi yang tepat, dan varians sampel

s2 =

n 1

Xn

i=1

(xi x) 2
ukuran penyebaran yang tepat untuk satu set data. Ada notasi

ubah di sini, dibandingkan dengan Bagian 2, perubahan notasi yang


penting

tant.

Rata-rata sampel dan varians sampel keduanya adalah contoh dari


status

tistic, kuantitas yang merupakan fungsi dari data. Kami sekarang


menganggapnya sebagai

fungsi dari nilai x1; :::; xn dari variabel acak sampel X1; :::; Xn:

Ada ekspresi yang berhubungan dengan x dan s2 dalam hal sampel ini

variabel acak X1; :::; Xn:

Xn

i=1

Xi;

S2 =

n 1

Xn

i=1

Xi X

2:
BAB 11. DISTRIBUSI STATISTIK & SAMPLING

Ekspresi ini menunjukkan bahwa X

dan S2 adalah fungsi dari sampel acak

variabel X1; :::; Xn; dan karena itu variabel acak itu sendiri, memiliki

distribusi probabilitas, nilai yang diharapkan, dll.

Distribusi probabilitas X

dan S2 disebut sampling dis-

kontribusi karena mereka bergantung pada prosedur pengambilan


sampel acak.

Perhatikan bahwa dengan perspektif baru ini, statistik x adalah nilai


sampel

dari statistik sampel X

; dan statistik s2 adalah nilai sampel dari

statistik sampel S2:

Penting untuk membedakan statistik dan statistik sampel: satu

adalah nilai numerik, yang lainnya adalah variabel acak, dengan


probabilitas

distribusi disebut sebagai distribusi sampling.

11.2 Distribusi Sampel

Bagaimana distribusi sampling ditemukan? Contoh berikut menunjukkan


itu

itu bisa sangat melelahkan untuk ... menemukan mereka dari ... prinsip
pertama.

11.2.1 Contoh

Misalkan sampel acak ukuran 2 diambil dari probabilitas

distribusi variabel acak X; di mana ini diberikan dalam tabel


Nilai X 0 1 2 E [X]

Kemungkinan 0: 2 0: 3 0: 5 1: 3

Sampel acak akan terdiri dari variabel acak independen X1; X2;

masing-masing dengan distribusi probabilitas ini. Jadi, misalnya,


probabilitas

mendapatkan sampel x1 = 0; x2 = 1 (misalnya), adalah, dengan


independensi,

Pr (X1 = 0; X2 = 1) = Pr (X1 = 0) Pr (X2 = 1)

= 0:06:

Di sini, mean sampel adalah

(X1 + X2):

Apa distribusi probabilitasnya?

Strateginya adalah untuk ... mencari tahu sampel apa yang bisa diambil,
apa

probabilitas terjadinya adalah, dan nilai X

tersirat oleh sampel itu

11.2. DISTRIBUSI SAMPLING 129

Dari informasi ini kita dapat menyimpulkan distribusi probabilitas X

: Semua

potongan informasi ini ditampilkan pada tabel di bawah ini:


Nilai Probabilitas Sampel X

(0; 0) 0:04 0

(0; 1) 0:06 0: 5

(0; 2) 0: 1 1

(1; 0) 0:06 0: 5

(1; 1) 0:09 1

(1; 2) 0:15 1: 5

(2; 0) 0: 1 1

(2; 1) 0:15 1: 5

(2; 2) 0:25 2

Kita bisa melihat apa nilai yang mungkin untuk X

adalah, dan probabilitas dari

sampel yang menguntungkan untuk setiap nilai X

. Ini mengarah ke sebuah tabel

menampilkan distribusi probabilitas X

Nilai X

0 0: 5 1 1: 5 2 E

Probabilitas 0:04 0:12 0:29 0: 3 0:25 1: 3

Mudah dicek bahwa probabilitas bertambah hingga 1, dan itu yang


diharapkan
perhitungan nilai untuk X

benar.

Aspek penting dari contoh ini adalah nilai yang diharapkan dari X

sama dengan nilai yang diharapkan dari X; yang di sini dapat


digambarkan sebagai

berarti populasi.

Contoh lain: Distribusi Binomial

Distribusi ini dijelaskan dalam Bagian 5.2.4. Seandainya

populasi (besar) terdiri dari nilai 0 atau 1;

1 menunjukkan (misalnya) rumah tangga di Inggris yang memiliki


pemutar DVD,

frekuensi relatif populasi (tidak diketahui) 10s adalah:

Variabel acak yang dapat menggambarkan populasi ini adalah variabel


yang mengambil

pada nilai 0 dan 1 dengan probabilitas 1 dan masing-masing.


Nyatakan ini

variabel acak dengan X; variabel acak Bernoulli, dibahas dalam Bagian

5.2.2.

Bayangkan eksperimen itu menghasilkan nilai acak Bernoulli

variabel diulangi n kali dalam kondisi yang identik, sedemikian rupa


sehingga

hasil potensial dari satu percobaan tidak tergantung pada percobaan


lain

Iments. Kemudian, pengulangan ini setara dengan menggambar sampel


acak

130 BAB 11. DISTRIBUSI STATISTIK & SAMPLING


ukuran n dari distribusi Bernoulli ini. Jika hasil percobaan

adalah nilai 1; sebut itu "sukses".

Setiap percobaan menghasilkan nilai variabel acak Bernoulli;

memiliki distribusi yang sama dengan X: Biarkan variabel acak T


menjadi total

sejumlah keberhasilan,

T=

Xn

i=1

Xi:

Bagian 5.2.4 menjelaskan bahwa dalam situasi ini, distribusi probabilitas

T adalah distribusi binomial:

Pr (T = t) =

t (1 ) n t; t = 0; :::; n; 0 <<1:

Bagaimana ini berhubungan dengan contoh sebelumnya?

Kita dapat menggunakan ini untuk menyimpulkan distribusi sampling


dari mean sampel

; karena ini terkait sangat sederhana dengan T:

=
1

Xn

i=1

Xi =

Kita dapat menyimpulkan bahwa jika T dapat mengambil nilai 0; 1; 2; :::;


n 1; n lalu X

bisa

mengambil nilai

0;

; :::;

n 1

;1

dan itu

Pr
X

= Pr (T = t); t = 0; :::; n:

Pada prinsipnya, kita sekarang dapat mencoba menunjukkan bahwa


nilai yang diharapkan dari X

sama

dengan nilai X yang diharapkan; (yaitu); artinya populasi. Ini akan

ikuti dari diskusi di bagian selanjutnya.

11.3 Distribusi Sampling X

Dengan asumsi pengambilan sampel acak, kita dapat ... menemukan


mean dan varians dari sampel

distribusi pling X

, tanpa benar-benar mengetahui apa yang distribusi sampel

bution adalah. Ini adalah hasil yang sangat berguna dan penting.

Misalkan sampel acak ukuran n diambil dari populasi dengan

rerata dan varian 2; atau setara, dari distribusi probabilitas

dari variabel acak X dengan E [X] =; var [X] = 2:

Sejak

n
Xn

i=1

Xi;

11.3. DISTRIBUSI SAMPLING X

131

adalah kombinasi linear dari variabel acak sampel X1; :::; Xn; maka

hasil dalam Bagian 9.1.2 dan 9.2.1 dapat digunakan untuk… dan E

dan var

Bobot dalam kombinasi linier semuanya sama:

ai =

dalam notasi bagian-bagian tersebut.

Pada gilirannya, dari sifat-sifat pengambilan sampel acak, kita tahu itu

E [Xi] = E [X] =;
var [Xi] = var [X] = 2:

11.3.1 Mean dari mean sampel

Judul ini sengaja menyesatkan: yang dimaksud justru adalah mantan

nilai yang diharapkan atau harapan distribusi sampling dari rata-rata


sampel.

Dalam pengambilan sampel acak, nilai yang diharapkan dari X

sama dengan populasi

berarti:

Bukti: Dari Bagian 9.1.2,

=E

"

Xn

i=1

Xi

Xn
i=1

E [Xi]

Xn

i=1

=:

11.3.2 Varian rata-rata sampel

Pengambilan sampel acak membuat sampel variabel acak X1; :::; Xn


indepen-

penyok dan karenanya tidak berkorelasi. Kami kemudian dapat


menggunakan slogan Bagian 9.2:

varians dari jumlah tertimbang adalah jumlah varian tertimbang untuk


membuktikannya

dalam random sampling, varians dari mean sampel adalah

132 BAB 11. DISTRIBUSI STATISTIK & SAMPLING

Bukti:

var

X
= var

"

Xn

i=1

Xi

Xn

i=1

var

Xi

Xn

i=1

n
2

var [Xi]

Xn

i=1

n2

n2

Akar kuadrat dari var

adalah standar deviasi X

; dan ini

biasanya diberi nama spesifik kesalahan standar. Sejauh ini, kami telah
mengidentifikasi
ti ... parameter populasi dengan parameter distribusi

variabel acak yang sesuai X: Kita dapat memperluas ini untuk mencakup
karakteristik

tics atau parameter distribusi probabilitas statistik sampel suka

: Jadi, var

adalah parameter dari distribusi probabilitas X

; dan sebagainya

adalah kesalahan standar,

SE

pn

11.3.3 Contoh

Dalam Contoh Bagian 11.2.1, kami menemukan E [X] = 1: 3; dan itu


mudah

temukan itu

E
X2

= (0) 2 (0: 2) + (1) 2 (0: 3) + (2) 2 (0: 5) = 2: 3;

sehingga varians populasi adalah

var [X] = 2: 3 (1: 3) 2 = 0:61:

Kami juga menemukan bahwa E

= 1: 3; dan kita bisa menghitung dari probabilitas

distribusi X

bahwa

= (0) 2 (0:04) + (0: 5) 2 (0:12) + (1) 2 (0:29) + (1: 5) 2 (0: 3) + (2) 2


( 0:25)

= 1: 995:

Ini memberi

var

= 1: 995 (1: 3) 2 = 0: 305


1.3. DISTRIBUSI SAMPLING X

133

yang tepatnya

0:61

sama persis dengan hasil teoretis, karena n = 2 di sini.

Di sini, kesalahan standarnya adalah

SE

= p0: 305 = 0: 552:

11.3.4 Ringkasan

Hasil yang disajikan di atas sangat penting sehingga mereka perlu


dinyatakan

padat.

Jika sampel acak ukuran n diambil dari populasi dengan mean

dan varian 2;

nilai yang diharapkan dari X

sama dengan rata-rata populasi,: E


X

varians dari mean sampel adalah

: var

Perhatikan bahwa varian X

menurun, relatif terhadap variasi populasi

ance, dengan meningkatnya ukuran sampel n. Ini secara eksplisit


disebabkan oleh "rata-rata"

Efek yang terkandung dalam mean sampel. Jelas, hal yang sama
berlaku untuk standar

dard error SE

X
demikian juga.

11.3.5 Kasus Binomial

Di sini, X

diperoleh secara acak dari distribusi Bernoulli,

dengan probabilitas keberhasilan - lihat Bagian 11.2.1. Jadi, jika X


memiliki Bernoulli

distribusi, rerata populasi dan varians populasi adalah

E [X] = (0) (1 ) + (1) () =;

X2

= (0) 2 (1 ) + (1) 2 () =;

var [X] = E

X2

(E [X]) 2 = 2 = (1 ):

Menggunakan properti umum dari Bagian 11.3.1 dan 11.3.2, itu akan
mengikuti

bahwa

=; var
X

(1 )

Pada gilirannya, kita bisa menggunakan hubungan itu

untuk menyimpulkan bahwa jika T memiliki distribusi Binomial,

E [T] = n; var [T] = n2 var

= n (1 ):

Ini mengkonfirmasikan hasil yang diberikan dalam Bagian 8.6.1.

134 BAB 11. DISTRIBUSI STATISTIK & SAMPLING

11.3.6 Distribusi Sampel

Perlu ditekankan bahwa hasil di atas telah disimpulkan tanpa

mengetahui sifat distribusi yang telah dijadikan sampel. Tanpa

informasi tersebut kami tidak dapat menghitung, untuk nilai apa pun x,

Pr
X

6x

Dalam contoh Bagian 11.2.1, mudah untuk ... menemukan probabilitas

garis X

dari ... prinsip pertama. Dalam contoh berikut, di Bagian 11.2.1,

kami melihat bahwa sifat populasi dan Bernoulli yang sesuai

variabel acak menghasilkan distribusi sampling yang merupakan


Binomial

distribusi kemungkinan. Jadi, distribusi sampling X

berubah seperti kita

mengubah distribusi probabilitas populasi.

Contoh klasik dari distribusi sampling X

adalah tempat

distribusi probabilitas populasi adalah distribusi normal. Di bagian

9: 3; dinyatakan bahwa kombinasi linear dari variabel acak normal juga

memiliki distribusi normal. Sejak X

adalah kombinasi linear - lihat

awal Bagian 11.3, berarti X

juga memiliki distribusi normal.

Hasil ini sangat penting. Hampir semua sisa dari kursus ini

tergantung pada hasil ini.

Jika sampel acak ukuran n diambil dari distribusi X

N
;2

; kemudian

Perhatikan bahwa rata-rata dan varian dari distribusi ini persis seperti itu

disimpulkan di atas tanpa menggunakan pengetahuan tentang


probabilitas populasi

distribusi.

Contoh Tes IQ dirancang untuk berperilaku seolah-olah itu adalah


gambar

dari distribusi normal dengan rata-rata 100 dan varians 400: X

N (100; 400). Misalkan sampel acak dari 25 individu adalah

katanya. Kemudian,

100;
400

25

; atau, X

N (100; 16):

Kami kemudian dapat menghitung, misalnya,

Pr

<90

= Pr

100

<

90 100

= Pr (Z < 2: 5)

= 0: 0062:

11.3. DISTRIBUSI SAMPLING X

135

11.3.7 Pengambilan sampel dari distribusi Non-Normal

Dalam hal ini, distribusi sampling X


tidak akan normal. Namun,

jika kita membayangkan bahwa ukuran sampel n dibiarkan bertambah


tanpa terikat,

jadi n! 1; kita dapat menarik teorema yang terkenal (lebih tepatnya,

kumpulan teorema) dalam teori probabilitas yang disebut Batas Pusat

Dalil. Ini menyatakan itu

jika X

diperoleh dari sampel acak berukuran n dari suatu populasi

dengan mean dan varian 2; kemudian, terlepas dari distribusinya

sampel,

SE

(= pn)! N (0; 1) sebagai n! 1:

Artinya, distribusi probabilitas

SE

X
mendekati standar

dard distribusi normal sebagai n! 1:

Kami menafsirkan ini sebagai mengatakan itu

SE

(= pn) N (0; 1); sekitar

untuk ... nite n:

Alternatifnya adalah mengatakan itu

sekitar

untuk ... nite n:

Tingkat di mana distribusi normal standar didekati di

Memengaruhi kualitas aproksimasi. Ini diharapkan membaik sebagai


n bertambah, dan buku teks biasanya mengklaim bahwa perkiraannya
bagus

cukup jika

n> 20 atau n> 30:

Gagasan bahwa X

memiliki perkiraan distribusi normal sebagai n! 1 adalah

sering digambarkan sebagai normalitas sampel besar dari mean sampel.


Itu

Klaim buku teks di sini adalah bahwa sampel "besar" setidaknya 20. Ini
tidak benar-benar

masuk akal, tetapi cukup untuk digunakan dalam kursus seperti ini.

Jadi, dalam contoh IQ di atas, kita dapat berpendapat bahwa Pr

<90

= 0: 0062

kira-kira jika sebenarnya IQ tidak terdistribusi secara normal, tetapi


memang ada

mean populasi 100 dan varians populasi 400:

BAB 11. DISTRIBUSI STATISTIK & SAMPLING

Anda mungkin juga menyukai