Sampel Acak Dan Distribusinya PDF
Sampel Acak Dan Distribusinya PDF
1
Populasi
• Dalam survey statistik, hasil pengamatan dicatat dalam
numerik. Obyek yang diamati bisa manusia, hewan, atau
benda lainnya.
2
• Ukuran populasi menyatakan banyaknya pengamatan di
dalam populasi. Jika jumlah pemilih 20000 orang, maka
ukuran populasinya dikatakan 20000 orang.
3
• Oleh karena itu, kita terpaksa menggunakan
sebagian pengamatan dari populasi untuk menarik
inferensi statistik tentang populasi tersebut.
4
• Sampel acak berarti pengamatan dilakukan secara
bebas satu sama lain dan acak.
5
• Contoh: dari sebuah pabrik batere dipilih secara acak
n = 8 batere yang diproduksi dengan keadaan yang
sama, kemudian umurnya dicatat: x1 adalah umur
batere pertama, x2 adalah umur batere kedua, dan
seterusnya. Maka, x1, x2, …, x8 merupakan nilai
sampel acak X1, X2, …, X8 . Bila dianggap populasi
umur batere berditsribusi normal, nilai yang mungkin
untuk xi, i = 1, 2, …, 8, akan tetap sama dengan pada
populasi semula. Dan karena itu Xi mempunyai
distribusi normal yang tepat sama dengan X.
6
Statistik
• Apa yang dimaksud dengan statistik?
7
• Dalam praktek, parameter p yang menggambarkan
proporsi sebenarnya dihampiri dengan parameter p̂
pada sampel acak tersebut.
• Nilai p̂ ini kemudian dipakai untuk menarik kesimpulan
mengenai proporsi p yang sesungguhnya.
• Jadi, p̂ merupakan fungsi dari nilai pengamatan dalam
sampel acak.
• Karena banyak kemungkinan sampel acak yang dapat
diambil dari populasi yang sama, maka tentunya p̂ akan
berbeda sedikit antara sampel acak yang satu dengan
sampel acak yang lain.
• Dengan kata lain, p̂ adalah nilai dari suatu peubah acak
yang kita nyatakan dengan P. Peubah acak seperti ini
dinamakan statistik
8
• Definisi. Setiap fungsi dari peubah acak yang
membentuk suatu sampel acak disebut statistik.
9
Rataan (mean)
• Definisi. Bila X1, X2, …, Xn menyatakan sampel acak berukuran n,
maka rataan sampel dinyatakan oleh statistik:
n
∑X
i =1
i
X=
n
22 + 21 + 24 + 22 + 23 + 25 + 24 + 22
x= = 22.875
8
10
Median
• Definisi. Bila X1, X2, …, Xn menyatakan sampel acak berukuran
n, diurutkan membesar menurut besarnya, maka median
sampel ditentukan sebagai statistik
~ =
X
• Contoh 2. Tentukan median dari usia wisudawan pada
Contoh 1 di atas.
Jawaban: Urutkan data pengamatan terlebih dahulu:
21, 22, 22, 22, 23, 24, 24, 25
Karena n genap, maka mediannya: ~ 22 + 23
x= = 22.5
2
11
Modus
• Definisi. Bila X1, X2, …, Xn menyatakan sampel acak berukuran
n, maka modus M ialah suatu nilai sampel yang paling sering
muncul atau frekuensinya paling tinggi. Modus mungkin tidak
ada, dana kalaupun ada mungkin tidak tunggal.
12
• Contoh 4. Bila data pengamatannya bertambah menjadi 10
orang sehingga diperoleh 22, 21, 24, 22, 23, 25, 24, 22, 24, 23,
maka modunya ada 2 yaitu 22 dan 24 karena keduanya paling
sering muncul. Statistik ini disebut dwimodus.
13
Jangkauan
• Definisi. Jangkauan atau rentangan dari sampel acak X1, X2,
…, Xn didefinisikan sebagai statistik X(n) – X(1) , bila X(n) dan X(1)
masing-masing menyatakan pengamatan yang terbesar dan
terkecil dari sampel.
14
Variansi
• Definisi. Bila X1, X2, …, Xn menyatakan sampel acak berukuran
n, maka variansi sampel didefinisikan sebagai statistik:
∑ i
( X
i =1
− 22 . 875 ) 2
s2 =
8 −1
= ( 22 − 22 .875 ) 2 + ( 21 − 22 .875 ) 2 + ... + ( 22 − 22 .875 ) 2
=
7 15
• Untuk menghindari kesalahan akibat pembulatan,
maka alternatif menghitung variansi adalah dengan
rumus:
2
n
n
n∑ X i2 − ∑ X i
S 2 = i =1 i =1
n(n − 1)
16
Simpangan Baku
• Simpangan baku sampel dinyatakan dengan S adalah akar
positif variansi sampel.
i =i i =1
( 6 )(171) − (31) 2
13
Jadi, S 2 = = dan S = √(13/6) = 1.47
(6)(5) 6
17
Populasi
Sampel
Sampling
18
Distribusi Sampel
• Bidang statistika inferensi pada dasarnya berkenaan
dengan perampatan dan hasil prediksi.
• Kita menghitung suatu statistik dari sampel yang
dipilih dari populasi, dan dari statistik ini kita
membuat pernyataan yang mungkin benar atau tidak
mengenai nilai parameter populasi.
• Contoh: berdasarkan pendapat beberapa orang yang
diwawancarai sebelum Pilkada di Bandung, 60% dari
pemilih akan memilih calon tertentu.
19
• Karena statistik merupakan peubah acak yang
tergantung hanya pada sampel yang diamati, maka
tentulah ada distribusi peluangnya.
21
• Perhatikanlah bahwa rataan X 1 , X 2 ,..., X 10 mempunyai
nilai yang berbeda-beda sehingga rataan X 1 , X 2 ,..., X 10
membentuk suatu sampel acak tersendiri yaitu X yang
disebut sampel rataan, oleh karena itu kita bisa
menentukan rataan dan simpangan baku dari sampel
rataan ini.
σ 2.92
simpangan baku: σ X = = = 0.92
n 10
24
• Bila populasi yang disampel tidak diketahui distribusinya,
maka distribusi sampel X masih akan berdistribusi hampir
normal (mendekati distribusi normal) dengan rataan µ dan
variansi σ2/n asalkan ukuran sampelnya besar.
25
• Dalam statistik, sampel dikatakan berukuran besar jika n ≥ 30.
• Hampiran normal untuk X umumnya cukup baik jika n ≥ 30,
terlepas dari bentuk populasi (normal atau bukan).
• Bila n < 30, hampirannya hanya akan baik bila populasinya tidak
• jauh berbeda dengan normal.
• Bila populasinya diketahui normal, maka distribusi sampel X
akan tetap berdistribusi normal terlepas dari ukuran
sampelnya.
sehingga
P( <775) = P(z< -2,5)
= 0,0062
27
• Contoh 11. Diketahui sebuah populasi berdistribusi seragam
diskrit:
1
, x = 0,1,2,3
f ( x) = 4
0, lainnya
28
dan
( 0 − 3 / 2 ) 2
+ (1 − 3 / 2 ) 2
+ ( 2 − 3 / 2 ) 2
+ (3 − 3 / 2 ) 2
σ2 = = 5/ 4
4
29
Lakukan transformasi ke peubah z terlebih dahulu:
z1 = (1.45 – 1.5)/0.186 = -0.27
z2 = (1.75 – 1.5)/0.186 = 1.27
Jadi,
P(1.4 < < 1.8) ≅ P(-0.27 < Z < 1.34)
= P(Z < 1.34) – P(Z < -0.27)
= 0.9099 – 0.3936
= 0.5163
30
Teorema (Distribusi Sampel dari Selisih Dua Rataan)
• Bila sampel bebas ukuran n1 dan n2 diambil secara acak dari dua
populasi, diskrit maupun kontinu, masing-masing dengan rataan
dan dan , variansi dan , maka distribusi sampel dari
selisih rataan, , berdistribusi hampir normal, rataan dan
variansi diberikan oleh
dan
sehingga
32
• Contoh 12. Suatu sampel berukuran n1=15 diambil
secara acak dari populasi yang berdistribusi normal
dengan rataan =50 dan variansi = 9, dan rataan
sampel dihitung. Sampel acak kedua berukuran
n2= 4 diambil, bebas dari yang pertama, dari populasi
lain yang juga berdistribusi normal, dengan rataan =
40 dan variansi = 4, dan rataan sampel dihitung.
Carilah P( < 8,2).
33
Jawaban: Dari distribusi sampel kita ketahui bahwa
distribusinya normal dengan rataan dan variansi
= 50 – 40 = 10
35
Distribusi sampel akan berdistribusi hampiran
normal dan mempunyai rataan dan simpangan baku:
36
• Latihan. Di sebuah universitas terdapat dua populasi,
yaitu populasi mahasiswa laki-laki dan populasi
mahasiswa perempuan. Diketahui rata-rata tinggi
badan mahasiswa laki-laki adalah 164 cm dengan
simpangan baku 5.3 cm, sedangkan rata-rata tinggi
mahasiswa perempuan adalah 153 cm dengan
simpangan baku 5.1 cm. Misalka n dari kedua
populasi tersebut diambil sampel secara acak yang
saling bebas masing-masing 150 orang, berapa
peluang rata-rata tinggi mahasiswa laki-laki paling
sedikit 12 cm lebihnya daripada rata-rata tinggi
mahasiswa perempuan.
37
Jawaban: Diketahui data berikut:
Populasi I Populasi II
---------------------------------
µ1 = 164 µ2 = 153
σ1 = 5.3 σ2 = 5.1
n1 = 150 n2 = 150
Misalkan X 1 dan X 2 masing-masing menyatakan rata-rata
tinggi badan mahasiswa laki-laki dan rata-rata tinggi
mahasiswa perempuan.
Karena ukuran sampel cukup besar (≥ 30), maka distribusi
sampel akan berdistribusi hampiran normal dan
mempunyai rataan dan simpangan baku:
= 164 – 158 = 11 cm
(5.3) 2 (5.1) 2
σ X −X = + = 0.60
1 2
150 150 38
Peluang bahwa rata-rata tinggi mahasiswa laki-laki paling
sedikit 12 cm lebihnya daripada rata-rata tinggi mahasiswa
perempuan adalah P( ≥ 12)
Padanan nilai 12 adalah z = (12 – 11)/0.60 = 1.67
Sehingga
P( ≥ 12) = P(Z > 1.67) = 1 – P(Z < 1.67)
= 0.0475
39
σ2
Distribusi Sampel dari (n – 1)S2/σ
40
• Nilai peubah X2 dihitung dari tiap sampel dengan rumus
(n − 1) s 2
χ =
2
σ2
• Peluang suatu sampel acak menghasilkan nilai χ lebih besar
2
χ2
χα2 41
Kurva distrubusi Chi-Squared dengan bermacam-macam derajat kebebasan
42
43
44
• Contoh 14. Suatu pabrik baterai mobil menjamin
bahwa baterainya akan tahan rata-rata 3 tahun
dengan simpangan baku 1 tahun. Bila 5 baterainya
tahan 1,9, 2,4, 3,0, 3,5, dan 4,2 tahun, apakah
pembuatnya masih yakin bahwa simpangan baku
baterai tersebut 1 tahun ?
45
Jawaban:
• Mula-mula dihitung variansi sampel :
kemudian
(4)(0.815)
χ2 = = 3.26
1
merupakan suatu nilai distribusi khi-kuadrat dengan
derajat kebebasan 4. Karena 95% nilai χ 2 dengan derajat
kebebasan 4 terletak antara 0,484 dan 11,143, nilai
perhitungan dengan menggunakan = 1 masih wajar,
sehingga tidak ada alasan bagi pembuatnya untuk
mencurigai bahwa simpangan baku baterainya bukan 1
tahun.
46
Distribusi-t
• Variansi populasi yang sampel acaknya diambil
seringkali sukar diketahui.
• Untuk ukuran sampel yang besar (n ≥ 30), taksiran σ2
yang baik dapat diperoleh dengan menghitung S2.
• Untuk n yang kecil, nilai S2 berubah cukup besar dari
sampel ke sampel lainnya dan distribusi peubah acak
Z = ( X − µ ) /(σ / n ) menyimpang cukup jauh dari
distribusi normal baku.
• Untuk sampel berukuran kecil, kita berhadapan dengan
distribusi suatu statistik yang dinamakan T.
47
• T adalah peubah acak dengan
S
, yang dalam hal ini σ X =
n
48
Teorema. Misalkan Z peubah acak normal baku dan V
peubah acak khi-kuadrat dengan derajat kebebasan v.
Bila Z dan V bebas, maka distribusi peubah acak T, bila
diberikan oleh
49
• Dalam menurunkan rumus distribusinya, Gosset
mengasumsikan bahwa sampel acak diambil dari populasi
normal.
• Meskipun demikian, bila sampel acak diambil dari sampel
yang distribusinya tidak normal tetapi bila kurva distribusinya
berbentuk lonceng, maka dapat dibuktikan bahwa distribusi
statistik tersebut masih mendekati distribusi t.
• Distribusi t sangat mirip dengan distribusi normal baku Z,
keduanya setangkup terhadap rataan 0, tetapi distribusi t
lebih bervariasi karena nilai T sangat bergantung pada
perubahan nilai X dan S2, sedangkan distribusi normal hanya
bergantung pada perubahan nilai X dari suatu sampel ke
sampel yang lain.
50
• Distribusi t dan Z berbeda karena variansi T bergantung pada
ukuran sampel n dan variansi ini selalu lebih besar dari 1.
Hanya jika n →∞, kedua distribusi ini akan menjadi sama.
51
t
0
52
• Peluang suatu sampel acak mempunyai nilai t = ( x − µ ) /(s / n )
yang terletak antara dua nilai tertentu sama dengan luas di
bawah kurva distribusi t yang dibatasi oleh absis yang
berpadanan dengan kedua nilai tersebut.
53
54
55
• Notasi: tα menyatakan nilai t sedemikian sehingga di sebelah
kanannya terdapat luas sebesar α
56
Gambar 3 Sifat setangkup distribusi t
57
• Contoh 15. Nilai t dengan derajat kebebasan v = 14 sehingga
luas di sebelah kirinya 0.025 (jadi luas di sebelah kanannya = 1
– 0.025 = 0.975) adalah
t0.975 = – t0.025 = – 2.145
58
• Contoh 17. Untuk sampel berukuran n = 10 dan α = 0.05,
tentukanlah P(T < t α) dan P(- t α < T < t α ).
Jawaban: Derajat kebebasan = n – 1 = 10 – 1 = 9.
t 0.05 = 1.833
Jadi, P(T < 1.833) = 1 – 0.05 = 0.95
dan P(-1.833 < T < 1.833) = 1 – 0.05 – 0.05 = 0.90
59
• Perhatikan bahwa 95% dari nilai peluang suatu
distribusi t dengan derajat kebebasan v = n – 1
berada antara –t0,025 dan t0,025
• Suatu nilai t yang jatuh di bawah –t0,025 dan t0,025
akan cenderung memberi keyakinan pada kita bahwa
suatu kejadian yang amat jarang terjadi telah terjadi
atau anggapan kita mengenai µ yang kita ambil
keliru.
• Jika hal ini muncul maka kita akan memilih
kesimpulan yang terakhir dan menyatakan bahwa
anggapan nilai µ yang kita ambil keliru.
60
• Contoh 18. Sebuah pabrik lampu yakin bahwa bola lampunya
akan terus menyala selama 500 jam. Untuk mempertahankan
nilai tersebut, tiap bulan diuji 25 bola lampu. Bila nilai t yang
dihitung terletak antara –t0,05 dan t0,05 maka pengusaha
pabrik tadi akan mempertahankan keyakinannya. Kesimpulan
apakah yang seharusnya dia ambil dari sampel dengan rataan
518 jam dan simpangan baku 40 jam? Anggaplah bahwa
distribusi waktu menyala, secara hampiran, normal.
Jawaban:
Derajat kebebasan = 25 – 1 = 24
Dari tabel t diperoleh t0,05 = 1.711 .
Jadi pengusaha tadi akan puas dengan keyakinannya bila
sampel 25 lampu memberikan nilai t antara –1.711 dan
1.711
61
Bila µ = 500, maka
suatu nilai yang jauh dari 1.711 . Jadi pengusaha tadi tidak
yakin karena 2.25 > 1.711.
62
Distribusi-F
Statistik F didefinisikan sebagai nisbah dua peubah
acak khi-kuadrat yang bebas, masing-masing dibagi
dengan derajat kebebasannya.
Jadi dapat ditulis
63
Teorema. Misalkan U dan V dua peubah acak
bebas masing-masing berdistribusi khi-kuadrat
dengan derajat kebebasan v1 dan v2. Maka
distribusi peubah acak
diberikan oleh
64
• Distribusi F dihitung dengan menggunakan tabel Distribusi F.
Nyatakanlah f dengan lambang fα sehingga di sebelah
kanannya terdapat luas sebesar α.
fα f
65
• Bentuk kurva distribusi F selain bergantung pada derajat
kebebasan v1 dan v2 juga bergantung pada urutan keduanya
ditulis.
6 dan 24 f.d
6 dan 10 f.d
0 f 66
• Contoh 19. Untuk suatu distribusi–F hitunglah f0,05 bila v1 = 6
dan v2 = 10.
Jawaban : Dengan menggunakan Tabel F, diperoleh
f0,05 = 3,22
67
• Contoh 20. Hitunglah nilai f dengan derajat kebebasan 6 dan
10 sehingga luas sebelah kanannya 0.95.
Jawaban:
1 1
f 0.95 (6,10) = = = 0.246
f 0.05 (10,6) 4.06
68
Teorema. Bila dan adalah variansi
sampel acak yang bebas berukuran n1 dan
n2 yang diambil dari dua populasi
69