Johan Harlan
Metode Statistika 1
Penulis : Johan Harlan
ISBN 979-1223-01-7
Johan Harlan
Juni 2004
v
DAFTAR ISI
Kata Pengantar v
vii
Latihan 3 69
Bab 4 Probabilitas 75
4.1 Konsep Dasar Probabilitas 75
4.2 Probabilitas Peristiwa 80
4.3 Pencacahan Ruang Sampel 83
Lampiran 4A Saling Asing dan Independen 88
Lampiran 4B Teorema Bayes 90
Latihan 4 93
viii
Bab 6 Sampling 152
6.1 Distribusi Sampling 152
6.2 Metode Sampling 157
Kepustakaan 189
Addenda 191
Addendum A Program Komputer Statistik 191
Addendum B1 Distribusi Probabilitas Binomial 193
Addendum B2 Probabilitas Binomial Kumulatif 200
Addendum C1 Distribusi Probabilitas Poisson 205
Addendum C2 Probabilitas Poisson Kumulatif 211
Addendum D Distribusi Normal Standar 213
Addendum E Nilai Kritis Distribusi t 215
Addendum F Bilangan Acak 216
ix
BAB 1
PENDAHULUAN
Metode Statistika
adalah teknik tentang pengumpulan data, penyajian data, analisis data,
dan pengambilan kesimpulan dari data yang berhasil dihimpun tersebut.
1
Parameter dan Statistik
Parameter (parameter populasi) adalah ukuran-ukuran tertentu yang
digunakan untuk menggambarkan suatu populasi. Statistik (statistik sampel)
adalah ukuran-ukuran tertentu yang digunakan untuk menggambarkan suatu
sampel.
Data
Data merupakan kumpulan fakta atau angka atau segala sesuatu yang
dapat dipercaya kebenarannya, sehingga dapat digunakan sebagai dasar
menarik suatu kesimpulan.
Variabel
Variabel adalah karakteristik unsur yang menjadi perhatian dan
memiliki nilai-nilai yang berbeda-beda.
2
Data kuantitatif dibedakan menjadi data diskret dan data kontinu:
- Data diskret adalah karakteristik suatu variabel yang berasal dari
proses pencacahan (counting) dan berupa bilangan bulat.
Contoh: jumlah anak responden ibu rumah tangga, jumlah sesi
perkuliahan Statistika yang diikuti oleh responden mahasiswa, dan
sebagainya.
- Data kontinu adalah karakteristik suatu variabel yang berasal dari
proses pengukuran (measurement) dan nilai-nilainya berada dalam
suatu interval atau rentang tertentu. Nilai-nilai data kontinu dapat
berupa bilangan pecahan yang tak terhingga banyaknya.
Contoh: tinggi badan responden, berat badan responden, dan
sebagainya.
Skala pengukuran
- Skala nominal: data yang dihimpun dapat dibedakan menjadi beberapa
kategori tanpa memperhatikan urutan tertentu.
Contoh: suku bangsa, agama, dan sebagainya.
- Skala ordinal: data yang dihimpun dapat dibedakan menjadi beberapa
kategori yang berbeda dengan memperhatikan urutan.
Contoh: status sosial ekonomi (tinggi-menengah-rendah), kepangkatan
dalam militer (perwira-bintara-tamtama), dan sebagainya.
- Skala interval: data yang dihimpun dapat diletakkan dalam skala
dengan jarak (interval) antara dua titik skala diketahui dan skala
tersebut tidak memiliki titik nol mutlak (titik pusat).
Contoh: tanggal lahir, suhu tubuh dalam skala Celcius, dan sebagainya.
- Skala rasio: data yang dihimpun dapat diletakkan dalam skala dengan
jarak antara dua titik skala diketahui dan skala tersebut memiliki titik
nol mutlak.
Contoh: usia, suhu ruang dalam skala Kelvin, dan sebagainya.
3
binomial antara lain jenis kelamin (pria-wanita), hasil ujian (lulus-gagal), dan
sebagainya.
4
1.2 NOTASI SIGMA
Aturan sumasi
Aturan 1
Jika xi = k, suatu nilai konstan (yaitu nilai yang tidak berubah dengan
i), maka:
n n
∑ xi =
i =1
∑
i =1
k = k + k + . . . + k = nk
n
∑
i =1
xi = nk (1.1)
Aturan 2
Jika k suatu konstante, maka:
n
∑
i =1
kxi = k x1 + k x2 + . . . + k xn
n
= k ( x1 + x2 + . . . + xn ) = k ∑ xi
i =1
n n
∑
i =1
kxi = k ∑ xi
i =1
(1.2)
Aturan 3
n
∑
i =1
( xi + yi ) = ( x1 + y1 ) + ( x2 + y2 ) + . . . + ( xn + yn )
= ( x1 + x2 + . . . + xn ) + ( y1 + y2 + . . . + yn )
n n
= ∑
i =1
xi + ∑
i =1
yi
n n n
∑ ( xi + yi )
i =1
= ∑ xi +
i =1
∑
i =1
yi (1.3)
5
Contoh 1.1
n n
∑ ( xi + k ) ∑
2
1.
i =1
=
i =1
( xi2 + 2kxi + k 2 )
n n n
= ∑ xi2 +
i =1
∑ ( 2kxi )
i =1
+ ∑
i =1
k2 , aturan 3
n n
= ∑ xi2 + 2k ∑ xi + n k 2 ,
i =1 i =1
aturan 2 dan 1
n 2 n
∑( ) ∑ ( xi + 2 xi y i + y i )
2 2
2. xi + y i =
i =1 i =1
n n n
= ∑
i =1
xi2 + 2 ∑ xi yi +
i =1
∑
i =1
yi2 , aturan 3 dan 2
n n n
3. ∑ ( axi + byi ) = ∑ axi + ∑ byi , aturan 3
i =1 i =1 i =1
n n
= a ∑ xi + b ∑ y i , aturan 2
i =1 i =1
n n
∑ xi ( xi −1) = ∑ ( xi − xi )
2
4.
i =1 i =1
n n
= ∑ xi2 −
i =1
∑ xi , aturan 3
i =1
n n
∑ ( xi −1)( xi +1) = ∑ ( xi −1)
2
5.
i =1 i =1
n n
= ∑ xi2 −
i =1
∑1 , aturan 3
i =1
6
n
= ∑
i =1
xi2 − n, aturan 1
Sumasi Ganda
m n n m
maka: ∑∑ aij xi y j =
i =1 j =1
∑∑
j =1 i =1
a xyij i j
7
n
Misalkan Aij = aij x j dan ∑
i =1
Aij = bi , i = 1, 2, . . . , m dan j = 1, 2, . . .
, n,
a11 x1 + a12 x2 + ... + a1n xn = b1
a21 x1 a22 x2 a2 n xn = b2
. . . .
. . . .
. . . .
am1 x1 + am 2 x2 + ... + amn xn = bm
n
maka: ∑
i =1
aij x j = bi
m n m
dan: ∑∑
i =1 j =1
aij x j = ∑ bi
i =1
8
LAMPIRAN 1A: PERAN STATISTIKA DALAM
ILMU PENGETAHUAN
10
LAMPIRAN 1C: CONTOH-CONTOH
PENGGUNAAN NOTASI SIGMA
Contoh 1:
5
∑
i =1
xi = x1 + x2 + x3 + x4 + x5
4
∑
j =2
yj = y2 + y3 + y4
3
∑ zk
k =0
= z0 + z1 + z2 + z3
3
∑
i =1
( a + bxi ) = ( a + bx1 ) + ( a + bx2 ) + ( a + bx3 )
5
∑
i =3
( axi + byi ) = ( ax3 + by3 ) + ( ax4 + by4 ) + ( ax5 + by5 )
2
∑
i =1
( axi + b )( cxi + d ) = ( ax1 + b )( cx1 + d ) + ( ax2 + b )( cx2 + d )
3
∑
i =1
( axi yi ) = ax1 y1 + ax2 y2 + ax3 y3
2
∑
i =1
( axi2 + bxi + c ) = ( ax12 + bx1 + c ) + ( ax22 + bx2 + c )
3
∑
i =1
( axi + b )( cxi + d ) = ( ax1 + b )( cx1 + d ) + ( ax2 + b )( cx2 + d ) +
( ax3 + b )( cx3 + d )
11
Contoh 2:
i 1 2 3 4 5
Xi 80 65 70 60 65
5
• ∑
i =1
xi = 80 + 65 + 70 + 60 + 65 = 340
5
• ∑
i =1
xi2 = 802 + 652 + 702 + 602 + 652 = 23,350
5
5
5
• ∑
i =1
( 3xi + 7 ) + 3∑ xi
i =1
+ ∑ 7 = (3)(340) + (5)(7) = 1,055 =
i =1
5 5
5 2 5 5
∑ ( 2 xi + 3) ∑ 4∑ xi + 12∑ xi + ∑ 9
2
• = 4 xi(
2
+ 12 xi + 9 = )
i =1 i =1 i =1 i =1 i =1
= (4)(23,350) + (12)(340) + (5)(9) = 97,525
5 5
5
5
• ∑
i =1
( xi + 4 )( xi − 4 ) = ∑ ( xi2 − 16 ) = ∑ xi2
i =1 i =1
‒ ∑16
i =1
= 23,350 ‒ (5)(16) = 23,270
Catatan:
n
∑
i =1
xi = ∑i xi
m n
∑∑
i =1 j =1
xij = x11 + x12 + . . . + x1n + x21 + x22 + . . . + x2 n +
xm1 + xm 2 + . . . + xmn
m n
∑∑
i =1 j =1
xij = ∑∑
i j
xij
12
LATIHAN 1
Bagian Pertama
Pilihlah satu jawaban yang paling benar !
13
6. Yang tergolong dalam data kualitatif ialah:
A. Data nominal dan ordinal
B. Data interval dan rasio
C. Data diskret dan kontinu
D. Data kategorik dan numerik
10. Data yang diperoleh langsung dari subjek yang ingin diketahui
karakteristiknya dinamakan:
A. Data diskret C. Data primer
B. Data rasio D. Data sekunder
14
11. Data yang diperoleh dari pihak ketiga, yang biasanya telah
dikumpulkan sebelumnya untuk keperluan lain dari subjek yang hendak
dipelajari dinamakan:
A. Data diskret C. Data primer
B. Data rasio D. Data sekunder
12. Luas lantai berbagai tipe rumah disebuah real estate merupakan
contoh data:
A. Nominal C. Interval
B. Ordinal D. Rasio
15
17. Contoh berikut adalah data berskala interval, kecuali:
A. Tanggal ulang tahun siswa kelas 3 SMU Bintang Kejora
B. Rata-rata suhu luar-rumah harian di Jakarta yang dinyatakan
dalam skala Celcius.
C. Usia penduduk Desa Tamansari pada HUT terakhirnya
D. Semua merupakan contoh data berskala interval
18. Contoh data berskala rasio di antara pilihan di bawah ini adalah:
A. Suhu dalam skala Celcius C. Suhu dalam skala Kelvin
B. Suhu dalam skala Fahrenheit D. Semuanya benar
16
Bagian Kedua
A. 21 C. 23
B. 22 D. 24
5
2. ∑ ( 3x + 5) =
i =1
i
A. 64 C. 84
B. 74 D. 94
5
3. ∑ ( x − 2 )( 2 x + 3) =
i =1
i i
A. 196 C. 217
B. 203 D. 241
Bagian Ketiga
Selesaikanlah soal-soal berikut:
Anak 1 2 3 4 5 6 7 8
17
Hitunglah:
5 8
∑ ( xi 2 − xi − 1) ∑ ( x − 8)
2
A. E. i
i =1 i =1
8
1 8
B. x = ∑ xi
8 i =1
F. ∑ ( x − 10 )
i =1
i
5 8
C. ∑ ( xi − 8)
i =1
G. ∑ x − 10
i =1
i
8 5
1 1
D. ∑ x −8 i H. ∑ x −
8
i =1 i =1 i
Pasangan (i) 1 2 3 4 5 6 7 8
Umur pria ( xi ) 23 32 25 26 42 29 19 24
Umur wanita ( yi ) 19 38 21 26 35 32 17 20
Hitunglah:
8 8 8
A. ∑
i =1
xi , ∑ yi , dan ∑ xi yi
i =1 i =1
2 2
2 8 8 8
8 8 8
B. ∑ xi2 ,
i =1
∑
i =1
yi , ∑ i , ∑ yi , ∑ xi ∑ yi
x
i =1 i =1 i =1 i =1
8
C. ∑
i =1
( xi + yi )
8
∑
2
D. ( xi + yi )
i =1
8
E. ∑
i =1
( 2 xi + 5 yi )
18
BAB 2
PERINGKASAN DATA
Peringkasan data dapat dilakukan secara tabular (penyajian tabel),
secara grafikal (penyajian grafik), dan secara numerik (penyajian angka).
Dalam bagian ini akan dibahas mengenai peringkasan data secara tabular dan
grafikal.
2.1. TABEL
Distribusi Frekuensi
Tabel 2.1 Rincian nilai skala Depresi MMPI-2 50 mahasiswa
Psikologi Gunadarma 2003
21 25 24 23 24 21 19 25 23 27
17 32 26 32 28 29 21 21 25 23
35 37 19 26 24 27 16 23 24 25
25 18 31 23 17 26 29 21 16 23
23 30 29 18 28 22 19 24 29 21
Data yang disajikan diatas dikatakan sebagai data mentah (raw data).
Seyogyanya data tersebut disusun dari angka terkecil hingga angka terbesar:
19
Tabel 2.3. Distribusi frekuensi berat badan 64 mahasiswa
Psikologi Gunadarma 2003
Berat badan (kg) Frekuensi
36-44 20
45-53 19
54-62 17
63-71 5
72-80 1
81-89 1
90-98 1
Jumlah 64
Beberapa istilah:
a. Kelas / kelompok data
Jumlah kelas: biasanya 5 s.d. 15
Aturan Sturges (dibaca: ster’-jes):
Jumlah kelas = 1 + 3.322 log n (2.1)
Rentang adalah beda antara nilai data terbesar dengan nilai data terkecil.
c. Batas kelas dan tepi batas kelas
Batas-batas kelas (class limits) adalah dua angka yang dijadikan sebagai
pembatas kelas, terdiri atas batas kelas atas dan batas kelas bawah.
Kelas IV Kelas V
-----------o------------------------------------------------o---------------
20
tepi batas
Kelas IV kelas Kelas V
------------o--------------------------o-----------------------o-----------
71 71.5 72
Batas kelas atas Batas kelas bawah
kelas keempat kelas kelima
Diagram 2.2. Tepi batas kelas (class boundaries ) dengan garis bilangan
untuk data pada tabel 2.3
Contoh distribusi frekuensi dengan tepi batas kelas sebagai batas kelas:
Tabel 2.4. Distribusi berat badan 64 mahasiswa Psikologi Gunadarma
3003 − tepi batas kelas sebagai batas kelas
d. Titik tengah
Titik tengah setiap kelas dijadikan penaksir data asli yang sudah hilang
sebagai akibat proses pengelompokan. Contoh distribusi frekuensi
dengan titik tengah:
Tabel 2.5. Distribusi berat badan 64 mahasiswa Psikologi Gunadarma
2003 − dengan titik tengah
21
Langkah-langkah penyusunan distribusi frekuensi:
a. Menentukan jumlah kelas:
Untuk contoh tabel 2.2 → n = 50
Dengan aturan Sturges:
Jumlah kelas = 1 + 3.322 log 50
= 6.64 ≈ 7 kelas
b. Menentukan interval kelas
Rentang angka data terbesar dengan angka terkecil adalah:
37 – 16 = 21
Interval kelas = [Rentang kelas + 1] : jumlah kelas
= 22 : 7 = 3.14 ≈ 4 (dibulatkan ke atas)
c. Menyusun kelas-kelas data
Tabel 2.6. Batas kelas bawah dan batas kelas atas
Batas kelas bawah Batas kelas atas
13 16
17 20
21 24
25 28
29 32
33 36
37 40
d. Memasukkan data
Semua angka data harus dapat dimasukkan tanpa mengalami keragu-
raguan. Pemasukan data dipermudah dengan membuat tally (melidi)
terlebih dahulu.
22
Hasil penyusunan distribusi frekuensi:
Batas atas dapat juga dinyatakan dengan simbol ‘lebih kecil daripada’
(<):
23
Tabel 2.10. Distribusi frekuensi nilai skala Depresi MMPI-2 50
mahasiswa Psikologi Gunadarma 2003
13-16 2 < 17 2
17-20 7 < 21 20 + 7 = 9
21-24 19 < 25 9 + 19 = 28
25-28 12 < 29 28 + 12 = 40
29-32 8 < 33 40 + 8 = 48
33-36 1 < 37 48 + 1 = 49
37-40 1 < 41 49 + 1 = 50
24
Distribusi frekuensi kumulatifnya adalah:
25
2.2. GRAFIK
Histogram Frekuensi:
Histogram merupakan penyajian secara grafikal data yang ada pada
tabel distribusi frekuensi. Histogram umumnya digunakan untuk data
kuantitatif (numerik) yang dikategorisasikan.
Poligon Frekuensi
Sama seperti histogram, hanya pada poligon frekuensinya dilukiskan
dalam bentuk garis yang menghubungkan tiap titik tengah puncak masing-
masing kelas. Poligon frekuensi untuk data pada tabel 2.8 adalah:
26
Diagram 2.4. Poligon frekuensi nilai skala Depresi MMPI-2 50
mahasiswa Psikologi Gunadarma 2003
Ogive
Distribusi frekuensi kumulatif dapat disajikan dalam bentuk diagram
yang dinamakan ogive. Ogive untuk tabel 2.12 adalah:
27
Diagram Batang (bar chart)
Biasanya digunakan untuk data kategorik ordinal. Berbeda dengan
histogram, pada diagram batang antara batang yang satu dengan yang
berikutnya didapatkan celah (gap).
28
Diagram 2.7. Asal fakultas 218 mahasiswa
Studi Nyeri Kepala Gunadarma, 2003
Diagram Batang-dan-Daun:
Diagram batang-dan–daun (stem-and-leaf) merupakan kombinasi
antara histogram dengan penyajian data individual secara numerik. Untuk
angka dua digit, puluhan dijadikan ‘batang’ dan satuan dijadikan ‘daun’.
Dari contoh data pada tabel 2.15 di bawah dihasilkan diagram batang-
dan-daun seperti terlihat pada diagram 2.8.
41 45 49 51 52 53 55 56 56 57
57 58 59 59 60 61 61 62 63 63
65 65 65 67 67 67 67 69 69 69
69 70 71 71 71 73 73 73 73 73
75 75 77 77 77 79 79 81 81 81
83 83 87 89 89 92 92 93 94 96
29
4* | 159
5* | 12356677899
6* | 01123355577779999
7* | 0111333335577799
8* | 11133799
9* | 22346
30
LAMPIRAN 2A BAGIAN-BAGIAN TABEL
1. Judul (title).
- ditempatkan di atas tabel
- memberikan deskripsi yang singkat dan eksplisit mengenai isi tabel
- terdiri atas:
a. nomor tabel (table number) jika ada lebih daripada satu tabel
b. cakupan dan jangkauan informasi
c. periode sehubungan dengan isi tabel
d. cara pengumpulan informasi
e. unit pengukuran apabila tak disebutkan di bagian lain tabel
f. jika judul terlalu panjang, sebagian di antaranya ditulis di bawah
judul utama(sebagai headnote)
31
Contoh tabel dan bagian-bagiannya
32
LATIHAN 2
Bagian Pertama
Pilihlah satu jawaban yang paling benar !
1. Jarak antara kelas yang satu dengan kelas lainnya secara berurutan pada
tabel distribusi frekuensi dinamakan:
A. Rentang
B. Interval kelas
C. Limit kelas (class limit)
D. Batas kelas (class boundary)
2. Array adalah:
A. Kumpulan data yang sudah di urutkan dari yang terkecil ke yang
terbesar
B. Kumpulan data yang telah disusun dalam bentuk distribusi
frekuensi
C. Kumpulan data yang memiliki lebih daripada satu modus
D. Semuanya salah
3. Misalkan dari suatu survei diperoleh data sebanyak 200 item. jika akan
dibuat distribusi frekuensinya, jumlah kelas menurut aturan Sturges
adalah:
A. 5 C. 9
B. 7 D. 12
4. Jika untuk soal No. 3 di atas diketahui pula nilai minimum X min = 35
dan nilai maksimum X max = 164, maka interval kelas adalah:
A. 14 C. 18
B. 15 D. 19
33
6. Tabel yang baik ialah tabel yang:
A. bersifat self − explanatory.
B. sederhana
C. bersifat self − explanatory dan sederhana.
D. bersifat self − explanatory dan kompleks.
8. Ogive adalah:
A. Poligon frekuensi untuk frekuensi kumulatif
B. Histogram untuk distribusi frekuensi relatif
C. Diagram batang untuk distribusi frekuensi mutlak
D. Semuanya salah
34
11. Dari grafik di bawah ini dapat disimpulkan bahwa:
35
Bagian Kedua
Selesaikan soal berikut:
67 52 72 42 21 55 47 66 54 37 37 34
59 51 44 56 48 44 69 56 27 34 47 59
20 51 42 78 35 61 44 51 52 77 82 57
63 73 49 67 33 78 48 47 41 62 72 85
25 72 54 52 108 28 93 37 22 37 66 49
69 42 54 59 58 75 61 66 99 97 51 61
26 73 33 71 64 57 55 56 47 87 68 97
36
BAB 3
UKURAN STATISTIK
3.1 UKURAN PUSAT (NILAI TENGAH)
Rerata; Rerata Hitung (Mean; Arithmetic Mean) untuk
Data Tak-berkelompok (Ungroup Data)
Rerata hitung adalah jumlah seluruh angka data dibagi dengan
banyaknya (jumlah) data.
x + x + . . . + xn
x = 1 2
n
n
∑
i
=1
xi
atau x= (3.1)
n
x : rerata sampel
xi : data ke-i variabel acak X; i = 1, 2, . . . , n
n : ukuran sampel (banyaknya anggota sampel)
Untuk populasi:
N
∑
i
Xi
=1
µ = (3.2)
N
Contoh 3.1:
Misalkan dimiliki data tinggi badan 10 orang mahasiswa (dalam cm):
162, 161, 157, 154. 164, 170, 162, 165, 162, 161.
n
n = 10 dan ∑
i
=1
xi = 162 + 161 + . . . + 161 = 1618
37
n
∑
i
=1
xi
1618
sehingga: x= = = 161.8
n 10
k
∑
j
f jxj
=1
atau: x= (3.3)
n
x : rerata sampel
xj : titik tengah kelas ke-j; j = 1, 2, . . . , k
fj : frekuensi (banyak anggota) kelas ke-j
n : ukuran sampel (jumlah frekuensi data sampel)
Rerata populasi:
K
∑
j
fjX j
=1
µ = K
∑
j
fj
=1
K
∑
j
fjX j
=1
atau: µ = (3.4)
N
µ : rerata populasi
Xj : titik tengah kelas ke-j; j = 1, 2, . . . , K
fj : frekuensi (jumlah anggota) kelas ke-j
N : ukuran populasi (jumlah frekuensi data populasi)
38
Contoh 3.2:
Lihat kembali data berat badan 64 mahasiswa Psikologi Gunadarma
pada tabel 2.3.
3, 307
x = = 51.67
64
Keunggulan rerata:
1. Lebih dikenal, sehingga penggunaannya pun lebih mudah .
2. Setiap dapat digunakan data kuantitatif memiliki dan hanya memiliki
satu rerata.
3. Karena kumpulan data hanya memilki satu rerata, maka ukuran pusat
data ini dapat digunakan dengan baik dalam prosedur statistika, seperti
perbandingan dua atau lebih kumpulan data.
Kelemahan rerata:
1. Sangat peka terhadap data ekstrim.
2. Tidak dapat digunakan untuk menentukan ukuran pusat data kualitatif.
3. Untuk data berkelompok, hasil perhitungan tidak mencerminkan rerata
sesungguhnya.
4. Untuk data berkelompok dengan kelas terbuka, rerata-nya tidak dapat
dihitung.
39
Rerata Geomerik (Geometric Mean)
Misalkan G menyatakan rerata geometrik untuk data x1 , x2 , . . . , xn ,
maka:
n
G n = x1 . x2 . . . xn = xi (3.5.a)
i =1
Contoh 3.3:
Misalkan jumlah kasus DBD (Demam Berdarah Dengue) di kota B
pada tahun 2000, 2001, 2002, dan 2003 masing-masing adalah 124, 130,
143, dan 158. Rerata geometriknya adalah:
G= n x1 x2 . . . xn
40
Contoh 3.4:
Misalkan kelajuan sebuah mobil adalah 60 km/jam selama
menempuh kilometer pertama, 80 km/jam pada kilometer kedua, dan 65
km/jam pada kilometer ketiga. Rerata kelajuan mobil tersebut (dihitung
sebagai rerata harmonik) dalam km/jam adalah:
n
H= n
1
∑
i =1 xi
3 3
= = = 67.34
1 1 1 1 1 1
+ + + +
x1 x2 x3 60 80 65
Contoh 3.5:
Misalkan mahasiswa Y mendapatkan nilai 90 untuk tugas harian mata
kuliah Statistika, 80 untuk Ujian Tengah Semester, dan 60 untuk Ujian Akhir
Semester. Jika bobot tugas harian, UTS, dan UAS masing-masing adalah
10%, 60%, dan 30%, maka nilai akhirnya (dihitung sebagai rerata
tertimbang) adalah:
n
W= ∑
i
wi xi
=1
= (0.10)(90) + (0.60)(80) + (0.30)(60) = 75
41
Rerata Terpangkas (Trimmed mean)
Rerata terpangkas digunakan untuk menghindari pengaruh nilai-nilai
ekstrim terhadap rerata. Untuk menghitungnya, mula-mula data
‘dipangkas’, yaitu dengan membuang sejumlah nilai terendah dan nilai-nilai
tertinggi, misalnya 5% nilai terendah dan 5% nilai tertinggi (atau 10% nilai
terendah dan 10% nilai tertinggi), lalu terhadap sisa data dilakukan
perhitungan rerata hitung seperti biasa.
Med = X , n ganjil )
n+1
2
X +X
n n
2 +1
2
Med = , n genap ) (3.8.a)
2
Contoh 3.6:
Lihat kembali data tinggi badan 10 orang mahasiswa pada contoh 3.1:
162, 161, 157, 154, 164, 170, 162, 165, 162, 161. Data diurutkan dalam
bentuk array (dibaca: er-rei) sebagai berikut:
42
X = 154 X = 162
(1) ( 6)
X = 157 X = 162
( 2) (7)
X = 161 X = 164
( 3) (8)
X = 161 X = 165
( 4) (9)
X = 162 X = 170
( 5) (10 )
( n 2 ) − fkmed
Med = Bmed + i (3.9)
f med
Med : median
Bmed : tepi batas kelas bawah pada kelas median (lower class boundary)
i : interval kelas
n : ukuran sampel
fkmed : frekuensi kumulatif sebelum kelas median
f med : frekuensi pada kelas median
Contoh 3.7:
Lihat kembali data berat badan 64 mahasiswa Psikologi Gunadarma
pada tabel 2.3.
43
Tabel 3.2. Distribusi frekuensi berat badan 64 mahasiswa
Psikologi Gunadarma 2003
Titik posisi median = 32. Kelas posisi median yaitu kelas ke-2.
Bmed = 44.5
i =9
fkmed = 20
f med = 19
( n 2 ) − fkmed
Med = Bmed + i
f med
32 − 20
= 44.5 + 9 = 50.18
19
Keunggulan median:
1. Tidak dipengaruhi oleh data ekstrim
2. Mudah dimengerti dan mudah dihitung, baik dari data tak-berkelompok
maupun data berkelompok. Juga dapat dihitung untuk data
berkelompok dengan kelas terbuka.
3. Dapat digunakan untuk data kuantitatif maupun data kualitatif.
Kelemahan median:
1. Hanya dapat ditentukan dari data yang telah diurutkan sehingga
membutuhkan waktu yang tidak sedikit.
2. Dihitung bukan berdasarkan nilai data, tetapi berdasarkan jumlah data,
sehingga sulit dijadikan sebagai ukuran pusat data untuk
menggambarkan kumpulan datanya.
44
Modus untuk Data Tak-berkelompok
Modus adalah nilai yang memiliki frekuensi tertinggi.
Contoh 3.8:
Lihat kembali data tinggi badan 10 orang mahasiswa pada contoh 3.1:
162, 161, 157, 154, 164, 170, 162, 165, 170, 161. Modus akan lebih mudah
ditentukan jika data tersusun dalam distribusi frekuensi seperti di bawah ini.
di
Mo = Bmo + i (3.10)
d1 + d 2
Mo : modus
Bmo : tepi batas kelas bawah pada kelas modus
i : interval kelas
d1 : frekuensi kelas modus dikurangi frekuensi kelas sebelum kelas
modus
d2 : frekuensi kelas modus dikurangi frekuensi kelas sesudah kelas
modus
45
Contoh 3.9:
Lihat kembali data berat badan 64 mahasiswa Psikologi Gunadarma
pada tabel 2.3 dan distribusi frekuensi beserta frekuensi kumulatifnya pada
tabel 3.2.
Kelas posisi modus yaitu kelas pertama.
Bmo = 35.5
i=9
d1 = 20 ‒ 0 = 20
d 2 = 20 ‒ 19 = 1
di
Mo = Bmo + i
d1 + d 2
20
= 35.5 + 9 = 44.07
20 + 1
Keunggulan modus:
1. Dapat digunakan untuk data kualitatif maupun kuantitatif.
2. Tidak dipengaruhi oleh data ekstrim.
3. Dapat dihitung untuk data berkelompok dengan kelas terbuka.
Kelemahan modus:
1. Dalam kasus-kasus tertentu, kumpulan data tidak memiliki modus.
2. Jika modus justru lebih daripada satu, tidak dapat digunakan sebagai
ukuran pusat data.
Contoh 3.10:
Hitung rerata, median, dan modus distribusi frekuensi berikut:
Tabel 3.4. Distribusi frekuensi IPK 32 orang mahasiswa
IPK Frekuensi
X < 1.5 1
1.5 < X < 2.0 4
2.0 < X < 2.5 5
2.5 < X < 3.0 7
3.0 < X < 3.5 11
X > 3.5 4
Jumlah 32
46
Tabel 3.5. Perhitungan rerata, median, dan modus IPK
32 orang mahasiswa
Xj fj Xj fj Frekuensi kumulatif
1.52 1 1.25 1
1.75 4 7.00 5
2.25 5 11.25 10
2.75 7 19.25 17
3.25 11 35.75 28
3.75 4 15.00 32
Jumlah 32 89.50
a. Rerata:
n
∑
i
Xi
=1 89.50
X= = = 2.80
n 32
b. Median:
Kelas posisi median adalah kelas keempat.
( n 2 ) − fkmed
Med = Bmed + i
f med
16 − 10
= 2.50 + 0.5 = 2.93
7
c. Modus:
Kelas posisi modus adalah kelas kelima.
di
Mo = Bmo + i
d1 + d 2
4
= 3.00 + 0.5 = 3.18
4 + 7
47
Posisi kuartil (n < 30):
n+2
Posisi Q1 = )
4
2n + 2 n +1
Posisi Q2 = = ) (3.11)
4 2
= Posisi median
3n + 2
Posisi Q3 = )
4
( n 4 ) − fkq
Q1 = Bq + i (3.12.a)
fq
( 3n 4 ) − fkq
Q3 = Bq + i (3.12.b)
fq
Q1 : kuartil pertama
Q3 : kuartil ketiga
Bq : tepi batas kelas bawah pada kelas kuartil
i : interval kelas
n : ukuran sampel
fkq : frekuensi kumulatif sebelum kelas kuartil
fq : frekuensi pada kelas kuartil
Contoh 3.11:
Lihat tabel 3.5. Tentukan kuartil pertama dan kuartil ketiga!
32
Posisi kuartil pertama: =8
4
Bq = 2.00
i = 0.5
48
fkq = 5
fq = 5
( n 4 ) − fkq
Q1 = Bq + i
fq
8 − 5
= 2.00 + (0.5) = 2.25
5
49
Contoh 3.12:
Lihat tabel 3.6. Tentukan desil ke-7!
120 × 7
Posisi desil ke-7: = 84
10
Bd (tepi batas bawah kelas desil) : 63.5
i (interval kelas) : 4
fkd (frekuensi kumulatif sebelum kelas desil) : 75
f d (frekuensi pada kelas desil) : 18
50
Posisi beberapa titik persentil:
Contoh 3.13:
Lihat tabel 3.6. Tentukan persentil ke-67!
120 × 67
Posisi titik persentil ke-67: = 80.4
100
B p (tepi batas bawah kelas persentil) : 63.5
i (interval kelas) : 4
fk p (frekuensi kumulatif sebelum kelas persentil) : 75
f d (frekuensi pada kelas persentil) : 18
51
3.2 UKURAN PENYEBARAN
Rentang (Range)
Rentang adalah selisih antara data terbesar dan data terkecil.
R = X max ‒ X min (3.13)
Contoh 3.14:
Lihat kembali data tertinggi badan 10 mahasiswa pada contoh 3.1.
Data terkecil adalah X min = 154 dan data terbesar adalah X max = 170,
sehingga rentang adalah:
R = X max ‒ X min
= 170 ‒ 154 = 16
Rentang Inter-kuartil
Rentang inter-kuartil (inter-quartile range) adalah selisih antara
kuartil ketiga dan kuartil pertama.
IQR = Q3 ‒ Q1 (3.14)
Contoh 3.15:
Lihat data IPK 32 orang mahasiswa pada tabel 3.4. Pada contoh 3.11
telah dihitung kuartil pertama Q1 = 2.25 dan kuartil ketiga Q3 = 3.32,
sehingga rentang inter-kuartil adalah:
IQR = Q3 ‒ Q1
= 3.32 ‒ 2.25 = 1.07
52
dan deviasi mutlak rata-rata untuk sampel adalah:
n
∑
i
xi − x
=1
MAD = (3.15.a)
n
σ2 : variansi populasi
σ : standar deviasi populasi
Xi : data ke-i variabel random X; i i = 1, 2, . . . , N
µ : rerata populasi
N : ukuran populasi
53
n
∑
2
( xi − x )
i=1
s= (3.14.a)
n −1
s2 : variansi sampel
s : standar deviasi sampel
xi : data ke-i variabel random X; i = 1, 2, . . . , n
x : rerata sampel
n : ukuran sampel
∑ X i2 − ( ∑ X i ) N
2
2
σ = (3.18)
N
∑ X i2 − ( ∑ X i ) N
2
σ = (3.18.a)
N
σ2 : variansi populasi
σ : standar deviasi populasi
Xi : data ke-i variabel random X; i = 1, 2, . . . , N
N : ukuran populasi
∑ xi2 − ( ∑ xi ) n
2
2
s = (3.19)
n −1
∑ xi2 − ( ∑ xi ) n
2
s= (3.19.a)
n −1
s2 : variansi sampel
s : standar deviasi sampel
xi : data ke-i variabel random X; i = 1, 2, . . . , n
n : ukuran sampel
54
Contoh 3.16:
Lihat kembali data tinggi badan 10 mahasiswa pada contoh 3.1.
n
∑
2
( Xi − X )
i
s2 = =1
n −1
167.60
= = 18.62
10 − 1
s = 18.62 = 4.32
2
s =
n −1
261,960 − (1, 618 ) 10
2
= = 18.62
10 − 1
55
Variansi dan Standar Deviasi Data Berkelompok
Rumus definisi variansi SD untuk populasi:
K 2 K 2
∑ (
fj X j −µ ) ∑ (
fj X j −µ )
σ2 = j =1
K
= j =1
(3.20)
N
∑ fj
j =1
K 2
∑ f j (X j − µ)
j =1
σ = (3.20.a)
N
σ2 : variansi populasi
σ : standar deviasi populasi
Xj : titik tengah kelas ke-j; j = 1, 2, . . . , K
µ : rerata populasi
fj : frekuensi kelas ke-j
K
N : ukuran populasi (= ∑ f j )
j =1
s2 : variansi populasi
s : standar deviasi populasi
xj : titik tengah kelas ke-j; j = 1, 2, . . . , k
x : rerata sampel
fj : frekuensi kelas ke-j
k
N : ukuran sampel (= ∑ f j )
j =1
56
Dalam praktik, yang digunakan umumnya adalah rumus operasional.
f j X 2j − N
2
∑
(∑ f j X j )
σ2 = (3.22)
N
∑ f j X 2j − ( ∑ f j X j ) N
2
σ = (3.22.a)
N
σ2 : variansi populasi
σ : standar deviasi populasi
Xj : titik tengah kelas ke-j: j = 1, 2, . . . , K
fj : frekuensi kelas ke-j
N : ukuran populasi
∑ f j x 2j − ( ∑ f j x j ) n
2
s2 = (3.23)
n −1
f j x 2j − ∑ f j x j n
2
∑ (
)
s= (3.23.a)
n −1
s2 : variansi sampel
s : standar deviasi sampel
xj : titik tengah kelas ke-j; j = 1, 2, . . . , k
fj : frekuensi kelas ke-j
n : ukuran sampel
Contoh 3.17:
Lihat kembali data berat badan 64 mahasiswa Psikologi Gunadarma
pada tabel 2.3. Pada contoh 3.2 telah dihitung nilai reratanya X = 51.67.
57
Tabel 3.8. Perhitungan variansi dan standar deviasi berat badan 64
mahasiswa Psikologi Gunadarma dengan rumus definisi
2
Titik tengah: X j Deviasi: ( X i − X ) Frekuensi: f j f j ( Xi − X )
40 −11.67 20 2,724.65
49 −2.67 17 135.64
58 6.33 17 680.77
67 15.33 5 1,174.76
76 24.33 1 591.86
85 33.33 1 1,791.67
94 42.33 1 1,791.67
Jumlah 0 64 8,210.11
Variansi-nya adalah:
k 2
∑ (
fj X j − X )
s2 = j =1
n −1
k
∑ 8, 210.11
j =1
` = = 130.32
64 − 1
Dengan rumus operasional, terlebih dahulu harus dihitung f j X j dan
f j X 2j .
58
Variansi-nya adalah:
2
n
∑ f j j ∑ j j
x 2
−(
f x )
s2 =
n −1
179, 089 − ( 3,307 ) 64
2
= = 130.32
64 − 1
Koefisien Variansi
Koefisien variasi (coefficient of variation; CV) adalah nilai standar
deviasi dibagi dengan rerata. Koefisien merupakan ukuran penyebaran data
yang tak memiliki satuan, karena itu dapat digunakan untuk membandingkan
penyebaran data 2 variabel yang memiliki satuan berbeda, misalnya tinggi
dan berat badan.
Koefisien variansi untuk populasi adalah:
σ
CV = (3.24)
µ
dan koefisien variansi untuk sampel adalah:
s
CV = (3.24.a)
x
Koefisien variansi juga dapat dinyatakan dalam persentase, yaitu CV
= ( σ / µ ) 100% untuk populasi dan CV = (s/ x ) 100% untuk sampel.
Contoh 3.18:
Lihat kembali data tinggi badan 10 mahasiswa pada contoh 3.1. Pada
contoh 3.1. telah dihitung rerata-nya xa = 161.8 cm dan pada contoh 3.16
telah dihitung standar deviasi-nya sa = 4.32 cm, sehingga koefisien variansi-
nya adalah:
s
CVa = a (100%)
xa
59
4.32
= (100%) = 2.67%
161.8
Misalkan untuk kelompok mahasiswa yang sama diketahui pula data
berat badannya dengan rerata xb = 54.4 kg dan standar deviasi sb = 6.75 kg,
sehingga koefisien variasi-nya adalah:
s
CVb = b (100%)
xb
6.75
= (100%) = 12.41%
54.4
Tampak bahwa ukuran berat badan mahasiswa jauh lebih menyebar
dibandingkan ukuran tinggi badan pada kelompok mahasiswa yang sama.
60
LAMPIRAN 3A: UKURAN PUSAT PADA
DISTRIBUSI SIMETRIS DAN ASIMETRIS
Pada diagram 2.3 dapat dilihat gambaran distribusi frekuensi sampel
yang berasal dari populasi kontinu, namun telah dikategorisasikan. Jika
sampel yang berasal dari distribusi kontinu diperbesar ukurannya sampai
menjadi tak berhingga dan diperbanyak jumlah kelasnya sampai menjadi tak
berhingga banyaknya (atau tidak dilakukan kategorisasi lagi), akan diperoleh
beberapa gambaran seperti terlihat pada diagram III.1 di bawah ini.
61
Jika nilai-nilai besar lebih banyak daripada nilai-nilai kecil, akan
didapatkan gambaran distribusi asimetris dengan ekor yang lebih panjang di
sisi kanan, seperti pada diagram III.3. Distribusi seperti ini disebut juga
“menceng ke kanan” (skewed to the right). Distribusi ini dapat dianggap
berasal dari distribusi simetris dengan penambahan sejumlah nilai-nilai
ekstrim yang besar. Penambahan nilai-nilai ekstrim yang besar terutama akan
mempengaruhi nilai rerata, sehingga posisi rerata seolah-olah ‘tertarik’ ke
kanan, sedangkan posisi median hanya ‘tertarik’ sedikit (nilai median sedikit
terpengaruh), sedangkan posisi modus tidak berubah.
62
LAMPIRAN 3B: FRAKTIL
Matriks III.1. Macam-macam fraktil (kuantil)
Macam Data dibagi menjadi Fraktil
Median 2 bagian Med
Kuartil 4 bagian Q1 , Q2 , Q3 , ( Q4 )
Desil 10 bagian D1 , D2 , D3 , . . . , D9 , ( D10 )
Persentil 100 bagian P1 , P2 , P3 , . . . , P99 , ( P100 )
Matriks III.2. Kesamaan beberapa fraktil
Med
Q1 Q2 Q3
D1 D2 D3 D4 D5 D6 D7 D8 D9
P10 P20 P25 P30 P40 P50 P60 P70 P75 P80 P90
63
Contoh:
n× j
Posisi D j :
10
60 ×1
Posisi D1 : =6
10
60 × 3
Posisi D3 : = 18
10
60 × 7
Posisi D7 : = 42
10
64
2
LAMPIRAN 3C: NOTASI ∑ ( xi - x ) DAN ∑ ( xi - x )
A. ∑ ( xi − x ) = ∑ xi ‒ ∑ x
Karena x = ∑ i , sehingga ∑ x
x
i = n x ; dan pada pengambilan satu
n
sampel, x merupakan konstante, sehingga ∑ x = n x , maka:
∑ ( xi − x ) = ∑ xi ‒ ∑ x
=nx ‒nx =0
∑ ( xi − x ) ∑ ( xi2 − 2 xxi + x 2 )
2
B. =
= ∑ xi2 ‒ 2 x ∑ xi + ∑ x 2 [ x dan x 2 konstante]
= ∑ xi2 ‒ ( 2 x ) ( nx ) + n x 2
= ∑ xi2 ‒ 2n x 2 + n x 2
= ∑ xi2 ‒ n x 2
2
∑ xi
= ∑ x ‒ n
2
i n
2
( ∑ xi )
= ∑ xi
2
‒
n
65
LAMPIRAN 3D: DIAGRAM KOTAK
Diagram kotak (diagram kotak-dan-titik; box−plot;
box−and−whisker plot) adalah bentuk grafik yang menyajikan peringkasan
data dalam bentuk kuartil pertama, median, dan kuartil ketiga. Secara kasar
dapat dilihat apakah sebaran data simetris atau tidak, selain itu disajikan pula
‘nilai perbatasan bawah’ (lower adjacent value) dan ‘nilai perbatasan atas’
(upper adjacent value) yang antara lain berguna untuk menyimpulkan ada
tidaknya ‘data pencilan’ (outlier).
x 13 x 14 x 15 x 16 x 17 x 18 x 19 x 20 x 21 x 22 x 23
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
22 23 23 23 23 23 23 23 24 24 24
x 24 x 25 x 26 x 27 x 28 x 29 x 30 x 31 x 32 x 33 x 34
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
24 25 25 25 25 25 26 26 26 27 27
x 35 x 36 x 37 x 38 x 39 x 40 x 41 x 42 x 43 x 44 x 45
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
28 28 29 29 29 30 31 31 32 32 37
n 45 1
Posisi Q1 = = = 11 ≈ 11
4 4 4
Q1 = x 11 = 21
( )
Posisi Q2 = Med =
2n
=
( 2 )( 45) = 22 1
4 4 2
x 22 + x 23
( ) ( )
Q2 = Med = = 24
2
66
Posisi Q3 =
3n
=
( 3)( 45 ) = 33 3 ≈ 34
4 4 4
Q3 = x 34 = 27
( )
IQR (rentang inter-kuartil) = Q3 – Q1 = 27 – 21 = 6
1.5 IQR = (1.5)(6) = 9
67
Diagram III.5. Diagram kotak skala Depresi MMPI-2 45
mahasiswa wanita Psikologi Gunadarma 2003
68
LATIHAN 3
Bagian Pertama
69
6. Keunggulan median antara lain yaitu:
A. Tidak dipengaruhi oleh data ektrim
B. Dapat digunakan untuk menentukan ukuran pusat data kategorik
C. A) dan B) benar
D. A) dan B) salah
70
n
13. ∑
i =1
( xi − x )
A. Selalu lebih besar daripada nol
B. Selalu sama dengan nol
C. Dapat lebih kecil daripada nol
D. Semuanya salah
n
∑
2
14. ( xi − x ) =
i =1
2
n
n ∑ xi
A. 0 C. ∑ xi ‒ i =1
2
i =1 n
n
B. ∑
i =1
xi2 + nx 2 D. Semuanya salah
71
19. Diagram kotak antara lain berguna untuk:
A. Menilai simetris atau tidaknya sebaran data
B. Menilai ada tidaknya data pencilan
C. Keduanya benar
D. Keduanya salah
Bagian Kedua
2. Mediannya adalah:
A. 71.50 C. 74.00
B. 73.00 D. 78.00
3. Modusnya yaitu:
A. 71.50 C. 74.00
B. 73.00 D. 78.00
72
5. Rentang-nya (rentang) adalah:
A. 22.5 C. 25
B. 24 D. 27
n
6. Jika diketahui ∑
i =1
xi2 = 62.058, dengan menggunakan pembagi (n – 1)
i xi xi2
1 ... 2500
2 75 ...
3 64 ...
4 ... ...
5 ... 6400
∑ xi = . . . ∑ xi2 = . . .
2
( ∑ xi ) =...
73
n
10. ∑
i =1
xi =
A. 330 C. 63 800
B. 22 342 D. 108 900
n
11. ∑
i =1
xi2 =
A. 330 C. 63 800
B. 22 342 D. 108 900
2
n
12. ∑ xi =
i =1
A. 330 C. 63 800
B. 22 342 D. 108 900
4
∑
2
13. ( 2 xi + 12 ) =
i =2
A. 330 C. 63 800
B. 22 342 D. 108 900
14. s=
A. 10.6 C. 112.4
B. 11.9 D. 140.5
Bagian Ketiga
Selesaikanlah soal-soal berikut:
Lihat kembali soal Latihan 2 Bagian Kedua. Hitunglah rerata,
variansi, dan standar deviasi penghasilan bulanan 84 keluarga di desa B:
A. Sebagai data tak berkelompok
B. Sebagai data berkelompok.
Petunjuk:
- Untuk soal A, gunakan rumus operasional. ∑ xi dan ∑ xi2 dihitung
dengan menggunakan program komputer Excel.
- Untuk soal B, gunakan tabel distribusi frekuensi yang telah disusun pada
soal Latihan 2 Bagian Kedua.
74
BAB 4
PROBABILITAS
4.1 KONSEP DASAR PROBABILITAS
Himpunan (set)
a. Himpunan berhingga. Contoh:
− A adalah himpunan mahasiswa kelompok I mata kuliah Statistika
kelas 2PA01, maka:
A = {Agustin, Anita, Endang, . . . , Yenny}
− B adalah himpunan buah yang dijual di sebuah supermarket,
maka:
B = {jeruk, pepaya, melon, . . .}
− C adalah angka-angka yang tampak di permukaan sebuah dadu,
maka:
C = {1, 2, 3, 4, 5, 6}
b. Himpunan tak berhingga:
− D adalah himpunan nilai-nilai IP semester yang mungkin
diperoleh mahasiswa Gunadarma, maka:
D = {x | 0 < x < 4}
(dibaca: x adalah sedemikian hingga x lebih besar atau sama
dengan nol dan x lebih kecil atau sama dengan empat)
75
Ruang sampel ditulis dengan lambang ‘S’ ( = semesta), peristiwa
dengan huruf besar A, B, C, . . . . Jika suatu percobaan menghasilkan n
kemungkinan peristiwa, ruang sampelnya disajikan sebagai:
S = { a1 , a2 , . . . , an } (4.1)
dengan a1 , a2 , . . . , an menyatakan semua hasil yang mungkin terjadi pada
percobaan itu. A = { a2 , a4 } menunjukkan peristiwa yang hanya terdiri dari
hasil a2 dan a4
Contoh 4.1:
1) Percobaan : Pelontaran sebuah dadu
Hasil : Mata dadu yang tampak di atas.
Ruang sampel S = {1, 2, 3, 4, 5, 6}
Salah satu peristiwa : A = titik ganjil tampak
= {1, 3, 5}
2) Percobaan : Pelontaran sebuah mata uang logam dua kali.
Salah satu hasil : MB (hasil pelontaran pertama adalah muka,
dan hasil pelontaran kedua adalah belakang.
Ruang sampel : S = {MM, MB, BM, BB}
Contoh peristiwa : A = paling sedikit satu muka
= {MM, MB, BM}
B = kedua hasil sama
= {MM, BB}
76
dadu merah, j menyatakan titik yang tampak
di atas pada dadu putih.
Ruang sampel : S = 6 × 6 pasangan berurut (i, j) dengan i = 1,
2, 3, 4, 5, 6 dan j = 1, 2, 3, 4, 5, 6.
Contoh peristiwa:
a) A = jumlah titik yang tampak sama dengan 7
= {(1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)}
b) B = kedua hasil sama
= {(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)}
77
Diagram 4.1. Diagram Venn: union, interseksi, komplemen
Contoh 4.2:
1) Sebuah kartu diambil secara acak dari satu dek kartu bridge.
Didefinisikan peristiwa-peristiwa berikut:
A = kartu yang terambil adalah Ace.
B = kartu yang terambil adalah ♥
C = kartu yang terambil adalah .
D = kartu yang terambil adalah Merah
E = kartu yang terambil adalah Hitam
Maka:
B ∪C = kartu yang terambil adalah ♥ atau
B ∩C = karena satu kartu tidak dapat berupa ♥ dan
sekaligus.
B ∪C ∪ E = S = D ∪ E
A∩C = kartu yang terambil adalah Ace
C
D = kartu yang terambil bukan Merah = E
78
C
(B ∪C) = DC = E
∅ adalah himpunan kosong yang tak mempunyai anggota, = {}.
2) Jika sebuah dadu dilemparkan, dan A = {1, 3, 5}; B = {1}; dan C = {2,
4, 6}, maka:
A ∪ C = {1, 2, 3, 4, 5, 6} = S
AC = {2, 4, 6} = C
A ∪ B = {1, 3, 5} = A
B ∪ C = {1, 2, 4, 6}
A∩C = ∅
A ∩ B = {1} = B
BC = {2, 3, 4, 5, 6}
C
B ∩ A = {3, 5}
Hukum De Morgan:
C
a) ( A ∪ B) = AC ∩ BC (4.2.a)
C
b) ( A ∩ B) = AC ∪ BC (4.2.b)
Hukum distributif:
a) A ∩ ( B ∪ C ) = ( A ∩ B) ∪ ( A ∩ C ) (4.3.a)
b) A ∪ ( B ∩ C ) = ( A ∪ B) ∩ ( A ∪ C ) (4.3.b)
Partisi:
Misalkan dimiliki himpunan A dengan sejumlah himpunan bagian-
nya A1 , A 2 , . . . , An ..
79
a) Himpunan-himpunan bagian A1 , A 2 , . . . , An dikatakan ‘saling
asing’ (mutually exclusive) jika Ai ∩ Aj = ∅ untuk setiap pasangan
nilai (i, j); i = 1, 2, . . . , n; j = 1, 2, . . . , n; i ≠ j.
b) Himpunan-himpunan bagian A1 , A 2 , . . . , An dikatakan ‘terbagi
habis’ (mutually exclusive) jika A1 ∪ A 2 ∪ . . . ∪ An = A.
Contoh 4.3:
1) Jika A adalah peristiwa ‘banyaknya titik ganjil’ pada satu kali
pelontaran sebuah dadu, maka N(A) = 3 dan N(S) = 6, sehingga P(A) =
3/6 = 1/2. Demikian juga P(1) = 1/6 dan P(genap) = 3/6 = 1/2.
2) Dalam pelontaran dua buah dadu, peristiwa ‘berpasangan’ [{1, 1}, {2,
2}, . . . , {6, 6}] terdiri atas 6 unsur. Karena seluruhnya ada 36 unsur
dalam ruang sampelnya (= 62), maka P (berpasangan) = 6/36 = 1/6.
Juga P (jumlah genap) = 18/36 = 1/2.
Untuk setiap peristiwa A, berlaku:
0 < P (A) < 1 (4.5)
80
Selanjutnya:
N (∅ ) 0
P (∅) = = =0 (4.5.a)
N (S ) N (S )
dan:
N (S )
P (S) = =1 (4.5.b)
N (S )
N ( A ∪ B) N ( A) N ( B) ( A ∩ B)
= + –
N (S ) N (S ) N (S ) N (S )
atau: (
P (B) = P ( B ∩ A) + P B ∩ AC ) (4.9.b)
81
Definisi Probabilitas
Misalkan ruang sampel S suatu percobaan terdiri atas N unsur [ a1 , a2 ,
. . . , a N ] dan misalkan pula p1 , p2 , . . . , pN adalah bilangan-bilangan non-
negatif yang jumlahnya sama dengan 1. Untuk suatu peristiwa A (himpunan
bagian S), probabilitasnya didefinisikan sebagai:
P (A) = ∑ pi (4.10)
dengan pi menyatakan proporsi tiap hasil ai ; ai adalah unsur yang
termasuk dalam A.
Contoh 4.4:
1) Sebuah dadu dibuat sedemikian hingga dalam jangka panjang sisi dadu
akan tampak di atas dalam proporsi (frekuensi relatif) sebagai berikut:
S = {1, 2, 3, 4, 5, 6}
A = titik genap = {2, 4, 6}
P(A) = p2 + p4 + p6
= 0.18 + 0.16 + 0.20 = 0.54
C
A = titik ganjil = {1, 3, 5}
P(AC) = p1 + p3 + p5
= 0.13 + 0.18 + 0.15 = 0.46 = 1 – P(A)
2) Sebuah bola diambil secara acak dari sebuah kotak berisi 34% bola
merah, 27% bola putih, 20% bola biru, dan 19% bola hitam. Jika a1
menyatakan peristiwa yang terambil bola merah, a2 putih, a3 biru, dan
a4 hitam, maka ruang sampelnya adalah S = { a1 , a2 , a3 , a4 } dengan
p1 = 0.34, p2 = 0.27, p3 = 0.20, dan p4 = 0.19; ∑ pi = 1.
Misalkan A = bola yang terpilih tidak hitam, maka:
P(A) = p1 + p2 + p3
= 0.34 + 0.27 + 0.20 = 0.81 = 1 − p4
3) Pada pelontaran sepasang dadu, misalkan yang diperhatikan adalah
jumlah titik keduanya. Ruang sampel yang terjadi yaitu S yang
82
memiliki 11 unsur: S = { a2 , a3 , . . . , a12 }. Diperoleh distribusi nilai
probabilitas sebagai berikut:
Hasil a2 a3 a4 a5 a6
Prob. 1/36 2/36 3/36 4/36 5/36
Contoh 4.5:
a) Sebuah dadu dilontarkan dua kali berturut-turut. Lontaran pertama
dapat memberikan 6 hasil yang mungkin. Untuk tiap hasil ini, pada
lontaran kedua dapat terjadi 6 hasil yang mungkin.
b) Seorang pria mempunyai 5 kemeja, 3 celana, dan 2 pasang sepatu.
Maka banyak cara ia dapat berpakaian secara berbeda adalah 5 × 3
× 2 = 30.
2) Banyak susunan atau urutan berbeda yang dapat dibentuk oleh k objek
yang diambil dari sekumpulan n objek yang berbeda dinamakan banyak
permutasi k objek dari n objek (dengan memperdulikan urutannya;
dinyatakan dengan lambang Pnk , dihitung dengan rumus:
83
n!
Pkn = (4.11)
( n − k )!
= [(n – k) + 1] . [(n – k) + 2] . [(n – k) + 3] . . . (n – 2) .
(n – 1) . n
Contoh 4.6:
Banyak bilangan tiga digit yang dapat dibentuk dengan
menggunakan angka-angka 1, 2, 3, 4, 5 adalah:
‒ Tanpa pengulangan:
P35 = 3 . 4 . 5 = 60
‒ Dengan pengulangan:
5 . 5 . 5 = 125
3) Banyak kombinasi k objek yang diambil dari n objek yang berbeda
(tanpa memperdulikan urutannya; dinyatakan dengan lambang Ckn )
adalah:
n!
Ckn = (4.13)
k !( n − k ) !
Contoh 4.7:
Misalkan dimiliki lima bola dengan warna berbeda-beda. Jika
diambil tiga bola dari kumpulan lima bola itu, banyak kombinasi yang
mungkin adalah:
5!
C35 = = 10
3!2!
84
Perhatikan:
Aturan permutasi digunakan jika peristiwa yang disebutkan memiliki
urutan tertentu pada hasil percobaan. Jika urutan itu tidak penting, digunakan
aturan kombinasi.
Probabilitas Bersyarat
Misalkan A dan B dua peristiwa dengan P(B) > 0, maka probabilitas
bersyarat (conditional probability) peristiwa A dengan syarat (jika diketahui)
B terjadi adalah:
P ( A ∩ B)
P ( A B) = (4.14)
P (B)
Contoh 4.8:
1) Misalkan dalam sebuah populasi yang terdiri dari 1000 orang memiliki
data berikut:
Buta warna Normal Jumlah
680
P (A ) = = 0.68
1000
135
P (B ) = = 0.135
1000
Probabilitas yang dipilih buta warna, jika diketahui ia seorang pria,
adalah:
60 3
P ( B A) = =
680 34
Tampak bahwa:
N ( A ∩ B) N ( A ∩ B) N (S )
P ( B A) = =
N ( A) N ( A) N ( S )
85
P ( A ∩ B)
P ( B A) = (4.14.a)
P ( A)
2) Sebuah kartu dipilih secara acak dari satu dek kartu bridge, dan
ternyata diperoleh kartu Merah.
a) Probabilitas kartu itu Ace adalah:
P ( Ace | Merah )
P (Ace|Merah) =
P ( Merah )
2 52 1
= = = P(Ace)
26 52 13
b) Probabilitas kartu itu ♥ (Hati) adalah:
P ( Hati ∩ Merah ) 13 52 1
P(Hati|Merah) = = =
P ( Merah ) 26 52 2
13 1
≠ P(Hati) = =
52 4
P ( B | A) = P ( B ) (4.15.b)
Contoh 4.9:
1) Sebuah kartu diambil secara acak dari satu dek kartu bridge, lalu
dikembalikan, kartu dikocok kembali, lalu diambil kartu kedua secara
acak (sampling dengan pengembalian).
Misalkan A1 adalah peristiwa ‘diperoleh Ace pada pengambilan
pertama’, dan A2 adalah peristiwa ‘diperoleh Ace pada pengambilan
kedua’, maka:
86
4
P(A1) = P(A2) =
52
4 4
P ( A1 ∩ A2 ) = = P(A1) . P(A2)
52 52
Jadi A1, A2 independen.
2) Dua kartu diambil secara acak dari satu dek kartu bridge, kartu pertama
tidak dikembalikan terlebih dahulu pada pengambilan kartu kedua
(sampling tanpa pengembalian), maka probabilitas kedua kartu adalah
Ace:
P ( A1 ∩ A2 ) = P(A1) . P(A2|A1)
4 3 1 1 1
= = =
52 51 13 17 221
3) Sebuah kotak berisi 100 bola, di antaranya hitam dan 40 sisanya putih.
Di antara 100 bola ini, 70 bernomor 0 dan 30 sisanya bernomor 1.
Diketahui pula 42 bola berwarna hitam dan bernomor 0.
Misalkan sebuah bola diambil secara acak, probabilitas bola itu
bernomor 0 (peristiwa A) dan berwarna hitam (peristiwa B) adalah:
42
P ( A ∩ B) = = 0.42
100
70
P(A) = = 0.7
100
60
P(B) = = 0.6
100
P ( A ∩ B ) = P(A) . P(B), sehingga peristiwa A, B independen.
Seandainya ada 48 bola yang berwarna hitam dan bernomor 0, maka:
48
P ( A ∩ B) = = 0.48
100
≠ P(A) . P(B) = (0.7)(0.6) = 0.42
87
LAMPIRAN 4A: SALING ASING DAN INDEPENDEN
A. Saling asing
Dua peristiwa A dan B dikatakan saling asing jika:
- Keduanya memuat unsur (unsur-unsur) yang seluruhnya berasal dari
satu semesta, dengan kata lain memuat unsur-unsur yang berasal dari
satu ruang sampel.
- Kedua peristiwa tidak memiliki unsur persekutuan.
Contoh:
Pada satu kali pelontaran dadu, semestanya adalah {1, 2, 3, 4, 5, 6}
- Misalkan A = {1, 3, 5} dan B = {2, 4, 6}, maka A dan B saling asing.
- Misalkan pula C = {3, 4, 6}, maka A dan C tidak saling asing.
B. Saling independen
Dua peristiwa A dan B dikatakan saling independen jika:
‾ Unsur-unsur peristiwa berasal dari semesta yang berbeda, dengan kata
lain unsur-unsur pada kedua peristiwa merupakan hasil yang mungkin
pada dua percobaan yang berbeda.
‾ Ruang sampel keduanya dapat digabungkan menjadi satu ruang sampel
‘bersama’.
Contoh:
- Misalkan menyatakan hasil yang diperoleh pada pelontaran sebuah
dadu, A = {1, 2, 3, 4, 5, 6}; B menyatakan hasil pelontaran sebuah mata
uang, B = {Muka, Belakang}, maka A dan B saling independen. Kedua
ruang sampel dapat digabungkan menjadi {(1, Muka), (1, Belakang),
(2, Muka), . . . , (6, Belakang)}.
- Sebuah kotak berisi 6 bola merah dan 4 bola hitam. Dua buah bola
diambil berturut-turut tanpa pengembalian. Misalkan A menyatakan
hasil pada pengambilan bola pertama, A = {Merah, Hitam}, dan B hasil
pada pengambilan bola kedua, tidak saling independen, karena
probabilitas hasil-hasil B tergantung pada hasil peristiwa A. Kedua
88
ruang sampel dapat digabungkan menjadi {(Merah, Merah), (Merah,
Hitam), (Hitam, Merah), (Hitam, Hitam)}.
89
LAMPIRAN 4B: TEOREMA BAYES
Misalkan B merupakan dua peristiwa yang tidak independen dalam
ruang sampel S maka:
P ( A ∩ B)
P(A|B) =
P (B)
P ( A ∩ B)
Dari: P(B|A) =
P ( A)
diperoleh: P ( A ∩ B ) = P(A) . P(B|A)
P ( A) P ( B | A)
sehingga: P(A|B) =
P ( B)
Selain itu denominator (penyebut) P ( B ) dapat dijabarkan menjadi:
(
P(B) = P ( B ∩ A ) + P B ∩ AC )
(hukum probabilitas total)
= P(A) . P(B|A) + P(A ) . P(B|AC)
C
Contoh:
Pada berbagai uji diagnostik di bidang kesehatan umumnya dimiliki
dua parameter, yaitu sensitivitas dan spesifisitas. Sensitivitas adalah
probabilitas bahwa seseorang menunjukkan hasil uji positif dengan syarat ia
sakit (menderita penyakit yang diperiksa dengan uji diagnostik tersebut):
Sn = P ( pos | sakit )
sedangkan spesifisitas adalah probabilitas seseorang menunjukkan hasil uji
negatif dengan syarat ia tidak sakit:
Sp = P ( neg | tidak sakit )
90
Dalam praktik, dengan memperoleh hasil uji positif atau negatif, yang
ingin diketahui ialah probabilitas seseorang menderita penyakit dengan
syarat hasil ujinya positif, yaitu P ( sakit | pos ) ataupun probabilitas
seseorang tidak menderita penyakit dengan syarat hasil ujinya negatif, yaitu
P ( tidak sakit | neg ) . Probabilitas ini dapat dihitung jika diketahui proporsi
penderita penyakit tersebut dalam populasi, yaitu probabilitas tidak bersyarat
untuk menderita penyakit tersebut.
Misalkan suatu uji diagnostik untuk penyakit DM (Diabetes Melitus)
diketahui memiliki sensitivitas sebesar 90% dan spesifisitas 70%, dan
diketahui pula proporsi penderita DM dalam populasi adalah 8%, maka:
Didefinisikan:
A : peristiwa subjek menderita DM
AC : peristiwa subjek sehat (tidak menderita DM)
B : peristiwa subjek menunjukkan hasil uji positif
BC : peristiwa subjek menunjukkan hasil uji negatif dan diketahui
bahwa:
P(B|A) = P ( pos | DM ) = Sn = 0.90
( )
P BC | AC = P ( neg | sehat ) = Sp = 0.70
P ( A) = P ( DM ) = 0.08
Selanjutnya:
( )
P BC | A = P ( neg | DM ) = 1 ‒ Sn = 1 ‒ 0.90 = 0.10
dan: P ( B ) = P ( A ) P ( B A) + P ( A ) P ( B | A )
C C
Sehingga:
P ( A) P ( B A)
P(A|B) =
P ( B)
91
P ( DM ) P ( pos DM )
atau: P ( DM pos ) =
P ( Pos )
=
( 0.08 )( 0.90 ) = 0.2069 = 20.69%
0.348
Kemudian:
P B C = P ( A ) P B C A + P AC P B C AC
( ) ( )
P ( neg ) = P ( DM ) P ( neg DM ) + P ( sehat ) P ( neg sehat )
= (0.08)(0.10) + (0.92)(0.70) = 0.652
Sehingga:
P AC P BC AC
( )
P AC BC
P BC ( )
P ( sehat ) P ( neg sehat )
atau: P ( sehat neg ) =
P ( neg )
=
( 0.92 )( 0.70 ) = 0.9877 = 98.77%
0.652
Maka disimpulkan bahwa seseorang yang hasil ujinya positif hanya
memiliki probabilitas sebesar 20.69% untuk menderita DM, sebaliknya
seseorang yang hasil ujinya negatif memiliki probabilitas sebesar 98.77%
untuk tidak menderita DM.
92
LATIHAN 4
Bagian Pertama
Pilihlah satu jawaban yang paling benar!
A. A ∩ (B ∪ C)
B. AC ∩ (B ∪ C)
C. (A ∩ B) ∪ C
D. (A ∩ B) ∪ (B ∩ C) ∪ (A ∩ C)
93
6. Pada pelontaran sebuah dadu, A menyatakan yang tampak di atas
adalah angka ganjil, B menyatakan yang tampak di atas adalah angka
genap, C menyatakan angka yang tampak di atas lebih besar daripada
5, dan S menyatakan semesta (universe), maka:
A. A ∪ B = S C. B ∪ C = C
B. A ∩ C = S D. B ∩ C = C
1 1 = 1 1 1 = 7
B. 4
3 4 3 D. 7
6 6
36
94
10. Sebuah dadu dan sebuah koin, keduanya setimbang, dilontarkan
bersama-sama. Probabilitas untuk mendapatkan angka lebih besar
daripada 4 pada dadu dan sisi belakang koin bersama-sama adalah:
1 1 4 2 1 5
A. + = C. + =
6 2 6 6 2 6
1 1 1 2 1 1
B. . = D. . =
6 2 12 6 2 6
Bagian Kedua
Pilihlah satu jawaban yang paling benar!
1. Banyaknya bilangan bulat antara 100−1000 dengan tidak ada digit yang
sama adalah:
A. 648 C. 9(P10)
B. 900 D. 10( P 29 )
2
2. Dua belas pertanyaan dalam ujian harus dijawab dengan B (benar) atau
S (salah). Seorang mahasiswa mencoba menjawab secara acak dengan
6 jawaban B dan 6 jawaban S. Ada berapa cara seperti ini?
A. 900 C. 924
B. 920 D. 1000
95
3. Grup A, B, dan C berturut-turut mempunyai 57, 49, dan 43 orang
anggota. A dan B mempunyai 13 anggota bersama; A dan C mempunyai
7 anggota bersama; B dan C 4 anggota bersama; 1 orang anggota dari
ketiga grup. Probabilitas mendapatkan 1 orang anggota ketiga grup
adalah:
1 1
A. C.
126 151
1 1
B. D.
148 160
B.
( 48)(5) D.
C5
48
52
C5 52
96
6. Satu tahun dianggap terdiri atas 365 hari. Probabilitas paling sedikit 2
orang di antara 5 orang mempunyai tanggal lahir yang sama adalah:
1
A.
5
365
1
B. 1−
5
365
C.
( 365)(364)(363)(362)( 361)
5
365
D. 1−
( 365)(364)(363)(362)( 361)
5
365
7.
Tiga kotak; I, II, dan III masing-masing berisi sejumlah bola putih (p)
dan merah (m). Dari kotak I diambil 1 bola, dimasukkan dalam kotak
II. Kemudian dari kotak II diambil 1 bola, dimasukkan ke dalam kotak
III. Selanjutnya 1 bola diambil dari kotak III. Probabilitas untuk
mendapatkan bola merah pada pengambilan ketiga adalah:
416 418
A. C.
630 630
417 419
B. D.
630 630
97
8. Dari 52 kartu bridge diambil setiap kali 1 kartu berturut-turut tanpa
pengembalian. Berapa probabilitas kartu wajik (diamond) tampak
ketiga kalinya pada pengambilan ke-6?
13
C2 C3
39 13
C 2 C3 11
39
A.
C5
52
C.
C5 47
52
13
C 2 C3
39
13 C 2 C3 10
13 39
B.
52 D.
C5 39
52 52
C5
Bagian Ketiga
Selesaikanlah soal-soal berikut!
1. Jika sebuah dadu dilontarkan, dan A = {1, 3}, B = {2, 5, 6}, dan C = {4,
5}, maka:
A. A ∪ B = E. CC =
B. A ∩ B = F. (A ∩ B)C =
C. A ∪ C = G. (B ∪ C)C =
D. A ∩ C = H. (A ∩ C)C =
3. Di antara 600 orang laki-laki dewasa di desa ‘X’, terdapat 6 orang tuna
aksara, sedangkan di antara perempuan dewasanya didapatkan 8 orang
tuna aksara. Jumlah penduduk dewasa di desa ‘X’ adalah 1000 orang.
Jika seorang penduduk dewasa dipilih secara acak dari desa ‘X’,
hitunglah probabilitas bahwa ia laki-laki dengan syarat ia buta huruf.
98
4. Diketahui 3 peristiwa A, B, dan C. A dan B saling independen, B dan C
saling asing. P (A), P (B), dan P (C) masing-masing adalah 0.5, 0.3,
dan 0.1. Nyatakan peristiwa berikut dalam notasi probabilitas dan
hitunglah probabilitasnya:
A. B dan C keduanya terjadi.
B. Paling sedikit salah satu dari A dan B terjadi
C. B tidak terjadi
D. Ketiga peristiwa terjadi
99
BAB 5
DISTRIBUSI TEORETIS
Contoh 5.1:
Percobaan melontarkan mata uang logam tiga kali menghasilkan ruang
sampel berikut:
MMM MMB MBB BBB
S= MBM BMB
BMM BBM
Jika mata uang logam seimbang, delapan unsur ruang sampel memiliki
probabilitas sama besar, masing-masing dengan probabilitas 1/8.
Misalkan variabel random X adalah ‘banyak M dalam tiap unsur’,
maka:
X (MMM) = 3
X (MMB) = X (MBM) = X (BMM) = 2
X (MBB) = X (BMB) = X (BBM) = 1
X (BBB) = 0
Contoh 5.2:
Seorang mahasiswa dipilih secara acak dari kelas yang beranggotakan
30 mahasiswa. Ruang sampelnya terdiri atas 30 mahasiswa, dinyatakan
sebagai S = { a1 , a2 , . . . , a30 }.
Misalkan variabel random Y (a) menyatakan indeks prestasi mahasiswa
a, dan IP mahasiswa a1 = 3.16, IP mahasiswa a2 = 2.43, dan seterusnya,
maka:
100
Y ( a1 ) = 3.16 ; Y ( a2 ) = 2.43 ; dan seterusnya
Suatu variabel random yang hanya dapat menjalani nilai-nilai berbeda
yang banyaknya berhingga (data diskret) disebut variabel random diskret.
Suatu variabel random yang dapat menjalani setiap nilai (tak berhingga
banyaknya) dalam suatu interval (data kontinu) disebut variabel random
kontinu.
Pada contoh 5.1 di atas, X hanya dapat menjalani nilai-nilai dalam
himpunan terhingga {0, 1, 2, 3}. Jadi X adalah variabel random diskret.
Pada contoh 5.2 di atas, Y(a) dapat menjalani setiap nilai yang tak
berhingga banyaknya, antara 0 dan 4, termasuk. Jadi Y (a) adalah variabel
random kontinu.
Distribusi Probabilitas
Lihat kembali hasil tiga kali pelontaran mata uang di atas. Ruang
sampelnya adalah:
MMM MMB MBB BBB
S= MBM BMB
BMM BBM
Dengan asumsi mata uang seimbang, sehingga tiap unsur memiliki
probabilitas sebesar 1/8 untuk terjadi, maka diperoleh distribusi
probabilitas diskret berikut:
101
Nilai Harapan dan Variansi
Rerata suatu variabel random X atau distribusi probabilitasnya,
dinamakan juga nilai harapan X dan dituliskan E [X].
Jika X dapat menjalani nilai-nilai yang mungkin X1 , X 2 , . . . ,
dengan probabilitas masing-masing f ( X i ) = P [X = X i ], maka nilai harapan
X adalah:
n
E [X] = rerata X = µ = ∑
i =1
Xi f ( Xi ) (5.1)
Contoh 5.3:
Misalkan variabel random X menyatakan jumlah anak dalam tiap
keluarga di negara Rusia, dan distribusi probabilitasnya diketahui,
perhitungan nilai harapan X = rerata X dapat dilakukan seperti terlihat pada
tabel 5.2 berikut:
Contoh 5.4:
Dalam suatu permainan dadu yang dinyatakan ‘seimbang’, untuk
bermain satu lemparan, pemain harus membayar C ribu rupiah dan akan
menerima uang (dalam ribuan rupiah) sebanyak titik yang tampak di atas
pada hasil pelemparan dadu tersebut. Misalkan variabel random X
menyatakan jumlah uang (dalam ribuan rupiah) yang diterima pemain,
distribusi probabilitasnya adalah:
102
Tabel 5.3. Distribusi probabilitas jumlah uang yang diterima pemain
pada permainan dadu seimbang
Nilai X 1 2 3 4 5 6
Prob X 1/6 1/6 1/6 1/6 1/6 1/6
E [X] = 1/6 (1 + 2 + 3 + 4 + 5 + 6)
= 3.5 = Rp. 3,500
Maka permainan dapat dinyatakan ‘adil’ jika C = Rp. 3,500, sehingga
banyak uang yang diterima pemain dalam jangka panjang akan sama dengan
banyak uang uang yang dibayar untuk bermain.
Var ( X ) = E [ X − µ ]2 = E X 2 ‒ µ 2 (5.5)
Var ( X ) = E X 2 ‒ ( E [ X ])
2
atau: (5.5.a)
Standar deviasi variabel random X atau distribusi probabilitasnya,
dituliskan SD (X) atau σ , adalah akar variansi variabel random X atau
distribusi probabilitasnya.
Contoh 5.5:
Misalkan variabel random X menyatakan jumlah penjualan HP merek
N per hari. Distribusi probabilitasnya dan perhitungan variansinya
diperlihatkan pada tabel 5.4 berikut:
103
Tabel 5.4. Distribusi probabilitas jumlah penjualan HP merek N
dan perhitungan variansinya
Xi f ( Xi ) Xi f ( Xi ) X i2 f ( X i )
0 0.1 0.0 0.0
1 0.1 0.1 0.1
2 0.2 0.4 0.8
3 0.3 0.9 2.7
4 0.2 0.8 3.2
5 0.1 0.5 2.5
Var ( X ) = E X 2 ‒ ( E [ X ])
2
= 9.3 – (2.7)2 = 2.01
SD (X) = 2.01 = 1.42
Dengan transformasi:
X − µx
Z= (5.10)
σx
maka variabel random X dengan rerata µ x dan standar deviasi σ x menjadi
variabel random Z yang mempunyai rerata 0 dan standar deviasi 1. Variabel
random Z ini dinamakan variabel random standar.
E (Z) = 0 (5.10.a)
Var (Z) = 1 (5.10.b)
104
Contoh 5.6:
Misalkan variabel random X menyatakan banyak penjualan HP merek
N per hari dan variabel random Y menyatakan keuntungan bersihnya sebagai
fungsi X:
Y = 5,000 X – 2,000
Maka: E [Y] = E [5,000 X – 2,000]
= 5,000 E [X] – 2,000
= (5,000)(2.7) – 2,000 = 11,500
Var (Y) = Var [5,000 X – 2,000]
= 5,0002 Var (X)
= (5,0002)(2.01) = 50,250,000
SD (Y) = 50, 250, 000 = 7,088.72
105
Diagram 5.1. Contoh grafik distribusi uniform
Distribusi Binomial
Distribusi binomial dapat dianggap sebagai hasil percobaan yang
diulang-ulang, yang memenuhi syarat sebagai ‘Bernoulli trials’.
Contoh 5.7:
Misalkan dilakukan Bernoulli trials sebanyak n kali, dengan
probabilitas sukses p pada tiap percobaan. Variabel random X menyatakan
banyak sukses dalam n kali percobaan tersebut, maka distribusi probabilitas
X dikatakan berdistribusi binomial dengan n kali percobaan dan probabilitas
sukses p.
Misalkan dilakukan n = 4 kali percobaan, maka semua hasil yang
mungkin adalah sebagai berikut:
106
TTTT TTTS SSTT SSST SSSS
TTST STST SSTS
TSTT STTS STSS
STTT TSST TSSS
TSTS
TTSS
Distribusi probabilitasnya diperlihatkan pada tabel 5.5 berikut:
0 C04 = 1 p0 q4 = q4
1 C14 = 4 p1 q 3 = p q 3
2 C24 = 6 p 2 q2
3 C34 = 4 p 3 q1 = p 3 q
4 C44 = 1 p4 q0 = p4
P (X = x) = Cxn p x q n − x ; x = 0, 1, . . . , n (5.13)
107
Contoh 5.8:
Sepasang suami isteri yang baru menikah merencanakan untuk
memperoleh empat orang anak. Jika rencananya mungkin terlaksana dan
diketahui probabilitas untuk memperoleh anak laki-laki dalam tiap kelahiran
adalah 0.51, maka:
a. Probabilitas untuk memperoleh empat orang anak laki-laki:
P (X = 4) = C44 p 4
= (1)(0.514) = 0.0677
b. Probabilitas untuk memperoleh tiga orang anak laki-laki:
P (X = 3) = C34 p 3 q
= (4)(0.513)(0.49) = 0.2600
c. Probabilitas untuk memperoleh dua orang anak laki-laki:
P (X = 2) = C24 p 2 q 2
= (6)(0.512)(0.492) = 0.3747
d. Probabilitas untuk memperoleh paling sedikit dua orang anak laki-laki:
P (X > 2) = P (X = 2) + P (X = 3) + P (X = 4)
= 0.3747 + 0.2600 + 0.0677 = 0.7024
Nilai-nilai probabilitas distribusi binomial dapat dilihat tabel
probabilitas binomial (Addendum B1). Untuk menjelaskan
penggunaannya, diperlihatkan cuplikan tabel binomial pada tabel 5.6 berikut.
Misalnya:
• Untuk n = 2 dan p = 0.01 : P (X = 1) = 0.0198
• Untuk n = 3 dan p = 0.40 : P (X = 2) = 0.2880
• Untuk n = 25 dan p = 0.99 P (X = 25) = 0.778
Kebanyakan tabel binomial tidak menyajikan nilai-nilai probabilitas
untuk p > 0.50.
Perhatikan bahwa:
P (X = x | p) = P (X’ = n – x | p’ = 1 – p);
yaitu probabilitas untuk mendapatkan x kali sukses P (X = x) adalah sama
dengan probabilitas untuk mendapatkan (n – x) kali sukses P (X’ = n – x) dari
percobaan dengan n yang sama dan probabilitas sukses baru p’ = 1 – p.
108
Tabel 5.6. Cuplikan tabel distribusi binomial [P (X = x)]
p
n X
01 0.05 ... 0.40 ... 0.95 .99
2 0 .9801 ... .3600 ... .0001
1 .0198 ... .4800 ... .0198
2 .0001 ... .1600 ... .9801
Misalnya:
• Jika n = 2, P (X = 0) = 0.0001 untuk p = 0.99, bernilai sama dengan:
P (X = 2) = 0.0001 untuk p = 0.01
• Jika n = 2, P (X = 2) = 0.9801 untuk p = 0.9, bernilai sama dengan:
P (X = 0) = 0.9801 untuk p = 0.01
• Jika n = 3, P (X = 2) = 0.0294 untuk p = 0.99, bernilai sama dengan:
P (X = 1) = 0.0294 untuk p = 0.01
Nilai-nilai probabilitas distribusi binomial dapat pula disajikan secara
kumulatif, yaitu P (X < x) dalam bentuk tabel binomial kumulatif
(Addendum B2).
109
Tabel 5.7. Cuplikan tabel distribusi binomial kumulatif P (X < x):
p
n X
.01 .05 ... .40 ... .95 .99
2 0 .9801 ... .3600 ... .0001
1 .9999 ... .8400 ... .0199
2 .1000 ... .1000 ... .1000
. .
. .
. .
Misalnya:
• Untuk n = 2 dan p =0.01 :
P (X = 1) = P (X < 1) – P (X = 0)
= 0.0000 – 0.9801 = 0.0198
• Untuk n = 3 dan p = 0.40 :
P (X = 2) = P (X < 2) – P (X < 1)
= 0.9360 – 0.6480 = 0.2880
• Untuk n = 25 dan p = 0.99 :
P (X = 25) = P (X < 25) – P (X < 24)
= 1.00 – 0.222 = 0.778
110
Distribusi Hipergeometrik
Sampel dengan dan tanpa pengembalian:
Pengembalian sampel dapat dilakukan dengan atau tanpa
pengembalian. Pada sampling (pengambilan sampel) dengan pengembalian
(with replacement), tiap anggota sampel yang terpilih dikembalikan ke dalam
‘himpunan calon anggota sampel’ untuk pemilihan anggota sampel
berikutnya, sehingga tiap anggota populasi dapat terpilih lebih daripada satu
kali (ataupun tidak terpilih) untuk menjadi anggota sampel.
Pada sampling tanpa pengembalian (without replacement), tiap
anggota sampel yang terpilih dikeluarkan dari ‘himpunan calon anggota
sampel’ untuk pemilihan anggota sampel berikutnya, sehingga tiap anggota
populasi hanya mungkin terpilih satu kali (ataupun tidak terpilih) untuk
menjadi anggota sampel.
Pengambilan sampel dengan pengembalian dari populasi yang
memiliki karakteristik yang bersifat biner (dikotomi) akan menghasilkan
distribusi binomial, sedangkan pengambilan sampel tanpa pengembalian
dari populasi yang memiliki karakteristik biner menghasilkan distribusi
hipergeometrik.
Contoh 5.9:
Sebuah berisi 6 bola merah (M) dan bola hitam (H). Dari kotak
tersebut, dikeluarkan sebuah bola secara acak tiga kali berturut-turut.
Probabilitas untuk mendapatkan bola merah atau hitam pada tiap kali
pengambilan, baik pada sampling dengan ataupun tanpa pengembalian
diperlihatkan pada diagram 5.3.
Pada sampling dengan pengembalian, komposisi isi kotak selalu tetap
6 bola merah dan 4 bola hitam, probabilitas untuk mendapatkan bola merah
selalu tetap berupa P (M) = 6/10 dan probabilitas untuk mendapatkan bola
hitam selalu tetap berupa P (H) = 4/10. Probabilitas untuk mendapatkan x
bola merah (atau n – x bola hitam) pada n kali pengambilan sampel dengan
pengembalian dapat dihitung dengan menggunakan distribusi binomial.
Pada sampling tanpa pengembalian, probabilitas untuk mendapatkan
bola merah (atau bola hitam) pada tiap kali pengambilan akan selalu
berubah, karena komposisi isi kotak akan selalu berubah, sesuai dengan hasil
yang diperoleh pada pengambilan sebelumnya. Probabilitas untuk
mendapatkan x bola merah (atau n – x bola hitam) pada n kali pengambilan
sampel tanpa pengembalian dapat dihitung dengan menggunakan distribusi
hipergeometrik.
111
Diagram 5.3. Skema probabilitas hasil tiap percobaan pada sampling dengan dan tanpa pengembalian
112
Contoh 5.10:
Misalkan dalam sebuah populasi yang beranggotakan N = 1000
terdapat 300 orang perokok (= R) dan 700 orang bukan perokok (= R ).
Apabila dipilih 2 orang secara acak di antara anggota populasi, maka
probabilitas untuk mendapatkan perokok pada kedua kali memilih
anggotanya secara acak tersebut adalah:
a. Sampling dengan pengambilan:
- Memilih anggota pertama: terdapat 300 orang perokok di antara 1000
anggota populasi. Probabilitas untuk memperoleh perokok adalah
P ( R ) P (R) = 300/1000 = 0.30
- Memilih anggota kedua: Tak tergantung hasil pemilihan pertama,
karena selalu akan dikembalikan kedalam populasi, pada pemilihan
kedua terdapat 300 orang perokok di antara 1000 anggota populasi.
Probabilitas untuk memperoleh adalah P (R) = 300/1000 = 0.30
113
R R N
300 700 1000
n = 2:
Dengan pengembalian Tanpa pengembalian
300 300
1) P (R) = = 0.3000 1) P (R) = = 0.3000
1000 1000
Contoh 5.11:
a N–a N
10 40 50
114
Untuk soal a. :
C010C340 C110C240
P (X = 0) = P (X = 1) =
C350 C350
C210C140 C310C040
P (X = 2) = P (X = 3) =
C350 C350
Untuk soal b. :
C010C1540
C110C1440
P (X = 0) = 50 P (X = 1) = 50
C15 C15
C210C1340
C310C1240
P (X = 2) = 50 P (X = 3) = 50
C15 C15
dan seterusnya.
C xa CnN−−xa
P (X = x) = (5.14)
CnN
x = 0, 1, . . . , n jika n < a
= 0, 1, . . . , a jika n > a
115
Dalam praktik, pengambilan sampel tanpa pengembalian dapat
diasumsikan berdistribusi binomial jika N besar dan N >> n.
Nilai-nilai probabilitas hipergeometrik juga dapat dilihat pada tabel
probabilitas hipergeometrik, walaupun tidak semua buku-buku Statistika
melampirkannya. Cuplikan tabel tersebut dapat dilihat pada tabel 5.8 berikut.
116
Diagram 5.5. Grafik distribusi hipergeometrik (a = 20, N = 1000, n =
100) dan distribusi binomial (p = 0.02, n = 100)
Distribusi Poisson
Variabel random binomial X diasumsikan berdistribusi Poisson
(dibaca: pwa-song’) jika n sangat besar dan p sangat kecil (mendekati 0),
sehingga hasil perkalian n dan p bersifat konstan dan nilainya tidak terlalu
besar.
n p = λ (konstan)
Distribusi probabilitas distribusi Poisson adalah:
e −λ λ x
P (X = x) = (5.15)
x!
e = 2.71828 (bilangan pokok log naturalis)
Rerata X = Var (X) = λ (5.15.a)
Contoh 5.12:
Suatu proses produksi memiliki probabilitas 2% untuk menghasilkan
produk cacat. Jika yang diperiksa adalah 100 produk, maka:
p = 0.02 n = 100
117
λ = np = (100)(0.02) = 2
e −λ λ x
P (X = x) =
x!
e−2λ 0
P (X = 0) = = 0.135
0!
e−2λ1
P (X = 1) = = 0.271
1!
e−2λ 2
P (X = 2) = = 0.271
2!
Nilai-nilai probabilitas Poisson juga dapat diperoleh dari tabel
probabilitas Poisson, yang cuplikannya diperlihatkan pada tabel 5.9.
λ
X
.01 .02 ... 2 ... 19 20
0 .9048 .8187 ... .1353 ... .0000 .0000
1 .9005 .1637 ... .2707 ... .0000 .0000
2 .0045 .0164 ... .2707 ... .0000 .0000
. . . . . .
. . . . . .
. . . . . .
38 .0000 .0000 ... .0000 ... .0000 .0001
39 .0000 .0000 ... .0000 ... .0000 .0001
118
Diagram 5.6. Contoh beberapa grafik distribusi Poisson dengan
berbagai nilai rerata (= λ)
119
Diagram 5.7. Grafik fungsi probabilitas distribusi homogen
Distribusi Normal
Variabel random kontinu X dikatakan berdistribusi normal (distribusi
Gauss) dengan rerata µ dan variansi σ 2 , jika variabel itu mempunyai fungsi
probabilitas yang berbentuk:
1
( x − µ )2
1 2
f (x) = e 2σ ; −∞ < x < ∞ (5.17)
2
2πσ
120
2
Diagram 5.8. Kurva normal X dengan rerata µ dan variansi σ
121
Diagram 5.9. Luas area kurva normal antara x = a dan x = b
122
Diagram 5.11.a. Kurva normal dengan variansi yang sama, namun
rerata berbeda: µ1 < µ2 < µ3
1 2
1 z
f (z) = e2 ; −∞< x < ∞ (5.20)
2π
123
Diagram 5.12. Transformasi variabel random normal X dengan µ = 50
dan σ2 menjadi variabel random normal standar Z
Beberapa luas area pada kurve normal standar Z (lihat diagram 5.13):
P [–1 < Z < +1] ≈ 68% )
P [–2 < Z < +2] ≈ 95% ) (5.21)
P [–3 < Z < +3] ≈ 99% )
124
Tabel 5.10. Cuplikan salah satu bentuk tabel Z [P (0 < Z < z)]
125
• P [|Z| < 3.00] = (2)(0.4987) = 0.9974
• P [0.00 < Z < 1.96] = 0.4750
• P [|Z| < 1.96] = (2)(0.4750) = 0.9500
Dapat dibalik: Jika A = 95%, maka |Z| < 1.96 (dengan syarat A simetris
terhadap sumbu vertikal)
• P [|Z| < 1.64] = (2)(0.4495) = 0.8990 ≈ 0.9000
Dapat dibalik: Jika A = 99%, maka |Z| < 1.64 (dengan syarat A simetris
terhadap sumbu vertikal)
• P [1.00 < Z < 2.00] = P [0.00 < Z < 2.00] – P [0.00 < Z < 1.00]
= 0.4772 – 0.3413 = 0.1359
• P [−1.00 < Z < 2.00] = P [−1.00 < Z < 0.00] + P [0.00 < Z < 2.00]
= P [0.00 < Z < 1.00] + P [0.00 < Z < 2.00]
= 0.3413 + 0.4772 = 0.8185
Untuk aplikasi tabel Z pada perhitungan bagi variabel random X yang
berdistribusi normal, transformasikan terlebih dahulu nilai-nilai X menjadi
nilai Z:
X −µ
Z=
σ
sebaliknya pada akhir perhitungan, nilai-nilai Z dapat ditransformasikan
kembali ke nilai X:
X=µ+Zσ
Contoh 5.13:
Nilai-nilai ujian seleksi penerimaan mahasiswa baru secara nasional
dianggap berdistribusi normal dengan rerata 45 dan standar deviasi 13. Jika
hanya 32.5% calon mahasiswa yang akan diterima, berapakah nilai terendah
calon mahasiswa yang diterima?
Misalkan variabel random normal X menyatakan nilai-nilai ujian
seleksi penerimaan mahasiswa baru, maka X ~ N (45 ; 13). Jika x
menyatakan nilai terendah calon mahasiswa yang diterima, maka:
P [X > x] = 0.325
Dengan menggunakan tabel Z serta interpolasi linear (lihat Lampiran
5D dan 5E), diperoleh bahwa untuk luas area sebesar 0.325 pada sisi kanan
distribusi Z, nilai z-nya adalah 0.4538, sehingga:
P [Z > 0.4538] = 0.325
126
Dari transformasi standar Z = ( X − µ ) σ diperoleh:
x=µ+zσ
dan: x = 45 + (0.4538)(13) = 50.90
Contoh 5.14:
Usia hidup rata-rata elemen kering merek PQR adalah 300 jam
dengan standar deviasi 35 jam. Dengan asumsi bahwa distribusi usia hidup
elemen kering itu mendekati distribusi normal, hitunglah:
a. Berapa persen elemen kering merek PQR yang usia hidupnya kurang
daripada 225 jam?
b. Berapa persen elemen kering merek PQR yang usia hidupnya
kurangnya daripada 350 jam?
Misalkan variabel random normal X menyatakan usia hidup rata-rata
elemen kering merek PQR, maka X ~ N (300 ; 35), maka proporsi elemen
kering merek PQR yang usia hidupnya kurang daripada 225 jam dapat
dinyatakan sebagai:
P (X < 225)
yang dengan transformasi standar dapat diubah menjadi:
225 − 300
PZ < = P (Z < −2.14)
35
yang bernilai sama dengan:
P (Z > 2.14) = 0.5000 – P (0 < Z < 2.14)
= 0.5000 – 0.4838 = 0.0162 ≈ 1.62%
Proporsi elemen kering merek PQR yang usia hidupnya kurang
daripada 350 jam dapat dinyatakan sebagai:
P (X < 350)
yang dengan transformasi standar dapat diubah menjadi:
350 − 300
PZ < = P (Z < 1.43)
35
= 0.5000 + P (0 < Z < 1.43)
= 0.5000 + 0.4236 = 0.9236 = 92.36%
Distribusi t
Distribusi t (Student’s t) digunakan untuk sampel berukuran kecil (n
< 30). Gambaran kurvanya menyerupai distribusi Z, namun memiliki ekor
127
yang lebih tebal (sebaran nilai yang lebih besar) daripada distribusi Z (lihat
diagram 5.14).
Kurvanya / variansinya dapat berubah-ubah sesuai nilai ‘derajat
bebas’-nya (db; df; degree of freedom), yaitu db = n – 1. Pada db > 30,
distribusi t dapat dianggap sama dengan distribusi Z.
Nilai-nilai untuk distribusi t dapat dilihat pada tabel (lihat contoh
cuplikan pada tabel 5.11).
128
Tabel 5.11. Cuplikan salah satu bentuk tabel t [α = P (t > tα)]:
Perhatikan:
o Secara matematik, distribusi t baru akan sama dengan distribusi Z pada n
= ∞ , namun secara praktis keduanya sudah dapat dianggap sama pada n
= 30 (n = 50).
o Pada tabel t, badan tabel memuat nilai t dan luas area tercantum pada sisi
atas tabel (pada tabel Z, badan tabel memuat luas area, nilai Z diperoleh
dari sisi kiri dan atas tabel).
o Sesuai kebutuhan, tabel t hanya memuat nilai-nilai t untuk luas area kecil
(10% atau kurang).
Contoh 5.15:
Lihat tabel t satu sisi (satu ekor, one-tail). Tampak bahwa untuk db
11 dan luas area 0.05, nilai t adalah 1.796 atau:
t(11;0.05) = 1.796
129
yang dalam konteks probabilitas berarti bahwa:
P [ t(11) > 1.796] = 0.05
Jika digunakan tabel t dua sisi (dua ekor, two-tails), nilai t sebesar
1.796 dengan db 11 akan diperoleh untuk luas area 0.10, atau:
t(11;0.10) = 1.796
karena yang dimaksud dengan luas area pada tabel t dua sisi adalah:
P [| t(11) | > 1.796] = 0.10
130
Diagram 5.15. Pendekatan normal untuk distribusi binomial dengan p =
0.5. Atas: n = 6; tengah: n = 10; bawah: n = 14
131
Pada pendekatan normal untuk binomial ini biasa digunakan ‘koreksi
kontinuitas’ (karena nilai-nilai diskret pada distribusi binomial), yaitu:
o P (X = c) ≈ P (c – 0.5 < X < c + 0.5) )
o P (X < c) ≈ P (X < c + 0.5) ) (5.23)
o P (X > c) ≈ P (X > c − 0.5) )
Contoh 5.16:
Delapan puluh persen mahasiswa Psikologi Gunadarma adalah
wanita. Jika 50 orang mahasiswa Psikologi Gunadarma dipilih secara acak,
maka probabilitas bahwa sekurang-kurangnya 35 orang di antaranya adalah
wanita dapat dihitung dengan pendekatan normal untuk binomial (tanpa
korelasi kontinuitas).
n = 50 p = 0.80 q = 1 – p = 0.20
x − np
P (X > x) = P Z ≥
npq
35 − ( 50 )( 0.80 )
P (X > x) = P Z ≥
( 50 )( 0.80 )( 0.20 )
= P (Z > −1.7778)
= P (−1.7778 < Z < 0) + P (Z > 0)
= 0.4614 + 0.5000 = 0.9614
Contoh 5.17:
Misalkan untuk data pada contoh 5.16 di atas hendak dihitung P (X =
35):
• Dengan ‘koreksi kontinuitas’ pada pendekatan normal:
P (X = c) ≈ P (c – 0.5 < X < c + 0.5)
P (X = 35) ≈ P (34.5 < X < 35.5)
34.5 − 40 35.5 − 40
=P <Z<
8 8
= P (−1.9445 < Z < −1.5910)
= P (1.5910 < Z < 1.9445)
= 0.4741 – 0.4442 = 0.0299
132
• Dengan ‘cara eksak’ (menggunakan distribusi binomial):
P (X = x) = C xn p x q n − x
50
P (X = 35) = C35 ( ) ( 0.2 )
0.835 15
= 0.0299
133
LAMPIRAN 5A: RANGKUMAN PARAMETER DISTRIBUSI PROBABILITAS
A. DISTRIBUSI PROBABILITAS DISKRET
134
B. DISTRIBUSI PROBABILITAS KONTINU
135
LAMPIRAN 5B: BEBERAPA CONTOH PENGGUNAAN
DISTRIBUSI PROBABILITAS DISKRET
P [X = x] = C xn p x q n − x
n
P [X > x] = ∑
i= x
Cxn p x q n − x
= P [X = 6] + P [X = 7] + P [X = 8] + P [X = 9] + P [X = 10]
= 0.1115 + 0.0425 + 0.0106 + 0.0016 + 0.0001 = 0.1663
Probabilitas bahwa kurang daripada separuhnya membayar iuran
adalah:
4
P [X < 4] = ∑
i =0
Ci10 0.4i 0.610 − i
= P [X = 0] + P [X = 1] + P [X = 2] + P [X = 3] + P [X = 4]
= 0.0060 + 0.0403 + 0.1209 + 0.2150 + + 0.2508 = 0.6330
3. Sebuah kapal penangkap ikan rata-rata mendapat tiga ekor ikan dalam
lima hari.
Beberapa probabilitas penangkapan:
a. Dua ekor ikan dalam tiga hari.
b. Sekurang-kurangnya tiga ekor ikan dalam dua hari.
Jumlah ikan yang ditangkap berdistribusi Poisson dengan rerata λ = 3
untuk periode 5 hari.
a. Untuk periode 3 hari, nilai rerata berubah menjadi:
3
λ’ = λ
5
= (0.6)(3) = 1.8
137
e−1.8 1.82
P [X = 2] = = 0.2678
2!
b. Untuk periode 2 hari, nilai rerata berubah menjadi:
2
λ” = λ
5
= (0.4)(3) = 1.2
P [X > 3] = 1 − P [X < 2]
= 1 – [P (X = 0) + P (X = 1) + P (X = 2)]
= 1 – [0.3012 + 0.3614 + 0.2169]
= 0.1205
138
LAMPIRAN 5C: NILAI STANDAR (NILAI BAKU,
VARIABEL STANDAR Z)
Variabel standar Z
adalah variabel dengan nilai mean nol ( µ z = 0) dan standar deviasi
satu ( σ z = 1). Setiap variabel X dapat ditransformasikan menjadi variabel
standar Z dengan menggunakan rumus:
X − µx
Z=
σx
Jika nilai µ x dan σ x tidak diketahui, digunakan nilai penaksirnya
X −x
(estimatornya), yaitu x dan s x , sehingga Z = .
sx
Contoh:
Lihat data BB lima orang mahasiswa pertama kelas 2PA01 TA
3003/2004 (dalam kg): 50, 56, 47, 45, 54.
2
n=5 ∑ xi = 252 ∑ xi = 12,786
∑ xi
x =
n
252
= = 50.4
5
2 ( ∑ xi )2
∑ xi −
sx = n
n −1
2522
12, 786 −
= 5 = 4.62
5 −1
50 − 50.4
x1 = 50 ⇒ z1 = = −0.09
4.62
56 − 50.4
x2 = 56 ⇒ z2 = = 1.21
4.62
139
47 − 50.4
x3 = 47 ⇒ z3 = = −0.74
4.62
47 − 50.4
x4 = 45 ⇒ z4 = = −1.17
4.62
54 − 50.4
x5 = 54 ⇒ z5 = = 0.78
4.62
140
LAMPIRAN 5D: BEBERAPA CONTOH
PENGGUNAAN DISTRIBUSI NORMAL
Luas area antara X1 = 58 dan X 2 = 86.3 adalah sama dengan luas area
antara Z1 = 0.53 dan Z 2 = 2.42, atau:
P (58 < X < 86.3) = P (0.53 < Z < 2.42)
= P (0 < Z < 2.42) − P (0 < Z < 0.53)
= 0.4922 – 0.2019 = 0.2903
Luas area di sisi kanan X1 = 72 adalah sama dengan luas area di sisi
kanan Z1 = 1.09 atau:
P (X > 72) = P (Z > 1.09)
= P (0 < Z < ∞ ) – P (0 < Z < 1.09)
= 0.5000 – 0.3621 = 0.1379
141
3. X berdistribusi normal dengan rerata µ = 75 dan standar deviasi σ = 14.
Hitunglah luas area kurve normal di sisi kanan X1 = 70.
70 − 75
Z1 = = −0.36
14
Luas area di sisi kanan adalah sama dengan luas area di sisi kanan
Z1 = −0.36, atau:
P (X > 70) = P (Z > −0.36)
= P (−0.36 < Z < 0) + P (0 < Z < ∞)
= 0.1406 + 0.5000 = 0.6406
142
LAMPIRAN 5E: INTERPOLASI LINEAR
Interpolasi linear digunakan untuk pembacaan tabel probabilitas
kontinu X secara lebih akurat jika dimiliki nilai x yang terletak di antara dua
nilai berurutan x1 dan x2 yang ada pada tabel (yang masing-masing
bersesuaian dengan luas area A1 dan A 2 ) dan akan ditentukan luas areanya
A yang nilainya berada di antara luas area A1 dan A 2 .
Salah satu dalil planimetri (ilmu ukur bidang) menyatakan: Jika pada
segitiga sebarang ABC, DE sejajar dengan alas BC, maka AD : AB = AE :
AC (lihat diagram V.1).
143
Jika yang diketahui adalah A dan yang dicari adalah nilai x, maka:
A − A1
x = x1 + ( x2 − x 1 )
A 2 − A1
Yang dimaksud dengan tabel probabilitas X di sini dapat berupa tabel
Z, tabel t, ataupun tabel probabilitas kontinu lainnya.
Contoh:
1. Misalkan hendak dicari nilai z untuk luas area A = P (0 < Z < z) =
0.4000. Dari tabel Z yang bersesuaian diperoleh:
z A
1.28 0.3997
1.29 0.4015
Maka nilai z yang bersesuaian untuk A = 0.4000 adalah:
A − A1
z = z1 + ( z2 − z1 )
A 2 − A1
0.4000 − 0.3997
= 1.28 + (1.29 – 1.28) = 1.2817
0.4015 − 0.3997
144
LATIHAN 5
Bagian Pertama
Pilihlah satu jawaban yang paling benar !
145
6. Jika diasumsikan bahwa probabilitas untuk memperoleh anak laki-laki
pada tiap kelahiran adalah 0.50, maka probabilitas untuk memperoleh
paling sedikit 2 orang anak perempuan pada pasangan suami isteri baru
yang merencanakan untuk memperoleh 4 orang anak adalah:
A. 0.0625 C. 0.3125
B. 0.25 D. 0.6875
A. p = 0.25 ; n = 3 C. p = 0.75 ; n = 3
B. p = 0.5 ; n = 3 D. p = 0.5 ; n = 2
10. Pada pengambilan sampel tanpa pengembalian yang ditarik dari suatu
populasi berhingga, perhitungan probabilitasnya secara eksak
didasarkan atas asumsi distribusi:
A. Binomial C. Poisson
B. Hipergeometrik D. Normal
146
11. Dalam sebuah kotak terdapat 12 bola, 5 putih, 4 merah, dan sisanya
kuning. Tiga buah bola diambil secara acak tanpa pengembalian.
Probabilitas bahwa ketiga bola yang terambil semuanya tidak merah
adalah:
A. C812 C711 C610 C. A) dan B) benar
C38 C04
B. D. A) dan B) salah
C312
16. Jumlah rata-rata panggilan telepon yang masuk ke sebuah kantor tiap
menit pada jam kerja adalah 2.5. Probabilitas bahwa akan didapatkan
tiga panggilan pada suatu menit tertentu dalam jam kerja adalah:
A. 0.142 C. 0.544
B. 0.214 D. 0.758
147
17. Jumlah rata-rata konsultasi yang diterima oleh guru BP di SMU
‘Santai’ adalah tiga kasus per minggu. Probabilitas bahwa pada minggu
depan hanya akan didapatkan dua kasus konsultasi adalah:
A. 0.149 C. 0.224
B. 0.199 D. 0.423
19. Jika pada suatu distribusi diketahui bahwa rerata, median, dan
modusnya berimpit, maka distribusi tersebut:
A. Belum tentu berdistribusi normal
B. Pasti berdistribusi normal
C. Menceng ke kiri.
D. Menceng ke kanan.
22. Jika X berdistibusi normal dengan mean 30 dan variansi 25, maka
probabilitas bahwa 25 < X < 37.5 adalah (menggunakan tabel):
A. 0.0919 C. 0.4332
B. 0.3413 D. 0.7745
148
Untuk soal No. 23 dan 24:
Misalkan nilai-nilai ujian akhir semester mahasiswa Gunadarma
dapat dianggap berdistribusi normal dengan mean 65 dan variansi 100.
23. Jika ambang nilai batang lulus ditetapkan sebesar 55, maka persentase
mahasiswa yang tidak lulus adalah:
A. 4.0 % C. 34.1 %
B. 15.9 % D. 46.0 %
24. Jika diputuskan bahwa 10% mahasiswa terbaik nilai ujian akhir
semesternya akan diberikan beasiswa pada semester berikutnya, maka
nilai terendah yang mendapatkan beasiswa adalah:
A. 67.5 C. 81.4
B. 77.8 D. 85.0
149
Bagian Kedua
Pilihlah satu jawaban yang paling benar!
Nilai X 0 1 2 3
Probabilitas X 0.2 0.4 0.3 0.1
3. Jika keuntungan bersih untuk tiap penjualan mobil rata-rata sebesar Rp.
5,000,000, nilai harapan keuntungan bersih show-room Kartika per
minggu adalah:
A. Rp. 4,050,000 C. Rp. 6,500,000
B. Rp. 4,500,000 D. Rp. 12,500,000
Banyak 1 2 3 4 5 6
titik
X −3 −2 −1 1 2 3
P (X) 1/6 1/6 1/6 1/6 1/6 1/6
150
4. Nilai harapan X adalah:
2
A. E (X) = µ = 0 C. E (X) = µ = 4
3
B. E (X) = µ = 3.5 D. Semuanya salah
6. Variansi X adalah:
A. Var (X) = E ( X 2 ) − µ 2 = 0
B. Var (X) = E ( X 2 ) − µ 2 = 3.5
2
C. Var (X) = E ( X 2 ) − µ 2 = 4
3
D. Semuanya salah
Bagian Ketiga
Selesaikanlah soal berikut:
151
BAB 6
SAMPLING
6.1 DISTRIBUSI SAMPLING
Distribusi Sampling Nilai Rerata
Misalkan dimiliki populasi dengan N = 3;
X1 = 3 X2 = 6 X3 = 8
µ x = µ = 5.67 σ x2 = σ 2 = 4.22
Misalkan pula dilakukan pengambilan sampel secara acak dengan n =
2. Kemungkinan sampel yang diperoleh adalah:
• Sampling dengan pengembalian (jumlah kemungkinan sampel = N n =
32 = 9):
( x1; x1 ) ( x1; x2 ) ( x1; x3 )
( x2 ; x1 ) ( x2 ; x2 ) ( x2 ; x3 )
( x3 ; x1 ) ( x3 ; x2 ) ( x3 ; x3 )
Rerata-nya masing-masing adalah:
x(1a ) = 3 x( 2 a ) = 4.5 x( 3a ) = 5.5
x( 4 a ) = 4.5 x( 5 a ) = 6 x( 6 a ) = 7
x( 7 a ) = 5.5 x( 8 a ) = 7 x( 9 a ) = 8
152
Kumpulan rerata semua kemungkinan sampel demikian pada
sampling dengan pengembalian:
{x( 1a )
, x( 2 a ) , x( 3 a ) , x( 4 a ) , x( 5 a ) , x( 6 a ) , x( 7 a ) , x(8 a ) , x( 9 a ) }
ataupun apada sampling tanpa pengembalian:
{x( 1b )
, x 2 b , x 3b
( ) ( ) }
dinamakan distribusi sampling nilai rerata dengan rerata:
µx atau E(X )
dan variansi:
σ x2 atau Var ( X )
Standar deviasinya σ x atau SD (X) dinamakan juga standard error (x) =
SE ( X ) .
153
Sifat ini hanya berlaku pada sampling dengan pengembalian. Jika
dilakukan sampling tanpa pengembalian, maka rerata-nya adalah:
µx = E ( X ) = µ (6.5)
variansi-nya:
σ 2 ( N − n)
σ x2 = Var ( X ) = (6.6)
n ( N − 1)
dan standar deviasi-nya:
σ x = SE ( X ) =
σ ( N − n) (6.7)
n ( N − 1)
Tetapi jika N relatif jauh lebih besar daripada n, maka pada sampling
tanpa pengembalian dapat dianggap berlaku rerata:
µx = E ( X ) = µ
dan variansi:
σ2
σ x2 = Var ( X ) ≈
n
Perhatikan:
1. Distribusi sampel, jika n cukup besar dan pengembalian sampel
dilakukan secara acak, umumnya akan mendekati distribusi populasinya.
2. Jika ukuran sampel n cukup besar (n > 30), distribusi sampling nilai
rerata dapat dianggap berdistribusi normal (apa pun bentuk distribusi
x −µ
populasinya; lihat diagram 6.1), transformasi bakunya maupun
σ n
x −µ
transformasi (jika σ tak diketahui) selalu berdistribusi normal
s n
standar.
3. Jika ukuran sampel n lebih kecil daripada 30 dan populasinya
berdistribusi normal, distribusi sampling nilai rerata selalu berdistribusi
normal (tak tergantung besar nilai n ; sedangkan transformasi baku
x −µ x −µ
berdistribusi normal standar dan transformasi (jika σ tak
σ n s n
diketahui) berdistribusi t dengan derajat bebas (n – 1).
154
Diagram 6.1. Teorema limit pusat: distribusi x untuk berbagai
populasi dan ukuran sampel
Rangkuman hubungan antara distribusi parental (distribusi populasi) X,
distribusi sampling X , dan distribusi transformasi X diperlihatkan pada
matriks 1 Lampiran 6A.
Contoh 6.1:
Nilai ujian nasional lulusan SMU di Yogyakarta untuk mata pelajaran
matematika mempunyai rerata 41.4 dan variansi 84.64. Apabila dipilih 40
orang lulusan SMU tersebut secara acak, hitung probabilitas bahwa rerata
sampelnya terletak:
a. Antara 40 dan 45
b. Lebih besar daripada 45.
µ = 41.4 σ 2 = 84.64 n = 40
µ x = µ = 41.4
σ2 84.64
σ x2 = = = 2.116
n 40
σx = 2.116 = 1.45
( 40 − 41.5) ( 45 − 41.5)
a. P [40 < X < 45] = P <Z<
1.45 1.45
= P [‒1.30 < Z < 2.41]
= 0.3485 + 0.4920 = 0.8405
b. P [ X > 45] = P [Z > 2.41]
= 0.5 – 0.4920 = 0.0080
155
Distribusi Sampling Nilai Proporsi
Distribusi sampling proporsi sampel p adalah distribusi binomial
dengan parameter n dan P, n adalah ukuran sampel dan P proporsi populasi.
Variabel random X menyatakan banyaknya sukses dalam n percobaan.
Karena p = X n dan n merupakan konstante, X berdistribusi sama seperti p.
Jika ukuran sampel n membesar, teorema limit pusat juga berlaku di
sini, dan distribusi sampling p dapat dianggap berdistribusi normal dengan
rerata:
E (p) = P (6.8)
dan variansi:
P (1 − P ) PQ
Var (p) = = (6.9)
n n
sehingga:
p−P
Z= (6.10)
PQ n
berdistribusi normal standar.
Contoh 6.2:
Misalkan diketahui bahwa 70% calon pembeli mobil di Indonesia
terutama berminat untuk membeli kendaraan minibus. Apabila diambil
sampel 100 orang calon pembeli mobil secara acak, berapakah bahwa
sekurang-kurangnya 60 orang di antaranya memilih untuk membeli minibus?
P = 0.70 Q = 1 ‒ P = 0.30 n = 100
0.60 − 0.70
P (p > 0.60) = P Z ≥
( 0.70 )( 0.30 ) 100
= P (Z > ‒2.1822)
= 0.4854 + 0.5000 = 0.9854 = 98.54%
156
6.2 METODE SAMPLING
Penarikan Sampel
Tujuan
Mengumpulkan data yang valid (sahih) dan reliable (terpercaya)
untuk melakukan inferensi / generalisasi mengenai karakteristik populasi.
Manfaat
Penggunaan proses sampling memungkinkan dilakukannya inferensi /
generalisasi:
dengan jumlah data yang relatif sedikit
dalam jangka waktu yang relatif singkat, dan
dengan jumlah menggunakan biaya / sumber daya yang terbatas.
157
Diagram 6.2 Validitas dan reliabilitas data sampel: (a) Tidak valid dan
tidak reliabel; (b) Valid, tidak reliabel; (c) Reliabel, tidak valid; dan (d)
Valid dan reliabel
Beberapa istilah:
- Elemen (unsur) populasi: unit (satuan) yang dicari informasinya;
merupakan unit elementernya yang membentuk populasi yang diteliti.
Elemen populasi adalah unit analisis.
- Unit sampling: terdiri atas satu / lebih elemen, digunakan untuk
memilih elemen untuk anggota sampel.
- Populasi target (sasaran): Populasi yang di-‘target’-kan untuk diteliti
dan diestimasi nilai parameternya.
- Populasi aktual: kumpulan elemen yang ‘eligibel’ (memenuhi syarat)
untuk menjadi anggota sampel.
- Kerangka sampel: kumpulan elemen yang ‘terdaftar’ sebagai calon
anggota sampel.
Macam sampel
Berdasarkan objektif-tidak-nya beserta acak-tidak-nya cara
pengambilan, dikenal berbagai macam sampel yang secara skematis
diperlihatkan pada matriks 6.1.
158
Matriks 6.1. Teknik penarikan sampel
Probabilitas Non-probabilitas
Sampel
- ‘purposive’
Objektif Sampel random
- ‘quota’
- ‘haphazard’
Subjektif Sampel kuasi-random Sampel ‘judgment’
159
- Sampling acak sederhana ( simple random sampling)
- Sampling acak stratifikasi (stratified random sampling).
- Sampling acak klaster ( cluster random sampling)
- Sampling acak sistematik (systematic random sampling).
s2 N − n
ˆ (x ) =
Var (6.12)
n N
• Pelaksanaan.
Dapat digunakan antara lain:
160
(1) metode ‘penarikan undian’,
(2) bilangan acak yang dihasilkan oleh komputer / kalkulator
saintifik; atau
(3) tabel bilangan acak.
161
• Estimasi rerata dan variansi distribusi sampling nilai rerata.
L
xstr = ∑ N h xh n (6.13)
h =1
dengan:
L
xh = ∑ xh nh (6.14)
i =1 i
1 L N h − nh sh2
ˆ ( xstr ) =
Var ∑ 2
Ni
Nh nh
(6.15)
N2 h=1
• Pelaksanaan.
Populasi dibagi menjadi beberapa strata, yang masing-masing relatif
homogen. Lakukan sampling acak sederhana pada tiap stratum.
N : populasi
clust : pengelompokan (clustering)
162
Ni : kluster ke-i, i = 1, 2, . . . , M
srs : sampling acak sederhana (simple random sampling)
N i = ni : klaster terpilih menjadi sampel ; i = 1, 2, . . . , m
()
n : sampel
• Data sampel.
Klaster 1 : x11 , x12 , . . . , x1N 1
()
.
.
Kluster m : xm1 , xm 2 , . . . , xmN m
( )
dengan:
ni
xi = ∑ xij ni (6.17)
j =1
M −m 1 m
∑
2
ˆ ( xcl ) =
Var ni2 ( xi − xcl ) (6.18)
M m n2 m − 1 i =1
• Pelaksanaan.
Populasi dibagi menjadi sejumlah klaster, yang masing-masing relatif
heterogen. Lakukan sampling acak sederhana dengan klaster sebagai unit
sampling. Untuk tiap klaster yang terpilih, seluruh elemen anggotanya
dijadikan anggota sampel.
• Skema penyampelan:
163
Diagram 6.6. Sampling acak klaster dua-tahap
N : populasi
clust : pengelompokan (clustering)
Ni : kluster ke- i; i = 1, 2, . . . , M
srs : sampling acak sederhana
Ni : klaster terpilih menjadi sampel ; i = 1, 2, . . . , m
()
ni : sampel pada klaster ke-i; i = 1, 2, . . . , m
n : sampel
• Data sampel.
Klaster 1: x11 , x12 , . . . , x1n
()
1
.
.
Kluster m: xm1 , xm 2 , . . . , xmn( m )
• Pelaksanaan.
Populasi dibagi menjadi sejumlah klaster, yang masing-masing relatif
heterogen. Lakukan sampling acak sederhana dengan klaster sebagai unit
sampling. Pada tiap klaster terpilih, dilakukan sampling acak sederhana
164
(sampling tahap kedua) dengan elemen anggotanya sebagai unit untuk
memilih anggota sampel final.
165
B. N tidak merupakan kelipatan bulat k (N ≠ nk)
• Pelaksanaan.
(1) Bagi N anggota populasi menjadi n grup (group), dengan tiap
group memiliki k = N n elemen. Pilih secara acak satu di antara k
elemen anggota grup pertama untuk dijadikan anggota sampel.
Anggota selanjutnya ditentukan secara sistematik, yaitu tiap
anggota ke-k berikutnya dalam daftar; atau:
(2) Pilih secara acak di antara N anggota populasi untuk dijadikan
anggota sampel. Anggota selanjutnya ditentukan secara sistematik,
yaitu tiap anggota ke-k berikutnya dalam daftar; setelah mencapai
akhir daftar dilanjutkan mulai dari awal sampai kembali ke
anggota sampel pertama.
166
LAMPIRAN 6A: DISTRIBUSI X, DISTRIBUSI X ,
DAN DISTRIBUSI TRANSFORMASI X
X dalam teori sampling merupakan variabel random, karena
diperoleh dari sampel berulang dan memiliki nilai yang berubah-ubah pada
tiap penarikan sampel.
n X + X2 + . . . + Xn
X = ∑ Xi n = 1
i =1 n
X1 , X 2 , . . . , X n masing-masing mempunyai rerata µ dan variansi
σ 2 , sehingga:
X + X2 + . . . + Xn
E(X ) = E 1
n
1
= E X + X 2 + . . . + X n
n 1
1
= E ( X 1 ) + E ( X 2 ) + . . . + E ( X n )
n
1
= [ nµ ] = µ
n
X + X2 + . . . + Xn
dan: Var ( X ) = Var 1
n
1
= 2 Var X1 + X 2 + . . . + X n
n
1
= 2 Var ( X 1 ) + Var ( X 2 ) + . . . + Var ( X n )
n
1 σ2
= nσ 2
=
n2 n
167
Matriks 1. Distribusi tranformasi X untuk distribusi parental X normal dan sebarang serta
ukuran sampel besar dan kecil
Distribusi sampling σ2 σ2 σ2 σ2
X ~ N µ, X ~ N µ, X ~ N µ, X ~ ? µ,
rerata (distribusi X ) n n n n
σ x −µ x −µ x −µ
~ Z (0 ; 1) ~ Z (0 ; 1) ~ Z (0 ; 1)
Distribusi diketahui σ n σ n σ n
transformasi X ?
σ tak x −µ x −µ x −µ
~ Z (0 ; 1) ~ t( n−1) ~ Z (0 ; 1)
diketahui σ n σ n σ n
168
LAMPIRAN 6B: POPULASI , GALAT ACAK, DAN
GALAT SISTEMATIK
Hirarki populasi
Istilah ‘populasi’ dalam metodologi penelitian memiliki pengertian
lebih luas yang dapat dibedakan atas (lihat diagram 1):
1. Populasi studi (sampel): kumpulan subjek / objek yang sebenarnya
menghasilkan data untuk penelitian. Nilai statistik yang diperoleh dari
studi (sampel) sebagai estimator bagi parameter sesungguhnya
dinyatakan dengan lambang θˆ .
2. Populasi aktual: kumpulan subjek / objek yang ‘eligibel’ (memenuhi
syarat) untuk diikutsertakan dalam penelitian dan proses sampling.
Parameter yang ada pada populasi aktual dinyatakan dengan lambang
θo.
3. Populasi target: kumpulan subjek / objek yang menjadi target
penelitian sebenarnya (yang sebenarnya hendak diteliti). Parameter
yang ada pada populasi target dinyatakan dengan lambang θ
4. Populasi eksternal: kumpulan subjek / objek yang lebih luas daripada
populasi target, memiliki karakteristik yang tidak terlalu berbeda
dengan populasi target, dan dianggap masih ‘layak’ untuk ‘menerima’
generalisasi hasil penelitian.
170
LAMPIRAN 6C: STRATA DAN KLASTER
Stratum adalah pengelompokan yang relatif homogen, sedangkan
klaster merupakan pengelompokan yang bersifat heterogen (lihat diagram 1).
Sampling acak stratifikasi digunakan jika karakteristik yang menjadi dasar
stratifikasi, misalnya jenis kelamin, tingkat sosial ekonomi, suku bangsa, dan
sebagainya dianggap terkait dengan variabel yang hendak diteliti, untuk
menjamin agar anggota populasi dengan setiap taraf karakteristik tersebut
terwakili secara memadai dalam sampel akhir yang dikumpulkan.
Klaster adalah pengelompokan yang biasanya didasarkan atas tempat
(ruang) atau waktu, misalnya desa, kecamatan, kartu registrasi calon
mahasiswa yang terkumpul per hari, dan sebagainya. Klaster bersifat
heterogen, misalnya dalam satu klaster didapatkan subjek dari berbagai
tingkat sosial ekonomi, pria dan wanita, serta berbagai suku bangsa.
Sampling acak klaster digunakan jika ukuran populasi sangat besar sehingga
tidak mungkin ataupun tidak praktis untuk memperoleh atau menyusun
kerangka sampel secara lengkap.
Contoh:
1. Akan diteliti pengeluaran rata-rata mahasiswa per bulan di universitas
WWW. Jika variabel ini diasumsikan terkait erat dengan jenis kelamin
171
mahasiswa, maka dapat digunakan sampling acak stratifikasi dengan
jenis kelamin sebagai dasar stratifikasi.
2. Akan diteliti proporsi keluarga yang paling sedikit salah satu
anggotanya mendengarkan secara teratur siaran stasiun radio A di
kecamatan TS. Karena kerangka sampel bagi terlalu besar untuk
pelaksanaan sampling acak sederhana, dilakukan sampling acak klaster
dua-tahap dengan menggunakan desa sebagai unit klaster.
172
LAMPIRAN 6D: CONTOH PENGGUNAAN
KEEMPAT METODE SAMPLING
Data:
Basis data (dataset) mahasiswa kelas 2PA01 TA 2002/2003 dengan
nomor anggota kelas / populasi (nomor pada basis data), data jenis kelamin,
berat badan, dan IP semester I.
173
Soal:
1. Dengan menggunakan sampling acak sederhana (simple random
sampling), ambillah sampel yang terdiri atas 10 orang mahasiswa. Buat
daftar anggota sampel yang terpilih (No anggota kelas dan BB). Hitung
nilai rerata BB sampel sebagai estimator bagi nilai rerata populasi (data
kelas).
2. Bagi anggota kelas atas 2 strata, pria dan wanita. Dengan jenis kelamin
sebagai dasar stratifikasi, gunakan metode sampling acak stratifikasi
(stratified random sampling) untuk mendapatkan sampel berukuran 10
yang terdiri atas 2 pria dan 8 wanita. Buat daftar anggota sampel yang
terpilih (No anggota kelas dan BB). Hitung nilai rerata BB sampel.
3. Anggota kelas diklasifikasikan dalam 5 kelompok (klaster) berdasarkan
nilai IP-nya, yaitu klaster 1 (IP < 3.00), klaster 2 (IP 3.00-3.24), klaster
3 (IP 3.25-3.49), klaster 4 (IP 3.50-3.74), dan klaster 5 (IP 3.75-4.00).
Dengan metode sampling acak klaster (cluster random sampling) 2-
tahap, mula-mula dipilih 2 di antara 5 klaster secara acak, lalu dari
kedua klaster tersebut masing-masing diambil 5 orang anggota sampel
secara acak, sehingga seluruhnya didapatkan 10 orang anggota sampel.
Buat daftar anggota sampel yang terpilih [No anggota kelas, No
anggota klaster (nomor pada klaster masing-masing), dan BB). Hitung
nilai rerata BB sampel.
4. Dengan menggunakan metode sampling acak sistematik (systematic
random sampling) terhadap data nomor anggota kelas pada basis data
tersebut, tarik sampel berukuran 10. Buat daftar anggota sampel yang
terpilih (No anggota kelas dan BB). Hitung nilai rerata BB sampel.
5. Hitung nilai rerata BB kelas / populasi sebenarnya (70 mahasiswa kelas
2PA01 TA 2003/2004). Bandingkan hasilnya dengan nilai estimasi
yang diperoleh dengan keempat metode sampling.
Jawaban:
1. Sampling Acak Sederhana
Dengan tabel bilangan acak (tabel E) halaman 1, mulai dari baris
12, kolom ke-10 ke kanan, dan seterusnya.
Dengan ukuran populasi N = 70 dan ukuran sampel n = 10,
dilakukan pembacaan nomor-nomor dua digit: 54, 30, 98, dan
seterusnya. Pembacaan yang telah mencapai ujung kanan baris
diteruskan ke ujung kiri baris di bawahnya.
174
Nomor terpilih (digarisbawahi di bawah ini) adalah nomor yang
lebih kecil daripada (atau sama dengan) 70. Nomor-nomor yang
sama hanya dapat dipilih satu kali.
Pembacaan dihentikan setelah diperoleh 10 nomor berbeda yang
lebih kecil daripada (atau sama dengan) 70.
Tabel 1. Hasil pembacaan tabel bilangan acak
54 / 30 / 9 8 / 74 / 56 78 / 96 / 7 7 / 96 / 38
68 / 86 / 9 4 / 90 / 62 02 / 19 / 6 5 / 51 / 09
27 04 5 6 26 26 dst.
175
Wanita:
No str No kls No str No kls No str No kls No str No kls
1 2 17 18 33 36 49 53
2 3 18 21 34 37 50 54
3 4 19 22 35 38 51 55
4 5 20 23 36 39 52 56
5 6 21 24 37 40 53 60
6 7 22 25 38 41 54 61
7 8 23 26 39 42 55 62
8 9 24 27 40 43 56 63
9 10 25 28 41 44 57 64
10 11 26 29 42 45 58 65
11 12 27 30 43 46 59 66
12 13 28 31 44 47 60 67
13 14 29 32 45 49 61 68
14 15 30 33 46 50 62 69
15 16 31 34 47 51 63 70
16 17 32 35 48 52
176
Tabel 4. Hasil sampling acak sederhana pada stratum pria
No No str BB Rerata BB
(No kelas)
2
∑
j =1
x1 j
1 4 (48) 60 x1 =
2
135
2 1 (1) 75 = = 67.2
2
177
o Estimasi nilai rerata BB dengan sampel acak stratifikasi yang
diperoleh:
2 N x + N 2 x2
xst = ∑ N h xh N = 1 1
h =1 N1 + N 2
=
( 7 )( 67.5 ) + ( 63)( 49.875 ) = 51.64
7 + 63
178
Klaster 2 (IP 3.00-3.24):
No klast No kls No klast No kls No klast No kls No klast No kls
1 5 6 18 11 42 16 58
2 8 7 23 12 44 17 65
3 11 8 26 13 47 18 66
4 12 9 27 14 51 19 69
5 17 10 41 15 57
2 5 (19) 49 ∑
j =1
x1 j
3 7 (38) 42 x1 =
5
4 6 (37) 50
232
5 8 (40) 46 = = 46.4
5
179
o Pembacaan tabel bilangan acak yang terhenti pada titik akhir
untuk sampling acak sederhana pada klaster 4 dilanjutkan dengan
pembacaan untuk klaster 2.
o Dengan ukuran populasi klaster N 2 = 19, ukuran sampel klaster 2
n2 = 5, dilakukan pembacaan nomor-nomor dua digit: 96, 46, 62,
dan seterusnya. Pembacaan yang telah mencapai ujung kanan
baris diteruskan ke ujung kiri baris di bawahnya.
o Nomor terpilih (digarisbawahi di bawah ini) adalah nomor yang
lebih kecil daripada (atau sama dengan) 19. Nomor-nomor yang
sama hanya dapat dipilih satu kali.
o Pembacaan dihentikan setelah diperoleh 5 nomor berbeda yang
lebih kecil daripada (atau sama dengan) 19.
2 11 (42) 59 ∑
j =1
x2 j
3 8 (26) 50 x2 =
5
4 13 (47) 42 269
5 14 (51) 70 = = 53.8
5
1 5 12 19
= ( 232 ) + ( 269 ) = 56.39
70 2 5 5
180
4. Sampling Acak Sistematik
o Ukuran populasi N = 70, ukuran sampel n = 10, maka nilai k
adalah N/n = 70/10 = 7, sehingga N merupakan kelipatan bulat k.
o Mula-mula dilakukan sampling acak sederhana, yaitu memilih
menjadi angka 1 di antara 7 (nilai) untuk menentukan nomor
pertama yang terpilih menjadi anggota sampel.
o Digunakan tabel bilangan acak (tabel E) halaman 4, baris ke-80,
kolom ke-55 (hanya dibutuhkan 1 angka).
o Nomor terpilih (digarisbawahi di bawah ini) adalah nomor yang
lebih kecil daripada (atau sama dengan) 7, yaitu nomor 1,
sehingga yang terpilih untuk menjadi anggota sampel sistematik
adalah anggota populasi dengan nomor baris data 1, 8, 18, . . . ,
64 (10 orang).
No No kelas BB Rerata BB
1 1 75
2 8 49
3 15 45 10
4 22 57 ∑
i =1
xi
5 29 55
xsy =
10
6 36 53 542
7 43 45 = = 54.2
10
8 50 46
9 57 65
10 64 52
181
berdasarkan keempat metode sampling beserta nilai rerata populasi
sesungguhnya.
Tabel 14. Estimasi nilai rerata berat badan mahasiswa kelas 2PA01 TA
2002/2003, Depok dengan keempat metode sampling serta nilai rerata
populasi sesungguhnya
No Metode sampling Rerata BB (kg)
1 Sampling acak sederhana 50.7
2 Sampling acak stratifikasi 51.64
3 Sampling acak klaster 56.39
4 Sampling acak sistematik 54.2
Populasi kelas 49.87
182
LATIHAN 6
Bagian Pertama
Pilihlah satu jawaban yang paling benar !
183
5. Dibandingkan dengan nilai Var ( X ) pada sampling dengan
pengembalian, nilai Var ( X ) pada sampling tanpa pengembalian:
A. Selalu lebih besar.
B. Dapat lebih besar.
C. Tidak lebih besar.
D. Mungkin lebih besar, sama besar, ataupun lebih kecil.
x −µ
8. Pernyataan yang tidak benar mengenai transformasi ialah:
σ n
A. Hanya berdistribusi Z jika distribusi populasi normal dan n > 30
B. Hanya berdistribusi Z jika distribusi populasi normal
C. Hanya berdistribusi Z jika n > 30
D. Seluruhnya pernyataan di atas tidak benar
184
9. Pilihlah pernyataan yang salah:
A. Jika n besar dan populasi berdistribusi normal, distribusi
x −µ
sampling juga berdistribusi normal.
s n
B. Jika n besar dan populasi berdistribusi menceng ke kanan,
x −µ
distribusi sampling tetap berdistribusi normal.
s n
x −µ
C. Jika n besar dan distribusi sampling berdistribusi normal,
s n
distribusi populasinya pasti normal.
x −µ
D. Jika n besar dan distribusi sampling berdistribusi normal,
s n
distribusi populasinya mungkin menceng ke kiri.
11. Validitas data antara lain ditentukan oleh faktor berikut, kecuali:
A. Subjek / objek yang diukur
B. Instrumen pengukuran
C. Subjek pelaku pengukuran
D. Semua faktor di atas ikut menentukan validitas data
185
14. Populasi target adalah:
A. Kumpulan subjek / objek yang mengkontribusikan data bagi
penelitian.
B. Kumpulan subjek / objek yang eligibel untuk mengikuti proses
sampling.
C. Kumpulan subjek / objek yang sebenarnya hendak diestimasi
parameternya.
D. Semuanya salah.
15. Tiap elemen anggota populasi dimiliki probabilitas yang pasti sama
untuk terpilih menjadi anggota sampel pada:
A. Sampling acak sederhana. C. Sampling acak klaster.
B. Sampling acak stratifikasi. D. Semuanya benar.
20. Metode sampling yang hanya memerlukan penentuan secara acak bagi
anggota pertamanya didapatkan pada:
A. Sampling acak sederhana C. Samplingg acak kelompok
B. Sampling acak stratifikasi D. Sampling acak sistematik.
186
Bagian Kedua
Selesaikan soal-soal berikut:
1. Dimiliki populasi:
i 1 2 3 4 5 6 7 8 9 10
Xi 72 68 74 68 90 87 68 71 69 88
Hitunglah:
A. Rerata dan variansi populasi X
B. Rarata dan variansi distribusi sampling X jika dilakukan
sampling dengan pengembalian, n = 3.
C. Rerata dan variansi distribusi sampling X pada sampling tanpa
pengembalian dengan n = 3.
187
KEPUSTAKAAN
189
Kustituanto B, R Badrudin. Statistika I (Deskriptif). Jakarta: Penerbit
Gunadarma, 1994.
Maki DP, M Thompson. Finite Mathematics, Third Edition. New York:
McGraw-Hill, Inc, 1989.
Sanders DH. Statistics: A First Course, Fifth Edition. New York: McGraw-
Hill, Inc, 1995.
Scheaffer RL, W Mendelhall, L Ott. Elementary Survey Sampling, Third
Edition. Boston: Duxbury Press, 1986.
Snedecor GW, WG Cochran. Statistical Methods, Seventh Edition. Ames,
Iowa: The Iowa State University Press, 1982.
Soejoeti Z. Metode Statistik I. Jakarta: Universitas Terbuka Depdikbud,
1984.
Steel RGD, JH Torrie. Principles and Procedures of Statistics: A Biometrical
Approach, Second Edition. Auckland: McGraw-Hill International Book
Company, 1981.
Thompson SK. Sampling. New York: John Wiley & Sons, 1992.
190