Anda di halaman 1dari 204

ABJAD YUNANI

Huruf Yunani Nama Yunani Aksara Latin ekivalen


Α α alpha A a
Β β beta B b
Γ γ gamma G g
∆ δ delta D d
Ε ε epsilon Ĕ ĕ
Ζ ζ zeta Z z
Η η eta Ē ē
Θ θ theta Th th
Ι ι iota I i
Κ κ kappa K k
Λ λ lambda L l
Μ µ mu M m
Ν ν nu N n
Ξ ξ xi X x
Ο ο omicron Ŏ ŏ
Π π pi P p
Ρ ρ rho R r
Σ σ sigma S s
Τ τ tau T t
Υ υ upsilon Y y
Φ φ phi Ph ph
Φ χ chi Ch ch
Ψ ψ psi Ps ps
Ω ω omega Ō ō
METODE STATISTIKA 1

Johan Harlan
Metode Statistika 1
Penulis : Johan Harlan
ISBN 979-1223-01-7

Cetakan Pertama, 2004

Diterbitkan pertama kali oleh Gunadarma


Jl. Margonda Raya No. 100, Pondokcina, Depok 16424
Telp. +62-21-78881112, 7863819 Faks. +62-21-7872829
e-mail : sektor@gunadarma.ac.id

Hak Cipta dilindungi undang-undang. Dilarang mengutip atau


memperbanyak dalam bentuk apapun sebagian atau seluruh isi
buku tanpa ijin tertulis dari penerbit.
KATA PENGANTAR

Pemberlakuan kurikulum berbasis kompetensi sedikit banyak


memerlukan penyesuaian cara penyampaian materi pengajaran Statistika di
tingkat Perguruan Tinggi. Isi buku-buku Metode Statistika ini sedapat
mungkin disesuaikan dengan silabus yang digunakan untuk perkuliahan
Statistika di jenjang S1, selain diupayakan untuk menggunakan cara
penyampaian yang diharapkan lebih memudahkan pembaca untuk mencerna
materi yang dipelajari.
Seri buku-buku Metode Statistika ini terdiri atas empat buku, yaitu
buku teks Metode Statistika 1, buku teks Metode Statistika 2, buku jawaban
soal-soal latihan Metode Statistika 1, dan buku jawaban soal-soal latihan
Metode Statistika 2. Materi yang diberikan terutama ditujukan untuk
perkuliahan Statistika selama dua semester di jenjang S1, tanpa memerlukan
penguasaan matematika lebih lanjut selain yang telah diperoleh di tingkat
SMU.
Buku teks Metode Statistika 1 memuat materi Statistika Deskriptif,
pengantar teori probabilitas, serta pengenalan terhadap beberapa distribusi
probabilitas yang penting dalam Statistika Terapan. Buku teks Metode
Statistika 2 berisi materi mengenai Inferensi Statistik, yaitu estimasi
parameter dan uji hipotesis, termasuk dengan menggunakan Statistika Non-
Parametrik.
Kepada semua pihak yang telah membantu terlaksananya penerbitan
buku-buku ini, penulis menyampaikan terima kasih yang sebesar-besarnya.
Penulis juga sangat mengharapkan saran, kritik, dan koreksi dari pembaca
demi perbaikan pada penerbitan selanjutnya.

Johan Harlan

Juni 2004

v
DAFTAR ISI

Kata Pengantar v

Daftar Isi vii


Bab 1 Pendahuluan 1
1.1 Konsep Statistika 1
2.2 Notasi Sigma 5
Lampiran 1A Peran Statistika dalam Ilmu Pengetahuan 9
Lampiran 1B Skala Pengukuran 10
Lampiran 1C Contoh-contoh Penggunaan Notasi 11
Sigma
Latihan 1 13

Bab 2 Peringkasan Data 19


2.1 Tabel 19
2.2 Grafik 26
Lampiran 2A Bagian-bagian Tabel 31
Latihan 2 33

Bab 3 Ukuran Statistik 37


3.1 Ukuran Pusat (Nilai Tengah) 37
3.2 Ukuran Penyebaran 52
Lampiran 3A Ukuran Pusat pada Distribusi Simetris 61
dan Asimetris
Lampiran 3B Fraktil 63
2 65
Lampiran 3C Notasi ∑ ( xi − x ) dan ∑ ( xi − x )
Lampiran 3D Diagram Kotak 66

vii
Latihan 3 69

Bab 4 Probabilitas 75
4.1 Konsep Dasar Probabilitas 75
4.2 Probabilitas Peristiwa 80
4.3 Pencacahan Ruang Sampel 83
Lampiran 4A Saling Asing dan Independen 88
Lampiran 4B Teorema Bayes 90
Latihan 4 93

Bab 5 Distribusi Teoretis 100


5.1 Konsep Dasar Distribusi Probabilitas 100
5.2 Distribusi Probabilitas Diskret 105
5.3 Distribusi Probabilitas Kontinu 119
Lampiran 5A Rangkuman Parameter Distribusi 134
Probabilitas
Lampiran 5B Beberapa Contoh Penggunaan Distribusi 136
Probabilitas Diskret
Lampiran 5C Nilai Standar (Nilai Baku, Variabel 139
Standar Z)
Lampiran 5D Beberapa Contoh Penggunaan Distribusi 141
Normal
Lampiran 5E Interpolasi Linear 143
Latihan 5 145

viii
Bab 6 Sampling 152
6.1 Distribusi Sampling 152
6.2 Metode Sampling 157

Lampiran 6A Distribusi X, Distribusi X , dan 167


Distribusi Transformasi X
Lampiran 6B Populasi, Galat Acak, dan Galat 169
Sistematik
Lampiran 6C Strata dan Klaster 171
Lampiran 6D Contoh Penggunaan Keempat Metode 173
Sampling
Latihan 6 183

Kepustakaan 189

Addenda 191
Addendum A Program Komputer Statistik 191
Addendum B1 Distribusi Probabilitas Binomial 193
Addendum B2 Probabilitas Binomial Kumulatif 200
Addendum C1 Distribusi Probabilitas Poisson 205
Addendum C2 Probabilitas Poisson Kumulatif 211
Addendum D Distribusi Normal Standar 213
Addendum E Nilai Kritis Distribusi t 215
Addendum F Bilangan Acak 216

ix
BAB 1
PENDAHULUAN

1.1 KONSEP STATISTIKA

 Metode Statistika
adalah teknik tentang pengumpulan data, penyajian data, analisis data,
dan pengambilan kesimpulan dari data yang berhasil dihimpun tersebut.

Istilah “statistika” berasal dari kata “status” (= state), yang berarti


“negara”, karena pada awal mula perkembangannya Statistika digunakan
untuk mengurus hal-hal yang berkaitan dengan penyelenggaraan negara.

Statistika dibedakan menjadi:


1. Statistika Matematika: mempelajari dasar-dasar matematika bagi
berbagai analisis statistik serta mengembangkan teknik-teknik baru
Statistika secara matematik.
2. Statistika Terapan: mempelajari penerapan dan penggunaan Statistika
dalam berbagai bidang ilmu pengetahuan. Statistika Terapan terbagi
atas dua bagian, yaitu:
a. Statistika Deskriptif: serangkaian teknik yang meliputi
pengumpulan, penyajian, dan peringkasan data.
b. Statistika Inferensi: serangkaian teknik untuk mengkaji,
menaksir, dan mengambil kesimpulan berdasarkan sebagian data
(data sampel) yang dipilih secara acak dari seluruh data yang
menjadi subjek kajian (populasi).

 Populasi dan Sampel


Populasi adalah himpunan seluruh objek yang ingin diketahui besaran
karakteristiknya. Sampel adalah himpunan bagian populasi yang memiliki
karakteristik yang sama dengan karakteristik populasinya.

1
 Parameter dan Statistik
Parameter (parameter populasi) adalah ukuran-ukuran tertentu yang
digunakan untuk menggambarkan suatu populasi. Statistik (statistik sampel)
adalah ukuran-ukuran tertentu yang digunakan untuk menggambarkan suatu
sampel.

Nilai statistik merupakan penaksir (estimator) bagi nilai parameter,


yang nilai sesungguhnya tidak pernah diketahui besarnya.

Istilah “statistik” memiliki pengertian yang berbeda dengan “statistika”.


“Statistika” (statistics) adalah ilmu atau metode untuk pengolahan dan
analisis data, sedangkan “statistik” (statistic) adalah nilai (ukuran) yang
diperoleh dari sampel.

 Data
Data merupakan kumpulan fakta atau angka atau segala sesuatu yang
dapat dipercaya kebenarannya, sehingga dapat digunakan sebagai dasar
menarik suatu kesimpulan.

 Variabel
Variabel adalah karakteristik unsur yang menjadi perhatian dan
memiliki nilai-nilai yang berbeda-beda.

 Data primer dan data sekunder


Data primer adalah data yang diperoleh langsung dari objek yang
ingin diketahui karakteristiknya. Data sekunder adalah data yang tidak
diperoleh langsung dari objek yang ingin diketahui karakteristiknya,
melainkan dari sumber lain yang telah mengumpulkannya terlebih dahulu.

 Data kuantitatif dan kualitatif


Data kuantitatif (data numerik) adalah karakteristik suatu variabel
yang nilai-nilainya dinyatakan dalam bentuk numerik. Data kualitatif (data
kategorik) adalah karakteristik suatu variabel yang nilai-nilainya dinyatakan
dalam bentuk non-numerik atau atribut-atribut.

2
Data kuantitatif dibedakan menjadi data diskret dan data kontinu:
- Data diskret adalah karakteristik suatu variabel yang berasal dari
proses pencacahan (counting) dan berupa bilangan bulat.
Contoh: jumlah anak responden ibu rumah tangga, jumlah sesi
perkuliahan Statistika yang diikuti oleh responden mahasiswa, dan
sebagainya.
- Data kontinu adalah karakteristik suatu variabel yang berasal dari
proses pengukuran (measurement) dan nilai-nilainya berada dalam
suatu interval atau rentang tertentu. Nilai-nilai data kontinu dapat
berupa bilangan pecahan yang tak terhingga banyaknya.
Contoh: tinggi badan responden, berat badan responden, dan
sebagainya.

 Skala pengukuran
- Skala nominal: data yang dihimpun dapat dibedakan menjadi beberapa
kategori tanpa memperhatikan urutan tertentu.
Contoh: suku bangsa, agama, dan sebagainya.
- Skala ordinal: data yang dihimpun dapat dibedakan menjadi beberapa
kategori yang berbeda dengan memperhatikan urutan.
Contoh: status sosial ekonomi (tinggi-menengah-rendah), kepangkatan
dalam militer (perwira-bintara-tamtama), dan sebagainya.
- Skala interval: data yang dihimpun dapat diletakkan dalam skala
dengan jarak (interval) antara dua titik skala diketahui dan skala
tersebut tidak memiliki titik nol mutlak (titik pusat).
Contoh: tanggal lahir, suhu tubuh dalam skala Celcius, dan sebagainya.
- Skala rasio: data yang dihimpun dapat diletakkan dalam skala dengan
jarak antara dua titik skala diketahui dan skala tersebut memiliki titik
nol mutlak.
Contoh: usia, suhu ruang dalam skala Kelvin, dan sebagainya.

Data nominal dan ordinal tergolong dalam data kualitatif (kategorik),


sedangkan data interval dan rasio merupakan data kuantitatif (numerik).

Data kualitatif dengan dua kategori disebut sebagai data binomial


(dikotomi, binary), yang selalu tergolong dalam data nominal. Contoh data

3
binomial antara lain jenis kelamin (pria-wanita), hasil ujian (lulus-gagal), dan
sebagainya.

Data kualitatif dengan lebih daripada dua kategori dinamakan data


politomi. Data politomi mungkin berupa data nominal ataupun ordinal.

 Sifat-sifat skala pengukuran


Dalam urutannya, skala rasio merupakan skala pengukuran yang
tertinggi, sedangkan skala nominal merupakan skala pengukuran yang
terendah. Ringkasan sifat-sifat keempat skala pengukuran tersebut dapat
dilihat pada matriks 1.1 berikut. Tampak bahwa sifat tiap skala yang lebih
rendah selalu juga akan dimiliki oleh skala yang lebih tinggi.

Matriks 1.1 Sifat-sifat keempat skala pengukuran data

Dapat ditentukan Dapat dibilang


xi < x j ,
Skala xi = x j
xi = x j , Nilai interval Nilai rasio
pengukuran atau
atau ( xi − x j ) ( xi / x j )
xi ≠ x j
xi > x j
Rasio + + + +
Interval + + + −
Ordinal + + − −
Nominal + − − −

4
1.2 NOTASI SIGMA

 Aturan sumasi

Aturan 1
Jika xi = k, suatu nilai konstan (yaitu nilai yang tidak berubah dengan
i), maka:
n n
∑ xi =
i =1

i =1
k = k + k + . . . + k = nk

n

i =1
xi = nk (1.1)

Aturan 2
Jika k suatu konstante, maka:
n

i =1
kxi = k x1 + k x2 + . . . + k xn

n
= k ( x1 + x2 + . . . + xn ) = k ∑ xi
i =1
n n

i =1
kxi = k ∑ xi
i =1
(1.2)

Aturan 3
n

i =1
( xi + yi ) = ( x1 + y1 ) + ( x2 + y2 ) + . . . + ( xn + yn )
= ( x1 + x2 + . . . + xn ) + ( y1 + y2 + . . . + yn )
n n
= ∑
i =1
xi + ∑
i =1
yi

n n n
∑ ( xi + yi )
i =1
= ∑ xi +
i =1

i =1
yi (1.3)

5
Contoh 1.1

n n
∑ ( xi + k ) ∑
2
1.
i =1
=
i =1
( xi2 + 2kxi + k 2 )
n n n
= ∑ xi2 +
i =1
∑ ( 2kxi )
i =1
+ ∑
i =1
k2 , aturan 3

n n
= ∑ xi2 + 2k ∑ xi + n k 2 ,
i =1 i =1
aturan 2 dan 1

n 2 n
∑( ) ∑ ( xi + 2 xi y i + y i )
2 2
2. xi + y i =
i =1 i =1
n n n
= ∑
i =1
xi2 + 2 ∑ xi yi +
i =1

i =1
yi2 , aturan 3 dan 2

n n n
3. ∑ ( axi + byi ) = ∑ axi + ∑ byi , aturan 3
i =1 i =1 i =1
n n
= a ∑ xi + b ∑ y i , aturan 2
i =1 i =1

n n
∑ xi ( xi −1) = ∑ ( xi − xi )
2
4.
i =1 i =1
n n
= ∑ xi2 −
i =1
∑ xi , aturan 3
i =1

n n
∑ ( xi −1)( xi +1) = ∑ ( xi −1)
2
5.
i =1 i =1
n n
= ∑ xi2 −
i =1
∑1 , aturan 3
i =1

6
n
= ∑
i =1
xi2 − n, aturan 1

 Sumasi Ganda

Misalkan dimiliki mn kuantitas xij , i = 1, 2, . . . , m dan j = 1, 2, . . . , n;


x11 x12 ... x1n
x21 x22 x2 n
. . .
. . .
. . .
xm1 xm 2 xmn
n
m  m  n 
maka: ∑  ∑ xij  =
j =1  i =1 
∑  ∑ xij 
i =1  j =1 
n m m n
atau: ∑∑ xij =
j =1 i =1
∑∑
i =1 j =1
xij

Misalkan Aij = aij xi y j , i = 1, 2, . . . , m dan j = 1, 2, . . . , n,


a11 x1 y1 a12 x1 y2 ... a1n x1 yn
a21 x2 y1 a22 x2 y2 a2 n x2 yn
. . .
. . .
. . .
am1 xm y1 am 2 xm y2 amn xm yn

m n n m
maka: ∑∑ aij xi y j =
i =1 j =1
∑∑
j =1 i =1
a xyij i j

7
n
Misalkan Aij = aij x j dan ∑
i =1
Aij = bi , i = 1, 2, . . . , m dan j = 1, 2, . . .

, n,
a11 x1 + a12 x2 + ... + a1n xn = b1
a21 x1 a22 x2 a2 n xn = b2
. . . .
. . . .
. . . .
am1 x1 + am 2 x2 + ... + amn xn = bm

n
maka: ∑
i =1
aij x j = bi

m n m
dan: ∑∑
i =1 j =1
aij x j = ∑ bi
i =1

8
LAMPIRAN 1A: PERAN STATISTIKA DALAM
ILMU PENGETAHUAN

Diagram 1. Proses ilmiah menurut Wallace

Diagram 2. Siklus metodologi ilmu pengetahuan (Popper)


9
LAMPIRAN 1B: SKALA PENGUKURAN

Diagram 1. Algoritma pemeriksaan skala pengukuran

10
LAMPIRAN 1C: CONTOH-CONTOH
PENGGUNAAN NOTASI SIGMA

Contoh 1:
5
 ∑
i =1
xi = x1 + x2 + x3 + x4 + x5

4
 ∑
j =2
yj = y2 + y3 + y4

3
 ∑ zk
k =0
= z0 + z1 + z2 + z3

3
 ∑
i =1
( a + bxi ) = ( a + bx1 ) + ( a + bx2 ) + ( a + bx3 )
5
 ∑
i =3
( axi + byi ) = ( ax3 + by3 ) + ( ax4 + by4 ) + ( ax5 + by5 )
2
 ∑
i =1
( axi + b )( cxi + d ) = ( ax1 + b )( cx1 + d ) + ( ax2 + b )( cx2 + d )
3
 ∑
i =1
( axi yi ) = ax1 y1 + ax2 y2 + ax3 y3
2
 ∑
i =1
( axi2 + bxi + c ) = ( ax12 + bx1 + c ) + ( ax22 + bx2 + c )
3
 ∑
i =1
( axi + b )( cxi + d ) = ( ax1 + b )( cx1 + d ) + ( ax2 + b )( cx2 + d ) +
( ax3 + b )( cx3 + d )

11
Contoh 2:

i 1 2 3 4 5
Xi 80 65 70 60 65

5
• ∑
i =1
xi = 80 + 65 + 70 + 60 + 65 = 340

5
• ∑
i =1
xi2 = 802 + 652 + 702 + 602 + 652 = 23,350

5
 5
 5 
• ∑
i =1
( 3xi + 7 ) + 3∑ xi 
 i =1 
+  ∑ 7  = (3)(340) + (5)(7) = 1,055 =
 i =1 
5 5
 5 2  5   5 
∑ ( 2 xi + 3) ∑  4∑ xi  + 12∑ xi  +  ∑ 9 
2
• = 4 xi(
2
+ 12 xi + 9 = )
i =1 i =1  i =1   i =1   i =1 
= (4)(23,350) + (12)(340) + (5)(9) = 97,525

5 5
 5
5  
• ∑
i =1
( xi + 4 )( xi − 4 ) = ∑ ( xi2 − 16 ) = ∑ xi2 
i =1  i =1 
‒  ∑16 
 i =1 
= 23,350 ‒ (5)(16) = 23,270

Catatan:
n
 ∑
i =1
xi = ∑i xi
m n
 ∑∑
i =1 j =1
xij = x11 + x12 + . . . + x1n + x21 + x22 + . . . + x2 n +

xm1 + xm 2 + . . . + xmn
m n
 ∑∑
i =1 j =1
xij = ∑∑
i j
xij

12
LATIHAN 1
Bagian Pertama
Pilihlah satu jawaban yang paling benar !

1. Ukuran-ukuran tertentu yang mendeskripsikan karakteristik suatu


populasi, yang nilai sesungguhnya umumnya tidak diketahui dengan
pasti dinamakan:
A. Statistik C. Variabel
B. Parameter D. Konstante

2. Ukuran-ukuran tertentu yang nilainya diperoleh dari sampel


dinamakan:
A. Statistik C. Variabel
B. Parameter D. Konstante

3. Cabang Statistika yang mempelajari tentang peingkasan data yang


diperoleh dari suatu kelompok objek dinamakan:
A. Statistika matematik C. Statistika deskriptif
B. Statistika terapan D. Statistika inferensi

4. Cabang Statistika yang mempelajari tentang metode untuk


menggeneralisasikan hasil temuannya terhadap kelompok objek yang
lebih luas dinamakan:
A. Statistika matematik C. Statistika deskriptif
B. Statistika terapan D. Statistika inferensi

5. Peranan metodologi statistika dalam penerapan metode ilmiah ialah


pada tahap:
A. Penentuan tujuan C. Analisis data
B. Pengumpulan informasi D. Semuanya benar

13
6. Yang tergolong dalam data kualitatif ialah:
A. Data nominal dan ordinal
B. Data interval dan rasio
C. Data diskret dan kontinu
D. Data kategorik dan numerik

7. Yang tergolong dalam data kuantitatif ialah:


A. Data nominal dan ordinal
B. Data interval dan rasio
C. Data diskret dan kontinu
D. Data kategorik dan numerik

8. Contoh data diskret di antara yang tersebut di bawah ini yaitu:


A. Lama hidup tikus pwercobaan yang telah diangkat kelenjar anak
ginjalnya
B. Curah hujan tahunan di Kota Jakarta
C. Jumlah motor yang diparkir setiap hari di halaman kampus
Gunadarma Pondokcina
D. Biaya hidup rata-rata bulanan mahasiswa Gunadarma

9. Contoh data kontinu di antara yang tersebut di bawah ini yaitu:


A. Jumlah gigi sehat tanpa karies pada anak TK
B. Banyak peluru kendali yang ditembakkan pasukan koalisi per hari
selama Perang Teluk I
C. Nilai tes esai bahasa Inggris mahasiswa
D. Jumlah kematian akibat kecelakaan lalu lintas per bulan di jalan
tol Jagorawi

10. Data yang diperoleh langsung dari subjek yang ingin diketahui
karakteristiknya dinamakan:
A. Data diskret C. Data primer
B. Data rasio D. Data sekunder

14
11. Data yang diperoleh dari pihak ketiga, yang biasanya telah
dikumpulkan sebelumnya untuk keperluan lain dari subjek yang hendak
dipelajari dinamakan:
A. Data diskret C. Data primer
B. Data rasio D. Data sekunder

12. Luas lantai berbagai tipe rumah disebuah real estate merupakan
contoh data:
A. Nominal C. Interval
B. Ordinal D. Rasio

13. Hasil pengukuran IQ ( intelligence quotient ) merupakan contoh data:


A. Nominal C. Interval
B. Ordinal D. Rasio

14. Jumlah halaman pada buku-buku di sebuah perpustakaan merupakan


contoh data:
A. Ordinal dan diskret C. Rasio dan diskret
B. Ordinal dan kontinu D. Rasio dan kontinu

15. Nilai IPK mahasiswa semester akhir Gunadarma merupakan contoh


data:
A. Ordinal dan diskret C. Rasio dan diskret
B. Ordinal dan kontinu D. Rasio dan kontinu

16. Contoh di bawah ini merupakan data berskala ordinal, kecuali:


A. Jenis kelamin subjek
B. Kelompok usia subjek
C. Golongan kepangkatan pada PNS
D. Status social-ekonomi responden

15
17. Contoh berikut adalah data berskala interval, kecuali:
A. Tanggal ulang tahun siswa kelas 3 SMU Bintang Kejora
B. Rata-rata suhu luar-rumah harian di Jakarta yang dinyatakan
dalam skala Celcius.
C. Usia penduduk Desa Tamansari pada HUT terakhirnya
D. Semua merupakan contoh data berskala interval

18. Contoh data berskala rasio di antara pilihan di bawah ini adalah:
A. Suhu dalam skala Celcius C. Suhu dalam skala Kelvin
B. Suhu dalam skala Fahrenheit D. Semuanya benar

19. Pilihlah pernyataan yang benar:


A. Semua sifat skala interval dimiliki oleh skala rasio.
B. Semua sifat skala ordinal dimiliki oleh skala nominal.
C. Semua sifat skala interval dimiliki oleh skala ordinal.
D. Semua sifat skala rasio dimiliki oleh skala interval.

20. Yang tidak benar di antara pernyataan berikut ialah:


n n n n
A. ∑ k = nk ; k konstante
i =1
C. ∑ ( xi . yi ) = ∑ xi ∑ yi
i =1 i =1 i =1
n n n n n
B. ∑ kxi = k ∑ xi
i =1 i =1
D. ∑ ( xi + yi ) = ∑ xi + ∑ yi
i =1 i =1 i =1

16
Bagian Kedua

Pilihlah satu jawaban yang paling benar !

Untuk soal No. 1 s.d. 3:


Misalkan x1 = 1, x2 = 3, x3 = 5, x4 = 8, dan x5 = 6.
5
1. ∑x
i=2
1 =

A. 21 C. 23
B. 22 D. 24

5
2. ∑ ( 3x + 5) =
i =1
i

A. 64 C. 84
B. 74 D. 94

5
3. ∑ ( x − 2 )( 2 x + 3) =
i =1
i i

A. 196 C. 217
B. 203 D. 241

Bagian Ketiga
Selesaikanlah soal-soal berikut:

1. Dalam suatu eksperimen , delapan orang anak diberi makan dengan


menu tertentu selama satu bulan. Angka-angka berikut menunjukkan
tambahan berat badan (dalam ons).

Anak 1 2 3 4 5 6 7 8

Tambahan berat 25 14 21 12 17 −10 0 −15

17
Hitunglah:
5 8

∑ ( xi 2 − xi − 1) ∑ ( x − 8)
2
A. E. i
i =1 i =1
8
1 8
B. x = ∑ xi
8 i =1
F. ∑ ( x − 10 )
i =1
i

5 8
C. ∑ ( xi − 8)
i =1
G. ∑ x − 10
i =1
i

8 5
1 1
D. ∑ x −8 i H. ∑ x − 
8
i =1 i =1  i

2. Data dalam tabel di bawah menunjukkan umur beberapa pasangan


pengantin yang melakukan pernikahan pada tahun bulan Juli 1999 di
Kecamatan Depok.

Pasangan (i) 1 2 3 4 5 6 7 8

Umur pria ( xi ) 23 32 25 26 42 29 19 24

Umur wanita ( yi ) 19 38 21 26 35 32 17 20

Hitunglah:
8 8 8
A. ∑
i =1
xi , ∑ yi , dan ∑ xi yi
i =1 i =1

2 2
2    8   8  8 
8 8 8
B. ∑ xi2 ,
i =1

i =1
yi ,  ∑ i  ,  ∑ yi  ,  ∑ xi   ∑ yi 
x
 i =1   i =1   i =1   i =1 
8
C. ∑
i =1
( xi + yi )
8

2
D. ( xi + yi )
i =1

8
E. ∑
i =1
( 2 xi + 5 yi )

18
BAB 2
PERINGKASAN DATA
Peringkasan data dapat dilakukan secara tabular (penyajian tabel),
secara grafikal (penyajian grafik), dan secara numerik (penyajian angka).
Dalam bagian ini akan dibahas mengenai peringkasan data secara tabular dan
grafikal.

2.1. TABEL
 Distribusi Frekuensi
Tabel 2.1 Rincian nilai skala Depresi MMPI-2 50 mahasiswa
Psikologi Gunadarma 2003
21 25 24 23 24 21 19 25 23 27
17 32 26 32 28 29 21 21 25 23
35 37 19 26 24 27 16 23 24 25
25 18 31 23 17 26 29 21 16 23
23 30 29 18 28 22 19 24 29 21

Data yang disajikan diatas dikatakan sebagai data mentah (raw data).
Seyogyanya data tersebut disusun dari angka terkecil hingga angka terbesar:

Tabel 2.2. Rincian nilai terurut skala Depresi MMPI-2 50 mahasiswa


Psikologi Gunadarma 2003
16 16 17 17 18 18 19 19 19 21
21 21 21 21 21 22 23 23 23 23
23 23 23 24 24 24 24 24 25 25
25 25 25 26 26 26 27 27 28 28
29 29 29 29 30 31 32 32 35 37

Distribusi frekuensi sering disebut sebagai tabel frekuensi. Contohnya


diperlihatkan pada tabel 2.3.

19
Tabel 2.3. Distribusi frekuensi berat badan 64 mahasiswa
Psikologi Gunadarma 2003
Berat badan (kg) Frekuensi
36-44 20
45-53 19
54-62 17
63-71 5
72-80 1
81-89 1
90-98 1
Jumlah 64

Beberapa istilah:
a. Kelas / kelompok data
Jumlah kelas: biasanya 5 s.d. 15
Aturan Sturges (dibaca: ster’-jes):
Jumlah kelas = 1 + 3.322 log n (2.1)

Aturan Sturges hanya digunakan jika secara substantif menurut bidang


ilmu yang bersangkutan belum ada kategorisasi baku bagi variabel yang
data-nya hendak ditabelkan.
b. Interval kelas
Adalah jarak antara kelas yang satu dengan lainnya secara berurutan.
Rentang + 1
Interval kelas = (2.2)
Jumlah kelas

Rentang adalah beda antara nilai data terbesar dengan nilai data terkecil.
c. Batas kelas dan tepi batas kelas
Batas-batas kelas (class limits) adalah dua angka yang dijadikan sebagai
pembatas kelas, terdiri atas batas kelas atas dan batas kelas bawah.
Kelas IV Kelas V
-----------o------------------------------------------------o---------------

Batas kelas atas Batas kelas bawah


kelas keempat kelas kelima
Diagram 2.1. Batas kelas atas dan bawah dengan garis bilangan
untuk data pada tabel 2.3

20
tepi batas
Kelas IV kelas Kelas V
------------o--------------------------o-----------------------o-----------
71 71.5 72
Batas kelas atas Batas kelas bawah
kelas keempat kelas kelima
Diagram 2.2. Tepi batas kelas (class boundaries ) dengan garis bilangan
untuk data pada tabel 2.3
Contoh distribusi frekuensi dengan tepi batas kelas sebagai batas kelas:
Tabel 2.4. Distribusi berat badan 64 mahasiswa Psikologi Gunadarma
3003 − tepi batas kelas sebagai batas kelas

Berat badan (kg) Frekuensi


35.5-44.5 20
44.5-53.5 19
53.5-62.5 17
62.5-71.5 5
71.5-80.5 1
80.5-89.5 1
89.5-98.5 1
Jumlah 64

d. Titik tengah
Titik tengah setiap kelas dijadikan penaksir data asli yang sudah hilang
sebagai akibat proses pengelompokan. Contoh distribusi frekuensi
dengan titik tengah:
Tabel 2.5. Distribusi berat badan 64 mahasiswa Psikologi Gunadarma
2003 − dengan titik tengah

Batas-batas kelas Tepi-tepi batas kelas Titik-titik tengah Frekuensi


36-44 35.5-44.5 40 20
45-53 44.5-53.5 49 19
54-62 53.5-62.5 58 17
63-71 62.5-71.5 67 5
72-80 71.5-80.5 76 1
81-89 80.5-89.5 85 1
90-98 89.5-98.5 94 1
Jumlah 64

21
Langkah-langkah penyusunan distribusi frekuensi:
a. Menentukan jumlah kelas:
Untuk contoh tabel 2.2 → n = 50
Dengan aturan Sturges:
Jumlah kelas = 1 + 3.322 log 50
= 6.64 ≈ 7 kelas
b. Menentukan interval kelas
Rentang angka data terbesar dengan angka terkecil adalah:
37 – 16 = 21
Interval kelas = [Rentang kelas + 1] : jumlah kelas
= 22 : 7 = 3.14 ≈ 4 (dibulatkan ke atas)
c. Menyusun kelas-kelas data
Tabel 2.6. Batas kelas bawah dan batas kelas atas
Batas kelas bawah Batas kelas atas
13 16
17 20
21 24
25 28
29 32
33 36
37 40

d. Memasukkan data
Semua angka data harus dapat dimasukkan tanpa mengalami keragu-
raguan. Pemasukan data dipermudah dengan membuat tally (melidi)
terlebih dahulu.

Tabel 2.7. Distribusi frekuensi nilai skala Depresi MMPI-2 50


mahasiswa Psikologi Gunadarma 2003 − proses melidi
Nilai skala D Tally Frekuensi
13-16 // 2
17-20 ///// // 7
21-24 ///// ///// ///// //// 19
25-28 ///// ///// // 12
29-32 ///// /// 8
33-36 / 1
37-40 / 1
Jumlah 50

22
Hasil penyusunan distribusi frekuensi:

Tabel 2.8. Distribusi frekuensi nilai skala Depresi MMPI-2 50


mahasiswa Psikologi Gunadarma 2003

Nilai skala D Frekuensi


13-16 2
17-20 7
21-24 17
25-28 12
29-32 8
33-36 1
37-40 1
Jumlah 50

Batas atas dapat juga dinyatakan dengan simbol ‘lebih kecil daripada’
(<):

Tabel 2.9. Distribusi frekuensi nilai skala Depresi MMPI-2 50


mahasiswa Psikologi Gunadarma 2003 – batas atas dengan
simbol ‘lebih kecil daripada’

Nilai skala D Frekuensi


D < 17 2
17 < D < 21 7
21 < D<25 19
25 < D < 29 12
29 < D < 33 8
33 < D < 37 1
D > 37 1
Jumlah 50

 Distribusi Frekuensi Relatif


Frekuensi data dinyatakan dengan bilangan relatif (proporsi atau
persentase). Contoh:

23
Tabel 2.10. Distribusi frekuensi nilai skala Depresi MMPI-2 50
mahasiswa Psikologi Gunadarma 2003

Nilai skala D Persentase


D < 17 4%
17 < D < 21 14 %
21 < D<25 38 %
25 < D < 29 24 %
29 < D < 33 16 %
33 < D < 37 2%
D > 37 2%
Jumlah 100 %

 Distribusi Frekuensi Kumulatif


Distribusi frekuensi kumulatif dibedakan menjadi dua:
 Distribusi frekuensi kumulatif ‘kurang daripada’ (KDP)
 Distribusi frekuensi kumulatif ‘sama atau lebih daripada’ (LDP)

Tabel 2.11. Penyusunan distribusi frekuensi kumulatif tipe KDP

13-16 2 < 17 2
17-20 7 < 21 20 + 7 = 9
21-24 19 < 25 9 + 19 = 28
25-28 12 < 29 28 + 12 = 40
29-32 8 < 33 40 + 8 = 48
33-36 1 < 37 48 + 1 = 49
37-40 1 < 41 49 + 1 = 50

24
Distribusi frekuensi kumulatifnya adalah:

Tabel 2.12. Distribusi frekuensi nilai skala Depresi MMPI-2 50


mahasiswa Psikologi Gunadarma 2003
Nilai skala D Frekuensi kumulatif
< 17 2
< 21 9
< 25 28
< 29 40
< 33 48
< 37 49
< 41 50

Contoh penyusunan distribusi frekuensi kumulatif tipe ‘sama atau


lebih daripada’:
Tabel 2.13. Penyusunan distribusi frekuensi kumulatif tipe
‘sama atau lebih daripada’
13-16 2 > 13 48 + 2 = 50
17-20 7 > 17 41 + 7 = 48
21-24 19 > 21 22 + 19 = 41
25-28 12 > 25 10 + 12 = 22
29-32 8 > 29 2 + 8 = 10
33-36 1 > 33 1+1=2
37-40 1 > 37 1

Hasil akhirnya adalah:

Tabel 2.14. Penyusunan distribusi frekuensi kumulatif nilai skala Depresi


MMPI-2 50 mahasiswa Psikologi Gunadarma 2003 –
tipe ‘sama atau lebih daripada’
Nilai skala D Frekuensi kumulatif
> 13 50
> 17 48
> 21 41
> 25 22
> 29 10
> 33 2
> 37 1

25
2.2. GRAFIK
 Histogram Frekuensi:
Histogram merupakan penyajian secara grafikal data yang ada pada
tabel distribusi frekuensi. Histogram umumnya digunakan untuk data
kuantitatif (numerik) yang dikategorisasikan.

Diagram 2.3. Histogram nilai skala Depresi MMPI-2 50 mahasiswa


Psikologi Gunadarma 2003
Angka-angka pada sumbu horizontal dapat diambil dari:
- Tepi-tepi batas kelas (class boundaries), atau:
- Batas-batas kelas (class limits)

 Poligon Frekuensi
Sama seperti histogram, hanya pada poligon frekuensinya dilukiskan
dalam bentuk garis yang menghubungkan tiap titik tengah puncak masing-
masing kelas. Poligon frekuensi untuk data pada tabel 2.8 adalah:

26
Diagram 2.4. Poligon frekuensi nilai skala Depresi MMPI-2 50
mahasiswa Psikologi Gunadarma 2003

 Ogive
Distribusi frekuensi kumulatif dapat disajikan dalam bentuk diagram
yang dinamakan ogive. Ogive untuk tabel 2.12 adalah:

Diagram 2.5. Ogive nilai skala MMPI-2 50 mahasiswa Psikologi


Gunadarma 2003

27
 Diagram Batang (bar chart)
Biasanya digunakan untuk data kategorik ordinal. Berbeda dengan
histogram, pada diagram batang antara batang yang satu dengan yang
berikutnya didapatkan celah (gap).

Diagram 2.6. Tingkat pendidikan 100 responden


Studi Jantung Honolulu, 1969

 Diagram Lingkar (pie chart)


Biasanya digunakan untuk data kategorik nominal.

28
Diagram 2.7. Asal fakultas 218 mahasiswa
Studi Nyeri Kepala Gunadarma, 2003

 Diagram Batang-dan-Daun:
Diagram batang-dan–daun (stem-and-leaf) merupakan kombinasi
antara histogram dengan penyajian data individual secara numerik. Untuk
angka dua digit, puluhan dijadikan ‘batang’ dan satuan dijadikan ‘daun’.

Dari contoh data pada tabel 2.15 di bawah dihasilkan diagram batang-
dan-daun seperti terlihat pada diagram 2.8.

Tabel 2.15 Contoh data yang telah diurut untuk pembuatan


diagram batang-dan –daun

41 45 49 51 52 53 55 56 56 57
57 58 59 59 60 61 61 62 63 63
65 65 65 67 67 67 67 69 69 69
69 70 71 71 71 73 73 73 73 73
75 75 77 77 77 79 79 81 81 81
83 83 87 89 89 92 92 93 94 96

29
4* | 159
5* | 12356677899
6* | 01123355577779999
7* | 0111333335577799
8* | 11133799
9* | 22346

Diagram 2.8. Diagram batang-dan-daun yang dihasilkan dari


data pada tabel 2.15

30
LAMPIRAN 2A BAGIAN-BAGIAN TABEL
1. Judul (title).
- ditempatkan di atas tabel
- memberikan deskripsi yang singkat dan eksplisit mengenai isi tabel
- terdiri atas:
a. nomor tabel (table number) jika ada lebih daripada satu tabel
b. cakupan dan jangkauan informasi
c. periode sehubungan dengan isi tabel
d. cara pengumpulan informasi
e. unit pengukuran apabila tak disebutkan di bagian lain tabel
f. jika judul terlalu panjang, sebagian di antaranya ditulis di bawah
judul utama(sebagai headnote)

2. Caption kolom (column caption)


- Klasifikasi yang dianggap lebih penting disusun per kolom
- Caption untuk tiap kolom diletakkan pada puncak tiap kolom
- Kolom disusun menurut urutan kepentingannya, menurut abjad, atau
menurut urutan waktu

3. Stub / caption baris (row caption)


Terletak pada sisi terkiri baris yang berkaitan

4. Badan tabel (body)


- Himpunan entry yang termuat pada sel-sel tabel yang relevan

5. Catatan kaki (footnote)


- Sumber informasi biasanya dicantumkan di bawah tabel

31
Contoh tabel dan bagian-bagiannya

32
LATIHAN 2
Bagian Pertama
Pilihlah satu jawaban yang paling benar !

1. Jarak antara kelas yang satu dengan kelas lainnya secara berurutan pada
tabel distribusi frekuensi dinamakan:
A. Rentang
B. Interval kelas
C. Limit kelas (class limit)
D. Batas kelas (class boundary)

2. Array adalah:
A. Kumpulan data yang sudah di urutkan dari yang terkecil ke yang
terbesar
B. Kumpulan data yang telah disusun dalam bentuk distribusi
frekuensi
C. Kumpulan data yang memiliki lebih daripada satu modus
D. Semuanya salah

3. Misalkan dari suatu survei diperoleh data sebanyak 200 item. jika akan
dibuat distribusi frekuensinya, jumlah kelas menurut aturan Sturges
adalah:
A. 5 C. 9
B. 7 D. 12

4. Jika untuk soal No. 3 di atas diketahui pula nilai minimum X min = 35
dan nilai maksimum X max = 164, maka interval kelas adalah:
A. 14 C. 18
B. 15 D. 19

5. Sebuah tabel yang lengkap sekurang-kurangnya terdiri atas:


A. Judul tabel, stub, body, sumber.
B. Judul tabel, stub, body, jumlah.
C. Judul tabel, stub, column caption, body.
D. Judul tabel, column caption, body, sumber.

33
6. Tabel yang baik ialah tabel yang:
A. bersifat self − explanatory.
B. sederhana
C. bersifat self − explanatory dan sederhana.
D. bersifat self − explanatory dan kompleks.

7. Data yang tersusun dalam bentuk distribusi frekuensi dapat disajikan


dalam bentuk grafik berikut, kecuali:
A. Histogram C. Diagram batang
B. Diagram tebar D. Diagram lingkar

8. Ogive adalah:
A. Poligon frekuensi untuk frekuensi kumulatif
B. Histogram untuk distribusi frekuensi relatif
C. Diagram batang untuk distribusi frekuensi mutlak
D. Semuanya salah

9. Diagram batang terutama dianjurkan penggunaannya untuk:


A. Data kategorik nominal
B. Data kategorik ordinal
C. Data numerik yang dikategorisasikan
D. Semuanya salah

10. Secara konseptual, diagram ‘batang-daun-daun’ (stem-and-leaf)


merupakan perpaduan antara penyajian data secara numerik dengan:
A. Histogram C. Piktogram
B. Diagram kotak D. Diagram lingkar

34
11. Dari grafik di bawah ini dapat disimpulkan bahwa:

Diagram. Jumlah penjualan komputer di Toko A, B, dan C


Agustus 2000
A. Jumlah penjualan di Toko B kurang lebih dua kali penjualan di
Toko A.
B. Jumlah penjualan di Toko A kurang lebih sepertiga penjualan di
Toko C.
C. A) dan B) benar.
D. A) dan B) salah.

35
Bagian Kedua
Selesaikan soal berikut:

Angka-angka berikut menunjukkan penghasilan bulanan 84 keluarga


di desa B (dalam ribuan rupiah).

67 52 72 42 21 55 47 66 54 37 37 34
59 51 44 56 48 44 69 56 27 34 47 59
20 51 42 78 35 61 44 51 52 77 82 57
63 73 49 67 33 78 48 47 41 62 72 85
25 72 54 52 108 28 93 37 22 37 66 49
69 42 54 59 58 75 61 66 99 97 51 61
26 73 33 71 64 57 55 56 47 87 68 97

Dengan menggunakan langkah-langkah yang telah Anda pelajari,


susunlah tabel distribusi frekuensi untuk menyajikan ringkasan data di atas
secara deskriptif. Perhatikan juga bagian-bagian yang harus ada pada saat
penyajian tabel.

36
BAB 3
UKURAN STATISTIK
3.1 UKURAN PUSAT (NILAI TENGAH)
 Rerata; Rerata Hitung (Mean; Arithmetic Mean) untuk
Data Tak-berkelompok (Ungroup Data)
Rerata hitung adalah jumlah seluruh angka data dibagi dengan
banyaknya (jumlah) data.
x + x + . . . + xn
x = 1 2
n
n

i
=1
xi
atau x= (3.1)
n

x : rerata sampel
xi : data ke-i variabel acak X; i = 1, 2, . . . , n
n : ukuran sampel (banyaknya anggota sampel)

Untuk populasi:
N

i
Xi
=1
µ = (3.2)
N

µ : rerata populasi (dibaca: myu)


Xi : data ke-i variabel acak X; i = 1, 2, . . . , N
N : ukuran populasi (banyaknya anggota populasi)

Contoh 3.1:
Misalkan dimiliki data tinggi badan 10 orang mahasiswa (dalam cm):
162, 161, 157, 154. 164, 170, 162, 165, 162, 161.
n
n = 10 dan ∑
i
=1
xi = 162 + 161 + . . . + 161 = 1618

37
n

i
=1
xi
1618
sehingga: x= = = 161.8
n 10

 Rerata Hitung untuk Data Berkelompok (Grouped Data)


Rerata sampel:
k

j
f jxj
=1
x= k

j
fj
=1

k

j
f jxj
=1
atau: x= (3.3)
n

x : rerata sampel
xj : titik tengah kelas ke-j; j = 1, 2, . . . , k
fj : frekuensi (banyak anggota) kelas ke-j
n : ukuran sampel (jumlah frekuensi data sampel)

Rerata populasi:
K

j
fjX j
=1
µ = K

j
fj
=1

K

j
fjX j
=1
atau: µ = (3.4)
N

µ : rerata populasi
Xj : titik tengah kelas ke-j; j = 1, 2, . . . , K
fj : frekuensi (jumlah anggota) kelas ke-j
N : ukuran populasi (jumlah frekuensi data populasi)

38
Contoh 3.2:
Lihat kembali data berat badan 64 mahasiswa Psikologi Gunadarma
pada tabel 2.3.

Tabel 3.1. Perhitungan rerata berat badan


mahasiswa Psikologi Gunadarma

Berat badan Titik tengah: Frekuensi:


fj Xj
(kg) Xj fj
36-44 40 20 800
45-53 49 29 931
54-62 58 17 986
63-71 67 5 335
72-80 76 1 76
81-89 85 1 85
90-98 94 1 34
Jumlah 64 3,307

3, 307
x = = 51.67
64

Keunggulan rerata:
1. Lebih dikenal, sehingga penggunaannya pun lebih mudah .
2. Setiap dapat digunakan data kuantitatif memiliki dan hanya memiliki
satu rerata.
3. Karena kumpulan data hanya memilki satu rerata, maka ukuran pusat
data ini dapat digunakan dengan baik dalam prosedur statistika, seperti
perbandingan dua atau lebih kumpulan data.

Kelemahan rerata:
1. Sangat peka terhadap data ekstrim.
2. Tidak dapat digunakan untuk menentukan ukuran pusat data kualitatif.
3. Untuk data berkelompok, hasil perhitungan tidak mencerminkan rerata
sesungguhnya.
4. Untuk data berkelompok dengan kelas terbuka, rerata-nya tidak dapat
dihitung.

39
 Rerata Geomerik (Geometric Mean)
Misalkan G menyatakan rerata geometrik untuk data x1 , x2 , . . . , xn ,
maka:
n
G n = x1 . x2 . . . xn =  xi (3.5.a)
i =1

log G n = log ( x1 , x2 , . . . , xn = log x1 + log x2 + . . . + log xn


n
n log G = ∑
i =1
log xi
n

i =1
log xi
sehingga: log G = (3.5.b)
n
n
atau: G= n x1 x2 . . . xn = n 
i =1
xi (3.5.c)

Contoh 3.3:
Misalkan jumlah kasus DBD (Demam Berdarah Dengue) di kota B
pada tahun 2000, 2001, 2002, dan 2003 masing-masing adalah 124, 130,
143, dan 158. Rerata geometriknya adalah:

G= n x1 x2 . . . xn

= 4 (124 )(130 )(143)(158) = 138.15

 Rerata Harmonik (Harmonic Mean)


Misalkan H menyatakan rerata harmonik untuk data x1 , x2 , . . . , xn ,
maka:
n
1
1
∑ x
= i =1 i (3.6.a)
H n
n
sehingga: H= n (3.6.b)
1

i =1 xi

40
Contoh 3.4:
Misalkan kelajuan sebuah mobil adalah 60 km/jam selama
menempuh kilometer pertama, 80 km/jam pada kilometer kedua, dan 65
km/jam pada kilometer ketiga. Rerata kelajuan mobil tersebut (dihitung
sebagai rerata harmonik) dalam km/jam adalah:
n
H= n
1

i =1 xi
3 3
= = = 67.34
1 1 1 1 1 1
+ + + +
x1 x2 x3 60 80 65

 Rerata Tertimbang (Weighted Mean)


Misalkan W menyatakan rerata tertimbang untuk data x1 , x2 , . . . ,
xn , masing-masing dengan penimbang (bobot) w1 , w2 , . . . , wn , maka
rerata tertimbang adalah:
n

i
wi xi
=1
W= n (3.7a)

i
wi
=1

Jika penimbang dinyatakan dalam proporsi (atau persentase), maka


∑ wi = 1, sehingga:
n
W= ∑
i
wi xi
=1
(3.7.b)

Contoh 3.5:
Misalkan mahasiswa Y mendapatkan nilai 90 untuk tugas harian mata
kuliah Statistika, 80 untuk Ujian Tengah Semester, dan 60 untuk Ujian Akhir
Semester. Jika bobot tugas harian, UTS, dan UAS masing-masing adalah
10%, 60%, dan 30%, maka nilai akhirnya (dihitung sebagai rerata
tertimbang) adalah:
n
W= ∑
i
wi xi
=1
= (0.10)(90) + (0.60)(80) + (0.30)(60) = 75

41
 Rerata Terpangkas (Trimmed mean)
Rerata terpangkas digunakan untuk menghindari pengaruh nilai-nilai
ekstrim terhadap rerata. Untuk menghitungnya, mula-mula data
‘dipangkas’, yaitu dengan membuang sejumlah nilai terendah dan nilai-nilai
tertinggi, misalnya 5% nilai terendah dan 5% nilai tertinggi (atau 10% nilai
terendah dan 10% nilai tertinggi), lalu terhadap sisa data dilakukan
perhitungan rerata hitung seperti biasa.

 Median untuk Data Tak-berkelompok


Median adalah ukuran pusat data yang nilainya terletak di tengah-
tengah kumpulan data yang terurut.
Untuk menentukan median, mula-mula data harus disusun berupa
array, yaitu data yang diurutkan dari yang terkecil sampai dengan yang
terbesar:
X1 , X 2 , X 3 ,..., X n
() ( ) ( ) ( )
X adalah data terkecil (= X min ), sedangkan X adalah data terbesar (=
(1) ( n)
X max ).
Posisi median adalah:
n +1
Pmed = (3.8)
2
sehingga median adalah:

Med = X , n ganjil )
 n+1 
 2 
 

X +X
n n 
2  +1
  2 
Med = , n genap ) (3.8.a)
2

Contoh 3.6:
Lihat kembali data tinggi badan 10 orang mahasiswa pada contoh 3.1:
162, 161, 157, 154, 164, 170, 162, 165, 162, 161. Data diurutkan dalam
bentuk array (dibaca: er-rei) sebagai berikut:

42
X = 154 X = 162
(1) ( 6)
X = 157 X = 162
( 2) (7)
X = 161 X = 164
( 3) (8)
X = 161 X = 165
( 4) (9)
X = 162 X = 170
( 5) (10 )

n = 10, sehingga posisi median adalah Pmed = (10 + 1) 2 = 5.5.


Karena n genap, maka median adalah:
X 5 +X 6
() ( ) 162 + 162
Med = = = 162
2 2

Seandainya n = 9 dan X = 170 tidak ada, maka posisi median


(10 )
adalah Pmed = ( 9 + 1) 2 = 5 dan median adalah Med = X = 162.
( 5)

 Median untuk Data Berkelompok

 ( n 2 ) − fkmed 
Med = Bmed +  i (3.9)
 f med 

Med : median
Bmed : tepi batas kelas bawah pada kelas median (lower class boundary)
i : interval kelas
n : ukuran sampel
fkmed : frekuensi kumulatif sebelum kelas median
f med : frekuensi pada kelas median

Contoh 3.7:
Lihat kembali data berat badan 64 mahasiswa Psikologi Gunadarma
pada tabel 2.3.

43
Tabel 3.2. Distribusi frekuensi berat badan 64 mahasiswa
Psikologi Gunadarma 2003

Berat Badan (kg) Frekuensi Frekuensi kumulatif


36-44 20 20
45-53 19 39
54-62 17 56
63-71 5 61
72-80 1 62
81-89 1 63
90-98 1 64
Jumlah 64

Titik posisi median = 32. Kelas posisi median yaitu kelas ke-2.
Bmed = 44.5
i =9
fkmed = 20
f med = 19
 ( n 2 ) − fkmed 
Med = Bmed +  i
 f med 
 32 − 20 
= 44.5 +  9 = 50.18
 19 

Keunggulan median:
1. Tidak dipengaruhi oleh data ekstrim
2. Mudah dimengerti dan mudah dihitung, baik dari data tak-berkelompok
maupun data berkelompok. Juga dapat dihitung untuk data
berkelompok dengan kelas terbuka.
3. Dapat digunakan untuk data kuantitatif maupun data kualitatif.

Kelemahan median:
1. Hanya dapat ditentukan dari data yang telah diurutkan sehingga
membutuhkan waktu yang tidak sedikit.
2. Dihitung bukan berdasarkan nilai data, tetapi berdasarkan jumlah data,
sehingga sulit dijadikan sebagai ukuran pusat data untuk
menggambarkan kumpulan datanya.

44
 Modus untuk Data Tak-berkelompok
Modus adalah nilai yang memiliki frekuensi tertinggi.

Contoh 3.8:
Lihat kembali data tinggi badan 10 orang mahasiswa pada contoh 3.1:
162, 161, 157, 154, 164, 170, 162, 165, 170, 161. Modus akan lebih mudah
ditentukan jika data tersusun dalam distribusi frekuensi seperti di bawah ini.

Tabel 3.3. Distribusi frekuensi tinggi badan 10 mahasiswa

Tinggi badan (cm) Frekuensi


154 1
157 1
161 2
162 3
164 1
165 1
170 1

Tampak bahwa modus data adalah Mo = 162

 Modus untuk Data Berkelompok

 di 
Mo = Bmo +  i (3.10)
 d1 + d 2 
Mo : modus
Bmo : tepi batas kelas bawah pada kelas modus
i : interval kelas
d1 : frekuensi kelas modus dikurangi frekuensi kelas sebelum kelas
modus
d2 : frekuensi kelas modus dikurangi frekuensi kelas sesudah kelas
modus

45
Contoh 3.9:
Lihat kembali data berat badan 64 mahasiswa Psikologi Gunadarma
pada tabel 2.3 dan distribusi frekuensi beserta frekuensi kumulatifnya pada
tabel 3.2.
Kelas posisi modus yaitu kelas pertama.
Bmo = 35.5
i=9
d1 = 20 ‒ 0 = 20
d 2 = 20 ‒ 19 = 1
 di 
Mo = Bmo +  i
 d1 + d 2 
 20 
= 35.5 +  9 = 44.07
 20 + 1 

Keunggulan modus:
1. Dapat digunakan untuk data kualitatif maupun kuantitatif.
2. Tidak dipengaruhi oleh data ekstrim.
3. Dapat dihitung untuk data berkelompok dengan kelas terbuka.

Kelemahan modus:
1. Dalam kasus-kasus tertentu, kumpulan data tidak memiliki modus.
2. Jika modus justru lebih daripada satu, tidak dapat digunakan sebagai
ukuran pusat data.

Contoh 3.10:
Hitung rerata, median, dan modus distribusi frekuensi berikut:
Tabel 3.4. Distribusi frekuensi IPK 32 orang mahasiswa
IPK Frekuensi
X < 1.5 1
1.5 < X < 2.0 4
2.0 < X < 2.5 5
2.5 < X < 3.0 7
3.0 < X < 3.5 11
X > 3.5 4
Jumlah 32

46
Tabel 3.5. Perhitungan rerata, median, dan modus IPK
32 orang mahasiswa

Xj fj Xj fj Frekuensi kumulatif
1.52 1 1.25 1
1.75 4 7.00 5
2.25 5 11.25 10
2.75 7 19.25 17
3.25 11 35.75 28
3.75 4 15.00 32
Jumlah 32 89.50

a. Rerata:
n

i
Xi
=1 89.50
X= = = 2.80
n 32
b. Median:
Kelas posisi median adalah kelas keempat.
 ( n 2 ) − fkmed 
Med = Bmed +  i
 f med 
16 − 10 
= 2.50 +  0.5 = 2.93
 7 
c. Modus:
Kelas posisi modus adalah kelas kelima.
 di 
Mo = Bmo +  i
 d1 + d 2 
 4 
= 3.00 +  0.5 = 3.18
 4 + 7 

 Kuartil untuk Data Tak-berkelompok


Kuartil membagai sederetan data terurut menjadi empat bagian yang
sama. Terdapat tiga kuartil, yaitu kuartil pertama ( Q1 ), kuartil kedua ( Q2 ),
dan kuartil ketiga ( Q3 ).

47
Posisi kuartil (n < 30):
n+2
Posisi Q1 = )
4
2n + 2 n +1
Posisi Q2 = = ) (3.11)
4 2
= Posisi median
3n + 2
Posisi Q3 = )
4

 Kuartil untuk Data Berkelompok


Nilai kuartil (n > 30):

 ( n 4 ) − fkq 
Q1 = Bq +  i (3.12.a)
 fq 

 ( 3n 4 ) − fkq 
Q3 = Bq +  i (3.12.b)
 fq 

Q1 : kuartil pertama
Q3 : kuartil ketiga
Bq : tepi batas kelas bawah pada kelas kuartil
i : interval kelas
n : ukuran sampel
fkq : frekuensi kumulatif sebelum kelas kuartil
fq : frekuensi pada kelas kuartil

Contoh 3.11:
Lihat tabel 3.5. Tentukan kuartil pertama dan kuartil ketiga!
32
Posisi kuartil pertama: =8
4
Bq = 2.00
i = 0.5

48
fkq = 5
fq = 5
 ( n 4 ) − fkq 
Q1 = Bq +  i
 fq 
8 − 5 
= 2.00 +  (0.5) = 2.25
 5 

Posisi kuartil ketiga:


( 3)( 32 ) = 24
4
Bq = 3.00
i = 0.5
fkq = 17
f q = 11
 ( 3n 4 ) − fkq 
Q3 = Bq +  i
 fq 
 24 − 17 
= 3.00 +  (0.5) = 3.32
 11 

 Desil dan Persentil


Pada desil, deretan data terurut dibagi menjadi 10 bagian yang sama.

Desil ke-1: n/10


Desil ke-2: 2n/10
Desil ke-3: 3n/10
Desil ke-4: 4n/10
Desil ke-5: 5n/10 ← Median
Desil ke-6: 6n/10
Desil ke-7: 7n/10
Desil ke-8: 8n/10
Desil ke-9: 9n/10

49
Contoh 3.12:
Lihat tabel 3.6. Tentukan desil ke-7!

Tabel 3.6. Distribusi frekuensi berat badan 120 siswa SMU


Berat Badan (kg) Frekuensi Frekuensi kumulatif
43.5-47.5 1 1
47.5-51.5 4 5
51.5-55.5 17 22
55.5-59.5 28 50
59.5-63.5 25 75
63.5-67.5 18 93
67.5-71.5 13 106
71.5-75.5 6 112
75.5-79.5 5 117
79.5-83.5 2 119
83.5-87.5 1 120
Jumlah 120

120 × 7
Posisi desil ke-7: = 84
10
Bd (tepi batas bawah kelas desil) : 63.5
i (interval kelas) : 4
fkd (frekuensi kumulatif sebelum kelas desil) : 75
f d (frekuensi pada kelas desil) : 18

Desil ke-7 adalah:


 ( 7 n 10 ) − fkd 
D7 = Bd +  i
 fd 
 84 − 75 
= 63.5 +  (4) = 65.5
 18 

50
Posisi beberapa titik persentil:

Persentil ke-1 n/100


Persentil ke-12 12n/100
Persentil ke-27 27n/100
Persentil ke-87 87n/100
Persentil ke-99 99n/100

Contoh 3.13:
Lihat tabel 3.6. Tentukan persentil ke-67!

120 × 67
Posisi titik persentil ke-67: = 80.4
100
B p (tepi batas bawah kelas persentil) : 63.5
i (interval kelas) : 4
fk p (frekuensi kumulatif sebelum kelas persentil) : 75
f d (frekuensi pada kelas persentil) : 18

Persentil ke-67 adalah:


 ( 67 n 10 0 ) − fk p 
P67 = B p +  i
 fp 
 80.4 − 75 
= 63.5 +  (4) = 64.7
 18 

51
3.2 UKURAN PENYEBARAN
 Rentang (Range)
Rentang adalah selisih antara data terbesar dan data terkecil.
R = X max ‒ X min (3.13)

Contoh 3.14:
Lihat kembali data tertinggi badan 10 mahasiswa pada contoh 3.1.
Data terkecil adalah X min = 154 dan data terbesar adalah X max = 170,
sehingga rentang adalah:
R = X max ‒ X min
= 170 ‒ 154 = 16

 Rentang Inter-kuartil
Rentang inter-kuartil (inter-quartile range) adalah selisih antara
kuartil ketiga dan kuartil pertama.
IQR = Q3 ‒ Q1 (3.14)

Contoh 3.15:
Lihat data IPK 32 orang mahasiswa pada tabel 3.4. Pada contoh 3.11
telah dihitung kuartil pertama Q1 = 2.25 dan kuartil ketiga Q3 = 3.32,
sehingga rentang inter-kuartil adalah:
IQR = Q3 ‒ Q1
= 3.32 ‒ 2.25 = 1.07

 Deviasi Mutlak Rata-rata


Deviasi mutlak rata-rata (mean absolute deviation; MAD) adalah rata-
rata nilai mutlak penyimpangan (deviasi) data terhadap reratanya.
Deviasi mutlak rata-rata untuk populasi adalah:
N

i
Xi − µ
=1
MAD = (3.15)
N

52
dan deviasi mutlak rata-rata untuk sampel adalah:
n

i
xi − x
=1
MAD = (3.15.a)
n

 Variansi dan Standar Deviasi Data Tak-berkelompok


Variansi adalah rata-rata kuadrat deviasi data observasi terhadap
rerata-nya. Variansi data populasi dilambangkan dengan σ 2 (dibaca: sigma
kuadrat), sedangkan variansi data sampel dilambangkan dengan s 2 .
Standar deviasi, disingkat SD adalah akar variansi. Standar deviasi
data populasi dilambangkan dengan σ , sedangkan standar deviasi data
sampel dilambangkan dengan s.
Rumus definisi variansi dan SD untuk populasi:
N

2
( Xi − µ )
σ2 = i=1
(3.16)
N
N

2
( Xi − µ )
i =1
σ = (3.16.a)
N

σ2 : variansi populasi
σ : standar deviasi populasi
Xi : data ke-i variabel random X; i i = 1, 2, . . . , N
µ : rerata populasi
N : ukuran populasi

Rumus definisi variansi dan SD untuk sampel:


n

2
( xi − x )
i
s2 = =1
(3.17)
n −1

53
n

2
( xi − x )
i=1
s= (3.14.a)
n −1

s2 : variansi sampel
s : standar deviasi sampel
xi : data ke-i variabel random X; i = 1, 2, . . . , n
x : rerata sampel
n : ukuran sampel

Dalam praktik, yang digunakan umumnya adalah rumus operasional.

Rumus operasional variansi dan SD untuk populasi:

∑ X i2 − ( ∑ X i ) N 
2

2
σ =  (3.18)
N

∑ X i2 − ( ∑ X i ) N 
2

σ =  (3.18.a)
N

σ2 : variansi populasi
σ : standar deviasi populasi
Xi : data ke-i variabel random X; i = 1, 2, . . . , N
N : ukuran populasi

Rumus operasional variansi dan SD untuk sampel:

∑ xi2 − ( ∑ xi ) n 
2

2
s =  (3.19)
n −1

∑ xi2 − ( ∑ xi ) n 
2

s=  (3.19.a)
n −1

s2 : variansi sampel
s : standar deviasi sampel
xi : data ke-i variabel random X; i = 1, 2, . . . , n
n : ukuran sampel

54
Contoh 3.16:
Lihat kembali data tinggi badan 10 mahasiswa pada contoh 3.1.

Tabel 3.7. Perhitungan variansi dan standar deviasi tinggi badan


10 mahasiswa
2
Tinggi badan (= X i ) Rerata (= X ) ( Xi − X ) ( Xi − X ) X i2
162 161.8 0.2 0.04 26,244
161 161.8 −0.8 0.64 25,921
157 161.8 −4.8 23.04 24,649
154 161.8 −7.8 60.84 23,716
164 161.8 2.2 4.84 26,896
170 161.8 8.2 67.24 28,900
162 161.8 0.2 0.04 26,244
165 161.8 3.2 10.24 27,225
162 161.8 0.2 0.04 26,244
161 161.8 −0.8 0.64 25,921
1,618 0 167.60 261,960

n

2
( Xi − X )
i
s2 = =1

n −1
167.60
= = 18.62
10 − 1
s = 18.62 = 4.32

Dengan rumus operasional:


∑ X i2 − ( ∑ X i ) n 
2

2
s = 
n −1
261,960 − (1, 618 ) 10 
2

=   = 18.62
10 − 1

55
 Variansi dan Standar Deviasi Data Berkelompok
Rumus definisi variansi SD untuk populasi:
K 2 K 2
∑ (
fj X j −µ ) ∑ (
fj X j −µ )
σ2 = j =1
K
= j =1
(3.20)
N
∑ fj
j =1

K 2
∑ f j (X j − µ)
j =1
σ = (3.20.a)
N

σ2 : variansi populasi
σ : standar deviasi populasi
Xj : titik tengah kelas ke-j; j = 1, 2, . . . , K
µ : rerata populasi
fj : frekuensi kelas ke-j
K
N : ukuran populasi (= ∑ f j )
j =1

Rumus definisi variansi dan SD untuk sampel:


k 2
∑ (
f j xj − x )
s2 = j =1
(3.21)
n −1
k 2
∑ f j (xj − x)
j =1
s= (3.21.a)
n −1

s2 : variansi populasi
s : standar deviasi populasi
xj : titik tengah kelas ke-j; j = 1, 2, . . . , k
x : rerata sampel
fj : frekuensi kelas ke-j
k
N : ukuran sampel (= ∑ f j )
j =1

56
Dalam praktik, yang digunakan umumnya adalah rumus operasional.

Rumus operasional variansi dan SD untuk populasi:

f j X 2j −  N 
2
∑ 
(∑ f j X j ) 
σ2 = (3.22)
N

∑ f j X 2j − ( ∑ f j X j ) N 
2

σ =  (3.22.a)
N

σ2 : variansi populasi
σ : standar deviasi populasi
Xj : titik tengah kelas ke-j: j = 1, 2, . . . , K
fj : frekuensi kelas ke-j
N : ukuran populasi

Rumus operasional variansi untuk sampel:

∑ f j x 2j − ( ∑ f j x j ) n 
2

s2 =  (3.23)
n −1

f j x 2j −  ∑ f j x j n 
2
∑ (
) 
s= (3.23.a)
n −1

s2 : variansi sampel
s : standar deviasi sampel
xj : titik tengah kelas ke-j; j = 1, 2, . . . , k
fj : frekuensi kelas ke-j
n : ukuran sampel

Contoh 3.17:
Lihat kembali data berat badan 64 mahasiswa Psikologi Gunadarma
pada tabel 2.3. Pada contoh 3.2 telah dihitung nilai reratanya X = 51.67.

57
Tabel 3.8. Perhitungan variansi dan standar deviasi berat badan 64
mahasiswa Psikologi Gunadarma dengan rumus definisi
2
Titik tengah: X j Deviasi: ( X i − X ) Frekuensi: f j f j ( Xi − X )
40 −11.67 20 2,724.65
49 −2.67 17 135.64
58 6.33 17 680.77
67 15.33 5 1,174.76
76 24.33 1 591.86
85 33.33 1 1,791.67
94 42.33 1 1,791.67
Jumlah 0 64 8,210.11

Variansi-nya adalah:
k 2
∑ (
fj X j − X )
s2 = j =1

n −1
k
∑ 8, 210.11
j =1
` = = 130.32
64 − 1
Dengan rumus operasional, terlebih dahulu harus dihitung f j X j dan
f j X 2j .

Tabel 3.9. Perhitungan variansi dan standar deviasi berat badan 64


mahasiswa Psikologi Gunadarma dengan rumus operasional
Titik tengah: X j Frekuensi: f j fj Xj f j X 2j
40 20 800 32,000
49 19 931 45,619
58 17 986 57,188
67 5 335 22,445
76 1 76 5,776
85 1 85 7,225
94 1 94 8,836
Jumlah 64 3,307 179,089

58
Variansi-nya adalah:
 2
n 
∑ f j j  ∑ j j
x 2
−(
f x ) 
s2 =
n −1
179, 089 − ( 3,307 ) 64 
2

=   = 130.32
64 − 1

Standar deviasi adalah:


s = 130.32 = 11.42

 Koefisien Variansi
Koefisien variasi (coefficient of variation; CV) adalah nilai standar
deviasi dibagi dengan rerata. Koefisien merupakan ukuran penyebaran data
yang tak memiliki satuan, karena itu dapat digunakan untuk membandingkan
penyebaran data 2 variabel yang memiliki satuan berbeda, misalnya tinggi
dan berat badan.
Koefisien variansi untuk populasi adalah:
σ
CV = (3.24)
µ
dan koefisien variansi untuk sampel adalah:
s
CV = (3.24.a)
x
Koefisien variansi juga dapat dinyatakan dalam persentase, yaitu CV
= ( σ / µ ) 100% untuk populasi dan CV = (s/ x ) 100% untuk sampel.

Contoh 3.18:
Lihat kembali data tinggi badan 10 mahasiswa pada contoh 3.1. Pada
contoh 3.1. telah dihitung rerata-nya xa = 161.8 cm dan pada contoh 3.16
telah dihitung standar deviasi-nya sa = 4.32 cm, sehingga koefisien variansi-
nya adalah:
s
CVa = a (100%)
xa

59
4.32
= (100%) = 2.67%
161.8
Misalkan untuk kelompok mahasiswa yang sama diketahui pula data
berat badannya dengan rerata xb = 54.4 kg dan standar deviasi sb = 6.75 kg,
sehingga koefisien variasi-nya adalah:
s
CVb = b (100%)
xb
6.75
= (100%) = 12.41%
54.4
Tampak bahwa ukuran berat badan mahasiswa jauh lebih menyebar
dibandingkan ukuran tinggi badan pada kelompok mahasiswa yang sama.

60
LAMPIRAN 3A: UKURAN PUSAT PADA
DISTRIBUSI SIMETRIS DAN ASIMETRIS
Pada diagram 2.3 dapat dilihat gambaran distribusi frekuensi sampel
yang berasal dari populasi kontinu, namun telah dikategorisasikan. Jika
sampel yang berasal dari distribusi kontinu diperbesar ukurannya sampai
menjadi tak berhingga dan diperbanyak jumlah kelasnya sampai menjadi tak
berhingga banyaknya (atau tidak dilakukan kategorisasi lagi), akan diperoleh
beberapa gambaran seperti terlihat pada diagram III.1 di bawah ini.

Diagram III.1. Distribusi frekuensi sampel dari populasi kontinu yang


dikategorisasikan dengan berbagai jumlah kelas

Seandainya populasi berdistribusi simetris, maka dapat diperoleh


gambaran seperti pada diagram III.2. Pada populasi simetris, posisi rerata,
median, dan modus berimpit pada satu titik (nilai-nilai ketiganya sama
besar).

Diagram III.2. Posisi ukuran tengah pada distribusi simetris: rerata,


median, dan modus berimpit pada satu titik

61
Jika nilai-nilai besar lebih banyak daripada nilai-nilai kecil, akan
didapatkan gambaran distribusi asimetris dengan ekor yang lebih panjang di
sisi kanan, seperti pada diagram III.3. Distribusi seperti ini disebut juga
“menceng ke kanan” (skewed to the right). Distribusi ini dapat dianggap
berasal dari distribusi simetris dengan penambahan sejumlah nilai-nilai
ekstrim yang besar. Penambahan nilai-nilai ekstrim yang besar terutama akan
mempengaruhi nilai rerata, sehingga posisi rerata seolah-olah ‘tertarik’ ke
kanan, sedangkan posisi median hanya ‘tertarik’ sedikit (nilai median sedikit
terpengaruh), sedangkan posisi modus tidak berubah.

Diagram III.3. Posisi ukuran tengah pada distribusi menceng ke kanan:


dari ke kiri ke kanan didapatkan modus, median, dan rerata

Keadaan sebaliknya ditemukan pada diagram III.4, yang


menggambarkan distribusi ‘menceng ke kiri’ (skewed to the left). Distribusi
ini dapat dianggap berasal dari distribusi simetris dengan penambahan nilai-
nilai ekstrim kecil, yang mengakibatkan posisi rerata paling banyak ‘tertarik’
ke kiri, posisi median sedikit ‘tertarik’ dan posisi modus tetap.

Diagram III.4. Posisi ukuran tengah pada distribusi menceng ke kiri:


dari kiri ke kanan didapatkan rerata, median, dan modus

62
LAMPIRAN 3B: FRAKTIL
Matriks III.1. Macam-macam fraktil (kuantil)
Macam Data dibagi menjadi Fraktil
Median 2 bagian Med
Kuartil 4 bagian Q1 , Q2 , Q3 , ( Q4 )
Desil 10 bagian D1 , D2 , D3 , . . . , D9 , ( D10 )
Persentil 100 bagian P1 , P2 , P3 , . . . , P99 , ( P100 )
Matriks III.2. Kesamaan beberapa fraktil

Med
Q1 Q2 Q3
D1 D2 D3 D4 D5 D6 D7 D8 D9
P10 P20 P25 P30 P40 P50 P60 P70 P75 P80 P90

Matriks III.3. Cara menghitung fraktil


Cara eksak: Data kecil (n < 30) Aproksimasi: Data besar (n > 30)
Median √ √
Kuartil √ √
Desil √
Persentil √

Matriks III.4. Posisi fraktil *)


Fraktil Cara eksak Aproksimasi
n 1 n
Med 2+ 2 2
n×i 1 n×i
Qi +
4 2 4
n× j 1 n× j
Dj
10 + 2 10
n× k 1 n× k
Pk +
100 2 100
*) Dalam array (data yang telah diurut dari yang terkecil sampai dengan yang terbesar)

63
Contoh:

a. n = 20; digunakan cara eksak karena n < 30.


n×i 1
Posisi Qi : +
4 2
20 ×1 1
Posisi Q1 : + = 5.5
4 2
20 × 2 1
Posisi Q2 : + = 10.5
4 2
20 × 3 1
Posisi Q3 : + = 15.5
4 2

Jika n < 30 umumnya tidak dilakukan perhitungan desil atau


persentil.

b. n = 60; digunakan cara aproksimasi karena n > 30.


n×i
Posisi Qi :
4
60 ×1
Posisi Q1 : = 15
4
60 × 2
Posisi Q2 : = 30
4
60 × 3
Posisi Q3 : = 45
4

n× j
Posisi D j :
10
60 ×1
Posisi D1 : =6
10
60 × 3
Posisi D3 : = 18
10
60 × 7
Posisi D7 : = 42
10

64
2
LAMPIRAN 3C: NOTASI ∑ ( xi - x ) DAN ∑ ( xi - x )

A. ∑ ( xi − x ) = ∑ xi ‒ ∑ x
Karena x = ∑ i , sehingga ∑ x
x
i = n x ; dan pada pengambilan satu
n
sampel, x merupakan konstante, sehingga ∑ x = n x , maka:
∑ ( xi − x ) = ∑ xi ‒ ∑ x
=nx ‒nx =0

∑ ( xi − x ) ∑ ( xi2 − 2 xxi + x 2 )
2
B. =
= ∑ xi2 ‒ 2 x ∑ xi + ∑ x 2 [ x dan x 2 konstante]
= ∑ xi2 ‒ ( 2 x ) ( nx ) + n x 2
= ∑ xi2 ‒ 2n x 2 + n x 2
= ∑ xi2 ‒ n x 2
2
 ∑ xi 
= ∑ x ‒ n
2

i  n 
 
2
( ∑ xi )
= ∑ xi
2

n

65
LAMPIRAN 3D: DIAGRAM KOTAK
Diagram kotak (diagram kotak-dan-titik; box−plot;
box−and−whisker plot) adalah bentuk grafik yang menyajikan peringkasan
data dalam bentuk kuartil pertama, median, dan kuartil ketiga. Secara kasar
dapat dilihat apakah sebaran data simetris atau tidak, selain itu disajikan pula
‘nilai perbatasan bawah’ (lower adjacent value) dan ‘nilai perbatasan atas’
(upper adjacent value) yang antara lain berguna untuk menyimpulkan ada
tidaknya ‘data pencilan’ (outlier).

Tabel III.1. Rincian nilai skala Depresi MMPI-2 45 mahasiswa wanita


Psikologi Gunadarma 2003 dalam bentuk array
x1 x2 x3 x4 x5 x6 x7 x8 x9 x 10 x 11 x 12
() ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
16 17 17 18 19 19 19 21 21 21 21 21

x 13 x 14 x 15 x 16 x 17 x 18 x 19 x 20 x 21 x 22 x 23
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
22 23 23 23 23 23 23 23 24 24 24

x 24 x 25 x 26 x 27 x 28 x 29 x 30 x 31 x 32 x 33 x 34
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
24 25 25 25 25 25 26 26 26 27 27

x 35 x 36 x 37 x 38 x 39 x 40 x 41 x 42 x 43 x 44 x 45
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
28 28 29 29 29 30 31 31 32 32 37

Sumber: Hasil tes MMPI-2 kelas 2PA01 TA 2003/2004

n 45 1
Posisi Q1 = = = 11 ≈ 11
4 4 4
Q1 = x 11 = 21
( )

Posisi Q2 = Med =
2n
=
( 2 )( 45) = 22 1
4 4 2
x 22 + x 23
( ) ( )
Q2 = Med = = 24
2

66
Posisi Q3 =
3n
=
( 3)( 45 ) = 33 3 ≈ 34
4 4 4
Q3 = x 34 = 27
( )
IQR (rentang inter-kuartil) = Q3 – Q1 = 27 – 21 = 6
1.5 IQR = (1.5)(6) = 9

LF (lower fence; pagar bawah):


LF = Q1 – 1.5 IQR = 21 – 9 = 12
LAV (lower adjacent value; nilai perbatasan bawah) adalah nilai x
terkecil yang lebih besar daripada LF:
LAV = x 1 = 16
()
UF (upper fence; pagar atas):
UF = Q3 + 1.5 IQR = 27 + 9 = 36
UAV (upper adjacent value; nilai perbatasan atas) adalah nilai x
terbesar yang lebih kecil daripada UF:
UAV = x 43 = x 44 = 32
( ) ( )
‘Nilai perbatasan bawah’ dan nilai perbatasan atas’ masing-masing
merupakan nilai minimum dan nilai maksimum data yang masih belum
tergolong ‘data pencilan’. Nilai yang lebih kecil daripada ‘nilai perbatasan
bawah’ atau lebih besar daripada ‘nilai perbatasan atas’ (dengan sendirinya
juga lebih kecil daripada ‘pagar bawah’ atau lebih besar daripada ‘pagar
atas’) disebut sebagai ‘data pencilan’ (outlier).
Terdapat 1 nilai data pencilan, yaitu x 45 = 37 (lihat diagram III.5).
( )

67
Diagram III.5. Diagram kotak skala Depresi MMPI-2 45
mahasiswa wanita Psikologi Gunadarma 2003

68
LATIHAN 3

Bagian Pertama

Pilihlah satu jawaban yang paling benar !

1. Ukuran-ukuran berikut merupakan ukuran pusat sekaligus ukuran


lokasi, kecuali:
A. Rerata (mean) C. Variansi
B. Median D. Modus

2. Jumlah seluruh angka data dalam kelompoknya dibagi dengan


banyaknya data disebut:
A. Rerata hitung (arithmetic mean)
B. Rerata geometrik (geometric mean)
C. Rerata harmonik (harmonic mean)
D. Rerata terpangkas (trimmed mean)

3. Jika deviasi suatu nilai terhadap tiap observasi lainnya dijumlahkan,


dan hasil penjumlahannya sama dengan nol, maka nilai tersebut adalah
nilai:
A. Rerata C. Modus
B. Median D. Semuanya salah

4. Jika setengah di antara seluruh observasi nilai-nilainya lebih kecil


daripada suatu nilai tertentu, dan setengah observasi lainnya nilai-
nilainya lebih besar daripada nilai tertentu tersebut, nilai tertentu itu
adalah nilai:
A. Rerata C. Modus
B. Median D. Rerata harmonik.

5. Keunggulan rerata (mean) antara lain yaitu:


A. Tidak dipengaruhi oleh data ektrim
B. Dapat digunakan untuk menentukan ukuran pusat data kategorik
C. A) dan B) benar
D. A) dan B) salah

69
6. Keunggulan median antara lain yaitu:
A. Tidak dipengaruhi oleh data ektrim
B. Dapat digunakan untuk menentukan ukuran pusat data kategorik
C. A) dan B) benar
D. A) dan B) salah

7. Salah satu kelemahan modus yaitu:


A. Tidak dapat digunakan untuk data kuantitatif
B. Sangat peka terhadap data ekstrim
C. Tidak dapat dihitung untuk data berkelompok dengan kelas
terbuka
D. Tidak semua kumpulan data memiliki modus

8. Pernyataan berikut yang tidak benar mengenai konsep kuantil


(fraktil):
A. Kuartil II = median C. Desil 3 = kuartil I
B. Persentil 75 = kuartil III D. Desil 1 = persentil 10

9. Rentang inter-kuartil (inter-quartile range) adalah:


A. Kuartil IV - kuartil 0 C. Kuartil III – kuartil II
B. Kuartil IV – kuartil II D. Semuanya salah

10. Penyebaran data dapat dinilai dari ukuran berikut, kecuali:


A. Rentang inter-kuartil C. Standar deviasi
B. Deviasi mutlak rata-rata D. Kemencengan

11. Variansi (data tak berkelompok) bagi populasi berhingga adalah:


A. Rata-rata deviasi data observasi terhadap rerata-nya
B. Rata-rata kuadrat deviasi data observasi data observasi terhadap
rerata-nya
C. Kuadrat rata-rata deviasi data observasi terhadap rerata-nya
D. Akar rata-rata kuadrat deviasi data observasi terhadap rerata-nya

12. Ukuran variansi yang terbaik untuk membandingkan variasi berat


badan dan variasi tinggi badan adalah:
A. Rentang C. Standar deviasi
B. Rentang inter-kuartil D. Koefisien variasi

70
n
13. ∑
i =1
( xi − x )
A. Selalu lebih besar daripada nol
B. Selalu sama dengan nol
C. Dapat lebih kecil daripada nol
D. Semuanya salah

n

2
14. ( xi − x ) =
i =1
2
 n 
n  ∑ xi 
A. 0 C. ∑ xi ‒  i =1 
2

i =1 n
n
B. ∑
i =1
xi2 + nx 2 D. Semuanya salah

15. Himpunan data X1 , X 2 , . . . , X n memiliki rerata (mean) sama dengan


5, maka himpunan data ( X1 + 25), ( X 2 + 25), . . . , ( X n + 25) akan
memiliki rerata:
A. X =5 C. X = 30
B. 5 < X < 30 D. X > 30

16. Himpunan data X1 , X 2 , . . . , X n memiliki standar deviasi sama


dengan 8, maka himpunan data ( X1 + 20), ( X 2 + 20), . . . , ( X n + 20)
akan memiliki standar deviasi:
A. SD = 8 C. SD = 28
B. 8 < SD < 28 D. SD > 28

17. Himpunan data X1 , X 2 , . . . , X n memiliki standar deviasi sama


dengan 8, maka himpunan data 2 X1 , 2 X 2 , . . . , 2 X n akan memilki
standar deviasi:
A. SD = 16 C. SD = 56
B. 16 < SD < 56 D. SD > 56

18. Peringkasan data secara grafikal yang menampilkan nilai-nilai kuartil I,


median, dan kuartil III didapatkan pada:
A. Diagram batang-daun-daun C. Diagram titik
B. Diagram kotak D. Semuanya benar

71
19. Diagram kotak antara lain berguna untuk:
A. Menilai simetris atau tidaknya sebaran data
B. Menilai ada tidaknya data pencilan
C. Keduanya benar
D. Keduanya salah

20. Data pencilan (outlier) adalah:


A. Data yang nilainya lebih kecil daripada ‘pagar bawah’
B. Data yang nilainya lebih besar daripada kuartil ketiga ditambah
dengan satu setengah kali rentang inter-kuartil
C. Data yang nilainya lebih besar daripada ‘nilai perbatasan atas’
D. Semuanya benar

Bagian Kedua

Pilihlah satu jawaban yang paling benar !

Untuk soal nomor 1 s.d. 6:


Diketahui data hasil ujian Ilmu Alamiah Dasar sekelompok
mahasiswa sebagai berikut:
72, 86, 63, 59, 74, 67, 74, 77, 63, 74, 82, 67

1. Rerata-nya ( mean ) ialah:


A. 71.50 C. 74.00
B. 73.00 D. 78.00

2. Mediannya adalah:
A. 71.50 C. 74.00
B. 73.00 D. 78.00

3. Modusnya yaitu:
A. 71.50 C. 74.00
B. 73.00 D. 78.00

4. Kuartil I dan kuartil III masing-masing adalah:


A. 63 dan 77 C. 65 dan 75.5
B. 63 dan 79.5 D. 67 dan 82

72
5. Rentang-nya (rentang) adalah:
A. 22.5 C. 25
B. 24 D. 27

n
6. Jika diketahui ∑
i =1
xi2 = 62.058, dengan menggunakan pembagi (n – 1)

hitunglah variansi dan standar deviasinya:


A. 59.25 dan 7.70 C. 75.34 dan 8.68
B. 64.64 dan 8.04 D. 83.72 dan 9.15

Untuk soal No. 7 s.d 9:


Misalkan dimiliki data hasil ujian Statistika 10 orang mahasiswa:
75, 40, 80, 55, 90, 70, 55, 60, 60, 55.

7. Rerata data tersebut adalah:


A. 55 C. 64
B. 60 D. 71.7

8. Median data tersebut adalah:


A. 55 C. 64
B. 60 D. 71.7

9. Deviasi mutlak rata-ratanya adalah:


A. 11.8 C. 20
B. 14.7 D. 50

Untuk soal No. 10 s.d. 14:


Misalkan dimiliki data berikut: n=5 x = 66

i xi xi2
1 ... 2500
2 75 ...
3 64 ...
4 ... ...
5 ... 6400
∑ xi = . . . ∑ xi2 = . . .
2
( ∑ xi ) =...

73
n
10. ∑
i =1
xi =

A. 330 C. 63 800
B. 22 342 D. 108 900

n
11. ∑
i =1
xi2 =

A. 330 C. 63 800
B. 22 342 D. 108 900

2
 n 
12.  ∑ xi  =
 i =1 
A. 330 C. 63 800
B. 22 342 D. 108 900

4

2
13. ( 2 xi + 12 ) =
i =2
A. 330 C. 63 800
B. 22 342 D. 108 900

14. s=
A. 10.6 C. 112.4
B. 11.9 D. 140.5

Bagian Ketiga
Selesaikanlah soal-soal berikut:
Lihat kembali soal Latihan 2 Bagian Kedua. Hitunglah rerata,
variansi, dan standar deviasi penghasilan bulanan 84 keluarga di desa B:
A. Sebagai data tak berkelompok
B. Sebagai data berkelompok.

Petunjuk:
- Untuk soal A, gunakan rumus operasional. ∑ xi dan ∑ xi2 dihitung
dengan menggunakan program komputer Excel.
- Untuk soal B, gunakan tabel distribusi frekuensi yang telah disusun pada
soal Latihan 2 Bagian Kedua.

74
BAB 4
PROBABILITAS
4.1 KONSEP DASAR PROBABILITAS
 Himpunan (set)
a. Himpunan berhingga. Contoh:
− A adalah himpunan mahasiswa kelompok I mata kuliah Statistika
kelas 2PA01, maka:
A = {Agustin, Anita, Endang, . . . , Yenny}
− B adalah himpunan buah yang dijual di sebuah supermarket,
maka:
B = {jeruk, pepaya, melon, . . .}
− C adalah angka-angka yang tampak di permukaan sebuah dadu,
maka:
C = {1, 2, 3, 4, 5, 6}
b. Himpunan tak berhingga:
− D adalah himpunan nilai-nilai IP semester yang mungkin
diperoleh mahasiswa Gunadarma, maka:
D = {x | 0 < x < 4}
(dibaca: x adalah sedemikian hingga x lebih besar atau sama
dengan nol dan x lebih kecil atau sama dengan empat)

 Pengertian Peristiwa, Ruang Sampel


Himpunan yang unsur-unsurnya merupakan hasil yang mungkin
pada suatu percobaan dinamakan ruang sampel (sampel space). Unsur suatu
ruang sampel dinamakan titik sampel.
Suatu peristiwa (event; kejadian) adalah himpunan bagian suatu
ruang sampel.Peristiwa sederhana (simple event) adalah peristiwa yang
hanya memuat satu unsur. Peristiwa bersusun (composite event) merupakan
gabungan (union) dua atau lebih peristiwa sederhana.
Jika suatu percobaan telah dilakukan dan hasil yang diperoleh
termasuk dalam himpunan bagian A dikatakan peristiwa A telah terjadi.

75
Ruang sampel ditulis dengan lambang ‘S’ ( = semesta), peristiwa
dengan huruf besar A, B, C, . . . . Jika suatu percobaan menghasilkan n
kemungkinan peristiwa, ruang sampelnya disajikan sebagai:
S = { a1 , a2 , . . . , an } (4.1)
dengan a1 , a2 , . . . , an menyatakan semua hasil yang mungkin terjadi pada
percobaan itu. A = { a2 , a4 } menunjukkan peristiwa yang hanya terdiri dari
hasil a2 dan a4

Contoh 4.1:
1) Percobaan : Pelontaran sebuah dadu
Hasil : Mata dadu yang tampak di atas.
Ruang sampel S = {1, 2, 3, 4, 5, 6}
Salah satu peristiwa : A = titik ganjil tampak
= {1, 3, 5}
2) Percobaan : Pelontaran sebuah mata uang logam dua kali.
Salah satu hasil : MB (hasil pelontaran pertama adalah muka,
dan hasil pelontaran kedua adalah belakang.
Ruang sampel : S = {MM, MB, BM, BB}
Contoh peristiwa : A = paling sedikit satu muka
= {MM, MB, BM}
B = kedua hasil sama
= {MM, BB}

3) Percobaan : Pemilihan seorang mahasiswa secara acak


(random) dan pencatatan indeks prestasinya.
Hasil : Bilangan X di antara 0 dan 4
Ruang sampel : S = {0 < x < 4}, yaitu himpunan bilangan
real di antara 0 dan 4, termasuk.
Contoh peristiwa : A = IP di atas 3
= {3 < x < 4}
B = IP di bawah 2
= {0 < x < 2}

4) Percobaan : Pelemparan sepasang dadu, satu merah dan


satu putih.
Hasil : Dapat dinyatakan sebagai (i, j) dengan i
menyatakan titik yang tampak di atas pada

76
dadu merah, j menyatakan titik yang tampak
di atas pada dadu putih.
Ruang sampel : S = 6 × 6 pasangan berurut (i, j) dengan i = 1,
2, 3, 4, 5, 6 dan j = 1, 2, 3, 4, 5, 6.

Contoh peristiwa:
a) A = jumlah titik yang tampak sama dengan 7
= {(1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)}
b) B = kedua hasil sama
= {(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)}

 Operasi Himpunan (Union, Interseksi, Komplemen suatu


Peristiwa)
 Union (gabungan) dua peristiwa A, B dinyatakan dengan lambang
A ∪ B , adalah himpunan semua unsur yang termasuk dalam A atau
termasuk dalam B (juga yang termasuk dalam keduanya, jika ada).
 Interseksi (irisan) dua peristiwa A, B dinyatakan dengan lambang
A ∩ B , adalah himpunan semua unsur yang termasuk dalam A dan
termasuk dalam B sekaligus.
 Komplemen peristiwa A dinyatakan dengan lambang AC (atau A ),
adalah himpunan semua unsur yang tidak termasuk dalam A (relatif
terhadap S).

Operasi himpunan demikian dapat disajikan dalam diagram Venn


(diagram 4.1).

77
Diagram 4.1. Diagram Venn: union, interseksi, komplemen

Contoh 4.2:

1) Sebuah kartu diambil secara acak dari satu dek kartu bridge.
Didefinisikan peristiwa-peristiwa berikut:
A = kartu yang terambil adalah Ace.
B = kartu yang terambil adalah ♥
C = kartu yang terambil adalah .
D = kartu yang terambil adalah Merah
E = kartu yang terambil adalah Hitam
Maka:
B ∪C = kartu yang terambil adalah ♥ atau 
B ∩C = karena satu kartu tidak dapat berupa ♥ dan 
sekaligus.
B ∪C ∪ E = S = D ∪ E
A∩C = kartu yang terambil adalah Ace 
C
D = kartu yang terambil bukan Merah = E

78
C
(B ∪C) = DC = E
∅ adalah himpunan kosong yang tak mempunyai anggota, = {}.

2) Jika sebuah dadu dilemparkan, dan A = {1, 3, 5}; B = {1}; dan C = {2,
4, 6}, maka:
A ∪ C = {1, 2, 3, 4, 5, 6} = S
AC = {2, 4, 6} = C
A ∪ B = {1, 3, 5} = A
B ∪ C = {1, 2, 4, 6}
A∩C = ∅
A ∩ B = {1} = B
BC = {2, 3, 4, 5, 6}
C
B ∩ A = {3, 5}

3) Jika X menyatakan IP seorang mahasiswa, dan A = {3 < x < 4}; B = {0


< x < 2}; C = {1.5 < x < 3}, maka:
A∪C = {1.5 < x < 4}
A∩C = ∅
B ∩C = {1.5 < x < 2}
A ∪ B ∪ C = {0 < x < 4} = S
AC = {0 < x < 3} = B ∪ C
C
A ∪C = {0 < x < 3} = AC

Hukum De Morgan:
C
a) ( A ∪ B) = AC ∩ BC (4.2.a)
C
b) ( A ∩ B) = AC ∪ BC (4.2.b)

Hukum distributif:
a) A ∩ ( B ∪ C ) = ( A ∩ B) ∪ ( A ∩ C ) (4.3.a)

b) A ∪ ( B ∩ C ) = ( A ∪ B) ∩ ( A ∪ C ) (4.3.b)

Partisi:
Misalkan dimiliki himpunan A dengan sejumlah himpunan bagian-
nya A1 , A 2 , . . . , An ..

79
a) Himpunan-himpunan bagian A1 , A 2 , . . . , An dikatakan ‘saling
asing’ (mutually exclusive) jika Ai ∩ Aj = ∅ untuk setiap pasangan
nilai (i, j); i = 1, 2, . . . , n; j = 1, 2, . . . , n; i ≠ j.
b) Himpunan-himpunan bagian A1 , A 2 , . . . , An dikatakan ‘terbagi
habis’ (mutually exclusive) jika A1 ∪ A 2 ∪ . . . ∪ An = A.

c) Himpunan-himpunan bagian A1 , A 2 , . . . , An dikatakan merupakan


‘partisi’ himpunan A jika himpunan-himpunan bagian A1 , A 2 , . . . ,
An ‘saling asing’ dan ‘terbagi habis’.

4.2 PROBABILITAS PERISTIWA


 Peristiwa Dengan Probabilitas Sama
Misalkan suatu ruang sampel S mempunyai unsur yang banyaknya
berhingga, dan tiap unsur memiliki probabilitas yang sama untuk terjadi.
Misalkan pula A adalah suatu peristiwa dalam ruang sampel S. Probabilitas P
bahwa peristiwa A akan terjadi jika percobaan dilakukan, didefinisikan
sebagai:
N ( A)
P (A) = (4.4)
N (S )

dengan N (. . .) menyatakan banyaknya unsur dalam peristiwa (. . .).

Contoh 4.3:
1) Jika A adalah peristiwa ‘banyaknya titik ganjil’ pada satu kali
pelontaran sebuah dadu, maka N(A) = 3 dan N(S) = 6, sehingga P(A) =
3/6 = 1/2. Demikian juga P(1) = 1/6 dan P(genap) = 3/6 = 1/2.
2) Dalam pelontaran dua buah dadu, peristiwa ‘berpasangan’ [{1, 1}, {2,
2}, . . . , {6, 6}] terdiri atas 6 unsur. Karena seluruhnya ada 36 unsur
dalam ruang sampelnya (= 62), maka P (berpasangan) = 6/36 = 1/6.
Juga P (jumlah genap) = 18/36 = 1/2.
Untuk setiap peristiwa A, berlaku:
0 < P (A) < 1 (4.5)

80
Selanjutnya:
N (∅ ) 0
P (∅) = = =0 (4.5.a)
N (S ) N (S )
dan:
N (S )
P (S) = =1 (4.5.b)
N (S )

Untuk dua peritiwa A, B, berlaku:


N ( A ∪ B ) = N (A) + N (B) – N ( A ∩ B )

N ( A ∪ B) N ( A) N ( B) ( A ∩ B)
= + –
N (S ) N (S ) N (S ) N (S )

P ( A ∪ B ) = P (A) + P (B) – P ( A ∩ B ) (4.6)

Dua peristiwa A, B, yang saling tidak mempunyai unsur persekutuan,


yaitu A ∩ B = ∅ atau P ( A ∩ B ) = 0 dinamakan ‘saling asing’ (mutually
exclusive atau disjoint).
Untuk setiap dua peristiwa A, B, yang saling asing berlaku hukum
penjumlahan:
P ( A ∪ B ) = P (A) + P (B) (4.7)

Untuk setiap peristiwa A berlaku:


P (A) + P ( AC ) = 1 (4.8)
atau: P ( AC ) = 1 ‒ P (A) (4.8a)

Untuk setiap dua peristiwa A, B, juga berlaku hukum probabilitas


total:
(
P (A) = P ( A ∩ B ) + P A ∩ B C ) (4.9a)

atau: (
P (B) = P ( B ∩ A) + P B ∩ AC ) (4.9.b)

karena ( A ∩ B) dan ( A ∩ BC ) saling asing [ ( B ∩ A) dan ( B ∩ AC ) juga


saling asing].

81
 Definisi Probabilitas
Misalkan ruang sampel S suatu percobaan terdiri atas N unsur [ a1 , a2 ,
. . . , a N ] dan misalkan pula p1 , p2 , . . . , pN adalah bilangan-bilangan non-
negatif yang jumlahnya sama dengan 1. Untuk suatu peristiwa A (himpunan
bagian S), probabilitasnya didefinisikan sebagai:
P (A) = ∑ pi (4.10)
dengan pi menyatakan proporsi tiap hasil ai ; ai adalah unsur yang
termasuk dalam A.

Contoh 4.4:
1) Sebuah dadu dibuat sedemikian hingga dalam jangka panjang sisi dadu
akan tampak di atas dalam proporsi (frekuensi relatif) sebagai berikut:

Sisi dengan titik 1 2 3 4 5 6


Proporsi 0.13 0.18 0.18 0.16 0.15 0.20

S = {1, 2, 3, 4, 5, 6}
A = titik genap = {2, 4, 6}
P(A) = p2 + p4 + p6
= 0.18 + 0.16 + 0.20 = 0.54
C
A = titik ganjil = {1, 3, 5}
P(AC) = p1 + p3 + p5
= 0.13 + 0.18 + 0.15 = 0.46 = 1 – P(A)
2) Sebuah bola diambil secara acak dari sebuah kotak berisi 34% bola
merah, 27% bola putih, 20% bola biru, dan 19% bola hitam. Jika a1
menyatakan peristiwa yang terambil bola merah, a2 putih, a3 biru, dan
a4 hitam, maka ruang sampelnya adalah S = { a1 , a2 , a3 , a4 } dengan
p1 = 0.34, p2 = 0.27, p3 = 0.20, dan p4 = 0.19; ∑ pi = 1.
Misalkan A = bola yang terpilih tidak hitam, maka:
P(A) = p1 + p2 + p3
= 0.34 + 0.27 + 0.20 = 0.81 = 1 − p4
3) Pada pelontaran sepasang dadu, misalkan yang diperhatikan adalah
jumlah titik keduanya. Ruang sampel yang terjadi yaitu S yang

82
memiliki 11 unsur: S = { a2 , a3 , . . . , a12 }. Diperoleh distribusi nilai
probabilitas sebagai berikut:

Hasil a2 a3 a4 a5 a6
Prob. 1/36 2/36 3/36 4/36 5/36

Hasil a7 a8 a9 a10 a11 a12


Prob. 6/36 5/36 4/36 3/36 2/36 1/36

Misalkan peristiwa A = jumlah titik genap, maka:


P(A) = p2 + p4 + p6 + p8 + p10 + p12
= 1/36 + 3/36 + 5/36 + 3/36 + 1/36
= 18/36 = 1/2.

4.3 PENCACAHAN RUANG SAMPEL


 Aturan Analisis Kombinatorik dalam Probabilitas
1) Jika suatu percobaan terdiri atas 2 bagian, sedemikian hingga bagian
pertama memberikan k hasil yang berbeda, dan jika dengan tiap hasil
itu dapat terjadi m hasil yang berbeda pada bagian kedua, maka banyak
hasil yang mungkin seluruhnya (banyak cara) adalah: k×m.

Contoh 4.5:
a) Sebuah dadu dilontarkan dua kali berturut-turut. Lontaran pertama
dapat memberikan 6 hasil yang mungkin. Untuk tiap hasil ini, pada
lontaran kedua dapat terjadi 6 hasil yang mungkin.
b) Seorang pria mempunyai 5 kemeja, 3 celana, dan 2 pasang sepatu.
Maka banyak cara ia dapat berpakaian secara berbeda adalah 5 × 3
× 2 = 30.
2) Banyak susunan atau urutan berbeda yang dapat dibentuk oleh k objek
yang diambil dari sekumpulan n objek yang berbeda dinamakan banyak
permutasi k objek dari n objek (dengan memperdulikan urutannya;
dinyatakan dengan lambang Pnk , dihitung dengan rumus:

83
n!
Pkn = (4.11)
( n − k )!
= [(n – k) + 1] . [(n – k) + 2] . [(n – k) + 3] . . . (n – 2) .
(n – 1) . n

Jika k = n, banyak permutasi n objek yang berbeda adalah:


Pnn = 1 . 2 . 3 . . . (n – 2) . (n – 1) . n
Pnn = Pn = n! (4.12)

Catatan: n! dinamakan n faktorial, dengan definisi:


n! = 1 . 2 . 3 . . . (n – 2) . (n – 1) . n
Misalkan 5! = 1 . 2 . 3 . 4 . 5 = 120 dengan definisi tambahan 0! = 1

Contoh 4.6:
Banyak bilangan tiga digit yang dapat dibentuk dengan
menggunakan angka-angka 1, 2, 3, 4, 5 adalah:
‒ Tanpa pengulangan:
P35 = 3 . 4 . 5 = 60
‒ Dengan pengulangan:
5 . 5 . 5 = 125
3) Banyak kombinasi k objek yang diambil dari n objek yang berbeda
(tanpa memperdulikan urutannya; dinyatakan dengan lambang Ckn )
adalah:
n!
Ckn = (4.13)
k !( n − k ) !

Contoh 4.7:
Misalkan dimiliki lima bola dengan warna berbeda-beda. Jika
diambil tiga bola dari kumpulan lima bola itu, banyak kombinasi yang
mungkin adalah:
5!
C35 = = 10
3!2!

84
Perhatikan:
Aturan permutasi digunakan jika peristiwa yang disebutkan memiliki
urutan tertentu pada hasil percobaan. Jika urutan itu tidak penting, digunakan
aturan kombinasi.

 Probabilitas Bersyarat
Misalkan A dan B dua peristiwa dengan P(B) > 0, maka probabilitas
bersyarat (conditional probability) peristiwa A dengan syarat (jika diketahui)
B terjadi adalah:

P ( A ∩ B)
P ( A B) = (4.14)
P (B)

Contoh 4.8:
1) Misalkan dalam sebuah populasi yang terdiri dari 1000 orang memiliki
data berikut:
Buta warna Normal Jumlah

Pria 60 620 680


Wanita 75 245 320

Jumlah 135 865 1000


Jika seorang dipilih secara acak dari populasi tersebut, A peristiwa yang
dipilih seorang pria dan B peristiwa yang dipilih buta warna, maka:

680
P (A ) = = 0.68
1000
135
P (B ) = = 0.135
1000
Probabilitas yang dipilih buta warna, jika diketahui ia seorang pria,
adalah:
60 3
P ( B A) = =
680 34
Tampak bahwa:
N ( A ∩ B) N ( A ∩ B) N (S )
P ( B A) = =
N ( A) N ( A) N ( S )

85
P ( A ∩ B)
P ( B A) = (4.14.a)
P ( A)

2) Sebuah kartu dipilih secara acak dari satu dek kartu bridge, dan
ternyata diperoleh kartu Merah.
a) Probabilitas kartu itu Ace adalah:
P ( Ace | Merah )
P (Ace|Merah) =
P ( Merah )
2 52 1
= = = P(Ace)
26 52 13
b) Probabilitas kartu itu ♥ (Hati) adalah:
P ( Hati ∩ Merah ) 13 52 1
P(Hati|Merah) = = =
P ( Merah ) 26 52 2
13 1
≠ P(Hati) = =
52 4

Dua peristiwa A, B independen jika:


P ( A | B ) = P ( A) (4.15.a)

P ( B | A) = P ( B ) (4.15.b)

Jika tidak A, B dikatakan dependen:


P ( A | B ) ≠ P(A)
P ( B | A ) ≠ P(B)

Pada peristiwa independen berlaku hukum perkalian:


P ( A ∩ B ) = P ( A) . P ( B ) (4.16)

Contoh 4.9:
1) Sebuah kartu diambil secara acak dari satu dek kartu bridge, lalu
dikembalikan, kartu dikocok kembali, lalu diambil kartu kedua secara
acak (sampling dengan pengembalian).
Misalkan A1 adalah peristiwa ‘diperoleh Ace pada pengambilan
pertama’, dan A2 adalah peristiwa ‘diperoleh Ace pada pengambilan
kedua’, maka:

86
4
P(A1) = P(A2) =
52
 4  4 
P ( A1 ∩ A2 ) =     = P(A1) . P(A2)
 52   52 
Jadi A1, A2 independen.
2) Dua kartu diambil secara acak dari satu dek kartu bridge, kartu pertama
tidak dikembalikan terlebih dahulu pada pengambilan kartu kedua
(sampling tanpa pengembalian), maka probabilitas kedua kartu adalah
Ace:
P ( A1 ∩ A2 ) = P(A1) . P(A2|A1)
 4  3   1  1  1
=    =    =
 52   51   13   17  221
3) Sebuah kotak berisi 100 bola, di antaranya hitam dan 40 sisanya putih.
Di antara 100 bola ini, 70 bernomor 0 dan 30 sisanya bernomor 1.
Diketahui pula 42 bola berwarna hitam dan bernomor 0.
Misalkan sebuah bola diambil secara acak, probabilitas bola itu
bernomor 0 (peristiwa A) dan berwarna hitam (peristiwa B) adalah:
42
P ( A ∩ B) = = 0.42
100
70
P(A) = = 0.7
100
60
P(B) = = 0.6
100
P ( A ∩ B ) = P(A) . P(B), sehingga peristiwa A, B independen.
Seandainya ada 48 bola yang berwarna hitam dan bernomor 0, maka:
48
P ( A ∩ B) = = 0.48
100
≠ P(A) . P(B) = (0.7)(0.6) = 0.42

87
LAMPIRAN 4A: SALING ASING DAN INDEPENDEN
A. Saling asing
Dua peristiwa A dan B dikatakan saling asing jika:
- Keduanya memuat unsur (unsur-unsur) yang seluruhnya berasal dari
satu semesta, dengan kata lain memuat unsur-unsur yang berasal dari
satu ruang sampel.
- Kedua peristiwa tidak memiliki unsur persekutuan.

Contoh:
Pada satu kali pelontaran dadu, semestanya adalah {1, 2, 3, 4, 5, 6}
- Misalkan A = {1, 3, 5} dan B = {2, 4, 6}, maka A dan B saling asing.
- Misalkan pula C = {3, 4, 6}, maka A dan C tidak saling asing.

Untuk peristiwa saling asing berlaku hukum penjumlahan:


P ( A ∪ B ) = P(A) + P(B), karena P ( A ∩ B ) = 0

B. Saling independen
Dua peristiwa A dan B dikatakan saling independen jika:
‾ Unsur-unsur peristiwa berasal dari semesta yang berbeda, dengan kata
lain unsur-unsur pada kedua peristiwa merupakan hasil yang mungkin
pada dua percobaan yang berbeda.
‾ Ruang sampel keduanya dapat digabungkan menjadi satu ruang sampel
‘bersama’.

Contoh:
- Misalkan menyatakan hasil yang diperoleh pada pelontaran sebuah
dadu, A = {1, 2, 3, 4, 5, 6}; B menyatakan hasil pelontaran sebuah mata
uang, B = {Muka, Belakang}, maka A dan B saling independen. Kedua
ruang sampel dapat digabungkan menjadi {(1, Muka), (1, Belakang),
(2, Muka), . . . , (6, Belakang)}.
- Sebuah kotak berisi 6 bola merah dan 4 bola hitam. Dua buah bola
diambil berturut-turut tanpa pengembalian. Misalkan A menyatakan
hasil pada pengambilan bola pertama, A = {Merah, Hitam}, dan B hasil
pada pengambilan bola kedua, tidak saling independen, karena
probabilitas hasil-hasil B tergantung pada hasil peristiwa A. Kedua

88
ruang sampel dapat digabungkan menjadi {(Merah, Merah), (Merah,
Hitam), (Hitam, Merah), (Hitam, Hitam)}.

Untuk peristiwa B yang saling independen, berlaku hukum


perkalian:
P ( A ∩ B ) = P(A) . P(B), karena P(A|B) = P(A) dan P(B|A) = P(B).

89
LAMPIRAN 4B: TEOREMA BAYES
Misalkan B merupakan dua peristiwa yang tidak independen dalam
ruang sampel S maka:
P ( A ∩ B)
P(A|B) =
P (B)
P ( A ∩ B)
Dari: P(B|A) =
P ( A)
diperoleh: P ( A ∩ B ) = P(A) . P(B|A)
P ( A) P ( B | A)
sehingga: P(A|B) =
P ( B)
Selain itu denominator (penyebut) P ( B ) dapat dijabarkan menjadi:

(
P(B) = P ( B ∩ A ) + P B ∩ AC )
(hukum probabilitas total)
= P(A) . P(B|A) + P(A ) . P(B|AC)
C

sehingga diperoleh terorema Bayes:


P ( A) P ( B | A)
P(A|B) = (4.17)
( )(
P ( A) P ( B | A) + P AC P B | AC )
Dalam perkembangan selanjutnya, teorema Bayes menjadi sendi
utama bagi pengembangan Statistika Bayesian, suatu aliran Statistika yang
merupakan alternatif bagi Statistika Klasik Neyman-Pearson yang dipelajari
di sini.

Contoh:
Pada berbagai uji diagnostik di bidang kesehatan umumnya dimiliki
dua parameter, yaitu sensitivitas dan spesifisitas. Sensitivitas adalah
probabilitas bahwa seseorang menunjukkan hasil uji positif dengan syarat ia
sakit (menderita penyakit yang diperiksa dengan uji diagnostik tersebut):
Sn = P ( pos | sakit )
sedangkan spesifisitas adalah probabilitas seseorang menunjukkan hasil uji
negatif dengan syarat ia tidak sakit:
Sp = P ( neg | tidak sakit )

90
Dalam praktik, dengan memperoleh hasil uji positif atau negatif, yang
ingin diketahui ialah probabilitas seseorang menderita penyakit dengan
syarat hasil ujinya positif, yaitu P ( sakit | pos ) ataupun probabilitas
seseorang tidak menderita penyakit dengan syarat hasil ujinya negatif, yaitu
P ( tidak sakit | neg ) . Probabilitas ini dapat dihitung jika diketahui proporsi
penderita penyakit tersebut dalam populasi, yaitu probabilitas tidak bersyarat
untuk menderita penyakit tersebut.
Misalkan suatu uji diagnostik untuk penyakit DM (Diabetes Melitus)
diketahui memiliki sensitivitas sebesar 90% dan spesifisitas 70%, dan
diketahui pula proporsi penderita DM dalam populasi adalah 8%, maka:
Didefinisikan:
A : peristiwa subjek menderita DM
AC : peristiwa subjek sehat (tidak menderita DM)
B : peristiwa subjek menunjukkan hasil uji positif
BC : peristiwa subjek menunjukkan hasil uji negatif dan diketahui
bahwa:
P(B|A) = P ( pos | DM ) = Sn = 0.90

( )
P BC | AC = P ( neg | sehat ) = Sp = 0.70

P ( A) = P ( DM ) = 0.08
Selanjutnya:

( )
P BC | A = P ( neg | DM ) = 1 ‒ Sn = 1 ‒ 0.90 = 0.10

P ( B | A ) = P ( pos | sehat ) = 1 ‒ Sp = 1 ‒ 0.70 = 0.30


C

P ( A ) = P ( sehat ) = 1 ‒ 0.08 = 0.92


C

dan: P ( B ) = P ( A ) P ( B A) + P ( A ) P ( B | A )
C C

P ( pos ) = P ( DM ) P ( pos DM ) + P ( sehat ) P ( pos | sehat )


= (0.08)(0.90) + (0.92)(0.30) = 0.348

Sehingga:
P ( A) P ( B A)
P(A|B) =
P ( B)

91
P ( DM ) P ( pos DM )
atau: P ( DM pos ) =
P ( Pos )

=
( 0.08 )( 0.90 ) = 0.2069 = 20.69%
0.348
Kemudian:
P B C = P ( A ) P  B C A  + P AC P  B C AC 
( ) ( )
   
P ( neg ) = P ( DM ) P ( neg DM ) + P ( sehat ) P ( neg sehat )
= (0.08)(0.10) + (0.92)(0.70) = 0.652
Sehingga:
P AC P  BC AC 
( )
P  AC BC   
  P BC ( )
P ( sehat ) P ( neg sehat )
atau: P ( sehat neg ) =
P ( neg )

=
( 0.92 )( 0.70 ) = 0.9877 = 98.77%
0.652
Maka disimpulkan bahwa seseorang yang hasil ujinya positif hanya
memiliki probabilitas sebesar 20.69% untuk menderita DM, sebaliknya
seseorang yang hasil ujinya negatif memiliki probabilitas sebesar 98.77%
untuk tidak menderita DM.

92
LATIHAN 4

Bagian Pertama
Pilihlah satu jawaban yang paling benar!

1. Himpunan yang berisikan semua hasil yang mungkin diperoleh pada


suatu eksperimen dinamakan:
A. Titik sampel C. Peristiwa sederhana
B. Ruang sampel D. Peristiwa kompleks

2. Anggota himpunan gabungan (union) dua peristiwa A atau B adalah:


A. Unsur yang termasuk dalam A
B. Unsur yang termasuk dalam B
C. Unsur yang termasuk dalam keduanya
D. Semuanya benar

3. Anggota himpunan irisan (interseksi) A dan B adalah:


A. Unsur yang termasuk dalam A
B. Unsur yang termasuk dalam B
C. Unsur yang termasuk dalam keduanya
D. Semuanya benar

4. Jika diketahui A dan B saling asing dan ∅ menyatakan himpunan


kosong, maka:
A. A ∪ B = ∅ C. (AC ∪ BC)C = ∅
B. A ∩ B = ∅ D. (AC ∩ BC)C = ∅

5. Area berwarna gelap pada diagram Venn di bawah ini adalah:

A. A ∩ (B ∪ C)
B. AC ∩ (B ∪ C)
C. (A ∩ B) ∪ C
D. (A ∩ B) ∪ (B ∩ C) ∪ (A ∩ C)

93
6. Pada pelontaran sebuah dadu, A menyatakan yang tampak di atas
adalah angka ganjil, B menyatakan yang tampak di atas adalah angka
genap, C menyatakan angka yang tampak di atas lebih besar daripada
5, dan S menyatakan semesta (universe), maka:
A. A ∪ B = S C. B ∪ C = C
B. A ∩ C = S D. B ∩ C = C

7. A1, A2, dan A3 masing-masing merupakan himpunan bagian dari


himpunan A. Jika A1 ∪ A2 ∪ A3 = A, maka hubungan antara A1, A2,
dan A3 dikatakan bersifat:
A. Saling asing (mutually exclusive)
B. Terbagi habis (mutually exhaustive)
C. A) dan B) benar
D. A) dan B) salah

8. Pilihlah pernyataan yang benar:


A. Hukum penjumlahan berlaku pada dua peristiwa yang saling
independen
B. Hukum perkalian berlaku pada dua peristiwa yang saling asing
C. A) dan B) benar
D. A) dan B) salah

9. Sebuah dadu yang setimbang dilontarkan dua kali berturut-turut.


Probabilitas untuk mendapatkan jumlah angka 7 pada kedua
pelemparan adalah:
 1  1  = 1  1  1  = 1
A. 3
 3  4  4 C. 6
 6  6 
      6

 1  1  = 1  1  1  = 7
B. 4
 3  4  3 D. 7
 6  6 
      36

94
10. Sebuah dadu dan sebuah koin, keduanya setimbang, dilontarkan
bersama-sama. Probabilitas untuk mendapatkan angka lebih besar
daripada 4 pada dadu dan sisi belakang koin bersama-sama adalah:
1 1 4 2 1 5
A. + = C. + =
6 2 6 6 2 6
1 1 1 2 1 1
B. . = D. . =
6 2 12 6 2 6

11. Sebuah dadu dan sebuah koin, keduanya setimbang, dilontarkan


bersama-sama. Probabilitas untuk mendapatkan angka genap pada dadu
dan sisi muka koin bersama-sama adalah:
3 1 2 1 5
A. + =1 C. + =
6 2 6 2 6
3 1 1 2 1 1
B. . = D. . =
6 2 4 6 2 6

12. Tiga buah lampu tanda darurat masing-masing mempunyai probabilitas


0.7 akan menyala. Dengan anggapan ketiga lampu itu menyala secara
independen, maka probabilitas bahwa ketiganya menyala adalah:
A. 0.334 C. 0.433
B. 0.343 D. 0.434

Bagian Kedua
Pilihlah satu jawaban yang paling benar!

1. Banyaknya bilangan bulat antara 100−1000 dengan tidak ada digit yang
sama adalah:
A. 648 C. 9(P10)
B. 900 D. 10( P 29 )
2

2. Dua belas pertanyaan dalam ujian harus dijawab dengan B (benar) atau
S (salah). Seorang mahasiswa mencoba menjawab secara acak dengan
6 jawaban B dan 6 jawaban S. Ada berapa cara seperti ini?
A. 900 C. 924
B. 920 D. 1000

95
3. Grup A, B, dan C berturut-turut mempunyai 57, 49, dan 43 orang
anggota. A dan B mempunyai 13 anggota bersama; A dan C mempunyai
7 anggota bersama; B dan C 4 anggota bersama; 1 orang anggota dari
ketiga grup. Probabilitas mendapatkan 1 orang anggota ketiga grup
adalah:
1 1
A. C.
126 151
1 1
B. D.
148 160

4. Lima kartu diambil (tanpa pengembalian) dari 1 set kartu bridge.


Probabilitas tidak ada Ace di antara kelima kartu itu adalah:
48
48 C5
A. C.
52
52 C5

B.
( 48)(5) D.
C5
48

52
C5 52

5. Dari 4 kartu tertutup diketahui 2 berwarna merah dan 2 hitam.


Seseorang menebak warna keempat kartu tersebut. Probabilitas tidak
ada tebakan yang benar adalah:
1 3
A. C.
4 4
C2 C2
2 4
B. D.
4 4
C2 C2

96
6. Satu tahun dianggap terdiri atas 365 hari. Probabilitas paling sedikit 2
orang di antara 5 orang mempunyai tanggal lahir yang sama adalah:
1
A.
5
365
1
B. 1−
5
365

C.
( 365)(364)(363)(362)( 361)
5
365

D. 1−
( 365)(364)(363)(362)( 361)
5
365

7.

Tiga kotak; I, II, dan III masing-masing berisi sejumlah bola putih (p)
dan merah (m). Dari kotak I diambil 1 bola, dimasukkan dalam kotak
II. Kemudian dari kotak II diambil 1 bola, dimasukkan ke dalam kotak
III. Selanjutnya 1 bola diambil dari kotak III. Probabilitas untuk
mendapatkan bola merah pada pengambilan ketiga adalah:
416 418
A. C.
630 630
417 419
B. D.
630 630

97
8. Dari 52 kartu bridge diambil setiap kali 1 kartu berturut-turut tanpa
pengembalian. Berapa probabilitas kartu wajik (diamond) tampak
ketiga kalinya pada pengambilan ke-6?
13
C2 C3
39 13
C 2 C3  11 
39

A.
C5
52
C.
 
C5  47 
52

13
C 2 C3
39
 13  C 2 C3  10 
13 39

B.
 52  D.
 
  C5  39 
52 52
C5

Bagian Ketiga
Selesaikanlah soal-soal berikut!

1. Jika sebuah dadu dilontarkan, dan A = {1, 3}, B = {2, 5, 6}, dan C = {4,
5}, maka:
A. A ∪ B = E. CC =
B. A ∩ B = F. (A ∩ B)C =
C. A ∪ C = G. (B ∪ C)C =
D. A ∩ C = H. (A ∩ C)C =

2. Sebuah dadu dilontarkan dua kali. Peristiwa-peristiwa P, Q, R, dan T


didefinisikan sebagai berikut:
P : Lontaran pertama menghasilkan bilangan genap
Q : Lontaran kedua menghasilkan bilangan ganjil
R : Lontaran kedua menghasilkan angka 1
T : Lontaran pertama menghasilkan angka 6, maka:
A. Elemen-elemen peristiwa P ∩ Q ∩ R adalah: . . .
B. Elemen-elemen peristiwa P ∩ R ∩ T adalah: . . .

3. Di antara 600 orang laki-laki dewasa di desa ‘X’, terdapat 6 orang tuna
aksara, sedangkan di antara perempuan dewasanya didapatkan 8 orang
tuna aksara. Jumlah penduduk dewasa di desa ‘X’ adalah 1000 orang.
Jika seorang penduduk dewasa dipilih secara acak dari desa ‘X’,
hitunglah probabilitas bahwa ia laki-laki dengan syarat ia buta huruf.

98
4. Diketahui 3 peristiwa A, B, dan C. A dan B saling independen, B dan C
saling asing. P (A), P (B), dan P (C) masing-masing adalah 0.5, 0.3,
dan 0.1. Nyatakan peristiwa berikut dalam notasi probabilitas dan
hitunglah probabilitasnya:
A. B dan C keduanya terjadi.
B. Paling sedikit salah satu dari A dan B terjadi
C. B tidak terjadi
D. Ketiga peristiwa terjadi

99
BAB 5
DISTRIBUSI TEORETIS

5.1 KONSEP DASAR DISTRIBUSI PROBABILITAS


 Variabel Random
Suatu variabel random (peubah acak) X adalah: cara memberi nilai
angka bagi tiap unsur ruang sampel; atau:
X (a) adalah ukuran karakteristik tertentu, yang diberikan bagi tiap
unsur a suatu ruang sampel.

Contoh 5.1:
Percobaan melontarkan mata uang logam tiga kali menghasilkan ruang
sampel berikut:
 MMM MMB MBB BBB 
 
S=  MBM BMB 
 BMM BBM 
 
Jika mata uang logam seimbang, delapan unsur ruang sampel memiliki
probabilitas sama besar, masing-masing dengan probabilitas 1/8.
Misalkan variabel random X adalah ‘banyak M dalam tiap unsur’,
maka:
X (MMM) = 3
X (MMB) = X (MBM) = X (BMM) = 2
X (MBB) = X (BMB) = X (BBM) = 1
X (BBB) = 0

Contoh 5.2:
Seorang mahasiswa dipilih secara acak dari kelas yang beranggotakan
30 mahasiswa. Ruang sampelnya terdiri atas 30 mahasiswa, dinyatakan
sebagai S = { a1 , a2 , . . . , a30 }.
Misalkan variabel random Y (a) menyatakan indeks prestasi mahasiswa
a, dan IP mahasiswa a1 = 3.16, IP mahasiswa a2 = 2.43, dan seterusnya,
maka:

100
Y ( a1 ) = 3.16 ; Y ( a2 ) = 2.43 ; dan seterusnya
Suatu variabel random yang hanya dapat menjalani nilai-nilai berbeda
yang banyaknya berhingga (data diskret) disebut variabel random diskret.
Suatu variabel random yang dapat menjalani setiap nilai (tak berhingga
banyaknya) dalam suatu interval (data kontinu) disebut variabel random
kontinu.
Pada contoh 5.1 di atas, X hanya dapat menjalani nilai-nilai dalam
himpunan terhingga {0, 1, 2, 3}. Jadi X adalah variabel random diskret.
Pada contoh 5.2 di atas, Y(a) dapat menjalani setiap nilai yang tak
berhingga banyaknya, antara 0 dan 4, termasuk. Jadi Y (a) adalah variabel
random kontinu.

 Distribusi Probabilitas
Lihat kembali hasil tiga kali pelontaran mata uang di atas. Ruang
sampelnya adalah:
 MMM MMB MBB BBB 
 
S=  MBM BMB 
 BMM BBM 
 
Dengan asumsi mata uang seimbang, sehingga tiap unsur memiliki
probabilitas sebesar 1/8 untuk terjadi, maka diperoleh distribusi
probabilitas diskret berikut:

Tabel 5.1 Distribusi probabilitas X


Nilai X 0 1 2 3
Probabilitas X 1/8 3/8 1/8 3/8

Dari distribusi probabilitas di atas, dapat dihitung probabilitas


peristiwa-peristiwa yang berhubungan dengan X, misalnya:
P [X > 2] = P [X = 2] + P [X = 3]
= 3/8 + 1/8 = 4/8 = ½
P [1 < X < 3] = P [X = 1] + P [X = 2] + P [X = 3]
= 3/8 + 3/8 + 1/8 = 7/8

101
 Nilai Harapan dan Variansi
Rerata suatu variabel random X atau distribusi probabilitasnya,
dinamakan juga nilai harapan X dan dituliskan E [X].
Jika X dapat menjalani nilai-nilai yang mungkin X1 , X 2 , . . . ,
dengan probabilitas masing-masing f ( X i ) = P [X = X i ], maka nilai harapan
X adalah:
n
E [X] = rerata X = µ = ∑
i =1
Xi f ( Xi ) (5.1)

Contoh 5.3:
Misalkan variabel random X menyatakan jumlah anak dalam tiap
keluarga di negara Rusia, dan distribusi probabilitasnya diketahui,
perhitungan nilai harapan X = rerata X dapat dilakukan seperti terlihat pada
tabel 5.2 berikut:

Tabel 5.2. Distribusi probabilitas jumlah anak dalam keluarga di


negara Rusia dan perhitungan nilai harapannya
Xi f ( Xi ) Xi f ( Xi )
0 0.1 0.0
1 0.2 0.2
2 0.4 0.8
3 0.3 0.9
n

i =1
f ( Xi ) = 1 E [X] = 1.9

Contoh 5.4:
Dalam suatu permainan dadu yang dinyatakan ‘seimbang’, untuk
bermain satu lemparan, pemain harus membayar C ribu rupiah dan akan
menerima uang (dalam ribuan rupiah) sebanyak titik yang tampak di atas
pada hasil pelemparan dadu tersebut. Misalkan variabel random X
menyatakan jumlah uang (dalam ribuan rupiah) yang diterima pemain,
distribusi probabilitasnya adalah:

102
Tabel 5.3. Distribusi probabilitas jumlah uang yang diterima pemain
pada permainan dadu seimbang
Nilai X 1 2 3 4 5 6
Prob X 1/6 1/6 1/6 1/6 1/6 1/6

E [X] = 1/6 (1 + 2 + 3 + 4 + 5 + 6)
= 3.5 = Rp. 3,500
Maka permainan dapat dinyatakan ‘adil’ jika C = Rp. 3,500, sehingga
banyak uang yang diterima pemain dalam jangka panjang akan sama dengan
banyak uang uang yang dibayar untuk bermain.

Sifat-sifat nilai harapan:


1) Jika b bilangan konstan, maka:
E [b] = b (5.2)
2) Jika a bilangan konstan, maka:
E [aX] = a E [X] (5.3)
3) Jika a dan b bilangan konstan, maka:
E [aX + b] = a E [X] + b (5.4)
Variansi variabel random X atau distribusi probabilitas, dituliskan
Var ( X ) atau σ 2 , adalah nilai harapa kuadrat deviasi terhadap rerata:

Var ( X ) = E [ X − µ ]2 = E  X 2  ‒ µ 2 (5.5)
 

Var ( X ) = E  X 2  ‒ ( E [ X ])
2
atau: (5.5.a)
 
Standar deviasi variabel random X atau distribusi probabilitasnya,
dituliskan SD (X) atau σ , adalah akar variansi variabel random X atau
distribusi probabilitasnya.

Contoh 5.5:
Misalkan variabel random X menyatakan jumlah penjualan HP merek
N per hari. Distribusi probabilitasnya dan perhitungan variansinya
diperlihatkan pada tabel 5.4 berikut:

103
Tabel 5.4. Distribusi probabilitas jumlah penjualan HP merek N
dan perhitungan variansinya

Xi f ( Xi ) Xi f ( Xi ) X i2 f ( X i )
0 0.1 0.0 0.0
1 0.1 0.1 0.1
2 0.2 0.4 0.8
3 0.3 0.9 2.7
4 0.2 0.8 3.2
5 0.1 0.5 2.5

∑ f ( Xi ) = 1 E [X] = 2.7 E  X 2  = 9.3


 

Var ( X ) = E  X 2  ‒ ( E [ X ])
2

 
= 9.3 – (2.7)2 = 2.01
SD (X) = 2.01 = 1.42

Sifat-sifat variansi dan standar deviasi:


Untuk a dan b konstan:
1. Var ( X ) non-negatif: 1. SD ( X ) non-negatif:
Var ( X ) > 0 SD ( X ) > 0 (5.6)

2. Var ( X + b ) = Var ( X ) 2. SD (X + b) = SD (X) (5.7)

3. Var ( aX ) = a 2 Var ( X ) 3. SD (aX) = a SD (X) (5.8)

4. Var ( aX + b ) = a 2 Var ( X ) 4. SD (aX + b) = a SD (X) (5.9)

Dengan transformasi:
X − µx
Z= (5.10)
σx
maka variabel random X dengan rerata µ x dan standar deviasi σ x menjadi
variabel random Z yang mempunyai rerata 0 dan standar deviasi 1. Variabel
random Z ini dinamakan variabel random standar.
E (Z) = 0 (5.10.a)
Var (Z) = 1 (5.10.b)
104
Contoh 5.6:
Misalkan variabel random X menyatakan banyak penjualan HP merek
N per hari dan variabel random Y menyatakan keuntungan bersihnya sebagai
fungsi X:
Y = 5,000 X – 2,000
Maka: E [Y] = E [5,000 X – 2,000]
= 5,000 E [X] – 2,000
= (5,000)(2.7) – 2,000 = 11,500
Var (Y) = Var [5,000 X – 2,000]
= 5,0002 Var (X)
= (5,0002)(2.01) = 50,250,000
SD (Y) = 50, 250, 000 = 7,088.72

5.2 DISTRIBUSI PROBABILITAS DISKRET


 Distribusi Uniform
Misalkan variabel random X (a) menyatakan nilai-nilai yang
diberikan bagi hasil yang mungkin diperoleh pada percobaan dengan ruang
sampel S = { a1 , a2 , . . . , an }, maka variabel random X dikatakan
berdistribusi uniform jika:
1
P ( Xi ) = (5.11)
n

Contoh distribusi uniform misalnya distribusi probabilitas variabel


random X yang menyatakan titik yang tampak di atas pada pelontaran
berulang sebuah dadu yang seimbang. Variabel random X dapat menjalani
nilai-nilai dalam himpunan {1, 2, . . . , 6} masing-masing dengan probabilitas
P ( X i ) = 1/6.

Grafik contoh distribusi probabilitas uniform di atas diperlihatkan


dalam bentuk diagram garis pada diagram 5.1 berikut:

105
Diagram 5.1. Contoh grafik distribusi uniform

 Distribusi Binomial
Distribusi binomial dapat dianggap sebagai hasil percobaan yang
diulang-ulang, yang memenuhi syarat sebagai ‘Bernoulli trials’.

Sifat-sifat Bernoulli trials :


1. Tiap percobaan (trial) menghasilkan salah satu dari dua kemungkinan,
yang dinamakan sukses (S) dan tidak sukses / gagal (T).
2. Pada tiap percobaan, probabilitas sukses selalu tetap dan dinyatakan
sebagai:
p = P (S) (5.12.a)
Probabilitas tidak sukses dinyatakan sebagai:
q = P (T) = 1 − p (5.12.b)
sehingga:
p+q=1 (5.12.c)
3. Percobaan-percobaan independen satu dengan yang lain: Hasil suatu
percobaan tidak dipengaruhi oleh hasil pada percobaan-percobaan
sebelumnya.

Contoh 5.7:
Misalkan dilakukan Bernoulli trials sebanyak n kali, dengan
probabilitas sukses p pada tiap percobaan. Variabel random X menyatakan
banyak sukses dalam n kali percobaan tersebut, maka distribusi probabilitas
X dikatakan berdistribusi binomial dengan n kali percobaan dan probabilitas
sukses p.
Misalkan dilakukan n = 4 kali percobaan, maka semua hasil yang
mungkin adalah sebagai berikut:

106
TTTT TTTS SSTT SSST SSSS
TTST STST SSTS
TSTT STTS STSS
STTT TSST TSSS
TSTS
TTSS
Distribusi probabilitasnya diperlihatkan pada tabel 5.5 berikut:

Tabel 5.5 Contoh Distribusi Binomial dengan n = 4

Nilai X Banyak hasil: Cxn Prob. tiap hasil: p x q n − x

0 C04 = 1 p0 q4 = q4

1 C14 = 4 p1 q 3 = p q 3

2 C24 = 6 p 2 q2

3 C34 = 4 p 3 q1 = p 3 q

4 C44 = 1 p4 q0 = p4

Maka diperoleh distribusi probabilitas distribusi binomial:

P (X = x) = Cxn p x q n − x ; x = 0, 1, . . . , n (5.13)

Beberapa contoh grafik distribusi binomial dapat dilihat pada


diagram 5.2.

Diagram 5.2. Contoh beberapa grafik distribusi binomial


dengan n = 5 dan berbagai nilai p

107
Contoh 5.8:
Sepasang suami isteri yang baru menikah merencanakan untuk
memperoleh empat orang anak. Jika rencananya mungkin terlaksana dan
diketahui probabilitas untuk memperoleh anak laki-laki dalam tiap kelahiran
adalah 0.51, maka:
a. Probabilitas untuk memperoleh empat orang anak laki-laki:
P (X = 4) = C44 p 4
= (1)(0.514) = 0.0677
b. Probabilitas untuk memperoleh tiga orang anak laki-laki:
P (X = 3) = C34 p 3 q
= (4)(0.513)(0.49) = 0.2600
c. Probabilitas untuk memperoleh dua orang anak laki-laki:
P (X = 2) = C24 p 2 q 2
= (6)(0.512)(0.492) = 0.3747
d. Probabilitas untuk memperoleh paling sedikit dua orang anak laki-laki:
P (X > 2) = P (X = 2) + P (X = 3) + P (X = 4)
= 0.3747 + 0.2600 + 0.0677 = 0.7024
Nilai-nilai probabilitas distribusi binomial dapat dilihat tabel
probabilitas binomial (Addendum B1). Untuk menjelaskan
penggunaannya, diperlihatkan cuplikan tabel binomial pada tabel 5.6 berikut.
Misalnya:
• Untuk n = 2 dan p = 0.01 : P (X = 1) = 0.0198
• Untuk n = 3 dan p = 0.40 : P (X = 2) = 0.2880
• Untuk n = 25 dan p = 0.99 P (X = 25) = 0.778
Kebanyakan tabel binomial tidak menyajikan nilai-nilai probabilitas
untuk p > 0.50.

Perhatikan bahwa:
P (X = x | p) = P (X’ = n – x | p’ = 1 – p);
yaitu probabilitas untuk mendapatkan x kali sukses P (X = x) adalah sama
dengan probabilitas untuk mendapatkan (n – x) kali sukses P (X’ = n – x) dari
percobaan dengan n yang sama dan probabilitas sukses baru p’ = 1 – p.

108
Tabel 5.6. Cuplikan tabel distribusi binomial [P (X = x)]

p
n X
01 0.05 ... 0.40 ... 0.95 .99
2 0 .9801 ... .3600 ... .0001
1 .0198 ... .4800 ... .0198
2 .0001 ... .1600 ... .9801

3 0 .9703 ... .2160 ... .0000


1 .0294 ... .4320 ... .0003
2 .0003 ... .2880 ... .0294
3 .0000 ... .0640 ... .9703
. . . . .
. . . . .
. . . . .
25 0 .778 ... .000 ... . 000
1 .196 ... .000 ... .000
. . . .
. . . .
. . . .
25 .000 ... .000 ... .778

Misalnya:
• Jika n = 2, P (X = 0) = 0.0001 untuk p = 0.99, bernilai sama dengan:
P (X = 2) = 0.0001 untuk p = 0.01
• Jika n = 2, P (X = 2) = 0.9801 untuk p = 0.9, bernilai sama dengan:
P (X = 0) = 0.9801 untuk p = 0.01
• Jika n = 3, P (X = 2) = 0.0294 untuk p = 0.99, bernilai sama dengan:
P (X = 1) = 0.0294 untuk p = 0.01
Nilai-nilai probabilitas distribusi binomial dapat pula disajikan secara
kumulatif, yaitu P (X < x) dalam bentuk tabel binomial kumulatif
(Addendum B2).

109
Tabel 5.7. Cuplikan tabel distribusi binomial kumulatif P (X < x):

p
n X
.01 .05 ... .40 ... .95 .99
2 0 .9801 ... .3600 ... .0001
1 .9999 ... .8400 ... .0199
2 .1000 ... .1000 ... .1000

3 0 .9703 ... .2160 ... .0000


1 .9997 ... .6480 ... .0003
2 .1000 ... .9360 ... .0297
3 .1000 ... .1000 ... .1000

. .
. .
. .

25 0 .778 ... .000 ... . 000


1. .974 ... .000 ... .000
. . . .
. . . .
. . . .222
25 1.00 ... 1.00 ... 1.00

Misalnya:
• Untuk n = 2 dan p =0.01 :
P (X = 1) = P (X < 1) – P (X = 0)
= 0.0000 – 0.9801 = 0.0198
• Untuk n = 3 dan p = 0.40 :
P (X = 2) = P (X < 2) – P (X < 1)
= 0.9360 – 0.6480 = 0.2880
• Untuk n = 25 dan p = 0.99 :
P (X = 25) = P (X < 25) – P (X < 24)
= 1.00 – 0.222 = 0.778

110
 Distribusi Hipergeometrik
Sampel dengan dan tanpa pengembalian:
Pengembalian sampel dapat dilakukan dengan atau tanpa
pengembalian. Pada sampling (pengambilan sampel) dengan pengembalian
(with replacement), tiap anggota sampel yang terpilih dikembalikan ke dalam
‘himpunan calon anggota sampel’ untuk pemilihan anggota sampel
berikutnya, sehingga tiap anggota populasi dapat terpilih lebih daripada satu
kali (ataupun tidak terpilih) untuk menjadi anggota sampel.
Pada sampling tanpa pengembalian (without replacement), tiap
anggota sampel yang terpilih dikeluarkan dari ‘himpunan calon anggota
sampel’ untuk pemilihan anggota sampel berikutnya, sehingga tiap anggota
populasi hanya mungkin terpilih satu kali (ataupun tidak terpilih) untuk
menjadi anggota sampel.
Pengambilan sampel dengan pengembalian dari populasi yang
memiliki karakteristik yang bersifat biner (dikotomi) akan menghasilkan
distribusi binomial, sedangkan pengambilan sampel tanpa pengembalian
dari populasi yang memiliki karakteristik biner menghasilkan distribusi
hipergeometrik.

Contoh 5.9:
Sebuah berisi 6 bola merah (M) dan bola hitam (H). Dari kotak
tersebut, dikeluarkan sebuah bola secara acak tiga kali berturut-turut.
Probabilitas untuk mendapatkan bola merah atau hitam pada tiap kali
pengambilan, baik pada sampling dengan ataupun tanpa pengembalian
diperlihatkan pada diagram 5.3.
Pada sampling dengan pengembalian, komposisi isi kotak selalu tetap
6 bola merah dan 4 bola hitam, probabilitas untuk mendapatkan bola merah
selalu tetap berupa P (M) = 6/10 dan probabilitas untuk mendapatkan bola
hitam selalu tetap berupa P (H) = 4/10. Probabilitas untuk mendapatkan x
bola merah (atau n – x bola hitam) pada n kali pengambilan sampel dengan
pengembalian dapat dihitung dengan menggunakan distribusi binomial.
Pada sampling tanpa pengembalian, probabilitas untuk mendapatkan
bola merah (atau bola hitam) pada tiap kali pengambilan akan selalu
berubah, karena komposisi isi kotak akan selalu berubah, sesuai dengan hasil
yang diperoleh pada pengambilan sebelumnya. Probabilitas untuk
mendapatkan x bola merah (atau n – x bola hitam) pada n kali pengambilan
sampel tanpa pengembalian dapat dihitung dengan menggunakan distribusi
hipergeometrik.

111
Diagram 5.3. Skema probabilitas hasil tiap percobaan pada sampling dengan dan tanpa pengembalian

112
Contoh 5.10:
Misalkan dalam sebuah populasi yang beranggotakan N = 1000
terdapat 300 orang perokok (= R) dan 700 orang bukan perokok (= R ).
Apabila dipilih 2 orang secara acak di antara anggota populasi, maka
probabilitas untuk mendapatkan perokok pada kedua kali memilih
anggotanya secara acak tersebut adalah:
a. Sampling dengan pengambilan:
- Memilih anggota pertama: terdapat 300 orang perokok di antara 1000
anggota populasi. Probabilitas untuk memperoleh perokok adalah
P ( R ) P (R) = 300/1000 = 0.30
- Memilih anggota kedua: Tak tergantung hasil pemilihan pertama,
karena selalu akan dikembalikan kedalam populasi, pada pemilihan
kedua terdapat 300 orang perokok di antara 1000 anggota populasi.
Probabilitas untuk memperoleh adalah P (R) = 300/1000 = 0.30

b. Sampling tanpa pengembalian:


- Memilih anggota pertama: terdapat 300 orang perokok di antara 1000
anggota populasi. Probabilitas untuk memperoleh perokok adalah P
(R) = 300/1000 = 0.30
- Memilih anggota kedua: Hasilnya tergantung pada hasil pemilihan
pertama.
= Pemilihan pertama menghasilkan seorang perokok (= R): Untuk
pemilihan kedua terdapat 299 orang perokok di antara 999
anggota populasi. Probabilitas untuk memperoleh perokok adalah
P (R) = 299/999 = 0.2993
= Pemilihan pertama menghasilkan seorang bukan perokok (= R ):
Untuk pemilihan kedua terdapat 300 orang perokok di antara 999
anggota populasi. Probabilitas untuk memperoleh perokok adalah
P (R) = 300/999 = 0.3003
Proses sampling ini secara skematis diperlihatkan pada diagram 5.4.
Tampak bahwa untuk N besar (dan n kecil; n << N), probabilitas hasil
sampling tanpa pengembalian dapat dianggap sama dengan sampling
dengan pengembalian.

113
R R N
300 700 1000

n = 2:
Dengan pengembalian Tanpa pengembalian
300 300
1) P (R) = = 0.3000 1) P (R) = = 0.3000
1000 1000

300 299 300


2) P (R) = = 0.3000 2) P (R) = = 0.2993 2) P (R) = = 0.3003
1000 999 999
≈ 0.3000 ≈ 0.3000

Diagram 5.4. Skema probabilitas hasil tiap percobaan


pada sampling dengan N besar (n << N)

Contoh 5.11:

Misalkan sebuah kotak berisi 50 tabung elektronik, 10 di antaranya


rusak dan 40 baik.

a N–a N
10 40 50

a. Diambil sampel n = 3 tube (tanpa pengembalian; n < a):


X menyatakan jumlah tube yang rusak dalam sampel: X = {0, 1, 2, 3};
yaitu:
X = {0, 1, . . . n}

b. Diambil sampel n = 15 (n > a): X = {0, 1, . . . , 10}; yaitu:


X {0, 1, . . . , a}

114
Untuk soal a. :
C010C340 C110C240
P (X = 0) = P (X = 1) =
C350 C350
C210C140 C310C040
P (X = 2) = P (X = 3) =
C350 C350

Untuk soal b. :
C010C1540
C110C1440
P (X = 0) = 50 P (X = 1) = 50
C15 C15
C210C1340
C310C1240
P (X = 2) = 50 P (X = 3) = 50
C15 C15
dan seterusnya.

Secara umum distribusi probabilitas distribusi hipergeometrik dapat


dinyatakan sebagai:

C xa CnN−−xa
P (X = x) = (5.14)
CnN

x = 0, 1, . . . , n jika n < a
= 0, 1, . . . , a jika n > a

Matriks 5.1. Rerata dan variansi distribusi binomial dan hipergeometrik

Distribusi Binomial Hipergeometrik


a
Rerata µ=np µ=n = np
N
a b N −n
σ2 = n
σ 2 = n p (1 – p) N N N −1
Var
= npq N −n
= n pq
N −1

Jika N besar dan N >> n, maka:


N–n≈N dan N – 1 ≈ N
N −n
sehingga: n p q ≈ npq
N −1
dan variansi distribusi hipergeometrik dapat dianggap sama dengan variansi
distribusi binomial.

115
Dalam praktik, pengambilan sampel tanpa pengembalian dapat
diasumsikan berdistribusi binomial jika N besar dan N >> n.
Nilai-nilai probabilitas hipergeometrik juga dapat dilihat pada tabel
probabilitas hipergeometrik, walaupun tidak semua buku-buku Statistika
melampirkannya. Cuplikan tabel tersebut dapat dilihat pada tabel 5.8 berikut.

Tabel 5.8. Cuplikan tabel distribusi hipergeometrik [P (X = x)]

N n a x P (x) ... N n a x P (x)


2 1 1 0 0.5000 ... 20 1 1 0 0.9500
2 1 1 1 0.5000 ... 20 1 1 1 0.0500
3 1 1 0 0.6667 ... 20 2 1 0 0.9000
. .
. .
. .
9 4 4 3 0.1587 ... 20 10 10 9 0.0005
9 4 4 4 0.0079 ... 20 10 10 10 0.0000

Misalkan N = 9, n = 4, dan a = 4, maka:


• P (X = 3) = 0.1587
• P (X = 4) = 0.0079
Contoh kedekatan nilai-nilai probabilitas distribusi hipergeometrik
dan distribusi binomial jika N besar dan N >> n diperlihatkan secara grafikal
pada diagram 5.5.

116
Diagram 5.5. Grafik distribusi hipergeometrik (a = 20, N = 1000, n =
100) dan distribusi binomial (p = 0.02, n = 100)

 Distribusi Poisson
Variabel random binomial X diasumsikan berdistribusi Poisson
(dibaca: pwa-song’) jika n sangat besar dan p sangat kecil (mendekati 0),
sehingga hasil perkalian n dan p bersifat konstan dan nilainya tidak terlalu
besar.
n p = λ (konstan)
Distribusi probabilitas distribusi Poisson adalah:

e −λ λ x
P (X = x) = (5.15)
x!
e = 2.71828 (bilangan pokok log naturalis)
Rerata X = Var (X) = λ (5.15.a)

Contoh 5.12:
Suatu proses produksi memiliki probabilitas 2% untuk menghasilkan
produk cacat. Jika yang diperiksa adalah 100 produk, maka:
p = 0.02 n = 100

117
λ = np = (100)(0.02) = 2

e −λ λ x
P (X = x) =
x!
e−2λ 0
P (X = 0) = = 0.135
0!
e−2λ1
P (X = 1) = = 0.271
1!
e−2λ 2
P (X = 2) = = 0.271
2!
Nilai-nilai probabilitas Poisson juga dapat diperoleh dari tabel
probabilitas Poisson, yang cuplikannya diperlihatkan pada tabel 5.9.

Tabel 5.9. Cuplikan tabel distribusi Poisson [P (X = x)]

λ
X
.01 .02 ... 2 ... 19 20
0 .9048 .8187 ... .1353 ... .0000 .0000
1 .9005 .1637 ... .2707 ... .0000 .0000
2 .0045 .0164 ... .2707 ... .0000 .0000
. . . . . .
. . . . . .
. . . . . .
38 .0000 .0000 ... .0000 ... .0000 .0001
39 .0000 .0000 ... .0000 ... .0000 .0001

Misalkan, untuk λ = 2 (contoh 5.10 di atas)


• P (X = 0) = 0.1353
• P (X = 1) = 0.2707
• P (X = 2) = 0.2707
• P (X < 2) = P (X = 0) + P (X = 1) + P (X = 2)
= 0.1353 + 0.2707 + 0.2707 = 0.6767
• P (X > 3) = 1 – P (X < 3) = 1 – P (X < 2)
= 1 – 0.6767 = 0.3233
Contoh-beberapa grafik distribusi Poisson dengan berbagai nilai
rerata (= λ) diperlihatkan pada diagram 5.6.

118
Diagram 5.6. Contoh beberapa grafik distribusi Poisson dengan
berbagai nilai rerata (= λ)

5.3 DISTRIBUSI PROBABILITAS KONTINU


 Distribusi Homogen
Variabel random kontinu X dikatakan berdistribusi homogen dalam
interval [a, b], apabila variabel itu mempunyai fungsi probabilitas yang
berbentuk:
1
f (x) = a<x<b (5.16)
b−a
Distribusi homogen dapat dianggap sebagai ‘counterpart’ kontinu
bagi distribusi uniform yang diskret (lihat diagram 5.7 di bawah); walaupun
ada juga yang tetap menyebut bentuk kontinu ini sebagai ‘distribusi
uniform’.

119
Diagram 5.7. Grafik fungsi probabilitas distribusi homogen

 Distribusi Normal
Variabel random kontinu X dikatakan berdistribusi normal (distribusi
Gauss) dengan rerata µ dan variansi σ 2 , jika variabel itu mempunyai fungsi
probabilitas yang berbentuk:
1
( x − µ )2
1 2
f (x) = e 2σ ; −∞ < x < ∞ (5.17)
2
2πσ

σ2 > 0 π = 3.14 dan e = 2.718


Jika fungsi probabilitas itu digambarkan, maka diperoleh grafik
seperti pada diagram 5.8 di bawah, yang dinamakan ‘kurva normal’.

120
2
Diagram 5.8. Kurva normal X dengan rerata µ dan variansi σ

Sifat-sifat kurva normal:


1. Nilai modus, yaitu nilai sumbu X dengan kurvanya maksimum terletak
pada x = µ.
2. Kurva normal simetris terhadap sumbu vertikal melalui µ.
3. Kurva normal mempunyai titik belok pada x = µ + σ
4. Kurva normal memotong sumbu horizontal secara asimtotis.
5. Luas area di antara kurva normal dan sumbu horizontal sama dengan 1
(secara singkat dikatakan, luas kurva normal sama dengan 1).
Luas area kurva normal merupakan nilai probabilitas untuk
memperoleh seluruh nilai-nilai x yang berada dalam area tersebut. Atas dasar
persamaan :
∞ ∞ 1
1 2(
x − µ )2
∫ f ( x ) dx = ∫ e 2σ dx = 1
−∞ 2πσ 2 −∞
maka luas area kurva normal antara x = a dan x = b (= probabilitas bahwa
nilai x terletak antara a dan b) dapat dihitung sebagai:
b
P [a < x < b] = ∫a f ( x ) dx (5.18)

121
Diagram 5.9. Luas area kurva normal antara x = a dan x = b

Beberapa luas area pada kurva normal X (lihat diagram 5.10):


 P [µ – σ < X < µ + σ] ≈ 68% )
 P [µ – 2σ < X < µ + 2σ] ≈ 95% ) (5.19)
 P [µ – 3σ < X < µ + 3σ] ≈ 99% )

Diagram 5.10. Beberapa luas area pada kurva normal X

 Distribusi Z (Distribusi Normal Standar)


Kurva normal dapat berbeda-beda, tergantung pada nilai
parameternya µ dan σ (lihat diagram 5.11.a dan 5.11.b). Untuk penyusunan
tabel probabilitasnya serta menyederhanakan penggunaannya, diperlukan
standardisasi bagi kurva normal, yang menghasilkan kurva normal standar.

122
Diagram 5.11.a. Kurva normal dengan variansi yang sama, namun
rerata berbeda: µ1 < µ2 < µ3

Diagram 5.11.b. Kurva normal dengan rerata yang sama, namun


variansi berbeda: σ1 < σ2 < σ3

Misalkan variabel random kontinu X berdistribusi normal dengan


rerata µ dan variansi σ 2 . Maka transformasi Z = ( X − µ ) σ dikatakan
berdistribusi Z (berdistribusi normal standar) dengan rerata 0 dan variansi 1
(lihat contoh pada diagram 5.12).

1 2
1 z
f (z) = e2 ; −∞< x < ∞ (5.20)

123
Diagram 5.12. Transformasi variabel random normal X dengan µ = 50
dan σ2 menjadi variabel random normal standar Z

Beberapa luas area pada kurve normal standar Z (lihat diagram 5.13):
 P [–1 < Z < +1] ≈ 68% )
 P [–2 < Z < +2] ≈ 95% ) (5.21)
 P [–3 < Z < +3] ≈ 99% )

Diagram 5.13. Beberapa luas area pada kurva normal standar Z

Luas area pada kurva distribusi Z dapat dilihat pada tabel Z.


Penyajian tabel Z dapat dilakukan dalam berbagai bentuk. Dalam salah satu
bentuk penyajian, yang cuplikannya disajikan pada tabel 5.10 di bawah ini,
luas area (table area, TA) yang dimaksud adalah luas area dari Z = 0 sampai
dengan nilai z tertentu, yaitu P (0 < Z < z).

124
Tabel 5.10. Cuplikan salah satu bentuk tabel Z [P (0 < Z < z)]

Z 00 ... 04 ... 06 ... 09


0.0 .0000 ... .0160 ... .0239 ... .0359
0.1 .0398 ... .0557 ... .0636 ... .0753
. . . . .
. . . . .
1.0 .3413 ... .3508 ... .3554 ... .3621
. . . . .
. . . . .
1.6 .4452 ... .4495 ... .4545
. . . . .
. . . . .
1.9 .4713 ... .4750 ... .4767
2.0 .4772 ... .4793 ... .4803 ... .4817
. . . . .
. . . . .
3.0 .4987 ... .4988 ... .4989 ... .4990

Nilai-nilai yang tercantum dalam badan tabel menyatakan luas area [0


< Z < a]; a merupakan nilai pada tepi kiri dan sisi atas tabel. Karena
distribusi Z memiliki standar deviasi sama dengan 1, maka satuan
pengukuran pada sumbu horizontal adalah σ. Perhatikan contoh:
• P [Z = b] = 0
(sifat yang berlaku untuk seluruh distribusi probabilitas kontinu)
• P [0.00 < Z < 1.00] = P [0.00 < Z < 1.00]
= 0.3413
• P [−1.00 < Z < 0.00] = P [−1.00 < Z < 0.00]
= P [0.00 < Z < 1.00] (sifat simetris distribusi Z)
= 0.3413
• P [|Z| < 1.00] = P [−1.00 < Z < 1.00]
= (2)(0.3413) = 0.6826
• P [0.00 < Z < 2.00] = 0.4722
• P [|Z| < 2.00] = (2)(0.4772) = 0.9544
• P [0.00 < Z < 3.00] = 0.4987

125
• P [|Z| < 3.00] = (2)(0.4987) = 0.9974
• P [0.00 < Z < 1.96] = 0.4750
• P [|Z| < 1.96] = (2)(0.4750) = 0.9500
Dapat dibalik: Jika A = 95%, maka |Z| < 1.96 (dengan syarat A simetris
terhadap sumbu vertikal)
• P [|Z| < 1.64] = (2)(0.4495) = 0.8990 ≈ 0.9000
Dapat dibalik: Jika A = 99%, maka |Z| < 1.64 (dengan syarat A simetris
terhadap sumbu vertikal)
• P [1.00 < Z < 2.00] = P [0.00 < Z < 2.00] – P [0.00 < Z < 1.00]
= 0.4772 – 0.3413 = 0.1359
• P [−1.00 < Z < 2.00] = P [−1.00 < Z < 0.00] + P [0.00 < Z < 2.00]
= P [0.00 < Z < 1.00] + P [0.00 < Z < 2.00]
= 0.3413 + 0.4772 = 0.8185
Untuk aplikasi tabel Z pada perhitungan bagi variabel random X yang
berdistribusi normal, transformasikan terlebih dahulu nilai-nilai X menjadi
nilai Z:
X −µ
Z=
σ
sebaliknya pada akhir perhitungan, nilai-nilai Z dapat ditransformasikan
kembali ke nilai X:
X=µ+Zσ

Contoh 5.13:
Nilai-nilai ujian seleksi penerimaan mahasiswa baru secara nasional
dianggap berdistribusi normal dengan rerata 45 dan standar deviasi 13. Jika
hanya 32.5% calon mahasiswa yang akan diterima, berapakah nilai terendah
calon mahasiswa yang diterima?
Misalkan variabel random normal X menyatakan nilai-nilai ujian
seleksi penerimaan mahasiswa baru, maka X ~ N (45 ; 13). Jika x
menyatakan nilai terendah calon mahasiswa yang diterima, maka:
P [X > x] = 0.325
Dengan menggunakan tabel Z serta interpolasi linear (lihat Lampiran
5D dan 5E), diperoleh bahwa untuk luas area sebesar 0.325 pada sisi kanan
distribusi Z, nilai z-nya adalah 0.4538, sehingga:
P [Z > 0.4538] = 0.325

126
Dari transformasi standar Z = ( X − µ ) σ diperoleh:

x=µ+zσ
dan: x = 45 + (0.4538)(13) = 50.90

Contoh 5.14:
Usia hidup rata-rata elemen kering merek PQR adalah 300 jam
dengan standar deviasi 35 jam. Dengan asumsi bahwa distribusi usia hidup
elemen kering itu mendekati distribusi normal, hitunglah:
a. Berapa persen elemen kering merek PQR yang usia hidupnya kurang
daripada 225 jam?
b. Berapa persen elemen kering merek PQR yang usia hidupnya
kurangnya daripada 350 jam?
Misalkan variabel random normal X menyatakan usia hidup rata-rata
elemen kering merek PQR, maka X ~ N (300 ; 35), maka proporsi elemen
kering merek PQR yang usia hidupnya kurang daripada 225 jam dapat
dinyatakan sebagai:
P (X < 225)
yang dengan transformasi standar dapat diubah menjadi:
 225 − 300 
PZ <  = P (Z < −2.14)
 35 
yang bernilai sama dengan:
P (Z > 2.14) = 0.5000 – P (0 < Z < 2.14)
= 0.5000 – 0.4838 = 0.0162 ≈ 1.62%
Proporsi elemen kering merek PQR yang usia hidupnya kurang
daripada 350 jam dapat dinyatakan sebagai:
P (X < 350)
yang dengan transformasi standar dapat diubah menjadi:
 350 − 300 
PZ <  = P (Z < 1.43)
 35 
= 0.5000 + P (0 < Z < 1.43)
= 0.5000 + 0.4236 = 0.9236 = 92.36%
 Distribusi t
Distribusi t (Student’s t) digunakan untuk sampel berukuran kecil (n
< 30). Gambaran kurvanya menyerupai distribusi Z, namun memiliki ekor

127
yang lebih tebal (sebaran nilai yang lebih besar) daripada distribusi Z (lihat
diagram 5.14).
Kurvanya / variansinya dapat berubah-ubah sesuai nilai ‘derajat
bebas’-nya (db; df; degree of freedom), yaitu db = n – 1. Pada db > 30,
distribusi t dapat dianggap sama dengan distribusi Z.
Nilai-nilai untuk distribusi t dapat dilihat pada tabel (lihat contoh
cuplikan pada tabel 5.11).

Diagram 5.14. Distribusi t dan distribusi Z

128
Tabel 5.11. Cuplikan salah satu bentuk tabel t [α = P (t > tα)]:

Area satu sisi


db
.10 .05 .025 .01
1 3.078 6.314 12.706 31.821
2 1.886 2.920 4.303 6.965
. . . . .
. . . . .
11 1.363 1.796 2.201 2.718
. . . . .
. . . . .
19 1.328 1.729 2.093 2.539
. . . . .
. . . . .
30 1.310 1.697 2.042 2.457
. . . . .
. . . . .
120 1.289 1.658 1.980 2.358
Z 1.282 1.645 1.960 2.326

Perhatikan:
o Secara matematik, distribusi t baru akan sama dengan distribusi Z pada n
= ∞ , namun secara praktis keduanya sudah dapat dianggap sama pada n
= 30 (n = 50).
o Pada tabel t, badan tabel memuat nilai t dan luas area tercantum pada sisi
atas tabel (pada tabel Z, badan tabel memuat luas area, nilai Z diperoleh
dari sisi kiri dan atas tabel).
o Sesuai kebutuhan, tabel t hanya memuat nilai-nilai t untuk luas area kecil
(10% atau kurang).

Contoh 5.15:
Lihat tabel t satu sisi (satu ekor, one-tail). Tampak bahwa untuk db
11 dan luas area 0.05, nilai t adalah 1.796 atau:
t(11;0.05) = 1.796

129
yang dalam konteks probabilitas berarti bahwa:
P [ t(11) > 1.796] = 0.05

Jika digunakan tabel t dua sisi (dua ekor, two-tails), nilai t sebesar
1.796 dengan db 11 akan diperoleh untuk luas area 0.10, atau:
t(11;0.10) = 1.796

karena yang dimaksud dengan luas area pada tabel t dua sisi adalah:
P [| t(11) | > 1.796] = 0.10

atau: P [( t(11) < −1.796] ∪ ( t(11) > 1.796)] = 0.10

 Pendekatan Normal untuk Binomial


Jika X berdistribusi binomial dengan mean µ = n p dan variansi σ 2 =
n p q dan n besar, maka variabel random:
X − np
Z= (5.22)
npq
dapat dianggap berdistribusi normal standar.
Pendekatan ini sangat baik jika n besar dan p mendekati 0.5 (lihat
diagram 5.15). Juga seandainya n tidak terlalu besar, pendekatan ini masih
cukup baik, dengan syarat p tidak terlalu dekat dengan 0 atau 1.

130
Diagram 5.15. Pendekatan normal untuk distribusi binomial dengan p =
0.5. Atas: n = 6; tengah: n = 10; bawah: n = 14

131
Pada pendekatan normal untuk binomial ini biasa digunakan ‘koreksi
kontinuitas’ (karena nilai-nilai diskret pada distribusi binomial), yaitu:
o P (X = c) ≈ P (c – 0.5 < X < c + 0.5) )
o P (X < c) ≈ P (X < c + 0.5) ) (5.23)
o P (X > c) ≈ P (X > c − 0.5) )

Contoh 5.16:
Delapan puluh persen mahasiswa Psikologi Gunadarma adalah
wanita. Jika 50 orang mahasiswa Psikologi Gunadarma dipilih secara acak,
maka probabilitas bahwa sekurang-kurangnya 35 orang di antaranya adalah
wanita dapat dihitung dengan pendekatan normal untuk binomial (tanpa
korelasi kontinuitas).
n = 50 p = 0.80 q = 1 – p = 0.20
 x − np 
P (X > x) = P  Z ≥ 
 npq 

 35 − ( 50 )( 0.80 ) 
P (X > x) = P  Z ≥ 
 ( 50 )( 0.80 )( 0.20 ) 
 
= P (Z > −1.7778)
= P (−1.7778 < Z < 0) + P (Z > 0)
= 0.4614 + 0.5000 = 0.9614

Contoh 5.17:
Misalkan untuk data pada contoh 5.16 di atas hendak dihitung P (X =
35):
• Dengan ‘koreksi kontinuitas’ pada pendekatan normal:
P (X = c) ≈ P (c – 0.5 < X < c + 0.5)
P (X = 35) ≈ P (34.5 < X < 35.5)
 34.5 − 40 35.5 − 40 
=P  <Z< 
 8 8 
= P (−1.9445 < Z < −1.5910)
= P (1.5910 < Z < 1.9445)
= 0.4741 – 0.4442 = 0.0299

132
• Dengan ‘cara eksak’ (menggunakan distribusi binomial):
P (X = x) = C xn p x q n − x
50
P (X = 35) = C35 ( ) ( 0.2 )
0.835 15

= 0.0299

Pada contoh 5.16 di atas, penyelesaiannya yang lebih tepat dengan


koreksi kontinuitas adalah:
P (X > 35) ≈ P (X > 34.5)
 34.5 − 40 
= P Z > 
 8 
= P (Z > −1.9445)
= 0.9741

133
LAMPIRAN 5A: RANGKUMAN PARAMETER DISTRIBUSI PROBABILITAS
A. DISTRIBUSI PROBABILITAS DISKRET

No Distribusi Distribusi probabilitas Rerata Variansi


P [X = x] = 1 n x1 + xn xn2 + x12
1 Uniform E (X) = Var (X) =
x = 1, 2, . . . , n 2 12

2 Binomial P [X = x] = C xn p x q n − x E (X) = n p Var (X) = n p q


x = 0, 1, 2, . . . , n
 a   b   N −n
C aC b a Var (X) = n      
P [X = x] = x Nn− x E (X) = n    N   N   N −1 
3 Hipergeometrik Cn N
 N −n
x = max (0, n – b), . . . , min (a, n) =np =npq  
 N −1 
e −λ λ x
4 Poisson P [X = x] = E (X) = λ Var (X) = λ
x!
x = 0, 1, 2, . . .

134
B. DISTRIBUSI PROBABILITAS KONTINU

No Distribusi Distribusi probabilitas Rerata Variansi


1 a+b ( b − a )2
1 Homogen f (x) = E (X) = Var (X) =
b−a 2 12
1 2
( x − µ)
2 Normal 1 2
E (X) = µ
f (x) = e 2σ Var (X) = σ 2
2π σ 2
1 2
1 z
3 Normal standar (Z) f (z) = e2 E (Z) = 0 Var (Z) = 1

 n +1 
Γ 
f (x) =  2  1
n
4 Student’s t *) n
nπ Γ    t 2 
( n + 1) 2 E (t) = 0 Var (t) =
n−2
 2  1 + 
 n
 
*) Distribusi t: db = n ; untuk n = 1 dan 2, distribusi t tak memiliki variansi

−t λ −1
Γ (λ) = ∫0 e t dt

Γ (1) = 1 ; Γ (2) = 1! ; Γ (3) = 2! ; . . . ; Γ (n + 1) = n! ; n bilangan bulat non-negatif


1 3 1 1 1 5 3 3 3
Γ = π ; Γ = Γ =  π ; Γ = Γ =  π
2 2 2 2 2 2 2 2 4

135
LAMPIRAN 5B: BEBERAPA CONTOH PENGGUNAAN
DISTRIBUSI PROBABILITAS DISKRET

1. Misalkan hanya 40% pemilik TV yang membayar iuran. Jika dipilih


secara acak 10 pemilik TV, maka berapakah probabilitas:
a. Lebih daripada separuhnya membayar iuran?
b. Kurang daripada separuhnya membayar iuran?
Jumlah yang membayar iuran di antara 10 pemilik TV berdistribusi
binomial dengan:
p = 0.4 q = 1 – p = 0.6 n = 10

P [X = x] = C xn p x q n − x
n
P [X > x] = ∑
i= x
Cxn p x q n − x

Probabilitas lebih daripada separuhnya membayar iuran adalah:


10
P [X > 6] = ∑
i =6
Ci10 0.4i 0.610 − i

= P [X = 6] + P [X = 7] + P [X = 8] + P [X = 9] + P [X = 10]
= 0.1115 + 0.0425 + 0.0106 + 0.0016 + 0.0001 = 0.1663
Probabilitas bahwa kurang daripada separuhnya membayar iuran
adalah:
4
P [X < 4] = ∑
i =0
Ci10 0.4i 0.610 − i

= P [X = 0] + P [X = 1] + P [X = 2] + P [X = 3] + P [X = 4]
= 0.0060 + 0.0403 + 0.1209 + 0.2150 + + 0.2508 = 0.6330

2. Perkumpulan binaraga Samson beranggotakan 10 orang, terdiri atas 7


binaragawan profesional dan 3 binaragawan amatir. Jika dipilih secara
acak dua orang binaragawan untuk mewakili perkumpulan dalam
turnamen HUT DKI Jakarta, berapa probabilitas sekurang-kurangnya
satu orang yang terpilih adalah binaragawan amatir?
Jumlah binaragawan amatir yang mungkin terpilih di antara dua wakil
perkumpulan berdistribusi hipergeometrik dengan:
136
N = 10 n=2 a=3 b=7
C xa Cnb− x
P [X = x] =
CnN
P [X > 1] = P [X = 1] + P [X = 2]
C13 C17 C23 C07
= +
C210 C210
( 3)( 7 ) ( 3)(1)
= +
( 45) ( 45)
= 0.4667 + 0.0667 = 0.5333
atau:
P [X > 1] = 1 − P [X = 0]
C03 C27
=1−
C210
(1)( 21)
=1−
( 45)
= 1 – 0.4667 = 0.5333

3. Sebuah kapal penangkap ikan rata-rata mendapat tiga ekor ikan dalam
lima hari.
Beberapa probabilitas penangkapan:
a. Dua ekor ikan dalam tiga hari.
b. Sekurang-kurangnya tiga ekor ikan dalam dua hari.
Jumlah ikan yang ditangkap berdistribusi Poisson dengan rerata λ = 3
untuk periode 5 hari.
a. Untuk periode 3 hari, nilai rerata berubah menjadi:
3
λ’ =   λ
5
= (0.6)(3) = 1.8

e−λ ' ( λ ') x


P [X = x] =
x!

137
e−1.8 1.82
P [X = 2] = = 0.2678
2!
b. Untuk periode 2 hari, nilai rerata berubah menjadi:
2
λ” =   λ
5
= (0.4)(3) = 1.2
P [X > 3] = 1 − P [X < 2]
= 1 – [P (X = 0) + P (X = 1) + P (X = 2)]
= 1 – [0.3012 + 0.3614 + 0.2169]
= 0.1205

138
LAMPIRAN 5C: NILAI STANDAR (NILAI BAKU,
VARIABEL STANDAR Z)

Variabel standar Z
adalah variabel dengan nilai mean nol ( µ z = 0) dan standar deviasi
satu ( σ z = 1). Setiap variabel X dapat ditransformasikan menjadi variabel
standar Z dengan menggunakan rumus:
X − µx
Z=
σx
Jika nilai µ x dan σ x tidak diketahui, digunakan nilai penaksirnya
X −x
(estimatornya), yaitu x dan s x , sehingga Z = .
sx

Contoh:
Lihat data BB lima orang mahasiswa pertama kelas 2PA01 TA
3003/2004 (dalam kg): 50, 56, 47, 45, 54.
2
n=5 ∑ xi = 252 ∑ xi = 12,786
∑ xi
x =
n
252
= = 50.4
5

2 ( ∑ xi )2
∑ xi −
sx = n
n −1
2522
12, 786 −
= 5 = 4.62
5 −1
50 − 50.4
x1 = 50 ⇒ z1 = = −0.09
4.62
56 − 50.4
x2 = 56 ⇒ z2 = = 1.21
4.62

139
47 − 50.4
x3 = 47 ⇒ z3 = = −0.74
4.62
47 − 50.4
x4 = 45 ⇒ z4 = = −1.17
4.62
54 − 50.4
x5 = 54 ⇒ z5 = = 0.78
4.62

140
LAMPIRAN 5D: BEBERAPA CONTOH
PENGGUNAAN DISTRIBUSI NORMAL

1. X berdistribusi normal dengan rerata µ = 50 dan standar deviasi σ = 15.


Hitunglah luas area kurve normal antara X1 = 58 dan X 2 = 86.3.

Luas area antara X1 = 58 dan X 2 = 86.3 adalah sama dengan luas area
antara Z1 = 0.53 dan Z 2 = 2.42, atau:
P (58 < X < 86.3) = P (0.53 < Z < 2.42)
= P (0 < Z < 2.42) − P (0 < Z < 0.53)
= 0.4922 – 0.2019 = 0.2903

2. X berdistribusi normal rerata µ = 60 dan standar deviasi σ = 11.


Hitunglah luas area kurve normal di sisi kanan X1 = 72.
72 − 60
Z1 = = 1.09
11

Luas area di sisi kanan X1 = 72 adalah sama dengan luas area di sisi
kanan Z1 = 1.09 atau:
P (X > 72) = P (Z > 1.09)
= P (0 < Z < ∞ ) – P (0 < Z < 1.09)
= 0.5000 – 0.3621 = 0.1379

141
3. X berdistribusi normal dengan rerata µ = 75 dan standar deviasi σ = 14.
Hitunglah luas area kurve normal di sisi kanan X1 = 70.
70 − 75
Z1 = = −0.36
14

Luas area di sisi kanan adalah sama dengan luas area di sisi kanan
Z1 = −0.36, atau:
P (X > 70) = P (Z > −0.36)
= P (−0.36 < Z < 0) + P (0 < Z < ∞)
= 0.1406 + 0.5000 = 0.6406

4. X berdistribusi normal rerata µ = 25 dan standar deviasi σ = 5.


Hitunglah luas area kurve normal di antara X1 = 20 dan X 2 = 34.8.

Luas area antara X1 = 20 dan X 2 = 34.8 adalah sama dengan luas


area antara Z1 = −1.00 dan Z 2 = 1.96, atau:
P (20 < X < 34.8) = P (−1.00 < Z < 1.96)
= P (−1.00 < Z < 0.00) + P (0.00 < Z < 1.96)
= 0.3413 + 0.4750 = 0.8163

142
LAMPIRAN 5E: INTERPOLASI LINEAR
Interpolasi linear digunakan untuk pembacaan tabel probabilitas
kontinu X secara lebih akurat jika dimiliki nilai x yang terletak di antara dua
nilai berurutan x1 dan x2 yang ada pada tabel (yang masing-masing
bersesuaian dengan luas area A1 dan A 2 ) dan akan ditentukan luas areanya
A yang nilainya berada di antara luas area A1 dan A 2 .
Salah satu dalil planimetri (ilmu ukur bidang) menyatakan: Jika pada
segitiga sebarang ABC, DE sejajar dengan alas BC, maka AD : AB = AE :
AC (lihat diagram V.1).

Diagram V.1. Dalil planimetri: Jika DE // BC,


maka AD : AB = AE : AC
Analogi dengan dalil planimetri di atas, pembacaan tabel dengan
interpolasi linear dapat dilakukan sebagaimana terlihat pada diagram V.2,
yaitu:
( x − x1 ) : ( x 2 − x 1 ) = ( A − A1 ) : ( A 2 − A1 )
sehingga diperoleh:
x − x1
A = A1 + ( A 2 − A1 )
x2 − x 1

Diagram V.2. Interpolasi linear untuk pencarian nilai x atau


luas area A pada tabel probabilitas kontinu

143
Jika yang diketahui adalah A dan yang dicari adalah nilai x, maka:
A − A1
x = x1 + ( x2 − x 1 )
A 2 − A1
Yang dimaksud dengan tabel probabilitas X di sini dapat berupa tabel
Z, tabel t, ataupun tabel probabilitas kontinu lainnya.

Contoh:
1. Misalkan hendak dicari nilai z untuk luas area A = P (0 < Z < z) =
0.4000. Dari tabel Z yang bersesuaian diperoleh:
z A
1.28 0.3997
1.29 0.4015
Maka nilai z yang bersesuaian untuk A = 0.4000 adalah:
A − A1
z = z1 + ( z2 − z1 )
A 2 − A1
0.4000 − 0.3997
= 1.28 + (1.29 – 1.28) = 1.2817
0.4015 − 0.3997

2. Misalkan hendak dicari luas area pada ekor kanan distribusi t [A = P (T


> t)] yang bersesuaian untuk nilai t = 2.000 dengan derajat bebas 10.
Dari tabel t yang bersesuaian nilai-nilai yang ada ialah:
t (10 ; A) A
1.812 0.050
2.228 0.025
Maka luas area A yang bersesuaian untuk nilai t = 2.000 dengan derajat
bebas 10 adalah:
t − t1
A = A1 + ( A 2 − A1 )
t2 − t 1
2.000 − 1.812
= 0.050 + (0.025 – 0.050) = 0.0387
2.228 − 1.812

144
LATIHAN 5
Bagian Pertama
Pilihlah satu jawaban yang paling benar !

1. Pilihlah pernyataan yang benar:


A. Var (X + b) = Var (X) + b ; b konstante
B. SD (X + b) = SD (X) + b
C. Var (aX) = a Var (X) ; a konstante
D. SD (aX) = a SD (X)

2. Yang tergolong dalam distribusi diskret di antara distribusi teoretis di


bawah ini yaitu:
A. Distribusi normal C. Distribusi t
B. Distribusi Z D. Distribusi Poisson

3. Yang tergolong dalam distribusi kontinu di antara distribusi teoretis di


bawah ini yaitu:
A. Distribusi uniform C. Distribusi Poisson
B. Distribusi binomial D. Distribusi normal standar

4. Jika probabilitas kelahiran bayi laki-laki (L) dan perempuan (P)


dianggap tepat sama besar, maka probabilitas pasangan suami isteri
yang memiliki 5 orang anak untuk memperolehnya dengan urutan L-L-
P-L-L adalah:
A. 0.55 = 0.031 C. C45 0.54 (1 − 0.5 )1
1
B. P45 0.54 (1 − 0.5 ) D. Semua salah

5. Jika probabilitas kelahiran bayi laki-laki (L) dan perempuan (P)


dianggap tepat sama besar, maka probabilitas pasangan suami isteri
yang memiliki 4 orang anak untuk memperoleh 2 anak laki-laki dan 2
anak perempuan adalah:
2
A. 0.54 = 0.0625 C. C24 0.52 (1 − 0.5 )
2
B. P24 0.52 (1 − 0.5 ) D. Semua salah

145
6. Jika diasumsikan bahwa probabilitas untuk memperoleh anak laki-laki
pada tiap kelahiran adalah 0.50, maka probabilitas untuk memperoleh
paling sedikit 2 orang anak perempuan pada pasangan suami isteri baru
yang merencanakan untuk memperoleh 4 orang anak adalah:
A. 0.0625 C. 0.3125
B. 0.25 D. 0.6875

7. Jika diasumsikan bahwa probabilitas untuk memperoleh anak laki-laki


pada tiap kelahiran adalah 0.50, maka probabilitas untuk memperoleh
sekurang-kurangnya 1 orang anak laki-laki pada pasangan suami isteri
baru yang merencanakan untuk memperoleh 3 orang anak adalah:
A. 0.125 C. 0.750
B. 0.375 D. 0.875

8. Soal nomor 7 di atas diselesaikan dengan menggunakan distribusi


probabilitas:
A. Uniform. C. Hipergeometrik.
B. Binomial D. Poisson.

9. Diagram di bawah ini merupakan gambaran probabilitas distribusi


binomial dengan parameter:

A. p = 0.25 ; n = 3 C. p = 0.75 ; n = 3
B. p = 0.5 ; n = 3 D. p = 0.5 ; n = 2

10. Pada pengambilan sampel tanpa pengembalian yang ditarik dari suatu
populasi berhingga, perhitungan probabilitasnya secara eksak
didasarkan atas asumsi distribusi:
A. Binomial C. Poisson
B. Hipergeometrik D. Normal

146
11. Dalam sebuah kotak terdapat 12 bola, 5 putih, 4 merah, dan sisanya
kuning. Tiga buah bola diambil secara acak tanpa pengembalian.
Probabilitas bahwa ketiga bola yang terambil semuanya tidak merah
adalah:
A. C812 C711 C610 C. A) dan B) benar
C38 C04
B. D. A) dan B) salah
C312

12. Di antara 20 orang anggota ‘Himpunan Mahasiswa Pecinta Belajar’


Gunadarma, 15 orang adalah perokok. Jika dipilih 5 orang secara acak
untuk menjadi anggota Badan Pengurus, probabilitas bahwa paling
sedikit 4 orang anggota Badan Pengurus merokok adalah:
A. 0.1937 C. 0.4402
B. 0.3661 D. 0.6339

13. Perhitungan probabilitas untuk peristiwa-peristiwa yang saling


independen namun jarang terjadi, dengan probabilitas masing-masing
peristiwa sangat kecil, dilakukan atas dasar asumsi distribusi:
A. Binomial C. Poisson
B. Hipergeometrik D. Normal

14. Probabilitas seseorang yang memasuki Universitas KKN akan dapat


menyelesaikan kuliahnya adalah 0.4. Maka probabilitas bahwa di
antara lima orang mahasiswa tidak ada yang tamat adalah:
A. 0.010 C. 0.087
B. 0.078 D. 0.101

15. Misalkan mahasiswa baru Gunadarma memiliki probabilitas 2% untuk


lulus sebagai sarjana dengan predikat cum − laude. Dari sekelompok
100 orang mahasiswa baru Gunadarma, probabilitas bahwa sekurang-
kurangnya 3 orang di antaranya akan lulus sebagai sarjana dengan
predikat cum − laude adalah:
A. 0.1353 C. 0.3233
B. 0.2707 D. 0.6767

16. Jumlah rata-rata panggilan telepon yang masuk ke sebuah kantor tiap
menit pada jam kerja adalah 2.5. Probabilitas bahwa akan didapatkan
tiga panggilan pada suatu menit tertentu dalam jam kerja adalah:
A. 0.142 C. 0.544
B. 0.214 D. 0.758

147
17. Jumlah rata-rata konsultasi yang diterima oleh guru BP di SMU
‘Santai’ adalah tiga kasus per minggu. Probabilitas bahwa pada minggu
depan hanya akan didapatkan dua kasus konsultasi adalah:
A. 0.149 C. 0.224
B. 0.199 D. 0.423

18. Kurve normal memiliki sifat-sifat berikut, kecuali:


A. Simetris terhadap sumbu vertikal melalui µ .
B. Mempunyai titik belok pada x = µ + 2 σ
C. Memotong sumbu horizontal secara asimptotis.
D. Semuanya merupakan sifat kurve normal.

19. Jika pada suatu distribusi diketahui bahwa rerata, median, dan
modusnya berimpit, maka distribusi tersebut:
A. Belum tentu berdistribusi normal
B. Pasti berdistribusi normal
C. Menceng ke kiri.
D. Menceng ke kanan.

20. Pada kurve normal berlaku:


A. P  X ≤ x + σ  ≈ 68%
B. P  X ≤ µ + 2σ  ≈ 68%
C. P [ µ − 2σ ≤ X ≤ µ + 2σ ] ≈ 68%
D. A) dan C) benar

21. Nilai-nilai seleksi penerimaan mahasiswa baru Gunadarma dapat


dianggap berdistribusi normal dengan mean 60 dan standar deviasi 12.
Jika hanya 70% calon mahasiswa yang akan diterima, nilai terendah
calon mahasiswa yang diterima adalah:
A. 47 C. 66
B. 54 D. 73

22. Jika X berdistibusi normal dengan mean 30 dan variansi 25, maka
probabilitas bahwa 25 < X < 37.5 adalah (menggunakan tabel):
A. 0.0919 C. 0.4332
B. 0.3413 D. 0.7745

148
Untuk soal No. 23 dan 24:
Misalkan nilai-nilai ujian akhir semester mahasiswa Gunadarma
dapat dianggap berdistribusi normal dengan mean 65 dan variansi 100.
23. Jika ambang nilai batang lulus ditetapkan sebesar 55, maka persentase
mahasiswa yang tidak lulus adalah:
A. 4.0 % C. 34.1 %
B. 15.9 % D. 46.0 %

24. Jika diputuskan bahwa 10% mahasiswa terbaik nilai ujian akhir
semesternya akan diberikan beasiswa pada semester berikutnya, maka
nilai terendah yang mendapatkan beasiswa adalah:
A. 67.5 C. 81.4
B. 77.8 D. 85.0

25. Distribusi t (Student’s t) memiliki sifat:


A. Ekornya lebih tipis daripada distribusi Z
B. Nilai-nilainya lebih menyebar dibandingkan dengan distribusi Z
C. Secara praktis dapat dianggap sama dengan distribusi Z pada
derajat bebas lebih kecil daripada 30
D. Semuanya benar

26. Distribusi t dengan derajat bebas 10 memilki standar deviasi:


A. Lebih kecil daripada 1.
B. Sama dengan 1.
C. Lebih besar daripada 1.
D. Dapat lebih kecil atau lebih besar daripada 1.

27. Misalkan variabel X berdistribusi t dengan derajat bebas 9, maka


probabilitas bahwa nilai t lebih kecil daripada −1.383 adalah:
A. 0.01 C. 0.10
B. 0.05 D. 0.25

149
Bagian Kedua
Pilihlah satu jawaban yang paling benar!

Untuk soal nomor 1 s.d. 3:

Tabel berikut menyatakan distribusi probabilitas penjualan mobil /


minggu di show-room Kartika (variabel X menyatakan jumlah mobil yang
terjual per minggu):

Nilai X 0 1 2 3
Probabilitas X 0.2 0.4 0.3 0.1

1. Nilai-harapan penjualan mobil per minggu [E (X)] adalah:


A. 0.81 C. 1.3
B. 0.9 D. 2.5

2. E ( X 2 ) dan Var (X) masing-masing adalah:


A. 1.3 dan 0.81 C. 2.5 dan 0.81
B. 1.3 dan 0.9 D. 2.5 dan 0.9

3. Jika keuntungan bersih untuk tiap penjualan mobil rata-rata sebesar Rp.
5,000,000, nilai harapan keuntungan bersih show-room Kartika per
minggu adalah:
A. Rp. 4,050,000 C. Rp. 6,500,000
B. Rp. 4,500,000 D. Rp. 12,500,000

Untuk soal nomor 4 s.d. 6:


Misalkan variabel random X menyatakan jumlah uang (dalam ribuan
rupiah) yang harus dibayar (X < 0) atau akan diterima (X > 0) seseorang
sesuai dengan banyak titik pada sisi yang tampak di atas pada pelemparan
sebuah dadu dengan distribusi probabilitas sebagai berikut:

Banyak 1 2 3 4 5 6
titik
X −3 −2 −1 1 2 3
P (X) 1/6 1/6 1/6 1/6 1/6 1/6

150
4. Nilai harapan X adalah:
2
A. E (X) = µ = 0 C. E (X) = µ = 4
3
B. E (X) = µ = 3.5 D. Semuanya salah

5. Nilai harapan X 2 adalah:


2
A. E ( X 2) = 0 C. E ( X 2) = 4
3
B. E ( X 2 ) = 3.5 D. Semuanya salah

6. Variansi X adalah:
A. Var (X) = E ( X 2 ) − µ 2 = 0
B. Var (X) = E ( X 2 ) − µ 2 = 3.5
2
C. Var (X) = E ( X 2 ) − µ 2 = 4
3
D. Semuanya salah

Bagian Ketiga
Selesaikanlah soal berikut:

Dari 12 orang pelamar suatu pekerjaan, 3 orang sebenarnya tidak


mampu untuk menangani pekerjaan tersebut. Misalkan 2 orang yang akan
dipilih secara acak untuk dipekerjakan, maka:

A. Berapa jumlah pasangan berbeda yang mungkin terpilih?


B. Jika 2 orang yang dipekerjakan dipilih secara acak, berapa probabilitas
bahwa keduanya tidak mampu untuk menangani pekerjaan tersebut?

151
BAB 6
SAMPLING
6.1 DISTRIBUSI SAMPLING
 Distribusi Sampling Nilai Rerata
Misalkan dimiliki populasi dengan N = 3;
X1 = 3 X2 = 6 X3 = 8
µ x = µ = 5.67 σ x2 = σ 2 = 4.22
Misalkan pula dilakukan pengambilan sampel secara acak dengan n =
2. Kemungkinan sampel yang diperoleh adalah:
• Sampling dengan pengembalian (jumlah kemungkinan sampel = N n =
32 = 9):
( x1; x1 ) ( x1; x2 ) ( x1; x3 )
( x2 ; x1 ) ( x2 ; x2 ) ( x2 ; x3 )
( x3 ; x1 ) ( x3 ; x2 ) ( x3 ; x3 )
Rerata-nya masing-masing adalah:
x(1a ) = 3 x( 2 a ) = 4.5 x( 3a ) = 5.5
x( 4 a ) = 4.5 x( 5 a ) = 6 x( 6 a ) = 7
x( 7 a ) = 5.5 x( 8 a ) = 7 x( 9 a ) = 8

• Sampling tanpa pengembalian (jumlah kemungkinan sampel = CnN = C n3


= 3):
( x1; x2 ) ( x1; x3 ) ( x2 ; x3 )
Rerata-nya masing-masing adalah:
x 1b = 4.5 x 2b = 5.5 x 3b = 7
( ) ( ) ( )

152
Kumpulan rerata semua kemungkinan sampel demikian pada
sampling dengan pengembalian:

{x( 1a )
, x( 2 a ) , x( 3 a ) , x( 4 a ) , x( 5 a ) , x( 6 a ) , x( 7 a ) , x(8 a ) , x( 9 a ) }
ataupun apada sampling tanpa pengembalian:

{x( 1b )
, x 2 b , x 3b
( ) ( ) }
dinamakan distribusi sampling nilai rerata dengan rerata:
µx atau E(X )
dan variansi:
σ x2 atau Var ( X )
Standar deviasinya σ x atau SD (X) dinamakan juga standard error (x) =
SE ( X ) .

 Teorema Limit Pusat (Central Limit Theorem)


Jika sampel-sampel acak diambil dari populasi berdistribusi sebarang
dengan rerata µ dan variansi σ 2 , maka untuk n besar, distribusi sampling
nilai rerata dapat dianggap mendekati distribusi normal dengan rerata µ dan
variansi σ 2 n .
Dengan kata lain, X dapat dianggap berdistribusi normal dengan
rerata:
µx = E ( X ) = µ (6.1)
dan variansi:
σ2
σ x2 = Var ( X ) = (6.2)
n
Standar deviasi-nya adalah:
σ
σ x = SE ( X ) = (6.3)
n
x −µ
sehingga: Z= (6.4)
σ n
berdistribusi normal standar.

153
Sifat ini hanya berlaku pada sampling dengan pengembalian. Jika
dilakukan sampling tanpa pengembalian, maka rerata-nya adalah:
µx = E ( X ) = µ (6.5)
variansi-nya:

σ 2 ( N − n)
σ x2 = Var ( X ) = (6.6)
n ( N − 1)
dan standar deviasi-nya:

σ x = SE ( X ) =
σ ( N − n) (6.7)
n ( N − 1)
Tetapi jika N relatif jauh lebih besar daripada n, maka pada sampling
tanpa pengembalian dapat dianggap berlaku rerata:
µx = E ( X ) = µ
dan variansi:
σ2
σ x2 = Var ( X ) ≈
n

Perhatikan:
1. Distribusi sampel, jika n cukup besar dan pengembalian sampel
dilakukan secara acak, umumnya akan mendekati distribusi populasinya.
2. Jika ukuran sampel n cukup besar (n > 30), distribusi sampling nilai
rerata dapat dianggap berdistribusi normal (apa pun bentuk distribusi
x −µ
populasinya; lihat diagram 6.1), transformasi bakunya maupun
σ n
x −µ
transformasi (jika σ tak diketahui) selalu berdistribusi normal
s n
standar.
3. Jika ukuran sampel n lebih kecil daripada 30 dan populasinya
berdistribusi normal, distribusi sampling nilai rerata selalu berdistribusi
normal (tak tergantung besar nilai n ; sedangkan transformasi baku
x −µ x −µ
berdistribusi normal standar dan transformasi (jika σ tak
σ n s n
diketahui) berdistribusi t dengan derajat bebas (n – 1).

154
Diagram 6.1. Teorema limit pusat: distribusi x untuk berbagai
populasi dan ukuran sampel
Rangkuman hubungan antara distribusi parental (distribusi populasi) X,
distribusi sampling X , dan distribusi transformasi X diperlihatkan pada
matriks 1 Lampiran 6A.

Contoh 6.1:
Nilai ujian nasional lulusan SMU di Yogyakarta untuk mata pelajaran
matematika mempunyai rerata 41.4 dan variansi 84.64. Apabila dipilih 40
orang lulusan SMU tersebut secara acak, hitung probabilitas bahwa rerata
sampelnya terletak:
a. Antara 40 dan 45
b. Lebih besar daripada 45.
µ = 41.4 σ 2 = 84.64 n = 40
µ x = µ = 41.4
σ2 84.64
σ x2 = = = 2.116
n 40
σx = 2.116 = 1.45
 ( 40 − 41.5) ( 45 − 41.5) 
a. P [40 < X < 45] = P  <Z< 
 1.45 1.45 
= P [‒1.30 < Z < 2.41]
= 0.3485 + 0.4920 = 0.8405
b. P [ X > 45] = P [Z > 2.41]
= 0.5 – 0.4920 = 0.0080

155
 Distribusi Sampling Nilai Proporsi
Distribusi sampling proporsi sampel p adalah distribusi binomial
dengan parameter n dan P, n adalah ukuran sampel dan P proporsi populasi.
Variabel random X menyatakan banyaknya sukses dalam n percobaan.
Karena p = X n dan n merupakan konstante, X berdistribusi sama seperti p.
Jika ukuran sampel n membesar, teorema limit pusat juga berlaku di
sini, dan distribusi sampling p dapat dianggap berdistribusi normal dengan
rerata:
E (p) = P (6.8)
dan variansi:
P (1 − P ) PQ
Var (p) = = (6.9)
n n
sehingga:
p−P
Z= (6.10)
PQ n
berdistribusi normal standar.

Contoh 6.2:
Misalkan diketahui bahwa 70% calon pembeli mobil di Indonesia
terutama berminat untuk membeli kendaraan minibus. Apabila diambil
sampel 100 orang calon pembeli mobil secara acak, berapakah bahwa
sekurang-kurangnya 60 orang di antaranya memilih untuk membeli minibus?
P = 0.70 Q = 1 ‒ P = 0.30 n = 100
 0.60 − 0.70 
P (p > 0.60) = P  Z ≥ 
 ( 0.70 )( 0.30 ) 100 

= P (Z > ‒2.1822)
= 0.4854 + 0.5000 = 0.9854 = 98.54%

156
6.2 METODE SAMPLING
 Penarikan Sampel
Tujuan
Mengumpulkan data yang valid (sahih) dan reliable (terpercaya)
untuk melakukan inferensi / generalisasi mengenai karakteristik populasi.

Manfaat
Penggunaan proses sampling memungkinkan dilakukannya inferensi /
generalisasi:
 dengan jumlah data yang relatif sedikit
 dalam jangka waktu yang relatif singkat, dan
 dengan jumlah menggunakan biaya / sumber daya yang terbatas.

Validitas dan reliabilitas


Data yang valid (sahih) ialah data yang menyatakan keadaan yang
sesungguhnya hendak diukur. Validitas data tergantung pada 3 faktor:
a. Faktor subjek / objek yang diukur: Sampel harus merupakan sampel
yang ‘representatif’ bagi populasi.
Syarat: pengambilan sampel harus dilakukan secara ‘acak’ (random).
b. Faktor instrumen pengukuran: Harus digunakan instrumen yang
sesungguhnya mengukur apa yang hendak diukur.
c. Faktor subjek pelaku pengukuran.
Ukuran ketidak-validnya data ialah ‘bias’.
Data yang reliable (terpercaya) ialah data dengan variabilitas yang
rendah pada pengukuran berulang. Reliabilitas data ditentukan oleh besar
sampel, selain oleh faktor subjek / objek yang diukur, instrumen pengukuran,
serta pelaku pengukuran. Ukuran reliabilitas data ialah ‘presisi’.
Pemahaman mengenai validitas dan reliabilitas yang dianalogikan
dengan hasil bidikan seorang petembak digambarkan secara sederhana pada
diagram 6.2.

157
Diagram 6.2 Validitas dan reliabilitas data sampel: (a) Tidak valid dan
tidak reliabel; (b) Valid, tidak reliabel; (c) Reliabel, tidak valid; dan (d)
Valid dan reliabel

Beberapa istilah:
- Elemen (unsur) populasi: unit (satuan) yang dicari informasinya;
merupakan unit elementernya yang membentuk populasi yang diteliti.
Elemen populasi adalah unit analisis.
- Unit sampling: terdiri atas satu / lebih elemen, digunakan untuk
memilih elemen untuk anggota sampel.
- Populasi target (sasaran): Populasi yang di-‘target’-kan untuk diteliti
dan diestimasi nilai parameternya.
- Populasi aktual: kumpulan elemen yang ‘eligibel’ (memenuhi syarat)
untuk menjadi anggota sampel.
- Kerangka sampel: kumpulan elemen yang ‘terdaftar’ sebagai calon
anggota sampel.

Macam sampel
Berdasarkan objektif-tidak-nya beserta acak-tidak-nya cara
pengambilan, dikenal berbagai macam sampel yang secara skematis
diperlihatkan pada matriks 6.1.

158
Matriks 6.1. Teknik penarikan sampel
Probabilitas Non-probabilitas
Sampel
- ‘purposive’
Objektif Sampel random
- ‘quota’
- ‘haphazard’
Subjektif Sampel kuasi-random Sampel ‘judgment’

Rumus-rumus statistika matematika hanya berlaku pada penarikan


sampel secara objektif atas dasar probabilitas, yaitu sampel acak / random.
Pada sampling probabilitas, tiap elemen populasi memiliki
probabilitas yang telah diketahui besarnya untuk terpilih. Metode seleksi
probabilitas demikian memiliki lima alternatif:
A. Epsem (equal probability for all elements; probabilitas sama bagi
seluruh elemen): probabilitas sama pada tiap tahap atau pada
keseluruhan tahap sampling
versus
Non-equal probabilities (probabilitas tak sama) bagi elemen yang
berlainan: dikompensasi dengan pembobotan terbalik (inverse weight).
B. Sampling elemen: satu tahap, unit sampling terdiri atas hanya satu
elemen
versus
Sampling klaster (kelompok): unit sampling adalah klaster
(kelompok) elemen.
C. Sampling tak-terstratifikasi: unit sampling dipilih dari keseluruhan
populasi
versus
Sampling stratifikasi: seleksi terpisah bagi masing-masing partisi /
stratum populasi.
D. Seleksi acak: unit sampling dipilih secara acak dari keseluruhan
stratum atau populasi
versus
Seleksi sistematik: unit sampling dipilih secara sistematik dengan
interval seleksi tertentu pada daftar.

Kelima alternatif di atas dapat saling dikombinasikan, menghasilkan


beberapa teknik penarikan sampel acak yang sering digunakan:

159
- Sampling acak sederhana ( simple random sampling)
- Sampling acak stratifikasi (stratified random sampling).
- Sampling acak klaster ( cluster random sampling)
- Sampling acak sistematik (systematic random sampling).

Sampling dengan dan tanpa pengembalian:


Pada keempat teknik penarikan sampel di atas dapat dilakukan
sampling dengan maupun tanpa pengembalian, namun yang umum
dilaksanakan dalam praktik adalah sampling tanpa pengembalian.
Di sini hanya akan dibahas rumus-rumus untuk sampling tanpa
pengembalian.

 Sampling Acak Sederhana


Metode untuk memilih n unit sampling di antara N, sehingga tiap
sampel yang mungkin dibentuk memiliki kemungkinan yang sama untuk
terpilih.
• Skema penyampelan:

Diagram 6.3. Sampling acak sederhana


N : populasi
srs : sampling random sederhana
n : sampel
• Data sampel:
x1 , x2 , . . . , xn

• Estimasi rerata dan variansi distribusi sampling nilai rerata:


 n 
x =  ∑ xi  n (6.11)
 i =1 

s2 N − n
ˆ (x ) =
Var (6.12)
n N
• Pelaksanaan.
Dapat digunakan antara lain:

160
(1) metode ‘penarikan undian’,
(2) bilangan acak yang dihasilkan oleh komputer / kalkulator
saintifik; atau
(3) tabel bilangan acak.

 Sampling Acak Stratifikasi


Populasi dibagi menjadi beberapa strata, lalu sampel acak sederhana
diambil pada tiap stratum.
• Skema penyampelan.

Diagram 6.4. Sampling acak stratifikasi


N : populasi
Str : stratifikasi
Nh : stratum ke-h; h = 1. 2, . . . , L
srs : sampling random sederhana
• Data sampel.
Stratum 1: x11 , x12 , . . . , x1n
1

Stratum 2: x21 , x22 , . . . , x2 n


2
.
.
.
Stratum L: xL1 , xL 2 , . . . , xLn
L

161
• Estimasi rerata dan variansi distribusi sampling nilai rerata.
L 
xstr =  ∑ N h xh  n (6.13)
 h =1 
dengan:
L 
xh =  ∑ xh  nh (6.14)
 i =1 i 
1 L N h − nh sh2
ˆ ( xstr ) =
Var ∑ 2
Ni
Nh nh
(6.15)
N2 h=1

• Pelaksanaan.
Populasi dibagi menjadi beberapa strata, yang masing-masing relatif
homogen. Lakukan sampling acak sederhana pada tiap stratum.

 Sampling Acak Klaster


Unit samplingnya adalah klaster (cluster; kelompok), yang terdiri atas
sejumlah elemen / sub-unit.
A. Sampling satu-tahap (one-stage sampling):
Seluruh anggota klaster yang terpilih secara otomatis terpilih menjadi
anggota sampel.
• Skema penyampelan.

Diagram 6.5. Sampling acak klaster satu-tahap

N : populasi
clust : pengelompokan (clustering)

162
Ni : kluster ke-i, i = 1, 2, . . . , M
srs : sampling acak sederhana (simple random sampling)
N i = ni : klaster terpilih menjadi sampel ; i = 1, 2, . . . , m
()
n : sampel

• Data sampel.
Klaster 1 : x11 , x12 , . . . , x1N 1
()

Klaster 2 : x21 , x22 , . . . , x2 N


( )
2

.
.
Kluster m : xm1 , xm 2 , . . . , xmN m
( )

• Estimasi rerata dan variansi distribusi sampling nilai rerata.


m  m
xcl =  ∑ ni xi  ∑ ni (6.16)
 i =1  i =1

dengan:
 ni 
xi =  ∑ xij  ni (6.17)
 j =1 
M −m 1 m

2
ˆ ( xcl ) =
Var ni2 ( xi − xcl ) (6.18)
M m n2 m − 1 i =1

• Pelaksanaan.
Populasi dibagi menjadi sejumlah klaster, yang masing-masing relatif
heterogen. Lakukan sampling acak sederhana dengan klaster sebagai unit
sampling. Untuk tiap klaster yang terpilih, seluruh elemen anggotanya
dijadikan anggota sampel.

B. Sampling dua-tahap (two-stage sampling):


Sampel acak sederhana diambil pada tiap klaster yang terpilih.

• Skema penyampelan:

163
Diagram 6.6. Sampling acak klaster dua-tahap

N : populasi
clust : pengelompokan (clustering)
Ni : kluster ke- i; i = 1, 2, . . . , M
srs : sampling acak sederhana
Ni : klaster terpilih menjadi sampel ; i = 1, 2, . . . , m
()
ni : sampel pada klaster ke-i; i = 1, 2, . . . , m
n : sampel

• Data sampel.
Klaster 1: x11 , x12 , . . . , x1n
()
1

Klaster 2: x21 , x22 , . . . , x2n


( )
2

.
.
Kluster m: xm1 , xm 2 , . . . , xmn( m )

• Estimasi rerata dan variansi distribusi sampling nilai rerata.


m ni
1 M Ni
xcl =
N m

i =1 ni

j =1
xij (6.19)

• Pelaksanaan.
Populasi dibagi menjadi sejumlah klaster, yang masing-masing relatif
heterogen. Lakukan sampling acak sederhana dengan klaster sebagai unit
sampling. Pada tiap klaster terpilih, dilakukan sampling acak sederhana

164
(sampling tahap kedua) dengan elemen anggotanya sebagai unit untuk
memilih anggota sampel final.

 Sampling Acak Sistematik


Anggota sampel pertama dipilih secara acak di antara anggota sampel
pertama / keseluruhan sampel, lalu anggota sampel berikutnya ditentukan
secara sistematik.
• Skema penyampelan.
A. N merupakan kelipatan bulat k (N = nk)

Diagram 6.7. Sampling acak sistematik:


N merupakan kelipatan k
N : populasi
gr : pengelompokan (grouping)
Oi : objek ke- i; i = 1, 2, . . . , N
srs : sampling acak sederhana
n : sampel

165
B. N tidak merupakan kelipatan bulat k (N ≠ nk)

Diagram 6.8. Sampling acak sistematik: N tidak merupakan


kelipatan bulat k
• Data sampel.
x1 , x2 , . . . , xn

• Estimasi rerata dan variansi distribusi sampling nilai rerata.


 n 
xsy =  ∑ xi  n (6.20)
 i =1 
n−1
N −n 1
Var ( )
ˆ xsy =
Nn 2 ( n − 1)

i =1
( xi − xi+1 ) (6.21)

• Pelaksanaan.
(1) Bagi N anggota populasi menjadi n grup (group), dengan tiap
group memiliki k = N n elemen. Pilih secara acak satu di antara k
elemen anggota grup pertama untuk dijadikan anggota sampel.
Anggota selanjutnya ditentukan secara sistematik, yaitu tiap
anggota ke-k berikutnya dalam daftar; atau:
(2) Pilih secara acak di antara N anggota populasi untuk dijadikan
anggota sampel. Anggota selanjutnya ditentukan secara sistematik,
yaitu tiap anggota ke-k berikutnya dalam daftar; setelah mencapai
akhir daftar dilanjutkan mulai dari awal sampai kembali ke
anggota sampel pertama.

166
LAMPIRAN 6A: DISTRIBUSI X, DISTRIBUSI X ,
DAN DISTRIBUSI TRANSFORMASI X
X dalam teori sampling merupakan variabel random, karena
diperoleh dari sampel berulang dan memiliki nilai yang berubah-ubah pada
tiap penarikan sampel.
n X + X2 + . . . + Xn
X = ∑ Xi n = 1
i =1 n
X1 , X 2 , . . . , X n masing-masing mempunyai rerata µ dan variansi

σ 2 , sehingga:
 X + X2 + . . . + Xn 
E(X ) = E 1 
 n 
1
= E  X + X 2 + . . . + X n 
n  1
1
=  E ( X 1 ) + E ( X 2 ) + . . . + E ( X n ) 
n
1
= [ nµ ] = µ
n
 X + X2 + . . . + Xn 
dan: Var ( X ) = Var  1 
 n 
1
= 2 Var  X1 + X 2 + . . . + X n 
n
1
= 2 Var ( X 1 ) + Var ( X 2 ) + . . . + Var ( X n ) 
n
1 σ2
=  nσ 2
 =
n2   n

167
Matriks 1. Distribusi tranformasi X untuk distribusi parental X normal dan sebarang serta
ukuran sampel besar dan kecil

Distribusi parental Normal Sebarang


(distribusi X) X ~ N (µ ; σ2) X ~ ? (µ ; σ2)

n besar n kecil n besar n kecil


(n > 30) (n < 30) (n > 30) (n < 30)

Distribusi sampling  σ2   σ2   σ2   σ2 
X ~ N  µ,  X ~ N  µ,  X ~ N  µ,  X ~ ?  µ, 
rerata (distribusi X )  n   n   n   n 
       
σ x −µ x −µ x −µ
~ Z (0 ; 1) ~ Z (0 ; 1) ~ Z (0 ; 1)
Distribusi diketahui σ n σ n σ n
transformasi X ?
σ tak x −µ x −µ x −µ
~ Z (0 ; 1) ~ t( n−1) ~ Z (0 ; 1)
diketahui σ n σ n σ n

168
LAMPIRAN 6B: POPULASI , GALAT ACAK, DAN
GALAT SISTEMATIK

Hirarki populasi
Istilah ‘populasi’ dalam metodologi penelitian memiliki pengertian
lebih luas yang dapat dibedakan atas (lihat diagram 1):
1. Populasi studi (sampel): kumpulan subjek / objek yang sebenarnya
menghasilkan data untuk penelitian. Nilai statistik yang diperoleh dari
studi (sampel) sebagai estimator bagi parameter sesungguhnya
dinyatakan dengan lambang θˆ .
2. Populasi aktual: kumpulan subjek / objek yang ‘eligibel’ (memenuhi
syarat) untuk diikutsertakan dalam penelitian dan proses sampling.
Parameter yang ada pada populasi aktual dinyatakan dengan lambang
θo.
3. Populasi target: kumpulan subjek / objek yang menjadi target
penelitian sebenarnya (yang sebenarnya hendak diteliti). Parameter
yang ada pada populasi target dinyatakan dengan lambang θ
4. Populasi eksternal: kumpulan subjek / objek yang lebih luas daripada
populasi target, memiliki karakteristik yang tidak terlalu berbeda
dengan populasi target, dan dianggap masih ‘layak’ untuk ‘menerima’
generalisasi hasil penelitian.

Diagram VI.1. Hirarki populasi pada penelitian


Jika dibandingkan dengan istilah ‘populasi’ dan ‘sampel’ pada awal
pelajaran Statistika, istilah, ‘populasi’ tersebut mengacu pada ‘populasi
target’ , sedangkan istilah ‘sampel’ mengacu pada ‘ populasi studi’.
169
Galat acak dan galat sistematik
Galak acak (random error) adalah perbedaan antara nilai estimasi
parameter yang diperoleh dari sampel (yaitu statistik sampel; θˆ ) dengan
nilai parameter yang sesungguhnya diestimasi (yaitu parameter aktual; θ0).
Galat acak disebabkan oleh variasi sampling, yang besarnya antara lain
tergantung pada metode sampling yang digunakan, besar ukuran sampel,
karakteristik estimator secara statistik.
Galat sistematik (systematic error) adalah perbedaan antara nilai
0
parameter yang sesungguhnya diestimasi (parameter populasi aktual; θ )
dengan nilai parameter populasi yang sebenarnya hendak diteliti (parameter
populasi target; θ). Galat sistematik disebabkan oleh berbagai aspek
rancangan studi ataupun analisis data di luar variasi sampling, antara lain
penarikan sampel yang tidak acak, ketidaktepatan pengukuran, dan
sebagainya.
Dengan demikian galat (error) menyeluruh dalam sebuah penelitian
( ˆ )
adalah θ − θ , yang dapat dibedakan atas dua komponen, galat acak dan
galat sistematik:
( θˆ − θ) = ( θˆ − θ0) + (θ0 – θ)
Galat acak dapat diperkecil dengan memilih metode sampling yang
lebih adekuat, memperbesar ukuran sampel, atau memilih estimator yang
lebih ‘tepat’ secara statistik. Galat sistematik dapat diperkecil antara lain
dengan penarikan sampel acak, perbaikan kualitas data, dan sebagainya.

170
LAMPIRAN 6C: STRATA DAN KLASTER
Stratum adalah pengelompokan yang relatif homogen, sedangkan
klaster merupakan pengelompokan yang bersifat heterogen (lihat diagram 1).
Sampling acak stratifikasi digunakan jika karakteristik yang menjadi dasar
stratifikasi, misalnya jenis kelamin, tingkat sosial ekonomi, suku bangsa, dan
sebagainya dianggap terkait dengan variabel yang hendak diteliti, untuk
menjamin agar anggota populasi dengan setiap taraf karakteristik tersebut
terwakili secara memadai dalam sampel akhir yang dikumpulkan.
Klaster adalah pengelompokan yang biasanya didasarkan atas tempat
(ruang) atau waktu, misalnya desa, kecamatan, kartu registrasi calon
mahasiswa yang terkumpul per hari, dan sebagainya. Klaster bersifat
heterogen, misalnya dalam satu klaster didapatkan subjek dari berbagai
tingkat sosial ekonomi, pria dan wanita, serta berbagai suku bangsa.
Sampling acak klaster digunakan jika ukuran populasi sangat besar sehingga
tidak mungkin ataupun tidak praktis untuk memperoleh atau menyusun
kerangka sampel secara lengkap.

Diagram VI.2 Strata dan klaster. Stratum A: tingkat sosial-ekonomi


tinggi, statum B: tingkat sosial-ekonomi menengah, dan stratum C:
status sosial ekonomi rendah. Ketiga klaster I, II, III dengan
tingkat sosial ekonomi heterogen
Variansi intra-stratum lebih kecil daripada variansi intra-klaster,
namun sebaliknya variansi antar-stratum lebih besar daripada variansi antar-
klaster.

Contoh:
1. Akan diteliti pengeluaran rata-rata mahasiswa per bulan di universitas
WWW. Jika variabel ini diasumsikan terkait erat dengan jenis kelamin

171
mahasiswa, maka dapat digunakan sampling acak stratifikasi dengan
jenis kelamin sebagai dasar stratifikasi.
2. Akan diteliti proporsi keluarga yang paling sedikit salah satu
anggotanya mendengarkan secara teratur siaran stasiun radio A di
kecamatan TS. Karena kerangka sampel bagi terlalu besar untuk
pelaksanaan sampling acak sederhana, dilakukan sampling acak klaster
dua-tahap dengan menggunakan desa sebagai unit klaster.

172
LAMPIRAN 6D: CONTOH PENGGUNAAN
KEEMPAT METODE SAMPLING

Data:
Basis data (dataset) mahasiswa kelas 2PA01 TA 2002/2003 dengan
nomor anggota kelas / populasi (nomor pada basis data), data jenis kelamin,
berat badan, dan IP semester I.

173
Soal:
1. Dengan menggunakan sampling acak sederhana (simple random
sampling), ambillah sampel yang terdiri atas 10 orang mahasiswa. Buat
daftar anggota sampel yang terpilih (No anggota kelas dan BB). Hitung
nilai rerata BB sampel sebagai estimator bagi nilai rerata populasi (data
kelas).
2. Bagi anggota kelas atas 2 strata, pria dan wanita. Dengan jenis kelamin
sebagai dasar stratifikasi, gunakan metode sampling acak stratifikasi
(stratified random sampling) untuk mendapatkan sampel berukuran 10
yang terdiri atas 2 pria dan 8 wanita. Buat daftar anggota sampel yang
terpilih (No anggota kelas dan BB). Hitung nilai rerata BB sampel.
3. Anggota kelas diklasifikasikan dalam 5 kelompok (klaster) berdasarkan
nilai IP-nya, yaitu klaster 1 (IP < 3.00), klaster 2 (IP 3.00-3.24), klaster
3 (IP 3.25-3.49), klaster 4 (IP 3.50-3.74), dan klaster 5 (IP 3.75-4.00).
Dengan metode sampling acak klaster (cluster random sampling) 2-
tahap, mula-mula dipilih 2 di antara 5 klaster secara acak, lalu dari
kedua klaster tersebut masing-masing diambil 5 orang anggota sampel
secara acak, sehingga seluruhnya didapatkan 10 orang anggota sampel.
Buat daftar anggota sampel yang terpilih [No anggota kelas, No
anggota klaster (nomor pada klaster masing-masing), dan BB). Hitung
nilai rerata BB sampel.
4. Dengan menggunakan metode sampling acak sistematik (systematic
random sampling) terhadap data nomor anggota kelas pada basis data
tersebut, tarik sampel berukuran 10. Buat daftar anggota sampel yang
terpilih (No anggota kelas dan BB). Hitung nilai rerata BB sampel.
5. Hitung nilai rerata BB kelas / populasi sebenarnya (70 mahasiswa kelas
2PA01 TA 2003/2004). Bandingkan hasilnya dengan nilai estimasi
yang diperoleh dengan keempat metode sampling.

Jawaban:
1. Sampling Acak Sederhana
 Dengan tabel bilangan acak (tabel E) halaman 1, mulai dari baris
12, kolom ke-10 ke kanan, dan seterusnya.
 Dengan ukuran populasi N = 70 dan ukuran sampel n = 10,
dilakukan pembacaan nomor-nomor dua digit: 54, 30, 98, dan
seterusnya. Pembacaan yang telah mencapai ujung kanan baris
diteruskan ke ujung kiri baris di bawahnya.

174
 Nomor terpilih (digarisbawahi di bawah ini) adalah nomor yang
lebih kecil daripada (atau sama dengan) 70. Nomor-nomor yang
sama hanya dapat dipilih satu kali.
 Pembacaan dihentikan setelah diperoleh 10 nomor berbeda yang
lebih kecil daripada (atau sama dengan) 70.
Tabel 1. Hasil pembacaan tabel bilangan acak
54 / 30 / 9 8 / 74 / 56 78 / 96 / 7 7 / 96 / 38
68 / 86 / 9 4 / 90 / 62 02 / 19 / 6 5 / 51 / 09
27 04 5 6 26 26 dst.

Tabel 2. Hasil sampling acak sederhana


No urut sampel No kelas BB Rerata BB
1 54 45
2 30 40
3 56 60 10
4 38 42 ∑
i =1
xi
5 68 55 x =
6 62 47 10
7 02 51 507
= = 50.7
8 19 49 10
9 65 48
10 51 70

2. Sampling Acak Stratifikasi


a. Stratifikasikan data menurut jenis kelamin
Pria:
1) 2) 1) 2) 1) 2) 1) 2)
No str No kls No str No kls No str No kls No str No kls
1 1 3 20 5 57 7 59
2 19 4 48 6 58
1) 2)
No str = nomor anggota stratum; No kls = nomor dalam kelas

175
Wanita:
No str No kls No str No kls No str No kls No str No kls
1 2 17 18 33 36 49 53
2 3 18 21 34 37 50 54
3 4 19 22 35 38 51 55
4 5 20 23 36 39 52 56
5 6 21 24 37 40 53 60
6 7 22 25 38 41 54 61
7 8 23 26 39 42 55 62
8 9 24 27 40 43 56 63
9 10 25 28 41 44 57 64
10 11 26 29 42 45 58 65
11 12 27 30 43 46 59 66
12 13 28 31 44 47 60 67
13 14 29 32 45 49 61 68
14 15 30 33 46 50 62 69
15 16 31 34 47 51 63 70
16 17 32 35 48 52

2.b. Sampling acak sederhana pada masing- masing stratum


o Digunakan tabel bilangan acak (tabel E) halaman 2, mulai dari
baris ke-25, kolom ke-80 ke kanan, dan seterusnya.
o Dengan ukuran stratum pria N1 = 7, ukuran sampel stratum n1 =
2, dilakukan pembacaan nomor-nomor satu digit: 9, 0, 8, dan
seterusnya.
o Nomor terpilih (digarisbawahi di bawah ini) adalah nomor yang
lebih kecil daripada (atau sama dengan) 7. Nomor-nomor yang
sama hanya dapat dipilih satu kali.
o Pembacaan dihentikan setelah diperoleh 2 nomor berbeda yang
lebih kecil daripada (atau sama dengan) 7.

Tabel 3. Hasil pembacaan tabel bilangan acak untuk stratum pria


9/0/8/4/1 73808 53421 dst

176
Tabel 4. Hasil sampling acak sederhana pada stratum pria
No No str BB Rerata BB
(No kelas)
2

j =1
x1 j
1 4 (48) 60 x1 =
2
135
2 1 (1) 75 = = 67.2
2

o Pembacaan tabel bilangan acak yang terhenti pada titik akhir


untuk stratum pria dilanjutkan dengan pembacaan untuk stratum
wanita.
o Dengan ukuran stratum wanita N 2 = 63, ukuran sampel stratum
n2 = 8, dilakukan pembacaan nomor-nomor dua digit: 73, 80, 85,
dan seterusnya. Pembacaan yang telah mencapai ujung kanan
baris diteruskan ke ujung kiri baris di bawahnya.
o Nomor terpilih (digarisbawahi di bawah ini) adalah nomor yang
lebih kecil daripada (atau sama dengan) 63. Nomor-nomor yang
sama hanya dipilih satu kali.
o Pembacaan dihentikan setelah diperoleh 8 nomor berbeda yang
kebih kecil daripada (atau sama dengan) 63.

Tabel 5. Hasil pembacaan tabel bilangan acak untuk stratum wanita


73 / 80 / 8 5 / 34 / 21 82 / 31 / 5 2 / 80 / 20
86 / 28 / 2 8 / 33 / 65 76 / 60 / 0 1 12 61
74 35 4 dst.

Tabel 6. Hasil sampling acak sederhana pada stratum wanita


No No str (No kelas) BB Rerata BB
1 34 (37) 50
2 21 (24) 51 8
3 31 (34) 50 ∑
j =1
x2 j
4 52 (56) 60 x2 =
5 20 (23) 42 8
6 28 (31) 46 399
= = 49.875
7 33 (36) 53 8
8 60 (67) 47

177
o Estimasi nilai rerata BB dengan sampel acak stratifikasi yang
diperoleh:
 2  N x + N 2 x2
xst =  ∑ N h xh  N = 1 1
 h =1  N1 + N 2

=
( 7 )( 67.5 ) + ( 63)( 49.875 ) = 51.64
7 + 63

3. Sampling acak klaster


3.a. Tahap I: Sampling acak terhadap klaster
o Digunakan tabel bilangan acak (tabel E) halaman 3, mulai dari
baris ke-60, kolom ke-5 ke kanan, dan seterusnya.
o Dengan jumlah klaster populasi M = 5 dan jumlah klaster sampel
m = 2, dilakukan pembacaan nomor-nomor satu digit: 7, 4, 0, dan
seterusnya.
o Nomor terpilih (digarisbawahi di bawah ini) adalah nomor yang
lebih kecil daripada (atau sama dengan) 5. Nomor-nomor yang
sama hanya dapat dipilih satu kali.
o Pembacaan dihentikan setelah diperoleh 2 nomor berbeda yang
lebih kecil daripada (atau sama dengan) 5.

Tabel 7. Hasil pembacaan tabel bilangan acak untuk memilih klaster


7/4/0/2/2 5 9 7 67 4 9 9 2 7 dst

o Klaster yang terpilih adalah klaster 4 (IP 3.50-3.74) dan klaster 2


(IP 3.00-3.24)

Klaster 4 (IP 3.50-3.74):


No klast No kls No klast No kls No klast No kls No klast No kls
1 2 4 15 7 38 10 62
2 3 5 19 8 40 11 63
3 9 6 37 9 61 12 64

178
Klaster 2 (IP 3.00-3.24):
No klast No kls No klast No kls No klast No kls No klast No kls
1 5 6 18 11 42 16 58
2 8 7 23 12 44 17 65
3 11 8 26 13 47 18 66
4 12 9 27 14 51 19 69
5 17 10 41 15 57

3.b. Tahap II: Sampling acak intra-klaster


o Pembacaan tabel bilangan acak yang terhenti pada titik akhir
untuk pemilihan klaster pria dilanjutkan dengan pembacaan untuk
klaster 4.
o Dengan ukuran populasi klaster 4 N1 = 12, ukuran sampel klaster
4 n1 = 5, dilakukan pembacaan nomor-nomor dua digit: 25, 97,
67, dan seterusnya. Pembacaan yang telah mencapai ujung kanan
baris diteruskan ke ujung kiri baris di bawahnya.
o Nomor terpilih (digarisbawahi di bawah ini) adalah nomor yang
lebih kecil daripada (atau sama dengan) 12. Nomor-nomor yang
sama hanya dapat dipilih satu kali.
o Pembacaan dihentikan setelah diperoleh 5 nomor berbeda yang
lebih kecil daripada (atau sama dengan) 12.

Tabel 8. Hasil pembacaan tabel bilangan acak untuk klaster 4


7 40 2/2 5 / 97 / 67 49 / 92 / 7 4 / 58 / 82
74 / 09 / 9 1 / 87 / 58 57 / 51 / 0 5 / 85 / 60
07 / 05 / 0 6 / 52 / 08 96 46 6 2 99 17 dst

Tabel 9. Hasil sampling acak sederhana pada klaster 4

No No str (No kls) BB Rerata BB


1 9 (61) 45 5

2 5 (19) 49 ∑
j =1
x1 j
3 7 (38) 42 x1 =
5
4 6 (37) 50
232
5 8 (40) 46 = = 46.4
5

179
o Pembacaan tabel bilangan acak yang terhenti pada titik akhir
untuk sampling acak sederhana pada klaster 4 dilanjutkan dengan
pembacaan untuk klaster 2.
o Dengan ukuran populasi klaster N 2 = 19, ukuran sampel klaster 2
n2 = 5, dilakukan pembacaan nomor-nomor dua digit: 96, 46, 62,
dan seterusnya. Pembacaan yang telah mencapai ujung kanan
baris diteruskan ke ujung kiri baris di bawahnya.
o Nomor terpilih (digarisbawahi di bawah ini) adalah nomor yang
lebih kecil daripada (atau sama dengan) 19. Nomor-nomor yang
sama hanya dapat dipilih satu kali.
o Pembacaan dihentikan setelah diperoleh 5 nomor berbeda yang
lebih kecil daripada (atau sama dengan) 19.

Tabel 10. Hasil pembacaan tabel bilangan acak untuk klaster 2


96 / 46 / 6 2 / 99 / 17 22 / 86 / 2 6 / 99 / 72
35 / 17 / 8 3 / 29 / 11 08 / 17 / 2 0 / 62 / 77
62 / 76 / 5 2 / 13 / 23 38 14 8 2 66 96
81 74 1 dst.

Tabel 11. Hasil sampling acak sederhana pada klaster 2


No No str (No kls) BB Rerata BB
1 17 (65) 48 5

2 11 (42) 59 ∑
j =1
x2 j
3 8 (26) 50 x2 =
5
4 13 (47) 42 269
5 14 (51) 70 = = 53.8
5

o Estimasi nilai rerata BB dengan sampel acak klaster yang


diperoleh:
n
1 M m Ni i
xcl = ∑ ∑x
N m i =1 ni j =1 ij
1 M  N1 1  N 
n n2
=  ∑ x1 j  +  2 ∑ x2 j  
N m  n1 j =1   n2 j =1  

1 5  12   19  
=    ( 232 ) +   ( 269 )  = 56.39
70 2  5   5 

180
4. Sampling Acak Sistematik
o Ukuran populasi N = 70, ukuran sampel n = 10, maka nilai k
adalah N/n = 70/10 = 7, sehingga N merupakan kelipatan bulat k.
o Mula-mula dilakukan sampling acak sederhana, yaitu memilih
menjadi angka 1 di antara 7 (nilai) untuk menentukan nomor
pertama yang terpilih menjadi anggota sampel.
o Digunakan tabel bilangan acak (tabel E) halaman 4, baris ke-80,
kolom ke-55 (hanya dibutuhkan 1 angka).
o Nomor terpilih (digarisbawahi di bawah ini) adalah nomor yang
lebih kecil daripada (atau sama dengan) 7, yaitu nomor 1,
sehingga yang terpilih untuk menjadi anggota sampel sistematik
adalah anggota populasi dengan nomor baris data 1, 8, 18, . . . ,
64 (10 orang).

Tabel 12. Hasil pembacaan tabel bilangan acak untuk penentuan


nomor anggota pertama sampel sistematik
1 6 0 9 1 2 9 5 4 3 dst.

Tabel 13. Hasil sampling acak sistematik

No No kelas BB Rerata BB
1 1 75
2 8 49
3 15 45 10

4 22 57 ∑
i =1
xi
5 29 55
xsy =
10
6 36 53 542
7 43 45 = = 54.2
10
8 50 46
9 57 65
10 64 52

Sebagai bahan perbandingan, pada tabel VI.14 diperlihatkan nilai


estimasi rerata berat badan mahasiswa kelas 2PA01 TA 2002/2003

181
berdasarkan keempat metode sampling beserta nilai rerata populasi
sesungguhnya.

Tabel 14. Estimasi nilai rerata berat badan mahasiswa kelas 2PA01 TA
2002/2003, Depok dengan keempat metode sampling serta nilai rerata
populasi sesungguhnya
No Metode sampling Rerata BB (kg)
1 Sampling acak sederhana 50.7
2 Sampling acak stratifikasi 51.64
3 Sampling acak klaster 56.39
4 Sampling acak sistematik 54.2
Populasi kelas 49.87

182
LATIHAN 6
Bagian Pertama
Pilihlah satu jawaban yang paling benar !

1. Jika distribusi populasi adalah normal, maka distribusi sampling nilai


rerata-nya:
A. Selalu berdistribusi normal.
B. Tidak selalu berdistribusi normal.
C. Mungkin berdistribusi t
D. B) dan C) benar.

2. Jika berdistribusi populasi sebarang, maka distribusi sampling nilai


rerata-nya:
A. Tidak mungkin berdistribusi normal.
B. Dapat berdistribusi normal jika ukuran sampelnya besar.
C. Dapat berdistribusi normal jika ukuran sampelnya kecil.
D. Distribusi sampling nilai rerata-nya tidak ditentukan oleh ukuran
sampel.

3. Pilihlah pernyataan yang benar:


A. SE ( x ) mungkin lebih besar daripada SD (x).
B. SE ( x ) selalu lebih besar daripada SD (x)
C. SE ( x ) mungkin sama dengan SD (x)
D. SE ( x ) selalu lebih kecil daripada SD (x)

4. Pernyataan bahwa Var ( X ) = σ 2 n pada sampling dengan


pengembalian:
A. Hanya berlaku jika distribusi populasi normal.
B. Hanya berlaku jika ukuran sampel besar.
C. Hanya berlaku jika distribusi populasi normal dan ukuran sampel
besar.
D. Berlaku tanpa tergantung pada bentuk distribusi populasi ataupun
ukuran sampel.

183
5. Dibandingkan dengan nilai Var ( X ) pada sampling dengan
pengembalian, nilai Var ( X ) pada sampling tanpa pengembalian:
A. Selalu lebih besar.
B. Dapat lebih besar.
C. Tidak lebih besar.
D. Mungkin lebih besar, sama besar, ataupun lebih kecil.

6. Persyaratan agar teorema limit pusat yang menyatakan bahwa distribusi


sampling nilai rerata berdistribusi normal dengan rerata µ dan variansi
σ 2 n berlaku, antara lain yaitu:
A. Sampling dilakukan tanpa pengembalian.
B. Nilai n besar.
C. A) dan B) benar.
D. A) dan B) salah.
x −µ
7. Pernyataan yang benar mengenai transformasi ialah:
s n
A. Selalu berdistribusi t dengan derajat bebas n
B. Selalu berdistribusi t dengan derajat bebas (n – 1)
C. Dapat berdistribusi Z jika n > 30
D. Semuanya salah.

x −µ
8. Pernyataan yang tidak benar mengenai transformasi ialah:
σ n
A. Hanya berdistribusi Z jika distribusi populasi normal dan n > 30
B. Hanya berdistribusi Z jika distribusi populasi normal
C. Hanya berdistribusi Z jika n > 30
D. Seluruhnya pernyataan di atas tidak benar

184
9. Pilihlah pernyataan yang salah:
A. Jika n besar dan populasi berdistribusi normal, distribusi
x −µ
sampling juga berdistribusi normal.
s n
B. Jika n besar dan populasi berdistribusi menceng ke kanan,
x −µ
distribusi sampling tetap berdistribusi normal.
s n
x −µ
C. Jika n besar dan distribusi sampling berdistribusi normal,
s n
distribusi populasinya pasti normal.
x −µ
D. Jika n besar dan distribusi sampling berdistribusi normal,
s n
distribusi populasinya mungkin menceng ke kiri.

10. Manfaat sampling antara lain yaitu:


A. Mengurangi jumlah data yang dibutuhkan.
B. Mempersingkat jangka waktu penelitian.
C. Mengefisiensikan penggunaan data / sumber daya lainnya.
D. Semuanya benar.

11. Validitas data antara lain ditentukan oleh faktor berikut, kecuali:
A. Subjek / objek yang diukur
B. Instrumen pengukuran
C. Subjek pelaku pengukuran
D. Semua faktor di atas ikut menentukan validitas data

12. Data yang ‘bias’ adalah data yang:


A. Tidak menyatakan keadaan yang sesungguhnya hendak diukur.
B. Memiliki variabilitas yang tinggi pada pengukuran berulang.
C. A) dan B) benar.
D. A) dan B) salah.

13. Kumpulan elemen yang ‘terdaftar’ sebagai calon anggota sampel


dinamakan:
A. Populasi target. C. Populasi eksternal.
B. Populasi aktual D. Kerangka sampel.

185
14. Populasi target adalah:
A. Kumpulan subjek / objek yang mengkontribusikan data bagi
penelitian.
B. Kumpulan subjek / objek yang eligibel untuk mengikuti proses
sampling.
C. Kumpulan subjek / objek yang sebenarnya hendak diestimasi
parameternya.
D. Semuanya salah.

15. Tiap elemen anggota populasi dimiliki probabilitas yang pasti sama
untuk terpilih menjadi anggota sampel pada:
A. Sampling acak sederhana. C. Sampling acak klaster.
B. Sampling acak stratifikasi. D. Semuanya benar.

16. Yang tidak termasuk dalam sampling probabilitas di antara prosedur


sampling berikut yaitu:
A. Sampling purposif (purposive sampling)
B. Sampling acak sederhana
C. sampling acak stratifikasi
D. Semuanya salah

17. Penggunaan prosedur sampling probabilitas antara lain ditujukan


untuk:
A. Memperkecil random error C. Keduanya benar
B. Memperkecil systematic error D. Keduanya salah

18. Jika variansi dalam-kelompok relatif besar dan variansi antar-kelompok


relatif kecil, metode sampling yang dianjurkan adalah:
A. Sampling acak stratifikasi. C. Keduanya benar.
B. Sampling acak klaster D. Keduanya salah.

19. Inferensi statistik berlaku secara valid pada penelitian yang


menggunakan:
A. Sampel kuota C. Sampel purposif
B. Sampel acak. D. Semuanya benar

20. Metode sampling yang hanya memerlukan penentuan secara acak bagi
anggota pertamanya didapatkan pada:
A. Sampling acak sederhana C. Samplingg acak kelompok
B. Sampling acak stratifikasi D. Sampling acak sistematik.

186
Bagian Kedua
Selesaikan soal-soal berikut:

1. Dimiliki populasi:

i 1 2 3 4 5 6 7 8 9 10
Xi 72 68 74 68 90 87 68 71 69 88

Hitunglah:
A. Rerata dan variansi populasi X
B. Rarata dan variansi distribusi sampling X jika dilakukan
sampling dengan pengembalian, n = 3.
C. Rerata dan variansi distribusi sampling X pada sampling tanpa
pengembalian dengan n = 3.

2. Misalkan diketahui bahwa rerata usia penduduk kota Depok adalah 29


tahun dengan standar deviasi 16 tahun. Jika dipilih kelompok yang
terdiri atas 36 orang penduduk secara acak, hitunglah probabilitas
bahwa rerata usia kelompok tersebut kurang daripada 35 tahun.

3. Misalkan pula diketahui proporsi mahasiswa di antara penduduk kota


Depok adalah 0.20. Hitunglah probabilitas bahwa dalam kelompok
yang dipilih pada soal No. 2 di atas sekurang-kurangnya terdapat 10
orang mahasiswa.

187
KEPUSTAKAAN

Aczel AD. Complete Business Statistics. Homewood, Illinois: Richard D


Irwin, Inc,1989.
Ary D, LC Jacobs, A Razavieh. Introduction to Research in Education. New
York: Holt, Rinehart and Winston, Inc, 1972.
Bhattacharyya GK, RA Johnson. Statistical Concepts and Methods. New
York: John Wiley & Sons, 1977.
Chakravarti IM, RG Laha, J Roy. Handbook of Methods of Applied
Statistics, Volume I. Techniques of Computation, Descriptive Methods,
and Statistical Inference. New York: John Wiley & Sons, 1967.
Chambers JM, WS Cleveland, B Kleiner, PA Tukey. Graphical Methods for
Data Analysis. Belmont, California: Wadsworth International Group,
1983.
Cochran WG. Sampling Techniques, Third Edition. New York: John Wiley
& Sons, 1977.
Everitt BS. The Cambridge Dictionary of Statistics. Cambridge: Cambridge
University Press, 1998.
Fox J. Describing Univariate Distributions. In: J Fox, JS Long (Eds).
Modern Methods of Data Analysis. Newbury Park: Sage Publications,
Inc, 1990.
Harshbarger RJ, JJ Reynolds. Calculus with Applications. Lexington,
Massachusetts: DC Heath and Company, 1990.
Hayslett HT. Statistics Made Simple. London: WH Allen & Co, Ltd, 1979.
Huntsberger DV, P Billingsley. Elements of Statistical Inference, Fifth
Edition. Boston: Allyn and Bacon, Inc, 1981.
Jessen RJ. Statistical Survey Techniques. New York: John Wiley & Sons,
1978.
Kartika SH. Analisis Data Statistik. Jakarta: Karunika, Universitas Terbuka,
1985.
Kendall SMG, WR Buckland. A Dictionary of Statistical Terms, 4th Edition.
London: Longman Group Ltd, 1982.
Kreyszig E. Introductory Mathematical Statistics: Principles and Methods.
New York: John Wiley & Sons, 1970.

189
Kustituanto B, R Badrudin. Statistika I (Deskriptif). Jakarta: Penerbit
Gunadarma, 1994.
Maki DP, M Thompson. Finite Mathematics, Third Edition. New York:
McGraw-Hill, Inc, 1989.
Sanders DH. Statistics: A First Course, Fifth Edition. New York: McGraw-
Hill, Inc, 1995.
Scheaffer RL, W Mendelhall, L Ott. Elementary Survey Sampling, Third
Edition. Boston: Duxbury Press, 1986.
Snedecor GW, WG Cochran. Statistical Methods, Seventh Edition. Ames,
Iowa: The Iowa State University Press, 1982.
Soejoeti Z. Metode Statistik I. Jakarta: Universitas Terbuka Depdikbud,
1984.
Steel RGD, JH Torrie. Principles and Procedures of Statistics: A Biometrical
Approach, Second Edition. Auckland: McGraw-Hill International Book
Company, 1981.
Thompson SK. Sampling. New York: John Wiley & Sons, 1992.

190

Anda mungkin juga menyukai