Modul Lengkap Statistika Dasar PDF
Modul Lengkap Statistika Dasar PDF
BAB I
PENYAJIAN DATA
1.1 PENDAHULUAN
Data mentah atau data yang diperoleh dari proses pengumpulan data pada umumya
masih berupa data yang tidak teratur. Agar data tersebut lebih bermakna, maka proses
pertama adalah mengelompokkan atau mengatur data mentah tersebut ke dalam
bentuk-bentuk tertentu agar lebih berarti dan mudah untuk penggunaan selanjutnya.
Selain ditampilkan dalam bentuk distribusi angka-angka, data juga bisa ditampilkan
dalam bentuk grafik. Tampilan berupa grafik pada prinsipnya bertujuan agar data
secara sekilas mudah dipahami, selain disajikan dalam format yang lebih menarik.
Pemilihan grafik dalam penyajian data tergantung dari jenis data yang mau disajikan.
Dalam hal ini dibedakan berdasarkan atas data kualitatif dan data kuantitatif.
1.2 PENYAJIAN
PENYAJIAN DATA
Bentuk-bentuk tampilan atau penyajian data pada dasarnya ada dua jenis :
1. Tabel
Data biasa ditampilkan dalam bentuk tabulasi, yang berarti terdapat BARIS dan
KOLOM dalam jumlah tertentu. Tabel sendiri bisa dibagi penggunaannya
berdasar jenis data yang ada. Jika data adalah kualitatif, maka penggunaan
TABEL KONTINGENSI lebih dianjurkan karena tidak adanya decimal dalam
data kualitatif. Sedang untuk data kuantitatif, agak sulit untuk menampilkannya
dalam sebuah table kontigensi. untuk itu data kuantitatif biasa disajikan dengan
sebuah STEAM AND LEAF DISPLAY, atau menyusunnya dalam sebuah
distribusi frekuensi.
1
Modul statistika dasar
Contoh :
Penggambaran data kualitatif.
Remaja Muda Dewasa
Suka 2 5 12
Cukup suka 7 21 30
Tidak suka 5 11 21
Selain dengan table kontingensi, data juga bias dikelompokkan berdasar besaran-
besaran tertentu, yang disebut kelas-kelas, desertai sebuah kolom yang berisi
frekuensi tertentu. Tabel semacam ini biasa disebut dengan Distribusi Frekuensi.
Contoh Penggambaran data kuantitatif.
Berat Badan Frekuensi
(kg)
25 - 40 10
41 - 56 27
Di atas 56 7
2. Grafik (Diagram)
Selain disusun dalam bentuk table kontingensi atau distribus frekuensi yang
hanya menonjolkan angka-angka, data juga bisa disajikan lebih menarik dengan
tampilan berupa grafik, seperti grafik batang, grafik lingkaran, grafik garis dan
sebagainya. Pada distribusi frekuensi, selain data ditampilkan dalam bentuk
frekuensi perkelas, data juga bias divisualkan dalam bentuk histogram atau
polygon.
Contoh diagram lingkaran :
2
Modul statistika dasar
Contoh Poligon :
Selain dengan table atau grafik, data khususnya data kuantitatif bisa pula
dusajikan dala bentuk STEAM AND LEAF atau ORDERED ARRAY. Ordered
array adalah menyusun data-data secara berurutan (order), bisa dari data terkecil
ke data terbesar atau sebaliknya. Sedangkan steam and leaf merupakan tahap
lanjutan dari ordered array. Setelah data tersusun, kumpulan data tersebut bisa
disajikan dalam bentuk data pokok lalu disertai dengan angka decimal yang ada.
Jadi penyusunan steam and leaf akan efektif pada penyajian data yang
mempunyai angka decimal, seperti tinggi badan 173,3 cm, berat badan 56,7 kg
dan seterusnya.
3
Modul statistika dasar
Penyajian data dalam bentuk grafik sebaiknya dilihat pula pada tipe
datanya.jika data bersifat KATEGORIKAL, seperti data nominal dan ordinal,
maka grafik yang sesuai adalah Bar Chart ( Grafik Batang), Pie Chart
(Lingkaran) dan Pareto.
Toyota 5661
Mitsibishi 1799
Suzuki 1463
Isuzu 1237
Daihatsu 1093
Honda 717
4
Modul statistika dasar
Toyota 37991
Mitsibishi 37654
Suzuki 29239
Isuzu 14140
Daihatsu 10142
Honda 3449
5
Modul statistika dasar
6
Modul statistika dasar
Toyota
Mitsibishi
Suzuki
Isuzu
Daihatsu
Honda
7
Modul statistika dasar
Toyota
Mitsibishi
Suzuki
Isuzu
Daihatsu
Honda
3. Grafik Pareto
Grafik Pareto sering digunakan dalam penggunaan statistic untuk
pengendalian mutu (quality control), yang menggambarkan komponen mana
yang lebih menonjolkan kuantitasnya dibanding yang lain, sehingga perlu
perhatian khusus.
Grafik ini merupakan gabungan antara tampilan grafik batang dengan
grafik garis dengan cirri khas data-data untuk pembuatan grafi pareto selalu
diurutkan dahulu dari yang terbesar sampai yang terkecil .
Kategori Sedan
Merk Jumlah (unit)
Toyota 5661
Mitsibishi 1799
Suzuki 1463
Isuzu 1237
Daihatsu 1093
Honda 717
8
Modul statistika dasar
Kategori Sedan
Merk Jumlah (unit)
Honda 717
Daihatsu 1093
Isuzu 1237
Suzuki 1463
Mitsibishi 1799
Toyota 5661
Dan jika ditampilkan dengan grafik Pareto akan tampak sebagai berikut :
Pada grafik Pareto, sumbu X menampilkan data kualitatif, yang pada kasus ini adalah
merk-merk mobil yang terjual, sedangkan sumbu Y menampilkan jumlah unit mobil
tertentu yang terjual. Pada sumbu Y ini juga, pada sebelah kanan, terlihat persentase
mobil tertentu yang terjual yang karena berbentuk komulatif . Jika tampilan setiap
nilai individu dinyatakan dalam bentuk bar, maka tampilan secara komulatif
dinyatakan dalam bentuk garis (line).
Dari grafik di atas terlihat secara menyolok bahwa mobil merk Toyota terjual
paling banyak, kemudian diikuti merk mobil lain yang gradasi penurunan gambarnya
(tinggi bar) cukup landai dan tidak terlihat menyolok seperti mobil Toyota tersebut.
9
Modul statistika dasar
Dari grafik ini, sesuai tujuan Pareto, perhatian harus diberikan pada satu atau
beberapa data dengan jumlah besar, yang adalah mobil merk Toyota.
KATEGORI NON-SEDAN
Toyota 37991
Mitsubishi 37654
Suzuki 29239
Izusu 14140
Daihatsu 10142
Honda 3449
Lain-lain 12737
Jika diurutkan secara descending (dari terbesar ke terkecil), maka table menjadi :
Toyota 37991
Mitsubishi 37654
Suzuki 29239
Izusu 14140
Lain-lain 12737
Daihatsu 10142
Honda 3449
10
Modul statistika dasar
Dari grafik di atas terlihat mobil merk Toyota kembali menjadi merk yang harus
diperhatikan karena mempunyai persentase terbesar. Namun berbeda dengan
tampilan Pareto pada modil non-sedan, pada mobil sedan, selain merk Toyota, merk
Mitsubishi dan Suzuki mempunyai persentase yang hampir sama dengan Toyota.
Dengan demikian, selain Toyota, kedua merk tersebut juga patut mendapat perhatian.
Januari 0,33
Februari 0,87
Maret 0,89
April 0,46
Mei 1,13
11
Modul statistika dasar
Juni 1,67
Juli 2,12
Agustus -0,21
September 0,64
Oktober 0,68
November 1,71
Desember 1,62
TABEL KONTINGENSI
Table kontingensi bisa digunakan jika data yang ada berbentuk kualitatif, seperti
jenis kelamin, tingkat pendidikan dan sebagainya. Data tersebut meliputi data dengan
skala pengukuran nominal atau ordinal. Pada banyak buku, data tersebut bisa juga
dinamakan data kategori, yakni data yang didapat dan kemudian dimasukkan dalam
sebuah kategori tertentu. Ciri khas dari data ini adalah data berbentuk bilangan
integer (bulat), sehingga data tidak mengandung unsure decimal.
Untuk lebih jelasnya, berikut disertakan kasus sederhana, untuk menunjukkan
barbagai variasi tampilan data dengan table kontingensi.
Kasus :
Data komposisi kepemilikan STASIUN RADIO di berbagai kota di Jawa :
KOTA DI JAWA
Jenis Gelombang
12
Modul statistika dasar
AM 4 14 5 2
FM 34 11 21 3
Pada table kontingensi di atas, baik data jenis radio maupun data kota adalah data
kualitatif, karena keduanya adalah data nominal. Dengan demikian, pasti kedua
variable tersebut tidak mengandung decimal, karena tidak mungkin jumlah stasiun
radio AM ada 2,5 buah, atau jumlah stasiun radio gelombang FM di Jakarta
berjumlah 15,4 buah.
FM 34 11 21 3 69
TOTAL 38 25 26 5 94
13
Modul statistika dasar
Dari table di atas bisa dilihat tambahan informasi yang berguna, yakni :
Jika dilihat dari TOTAL KOLOM, maka jumlah radio FM secara total
berjumlah lebih besar disbanding total rdio AM. Perbandingan tersebut
bahkan dua kali lebih (69 dibanding 25 atau sekitar 2,76).
Jika dilihat dari TOTAL BARIS, maka kota Jakarta mempunyai jumlah total
radio (gelombang AM dan gelombang FM) terbanyak, sebesar 38. Sedang
kota Surabaya dan Bandung hamper berimbang (25 dibanding 26).
Keterangan :
14
Modul statistika dasar
Keterangan :
Sel untuk radio AM di Jakarta jika diubah ke persentase BARIS menjadi :
15
Modul statistika dasar
Hasil pengubahan dalam persentase baris dan kolom dari data stasiun radio di atas :
Keterangan :
16
Modul statistika dasar
Sel untuk radio AM di Jakarta jika diubah ke persentase BARIS dan KOLOM
menjadi :
4/94 x 100% = 4.26%
Sel untuk radio FM di Surabaya jika diubah ke persentase BARIS dan
KOLOM menjadi :
14/94 x 100% = 11.70%
Demikian untuk persentase sel lainnya, dengan ketentuan setiap isi sel yang
bersangkutan dibagi dengan total stasiun radio, baik gelombang AM atau FM di
keempat kota tersebut, yakni 94 buah.
Analisis :
Dari table di atas terlihat bahwa jumlah seluruh stasiun radio paling banyak ada
di Jakarta (40.43%), sedang terkecil ada di kota Bogor (hanya 5.32%). Sedang
jika dilihat dari jenis gelombang radio, terbesar tetap Jakarta, dengan jumlah
stasiun radio FM sejumlah 36.17% dari total stasiun radio di keempat kota
tersebut.
Ummary Tabel
Summary table berfungsi untuk meringkas berbagai informasi yang bertipe
kualitatif. Berbeda dengan table kontingensi yang mempunyai banyak baris dan
kolom, summary table hanya mempunyai satu kolom yang berfungsi untuk
meringkas seluruh informasi yang terkandung dalam setiap baris yang ada.
Sebagai contoh, jika table kontingensi yang menggambarkan komposisi radio di
kota-kota di Jawa disajikan dalam sebuah summary table, maka ventuk table adalah
:
AM 25
FM 69
17
Modul statistika dasar
TOTAL 94
Perhatikan table di atas yang tidak menampilkan perincian radio AM dan FM per
kota, karena yang diinginkan adalah ringkasan jenis gelombang radio. Pada
summary table, bisa juga diberi tambahan sebuah kolom yang berisi persentase
masing-masing data pada sebuah baris :
AM 25 26.6
FM 69 73.4
TOTAL 94 100
Walaupun kolom summary table di atas lebih dari satu kolom, namun kolom kedua
ini merupakan penjelasan tambahan saja dari kolom ringkasan.
Jika akan ditampilkan ringkasan jumlah stasiun radio per kota, maka tampilan
menjadi :
Jakarta 38
Surabaya 25
Bandung 26
Bogor 5
TOTAL 94
18
Modul statistika dasar
1.2.1 LATIHAN
1. Berikut adalah komposisi Pembangkit Listrik berdasarkan sumber
energy pada Negara-negara Eropa :
Nuklir 35%
Lain-lain 3%
TOTAL 100%
Denmark 29,0
8,7
Italia 25,0
16,0
Jerman 12,5
4,5
19
Modul statistika dasar
BAB II
DISTRIBUSI FREKUENSI
2.1 PENDAHULUAN.
Seperti yang telah disinggung pada modul pertama yaitu penyajian data, Distribusi
frekuensi pada prinsipnya adalah menyususn dan mengatur data kuantitatif yang
masih mentah ke dalam beberapa kelas data yang sama, sehingga setiap kelas bisa
menggambarkan karakteristik data yang ada. Seperti missal jika ada kelas data upah
bulanan “ 200.000 – 300.000” yang berisi frekuensi “100”, maka bisa diartikan
bahwa ada 100 orang yang menerima upah bulanan antara Rp. 200.000 sampai Rp.
300.000.
20
Modul statistika dasar
2.2 PENYAJIAN.
Distribusi frekuensi
Data hasil pengukuran biasanya dapat disajikan dalam bentuk diagram seperti pada
modul sebelumnya, juga bisa pula disusun dalam sebuah table yang disebut table
frekuensi atau distribusi frekuensi yang yang terdiri dari distribusi frekuensi tunggal
dan distribusi frekuensi berkelompok.
Berikut ini akan diberikan sejumlah data hasil pengukuran tinggi badan ( sampai
sentimeter terdekat) dari 40 orang mahasiswa/I semester I Pendidikan Matematika.
Dari data tersebut di atas dapat diperoleh ukuran paling rendah ( minimum) adalan
148 cm dan ukuran tertinggi (maksimum) adalah 177 cm. sehingga selisih antara
data tertinggi dan data terendah disebut sebagai jangkauan ( Range).Untuk data di
atas range = 177 cm – 148 cm = 29 cm. Jika data tersebut disusun dalam table
frekuensi data tunggal maka tentu akan sangat panjang. Untuk itu data tersebut
21
Modul statistika dasar
harus disusun dalam sebuah table yang disebut table frekuensi data berkelompok
atau distribusi frekuensi data berkelompok.
Jumlah kelas pada prinsipnya bisa ditentukan secara subyektif, walaupun secara
umum jumlah kelas yang bagus berkisar antara 5 sampai 20 kelas. Jika jumlah
kelas terlalu kecil, misal ada 500 data dengan jumlah kelas hanya 5, maka banyak
informasi yang penting akan hilang.namun jumlah kelas terlalu banyak juga
dengan data yang relativesedikit, misalnya untuk 50 data ada 20 kelas, maka tiap
kelas relative hanya mendapat 3 data.
H.A Sturges (1926) mengajukan sebuah rumus untuk menentukan jumlah kelas
dari sekelompok data :
K = 1 + 3,322. Log n
Ket :
k = jumlah kelas
n = jumlah data
misalkan untuk data nilai ujian matematika dari 78 mahasiswa, maka jumlah kkelas
yang dianjurkan adalah :
Jadi dari 78 data tersebut akan dibuat table frekuensi dengan kelas berjumlah 7.
NB. Rumus sturges adalah sebuah alternative, dan tidak diharuskan digunakan dalam
setiap kelas.
22
Modul statistika dasar
i = Range/ k
Dimana :
I = interval kelas
K = jumlah kelas
Dengan jumlah kelas dan panjang interval kelas yang telah diperoleh, maka
disusunlah table frekuensi. ( seperti pada contoh).
Ada beberapa istilah dalam table distribusi frekuensi yang harus diketahui yaitu :
23
Modul statistika dasar
Pada banyak distribusi frekuensi, untuk menghindari sebuah data bisa masuk
pada dua kelas yang berbeda, maka batas kelas diperluas, baik ke bawah atau ke
atas. Seperti pada contoh kelas di atas maka : batas kelasnya dapat diperluas (10,5
– 16,5).
Berikut adalah contoh pembuatan table frekuensi atau table distribusi frekuensi dari
data tinggi badan 40 mahasiswa di atas:
1. Seperti telah dihitung Range dari data tersebut adalah 29 cm. Dan panjang
interval kelas adalah 5 ( i=5).
2. Banyaknya kelas (k) atau panjang kelas dapat dihitung sbb.
K = (range/i) + 1
= (29/5) + 1
= 6,8 atau dibulatkan menjadi 7.
3. Jadi table distribusi frekuensi dari data tinggi badan 40 mahasiswa tersebut
adalah:
Tinggi badan (cm) Turus (Tally) Frekuensi
145 – 149 II 2
150 – 154 VI 6
155 – 159 VII 7
160 – 164 X 10
165 – 169 VIII 8
170 – 174 V 5
175 - 179 II 2
= 40
Dari table yang ada maka dapat diketahui bahwa jumlah mahasiswa yang
tingginya kurang dari 60 adalah 15 orang.
24
Modul statistika dasar
mengetahui hal-hal penting pada sebuah distribusi frekuensi ( seperti contoh siapa
yang tertinggi dan siapa yang terendah).
Kasus.
145 – 149 2
150 – 154 6
155 – 159 7
160 – 164 10
165 – 169 8
170 – 174 5
175 - 179 2
= 40
HISTOGRAM
Berikut adalah histogram dari data tinggi badan mahasiswa pada table di atas.
25
Modul statistika dasar
POLIGON FREKUENSI
Poligon frekuensi adalah bentuk lain dari histogram, yang berupa garis yang
menghubungkan titik tengah – titik tengah dari setiap batang (Bar).Jika distribusi
frekuensi dari data tinggi badan di atas ditampilkan dalam polygon maka hasilnya
sbb.
Perhatikan sebuah polygon yang selalu mulai dari titik nol dan diakhiri juga dengan
sebuah titik nol pada sumbu X. Poligon frekuensi berguna untuk membandingkan
dua atau lebih distribusi frekuensi, yang jika ditampilkan dalam bentuk histogram
akan tampak rumit dan sulit untuk interprtasikan.
26
Modul statistika dasar
Kurang dari 5 0
Kurang dari 20 17
Kurang dari 35 30
Kurang dari 50 38
Kurang dari 65 50
Kurang dari 80 63
Kurang dari 95 77
Keterangan :
Angka 0 secara otomatis terjadi karena tidak ada nilai ujian yang kurang dari 5 atau
kurang dari batas bawah dari kelas pertama. Distribusi komulatif ‘KURANG DARI’
selalu dimulai dengan angka 0.
Angka 17 adalah nilai awal dari distribusi frekuensi, yang ada pada kelas pertama,
yakni jumlah mahasiswa (frekuensi) yang mendapat nilai ujian antara 5 sampai 20
(atau dengan batas kelas, antara 4,99 sampai 19,99).
27
Modul statistika dasar
Angka 35 adalah penjumlahan dari angka 17 dan 13. Karena pernyataan ‘Kurang
dari 35’ berarti penjumalahan frekuensi semua mahasiswa yang mendapat nilai
kurang dari 35, sehingga nilai di bawah 20 pun tetap termasuk pada range tersebut.
Demikian seterusnya, setiap kenaikan kelas berarti terjadi penjumlahan satu persatu
dari isi tiap kelas, sehingga secara logika, pada akhir kelas akan terdapat frekuensi
seluruh data, yakni 78 data.
Kemudian jika distribusi nilai ujian Matematika akan dibuat dalam bentuk Distribusi
Komulatif LEBIH DARI akan menjadi :
Lebih dari 5 0
Lebih dari 20 17
Lebih dari 35 30
Lebih dari 50 38
Lebih dari 65 50
Lebih dari 80 63
Lebih dari 95 77
Keterangan :
Angka 78 atau jumlah total data secara otomatis terjadi karena tidak ada nilai ujian
yang kurang dari 5, atau semua lebih dari nilai minimum, yakni 5. Distribusi
Komulatif ‘LEBIH DARI’ selalu dimulai dengan angka jumlah data total, dalam
kasus ini adalah 78.
Jumlah ‘lebih dari 20’ berarti semua data dikurangi jumlah yang mendapat nilai di
bawah 20. Karena yang mendapat nilai 20 ke bawah adalah 17 orang, maka yang
mendapat lebih dari 20 adalah 78 – 17 = 61 orang.
28
Modul statistika dasar
Demikian seterusnya, setiap kenaikan kelas berarti terjadi pengurangan satu persatu
dari setiap isi kelas, sehingga secara logika, pada akhir kelas akan terdapat nilai 0,
karena tidak aka nada mereka yang bernilai lebih dari 105.
Jika kedua distribusi tersebut digabung pada sebuah Poligon Frekuensi, maka
Poligon khusus tersebut bias dinamakan KURVA OGIVE :
SOAL LATIHAN
1. Buatlah dalam table distribusi frekuensi data nilai mata kuliah statistiksa
dari 100 mahasiswa matematika berikut :
45 40 65 67 67 60 80 86 80 85
64 49 40 40 56 50 58 80 80 68
90 95 100 100 70 76 80 95 90 70
65 65 80 85 80 40 45 40 50 55 50 58
80 82 80 65 60 70 75 75 70 60 55 58 58
80 85 80 85 80 90 90 60 60 70 55 50 70 75 80
60 67 65 67 80 80 80 90 95 100
75 55 45 90 95 76 76 55 60 68
29
Modul statistika dasar
86 56 55 58 68 70 70 75 75 60 67 65 80 86 85 78 75 56 46 40
Honda 64,00%
Suzuki 20,70%
Yamaha 13,10%
Kawasaki 1,66%
Lain-lain 0,54%
TOTAL 100%
Nuklir 35%
TOTAL 100%
30
Modul statistika dasar
Dari table di atas buatlah grafik Bar untuk data tahun 1997 dan tahun 2010.
Bandingkanlah grafik keduanya.
BAB III
3.1 PENDAHULUAN
Untuk mendapat gambaran yang jelas tentang sebuah data mengenai suatu hal, baik
mengenai sampel ataupun populasi, selain daripada data itu disajikan dalam bentuk
table dan diagram, masih diperlukan ukuran- ukuran yang merupakan wakil
kumpulan data tersebut. Dalam modul ini akan diuraikan tentang ukuran gejala pusat
dan ukuran letak. Beberapa macam ukuran dari golongan pertama adalah : rata-rata
atau rata-rata hitung, rata-rata ukur, rata-rata harmonic dan modus. Golongan kedua
adalah Median, kuartil, desil dan persentil.
31
Modul statistika dasar
Ukuran yang dihitung dari kumpulan data dalam sampel dinamakan statistic. Apabila
ukuran itu dihitung dari kumpulan data dalam populasi atau dipakai untuk
menyatakan populasi , maka namanya parameter.Jadi ukuran yang sama dapat
berbentuk statistic atau parametertergantung pada apakah ukuran yang dimaksud
untuk sampel atau populasi.
3.2 PENYAJIAN
MEAN
dimana :
Contoh 1:
Data jumlah tamu Hotel AMAN selama seminggu :
Senin 120
Selasa 80
Rabu 46
Kamis 59
32
Modul statistika dasar
Jum’at 89
Sabtu 202
Minggu 279
= = = 125.
Terlihat rata-rata tamu perhari adalah 125 0rang. Perhatikan bahwa yang dimaksud
bukan
setiap hari ada persis 125 orang yang menginap di Hotel AMAN, namun jika dirata-
ratakan, dari orang yang menginap mulai hari senin sampai sabtu, jumlah tamu
adalah 125 orang perhari.
Contoh 2:
Data jumlah tamu yang menginap di Hotel SRIKANDI. Namun berbeda dengan
Hotel AMAN, Hotel SRIKANDI hanya menyewakan kamar pada hari Kamis sampai
Senin depan saja, sedang hari Selasa dan Rabu digunakan pihak Hotel untuk
membersihkan kamar.
Kamis 61
Jum’at 79
Sabtu 88
Minggu 92
Senin 48
33
Modul statistika dasar
∑
X= = = 73,6
Terlihat rata-rata jumlah tamu perhari adalah 73,6 orang dibulatkan menjadi 74
orang. Perhatikan jumlah data adalah 5, berbeda dengan jumlah data sebesar 7 pada
contoh 1.
Sekarang jika dianggap di daerah tersebut hanya ada dua hotel, maka berapakah rata-
rata(mean) tamu yang menginap di daerah tersebut untuk hari senin dan selasa?
∑
X= = = 84
Perhatikan jumlah data sekarang hanya ada dua, karena memang cuma ada dua hotel.
Dengan demikian, rata-rata tamu yang menginap di daerah tersebut pada hari senin
adalah 84 orang.
Untuk hari Selasa, Mean adalah rata-rata dari semua tamu yang menginap di
kedua hotel tersebut pada hari Selasa, yakni :
∑
X= = = 40
Walaupun jumlah data sama, yakni dua, namun data hari Selasa untuk Hotel
SRIKANDI adalah nol, karena hotel tidak menerima tamu. Dengan demikian, rata-
rata tamu yang menginap di daerah tersebut pada hari Selasa adalah 40 orang.
dimana :
34
Modul statistika dasar
Perhitungan ini digunakan untuk menghitung rata-rata dari suatu distribusi Frekuensi.
Contoh :
Data distribusi Frekuensi gaji yang diterima karyawan P.T. CLEOPATRA :
575.000 6
600.000 11
625.000 17
650.000 8
Keterangan :
Karyawan dengan gaji Rp. 575.000,-/bulan sejumlah 6 orang, sedang mereka yang
bergaji Rp. 600.000,-/bulan sejumlah 11 orang. Demikian seterusnya untuk data yang
lain. Berbeda dengan kasus sebelumnya, disini ada sejumlah data yang mempunyai
nilai yang sama, seperti data 575.000 ada 6 data, 600.000 ada 11 data, dan
seterusnya.
Namun tetap diperhatikan bahwa semua data haruslah data kuantitatif dan sejenis.
Sebagai contoh, jika isi table adalah 6 buah durian masing-masing seberat 5,1 kg, 9
buah nenas masimg-masing seberat 2,5 kg dan 4 buah melon masing-masing seberat
1,75 kg. untuk data dengan campuran buah seperti ini, tidak bias dilakukan rata-rata
frekuensi, karena walaupun semua data kuantitatif, namun jenis data (jenis buah)
tidak sama. Dengan kata lain tidak mungkin dihitung rata-rata berat buah, karena
akan timbul pertanyaan’rata-rata untuk buah yang mana? Hal ini berbeda dengan gaji
pada table di atas, yang jelas sejenis, karena semua bersatuan ‘Rupiah/bulan’.
Perhitungan rata-rata gaji karyawan P.T. CLEOPATRA :
575.000 6 3.450.000
600.000 11 6.600.000
35
Modul statistika dasar
625.000 17 10.625.000
650.000 8 5.200.000
TOTAL 42 25.875.000
Dengan demikian, rata-rata gaji 42 orang karyawan P.T. CLEOPATRA adalah Rp.
616.071,4/bulan.
Dimana :
Walaupun rumus ini sama dengan rumus rata-rata frekuensi, dengan perbedaan pada
penggantian symbol f dengan w, namun secara konsep keduanya berbeda. Weighted
mean (rata-rata berbobot) berangkat dari pengertian bahwa data tidak mempunyai
bobot yang sama, tergantung dari besar kepentingan yang diberikan pada data
tersebut.
Contoh :
Perhitungan Indeks Prestasi (IP) seorang mahasiswa, yang mengambil sejumlah mata
kuliah tertentu, dan dihitung dengan sks. Pada umumnya tidak semua mata kuliah
mempunyai bobot sks yang sama, seperti mata kuliah Matematika mempunyai bobot
3 sks, sementara mata kuliah Sosiologi mungkin hanya 2 sks. Apa yang membedakan
kedua mata kuliah tersebut hingga yang satu diberi bobot 3 sks sementara yang lain
36
Modul statistika dasar
hanya 2 sks? Tentu saja ini tergantung pengambilan keputusan yang memandang
mata kuliah Matematika lebih penting dari mata kuliah Sosiologi.
Contoh lain :
Proses penilaian seorang karyawan, dengan memberi pembobotan pada komponen
penilaian yang meliputi kedisiplinan (bobot 50%), kerjasama (bobot 30%) dan
kinerja (bobot 20%). Perhatikan jumlah bobot pada kasus seperti ini selalu 100%
(50%+30%+20%).
Kasus I :
Berikut adalah distribusi mata kuliah yang diambil dan nilai akhir dari mahasiswa
bernama Chandra :
Matematika 3 A 4
Sosiologi 2 C 2
Ekonomi Mikro 4 D 1
Akuntansi 3 B 3
Keterangan :
Konversi Nilai dari huruf ke angka adalah :
A=4
B=3
C=2
D=1
E=0
Jadi untuk mata kuliah matematika yang mempunyai bobot 3 sks, Chandra mendapat
nilai A atau setara dengan angka 4. Demikian seterusnya untuk arti data lainnya.
Tentu saja disini harus dilakukan konversi (pengubahan) dari nilai huruf ke nilai
angka, sebab jika tidak demikian,proses perhitungan rata-rata tidak bias dikerjakan,
karena adanya data non-angka.
Rata-rata nilai Chandra (IP) adalah :
37
Modul statistika dasar
3 4 12
2 2 4
4 1 4
3 3 9
TOTAL 12 29
Atau dengan rumus :
( ∗ ) ( ∗ ) ( ∗ ) ( ∗ )
X= ( )
= = 2.41
X= = = 2.5
38
Modul statistika dasar
Disiplin 50% 70
Kerjasama 30% 60
Kinerja 20% 90
TOTAL 100%
Keterangan :
Nilai yang diberikan adalah pada skala 0 (sangat jelek) sampai 100 (sangat baik).
Data di atas menunjukkan Supervisor menilai Deddy dengan angka 70 untum
kedisiplinannya selama bekerja, nilai 60 untuk kerjasama dengan teman sekerja dan
90 untuk kinerja secara pribadi. Perhatikan jumlah bobot yang menunjukkan
setengah dari penilaian adalah berdasarkan kedisiplinan seseorang (50%) dan jumlah
bobot pada kasus seperti ini adalah selalu 100%.
NB : Bobot 50% bias juga ditampilkan dalam bentuk angka 0,5.
Rata-rata nilai dari Deddy, adalah :
50% 70 35
30% 60 18
20% 90 18
TOTAL 71
Dengan demikian, Nilai rata-rata Deddy adalah 71, yang tetap diukur dari skala 0
sampai 100. Dengan kata lain, tidak mungkin hasil rata-rata ada di bawah angka 0
atau di atas angka 100, jika pengukur awal adalah skor 0 sampai 100. Jika saja skor
nilai diukur pada skala 1 sampai 10, maka nilai rata-rata tetap tidak mungkin ada di
bawah 1 atau lebih dari 10.
NB : Perhatikan angka 100% yang sama dengan angka 1.
39
Modul statistika dasar
dimana :
Contoh :
Data distribusi frekuensi berat badan remaja sebuah daerah :
(kg) (frek/f)
35 – 39.9 6
40 – 44.9 15
45 – 49.9 40
50 – 54.9 38
55 – 59.9 24
Di atas 60 11
Keterangan :
Remaja dengan berat badan antara 35 kg sampai 39.9 kg sebanyak 6 orang.
Kemudian remaja dengan berat badan antara 40 kg sampai 44.9 kg sebanyak 15
orang. Demikian seterusnya untuk data yang lain. Perhatikan bahwa batas atas dibuat
dengan decimal 9 dengan asumsi bahwa pengukuran berat badan tidak melebihi dua
decimal, seperti berat badab seorang remaja akan diukur sampai 37.5 dan tidak 37.55
40
Modul statistika dasar
kg. Dengan demikian, jika seorang remaja mempunyai berat badan lebih dari 39.9
kg, ia langsung dikategorikan mempunyai berat badan 40 kg.
Dengan demikian, contoh perhitungan titik tengah untuk kelas 30 – 39.9 adalah :
(35+39.9)/2 = 37.45
Perhitungan rata-rata berat badan :
Rata-rata :
.
= = 50.88
Catatan ; Penggunaan titik tengah sebagai alat hitung hitung rata-rata grouped data
tentu bias mengakibatkan bias dalam perhitungan. Missal untuk interval berat badan 35-
39,9 kilogram,diasumsi remaja pada kelas tersebut sebagian besar mempunyai berat
badan 37,45 kilogram.ternyata sebagian besar jusru mempunyai berat badan 36 kilogram.
Hal ini tentu mengakibatkan bias perhitungan rata-rata, jika hasil 50,88 kilogram
dibandingkan dengan rata-rata hitung berat badan yang tidak dikelompokkan (lihat
penjelasan rata-rata frekuensi).
Namun demikian, selisih perhitungan tersebut tidaklah berarti jika jumlah data
banyak, seperti di atas 300 data, atau interval kelas relative kecil (missal 35-36.9 kg dan
seterusnya).
Rata-rata dengan Menggunakan Coding
41
Modul statistika dasar
dimana :
A = kelas dengan kode 0
f.u = total frekuensi
N = jumlah data
C = interval kelas
Sebagai contoh, digunakan data distribusi frekuensi berat badan remaja seperti kasus
sebelumnya.
Proses Pengkodean (coding) :
Cari kelas yang mempunyai frekuensi terbanyak, lalu beri kode 0. Pada kasus ini,
karena frekuensi terbesar adalah 40 yang ada di kelas 45-49.5, maka kode 0 ada pada
kelas tersebut.
Kemudian untuk kelas di atasnya diberi kode -1, -2 dan seterusnya, dan untuk kelas
di bawahnya diberi kode +1, +2 dan seterusnya, sampai jumlah kode mencukupi.
Hasil :
35 – 39.9 37.45 -2 6
40 – 44.9 42.45 -1 15
45 – 49.9 47.45 0 40
50 – 54.9 52.45 +1 38
42
Modul statistika dasar
55 – 59.9 57.45 +2 24
60 – 64.9 62.45 +3 11
45 – 49.9 47.45 0 40 0
50 – 54.9 52.45 +1 38 38
55 – 59.9 57.45 +2 24 48
60 – 64.9 62.45 +3 11 33
Di sini A adalah kelas dimana terdapat kode 0, yakni 45-49.9. karena kelas tersebut
mempunyai titik tengah 47.45, maka A adalah 47.45.
Dan c adalah interval kelas yang harus sama untuk setiap kelas yang ada, yakni 5
(bias didapat dari 39.9-35 atau 44.9-40 atau selisih kelas yang manapun dalam
distribusi frekuensi tersebut).
Perhitungan Mean :
= 47.45 + . 5 = 50.88
Perhatikan hasil perhitungan yang tepat sama dengan perhitungan Mean sebelumnya.
Catatan :
43
Modul statistika dasar
Karena sifatnya yang praktis, maka perhitungan Mean untuk distribusi frekuensi jika
memungkinkan sebaiknya menggunakan cara penyandian (kode), karena baik dengan
cara biasa maupun dengan cara koding, keduanya akan menghasilkan besaran Mean
yang sama.
RATA-RATA GEOMETRIK
= = = 7500
Jika rata-rata adalah 7500 TV per tahun, maka seharusnya dari 1000 TV, periode
kedua akan terjual 1000+7500 = 8500 TV, periode ketiga akan terjual 8500+7500
= 16000 TV, dan periode keempat akan terjual 16000+7500 = 23500 TV.
Kenyataan pergerakan penjualan sangat berbeda dengan angka-angka sebenarnya,
seperti terlihat pada table berikut ini :
1 1000 1000
2 5000 8500
44
Modul statistika dasar
3 9000 16000
4 15000 23500
Rata-rata Geometrik
Rumus :
= . …
dimana :
G adalah Rata-rata Geometrik
N adalah jumlah data
Dari penjualan TV seperti contoh sebelumnya, jika digunakan rata-rata geometric
akan didapat :
= √1000 5000 9000 15000 = 5097.13
Atau jika dibulatkan ke bawah rata-rata laju kenaikan penjualan TV adalah 5097
unit TV per tahun.
Dengan demikian, perbandingan kenaikan antara penggunaan rata-rata hitung
dengan geometric :
45
Modul statistika dasar
Terlihat selisih antara rata-rata geometric dengan data asli lebih sedikit daripada
selisih antara rata-rata hitung dengan data asli. Seperti pada akhir periode 4, data
asli menyatakan penjualan TV adalah 15.000 unit. Dengan rata-rata Geometrik,
diprediksi penjualan adalah 16.291 unit. Sedang dengan prediksi menggunakan
rata-rata Hitung, hasil yang didapat jauh dari data asli, yakni 23.500 unit. Dengan
demikian, jika akan dilakukan prediksi ke depan, maka untuk kasus seperti ini
seharusnya digunakan rata-rata Geometrik agar hasil tidak terlalu bias.
Secara umum, Rata-rata Geometrik selalu menghasilkan angka yang lebih kecil
dari rata-rata Hitung untuk data yang sama :
G<
= . … =
Di mana :
G adalah rata-rata Geometrik
n adalah jumlah data
.
= = 1,97.
.
Berarti rata-rata laju kenaikan penjualan TV secara rasio adalah 1,97 dari tahun
ke tahun.
46
Modul statistika dasar
Rata-rata Geometrik
(rasio 1,97)
MEDIAN
DEFINISI Median. Median segugus data yang telah diurutkan dari yang terkecil sampai
terbesar atau terbesar sampai terkecil adalah pengamatan yang tepat ditengah-tengah bila
banyaknya pengamatan itu ganjil, atau rata-rata kedua pengamatan yang ditengah bila
banyaknya pengamatan genap.
Contoh soal 3. Dari lima kali kuiz statistic seorang mahasiswa mendapat nilai 82,93,86,92 dan
79.tentukan median populasi nilai ini.
Jawab. Setelah data diurutkan dari terkecil sampai terbesar, kita peroleh
79 82 86 92 93
Contoh soal . Kadar nikotin yang berasal dari sebuah sampel random enam batang rokok
cap tertentu adalah 2.3,2.7,2.5,2.9,3.1,dan 1.9 milligram.Tentukan mediannya.
Jawab. Bila kadar nikotin itu kita urutkan dari yang terkecil sampai terbesar maka kita
peroleh :
47
Modul statistika dasar
. .
= = 2.6
Median = L + .i
Keterangan :
I = Lebar kelas
MODUS
DEFINISI Modus. Modus segugus pengamatan adalah nilai yang terjadi paling
sering atau yang mempunyai paling tinggi.
Contoh soal 5. Nilai ujian semester dari beberapa mahasiswa matematika tercatat
sebagai berikut: 90,100,50,90,90,70,80,60,65 dan 75. Tentukan modusnya.
Jawab. Modusnya adalah nilai yang terjadi dengan frekuensi paling paling tinggi,
adalah : 90.
MODUS = L + .
Keterangan :
48
Modul statistika dasar
i : Lebar kelas
1.3.1 LATIHAN
1. Sebuah bioskop mencatat adanya penurunan jumlah penonton selama
periode 1998-2001 :
PENONTON
TAHUN (orang)
1998 5300
1999 5200
2000 4500
2001 4000
49
Modul statistika dasar
21 22 34 30 32
29 33 31 34 40
21 28 32 33 40
Pertanyaan :
a. Buatlah distribusi frekuensi dari 25 data di atas, dengan interval kelas 5.
b. Hitung rata-rata dari distribusi frekuensi di atas.
c. Hitung rata-rata TANPA MENNGUNAKAN distribusi frekuensi.
d. Bandingkan dan analisis hasil b dan c.
4. Tentukan mean. Median dan modus dari data tinggi badan 50 mahasiswa
berikut.
Berat (X) Nilai tengah Frekuensi
kg interval
50 - 52 51 5
53 – 55 54 17
56 – 58 57 14
59 – 61 60 10
62 - 64 63 4
50
5. Sebuah bank yang secara agresif berusaha menarik dana dari para nasabah,
menawarkan suku bunga tabungan dalam lima bulan terakhir sebagai berikut : 5%,
9%, 15%, 20% dan 29%. Berapakah suku bungan tabungan rata-rata yang
ditawarkan bank tersebut?
BAB IV
UKURAN DISPERSI
4.1 PENDAHULUAN
50
Modul statistika dasar
Terlepas dari ukuran gejala pusat dan ukuran letak, masih ada lagi ukuran lain
ialah ukuran simpangan atau ukuran dispersi. Ukuran ini kadang-kadang dinamakan
pula ukuran variasi, yang manggambarkan bagaimana berpencarnya data kuantitatif.
Beberapa ukuran disperse yang dikenal dan akan diuraikan disini ialah : rentang,
rentang antar kuartil, simpangan kuartil atau deviasi kuartil, rata-rata simpangan atau
rata-rata deviasi, simpangan baku atau deviasi standar, varians dan koefisien variasi.
1.2 PENYAJIAN
(R1)
Karena mudahnya dihitung, rentang ini banyak sekali digunakan dalam cabang lain
dari statistika, iakah statistika industry.
Rentang antar kuartil juga mudah ditentukan, dan ini merupakan selisih antara dan
. Jadi didapatlah hubungan :
RAK = −
(R2)
dengan RAK = rentang antar kuartil
= kuartik ketiga
= kuartil pertama
Contoh : Daftar berikut menyatakan upah tiap jam untuk 65 pegawai di suatu
pabrik.
DAFTAR R1
Upah (Rupiah)
51
Modul statistika dasar
50,00 - 59,99 8
60,00 - 69,99 10
70,00 - 79,99 16
80,00 - 89,99 14
90,00 - 99,99 10
100,00 - 109,99 5
1100,00 - 119,99 2
JUMLAH 65
= +
dengan I = 1, 2, 3
RAK dihitung dengan menggunakan rumus R2, maka diperoleh : RAK = Rp. 22,50.
Ditafsirkan bahwa 50% dari data, nilainya paling rendah 68,25 dan paling tinggi
90,75 dengan perbedaan paling tinggi 22,50.
Simpangan kuartil atau deviasi kuartil atau disebut pula rentang semi antar kuartil,
harganya setengah dari rentang antar kuartil. Jadi jika simpangan kuartil disingkat
dengan SK, maka :
= 1 2( − )
(R3)
52
Modul statistika dasar
2. RATA-RATA SIMPANGAN
Misalkan data hasil pengamatan berbentuk , …, dengan rata-rata ̅.
Selanjutnya kita tentukan jarak antara tiap data dengan rata-rata ̅ . Jarak ini, dalam
symbol ditulis | − ̅ |. Dengan | |. Berarti sama dengan a jika a positif, sama
dengan –a jika a negative dan nol jika a = 0. Jadi harga mutlak, selalu memberikan
tanda positif, karena inilah | − ̅ | disebut jarak antara dengan ̅ . Jika sekarang
jarak-jarak :
| − ̅| , | − ̅ |, . . . , | − ̅ | dijumlahkan, lalu dibagi oleh n, maka diperoleh
satuan yang disebut rata-rata simpangan atau rata-rata deviasi. Rumusnya adalah :
∑| − ̅|
=
(R4)
Dengan RS berarti = rata-rata simpangan.
Contoh :
− | − |
8 -1 1
7 -2 2
10 1 1
11 2 2
53
Modul statistika dasar
3. SIMPANGAN BAKU
Barangkali ukuran simpangan yang paling banyak digunakan adalah simpangan baku
atau deviasi standar.
Pangkat dua dari simpangan baku dinamakan varians. Untuk sampel, simpangan
baku akan diberi symbol s, sedangkan untuk populasi diberi symbol . Variansnya
2
tentulah s untuk varians sampel dan untuk varians populasi. Jelasnya, s dan s2
merupakan statistic sedangkan dan parameter.
Jika kita mempunyai sampel berukuran n dengan data-data , …, dan rata-
rata ̅ , maka statistic s2 dihitung dengan :
∑( − )
=
−1
(R5)
Untuk mencari simpangan baku s, dari s2 diambil harga akarnya yang positif.
Dari rumus R5, varians s2 dihitung sebagai berikut :
1. Hitung rata-rata ̅
2. Tentukan − selisih, − ,…, −
3. Tentukan kuadrat selisih tersebut, yakni ( − )2, ( − )2, . . . , ( − )2
4. Kuadrat-kuadrat tersebut dijumlahkan
5. Jumlah tersebut dibagi oleh (n - 1)
− ( − )2
8 0 0
7 -1 1
10 2 4
54
Modul statistika dasar
11 3 9
4 -4 16
∑ − (∑ )
=
( − 1)
(R6)
Dalam rumus di atas Nampak bahwa tidak perlu dihitung dulu rata-rata ̅ , tetapi
cukup menggunakan nilai data aslinya berupa jumlah nilai data dan jumlah
kuadratnya. Jika digunakan untuk data di atas, maka dari table berikut ini, dihasilkan
:
8 64
7 49
10 100
11 121
4 16
40 = ∑ 350 = ∑
( )
= = 7,5 dan simpangan baku = 7,5 = 2,74.
55
Modul statistika dasar
Jika data dari sampel tekah disusun dalam daftar distribusi frekuensi, maka
untuk menentukan varians s2 dipakai rumus :
∑ −( − )
=
( − 1)
(R7)
∑ − (∑ )
=
( − 1)
(R8)
Contoh : Untuk menghitung varians s2 dari data di bawah ini tentang nilai ujian
80 mahasiswa, digunakan rumus R7.
Nilai ujian
31 – 40 1
41 – 50 2
51 – 60 5
61 – 70 15
71 – 80 25
81 – 90 20
91 – 100 12
Jumlah 80
NILAI
− ( − )2 . ( − )2
UJIAN
56
Modul statistika dasar
Jumlah 80 - - - 13.498,80
Kolom 3 merupakan tanda kelas, kolm 4 adalah tiap tanda kelas dalam kolom 3
dikurangi 76,6 dan kolom 5 merupakan kuadrat bilangan-bilangan dalam kolom 4
sedangkan kolom akhir sama dengan hasil kali kolom 2 dengan kolom 5. Didapat
harga-harga :
. ,
= = 170,9
Untuk menggunakan rumus R8, menggunakan data yang sama, maka table
yang perlu dibuat adalah seperti di bawah ini :
NILAI
. .
UJIAN
57
Modul statistika dasar
n=∑ = 80, ∑ . = . ∑ . = . .
80 483.310 − (6.130)
= = 172,1.
80 79
Hasilnya berbeda dengan hasil dari rumus R7, karena ̅ yang digunakan di
rumus R7 telah dibulatkan hingga satu decimal, yang dengan sendirinya akan
menyebabkan adanya perbedaan.
Cara singkat atau cara sandi, seperti ketika menghitung rata-rata ̅ , dapat
digunakan juga untuk menghitung varians sehingga perhitungan akan lebih
sederhana. Rumusnya adalah :
∑ − (∑ )
=
( − 1)
(R9)
Contoh : Untuk data dalam table yang lalu, jika dipakai rumus R9 ini, maka
diperlukan table berikut :
58
Modul statistika dasar
NILAI UJIAN . .
31 – 40 1 35,5 -4 16 -4 16
41 – 50 2 45,5 -3 9 -6 18
51 – 60 5 55,5 -2 4 -10 20
61 – 70 15 65,5 -1 1 -15 15
71 – 80 25 75,5 0 0 0 0
81 – 90 20 85,5 1 1 20 20
91 – 100 12 95,5 2 4 24 48
Jumlah 80 - - - 9 137
80 137 − (9)
= (10) = 172,1.
80 79
Hasilnya sama dengan bila digunakan rumus R8. Ini memang demikian!
Membandingkan rumus R8 dan R9, sebenarnya yang terakhir didapat dari yang
yaitu:
1. Jika tiap nilai data ditambah atau dikurangi dengan bilangan yang sama, maka
simpangan baku s tidak berubah.
2. Jika tiap nilai data dikalikan dengan bilangan yang sama d, maka simpangan
bakunya menjadi d kali simpangan baku yang asal.
Contoh : Diberikan sampel dengan data : 9, 3, 8, 8, 9, 8, 9, 18. Setelah dihitung
maka s = 4,14.
a. Tambah tiap data dengan 6 atau berapa saja, maka untuk data baru
s = 4,14.
b. Kurangi tiap data dengan 5 atau berapa saja, maka untuk data baru
s = 4,14
59
Modul statistika dasar
(R10)
Atau lengkapnya :
( − 1) +( − 1) + + ( − 1)
=
+ + + −
(R11)
Jadi diperoleh penyimpangan atau deviasi data dari rata-rata dinyatakan dalam
satuan simpangan baku. Bilangan yang didapat dinamakan bilangan z. variable
, …, ternyata mempunyai rata-rata = 0 dan simpangan baku = 1.
Dalam penggunaannya, bilangan z ini sering diubah menjadi keadaan atau model
baru, atau tepatnya distribusi baru, yang mempunyai rata-rata ̅ dan simpangan baku
60
Modul statistika dasar
yang ditentukan. Bilangan yang diperoleh dengan cara ini dinamakan bilangan
baku atau bilangan standar dengan rata-rata ̅ dan simpangan baku dengan rumus
:
− ̅
= ̅ +
(R12)
Perhatikan bahwa untuk ̅ = 0 dan = 1, rumus R12 menjadi rumus R11, sehingga
bilangan z sering pula diesbut bilangan standar. Bilangan baku sering dipakai untuk
membandingkan keadaan distribusi fenomena.
Contoh : Seorang mahasiswa mendapat nilai 86 pada ujian akhir matematika dimana
rata-rata dan simpangan baku kelompok, masing-masing 78 dan 10. Pada
ujian akhir statistika dimana rata-rata kelompok 84 dan simpangan baku
18, ia mandapat nilai 92. Dalam mata ujian mana ia mencapai kedudukan
yang lebih baik?
Mahasiswa itu mendapat 0,8 simpangan baku di atas rata-rata nilai matematika dan
hanya 0,44 simpangan baku di atas rata-rata nilai statistika. Kedudukannya lebih
timggi dalam hal matematika.
Kalau saja nilai-nilai di atas ke dalam bilangan angka baku dengan rata-rata 100 dan
simpangan baku 20, maka :
Ukuran variasi atau disperse yang diuraikkan dalam bagian-bagian yang lalu
merupakan disperse absolute. Variasi 5 cm untuk ukuran jarak 100 m dan variasi 5
61
Modul statistika dasar
Diepersi absolut
Dispersi relatif =
Rata − rata
(R13)
Jika untuk dispersi absolute diambil simpangan baku, maka didapat koefisien
variasi, disingkat KV. Rumusnya, dinyatakan dalam persen, berbentuk :
simpangan baku
KV = x100%
rata − rata
(R14)
Skoefisien variasi tidak bergantung pada satuan yang digunakan, karenanya dapat
dipakai untuk membandingkan variasi relative beberapa kumpulan data dengan
satuan yang berbeda.
Contoh : Semacam lampu electron rata-rata dapar dipakai selama 3.500 jam dengan
simpangan baku 1.050 jam. Lampu model lain rata-ratanya 10.000 jam
dengan simpangan baku 2.000 jam.
.
KV (lampu pertama) = 100% = 30%.
.
.
KV (lampu kedua) = 100% = 20%.
.
Ternyata lampu kedua secara relative mempunyai masa pakai yang lebih
uniform.
SOAL LATIHAN
62
Modul statistika dasar
Hitunglah :
a. Rata-rata simpangan
b. Simpangan baku
c. Simpangan baku berapa kali rata-rata simpangan.
3. Hasil pengamatan memberikan harga-harga = 140 dan = 196.
Apakah artinya?
a. −
b. ( − )
63
Modul statistika dasar
BAB V
5.1 PENDAHULUAN
Ekspektasi lain yang juga banyak digunakan dalam statistika adalah momen
distribusi suatu peubah random atau momen peubah random. Peranan momen ke-r
terhadap pusat suatu peubah random X, r = 0, dan momen ke-r terhadap suatu
peubah random X sangat penting dalam statistika namum demikian, suatu hal yang
dapat dipertanyakan adalah apakah distribusi suatu peubah random akan tertentu,
jika semua momennya tertentu? Jawabannya tentu saja tidak, yang artinya belum
tentu.
Untuk keperluan itu, akan sangat menguntungkan apabila kita dapat menentukan
64
Modul statistika dasar
suatu fungsi yang dapat menentukan semua momen suatu peubah random dan
fungsi tersebut menentukan distribusi peubah randomnya.
5.2 PENYAJIAN
A. MOMEN
Momen ke-r terhadap pusat suatu peubah random X, r =0, 1,2, . . .ditulis µr’
disesuaikan.
r ' E ( X r )
0' 1
1 ' E X X
Momen ke-r terhadap rataan suatu peubah random X, r = 0,1,2, …, ditulis µr
didefenisikan sebagai
= ( − )
= ( − ) =
= − = −
Metode Fungsi Pembangkit Momen
Teorema 5.2.
65
Modul statistika dasar
Ilustrasi 5.6.
( )=
( ⁄ )
( )= ( ) =
( ⁄ )
=
= ( ⁄ )
Jelas U ~ χ2 (2α)
Teorema 5.3.
( )
( )= ( ) = + + +
= ( … )
= ( ) ( )… ( )
66
Modul statistika dasar
= ( ) ( ) … ( )
=∏ ( )
Ilustrasi 5.7.
( )= ( ) ( ) … ( )
=( + ) ( + ) …( + )
=( + )
67
Modul statistika dasar
Suatu hal lain yang penting untuk dicatat adalah bahwa jika X adalah suatu
peubah random dengan mX(t) ada, maka distribusi X tertentu dan sebaliknya.
Dengan perkataan lain mX(t) ada bila dan hanya bila distribusi X tertentu.
Jika mX (t0) ada untuk t0 > 0, maka mX(t1) ada untuk setiap
untuk setiap t 1 (0, t 0 ), h 0
Demikian juga, jika mX(t1) ada untuk t0 < 0, maka mX(t1) ada
untuk setiap t 1 (t 0 ,0)
maX+b(t) = ebtmX(at)
Jika X1, X2, …,Xn saling bebas, maka
n
mn (t) mXi (ai t)
a1X1 (t )
i 1 i1
Maka
Contoh
x
2 x
maka m X (t) e tx dx
1
68
Modul statistika dasar
Perlu diperhatikan disini bahwa untuk soal ini µX dapat juga dihitung
menggunakan mX(t).
Untuk Distribusi data yang setangkup sempurna, nilai tengah dan mediannya
identik oleh karena ituSK bernilai nol.Bila Distribusinya menjulur nilai tengah lebih
kecil dari mediannya, sehingga nilai SK negative. Tetapi bila Distribusinya menjulur
ke kanan, nilai tengahnya lebih besar daripada mediannya, sehingga nilai SK positif.
Contoh Soal 10. Hitunglah koefisien kemenjuluran pearson bagi Distribusi umur
aki dalam table 2.2.
Jawab. Dengan menganggap data table 2.2 sebagai suatu sampel , kita peroleh = 3.41,
( )
= 3.4 dan S =0.70. oleh karena itu, SK =
( . – . )
= .
= 0.04
Hasil perhitungan di atas menunjukkan bahwa data itu hamya sedikit menjulur ke kanan.
Dengan nilai SK yang demikian kecilnya, kita dapat mengatakan bahwa datanya
setangkup.
Untuk menghitung prosedur perhitungan suatu persentil, sebagai contoh marilah kita
mencari P85 untuk besaran umur Aki dalam table 2.2. langkah pertama kita harus
mengurutkan data dari terkecil sampai terbesar. sbb: 1.6, 1.9,2.2, 2.5,2.6, 2.6,2.9,3.0,
69
Modul statistika dasar
3.0, 3.1, 3.1, 3.1, 3.1, 3.2, 3.2, 3.2, 3.3, 3.3, 3.3, 3.4, 3.4, 3.4, 3.5, 3.5, 3.6, 3.7, 3.7,
3.7, 3.8, 3.8, 3.9, 3.9, 4.1, 4.1, 4.2, 4.3, 4.4, 4.5, 4.7, 4.7.
Karena ada 40 data pengamatan, maka kita harus mencari sebuah nilai yang
dibawahnya terdapat (85/100) X 40 = 34 pengamatan. P85 dapat berupa sembarang
nilai antara 4.1 tahun dan 4.2 tahun.Supaya mendapat nilai yang khas maka P 85
didefinisikan sebagai titik tengah antara ke dua pengamatan tersebut. Jadi didapat P 85
. .
= = 4.15 tahun.
Cara kita menghitung desil persis sama dengan cara kita menentukan persentil.
Untuk menghitung Q1, bagi Distribusi umur Aki, kita memerlukan nilai yang
dibawahnya terdapat (25/100) X 40 = 10 pengmatan. Karena pengamatan yang ke –
10 dan ke-11 sama dengan 3.1 tahun, jadi Q1 = 3.1.
B. KEMIRINGAN
Kita sudah mengenal kurva halus atau model yang bentuknya bisa positif, negate
atau simetrik. Model positif terjadi bila kurvanya mempunyai ekor yang memanjang
di sebelah kanan. Sebaliknya, jika ekornya memanjang ke sebelah kiri didapat model
negative. Dalam kedua hal terjadi sifat taksimetri. Untuk mengetahui derajat
taksimetri sebuah model, digunakan ukuran kemiringan yang ditentukan oleh :
(Rata − rata) − (Modus)
kemiringan =
Simpangan baku
70
Modul statistika dasar
(K1)
Rumus empiric untuk kemiringan, adalah :
3((Rata − rata) − (Median))
kemiringan =
Simpangan baku
(K2)
Rumus-rumus K1 dan K2 berturut-turut dinamakan koefisien kemiringan pearson
tipe pertama dan tipe kedua.
Kita katakana model positif jika kemiringan positif, negative jika kemiringan
negative dan simetrik jika kemiringan sama dengan nol.
Contoh : Data nilai ujian 80 orang mahasiswa yang tercantum dalam daftar di bawah
ini telah menghasilkan = 76,62; Me = 77,3; Mo = 77,17 dan simpangan
baku s = 13,07.
Nilai ujian
31 – 40 1
41 – 50 2
51 – 60 5
61 – 70 15
71 – 80 25
81 – 90 20
91 – 100 12
Jumlah 80
, ,
Jawab : Kemiringan ,
= −0,04.
Karena kemiringan negative dan dekat kepada nol maka modelnya sedikit miring
ke kiri. Berikut ada gambar grafiknya.
71
Modul statistika dasar
A. KURTOSIS
Bertitik tolak dari kurva model normal atau distribusi normal, tinggi rendahnya
atau miring datarnya bentuk kurva disebut kurtosis, dapat ditentukan. Kurva
distribusi normal, yang tidak terlalu runcing atau tidak terlalu datar, dinamakan
mesokurtik. Kurva yang runcing dinamakan leptokurtic sedangkan yang datar
disebut platikurtik.
Salah satu ukuran kurtosis ialah koefisien kurtosis, diberi symbol , ditentukan
oleh rumus :
72
Modul statistika dasar
=( / )
(K3)
dengan SK = rentang semi antar kuarti
= kuarti kesatu
= kuartil ketiga
= persentil kesepuluh
= persentil ke-90
− = rentang 10 – 90 persentil.
Untuk model distribusi normal, harga k = 0,263.
SOAL LATIHAN
1. Bilangan-bilangan berikut menyatakan hasil ujian mata kuliah Metode
Statistik :
23 60 79 32 57 74 52 70 82 36
80 77 81 95 41 65 92 85 55 76
52 10 64 75 78 25 80 98 81 67
41 71 83 54 64 72 88 62 74 43
60 78 89 76 84 48 84 90 15 79
73
Modul statistika dasar
34 67 17 82 69 74 63 80 85 61
BAB VI
KOMBI NATORIAL
6.1 PENDAHULUAN
Seperti yang telah dibicarakan dalam modul-modul terdahulu, apabila suatu
eksperimen dilakukan, yang menjadi perhatian kita adalah beberapa kejadian yang
74
Modul statistika dasar
Sebenarnya menurut urutan yang tepat, maka sebelum kia membahas tentang
Peluang maka kita terlebih dahulu kita pelajari tentang bagaima cara atau teknik
membilang, menyelesaikan bentuk faktorial suatu bilang dan sampai masuk
permutasi dan kombinasi suatu bilangan. Jadi dalam modul ini kita akan
membahas khusus tentang materi-materi yang disinggung di atas, ditambah
dengan pengulangan beberapa bentuk distribusi peluang.
6.2 PENYEJIAN
Mencacah Titik Sampel
Masalah yang harus kita pikirkan dan coba untuk dievaluasi adalah pengaruh factor
kebetulan yang berkaitan dengan terjadinya kejadian-kejadian tertentu bila sebuah
percobaan dilaksanakan. Masalah ini termasuk dalam cabang matematika yang
disebut peluang. Dalam banyak hal kita akan memecahkan masalah peluang dengan
mencacah banyaknya titik dalam ruang sampel tanpa mendaftarkan dahulu unsur-
unsurnya.Prinsip dasar mencacah, sering disebut kaidah penggandaan, dan
dinyatakan dalam dalil-dalil sebagai berikut :
DALIL 1.Kaidah Penggandaan. Bila suatu operasi dapat dilakukan dalam n1 cara,
dan bila untuk setiap cara tersebut operasi kedua dapat dilakukan dengan n2 cara,
maka kedua operasi itu secara bersama-sama dapat dilakukan dalam n1n2 cara.
75
Modul statistika dasar
Contoh soal Bila sepasang dadu dilempar dilemparkan sekali, berapa banyakkah
titik sampel dalam ruang sampelnya?
DALIL 2. Kaidah Penggandaan Umum. Bila suatu operasi dapat dilakukan dalam
n1 cara, bila untuk setiap cara tersebut operasi ke dua dapat dilakukan debgan n2
cara, bila untuk setiap pasangan dua cara operasi ketiga dapat dilakukan dalam n3
cara, dan demukian seterusnya, maka k operasi dalam urutan tersebut dapat
dilakukan dalam n1n2…nk cara.
Contoh soal Berapa macam menu makan siang yang terdiri atas sup,
sandwich,desert dan minuman yang dapat dipilih dari 4 macam sup, 3 jenis
sandwich, desert dan 4 minuman?
Perhatikan tiga huruf a,b dan c. kemungkinan permutasinya abc, acb, bac, bca, cab,
dan cba. Jadi terdapat 6 susunan yang berbeda. Ada tiga posisi yang harus diisi oleh
ke tiga huruf a,b dan c.Jadi, kita mempunyai 3 pilihan untuk posisi pertama, 2 untuk
posisi kedua, dan 1 untuk posisi terakhir. Sehingga semuanya ada 3x2x1 = 6
permutasi.Secara umum dari n benda yang berbeda dapat disusun sebanyak n (n-
1)(n-2)…(3)(2)(1) cara. Perkalian ini kita lambangkan dengan n!. Selain itu
didefinisikan 1! =1 dan 0! = 1.
76
Modul statistika dasar
berbeda adalah :
!
nPr =( )
Contoh soal 18. Dua kupon lotere diambil dari 20 kupon untuk menentukan hadiah
pertama dan kedua. Hitunglah banyaknya titik sampel dalam ruang sampelnya.
!
20P2 =( = (20)(19) = 380.
)
Contoh Soal. Dari 24 orang anggota suatu perkumpulan akan dipilih pengurus yang
susunannya terdiri dari ketua, wakil ketua sekretaris dan bendahara. Jika semua anggota
mempunyai hak yang sama untuk menduduki suatu jabatan?
DALIL 5. Banyaknya permutasi n benda yang berbeda yang disusun dalam suatu
lingkaran adalah ( n – 1).
!
! ! !, … !
Contoh soal Berapa banyak susunan yang berbeda bila kita ingin membuat sebuah
rangkaian lampu hias untuk pohon natal dari 3 llampu merah, 4 kuning dan 2 biru?
!
! ! !
= 1260
Contoh soal: Banyaknya cara pengaturan duduk 5 orang pejabat di 5 kursi baris
terdepan ada
5 P5 5.4.3.2.1
120
77
Modul statistika dasar
Contoh Soal: Banyaknya permutasi dari huruf -huruf dalam kata-kata STATISTIKA
ada
n Pns , nT , nA , n I , nk 10 P2.3.2.2.1
10!
2!3!2!2!1!
s
1.2.3.4.5.6.7.8.9.10
1 .2 .1 .2 .3 .1 .2 .1 .2 .1
75600
9 P9 10 P2 ,3, 2 , 2 ,1 .2!.3!.2!.2!.2!.1!
sehingga
9 P2 ,3, 2 , 2 ,1 75600
Dalam banyak masalah kita ingin mengetahui banyaknya cara mengambil r benda
dari n benda tanpa memperhatikan urutannya. Pengambilan demikian ini disebut
kombinasi.
! !
= !( )!
atau nCr = !( )!
Contoh soal Dari 4 orang anggota partai Republik dam 3 oramg anggota partai
democrat, hitunglah banyaknya komisi yang terdiri atas 3 orang dengan 2 orang dari
Partai Republic dan 1 orang dari partai Demokrat yang dapat dibentuk.
Jawab. Banyaknya cara memilih 2 orang dari 4 orang partai Republik ada :
!
= ! !
=6
78
Modul statistika dasar
!
= ! !
=3
Jadi dengan dalil 1. Kita temukan banyaknya komisi yang dapat dibentuk dengan
2 orang partai Republik dan 1 orang Partai Demokrat adalah (6)(3) = 18.
Contoh
b. Jika akan disusun dua tim, maka banyaknya tim yang dapat disusun ada
12 12!
5,5,2 5!.5!.2!
1.2.3.4.5.6.7.8.9.10.11.12
1.2.3.4.5.1.2.3.4.5.1.2
16632
Banyaknya sampel random berukuran n yang dapat diambil dari suatu populasi
berukuran N ada
N N!
n n!(N n)!
Perlu dicatat disini bahwa pada umumnya ukuran populasi N tidak diketahui. Ini
bukan berarti bahwa ukuran tersebut tidak ada, tetapi ukuran tersebut besar sekali.
79
Modul statistika dasar
Nah ... dengan rumus di atas kalau kita mengambil hanya satu satu sampel random
n, tentunya harus disadari bahwa satu yang diambil tersebut adalah satu diantara
N
. Misalnya untuk n = 5 dan N =100, maka satu sampel random yang diambil
n
adalah satu diantara
100 100!
5 5!.95!
96.97.98.99.100
1.2.3.4.5.
760480
Dalam mengambil sampel random dari suatu populasi perlu dibedakan bermacam-
macam sampel menurut cara pengambilannya. karena cara tersebut akan menentukan
banyaknya , sampel yang mungkin diambil. Menurut cara pengambilannya dapat
dibedakan beberapa macam sampel random sebagai berikut :
N
Sampel yang diambil sekaligus
n
Sampel dengan pengembalian ada Nn
80
Modul statistika dasar
Jika dari 10 bola lampu dicoba 2 bola lampu secara random, maka banyaknya
pasangan bola lampu yang dapat di coba
= 100
Jika dalam contoh di atas yang dicoba adalah 3 bola lampu secara random, maka
banyaknya sampel bola lampu yang dapat dicoba
= 1000
81
Modul statistika dasar
SOAL LATIHAN
BAB VII
PENGANTAR PELUANG
7.1 PENDAHULUAN
Telah diketahui bahwa Statistika adalah ilmu atau cabang ilmu pengetahuan
tentang teori dan penggunaan metode-metode untuk mengumpulkan data
(statistik), menganalisis data tersebut dan menggunakannya untuk melakukan
inferensi statistik.
Dengan memperhatikan bahwa data statistik adalah kumpulan hasil pengukuran atau
perhitungan atau pengamatan terhadap obyek-obyek yang menjadi perhatian, dan
inferensi statistik adalah proses pengambilan kesimpulan terhada populasi (=
82
Modul statistika dasar
7.2PENYAJIAN
83
Modul statistika dasar
8 Hasil suatu eksperimen adalah hasil yang mungkin terjadi, jika eksperimen
tersebut dilakukan.
Contoh
Berikut ini akan disajikan berbagai hasil untuk beberapa eksperimen dalam
contoh 2.1.1.
1. Jika eksperimen adalah melempar sebuah mata uang 1 kali suatu hasil adalah
M (dapat muka), sedang hasil yang lain adalah B (dapat belakang).
2. Jika eksperimen adalah melempar sebuah mata uang 2 kali maka setiap hasil
adalah hasil dari lemparan pertama dan lemparan kedua. Dengan demikian
hasil eksperimen ini adalah MM atau MB atau BM atau BB
3. Jika eksperimen adalah mengukur tinggi seseorang, maka hasil eksperimen ini
adalah salah satu ukuran antara 164, dan 165,5, misalnya 165. Ukuran
tersebut adalah suatu hasil.
4. Jika eksperimen adalah mengamati indeks prestasi sekelompok mahasiswa
diakhir suatu tahun ajaran tertentu, maka suatu hasil adalah pasangan indeks
prestasi kelompok tersebut dengan indeks prestasi masing-masing mahasiswa
dalam kelompok tersebut, tertentu.
84
Modul statistika dasar
Menurut banyaknya hasil dalam ruang sampel, dibedakan dua macam ruang
sampel, yaitu : ruang sampel diskrit dan ruang sampel kontinu.
Hal lain yang perlu dicatat adalah bahwa penentuan ruang sampel suatu
eksperimen, ditulis S, dapat bergantung pada hasil yang diharapkan dari
eksperimennya. Misalnya. Dalam eksperimen melempar sebuah dadu satu
kali, jika perhatian kita adalah pada mata dadu yang tampak, maka ruang
sampelnya adalah S1 = {1, 2, 3, 4, 5, 6}, sedangkan jika perhatian kita adalah
pada mata dadu tampak genap atau ganjil, maka ruang sampelnya adalah
S2 = {genap, ganjil}. Dari contoh ini jelas bahwa
informasi yang diperoleh dari S1. lebih jelas dari pada S2,
Contoh
Untuk eksperimen melempar sebuah mata uang 1 kali, ruang sampelnya adalah S
= {M, B}.
atau
85
Modul statistika dasar
i = 1,2,3, ... }
Dari contoh-contoh di atas, ruang sampel dalam contoh 2.1.3 nomor 5 adalah
ruang sampel kontinu, sedangkan yang lain adalah ruang sampel diskrit.
10 Kejadian adalah suatu himpunan hasil atau suatu himpunan bagian dari
ruang sampel.
Dari definisi di atas jelaslah bahwa baik ruang sampel maupun kejadian
kosong juga merupakan kejadian. Kedua kejadian tersebut dikenal sebagai
kejadian-kejadian yang tidak sejati.
Menurut banyaknya hasil dalam suatu kejadian, dapat dibedakan dua
macam kejadian, yaitu : kejadian sederhana jika hasilnya hanya satu, dan
kejadian majemuk jika hasilnya lebih dari satu. Baik kejadian sederhana
maupun kejadian majemuk, keduanya merupakan kejadian-kejadian sejati.
Suatu kejadian dikatakan terjadi, jika eksperimen yang dilakukan
menghasilkan hasil dalam kejadian tersebut.
Contoh
86
Modul statistika dasar
maka
maka
Dari eksperimen dalam contoh 2.1.4. nomor 2 terlihat bahwa D adalah suatu
kejadian yang pasti terjadi, sedangkan E adalah suatu kejadian yang tidak
mungkin terjadi, jika eksperimen tersebut dilakukan. Kejadian-kejadian A, B
dan C adalah contoh kejadian majemuk.
87
Modul statistika dasar
Gabungan 2 kejadian A dan B, ditulis AՍB, adalah suatu kejadian yang hasil-
hasilnya adalah hasil dalam A atau hasil dalam B.
Jika A dan B tertentu, cara yang mudah untuk menentukan AՍB adalah
menggabungkan A dan B (dengan hasil dalam A dan B yang sama hanya
ditulis satu kali saja).
A B C= (A B) C = A U (B C).
Contoh 2.2.1.
1
A2 = (x,y)|0 ≤ y ≤ },
2
A3 = {(x,y)|0 ≤ x ≤ y ≤1)},
1
A4 = {(x,y)|0 ≤ x,y ≤ },
2
Maka
88
Modul statistika dasar
1 1
A1 A2 = { ((x,y)|0 ≤ x ≤ } atau {(x,y)|0 ≤ y ≤ },
2 2
1
A1 A3 = { ((x,y)|0 ≤ x ≤ } {(x,y)|0 ≤ x ≤ y ≤1)}
2
A2 A3 = A3 Ս A4
Contoh
89
Modul statistika dasar
hal ini tidak mungkin terjadi, karena lemparan pertama dan ketiga sama
dan lemparan pertama dan ketiga tidak sama tidak akan pernah terjadi
bersama.
b. A C ={MMM,BBB} {MMM,MMB,MBM,MBB}
= {MMM} atau r!
1
b. A1 A3 = {(x1.y)0≤ x ≤ } {(x,y)|0≤ x ≤ y≤1}
2
1
= {(x,y)|0≤x,y ≤ ,0≤ x ≤y ≤1}
2
90
Modul statistika dasar
1
c. A2 A3 = {(x1,y)0≤ x ≤ } {(x,y)|0≤ x ≤ y ≤1 }
2
1
= {(x,y)|0≤x,y ≤ ,0≤ x ≤y ≤1}
2
Komplemen suatu kedadian A, ditulis Ac, adalah suatu kejadian dalam S yang
hasil-hasilnya adalah bukan hasil dari A.
Cara kedua :
= {BM, BB}.
91
Modul statistika dasar
= {12, 14, 16, 21, 23, 25, 32, 34, 36, 41, 43, 45, 52, 54, 56,
61, 63, 65} .
S = {11,...,16,21,...26,31,...,36, 41,..,46,51...58,61,....66}
Karena Cc = hasil kedua lemparan tidak sama, akan sukar untuk dicari
tanpa memperhatikan S.
ALJABAR KEJADIAN
hukum komutatif :
A B = B A,
A B = B A.
92
Modul statistika dasar
hukum asosiatif :
A (B C) = (A B) C,
A (B C) = (A B) C.
hukum distributif :
A (B C) = (A B) (A C),
A (B C)= (A B) (A C).
hukum De Morgan :
(A B)c = Ac Bc,
(A B)c = Ac Bc.
A S = S,.A S = A, A = A, A =
A Ac = S, A Ac = , A A = A, A A = A.
A S = A (B BC) = (A B) (A Bc) dengan
(A B) dan (A BC) tidak mungkin terjadi bersama-sama.
DEFENISI PELUANG
Defenisi Peluang
Andaikan kejadian A adalah suatu kejadian yang menjadi perhatian kita dengan
Jika suatu eksperimen menghasilkan n hasil yang tidak mungkin terjadi bersama-
sama dan masirig-masing mempunyai peluang yang satna terjadi, maka
n( A)
P(A) =
n
93
Modul statistika dasar
Jawab :
Dadu yang "baik" (dalam keadaan baik) menjamin bahwa setiap hasil yang
mungkin terjadi mempunyai peluang yang sama untuk terjadi. Artinya dadu
dalam keadaan seimbang.
Karena S = (1,2,3,4,5,6}.
A = {2, 4, 6},
94
Modul statistika dasar
Cc = {4, 5, 6}.
n(C c ) = 3,
n(B) = 2,
n(C) = 3,
n(A B) = 4,
n(B C) = 1,
n(Cc) = 3, sehingga
n(A) 3 1
p(A)
n 6 2
n(B) 2 1
p(B)
n 6 3
n(C) 3 1
p(C)
n 6 2
n(A B) 4 2
p(A B)
n 6 3
n(A B) 1
p(A B) dan
n 6
c
n(C ) 3 1
p(C c )
n 6 2
Jawab :
Karena
95
Modul statistika dasar
n(A) 4 2
p(A)
n 6 3
n(B) 2 1
p(B)
n 6 3
n(A B) 5
p(A B)
n 6
n(A B)
p(A B) 0
n
n A
P ( A) lim
n n
96
Modul statistika dasar
Difenisi ini sebenarnya lebih masuk akal, sebab tidak diperlukan persyaratan
"berat" seperti pada definisi klasik. Tetapi suatu keberatannya adalah
eksperimen harus/dapat dilakukan sebanyak kali mungkin.
Definisi ini biasanya digunakan sebagai interpretasi dari definisi klasik
dan sebaliknya
Contoh 3.1.2.
97
Modul statistika dasar
(A,2) P(s) = 1
(A,3) Jika A1, A2, . . . adalah barisan kejadian saling asing dengan A1 A
(yang artinya untuk Ai Aj= untuk i≠j,i, j = 1, 2,... ) dan Ai Aj = Ai A
i 1
maka
P Ai P ( Ai )
i 1 i 1
(i) SA ,
(ii) Jika A A, maka Ac A
(iii) Jika A1 dan A2 A, maka A1 A2 A
Atau A hádala statu aljabar sigma, jika sifat (iii) dalam aljabar diganti
dengan
(iii) jika Jika A1,A2, ….. A, maka Ai A
i 1
P( ) = P Ai P ( Ai ) P ( )
i 1 i 1 i 1
98
Modul statistika dasar
P Ai P ( Ai )
i 1 i 1
Jika S adalah suatu ruang sampel diskrit, dengan sifat (A.3) maka peluang
terjadinya suatu kejadian adalah jumlah peluang setiap hasil dalam kejadian
tersebut, ditulis
n(A)
P(A) P(h i ), h i A dan i 1, 2, 3,..., n(A).
i 1
1 1 1
= + +
4 4 4
3
=
4
RUANG SAMPEL
Dalam statistic kita menggunakan istilah percobaan bagi sembarang proses yang
membangkitkan data. Misalnya suatu percobaan pelemparan sekeping mata uang.
DEFINISI Ruang Sampel. Ruang sampel adalah himpunan semua kemungkinan
hasil suatu percobaan, dan dilambangkan dengan huruf S.
Setiap kemungkinan hasil dalam suatu ruang sampel disebut unsure atau anggota
ruang sampel atau biasa juga disebut titik sampel. Seandainya banyaknya unsure
ruang sampel itu terhingga, kita mungkin dapat mendaftarkan unsure-unsur tersebut
dengan menggunakan koma untuk memisahkan setiap unsure, dan menutupnya
dengan dengan dua kurung kurawal.Jadi ruang sampel S bagi percobaan pelemparan
dekeping uang logam, dapat kita tuliskan sebagai : S = { G, A}, dengan G dan A
masing-masing menyatakan “sisi gambar” dan “sisi angka”.
Contoh soal 11. Sebuah percobaan pelemparan sebuah dadu berisi enam. Tentukan
ruang sampelnya.
99
Modul statistika dasar
Jawab: S = {1,2,3,4,5,6}.
Contoh soal 12. Misalkan tiga produk diambil secara random dari suatu proses
produksi dipabrik.kemudian setiap produk tersebut diperiksa apakah cacat ( C ) atau
tidak cacat ( T ). Tentukan ruang sampelnya.
Jawab. Untuk mendaftarkan semua anggota ruang sampel yang mengandung imformasi
maksimum, kita buat diagram pohon sbb.
Ruang sampel yang besar atau tak hingga paling baik diterangkan melalui suatu
pernyataan atau yang dikenal sebagai notasi pembangun himpunan. Misalnya, bila
kemungkinan hasil percobaan berupa himpunan kota-kota di dunia yang dihuni oleh
lebih dari 1 juta penduduk, maka ruang sampelnya dapat ditulis sbb.
KEJADIAN
DEFINISI Kejadian. Kejadian adalah suatu himpunan bagian dari ruang sampel.
Untuk suatu kejadian, kita membentuk sebuah kumpulan titik sampel yang
merupakan himpunan bagian ruang sampel. Himpunan bagian ini mencakup semua
anggota ruang sampel yang menyusun kejadian itu.
Contoh soal 12. Bila diketahui ruang sampel S = { t|t ≥ 0 }, sedangkan t adalah umur
(tahun) komponen elektronik tertentu. Maka kejadian A adalah komponen tersebut rusak
100
Modul statistika dasar
Contoh soal 13. Kejadian terambilnya kartu hati dari seperangkat (52 helai) kartu Bridge
dapat dinyatakan sebagai A = { hati} yang merupakan himpunan bagian dari ruang
sampel S = {hati, sekop, klaver, wajik}. Jadi A adalah kejadian sederhana. Kejadian B
yaitu terambilnya kartu merah merupakan kejadian majemuk, karena B= {hati ∪ wajik}
= { hati, wajik}.
DEFINISI Ruang Nol. Ruang nolatau ruang kosong atau himpnan kosong adalah
himpunan bagian ruang sampel yang tidak mengandung satupun anggota.Kejadian ini
kits beri lambang khusus ∅.
telanjang dalam suatu percobaan biologis, maka A = ∅. Juga, jika B = { x|x adalah
factor bukan prima dari 7 selain 1 }, maka B pasti himpunan kosong, karena factor bagi 7
adalah 1 dan 7 sedangkan 7 bilangan prima.
Hubungan antara kejadian dan ruang sampel dapat digambarkan dengan diagram
Venn, sebagai berikut :
101
Modul statistika dasar
Dalam diagram Venn, ruang sampel digambarkan sebagai empat persegi panjang,
sedangkan kejadian digambarkan sebagai lingkaran-lingkaran di dalam persegi panjang
tersebut.misalnya dalam gambar di atas, kejadian-kejadian A, B dan C semuanya
merupakan himpunan bagian ruang sampel S.
jawab: A ∩ B = {2,4}
DEFINISI Kejadian Saling Terpisah. Dua kejadian A dan B dikatakan saling terpisah
102
Modul statistika dasar
Dua kejadian saling terpisah A dab B diilustrasikan dengan diagram Venn berikut:
Dengan mewarnai kedua daerah yang mewakili kejadian A dan Bkita melihat bahwa
tidak ada daerah irisan keduanya yang mewakili kejadian A ∩ B.
Contoh soal 14. Misalkan sebuah dadu dilemparkan. Misalkan pula A adalah kejadian
munculnya bilangan genap dan B adalah kejadian munculnya bilangan ganjil. Maka
Kejadian A = {2,4,6} dan B= {1,3,5} tidak memiliki titik persekutuan karena bilangan
ganjil atau genap tidak mungkin muncul bersamaan pada satu kali lemparan sebuah
dadu.
103
Modul statistika dasar
1. A ∩ ∅ = ∅ 5. S’ = ∅
’
2. A ∪ ∅ = A 6. ∅ = S
’ ’ ’
3. A ∩ =∅ 7. ( ) = A
’
4. A ∪ =S
104
Modul statistika dasar
SOAL LATIHAN
BAB VIII
DISTRIBUSI PELUANG
8.1 PENDAHULUAN
Seperti yang telah dibicarakan dalam bagian-bagian terdahulu, apabila suatu
eksperimen dilakukan, yang menjadi perhatian kita adalah beberapa kejadian yang
105
Modul statistika dasar
Dalam modul ini akan diuraikan distribusi tentang peluang yang terdiri dari beberapa
distribusi diskrit antara lain adalah Distribusi Seragam, Distribusi Binom dan
Multinom, Distribusi Hipergeometrik, Distribusi Binom Negatif dan Distribusi
Geometrik, Distribusi Poisson.
8.2 PENYAJIAN
A. DISTRIBUSI PELUANG
8.3 Pengertian Peubah Random
DEFINISI Peubah Random. Suatu fungsi yang nilainya berupa bilangan nyata yang
ditentukan oleh setiap unsur dalam ruang sampel disebut peubah random.
Kita akan menggunakan huruf capital, misalnya X, untuk melambangkan suatu peubah
random, dan huruf kecilnya dalam hal ini x, untuk menyatakan salah satu di antara nilai-
nilainya.
Conto soal 31. Dua kelereng diambil berturut-turut tanpa pemulihan dari sebuah kantung
yang berisi 4 kelereng merah dan 3 kelereng hitam. Hasil-hasil percobaan yang mungkin
berikut nilai y bagi peubah random Y, yang menyatakan banyaknya kelereng merah yang
terambil adalah
Ruang Sampel y
106
Modul statistika dasar
MM 2
MH 1
HM 1
HH 0
DEFINISI Ruang Sampel Diskret. Bila suatu ruang sampel mengandung jumlah
titik sampel yang terhingga atau suatu barisan unsure yang tidak pernah berakhir,
tetapi yang sama banyaknya dengan bilangan cacah, maka ruang itu disebut ruang
contoh diskret.
Peubah random kontinu digunakan untuk data yang diukur, misalnya tinggi, bobot, suhu,
jarak, atau umur sedangkan peubaha random diskret digunakan untuk data yang berupa
cacahan, misalnya banyaknya produk yang cacat, banyaknya kecelakaan per tahun di
nsuatu provinsi.
107
Modul statistika dasar
Conto soal 32. Tentukan distribusi peluang bagi jumlah bilangan bila sepasang dadu
dilemparkan.
JAWAB. misalkan X adalah peubah random yang menyatakan jumlah bilangan dari
kedua dadu tersebut. Maka X dapat mengambil sembarang nilai bulat dari 2 sampai 12.
Dua dadu dapat mendarat dalam (6) (6) = 36 cara, masing-masing dengan peluang 1.36.
P(X = 3) = 2/36, karena jumlah 3 hanya dapat terjadi dalam 2 cara. Dengan
memperhatikan kemungkinan nilai-nilai lainnya, kita akan mendapatkan distribusi
peluang di bawah ini :
X 2 3 4 5 6 7 8 9 10 11
12
P(X=x)
Comtoh soal 33. Tentukan rumus bagi distribusi peluang banyaknya sisi gambar bila
sebuah uang logam dilempar 4 kali.
Jawab. Karena ruang sampelnya mengandung 24 = 16 titik ssampel, maka penyebut bagi
bagi peluangnya adalah 16, dan semua titik sampel ini mempunyai peluang terjadi yang
sama. Untuk menghitung banyaknya cara mendapatkan, misalnya 3 sisi gambar, kita
perlu memperhatikan banyaknya cara menyekat 4 hasil percobaan ke dalam 2 sel, dengan
3 sisi gambar dalam sel yang satu dan satu sisi angka dalam sel lainnya. Ini dapat
4
dilakukan dalam = 4 cara.secara umum x sisi gambar dan 4 – x sisi angka dapat
3
4
terjadi dalam cara, dengan x dapat bernilai 0,1,2,3,atau 4.jadi fungsi peluangnya f(x)
= P(X=x) adalah :
108
Modul statistika dasar
atas 21 tahun. Antara dua nilai tinggi sembarang, misalnya 163.5 dan 164.5
cm.terdapat tak hingga banyaknya tinggi, dan hanya satu yang tepat 164 cm. peluang
mengambil secara randomorang yang tingginya tepat 164 cm, dan bukan salah satu
dari takhingga banyaknyatinggi yang sangat dekat dengan 164 cm tetapi yang tidak
dapat lagi dibedakanoleh nanusia, adalah sangat kecil sekali. Sehingga kita
memberikan peluang nol pada kejadian tersebut.Tetapi bila kita bicarakan peluang
terambilnya seseorang yang tingginya sekurang-kurangnya 163 cm tetapi tidak lebih
dari 165 cm. dalam hal ini kita berhadapan dengan sebuah selang nilai peubah
random, dan bukan tepat satu nilai peubah random.
Untuk menghitung peluang bagi berbagai selang peubah random kontinu seperti
P(a < X < b), P(W>c), dan lain sebagainya.
Bila X kontinu, maka
P(a < X ≤ b) = P(a < X < b) + P(X = b)
= P(a < X < b)
Distribusi peluang bagi peubah random kontinu tidak dapat disajikan dalam bentuk
table tetapi dapat dinyatakan dalam bentuk rumus. Rumus itu merupakan fungsi
nilai-nilai peubah random kontinu X, sehingga dapat digambarkan sebagai suatu
kurva kontinu. Fungsi peluang yang digambarkan oleh kurva disebut fungsi
kepekatan peluang atau fungsi kepekatan atau fungsi densitas.
109
Modul statistika dasar
Gambar 4.3 a.
Beberapa bentu fungsi kepekatan
110
Modul statistika dasar
peluangbagi peubah random kontinu X bila luas darah dibawah kurva dan di atas
sumbu x sama dengan 1, dan bila luas daerah dibawah kurva antara x=a dan x=b
menyatakan peluang X terletak antara a dan b.
Contoh Soal 34. Sebuah peubah random kontinu X yang mengambil nilai antara x=2 dan
JAWAB.
a) Perhatikan gambarnya:
Karena daerah yang dihitami dalam gabar di atas adalah berupa sebuah
trapezium, maka luasnya sama dengan jumlah kedua sisi yang sejajar digandakan
dengan alasnya dan kemudian dibagi 2.
( )
Sekarang, karena f(2) = 3/8 dan f(4) = 5/8,maka P(2 < X < 4) = =1
111
Modul statistika dasar
Sudah diperoleh bahwa f(2) = 3/8, maka f(3.5) = 4.5/8. Sehingga luas daerah
.
( . )
yang diarsir adalah P ( X < 3.5) = = 0.70
c) Kita peroleh bahwa f(2.4) = 3.4/8 dan f(3.5) = 4.5/8, dapat dilihat pada gambar
. .
( . )
di bawah bahwa: P( 2.4 < X < 3.5 ) = = = 0.54
112
Modul statistika dasar
Contoh soal 35. Dua isi bolpoin dipilih secara random dari sebuah kotak yang berisi 3
isi bolpoin biru, 2 merah dan 3 hijau.Bila X adalah banyaknya isi bolpoin biru dan Y
banyaknya isi bolpoin merah yang terpilih, tentukan :
JAWAB.
b) P [(X,Y) ∈ A] = P(x + y ≤ 1)
113
Modul statistika dasar
Contoh Soal 36. Dari contoh soal 35, tentukan f(x 1) untuk semua nilai x dan
tentukan pula P(X= 0 Y = 1).
Jawab. Pertama-tama kita hitung h(1) = f(0,1) + f(1,1) + f(2,1) = 3/14 + 3/14 + 0 =
3/7
( , )
Sekarang, f(x 1) = ( )
= 7/3 f(x,1), x= 0,1,2. Sehingga,
x 0 1 2
f(x 1) ½ ½ 0
Dan terakhir,
P(X= 0 Y = 1) = f(0 1) = ½.
114
Modul statistika dasar
DE DEFINISI Dua Buah Peubah Random yang Bebas. Peubah random X dan Y
dikatakan bebas jika dan hanya jika
F(x,y) = g(x)h(y)
Contoh Soal 37. Tunjukkan bahwa kedua peubah random dalam cotoh 35 tidak bersifat
bebas.
JAWAB. Baiklah kita perhatikan titik (0.1). dari table distribusi peluang bersama contoh
35 kita mengetahui ketiga nilai peluang f(0.1), g(0), dan h (1) adalah
f(0.1) = ,
g(0) = ∑ ( , )= + + = ,
h(1) = ∑ ( , 1) = + + 0= .
P(X = x) f( ) f( ) . . . f( )
115
Modul statistika dasar
Contoh Soal 38. Tentukan nilai harapan bagi X bila X menyatakan hasil yang diperoleh
bila sebuah dadu setimbang dilemparkan.
Contoh Soal 39. Dalam sebuah permainan judi, petaruh akan mendapat 5 dolar bila hasil
dari 3 lemparan sebuah uang logam adalah gambar semua atau angka semua, tetapi Ia
harus membayar 3 dolar bila hasilnya adalah 1 atau 2 sisi gambar. Berapa penerimaan
harapan bagi petaruh tersebut?
Jawab. Ruang sampel bagi pelemparan 3 uang logam sekali, atau yang setara dengan 1
uang logam dilemparkan 3 kali, adalah :
= (1/2)(1/2)(1/2) = 1/8.
Peubah randomnya adalah Y, banyaknya uang yang dapat dimenangkan oleh petaruh,
dan
kemungkinan nilai bagi Y adalah 5 dolar bila yang terjadi adalah kejadian E1 =
{GGG,AAA} dan -3 dolar bila yang terjadi adalah E2 ={
GGA,GAG,AGG,GAA,AGA,AAG}.karena E1 dan E2 masing-masing mempunyai
peluang terjadi ¼ dan ¾, maka
116
Modul statistika dasar
Perhitungan sederhana menghasilkan f(0) = 1/35, f(1) = 12/35, f(2) = 18/35, dan f(3) =
4/35. Sehingga = ( ) = (0)(1/35) + (1)(12/35) + (2)(18/35) + (3)(4/35) = 1.7
Jadi, bila sebuah panitia 3 orang yang diambil secara random berulang-ulang dari 4 laki-
laki dan 3 perempuan, secara rata-rata akan berisi1.7 laki-laki.
DALIL 1. Nilai Tengah Fungsi satu peubah random. Misalkan X adalah suatu
peubah random Diskret dengan distribusi peluang :
x . . .
P(X = x) f( ) f( ) . . . f( )
Maka nilai tengah atau nilai harapan peubah random g(X) adalah
( ) = [ ( )] = ( ) ( ).
Contoh soal 41. Misalkan banyaknya mobil X, yang dicuci disuatu tempat penyucian
mobil antara pukul 16:00 dan 17:00 pada setiap hari jumat yang cerah mempunyai
distribusi peluang
x 4 5 6 7 8 9
Bila g(x) = 2X – 1 menyatakan uang yang dibayarkan, dalam dolar, oleh manager kepada
petugas pencuci, tentukan penerimaan harapan petugas encuci mobil pada periode waktu
tersebut.
117
Modul statistika dasar
= 12.67 Dolar.
( , ) = [ ( , )] = , ( , )
Contoh Soal 42. Misalkan X dan Y adalah peubah random dengan distribusi bersama
seperti yang diberikan contoh soal 36. Carilah nilai harapan bagi g(X,Y) =XY.
E(X)(Y) = ∑ ∑ ( , )
= f(1,1) = 3/14
dilambangkan dengan atau .Ragam populasi ini kita sebut dengan ragam
peubah random X atau ragam distribusinya:
118
Modul statistika dasar
F (x) f( ) f( ) . . . f( )
Contoh soal 43. Hitunglah ragam peubah random X dalam contoh soal 40. X
menyatakan banyaknya laki-laki dalam sebuah panitia yang terdiri atas 3 orang yang
diambil secara cak dari 4 orang laki-laki dan 3 perempuan.
= ( − ) ( )
= 24/4
DALIL 2. Rumus Hitung Bagi .Ragam bagi peubah random X dapat dihitung
menurut rumus = E(X2) - 2
Latihan : Buktikan dalil 2 di atas dengan rumus kaidah penjumlahan pada bab I.
Contoh soal 44. Peubah random X, yang menyatakan banyaknya peluru roket yang
gagal bila 3 peluru demikian ditembakkan, mempunyai distribusi peluang sebagai
berikut:
119
Modul statistika dasar
x 0 1 2 3
= 0.61, sehingga;
= 0.61
Jadi, = E(X2) - 2
x . . .
f (x) f( ) f( ) . . . f( )
2
( ) = E{[g(X) - ( )] }=∑ [( ( ) − ( ) )] ( )
Contoh soal 45. Hitunglah ragam g(X) = 2X + 3, bila X merupakan peubah random
dengan distribusi peluang :
120
Modul statistika dasar
x 0 1 2 3
2
( ) = E{[(2X + 3) - )] }
= E {[(2X + 3) – 6 ]2}
=∑ (4X2 + 12x + 3) ( )
= 137/8
121
Modul statistika dasar
Contoh soal 46. Dengan menerapkan Dalil 4 pada contoh 41, kita dapat menuliskan
=2 −
Sekarang,
= ( )= ∑ ( )
= ( ).
Sehingga
41
= (2) − 1 = $12.6
6
Seperti yang telah diperoleh sebelumnya.
DALIL 5 Nilaitengah jumlah atau selisih dua atau lebih peubah random sama dengan
jumlah atau selisih nilaitengah masing-masing peubah. Jadi
= + = − .
122
Modul statistika dasar
= ( ) ( ) ( )
= [∑ ( )] ∑
=
= =
123
Modul statistika dasar
= [( − ) ]
= [( − ) ]
= 2 2.
DALIL 9. Ragam jumlah atau selisih dua atau lebih peubah random yang bebas
sama dengan jumlah ragam masing-masing peubah random.jadi, bila X dan Y bebas,
maka
= + dan = +
Bukti. Dengan memperluas dalil 3. Pada kasus dua peubah random, kita peroleh :
= E{[(X – Y) - ] 2}
Sekarang, dari dalil 5.
= , sehingga
= E{[(X – Y) – ( ) ] 2}
= E{[(X – )–( − ) ] 2}
= E{[(X – )2] +E[( − )2 ] – 2E[{[(X – )( − )}
= +
E[(X – )( − )] = E(XY - Y- X+ )
= − − +
=0
Contoh Soal 47. Bila X dan Y bebas, masing-masing mempunyai ragam = 1 dan
= 2, tentukan ragam peubah random Z = 3X – 2Y +5.
Jawab. Dengan memandang 3X – 2Y sebagai peubah random yang baru, kita dapat
menggunakan dalil 7 untuk menuliskan :
124
Modul statistika dasar
= +
=9 + 4
= (9)(1) + (4)(2)
= 17
Kita telah menggunakan notasi f(x;k) alih-alih f(x) untuk menunjukkan bahwa
distribusi seragam itu bergantung pada parameter k.
Contoh Soal 48. Tentukan distribusi seragam bagi himpunan bagian nama bulan
berukuran 3 yang diambil secara random.
JAWAB. Karena semuanya terdapat 12 nama bulan, maka kita dapat mengambil 3 secara
random dalam = 220 cara. Dengan menomori masing-masing dari 1 sampai 220,
maka distribusi peluangnya diberikan oleh
f(x;220) = 1/220, untuk x = 1,2, . . . , 220
sehingga peluang terambilnya himpunan bagian nomor 5, misalnya, adalah f(x;220) =
1/220.
125
Modul statistika dasar
B(x;n,p) = , untuk x = 0, 1, 2, . . . , n.
B(X; 3,1/2) = =
Sesuai dengan hsil untuk banyaknya sisi gambar bila sebuah uang logam
dilemparkan tiga kali.
Contoh Soal 49. Tentukan peluang mendapatkan tepat tiga bilangan 2 bila sebuah dadu
setimbang dilemparkan 5 kali.
JAWAB. Peluang keberhasilan setiap ulangan yang bebas ini adalah 1/6 dan peluang
kegagalan adalah 5/6. Dalam hal ini munculnya bilangan 2 dianggap keberhasilan. Maka
b(3;5,1/6) =
!
= .
! !
= 0.032.
Contoh Soal 50. Peluang seorang sembuh dari suatu penyakit darah adalah 0.4. bila 15
orang diketahui menderita penyakit ini , berapa peluang bahwa (a) sekurang-kurangnya
10 orang dapat sembuh; (b) ada 3 sampai 8 orang yang sembuh; dan (c) tepat 5 orang
yang sembuh.
JAWAB. (a). Misalkan X adalah banyaknya orang yang sembuh. Maka
P(X ≥ 10) = 1 − ( < 10)
=1− ∑ ( ; 15, 0.4)
= 1 − 0.9662
126
Modul statistika dasar
= 0.0338.
(b) (3 ≤ ≤ 8) = ∑ ( ; 15, 0.4)
=∑ ( ; 15, 0.4) − ∑ ( ; 15, 0.4)
= 0.9050 − 0.0271
= 0.8779.
(c) ( = 5) = ( ; 15, 0.4)
=∑ ( ; 15, 0.4) − ∑ ( ; 15, 0.4)
= 0.4032 − 0.2173
= 0.1859.
Bukti. Misalkan hasil pada ulangan ke-j dinyatakan oleh peubah random , yang bernilai
0 dan 1, masing-masing dengan peluang q dan p. ini disebut peubah Bernoulli atau
mungkin lebih tepat peubah Indikator , karena = 0 berarti kegagalan dan =1
berarti keberhasilan.
Dengan demikian, dalam suatu percobaan binom banyaknya keberhasilan dapat
dituliskan sebagai jumlah n peubah indicator yang bebas. Sehingga
X= + +...+ .
Nilaitengah setiap adalah E( ) = 0.q + 1.p = p. maka dengan menggunakan Dalil 5,
kita mendapatkan nilaitengah bagi distribusi binom, yaitu
= ( )= ( )+ ( ) + …+ ( )
= + + ...+
= np.
Ragam bagi setiap adalah
= − = −
= (02)q + (1)2p – p2
= p (1 – p) = pq.
Dengan demikian, menurut Dalil 9, ragam distribusi binom adalah
= + + …+
127
Modul statistika dasar
= + + …+
= .
Contoh Soal 51. Dengan menggunkan Dalil Chebyshev, tentukan dan tafsirkan selang
±2
( ; )= , = 1,2, …
!
Sedangkan dalam hal ini adalah rata-rata banyaknya hasil percobaan yang
128
Modul statistika dasar
terjadi selam selang waktu atau dalam daerah yang dinyatakan, dan =
2.71828 …
Contoh Soal 60. Rata-rata jumlah hari sekolah ditutup karena salju selama musimdingin
di suatu kota di bagian timur AS adalah 4. Berapa peluang bahwa sekolah-sekolah di
kota ini akan ditutup selama 6 hari dalam suatu musim dingin?
(6; 4) = =∑ ( ; 4) − ∑ ( ; 4)
!
. Distribusi Normal
( )=
√
(N3)
dengan : π = nilai konstanta yang bila ditulis hingga 4 desimal π = 3,1416.
dan nilai x mempunyai batas −∞ < < ∞ maka dikatakan bahwa variable acak X
berdistribusi normal.
129
Modul statistika dasar
− 2
−1 2
√2 =1
(N4)
Untuk menentukan peluang harga X antara a dan b, yakni ( < < ),
digunakan rumus N4, sehingga :
− 2
−1 2
( < < )=∫ √2
(N5)
Distribusi normal standar ialah distribusi normal dengan rata-rata = 0 dan
simpangan baku = 1. Fungsi densitasnya berbentuk :
⁄
( )=
√
(N6)
untuk z dalam daerah −∞ < <∞.
Mengubah distribusi normal umum dalam rumus N3 menjadi distribusi normal baku
dalam rumus N6 dapat ditempuh dengan menggunakan transformasi :
=
(N7)
130
Modul statistika dasar
Bagian-bagian luas dari distribusi normal baku dapat dicari dengan cara berikut :
1. Hitung z sehingga dua decimal.
2. Gsmbsrksn kurvanya seperti gambar sebelah kanan pada gambar di atas.
3. Letakkan harga z pada sumbu datar, lalu tarik garis vertical hingga memotong
kurva.
4. Luas yang tertera dalam daftar adalah luas daerah antara garis ini dengan garis
tegak di titik nol.
5. Dalam daftar, Daftar F, Lampiran, cari tempat harga z pada kolom paling kiri
hingga hanya satu decimal dan decimal keduanya dicari pada baris paling atas.
6. Dari z di kolom kiri maju ke kanan dan dari z di baris atas turun ke bawah, maka
didapat bilangan yang merupakan luas yang dicari. Bilangan yang didapat harus
ditulis dalam bentuk 0,xxxx (bentuk 4 desimal).
Karena seluruh luas = 1 dan kurva simetrik terhadap = 0 , maka luas dari garis
tegak pada titik nol ke kiri ataupun ke kanan adalah 0,5.
131
Modul statistika dasar
Jawab :
Dengan X = berat bayi dalam gram, = 3.750 gram, = 325 gram, maka :
. .
= = 2,31.
132
Modul statistika dasar
c. Bertanya lebih kecil atau sama dengan 4.000 gram, maka beratnya harus lebih
kecil dari 4.000,5 gram.
. , .
= = 0,77.
Peluang berat bayi lebih kecil atau sama dengan 4.000 gram = 0,5 + 0,2794 =
0,7794.
d. Berat 4,250 gram berarti berat antara 4.249,5 gram dan 4.250,5 gram. Jadi untuk
X = 4.249,5, dan X = 4.250,5 didapat :
. , .
= = 1,53.
. , .
= = 1,54.
Antara distribusi binom dan distribusi normal terdapat hubungan tertentu. Jika
untuk fenomena yang berdistribusi binom berlaku :
133
Modul statistika dasar
a) N cukup besar,
b) = ( ) = peluang peristiwa A terjadi, tidak terlalu dekat kepada nol,
maka distribusi binom dapat didekati oleh distribusi normal dengan rata-rata
=
( )
(N8)
7. Distribusi Student
Fungsi densitasnya adalah :
( )= ⁄
1+ −1
berlaku untuk harga-harga t yang memenuhi −∞ < < ∞ dan K merupakan bilangan
tetap yang besarnya bergantung pada n sedemikian sehingga luas daerah di bawah
kurva sama dengan satu unit.
Pada distribusi t ini terdapat bilangan (n-1) yang dinamakan derajat kebebasan,
akan disingkat dengan dk.
Jika sebuah populasi mempunyai model dengan persamaan seperti dalam rumus
N9, maka dikatakan populasi itu berdistribusi t dengan dk = (n - 1) .
Bentuk grafiknya seperti grafik distribusi normal baku, simetrik terhadap t = 0,
sehingga sepintas lalu hamper tak ada bedanya. Untuk harga-harga n yang besar,
biasanya ≥ 30, distribusi t mendekati distribusi normal baku seperti dalam rumus
N6.
Untuk perhitungan-perhitungan, daftar distribusi t sudah disusun seperti dapat
ditemukan dalam lampiran, Daftar G. Daftar tersebut berisikan nilai-nilai t untuk dk
dan peluang tertentu. Kolom paling kiri, kolom dk, berisikan derajat kebebasan, baris
teratas berisikan nilai peluang.
Untuk penggunaan Daftar G, perhatikan
gambar di samping. Gambar ini merupakan
134
Modul statistika dasar
Contoh :
1. Untuk n = 13, jadi dk = 12, dan p = 0,95 maka t = 1,78.
Ini didapat (lihat Daftar G dalam lampiran) dengan jalan maju ke kanan dari 12 dan
menurun dari 0,95.
2. Gambar grafik
Untuk n = 16, tentukan t supaya luas yang diarsir = 0,95. Dari grafik dapat dilihat
bahwa luas ujung kanan dan luas ujung kiri = 1 – 0,95 = 0,05. Kedua ujung ini sama
luas, jadi luas ujung kanan, mulai dari t ke kanan = 0,025. Mulai dari t ke kiri luasnya
= 1 – 0,025 = 0,975. Harga p inilah yang dipakai untuk daftar.
Dengan = 15 (lihat Daftar G, dalam Lampiran) kita maju ke kanan dan dari p =
0,975 kita menurun, didapat t = 2,13. Jadi antara t = -2,13 dan t = 2.13 luas yang
diarsir = 0,95.
135
Modul statistika dasar
Contoh :
Gambar grafik
136
Modul statistika dasar
Distribusi F ini juga mempunyai variable acak yang kontinu. Fungsi densitasnya
mempunyai persamaan :
⁄ ( )
( )= . ⁄ ( )
1+
(N11)
dengan variable acak F memenuhi batas F > 0, K = bilangan tetap yang harganya
bergantung pada dan sedemikian sehingga luas di bawah kurva sama dengan
satu, = pembilang dan = penyebut.
Jadi distribusi F tidak simetrik dan umumnya sedikit positif. Daftar distribusi F telah
disediakan seperti dapat ditemukan dalam Lampiran, Daftar I. daftar tersebut
berisikan nilai-nilai F untuk peluang 0,01 dan 0,05 dengan derajat kebebasan dan
. Peluang inisama dengan luas daerah ujung kanan yang diarsir, sedangkan dk =
ada pada baris paling atas dan dk = pada kolom paling kiri.
Untuk tiap dk = , daftar terdiri atas dua baris, yang atas untuk peluang p = 0.05 dan
yang bawah untuk p = 0.01.
Notasi lengkap untuk nilai-nilai F dari daftar distribusi F dengan peluang p dan dk =
( , ) adalah ( , ).
Meskipun daftar yang diberikan hanya untuk peluang p = 0,01 dan p = 0,05, tetapi
sebenarnya masih bisa didapat nilai-nilai F dengan peluang 0,99 dan 0,95..
137
Modul statistika dasar
1
(1 − )( , )=
( , )
(N12)
Dalam rumus di atas perhatikan antara p dan (1 - p) dan pertukaran antara derajat
kebebasan ( , ) menjadi ( , ).
Maka , (8,24) = ,
= 0,321.
SOAL LATIHAN
x -3 6 9
138
Modul statistika dasar
4. Dari sekeranjang buah yang berisi 3 jeruk, 2 apel, dan 3 pisang, diambil
suatu contoh random 4 buah. Bila X menyatakan banyaknya jeruk dan
Y banyaknya apel yang terambil, hitunglah E(X2Y – 2XY).
5. Misalkan X menyatakan bilangan yang muncul bil;a sebuah dadu hijau
dilemparkan. Hitung ragam peubah random
a). 2X – Y
b). X + 3Y – 5.
139
Modul statistika dasar
BAB. IX
SAMPLING DAN DISTRIBUSI SAMPLING
9.1 PENDAHULUAN
Statistik terbagi atas dua fase yaitu statistika deskriptif dan statistika induktif. Fase
pertama dikerjakan untuk melakukan fase kedua. Fase kedua ialah statistika induktif,
berusaha menyimpulkan tentang karakteristik populasi, yang pada umumnya
dilakukan berdasarkan pada data sampel yang diambil dari populasi yang
bersangkutan. Populasi adalah totalitas semua nilai yang mungkin, baik hasil
menghitung maupun pengukuran, kuantitatif maupun kualitatif, daripada karakteristik
tertentu mengenai sekumpulan obyek yang lengkap dan jelas. Sampel adalah sebagian
yang diambil dari populasi dengan menggunakan cara-cara tertentu. Untuk
mendapatkan kesimpulan yang dapat dipertanggungjawabkan haruslah ditempuh cara-
cara yang benar dalam setiapkah termasuk cara-cara pengambilan sampel atau
sampling.
Untuk mempelajari populasi kita memerlukan sampel yang diambil dari populasi yang
bersangkutan. Meskipun kita dapat mengambil lebih dari sebuah sampel berukuran n
dari populasi berukuran N, pada prakteknya hanya sebuah sampel yang bisa diambil
dan digunakan untuk hal tersebut. Sampel yang diambil ialah sampel random dan dari
sampel tersebut nilai-nilai statistiknya dihitung untuk digunakan seperlunya.
Distribusi sampling biasanya diberi nama bergantung pada nama statistic yang
digunakan. Misalnya yang kita kenal distribusi sampling rata-rata, distribusi sampling
proporsi,, distribusi sampling simpangan baku dan lain lagi.
140
Modul statistika dasar
9.2 PENYAJIAN
b) Masalah biaya
Jika biaya penelitian yang tersedia terbatas,, maka samplinglah satu-satunya
pilihan, terkecuali jika ukuran populasi sedikit sekali sehingga sensus bisa
dilaksanakan.
c) Masalah waktu
Sensus memerlukan waktu yang lama dibandingkan dengan sampling. Dengan
demikian sampling dapat memberikan data lebih cepat.
d) Percobaan yang sifatnya merusak
Jika penelitian terhadap obyek sifatnya merusak, maka jenis sampling harus
dilakukan.
e) Masalah ketelitian
Data yang dikimpulkan harus benar dan pengumpulannya harus teliti. Begitu
pula dengan pencatatan dan penganalisisannya.
f) Factor ekonomis
Dengan factor ekonomis diartikan apakah kegunaan dari hasil penelitian
sepadan dengan biaya, waktu dan tenaga yang telah dikeluarkan untuk itu atau
tidak.
141
Modul statistika dasar
B. RANCANGAN SAMPLING
Beberapa hal yang perlu diperhatikan dalam perancanaan sampling yaitu :
b). Tentukan dengan jelas batas populasi mengenai persoalan yang ingin
diketahui.
c). Definisikan dengan jelas dan tepat segala unit dan istilah yang diperlukan.
e). Tentukan dan rumuskan cara-cara pengukuran dan penilaian yang akan
dilakukan.
f). Kumpulkan, jika ada, segala keterangan tentang hal yang ingin diteliti yang
pernah dilakukan masa lampau.
g). Tentukan ukuran ampel, yakni beberapa unit sampling yang harus diambil dari
populasi.
h). Tentukan cara sampling yang mana yang akan ditempuh agar sampel yang
diperoleh representative.
k). Sediakan biaya dan minta bantuan ahli baik berbentuk pembantu tetap ataupun
hanya berbentuk konsultan.
142
Modul statistika dasar
143
Modul statistika dasar
144
Modul statistika dasar
145
Modul statistika dasar
2. DISTRIBUSI SAMPLING
A. DISTRIBUSI RATA-RATA
Misalkan kita mempunyai sebuah populasi berukuran terhingga N dengan
parameter rata-rata dan simpangan baku . Dari populasi ini diambil sampel
random berukuran n. jika sampling dilakukan tanpa pengembalian, kita tahu
semuanya ada buah sampel yang berlainan. Untuk semua sampel-sampel yang
146
Modul statistika dasar
rata-rata. Anggap semua rata-rata ini sebagai data baru, jadi di dapat kumpulan data
yang terdiri atas rata-rata dari sampel-sampel. Dari kumpulan ini kita dapat
menghitung rata-rata dan simpangan bakunya. Jadi didapat rata-rata daripada rata-
rata diberi symbol dan simpangan baku daripada rata-rata diberi symbol .
Contoh : diberikan sebuah populasi dengan N = 10 yang ditanya :
98,99,97,98,99,98,97,97,98,99. Jika dihitung, populasi ini mempunyai = 98 dan
= 0,78
Diambil sampel berukuran n = 2. Semuanya ada = 45 buah sampel. Untuk
setiap sampel kita hitung rata-ratanya. Dan dalam tiap sampel dan rata-rata tiap
sampel diberikan dalam daftar berikut ini.
DAFTAR A1
SEMUA SAMPEL BERUKURAN n = 2 DAN RATA-RATANYA
DIAMBIL DARI POPULASI UKURAN N = 10
147
Modul statistika dasar
Jumlah ke-45 buah rata-rata = 4.410. Maka rata-ratanya untuk ke-45 rata-rata
.
ini = = 98. Jadi = 98.
Simpangan baku ke-45 rata-rata di atas juga dapat dihitung. Besarnya adalah :
= . .
Tetapi rata-rata populasi = 98 dan simpangan baku = 0,78. Selanjutnya
kita hitung :
,
= = 0,52.
√
=
√
(A1)
Jika N cukup besar dibandingkan terhadap n, maka barlaku hubungan :
=
=
√
(A2)
Untuk penggunaan rumus di atas cukup baik apabila (n/N) ≤ 5% . Dari uraian
di atas didapat : jika sampel random berukuran n diambil dari sebuah populasi
berukuran N dengan rata-rata dan simpangan baku , maka distribusi rata-rata
sampel mempunyai rata-rata dan simpangan baku seperti pada rumus A1 jika (n/N)
> 5%, seperti dalam rumus A2 jika (n/N)≤ 5%. dinamakan kekeliruan standar
148
Modul statistika dasar
rata-rata atau kekeliruan baku atau pula galat baku rata-rata. Ini merupakan
ukuran variasi rata-rata sampel sekitar rata-rata populasi .
DAFTAR A2
FREKUENSI DAN PELUANG RATA-RATA
DARI DAFTAR A1
97 3 1/15
971/2 12 4/15
98 15 1/3
981/2 12 4/15
99 3 1/15
Jumlah 45 1
Kita lihat bahwa rata-rata untuk semua sampel membentuk sebuah distribusi
peluang. Untuk penggunaanya, kita perlu mengetahui bentuk atau model distribusi
tersebut. Ternyata bahwa untuk ini berlaku sebuah dalil yang dinamakna dalil limit
pusat seperti tertera di bawah ini :
Jika sebuah populasi mempenyai rata-rata dan simpangan baku yang besarnya
terhingga, maka untuk ukuran sampel random n cukup besar, distribusi rata-rata
sampel mendekati distribusi normal dengan rata-rata = dan simpangan baku
= . Perhatikan bahwa dalil di muka berlaku untuk distribusig model populasi
√
149
Modul statistika dasar
mendekati distribusi normal. Pendekatan kepada normal ini makin baik jika ukuran
sampel n makin besar. Biasanya, untuk ≥ 30 pendekatan ini sudah mulai
berlaku.
Apabila populasi yang disampel sudah berdistribusi normal, maka rata-rata sampel
juga berdistribusi normal meskipun ukuran sampel n < 30.
Distribusi normal yang didapat dari distribusi rata-rata perlu distandarkan agar
daftar distribusi normal baku dapat digunakan. Ini perlu untuk perhitungan-
perhitungan. Untuk ini digunakan transformasi.
−
=
(A3)
Contoh : Tinggi badan mahasiswa rata-rata mencapai 165 cm dan simpangan
baku 8,4 cm. Telah diambil sebuah sampel random terdiri atas 45
mahasiswa. Tentukan berapa peluang tinggi rata-rata ke-45 mahasiswa
tersebut :
a). antara 160 cm dan 168 cm
b). paling sedikit 166 cm
Jawab : Jika ukuran populasi tidak dikatakan besarnya, selalu dianggap cukup
besar untuk berlakunya teori. Ukuran sampel n = 45 tergolong sampel
besar sehingga dalil limit pusat berlaku. Jadi rata-rata untuk tinggi
mahasiswa akan mendekati distribusi normal dengan :
Rata-rata = 165
,
Simpangan baku = = 1,252
√
150
Modul statistika dasar
Apabila dari populasi variansnya diketahui dan perbedaan antara rata-rata dari
sampel ke sampel diharapkan tidak lebih dari sebuah harga d yang ditentukan,
maka berlaku hubungan :
≤
(A4)
Dari rumus A4 ini, ukuran sampel yang paling kecil sehubungan dengan
distribusi rata-rata, dapat ditentukan.
Contoh : Untuk contoh di atas, misalkan harga-harga dari sampel yang satu
dengan sampel lainnya diharapkan tidak mau lebih dari 1 cm. Jika populasi cukup
besar, maka :
,
≤ ≤1
√ √
Atau ≥ 70,58.
Paling sedikit perlu diambil sampel terdiri atas 71 mahasiswa.
B. DISTRIBUSI PROPORSI
Misalkan populasi diketahui berukuran N yang di dalamnya didapat peristiwa A
sebanyak Y di antara N. Maka didapat parameter proporsi peristiwa A sebesar =
(Y/N).
Dari populasi ini diambil sampel random berukuran n dan dimisalkan di dalamnya
ada peristiwa A sebanyak x. Sampel ini memberikan statistic proporsi peristiwa A
= x/n. Jika semua sampel yang mungkin diambil dari populasi itu maka didapat
sekumpulan harga-harga statistic proporsi. Dari kumpulan ini kita dapat
menghitung rata-ratanya, diberi symbol / dan simpangan bakunya diberi
symbol / .
Untuk ini ternyata bahwa, jika ukuran populasi kecil dibandingkan dengan ukuran
sampel, yakni (n/N) > 5%, maka :
151
Modul statistika dasar
/ =
( )
/ =
(A5)
Dan jika ukuran populasi besar dibandingkan dengan ukuran sampel, yakni (n/N) ≤ 5%
Maka :
/ =
( )
/ =
(A6)
=
/
(A7)
Jika perbedaan antara proporsi sampel yang satu dengan sampel yang lainnya
diharapkan tidak lebih dari sebuah harga d yang ditentukan, maka berlaku :
152
Modul statistika dasar
/ ≤
(A8)
Karena / mengandung factor dengan = populasi maka
rumus A8 berlaku jika parameter sudah diketahui besarnya. Jika tidak dapat
ditempuh cara conservative dengan mengambil harga kekeliruan baku atau galat
baku yang terbesar,
yaitu : (1 − )= .
Contoh :
Ada petunjuk kuat bahwa 10% anggota masyarakat tergolong ke dalam golongan A.
sebuah sampel random terdiri atas 100 orang telah diambil.
a. Tentukan peluangnya bahwa dari 100 orang itu akan ada paling sedikit 15 orang
dari golongan A.
b. Berapa orang harus diselidiki agar persentase golongan A dari sampel yang satu
dengan yang lainnya diharapkan berbeda paling besar dengan 2%?
Jawab : populasi yang dihadapi berukuran cukup besar dengan = 0,10 1−
= 0,90.
a. Untuk ukuran sampel 100, diantaranya paling sedikit 15 tergolong kategori A,
maka paling sedikit x/n = 0,15.
Kekeliruan bakunya adalah :
( ) , ,
/ = = = 0,03
, ,
Bilangan z paling sedikit = ,
= 1,67
153
Modul statistika dasar
dari kumpulan ini sekarang dapat dihitung rata-ratanya, diberi symbol dan
simpangan bakunya, diberi symbol .
Jika populasi berdistribusi normal atau hamper normal, maka distribusi
simpangan baku, untuk n besar biasanya ≥ 100, sangat mendekati distribusi
normal dengan :
=
=
√2
(A9)
Dengan = .
Transformasi yang diperlukan untuk membuat distribusi menjadi normal baku
adalah :
−
=
(A10)
Untuk populasi tidak berdistribusi normal dan untuk sampel berukuraj kecil, n
< 100, rumus-rumus sangat sulit dan karena penggunaannya tidak banyak.
Contoh : Varians sebuah populasi yang berdistribusi normal 6,25. Diambil sampel
berukuran 225. Tentukan peluang sampel tersebut akan mempunyai simpangan
baku lebih besar dari 3,5.
Jawab : Varians = 6,25. Ukuran sampel cukup besar, maka distribusi simpangan
baku mendekati distribusi normal dengan rata-rata = 2,5 dan simpangan baku
,
= = 0,118.
√
Praktis tidak terjadi sampel berukuran 225 dengan simpangan baku lebih dari 3,5.
D. DISTRIBUSI MEDIAN
Jika populasi berdistribusi normal atau hampir normal maka, untuk sampel random
berukuran ≥ 30, distribusi Median Me akan mendekati distribusi normal dengan
rata-rata dan simpangan baku .:
154
Modul statistika dasar
=
1,2533
. =
√
(A11)
Dengan dan merupakan parameter populasi.
= +
(A12)
155
Modul statistika dasar
Kita juga dapat mengambil selisih rata-rata − dalam hal ini berlaku :
= −
= +
(A13)
Untuk ukuran-ukuran sampel cukup besar, maka selisih rata-rata −
akan mendekati distribusi normal dengan rata-rata dan simpangan baku seperti
pada rumus A12. Untuk membuat distribusi normal ini menjadi distribusi normal
baku digunakan transformasi.
( − )−( − )
=
(A14)
Apabila dari dua kumpulan rata-rata sampel dengan I = 1, 2, . . . , k dan
dengan j = 1, 2, .. . , r, sekarang dibentuk jumlahnya, maka diperoleh jumlah
rata-rata sampel + . Seperti di atas dari kumpulan ini dapat dihitung rata-
ratanya, diberi symbol dan simpangan bakunya diberi symbol . Untuk
sampel-sampel random yang independen, berlaku :
= +
= +
(A15)
Distribusi jumlah rata-rata ini, untuk sampel-sampel berukuran cukup
besar, akan mendekati distribusi normal dengan parameter rata-rata dan simpangan
baku seperti dalam rumus A15. Untuk membuat menjadi normal baku perlu
digunakan transformasi.
( + )−( + )
=
(A16)
Contoh : Rata-rata tinggi mahasiswa laki-laki 163 cm dan simpangan bakunya 5,2
cm, sedangkan untuk mahasiswa perempuan parameter tersebut
156
Modul statistika dasar
berturut-turut 152 cm dan 4,9 cm. Dari kedua kelompok mahasiswa itu
masing-masing diambil sebuah sampel random, secara independen
berukuran sama, ialah 140 orang. Berapa peluang rata-rata tinggi
mahasiswa laki-laki paling sedikit 10 cm lebihnya dari rata-rata tinggi
mahasiswa perempuan?
Jawab : Misalkan masing-masing menyatakan rata-rata tinggi dari sampel
untuk mahasiswa laki-laki dan perempuan. Yang ditanyakan adalah
peluang − paling sedikit 10 cm. Dari yang diketahui, didapat
= = 163 cm, = = 152 , = = 5,2 , = =
4,9 dan = = 140. Menurut reori di muka − berdistribusi
normal dengan rata-rata = (163 - 152) cm = 11 cm dan
( , ) ( , )
Simpangan baku = + = 0,6038 cm.
Luas daerah normal baku yang diperlukan adalah 0,5 + 0,4515 = 0,9515.
Jadi peluang yang dicari = 0,9515.
selisih proporsi. Dari kumpulan ini dapat dihitung rata-ratanya, diberi symbol
proporsi sampel kesatu dan proporsi sampel kedua. Ternyata untuk ini berlaku :
= −
( ) ( )
= +
(A17)
Untuk ukuran-ukuran sampel dan , cukup besar biasanya ≥
30 ≥ 30, maka distribusi selisih proporsi ini akan mendekati distribusi
normal dengan parameter seperti tertera pada rumus A17. Agar supaya distribusi
normal ini menjadi distribusi normal baku maka diperlukan transformasi.
157
Modul statistika dasar
− −( − )
=
(A18)
G.DISTRIBUSI SAMPLING LAINNYA
Misalkan kita punya sebuah populasi yang berdistribusi normal atau
hamper normal dengan rata-rata dan simpangan baku . Dari populasi tersebut
diambil sampel random berukuran n lalu dihitung rata-rata dan simpangan baku
s.
Sehubungan dengan ini, didapat dua hal :
1. Statistic t, yang ditentukan oleh :
̅−
=
/√
(A19)
Ternyata berdistribusi student dengan derajat kebebasan = − 1.
2. Statistic χ2 yang ditentukan oleh :
( ) ∑( ̅)
χ2 = =
(A20)
Dengan , I = 1, 2, …, n merupakan data dalam sampel, akan berdistribusi
chi-kuadrat dengan derjat kebebasan = − 1.
Dari sampel kesatu simpangan baku dihitung, dan demikian pula
simpangan baku dari sampel kedua. Kita bentuk statistic F yang ditentukan
oleh :
/
=
/
(A21)
Ternyata bahwa statistic F ini berdistribusi F dengan dk pembilang
= − 1 dan dk penyebut = − 1.
158
Modul statistika dasar
SOAL LATIHAN
1. Populasi yang terdiri atas 3000 obyek, 1000 di antaranya bernilai 0, dan
sisanya bernilai 1. Berapa dan ? Diambil 100 buah sampel random
yang masing-masing berukuran 10 lalu dihitung rata-rata tiap sampel.
Berapa diharapkan harga rata-rata dan varians rata-rata 100 sampel ini?
2. Simpangan baku berat anak laki-laki berumur 15-20 tahun besarnya 3,8 kg.
Diambil semua sampel random yang masing-masing berukuran 230 dan
lalu varians tiap sampel dihitung. Tentukan :
a. Rata-rata dan varians untuk distribusi sampling simpangan baku.
b. Ada berapa % dari sampel-sampel itu yang mempunyai simpangan baku
lebih dari 4,5 kg?
3. Pengalaman mencatat bahwa 65% dari penduduk ternyata menyenangi
pemimpin A. Dua buah sampel random telah diambil masing-masing
berukuran 250. Tentukan bagaimana peluangnya bahwa kedua sampel itu
akan memperlihatkan perbedaan persentase lebih dari 12% yang
menyenangi pemimpin A.
4. Diberikan dua buah populasi dengan data populasi I : 3, 2, 3, 5, 4, 8. Data
populasi II : 10, 12, 15, 10.
Dari populasi I diambil semua sampel random berukuran 3 dan dari
populasi II semua yang berukuran dua. Tulislah semua sampelnya, lalu :
a. Hitung rata-rata kedua populasi
b. Hitung rata-rata distribusi sampling rata-rata dari kedua populasi itu.
Sebut ini dan .
c. Hitung ̅ − dan bandingkan dengan selisih rata-ratapopulasi I dan
populasi II. Apa yang nampak?
Berlakukah rumus A12?
d. Bagaimana untuk ̅ + ?
Berlakukah rumus A
159