Anda di halaman 1dari 102

Agus

Statistika 1 - 1

Purnomo

B AB

PE N DAH U LUAN
1.1

STATISTIK DAN STATISTIKA


Pada mulanya, kata statistik diartikan sebagai keterangan-keterangan yang dibutuhkan
oleh negara dan berguna bagi negara. Keterangan-keterangan sedemikian itu umumnya
digunakan untuk memperlancar penarikan pajak dan mobilisasi rakyat ke dalam angkatan
perang. Sebenarnya keterangan-keterangan kuantitatif semacam itu kini lebih kita kenal sebagai
data sensus. Lambat laun, statistik diartikan sebagai data kuantitatif baik yang masih belum
tersusun maupun yang telah tersusun dalam bentuk tabel.
Kata statistik berasal dari bahasa Yunani status yang berarti state atau negara. Pertama
kali digunakan oleh Gottried Achenwall (1791 1872). Digunakan istilah negara karena awalnya
hanya digunakan untuk kepentingan-kepentingan negara saja seperti data penduduk, kepemilikan
tanah, kematian, perkawinan dan lain sebagainya. Seiring dengan perkembangannya, kini
statistik dipakai dalam berbagai aspek kehidupan dan kegiatan manusia.
Dalam arti sempit, statistik berarti data. Sedangkan dalam pengertian yang lebih luas,
Statistik diartikan sebagai kumpulan data dalam bentuk angka maupun bukan angka
yang disusun dalam bentuk tabel (daftar) dan atau diagram yang menggambarkan
(berkaitan) dengan suatu keadaan, peristiwa atau masalah tertentu serta menyatakan juga
ukuran atau karakteristik pada sampel seperti nilai rata-rata, standar deviasi, variansi dan
koefisen korelasi.
Examples :
- Citizen statistic is a group of numbers which correspond to the citizen problems
- Economy statistic is a group of numbers which correspond to the economy problems
- Education statistic is a group of numbers which correspond to the education
problems
- The avarage mark of mathematics is 75 and its standard deviation 10
Sedangkan dalam arti luas, Statistika adalah pengetahuan yang berkaitan dengan metode,
teknik atau cara mengumpulkan data, mengolah data, menyajikan data, menganalisis
data dan menarik kesimpulan atau mengintepretasikan data.
Dengan demikian dapat disimpulkan bahwa statistika adalah pengetahun yang berkaitan
dengan statistik atau statistika adalah ilmu yang mempelajari tentang statistik.
Berdasarkan perlakuan terhadap data, statistik dapat dikategorikan menjadi :
1. Descriptive statistics (deductive statistics): is a statistical method which describes a set
of nature data (there is, no attempt to generalize them). Dengan kata lain, statistika
deskriptif adalah statistika yang menggambarkan atau mendeskripsikan data menjadi
sebuah informasi yang lebih jelas dan mudah dipahami. Statistika deskriptif mengacu
pada bagaimana menata atau mengorganisasi, menyajikan dan menganalisis data dengan
cara perhitungan-perhitungan statistik seperti rata-rata hitung, median, modus, standar
deviasi dan lainnya dalam bentuk tabel-tabel, diagram-diagram atau grafik.
2. Inferential statistics (inductive statistics) : is a statistical method which infers a sample,
what the information implies (there is, attempt to generalize from specific). Dengan
demikian dalam statistika inferensia dilakukan suatu generalisasi dari hal yang bersifat
khusus (kecil) ke hal yang lebih luas (umum). Pada statistika inferensia dilakukan
pengujian hipotesis dan pendugaan mengenai karakteristik (ciri) dari suatu populasi,
seperti mean dan standar deviasi.

Agus
Statistika 1 - 2

Purnomo

START

PENGUMPULAN DATA
KUANTITATIF

PENGOLAHAN,
PENYEDERHANAAN
DAN PENATAAN
DATA KUANTITATIF

S
T
A
T
I
S
T
I
K

PENYAJIAN DATA
YANG TELAH
DISEDERHANAKAN

D
E
S
K
R
I
P
T
I
F

Data Sample ?

Ya

PERGUNAKAN DATA
SAMPLE UNTUK :
- MENAKSIR
PARAMETER
- MENGUJI ASUMSI
MENGENAI PARAMETER

Bukan

PENGGUNAAN DATA
SENSUS (POPULASI)
UNTUK ANALISA
KARAKTERISTIK
(PARAMETER)
POPULASI YANG
TENGAH DISELIDIKI

PENARIKAN KESIMPULAN
TENTANG
KARAKTERISTIK
POPULASI (PARAMETER)
YANG TENGAH DISELIDIKI

S
T
A
T
I
S
T
I
K
I
N
F
E
R
E
N
S

STOP

Gambar 1.1. Hubungan antara statistik deskriptif dengan statistik inferens


Ada keterkaitan yang erat antara statistika deskriptif dengan statistika inferensia (Gambar
1.2), yaitu pada umumnya statistika deskriptif selalu mendahului/mengawali tahapan statistika
inferensia, karena sebelum dilakukan penarikan kesimpulan mengenai suatu keadaan yang
sedang diteliti, maka datanya harus diuraikan dulu dalam bentuk statistika deskriptif sehingga
diperoleh kesimpulan yang akurat guna memperoleh manfaat secara maksimal. Jadi, antara
statistika deskriptif dan statistika inferensia dapat diibaratkan seperti sebuah mata uang logam
yang mempunyai dua sisi, dimana kedua sisi itu tidak dapat dipisahkan satu dengan lainnya.
Agus
Statistika 1 - 3

Purnomo

Oleh karena itu, untuk memperoleh penelitian yang baik, maka proses perhitungan statistika
deskriptif dan statistika inferensia harus dilakukan dengan baik dan benar.
1.2 PERANAN STATISTIK DALAM KEHIDUPAN MANUSIA MODERN
Perkembangan statistik sebagai metode ilmiah telah mempengaruhi hampir setiap aspek
kehidupan manusia moderen. Peranan metode statistik dalam pengambilan keputusan secara
ekonomis di perusahaan-perusahaan maupun penelitian yang sifatnya non ekonomis makin besar.
1.2.1

PERANAN STATISTIK DALAM BIDANG EKONOMI DAN MANAJEMEN


PERUSAHAAN
Bagi pimpinan perusahaan, metode statistik merupakan alat yang penting dalam proses
pengambilan keputusan. Keputusan-keputusan sedemikian itu meliputi keputusan mengenai
pembelian bahan, penggudangan, penentuan jumlah produksi, pengawasan administrasi,
penaksiran volume penjualan dimasa mendatang dan lain-lain persoalan yang berhubungan erat
dengan kelangsungan hidup perusahaan yang bersangkutan.
1) Bidang produksi
Penetapan standar kualitas dan pengawasan kualitas
Penetapan standar bagi kualitas produk merupakan tanggung jawab insinyur perusahaan.
Persoalan ini meliputi spesifikasi tekhnis yang menyarankan kualitas produk yang
dikehendaki serta batas spesifikasi atas dan batas spesifikasi bawah. Kedua batas
spesifikasi tersebut dipakai sebagai pedomanuntuk menentukan diterima atau tidaknya
produk yang dihasilkan.
Fungsi pengawasan kualitas ialah menentukan secara statistik apakah proses pembuatan
produk tersebut betul-betul telah dijalankan sedemikian rupa sehingga kedua spesifikasi
tersebut dapat dipenuhi.
Pengawasan terhadap efisiensi kerja
Penggunaan waktu bagi kegiatan-kegiatan yang tertentu harus diteliti secara statistik agar
dapat menetapkan waktu standar guna menyelesaikan pekerjaan yang tertentu.
Test terhadap metode atau produk baru
Secara statistik kita dapat menguji berarti atau tidaknya perbedaan metode atau produk
baru tersebut jika dibandingkan dengan yang lama . Bila perbedaannya memang sangat
berarti, maka perubahan metode atau produk dapat dilaksanakan.
2) Bidang akuntansi
Sebagian besar guna statistik dibidang akuntansi bertalian dengan penilaian tentang aktiva
perusahaan. Penyesuaian yang bertalian dengan perubahan harga dan hubungan antara
ongkos dan volume produksi juga membutuhkan peralatan statistik.
Penyesuian yang bertalian dengan perubahan harga
Penyesuaian sedemikian itu berlaku bagi penyusutan mesin-mesin, investaris dan bahan
baku perusahaan . Penyesuaian sedemikian itu umumnya menggunakan indeks harga.
Tujuan penyesuaian tersebut ialah untuk mengurangi penghasilan bersih bila terdapat
kenaikan harga-harga dan sebaliknya.
Hubungan antara ongkos dan volume produksi
Data historis umumnya dipakai guna menghitung secara statistik hubungan antara kedua
variabel diatas hubungan tersebut perlu diketahui karena pada suatu titik yang tertentu,
ongkos keseluruhan produksi akan bertambah secara kurang sebanding dengan volume
produksi.
3) Bidang pemasaran
Penggunaan statistik dalam bidang pemasaran ini berhubungan erat dengan
analisa penjualan, analisa pasar dan analisa pemasaran.
Penyelidikan tentang preferensi konsumen
Agus
Statistika 1 - 4

Purnomo

Bila perusahaan ingin memperkenalkan produk barunya kepada konsumen, penelitian


tentang preferensi konsumen merupakan suatu hal yang mutlak, penelitian semacam ini
dapat dilakukan dengan sampel.
Penaksiran potensi pasaran bagi produk baru
Sejalan dengan soal diatas potensi potensi pasaran bagi produk baru harus diketahui. Hal
ini membutuhkan pengamatan konsumen (consumer survey) yang bertalian antara lain
dengan persoalan kebutuhan konsumen akan produk tersebut.
Penelitian mengenai potensi pasaran di daerah baru
Data yang bersifat ekstern harus dipergunakan. pimpinan perusahaan untuk menaksirkan
nilai penjualan produknya dari nilai penjualan seluruh industri. Disamping itu pimpinan
perusahaan harus dapat menaksirkan pengaruh barang substitusi maupun barang
komplementer terhadap produknya.
Penetapan harga
Penetapan harga akan membawa pengaruh yang besar terhadap jumlah penerimaan
penjualan . Pimpinan perusahaan harus dapat membentuk kurva permintaan terhadap
produknya secara statistik. Hal tersebut tidaklah mudah.
Penelitian terhadap efektifnya cara mengiklankan produk
Penilaian terhadap efektifnya cara mrngiklankan produk . Sampai berapa jauh cara
mengiklankan produk baru atau lama yang dihasilkan oleh suatu perusahaan itu betulbetul efektif.
Test terhadap efektifnya metode penjualan yang berbeda
Jika kita memiliki beberapa cara penjualan hasil produksi, cara penjualan manakah yang
ternyata lebih efektif ?

1.2.2 PERANAN STATISTIK DI BIDANG PENELITIAN


Bagi peneliti di laboratorium, metode statistik memberikan peralatan yang berguna bagi
perencanaan eksperimennya dan evaluasi hasil eksperimen itu sendiri. Dalam merencanakan
eksperimen laboratorium peneliti harus memperhitungkan kemungkinan adanya kesalahan
eksperimen (experimental errors). Metode statistik memberikan teknik pengawasan serta
pengulangan kesalahan-kesalahan (errors) sedemikian itu disamping teknik penentuan kombinasi
faktor-faktor yang diuji secara laboratoris.
1.3 STATISTIK DAN KOMPUTER
Dewasa ini, penggunaan komputer untuk mengolah data kuantitatif dan melakukan komputasi
statistik yang serba rumit, makin merupakan suatu kebutuhan yang mendesak bagi para peneliti
dan statistisi. Statistika semakin berkembang luas dengan adanya kemajuan di bidang komputer
dan software. Perhitungan statistik semakin cepat, akurat dan teliti khususnya dalam analisa data
dan keperluan perencanaan (seperti: SAS,SPSS). Dengan mudah mendapatkan nilai rata-rata,
median, modus, standar deviasi, koefisien korelasi, koefisien persamaan regresi, dan analisa
varians.
1.4 DASAR OPERASI STATISTIK
Statistika bekerja dengan beberapa cara atau landasan, yaitu :
1)
2)
3)

Variasi : statistika bekerja dengan keadaan yang berubah-ubah (variasi). Misalnya keadaan
penduduk, keuangan, kelahiran, GNP, KB, dan lain-lain.
Reduksi : statistika bekerja secara reduksi, artinya tidak seluruh informasi yang harus
diolah. Tidak seluruh orang harus diteliti (populasi), melainkan cukup dengan sampel yang
mewakilinya atau sampel yang bersifat representatif.
Generalisasi : statistika induktif bekerja untuk menarik kesimpulan umum (generalisasi)
yang berlaku untuk anggota-anggota populasinya berdasarkan sampel-sampel yang

Agus
Statistika 1 - 5

Purnomo

4)

representatif tadi. Misalnya kita tidak mungkin meneliti 10.000 buah jeruk mengenai
kekuatannya terhadap sinar matahari, tetapi cukup dengan sampelnya misalnya 100 buah
saja untuk setiap 10.000 buah.
Spesialisasi : statistika selalu bekerja dengan angka-angka (kuantitatif). Istilah-istilah
seperti pada umumnya, kira-kira, sekitar, kurang lebih dll harus dibobot terlebih dahulu
agar dapat dikerjakan dengan metode-metode statistika.

1.5 DATA
A. DATA AND INFORMATION
Data bersifat jamak, sedangkan datum berbentuk tunggal. Jadi data adalah sekumpulan datumdatum. Data adalah suatu bahan mentah yang jika diolah dengan baik melalui berbagai
analisis dapat melahirkan berbagai informasi. Dengan informasi tersebut, kita dapat
mengambil suatu keputusan. Dalam statistika dikenal istilah-istilah jenis data, tingkatan data,
sumber data, penyajian data dan analisis data. Data dianalisis sesuai dengan jenis dan
tingkatannya, karean itu masing-masing tingkatan data mempunyai analisis sendiri khususnya
dalam analisis korelasi.
Data yang baik harus mutakhir, relevan dengan masalah yang diteliti dan berasal dari sumber
yang dapat dipertanggungjawabkan, lengkap, akurat, obyektif dan konsisten. Bagaimanapun
canggihnya suatu analisis jika tidak ditunjang oleh data yang baik, maka hasilnya kurang dapat
bisa dipertanggungjawabkan.
B. TIPE DAN TINGKATAN DATA
Dalam kegiatan statistika, kita akan selalu berhubungan dengan data. Secara garis besar, data
dibagi atas dua jenis yaitu :
1. Data dikotomi : disebut juga data diskrit, data kategorik atau data nominal adalah data yang
satuannya selalu bulat dalam bilangan asli dan tidak berbentuk pecahan yang diperoleh dari
hasil menghitung. Contoh : jumlah manusia, baju, mobil pohon dan lain sebagainya.
2. Data kontinum : data yang diperoleh dari hasil pengukuran menurut tingkatan yang
bervariasi, sehingga satuan datanya memungkinkan dalam bentuk pecahan. Data ini terdiri
atas 3 jenis, yaitu :
a. Data ordinal : data yang berbentuk rangking atau peringkat, misalnya juara I, II dan
III dinyatakan dalam skala, maka jarak antara satu data dengan lainnya tidak sama.
98
85
73
62
I

II

III

IV dst

b. Data interval : data yang jaraknya sama tapi tidak mempunyai nilai nol absolut ,
misalnya skala termometer, walaupun ada nilai 00 C, tetapi tetap ada nilainya.
-2
-1
0
1
2
3
4
c. Data ratio : data yang jaraknya sama dan mempunyai nilai nol mutlak, misalnya luas
area, tinggi dan berat dll. Panjang 0 meter berarti tidak mempunyai panjang. Data
ratio ini adalah data yang paling teliti.
Sedangkan tingkatan data jika diurutkan adalah dari urutan yang tertinggi ke yang terendah
adalah 1. Data ratio; 2. Data interval; 3. Data ordinal; dan 4. Data nominal. Dalam analisis
statistika, jiak diperlukan data yang tinggi dapat diturunkan ke tingkatan yang lebih rendah,
namun tidak bisa untuk sebaliknya.
Agus
Statistika 1 - 6

Purnomo

C. POPULASI DAN SAMPEL


Populasi dan sampel biasanya digunakan pada statistika inferensia, dimana hal itu berkaitan
dengan penarikan kesimpulan berdasarkan data yang dihitung dari sampel untuk
menggambarkan karakteristik dari suatu populasi. Penarikan kesimpulan seperti ini biasanya
dilakukan pada penelitian atau studi dengan memakai metode survei yang memakai data dari
sampel namun hasil perhitungan yang diperoleh diperluas untuk menggambarkan atau
menyimpulkan karakteristik dari populasinya. Jadi antara sampel dan populasi ada keterkaitan
yang sangat erat. Meskipun demikian, suatu penelitian tidak selalu memakai sampel, melainkan
langsung memakai populasi, dimana dalam hal demikian maka tidak ada generalisasi tetapi apa
yang dihitung langsung menyimpulkan karakteristik populasi.
Populasi dapat didefinisikan sebagai suatu keseluruhan pengamatan atau obyek yang
menjadi perhatian kita. Sedangkan Sampel adalah bagian dari populasi yang menjadi
perhatian kita. Jika digambarkan secara himpunan, maka populasi adalah himpunan semesta
dan sampel adalah himpunan bagian.
U = populasi = { sample-sampel }
U (populasi)
Populasi menggambarkan sesuatu yang sifatnya ideal
x, y,
dan teoritis, sedangkan sampel menggambarkan sesuatu
z
yang sifatnya nyata atau empirik. Populasi dan sampel
sampel
masing-masing mempunyai karakteristik yang dapat
diukur.
Karakteristik yang diukur atau dihitung dari populasi disebut parameter, misalnya mean
dilambangkan ; standar deviasi dilambangkan ; koefisien korelasi . Sedangkan karakteristik
yang dihitung dari sampel disebut statistik.
Meskipun populasi merupakan gambaran yang ideal, tetapi sangat jarang penelitian
menggunakan populasi, namun yang umum digunakan adalah sampel karena beberapa alasan
seperti :

waktu yang diperlukan lebih singkat


dana yang dibutuhkan lebih sedikit
data yang diperoleh lebih akurat
dengan statistika inferensia dapat dilakukan generalisasi.

D. METODE SAMPLING
Sebelum memilih sampel, maka tahap awal adalah menentukan populasinya, kemudain
menentukan metode pengambilan sampel yang terdiri dari dua cara :
1. Sampel non probabilitas : disebut juga incidental yaitu pengambilan sample yang dilakukan
dengan cara tidak acak. Cara ini terdiri dari 3 jenis :
a. Convenience sampling : sampel yang diambil berdasarkan kesukaan peneliti, misalnya
dengan cara menghadang pengunjung super market kemudian mewawancarainya,
b. Judgement sampling : pemilihan elemen sampel sangat tergantung pada peneliti dengan
mempertimbangkan dasar-dasar tertentu, misalnya untuk meneliti peraturan lalu lintas,
maka sampel yang dipilih adalah mereka yang memiliki dan tidak memiliki SIM saja.
c. Quota sampling : pemilihan sampel pada suatu tingkat diambil dengan jumlah tertentu
(kuota) dengan ciri-ciri tertentu, misalnya peneliti mengendalikan karakteristik usia
responden dengan cara menentukan 50% dari respondennya berusia 30 tahun ke atas.
2. Sampel Probabilitas : sampel yang diambil secara acak (random). Cara ini terdiri dari 3
jenis :
a. Simple random sampling : pengambilan sampel yang dilakukan secara acak, dimana
setiap anggota populasi mempunyai kesempatan yang sama untuk menjadi sample.
Agus
Statistika 1 - 7

Purnomo

b. Stratified sampling : pengambilan sampel dilakukan dengan terlebih dahulu melakukan


pengelompokan pada populasinya berdasarkan strata-strata tertentu.
c. Cluster sampling : pengambilan sampel dilakukan dengan terlebih dahulu melakukan
pengelompokan pada populasinya secara acak.
E. METODE SURVEI
Teknik atau metode pengambilan data adalah sebagai berikut :
1. Interview : a method of data collecting where researcher interviews respondent directly
which be guided by an interview guidance. The advantage of this method to researcher, he
can get the data directly and can be responsibled. The weakness of this method is that cannot
be operated in big scale.
2. Questionnaire : a method of data collecting where researcher sends a questions list to the
people who become research object, so that the answer or data can not be got directly. Many
advantages which be got from this method, such as possibility to run in big scale; need more
little cost; possibility to get the personality data. The weakness of this method such as,
possibility to get uncompleteness answers; the accuracy of the answer cannot be responsibled
at all; the questionnaire is not returned.
3. Observation : a method of data collecting where researcher observes the research object
directly which be guided by an observation guidance. The advantage of this method to
researcher, he can get the data more acurately The weakness of this method is
misinterpretation to the research object.
F. METODE SCALING
Seperti halnya jenis data, maka sifat skala pengukuran mempunyai sifat yang sama dengan
kualitas atau jenis data yang dipakai. Jadi, skala pengukuran dibagi dalam empat tingkatan
juga :
1. Skala nominal : membedakan data tanpa tingkatan, misalnya Laras, pohon, mobil dll.
2. Skala ordinal : membedakan data dengan suatu urutan, tanpa jarak, misalnya mhs sem
I berkode 3; mhs sem II berkode 5; mhs sem III berkode 9.
3. Skala interval : membedakan data dengan tingkatan, ada jarak, misalnya umur Tini 12
thn, Sinta 13 thn, Febri 14 thn, Lina 15 thn.
4. Skala ratio : Membedakan data dengan tingkatan, ada jarak dan ada nilai mutlak,
misalnya uang Adi Rp. 10.000 dan uang Budi Rp. 5.000, jadi uang Adi dua kali uang
Budi.
Sedangkan metode skala yang biasanya atau sering digunakan dalam penelitian bisnis adalah :
1. Skala Likert : digunakan untuk mengukur sikap, pendapat dan persepsi seseorang atau
kelompok tentang fenomena sosial dengan memberi bobot pada elemen-elemen
instrumen secara gradasi. Contoh :
- Sangat setuju
=5
- Setuju
=4
- Ragu-ragu
=3
- Tidak setuju
=2
- Sangat tdk setuju = 1
2. Skala Guttman : digunakan untuk memperoleh jawaban yang tegas terhadap suatu
permasalahan yang ditanyakan. Dengan demikian pada skala ini hanya ada dua jawaban
saja, ya atau tidak; setuju atau tidak setuju.

Agus
Statistika 1 - 8

Purnomo

BAB II
DISTRIBUSI FREKUENSI

Data yang telah dikumpulkan harus dikelola dan diorganisir sebaik mungkin dan sistematis
sehingga dapat menjadi sebuah informasi yang dapat digunakan untuk mengambil keputusan.
Penyajian data bisa berbentuk tabel-tabel, diagram, grafik maupun gambar-gambar. Dengan cara
demikian maka data dapat menjadi lebih komunikatif dan mudah dimengerti. Secara garis besar
data dapat diorganisir menjadi dua bagian :
2.1 Data yang tidak dikelompokkan.
Data yang jumlahnya tidak terlalu banyak seringkali tidak perlu dikelompokkan. Untuk data
yang demikian penyajiannya tidak terlalu sulit. Biasanya data disajikan dalam bentuk tabel
atau dengan urut yaitu dari nilai terkecil sampai yang terbesar atau sebaliknya. Contoh :
Tabel 1 Data Penjualan Produk X di Wilayah Bandung Bulan Januari 2010
No. urut
1
2
2
4
5
6
7
8
9
10

Wilayah/Cabang

Penjualan
(ribuan rupiah)
70
60
80
30
30
50
70
40
25
40
495

Cicaheum
Cicadas
Cisokan
Ciumbuleuit
Sukajadi
Setra Sari
Padasuka
Ujung Berung
Kepatihan
Cibeunying
JUMLAH

2.2 Data yang dikelompokkan.


Data yang jumlahnya cukup banyak penyajian secara individual akan sangat sulit, oleh karena itu
cara penyajiannya akan dikelompokkan menurut sifat atau kelas-kelas tertentu . Tiap-tiap kelas
akan menunjukkan jumlah atau frekuensinya.
2.3 Limit Kelas; Batas Kelas; Nilai Tengah dan Lebar Kelas
Contoh :Bagian Litbang super market Brena ingin mengetahui seberapa besar pelanggannya
berbelanja di super market tersebut untuk setiap kali kunjungan. Untuk itu pada tanggal 14
Februari 2010 dilakukan pendataan 60 pengunjung. Berikut ini adalah data nilai jumlah
belanjaan dalam ribuan rupiah.
50
32

32
61

Agus
Statistika 1 - 9

33
76

73
65

47
56

45
54

79
58

40
54

70
76

38
85
Purnomo

52
54
56
25

74
62
88
63

40
77
57
64

68
45
58
28

42
67
59
52

75
66
55
54

43
65
56
23

48
66
47
33

44
46
61
48

82
35
69
36

Data di atas masih merupakan data mentah (raw data) atau data kasar (crude data). Data
tersebut belum diolah secara statistika, sehingga belum komunikatif. Data tersebut perlu
disusun atau ditabuklasi dalam bentuk tabel frekuensi. Ada beberapa tahapan atau langkah
dalam menyusun tabel frekuensi, yaitu :
1. Tentukan nilai maksimum (terbesar) dan nilai minimum (terkecil) dari data mentah,
kemudian tentukan range atau jangkauannya dengan menggunakan rumus :
r = nilai maks nilai min

Maka range data tersebut adalah : r = 88 23 = 65


2. Tentukan banyaknya kelas dengan memakai rumus Sturgess :
k = 1 + 3,3 log n
dimana :

k = banyak kelas dan n = banyak data

k = 1 + 3,3 log 60 = 1 + 5,9 = 6,9 dibulatakan menjadi 7


3. Tentukan lebar kelas (interval kelas = c) dengan memakai rumus :
c = r/k

Untuk sekedar diingat bahwa penentuan lebar kelas dengan cara ini hanya bersifat pendugaan
atau perkiraan saja. Lebar kelas pada seriap kelas biasanya dibuat sama dan diusahakan
merupakan bilangan asli.
c = r/k = 65/7 = 9,3 dibulatkan selalu ke atas menjadi 10 (agar semua data
bisa masuk range dari interval kelas.
4. Buatlah tabulasi frekuensi dengan cara memasukkan semua data dalam satu tabel. Cara
memasukkan data biasanya menggunakan model stik
Interval Kelas
Frekuensi
Frekuensi
20 29
III
3
30 39
IIIII II
7
40 49
IIIII IIIII II
12
50 59
IIIII IIIII IIIII
15
60 69
IIIII IIIII II
12
70 79
IIIII III
8
80 89
III
3
5. Tentukan batas kelas, yang terdiri dari :
batas kelas bawah (nilai terendah dalam interval kelas)
batas kelas atas (nilai tertinggi dalam interval kelas).
Dari data diatas maka dapat ditentukan :
Agus
Statistika 1 - 10

Purnomo

batas kelas bawah : 20, 30, 40, 50, 60, 70, 80


batas kelas atas : 29, 39, 49, 59, 69, 79, 89
Interval Kelas
Frekuensi
20 29
3
30 39
7
40 49
12
50 59
15
60 69
12
70 79
8
80 89
3
Batas kelas atas

Batas kelas bawah


6. Tentukan tepi kelas atau batas kelas (class boundaries), yang juga terdiri dari :
tepi kelas bawah (adalah dari jumlah batas kelas bawah kelas tersebut dengan batas
kelas atas kelas sebelumnya)
tepi kelas atas (adalah dari jumlah batas kelas atas kelas tersebut dengan batas
kelas bawah dari kelas sesudahnya).
Maka dari data di atas dapat dihitung :
- kelas pertama :
tepi kelas bawah = (20 + 19) = 19,5
tepi kelas atas = (29 + 30) = 29,5
- kelas kedua :
tepi kelas bawah = (30 + 29) = 29,5
tepi kelas atas = (39 + 40) = 39,5
- kelas ketiga :
tepi kelas bawah = (40 + 39) = 39,5
tepi kelas atas = (49 + 50) = 49,5 dst
Jadi, tepi kelas atas dari suatu kelas merupakan tepi kelas bawah dari kelas berikutnya.
Interval Kelas
20 29
30 39
40 49
50 59
60 69
70 79
80 89

Tepi Kelas
19,5 29,5
29,5 39,5
39,5 49,5
49,5 59,5
59,5 69,5
69,5 79,5
79,5 89,5

Frekuensi
3
7
12
15
12
8
3

7. Tentukan nilai tengah (yaitu nilai yang terletak ditengah pada setiap kelas interval) dengan
cara dari jumlah batas kelas bawah dan batas kelas atas dari suatu kelas.
- nilai tengah I = (20 + 29) = 24,5
- nilai tengah II = (30 + 39) = 34,5 ; dst
Interval Kelas
20 29
30 39
40 49
50 59
60 69
70 79
Agus
Statistika 1 - 11

Nilai Tengah
24,5
34,5
44,5
54,5
64,5
74,5

Frekuensi
3
7
12
15
12
8
Purnomo

80 89

84,5

8. Hitunglah frekuensi relatif dan kumulatif, dengan cara :


Frekuensi relatif : merupakan rasio antara jumlah frekuensi masing-masing kelas dengan
jumlah frekuensi keseluruhan dikalikan 100%
- Untuk kelas I (20 29) = 3/60 x 100% = 5%
- Untuk kelas II (30 39) = 7/60 x 100% = 10%
- Untuk kelas III (40 49) = 12/60 x 100% = 20%
- Untuk kelas IV (40 49) = 15/60 x 100% = 25% ; dst
Interval Kelas
20 29
30 39
40 49
50 59
60 69
70 79
80 89
Jumlah

Frekuensi
3
7
12
15
12
8
3
60

Frekuensi kumulatif
kumulatif lebih dari
Interval
Kelas
20 29
30 39
40 49
50 59
60 69
70 79
80 89

ada 2, yaitu frekuensi kumulatif kurang dari dan frekuensi

Frekuensi
3
7
12
15
12
8
3

Frekuensi Relatif (%)


5
11
20
25
20
14
5
100%

Frekuensi kumulatif
kurang dari
0
3
10
22
37
49
57
60

Frekuensi kumulatif
lebih dari
60
57
50
38
23
11
3
0

2.4 GRAFIK DAN DIAGRAM


Ada 3 jenis diagram dan grafik yang sering digunakan pada statistika deskriptive, yaitu :
1. Polygon : diagram garis yang menghubungkan titik-titik koordinat dari nilai tengah dan
frekuensi dari masing-masing kelas. Sumbu vertikal menunjukkan frekuensi dan sumbu
horisontal menunjukkan nilai tengah.
Interval Kelas
20 29
30 39
40 49
50 59
60 69
70 79
80 89
Agus
Statistika 1 - 12

Nilai Tengah
24,5
34,5
44,5
54,5
64,5
74,5
84,5

Frekuensi
3
7
12
15
12
8
3
Purnomo

2. Histogram : diagram balok yang menunjukkan jumlah frekuensi dari setia kelas dengan
menggunakan tepi kelas untuk setiap batasan kelasnya. Sumbu vertikal dari grafik (tinggi
balok menunjukkan jumlah frekuensi setiap kelasnya dan sumbu horisontal menunjukkan
tepi kelas.
Interval Kelas
20 29
30 39
40 49
50 59
60 69
70 79
80 89

Agus
Statistika 1 - 13

Tepi Kelas
19,5 29,5
29,5 39,5
39,5 49,5
49,5 59,5
59,5 69,5
69,5 79,5
79,5 89,5

Frekuensi
3
7
12
15
12
9
3

Purnomo

3. Kurva Ogive : adalah grafik yang menunjukkan frekuensi kumulatif dari setiap kelas. Sumbu
vertikas menunjukkan frekuensi kumulatif dan sumbu horisontal menunjukkan tepi kelas.
Interval
Kelas
20 29
30 39
40 49
50 59
60 69
70 79
80 89

Frekuensi
3
6
12
15
12
9
3

Frekuensi kumulatif
kurang dari
0
3
9
21
36
48
57
60

Ogivelebih dari

Frekuensi kumulatif
lebih dari
60
57
51
39
24
12
3
0
Ogive kurang dari

60

45

30

15

19.5

Agus
Statistika 1 - 14

29.5

39.5

49.5

59.5

69.5

79.5

89.5

Purnomo

BAB III
PENGUKURAN CENTRAL TENDENCY,
LOCATION AND DISPERSION
3.1 PENDAHULUAN
Penyajian data dapat dilakukan dengan cara memakai ukuran pemusatan data (measures of
central tendency) dan ukuran letak data (measures of location).
Both of measures of central tendency and measures of location consist of a data typicals.
Both of them are a part of descriptive statistics. A measure of central tendency which we learn
consist of :
- Arithmethic Mean (Rata-Rata Hitung)
- Median (Median)
- Mode (Modus)
- Geometric Mean (Rata-Rata Ukur)
- Harmonic Mean (Rata-Rata Harmonis)
Sedangkan ukuran letak data (a measure of location) terdiri atas :
- Quartile (kuartil)
- Decil (desil)
- Percentile (persentil)
Ukuran pemusatan disebut juga sebagai rata-rata (average) menunjukkan di mana suatu data
memusat atau suatu kumpulan pengamatan memusat (mengelompok). Bila suatu kelompok data
diurutkan (secara membesar atau mengecil) maka ada kecenderungan data itu akan memusat
pada bagian tengah.
Thus, measure of central tendency is a single value which representatives set of data or
set of observation, wherein that value shows the data centralized.
3.2 ARITHMETIC MEAN (Rata-Rata Hitung)
1. Data yang tidak dikelompokkan :
Jika nilai data adalah X1 , X2 , X3 , Xi , dimana n adalah banyaknya data (sampel),
maka rata-rata hitung ( x , baca x bar) dirumuskan :
n

X =

+ X

+ X

, + X

atau

Xi

X =

i =1
n

Jika datanya adalah populasi, maka pada rumus di atas, simbol


x diganti dan simbol n
(sampel) diganti simbol N (populasi)
Contoh : Misalkan diketahui data penjualan selama 10 bulan adalah sbb :
Sale
70
80
60
30
30
40
40
60
40
50
Maka rata-rata penjualan selama 10 bulan adalah :
__

70 80 60 30 30 40 40 60 40 50
50
10

2. Data yang dikelompokkan


Data yang bervariasi, maka dapat dikelompokkan dalam tabel frekuensi, yang terdiri dari
kelas-kelas tertentu, dimana nilai data yang dipakai adalah nilai yang mewakili tiap kelas, yaitu
nilai tengah per kelas. Misalnya suatu data Xn di mana masing-masing nilai data muncul dengan
frekuensi fn maka nilai rata-rata hitungnya adalah :
Agus
Statistika 1 - 15

Purnomo

fi Xi

X =

i =1

n
n

fi Xi
Contoh : Misalkan penjualan
toko A disajikan dalam tabel frekuensi di bawah ini. Berapakah
i =1
X =?
rata-rata penjualannya
n
Penjualan
20 29
30 39
40 49
50 59
60 69
70 79
80 89

Nilai Tengah
24,5
34,5
44,5
54,5
64,5
74,5
84,5

Frekuensi
3
6
12
15
12
9
3

Dengan menggunakan rumus di atas, maka didapat :


X=

(3x24,5)+6(34,5)+12(44,5)+ .dst
3 + 6 + 12 + 15 + 12 + 9 + 3

3.330
60

= 55,5

Hasil ini bisa dibaca bahwa penjualan rata-rata toko A adalah Rp.55.500,- per hari.
A. RATA-RATA HITUNG MEMAKAI KODE (U)
Cara lain untuk menghitung arithmetic mean menggunakan cara transformasi linier, di
mana cara ini lebih sederhana dibandingkan dengan cara sebelumnya. Ketentuannya
adalah :
Digunakan untuk data berkelompok
Kode pengganti adalah U yang mempunyai nilai : 0, 1, 2, 3, 4, .dst.
Caranya dengan membuat titik 0 baru (0*) dari titik 0 lama
Tentukan nilai tengah (X0) dari kelas tengah, kemudian himpitkan nilai tsb dengan titik 0* ,
sehingga X0 = 0* = 0
Rumus yang digunakan adalah :
fU
X = X0 + c
f
di mana : X0 = Nilai tengah kelas dari kelas yang paling tengah
c = Lebar kelas
U = Kode
Contoh : hitunglah mean dari data di bawah ini :
Penjualan
Nilai Tengah
Frekuensi
20 29
24,5
3
30 39
34,5
6
40 49
44,5
12
50 59
54,5
15
60 69
64,5
12
70 79
74,5
9
Agus
Statistika 1 - 16

Purnomo

80 89

84,5

Jawab :
Tabel diubah dulu menjadi
Penjualan
Nilai Tengah
20 29
24,5
30 39
34,5
40 49
44,5
50 59
54,5
60 69
64,5
70 79
74,5
80 89
84,5

U
-3
-2
-1
0
1
2
3

f
3
6
12
15
12
9
3
f = 60

fU
-9
-12
-12
0
12
18
9
fU = 6

Masukkan dalam rumus :


X = X0 + c ( fU / f) = 54,5 + 10 (6 / 60) = 55,5 (bandingkan
dengan cara sebelumnya).
3.3 MEDIAN (Median)
Median can be defined as a mid value of a set of data which arranged according to size
(either in ascending or descending order).
Dengan kata lain, median adalah nilai paling tengah (jika jumlah data ganjil) atau rata-rata
dari dua nilai tengah (jika jumlah data genap). Median ditulis dengan simbol Med. Median
dari data yang tidak dikelompokkan dapat ditentukan langsung setelah datanya diurutkan.
Contoh :
1. Median dari data 3, 3, 4, 5, 6, 8, 8, 9, 10 adalah nilai ke-5, yaitu sama dengan 6,
karena banyaknya data (n) adalah 9 (ganjil). Ditulis Med = 6.
2. A = {5, 5, 7, 9, 11, 12, 15, 18} mempunyai median = (9+11) = 10, karena
banyaknya data (n) = 8 (genap). Dalam hal ini mediannya adalah rata-rata dari nilai
ke-4 dan ke-5
Untuk data yang dikelompokkan dalam tabel distribusi frekuensi, mediannya dihitung
dengan memakai rumus :

Med = L0 + c

n/2 - F
f

Di mana :
Med = Median
L0 = Batas bawah kelas median
c
= Lebar Kelas (interval)
n/2 = median dari data yang dikelompokkan
F
= jumlah frekuensi semua kelas sebelum
kelas yang mengandung median
f
= frekuensi kelas median

Sedangkan letak median ditentukan dengan rumus n/2.


Contoh : Tentukan median data modal 40 perusahaan pada tabel di bawah ini :

Agus
Statistika 1 - 17

Purnomo

Modal
112 120
121 129
130 138
139 147
148 156
157 165
166 174

frekuensi
4
5
8
12
5
4
2
Med =

Tentukan dulu pada kelas interval mana


mediannya terletak. Median terletak pada
nilai n/2 = 40/2 = 20, atau pada kelas
dengan interval 139 147. Dengan
demikian maka kita peroleh : L0 = 138,5 ;
f = 12 ; F = 4 + 5 + 8 = 17 ; c = 147,5
138,5 = 9 ; n = 20. Dengan memakai
rumus di atas , maka dapat dihitung
Median dari modal-modal tsb

138,5 + 9

20 - 17

= 140,75

12

3.4 MODE (Modus)


Modus adalah nilai data yang paling banyak muncul atau nilai data yang mempunyai
frekuensi paling besar. Suatu kelompok data mungkin mempunyai modus, tapi mungkin juga
tidak mempunyai modus. It means a data set has always no mode, but a data set may has more
than one mode.
Contoh :
a. Untuk data yang tidak dikelompokkan :
- 3, 6, 8, 10, 13, 18 tidak ada modus.
- 6, 8, 9, 9, 13, 9 mempunyai 1 modus, yaitu Mod = 9
- 9, 8, 9, 7, 6, 8, 10 mempunyai 2 modus, yaitu Mod = 8 dan Mod = 9
- 6, 6, 6, 6, 6 tidak ada modus
b. Untuk data yang dikelompokkan, modus dihitung dengan menggunakan rumus :

Mod =

L0 + c

b1
b1 + b2

Di mana :
Mod = Modus
L0 = Batas bawah kelas modus
c
= Lebar Kelas (interval)
b1 = selisih antara frekuensi kelas modus
dengan frekuensi tepat satu kelas sebelum
kelas modus
b2 = selisih antara frekuensi kelas modus
dengan frekuensi tepat satu kelas sesudah
kelas modus

Contoh : Tentukan modus dari tabel di bawah ini


Modal
Frekuensi
Tentukan dulu kelas interval yang mengandung modus, yaitu kelas interval yang mem11 20
2
punyai frekuensi terbesar. Pada tabel ini yg
21 30
4
mempunyai frekuensi terbesar adalah kelas
31 40
5
41 50 dengan f = 10. Jadi modusnya ter41 50
10
letak pada kelas 41 50. Jadi L0 = 40,5 ; c =
51 60
2
10 ; b1 = 10 5 = 5 ; dan b2 = 10 2 = 8
61 70
4
71 80
3
Dengan menggunakan rumus Modus, maka dapat dihitung modus untuk modal 30 perusahaan
adalah :
Mod =

Agus
Statistika 1 - 18

40,5 + 10

5+ 8

= 44,35

Purnomo

B. HUBUNGAN RATA-RATA HITUNG, MEDIAN DAN MODUS


Hubungan antara nilai rata-rata hitung, median dan modus ditentukan oleh simetri tidaknya
kurva distribusi data yang bersangkutan, yaitu :
1. Kurva akan medekati simetri, jika Mod = Med = X
2. Kurva asimetri ke kanan (mendekati sumbu vertikal), jika Mod < Med < X
3. Kurva asimetri ke kiri(menjauhi sumbu vertikal), jika x < Med < Mod

x < med < mod

Mod < med < x

mod = med = x

1
2
3
Dalam hal distribusi data asimetri ke kanan atau ke kiri, maka terdapat hubungan empirik antara
rata-rata hitung dengan median dan modus, yaitu :
X Mod = 3(X Med)

Example :
An asymmetry distribution data set has arithmetic mean 75 and Median 70. Find the mode of the
data !.
X Mod = 3 (X Med)
75 Mod = 3 (75 70)
Mod = 75 15 = 60
3.5 GEOMETRIC MEAN (Rata-Rata Ukur)
Dipakai untuk menggambarkan keseluruhan data, khususnya bila data mempunyai ciri
khusus seperti antara beberapa data mempunyai kelipatan yang sama, sehingga perbandingan 2
data yang berurutan hampir tetap.
Rumus yang digunakan pada rata-rata ukur adalah :
Untuk data yang jumlahnya kecil :

G=

. X2 . X3 .. Xn

Untuk data yg besar dan tidak berkelompok :

G = antilog {(log x)/n}

Untuk data yg besar dan berkelompok :

G = antilog {(f.log x)/ f}

Agus
Statistika 1 - 19

Purnomo

3.6 HARMONIC MEAN (Rata-rata Harmonic)


Dipakai jika suatu kelompok datanya adalah bilangan pecahan atau desimal.
Untuk data yang tidak berkelompok :

RH = n/(1/ x)

Untuk data yg berkelompok :

RH = f/(f/ x)

3.7

QUARTILES, DECILES AND PERCENTILES

1. Quartiles is a measurement which divide a data set distribution into four same portions.
Below are the quartiles formulas :
Qi = i(n + 1)/4 ; dimana i = 1,2,3

Data tidak berkelompok :

Untuk data yang dikelompokkan dalam tabel distribusi frekuensi, quartil dihitung dengan
memakai rumus :

Qi

= L0 + c

in/4 - F
f

Di mana :
Qi = Quartil ke i
L0 = Batas bawah kelas quartil
c
= Lebar Kelas (interval)
in/4 = quartil dari data yang dikelompokkan
F
= jumlah frekuensi semua kelas sebelum
kelas yang mengandung quartil
f
= frekuensi kelas Quartil Qi

Problem :
1. Find the quartil Q1 , Q2 , Q3 of a data set of 13 workers who have monthly income, as
follow : 40, 30, 50, 65, 45, 55, 70, 60, 80, 35, 85, 95, 100
Solutions :
Arrange the data in ascending order as follow:
30, 35, 40, 45, 50, 55, 60, 65, 75, 80, 85, 95, 100
Use the formula Qi = i(n + 1)/4 to solve the problem :
Q1 = 1(13 + 1)/4 = 14/4 = 3 nilai ke-3
= antara nilai ke-3 dan nilai ke-4
= nilai ke 3 + (nilai ke-4 nilai ke-3)
= 40 + (45 40) = 42,5
Q2 = 2(13 + 1)/4 = 28/4 = 7 nilai ke-7 = 60
Q3 = 3(13 + 1)/4 = 42/4 = 10 nilai ke-10
= nilai ke-10 + (nilai ke-11 nilai ke-10)
= 80 + (85 80) = 82,5
2. Find the quartil Q1 , Q2 , Q3 of a data set as follow :
Modal
112 120
121 129
Agus
Statistika 1 - 20

X
116
125

frekuensi
4
5
Purnomo

130 138
139 147
148 156
157 165
166 174

134
143
152
161
170

8
12
5
4
2

Solution :
Determine class interval Q1 , Q2 , Q3 :
Q1 , is the point at or below which lie 25% and at or above which lie 75% of the data points
Q2 , is the point at or below which lie 50% and at or above which lie 50% of the data points
Q3 , is the point at or below which lie 75% and at or above which lie 25% of the data points
Because of n = 40, then Q1 lies at class 130 138; Q2 lies at class 139 147 and Q 3 lies at class
148 156.
Use the formula :
Qi

L0 + c

in/4 - F
f

For Q1 , L0 = 129,5 ; F = 4 + 5 = 9 and f = 8, then :


Q1 = 129,5 + 9 {(40/4 9)/8} = 130,63
For Q2 , L0 = 138,5 ; F = 4 + 5 + 8 = 17 and f = 12, then :
Q1 = 138,5 + 9 {(80/4 17)/12} = 140,75
For Q3 , L0 = 147,5 ; F = 4 + 5 + 8 + 12 = 29 and f = 5, then :
Q1 = 147,5 + 9 {(120/4 29)/5} = 149,3
2. Deciles : Jika sekelompok data dibagi menjadi 10 bagian yang sama banyak, maka akan
terdapat 9 pembagi yang masing-masing disebut nilai desil (D), yaitu D 1 , D2 , D3 , D9 .
Nilai desil ke I, yaitu Di ditentukan dengan rumus :
Untuk data tidak berkelompok :

Di = i(n + 1)/10 ; dimana i = 1,2,3..9

Untuk data berkelompok :

Di

= L0 + c

in/10 - F
f

Di mana :
= Desil ke i
Di
L0 = Batas bawah kelas desil
c
= Lebar Kelas (interval)
in/10 = desil dari data yang dikelompokkan
F
= jumlah frekuensi semua kelas sebelum
kelas yang mengandung desil
f
= frekuensi kelas desil Di

Contoh :
1. Tentukan desil D3 dan D7 dari data :
30, 35, 40, 45, 50, 55, 60, 65, 75, 80, 85, 95, 100
Jawab :
Data diurutkan sebagai berikut:
30, 35, 40, 45, 50, 55, 60, 65, 75, 80, 85, 95, 100
Gunakan rumus Di = i(n + 1)/10 :
D3 = 3(13 + 1)/10 = 42/10 = 4 1/5 nilai ke-4 1/5
= antara nilai ke-4 dan nilai ke-5
= nilai ke-4 + 1/5(nilai ke-5 nilai ke-4)
Agus
Statistika 1 - 21

Purnomo

=
D7 =
=
=

45 + 1/5(50 45) = 46
7(13 + 1)/10 = 42/4 = 98/10 nilai ke-9 8/10
nilai ke-9 + 8/10(nilai ke-10 nilai ke-9)
70 + 8/10(80 70) = 78

2. Tentukan desil D3 dan D7 dari data :


Modal
112 120
121 129
130 138
139 147
148 156
157 165
166 174

X
116
125
134
143
152
161
170

f
4
5
8
12
5
4
2

Tentukan dulu class interval D3 dan D7 :


D3 , membagi data 30% ke bawah dan 70% ke
atas
D7 , membagi data 30% ke atas dan 70% ke
Bawah
Karena n = 40, maka D3 terletak pada kelas
130 138; dan D7 terletak pada kelas 139
147. Gunakan rumus :

Di

= L0 + c

in/10 - F
f

For D3 , L0 = 129,5 ; F = 4 + 5 = 9 and f = 8, then :


D3 = 129,5 + 9 {(120/10 9)/8} = 132,88
For D3 , L0 = 129,5 ; F = 4 + 5 + 8= 17 and f = 12, then :
D7 = 129,5 + 9 {(280/10 17)/12} = 146,75
3. Percentiles : Jika sekelompok data dibagi menjadi 100 bagian yang sama banyak, maka akan
terdapat 99 pembagi yang masing-masing disebut persentil (P), yaitu : P1 , P2 , P3 , P99
Untuk data tidak berkelompok :
Untuk data berkelompok :
Pi

= L0 + c

in/100 - F

Pi = i(n + 1)/100 ; dimana i = 1,2,3..99

Di mana :
= Persentil ke i
Pi
L0 = Batas bawah kelas persentil
c
= Lebar Kelas (interval)
in/100 = persentil dari data yang dikelompokkan
F
= jumlah frekuensi semua kelas sebelum
kelas yang mengandung persentil
f
= frekuensi kelas Persentil Di

3.8 DATA DISPERSION (Dispersi Data)


Dispersi data menggambarkan bagaimana suatu kelompok data menyebar terhadap pusat
data.
Kelompok data 1 : 50, 50, 50, 50, 50 ; mempunyai X = 50
Kelompok data 2 : 30, 40, 50, 60, 70 ; mempunyai X = 50
Kelompok data 3 : 20, 30, 50, 70, 80 ; mempunyai X = 50
Ketiga kelompok data di atas mempunyai rata-rata hitung yang sama, yaitu 50, tetapi
penyebaran nilainya pada mading-masing kelompok berbeda. Pada kelompok 1 nilainya tidak
menyebar, karena semuanya sama, sedang pada kelompok 2 dan 3 menyebar terhadap pusat data,
yaitu 50, tapi kelompok 3 lebih menyebar daripada kelompok 2, karena kelompok 2 mempunyai
Agus
Statistika 1 - 22

Purnomo

nilai terkecil 30 dan terbesar 70, sedangkan kelompok 3 mempunyai nilai terkecil 20 dan terbesar
80.
Jenis-jenis ukuran dispersi data :
1. Jangkauan (Range)
2. Simpangan Rata-rata (Mean Deviation)
3. Variansi (Variance)
disebut dispersi mutlak
4. Standar Deviasi (Standard Deviation)
5. Simpangan Kuartil (Quartile Deviation)
6. Koefisien Variasi (Coeficient of Variation) disebut dispersi relatif
1. Jangkauan (Range) : selisih antara nilai maksimum dengan nilai minimum suatu
kelompok data. Dirumuskan :
Data tidak berkelompok :

Range (r) = nilai maks nilai min


Range (r) = nilai tengah maks nilai tengah min

Data berkelompok :

Makin kecil jangkauan suatu data, maka makin baik kualitas data itu; sebaliknya semakin
besar jangkauannya, maka semakin buruk kualitasnya.
2. Simpangan Rata-Rata (SR = Mean Deviation) : jumlah nilai mutlak dari selisih semua
nilai dengan nilai rata-rata dibagi jumlah data.
Data tidak berkelompok :

SR = X - X / n

Data berkelompok :
SR = f X - X / n ; di mana n = f

Contoh :
1. Tentukan simpangan rata-rata kelompok data: 20, 30, 50, 70, 80.
Jawab :
Rata-rata hitung = X = 50 dan n = 5, maka :
|20 50| + |30 50| + |50 50| + |70 50| + |80 50|
SR =
5
SR = (30 + 20 + 0 + 20 + 30)/5 = 100/5 = 20
2. Tentukan simpangan rata-rata data modal 40 perusahaan pada tabel berikut :
Modal
112 120
121 129
130 138
139 147
148 156
157 165
166 174

Agus
Statistika 1 - 23

frekuensi
4
5
8
12
5
4
2

Purnomo

Jawab :
Tentukan rata-rata hitungnya (X) = fX/f = 5.621/40 = 140,525
Kemudian, buat tabel penolong sbb :
Modal
112 120
121 129
130 138
139 147
148 156
157 165
166 174

X
116
125
134
143
152
161
170

frekuensi
4
5
8
12
5
4
2
40

|X - X|
24,525
15,525
6,525
2,475
11,475
20,475
29,475

f|X - X|
98,100
77,625
52.200
29,700
57,375
81,900
58,950
455,850

SR = f |X X|/f = 455,850/40 = 11,396


3. Variance is defined as the arithmetic mean of the squares of the deviations. Variance is
symbolized by S2 (for sample) and for population is 2 ( read tho). The formulas are :
data tidak berkelompok :

data berkelompok :

S2 = (X X )2 / (n 1)

S2 = f (X X )2 / (n 1) ; dimana f = n

Hasil perhitungan variansi akan menghasilkan dispersi data jauh lebih besar dibandingkan
dengan perhitungan simpangan rata-rata, sehingga variansi bukan merupakan ukuran dispersi
yang baik untuk menggambarkan penyebaran data. Kelemahannya adalah bahwa variansi
menggunakan bentuk kuadrat dalam perhitungannya, sedangkan dispersi data sesungguhnya
adalah merupakan ukuran linier. Kelebihannya variansi melibatkan selisih dari semua nilai data.
4. Standard Deviation : is the positive square root of the variance. Thus the variance and the
standard deviation are closely related. The symbol for the standard deviation of a population
is ; and for the standard deviation of a sample is S.
Rumusnya adalah :
data tidak berkelompok :
S = (X X )2 / (n 1)

data berkelompok :

Agus
Statistika 1 - 24

S =

f (X X )

/ (n 1) ; dimana f = n

Purnomo

Rumus untuk varians dan standar deviasi sering disajikan dalam bentuk lain
(yang ini sering dipakai) :
Data tidak berkelompok
Data berkelompok
Variansi

S2 = {nX2 ( X )2 } / n(n 1)

S2 = {nfX2 ( fX )2 } / n(n 1)]

Standar
Deviasi

S = {nX2 (X)2 } / n(n 1)

S = {nfX2 (fX)2 } / n(n 1)

Selain menggunakan cara tersebut di atas, maka perhitungan variansi dan standar deviasi
juga dapatdigunakan cara koding atau trasformasi dari variabel X ke variabel U, khususnya hal
ini digunakan untuk data yang disajikan dalam bentuk tabel distribusi frekuensi. Dengan cara ini,
maka nila data X yang besar akan berubah menjadi nilai data U yang kecil, yaitu U = 0 ; 1 ; 2
; 3 ; 4 ; dst sehingga akan mempermudah perhitungan dan hasil yang diperoleh juga akan
menjadi lebih teliti dan resiko salah hitung bisa diminimalisir. Rumusnya adalah :
Variansi :

Standar Deviasi :

S2 = c2 [{nfU2 ( fU )2 } / n(n 1)]

S = c [{nfU2 (fU)2 } / n(n 1)]

Dimana c = lebar kelas dan n = f


Contoh :
Tentukan variansi dan standar deviasi dari data modal 40 perusahaan pada tabel berikut :
Modal
frekuensi
112 120
4
121 129
5
130 138
8
139 147
12
148 156
5
157 165
4
166 174
2
Jawab :
Buatlah tabel penolong seperti berikut ini :
Modal
X
f
U
fU
FU2
112 120
116
4
-3
- 12
36
121 129
125
5
-2
- 10
20
130 138
134
8
-1
-8
8
139 147
143
12
0
0
0
148 156
152
5
1
5
5
157 165
161
4
2
8
16
166 174
170
2
3
6
18
40
- 11
103
Masukkan ke dalam rumus variansi (cara koding) :
S2 = c2 [{nfU2 ( fU )2 } / n(n 1)]
Agus
Statistika 1 - 25

Purnomo

= 92 [{40(103) (- 11)2 } / 40(39)]


= 81[{4120 121}/1560
= 81(3999)/1560
= 207,64
Sedangkan standar deviasinya adalah :
S = 207,64 = 14,41

5. Quartile Deviation and Pecentile Deviation are other method to describe data dispersion.
This method is better than range method.
Their formulas are :
Qd = (Q3 - Q1 )

Quartile Deviation :

Q1 = kuartil bawah atau kuartil pertama


Q3 = kuartil atas atau kuartil ketiga
Percentile Deviation :

Pd10-90 = P90 - P10

P10 = Persentil ke-10 dan P90 = Persentil ke-90


6. Coeficient of Variation is a measurement which be used to compare dispersion of two or
more of data sets. This method is categorized as a relative dispersion. The formula is :
CV = (S / X).100%

3.9 TENDENCY OF DATA DISTRIBUTION


Kemiringan distribusi data observasi tercermin saat kita membahas hubungan antara mean,
median dan modus (sebagai ukuran-ukuran nilai pusat). Bentuk-bentuknya terdiri atas 3
jenis, yaitu ;
Kurva Normal (Simetris) yang mempunyai kemiringan nol. Menunjukkan bahwa
Mean = Median = Modus
Kurva Miring Ke Kanan (Positive Skewed). Modus terletak dibawah puncak yang
menunjukkan bahwa Modus < Median < Mean. Nilai Modus adalah yang paling kecil
dan Nilai Mean adalah yang paling besar.
Kurva Miring Ke Kiri (Negative Skewed). Modus terletak dibawah puncak yang
menunjukkan bahwa Modus > Median > Mean. Nilai Modus adalah yang paling besar.
Ada 3 cara (rumus) perhitungan derajat kemiringan distribusi data, yaitu Rumus Pearson, Rumus
Momen dan Rumus Bowley. Kita hanya membahas rumus Pearson yang banyak digunakan.
Rumus Pearson :

= (X Mod) / S atau = 3(X Med) / S

= derajat kemiringan Pearson


Rumus ini dapat digunakan untuk data tidak berkelompok maupun data berkelompok.
Ukurannya adalah :
Jika = 0 atau mendekati nol, maka distribusi data simetri
Agus
Statistika 1 - 26

Purnomo

Jika < 0 atau negatif, distribusi data asimetri ke kiri


Jika > 0 atau positif, distribusi data asimetri ke kanan

Agus
Statistika 1 - 27

Purnomo

BAB IV
METODE ANALISIS KORELASI
4.1 Analisis Hubungan.
Manusia adalah makhluk sosial, artinya manusia tidak dapat hidup sendiri. Dia
memerlukan hubungan dengan yang lainnya, apakah itu di rumah (dengan tetangga), di kantor
(dengan rekan sekerja), di sekolah (dengan teman sekolah), dan lain sebagainya. Dalam
melakukan hubungan ini, ada berbagai maksud atau kepentingan, namun pada dasarnya adalah
untuk memenuhi kebutuhan sosialnya.
Dalam bidang bisnispun demikian adanya, adanya suatu kejadian pasti berhubungan
dengan kejadian lainnya. Kejadian A disebabkan oleh kejadian B. Misalnya turunnya harga beras
lokal disebabkan karena impor beras yang melimpah; menurunnya penjualan disebabkan karena
biaya promosi yang kurang, menurunnya penerimaan devisa mungkin disebabkan mutu komoditi
ekspor yang kurang baik; naiknya harga produk hasil bumi mungkin disebabkan kenaikan harga
bbm dan masih banyak lagi kejadian lainnya.
Those examples above describe that there is a relation or correlation between one
phenomenon and another. It might be declared by the fluctuation of variable value. For
example, if X is a variable of price then the fluctuation of price might be declared by the
fluctuation of X value. If Y is a variable of selling then the fluctuation of selling might be
declared by the fluctuation of Y value. It means those phenomena might be declared in 2
variables relation form. It called a correlation of variable. There are 2 kinds of correlation :
linier correlation and non-linier correlation. (Contoh-contoh kejadian di atas mencoba
menggambarkan bahwa ada suatu hubungan (korelasi) antara peristiwa atau gejala yang satu
dengan peristiwa atau gejala yang lainnya. Peristiwa itu dapat dinyatakan dengan perubahan nilai
variabel. Misalnya jika X adalah variabel harga, maka naik turunnya harga dapat dinyatakan
dengan perubahan nilai X. Jika Y adalah variabel hasil penjualan, maka naik turunnya hasil
penjualan dapat dinyatakan dengan perubahan nilai Y. Artinya hubungan dua kejadian atau
peristiwa dapat dinyatakan dalam bentuk hubungan dua variabel. Jenis hubungan variabel ini
terdiri dari hubungan linier dan hubungan non-linier).
Dalam perencanaan bisnis, selain data masa lampau dan masa sekarang, juga dibutuhkan
data hasil peramalan yang menggambarkan kemampuan untuk masa yang akan datang. Misalnya
perencanaan impor beras, pemerintah memerlukan ramalan produksi beras lokal. Suatu
perusahaan dalam merencanakan produksi memerlukan ramalan hasil penjualan (kemampuan
menjual di masa mendatang). Hal ini dimaksudkan untuk mencegah terjadinya over produksi
atau under produksi.
If variable of X and Y have a correlation then the value of X variable might be used
to forecast or to estimate Y variable. In fact, the forecasting is an appraisal about the occur
of a case (value of a variable) in the future, such as production forecasting for 2 years later,
price forecasting for next month, the forcasting of citizen rate for 10 years later, etc. Jika
variabel X dan Y mempunyai hubungan , maka nilai variabel X yang sudah diketahui dapat
dipergunakan untuk menaksir atau meramalkan Y. Ramalan pada dasarnya merupakan
perkiraan/taksiran mengenai terjadinya suatu kejadian (nilai suatu variabel) untuk waktu yang
akan datang, seperti misalnya ramalan produksi 2 tahun yang akan datang, ramalan harga bulan
depan, ramalan jumlah penduduk 10 tahun ke depan dan lain sebagainya.
Variabel Y yang nilainya akan diramalkan itu disebut sebagai variabel terikat (dependent
variable) sedangkan variabel X yang nilainya digunakan untuk meramalkan nilai Y disebut
variabel bebas (independent variable) atau variabel peramal (predictor variable). Jadi analisis
korelasi memungkinkan kita untuk mengetahui terjadinya kejadian secara kualitatif ( akan terjadi
perang, akan turun hujan, akan lulus ujian, dan lain-lain) serta secara kuantitatif ( indeks harga
sembako naik 7%, penerimaan devisa turun 16%, penjualan naik 23%, dan lainnya). Cara
Agus
Statistika 1 - 28

Purnomo

meramalkan ini digunakan metode analisis regresi). Jadi jika analisis korelasi digunakan untuk
melihat adanya hubungan antara dua atau lebih kejadian, maka analisis regresi digunakan untuk
melihat signifikansi antara dua kejadian dengan peramalannya tersebut.
4.2 Diagram Pencar (Scatter Diagram).
Hubungan antara 2 variabel ada yang positif dan ada yang negatif serta tidak mempunyai
hubungan sama sekali atau kecil sekali. Hubungan X dan Y disebut positif, jika kenaikan atau
penurunan X juga diikuti oleh kenaikan atau penurunan Y. dan dikatakan mempunyai hubungan
negatif, jika jika kenaikan atau penurunan X akan diikuti oleh penurunan atau kenaikan Y.
Sedangkan jika kenaikan atau penurunan tidak diikuti oleh kenaikan dan atau penurunan Y, maka
dikatakan X dan Y tidak berkorelasi.
Untuk menganalisis hubungan tersebut digunakan alat yang disebut diagram pencar (scatter
diagram), yaitu suatu diagram yang menunjukkan ada atau tidaknya korelasi antara vriabel X dan
Y. Diagram pencar menggunakan sistem koordinat kartesius, di mana sumbu x diletakkan nilanilai variabel bebas (X) dan pada sumbu Y diletakkan nilai variabel terikat (Y). Kemudian pada
diagram tersebut ditarik sebuah garis yang membagi titik-titik koordinat, sehingga dari garis
tersebut dapat diketahui korelasi anatara kedua variabel. Tujuan menggunakan diagram pencar
adalah untuk mengetahui apakah titik-titik koordinat membentuk suatu pola tertentu.
Y
Y

KORELASI NEGATIF

KORELASI POSITIF
X

X
Y

KORELASI SEMPURNA

TIDAK ADA KORELASI

Explanations :

The diagram (left above) shows a trend line move form left below to
right above (increasing) through the middle of scatter dots so that X
and Y have a correlation (positive correlation). Grafik kiri atas menunjukkan
garis trend bergerak dari kiri bawah ke kanan atas (bergerak naik) melintasi tengah-tengah
diagram pencar sehignga X & Y mempunyai korelasi (korelasi positif).

The diagram (right above) shows a trend line move form left above
to right below (decreasing) through the middle of scatter dots so
that X and Y have a correlation (negative correlation). Grafik kanan atas
menunjukkan grs trend bergerak dari kiri atas ke kanan bawah (bergerak turun) melintasi
tengah-tengah diagram pencar sehingga X & Y mempunyai korelasi (korelasi negatif).

The diagram (left below) shows a trend line move parallely through
the middle of scatter dots so that Xs fluctuation does not affect to Y
value, so that X and Y have not a correlation. Grafik kiri bawah menunjukkan
garis trend bergerak sejajar sumbu X, sehingga variasi nilai X tidak berpengaruh terhadap
nilai Y, maka X dan Y tidak ada korelasi.

The diagram (right below) shows a trend line coincide perfectly to


the coordinate dot, so that X and Y have a correlation (perfect
correlation). Diagram kanan bawah menunjukkan garis trend tepat bersentuhan dengan
tititk koordinatnya, sehingga X & Y mempunyai korelasi sempurna.

Agus
Statistika 1 - 29

Purnomo

Contoh korelasi positif dan negatif :


Jenis korelasi
Variabel X
Biaya promosi
Pendapatan
Gaji/upah
Positif
Investasi Nasional
Pupuk
Berat Badan
Pendapatan masyarakat
Negatif
Jumlah akseptor
Harga barang

Variabel Y
Penjualan
Konsumsi
Harga makanan
Pendapatan Nasional
Produksi Beras
Tekanan darah
Kejahatan ekonomi
Jumlah kelahiran
Permintaan barang

C. Koefisien Korelasi.
Kuat dan tidaknya hubungan antara X dan Y, jika hubungan X dan Y dapat dinyatakan
dengan fungsi linier (paling tidak mendekati), diukur dengan suatu nilai yang disebut Koefisien
Korelasi. Nilai koefisien korelasi ini berkisar dari 1 hingga +1. Jika r (simbol koefisien
korelasi). Secara matematis ditulis - 1 r 1; di mana :
r = -1 , artinya : kedua kejadian (variabel X dan Y) mempunyai hubungan negatif
r = +1, artinya : kedua kejadian (variabel X dan Y) mempunyai hubungan positif
r = 0 , artinya : kedua kejadian (variabel X dan Y) tidak ada hubungan.
Interpretasi dari nilai r dapat disajikan dalam tabel berikut :
r
0
(0,01 0,20)
(0,21 0,40)
(0,41 0,60)
(0,61 0,80)
(0,81 0,99)
1

Interpretasi Korelasi
Tidak ada korelasi
Sangat rendah/sangat lemah
Rendah/lemah
Agak Rendah/agak lemah
Cukup
Tinggi/kuat
Sangat tinggi/sangat kuat/sempurna

X affect Ys value with condition if the fluctuation of X will change value of Y. It


means the fluctuations of X will affect the up and down of Y too. So that Y value will
fluctuate to average of Y and linier line that represent scatter diagram. X dikatakan
mempengaruhi nilai Y, jika berubahnya nilai X akan menyebabkan perubahan nilai Y, artinya
naik turunnya X akan membuat nilai Y naik turun juga. Dengan demikian nilai Y ini akan
bervariasi, baik terhadap rata-rata Y maupun terhadap garis linier yang mewakili diagram pencar.
Namun harus diperhatikan juga bahwa variasi nilai Y ini pada kenyataannya tidak hanya
disebabkan oleh naik turunnya X saja. Misalnya jika Y adalah penjualan dan X biaya promosi,
maka naik turunnya penjualan tentu saja tidak saja dipengaruhi oleh naik turunnya biaya promosi
saja. Ada faktor-faktor lain yang ikut berpengaruh seperti daya beli konsumen, harga produk,
selera dan lain-lain. Dengan demikian maka untuk melihat seberapa besar kontribusi X saja
terhadap Y, maka dihitunglah apa yang disebut sebagai Koefisien Determinan (simbolnya D)
yang merupakan kuadrat dari koefisien korelasi (dalam satuan persen) atau : D = r 2 % . Misalkan
koefisien korelasi (r) adalah 0,8, maka D = (0,8) 2 = 0,64 = 64%. Hal ini berarti besarnya
kontribusi variabel X terhadap naik turunnya Y adalah sebesar 64%, sedangkan yang disebabkan
faktor lainnya adalah sebesar 36%.
Agus
Statistika 1 - 30

Purnomo

Jenis-jenis teknik korelasi adalah :


1. Korelasi Produk Momen Pearson (r);
2. Korelasi Rank Spearman ()
3. Korelasi Rank Kendall ()
4. Korelasi Biserial (rbis)
5. Korelasi Biserial Widespread (rwbs)
6. Korelasi Point Biserial (rpbis)
7. Korelasi Tentrachrois (Ss)
8. Korelasi Phi ()
9. Korelasi Kontigensi ()
10. Korelasi Rasio otomatis ()
Kita akan membahas 3 jenis korelasi yang banyak digunakan saja, yaitu Korelasi Pearson,
Spearman dan Kendall.
1. Korelasi Produk Momen Pearson
Koefisien korelasi Pearson adalah indeks atau angka yang digunakan untuk mengukur
hubungan antara dua variabel yang datanya berbentuk data interval atau rasio. Untuk menghitung
koefisien korelasi (r) digunakan rumus :
r =

xy
x2 y2

atau

r =

di mana :
x = X - X dan y = Y - Y

n XY X Y

{nX2 (X)2} {nY2 (Y)2}

Rumus pertama di atas disebut Koefisien korelasi Pearson metode Product Moment sedangkan
rumus kedua Koefisien korelasi Pearson metode least square.
Contoh pemakaian rumus koefisien korelasi Pearson:
Diketahui X adalah biaya promosi dan Y adalah tingkat penjualan, maka dari tabel berikut ini
hitunglah koefisien korelasinya dan koefisien determinannya serta simpulkan dari perhitungan
tersebut !.
X
Y

1
2

2
4

4
5

5
7

Penyelesaian : Buatlah tabel penolong dengan


rumus pertama (metode produk momen) :
XX
YY
X
Y
(x)
(y)
1
2
-5,25
-5,75
2
4
-4,25
-3,75
4
5
-2,25
-2,75
5
7
-1,25
-0,75
7
8
0,75
0,25
9
10
2,75
2,25
10
12
3,75
4,25
Agus
Statistika 1 - 31

7
8

9
10

10
12

12
14

kolom-kolom yang sesuai dengan kebutuhan


x2
27,5625
18,0625
5,0625
1,5625
0,5625
7,5625
14,0625

y2
33,0625
14,0625
7,5625
0,5625
0,0625
5,0625
18,0625

xy
30,1875
15,9375
6,1875
0,9375
0,1875
6,1875
15,9375
Purnomo

12
50
6,25

Mean

14
62
7,75

xy

r =

5,75

6,25

111,5
=

x2 y2

33,0625
107,5

39,0625
117,5

35,9375
111,5

111,5
=

107,5 . 117,5

= 0,99
(10,368) (10,840)

Koefisien determinan = D = r2 = (0,99)2 = 0,9801 = 98%


Karena r = 0.99, maka korelasinya kuat, artinya bahwa kenaikan biaya promosi akan
meningkatkan penjualan. Sedangkan koefisien determinan 98%, artinya bahwa biaya promosi
mempengaruhi penjualan sebesar 98%, sedangkan 2% nya lagi dipengaruhi faktor lainnya.
Dengan menggunakan rumus kedua (metode least square), maka buatlah tabel pembantu
untuk memudahkan perhitungan.
X
1
2
4
5
7
9
10
12
50

r =

Y
2
4
5
7
8
10
12
14
62

X2
1
4
16
25
49
81
100
144
420

n XY X Y

{nX2 (X)2}

{nY2 (Y)2}

Y2
4
16
25
49
64
100
144
196
598

XY
2
8
20
35
56
90
120
168
499
8 (499) (50) (62)

{8 (420) (50)2}

{8(598) (62)2}

= 0,99

Kedua rumus memberikan hasil yang sama, namun secara teknis, metode least square lebih
mudah digunakan dibandingkan dengan metode produk momen.
2. Korelasi Rank Spearman
Koefisien korelasi rank Spearman adalah indeks atau angka yang digunakan untuk mengukur
keeratan antara 2 variabel, di mana datanya merupakan data ordinal (data bertingkat/ranking).
Simbolnya adalah (baca rho) dan rumusnya adalah :
6 d2
=

n (n2 1)
di mana :
= koefisien korelasi Spearman
d = selisih dalam ranking
n = banyaknya pasangan ranking

Agus
Statistika 1 - 32

Cara perhitungan :
Nilai dari kedua variabel diranking, dari besar ke
kecil atau sebaliknya, jika ada nilai sama maka
rankingnya diambil rata-rata.
Setiap pasang ranking dihitung selisihnya.
Selisih ranking tersebut dikuadratkan kemudian
dijumlahkan.

Purnomo

Contoh : Diketahui nilai matakuliah Manajemen dan Bisnis dari 10 mahasiswa seperti tabel di
bawah ini
Manajemen
Bisnis

82
79

75
80

85
89

70
65

77
67

60
62

63
61

66
68

80
81

89
84

Hitunglah koefisien korelasi rank Spearman dan simpulkan artinya !.


Penyelesaian :
Kita misalkan nilai manajemen adalah X dan nilai Bisnis adalah Y, maka buatlah tabel berikut ini
:
X
82
75
85

Y
79
80
89

70
77
60
63
66
80
89

65
67
62
61
68
81
84

Ranking X
8
5
9

Ranking Y
6
7
10

d
2
-2
-1

d2
4
4
1

3
4
2
1
5
8
9

1
2
-1
1
-2
-1
1

1
4
1
1
4
1
1
22

4
6
1
2
3
7
10
Jumlah
Masukkan dalam rumus Spearman :
6 d2
= 1

6 (22)
=1

n (n2 1)

= 0,867
10 (102 1)

Korelasinya adalah korelasi positif dan kuat, berarti jika nilai manajemen tinggi maka nilai bisnis
juga tinggi.
3. Korelasi Rank Kendall
Korelasi Rank Kendall merupakan pengembangan dari koefisien Spearman. Simbolnya
adalah (baca tau). Koefisien ini digunakan untuk pasangan variabel atau pasangan data X dan
Y dalam hal ketidaksesuaian rank, yaitu untuk mengukur ketidakteraturan. Rumusnya adalah :

=
di

S
C
D
N

CD

=
1/2N (N 1)
1/2N (N 1)
mana :
= koefisien korelasi Kendall
= Jumlah Konkordansi dan Diskordansi
= konkordansi
= Diskordansi
= banyaknya pasangan X dan Y

Agus
Statistika 1 - 33

Cara perhitungan :
Nilai dari kedua variabel diranking, dari besar ke
kecil atau sebaliknya, jika ada nilai sama maka
rankingnya diambil rata-rata.
Tentukan nilai patokan berurut dengan menyusun salah satu dari nilai ranking tsb secara berurutan, dari pertama, kedua dan seterusnya.
Tentukan nilai konkordansi (+1) dan nilai diskordansi (-1) dari nilai ranking yang bukan patokan.
Purnomo
Tentukan nilai S dengan menjumlahkan
nilainilai konrkordansi dan diskordansi

N(N 1) - Tx

Jika di antara nilai-

N(N 1) - Uy

Tx = jumlah tied pada kelompok X = peringkat sama untuk data X


Uy = jumlah tied pada kelompok Y = peringkat sama untuk data Y
Tx = tx (tx 1) ; Uy = uy (uy 1)

nilai yang di-amati


terdapat nilai yang
sama, maka dipakai

Contoh : Tabel berikut ini adalah nilai statistika dan matematika dari 5 orang mahasiswa
poltekpos setelah mengikuti UTS
Nama Mahasiswa
Matakuliah
Ali (A)
Badu (B)
Cipluk (C)
Dudi (D)
Edi (E)
Matematika
9
8
7
5
3
Statistika
6
8
5
7
4
Tentukan nilai koefisien korelasi rank Kendall dan simpulkan artinya !.
Penyelesaian :
a. Susunlah ulang tabel dengan cara memberi ranking
Nama Mahasiswa
Matakuliah
Ali (A)
Badu (B) Cipluk (C)
Dudi (D)
Edi (E)
Matematika
9
8
7
5
3
Rank
1
2
3
4
5
Matematika
Statistika
6
8
5
7
4
Rank Statistika
3
1
4
2
5
b. Tentukan patokan berurut, yaitu Matematika.
c. Untuk menentukan nilai konkordansi dan diskordansi hanya dilihat satu mata kuliah saja.
Karena nilai patokan berurut sudah ditentukan yaitu nilai matematika, maka nilai
konkordansi dan diskordansi dihitung dari nilai statistika.
Dilihat dari
A
d/k
B
d/k
C
d/k
D
d/k

(A ; B)
-1
(B ; C)
+1
(C ; D)
-1
(D ; E)
+1

Kombinasi pasangan
(A ; C)
(A ; D)
+1
-1
(B ; D)
(B ; E)
+1
+1
(C ; E)
+1
-

(A ; E)
+1
-

Catatan :
(A ; B) = -1 diskordansi (nilai B < A)
(A ; C) = +1 konkordansi (nilai C > A)
Agus
Statistika 1 - 34

Purnomo

d. Jumlahkan nilai konkordansi dan diskordansi, maka akan didapat nilai S :


-1 +1 1 +1 +1 +1 +1 1 +1 +1 = = +4
e. Nilai koefisien Kendall :
= S / N(N 1) = 4 / 5(5 1) = 0,4
f. Artinya korelasinya positif tapi tidak cukup kuat berpengaruh.
Exercises :
1. Jika variabel X adalah prosentase kenaikan harga dan variabel Y adalah prosentase kenaikan
penjualan, maka hitunglah korelasi Pearson dengan metode produk momen dan least square
serta koefisien determinan untuk data di bawah ini :
X
Y

2
15

4
14

5
12

6
10

8
9

10
8

11
6

13
4

14
3

15
2

2. Dari hasil penilaian terhadap 10 distributor produk unilever untuk wilayah jawa diduga
bahwa hasil pelatihan manajemen distribusi terhadap para distributor tersebut berpengaruh
terhadap hasil penjualan produk-produk unilever. Misalkan X adalah nilai para distributor
setelah mengikuti pelatihan dan Y adalah hasil penjualan produk tahun pertama setelah
pelatihan, maka buktikan bahwa pelatihan tsb berpengaruh terhadap kinerja penjualan para
distributor tersebut dengan menggunakan data pada tabel di berikut ini !. (Gunakan Metode
Spearman).

Distributor
CV. Lima Jaya
UD. Patra
UD. Kinerja
CV. Prima
CV. Hexama
PT. Adi Putra
CV. Andika Jaya
PT. Tiga Pilar
UD. Untung Jaya
PT. Sampurna

Nilai Pelatihan
48
32
40
34
30
50
26
50
22
43

Kinerja Penjualan
(ratusan juta rupiah)
312
164
280
196
200
288
146
361
149
252

3. Tabel di bawah ini menunjukkan perbandingan indeks harga (X) dengan hasil penjualan (Y)
selama 7 tahun :
Indeks Harga
74,3
82,8
90,4
108,7
119,5
135,0
150,5

Hasil Penjualan
81,2
75,5
59,6
48,8
37,5
25,0
15,5

Hitunglah :
Agus
Statistika 1 - 35

Purnomo

a. Koefisien korelasi Kendall dan Spearman kemudian bandingkan hasilnya !.


b. Koefisien determinannya !
c. Bagaimanakah kesimpulannya ?.

BAB V
ANALISIS REGRESI LINIER
Regresi merupakan alat ukur yang digunakan untuk mengukur hubungan fungsional antara dua
kejadian atau dalam bahasa matematis adalah untuk merepresentasikan bagaimana hubungan
fungsional antara variabel yang berhubungan dalam suatu bentuk persamaan matematis.
Istilah regresi berari ramalan, perkiraan atau taksiran. Regresi pertama kali diintrodusir oleh Sir
Francis Galton pada tahun 1877, dimana berhubungan dengan penelitian tentang tinggi manusia
(yaitu hubungan antara tinggi anak dengan tinggi orang tua). Galton menemukan dalam
penelitiannya, bahwa anak yang tinggi dari orang tua yang tinggi cenderung meningkat atau
menurun dari berat rata-rata populasi. Garis yang menunjukkan hubungan itu, atau juga seperti
garis lurus yang terdapat pada diagram pencar (scatter diagram) dikenal dengan garis regresi.
Regression Analysis lebih akurat dalam melakukan correlation analysis karena pada analisa itu,
kesulitan dalam menunjukkan slope/kemiringan (tingkat perubahan suatu variabel terhadap
variabel lainnya dapat ditentukan). Lebih jelasnya, bahwa peramalan atau perkiraan nilai variabel
terikat (dependent variable) pada nilai variabel bebas (independent Variable) dengan
menggunakan regression analysis akan lebih akurat.
Regresi linear adalah regresi yang independent variable (variabel x) berpangkat paling tinggi
satu. Untuk simple regression linear, persamaan garis regresinya dapat ditulis dalam dua bentuk,
yaitu sebagai berikut.
5.1 Persamaan Regresi Linear dari Y terhadap X
Persamaan regresi linear dari y terhadap x dapat ditulis

Y= a + bX
Keterangan :
Y = variabel terikat
X = variabel bebas
a = intersep
b = koefisien regresi (slope)
Persamaan regresi di atas dapat pula ditulis dalam bentuk

Y = ( xy / x2) x
Persamaan-persamaan garis regresi linear tersebut adalah identik jika semua titik pada diagram
pencarnya berada pada sebuah garis. Artinya terdapat korelasi yang sempurna antara X dan Y.
Sekali lagi diingat, bahwa persamaan yang digunakan untuk mendapatkan garis regresi pada data
Agus
Statistika 1 - 36

Purnomo

diagram pencar (scatter diagram) disebut persamaan regresi, persamaan perkiraan atau
persamaan ramalan.
Persamaan garis regresi haruslah dapat dinyatakan oleh suatu persamaan yang dapat mewakili
sebaran data yang ada. Berarti dalam hal ini diperlukan suatu kriteria bahwa persamaan regresi
yang paling baik adalah regresi yang mempunyai total kuadrat selisih atau atau total kuadrat eror
(Y ) yang paling minimum. Karenanya, metode kuadrat terkecil (method of least
squares) sekali lagi akan digunakan untuk menempatkan garis pada data yang diamati, sehingga
bentuk persamaan regresi adalah :
= a + b X.
Keterangan :
a = Y pintasan, (nilai bila X= 0)
b = kemiringan garis regresi (kenaikan atau penurunan untuk setiap perubahan X) atau
koefisien regresi yang mengukur besarnya pengaruh X terhadap Y kalau X naik satu
unit.
X = nilai tertentu dari variabel bebas
= Nilai yang diukur/dihitung pada variabel tidak bebas
Dengan metode kuadrat terkecil ini, maka persamaan regresi linier akan mempunyai total
kuadrat eror minimum jika koefisien regresi a dan b dihitung dengn rumus :
a = (Y.X2 X. XY) / n. X2 (X)2
b = (n. XY X. Y) / n. X2 (X)2

b = (n. XY X. Y) / n. X2 (X)2

atau

a = (Y/n) b(X/n )

5.2 Kesalahan baku dari penaksiran = a + b X


Kesalahan baku penaksiran atau selisih taksir standar adalah angka indeks yang digunakan
untuk mengukur ketepatan suatu penduga atau mengukur jumlah variasi titik-titik obsevasi
diskitar garis regresi.
Jika semua titik observasi berada tepat pada garis regresi, maka selisih taksir standar
sama dengan nol. Dengan demikian selisih taksir standar secara langsung menunjukkan tingkat
pencaran data. Selisih taksir standar berguna untuk mengetahui batasan seberapa jauh melesetnya
perkiraan dalam meramal data.
Rumus yang digunakan untuk mencari atau menentukan selisih taksir standar adalah :
S.x = (Y )2 / n

atau

S.x = (2 aY bXY) / n

Contoh :
Tabel berikut ini menunjukkan tinggi badanb (inch) dan berat badan (lb) dari 12 mahasiswa
Tinggi

badan

(X)
70 63 72 60
Berat badan (Y) 155 150 180 135

66 70
156 168

74 65
178 160

62 67 65
132 145 139

68
152

Tentukan dan hitunglah :


a. Tentukan persamaan regresi data tersebut !
b. Hitunglah kesalah baku penaksiran !
Agus
Statistika 1 - 37

Purnomo

Penyelesaian :
Buat tabel perhitungan sebagai berikut :
X
Y
X2
Y2
70
155
4,900
24,025
63
150
3,969
22,500
72
180
5,184
32,400
60
135
3,600
18,225
66
156
4,356
24,336
70
168
4,900
28,224
74
178
5,476
31,684
65
160
4,225
25,600
62
132
3,844
17,424
67
145
4,489
21,025
65
139
4,225
19,321
68
152
4,624
23,104
= 802 = 1,850 = 53,792 = 287,868

XY
10,850
9,450
12,960
8,100
10,296
11,760
13,172
10,400
8,184
9,715
9,035
10,336
= 124,258

Coba Anda Masukkan angka-angka tsb ke dalam rumus-rumus yang ada sehingga didapat harga
a dan b !

Agus
Statistika 1 - 38

Purnomo

B A B VI
PR O B AB I LI TY ( PE LUAN G )
6.1 RUANG SAMPEL (SAMPLE SPACE)
Statistikawan biasanya berurusan dengan cacah atau pengukuran yang berbentuk bilangan.
Bilangan seperti itu biasanya disebut suatu pengamatan (observation).
Definisi :
Informasi yang dicatat dan dikumpulkan dalam bentuk aslinya, baik dalam bentuk hitungan
maupun pengukuran, disebut data mentah.
Dalam statistika digunakan istilah percobaan (experiment) untuk menyatakan tiap proses yang
menghasilkan data mentah. Suatu contoh yang sederhana dari suatu percobaan dalam statistika
berupa lantunan suatu mata uang logam. Dalam percobaan ini hanya ada dua data yang mungkin,
muka (head) atau belakang (tail).
Definisi :
Gugus semua hasil yang mungkin dari suatu percobaan statistika disebut Ruang Sampel
(Sample Space) dan dinyatakan dengan lambang S.
Tiap hasil dalam ruang sampel disebut unsur (elemen) atau anggota ruang sampel tersebut atau
dengan singkat disebut titik sampel (sample point). Bila ruang sample mempunyai unsur yang
hingga banyaknya (finite number), maka anggotanya dapat didaftar dengan menuliskan diantara
dua akolade, masing-masing unsur dipisah oleh koma.
Contoh 1:
Perhatikan suatu percobaan melantunkan sebuah dadu. Bila yang diselidiki ialah nomor yang
muncul di muka sebelah atas, maka ruang sampelnya :
S1 = {1,2,3,4,5,6}
Bila yang ingin diselidiki, apakah nomor genap atau ganjil yang muncul, maka ruang
sampelnya :
S2 = {ganjil,genap}
Contoh 2:
Ruang sampel yang besar atau yang anggotanya takhingga (infinite) banyaknya lebih mudah
ditulis dengan suatu pernyataan atau aturan. Misalnya S menyatakan kumpulan semua titik (x,y)
pada batas atau bagian dalam suatu lingkaran berjari-jari 2, dengan pusat di titik asal, maka dapat
ditulis :
S = { (x,y) | x2 + y2 4}
Garis tegak dibaca bila dan jika.
6.2 KEJADIAN (EVENT)
Dalam tiap percobaan mungkin yang ingin diketahui munculnya kejadian tertentu dan
bukan hasil unsur tertentu dalam ruang sampel.
Misalnya ingin diketahui kejadian A bahwa hasil lantuanan suatu dadu dapat dibagi 3, maka A =
{ 3,6} dari ruang sampel S1 contoh 1.
Definisi :
Kejadian (event) adalah himpunan bagian (subset) dari ruang sampel
Contoh 3 :
Agus
Statistika 1 - 39

Purnomo

Misalkan A = { t | t < 5 } himpunan bagian dari ruang sampel S = { t | t 0 }, t menyatakan umur


(dalam tahun) suatu komponen mesin tertentu dan A menyatakan kejadian bahwa komponen
akan rusak sebelum akhir tahun kelima.
Definisi :
Ruang nol atau ruang hampa ialah himpunan bagain ruang sampel yang tidak mengandung
unsur. Himpunan seperti ini dinyatakan dengan lambang
Contoh 4 :
Bila A = { x | x pembagi 7 yang bukan bilangan prima }, maka B = , karena pembagi 7 yang
mungkin hanya 1 dan 7 dan keduanya bilangan prima.
Hubungan antara kejadian dan ruang sampel padanannya dapat digambarkan dengan diagram
Venn. Dalam suatu diagram Venn, ruang sampel dapat digambarkan dengan empat persegi
panjang dan kejadian dinyatakan dengan lingkaran didalamnya.
6.3 OPERASI DENGAN KEJADIAN
Definisi :
Irisan dua kejadian A dan B dinyatakan dengan lambang A B, ialah kejadian yang
unsurnya termasuk dalam A dan B.

A B = { x | x A dan x B }
berarti anggota atau termasuk dalam.
Contoh 5 :
Misalkan A = {1,2,3,4,5} dan B= { 2,4,6,8 };
maka A B = {2,4}
Definisi :
Dua kejadian A dan B saling terpisah bila A B =
S

Contoh 6 :
Misalkan A = {a,e,i,o,u} dan B = {r,s,t} ;
maka A B = . Yaitu A dan B tidak mempunyai
unsur persekutuan.

Definisi :
Gabungan dua kejadian A dan B, dinyatakan dengan lambang A B, ialah kejadian yang
mengandung semua unsur yang termasuk A atau B atau keduanya.

Agus
Statistika 1 - 40

Purnomo

A B = { x | x A dan x B }

Contoh 7 :
A = { x | 3 < x < 9 } dan B = { y | 5 < y < 12 };
maka A B = { z | 3 < z < 12 }

Definisi :
Komplemen suatu kejadian A terhadap S, ialah himpunan semua unsur
termasuk A, dinyatakan dengan lambang A.
S

S yang tidak

A = { x | x S dan x A }

Contoh 8 :
Misalkan ruang sampel
S={buku,pulpen,pinsil, penggaris,penghapus,spidol} dan A=
{buku,pulpen}
Maka A = {pinsil,penggaris,penghapus,spidol}

6.4 MENGHITUNG TITIK SAMPEL


Salah satu masalah yang harus dihadapi dan dicoba diberi nilai oleh statistikawan ialah
unsur kemungkinan yang berkaitan dengan munculnya kejadian tertentu bila suatu percobaan
dilakukan.
Teorema :
Bila suatu operasi dapat dilakukan dengan n 1 cara, dan bila untuk tiap cara ini operasi kedua
dapat dikerjakan dengan n2 cara, maka kedua operasi itu dapat dikerjakan bersama-sama
dengan n1n2 cara.
Contoh 9 :
Berapa banyak titik sampel dalam ruang sampel bila sepasang dadu dilantunkan sekali ?
Jawab :
Dadu pertama dapat menghasilkan salah satu dari enam kemungkinan. Untuk tiap posisi tersebut
dadu kedua dapat pula menghasilkan enam kemungkinan. Sehingga pasangan dadu ini dapat
Agus
Statistika 1 - 41

Purnomo

menghasilkan (6) (6) = 36 kemungkinan.


Teorema :
Bila suatu operasi dapat dilakukan dengan n 1 cara, dan bila untuk tiap cara ini operasi kedua
dapat dikerjakan dengan n2 cara, dan untuk setiap kedua cara operasi tersebut operasi ketiga
dapat dikerjakan dengan n3 cara, dan seterusnya, maka deretan k operasi dapat dikerjakan
dengan n1n2..nk cara.
Contoh 10 :
Berapa macam hidangan dapat disajikan bila masing-masing hidangan dapat terdiri atas sop, nasi
goreng, bakmi, dan soto, bila tersedia 4 macam sop, 3 macam nasi goreng, 5 macam bakmi, dan
4 macam soto ?
Jawab :
Jumlah hidangan semuanya (4) (3) (5) (4) = 240
Definisi :
Suatu permutasi ialah suatu susunanyang dapat dibentuk dari suatu kumpulan benda yang
diambil sebagian atau seluruhnya
Teorema :
Banyaknya permutasi n benda yang berlainan adalah n!
n ! = n(n-1)(n-2).(3)(2)(1)
Contoh 11 :
Ambillah tiga huruf a, b, dan c. Permutasi yang dapat dibuat adalah abc, acb, bac, bca, cab dan
cba. Jadi tiga benda dapat disusun dengan 3 ! = (3)(2)(1) = 6 cara.
Teorema :
Banyaknya permutasi n benda yang berlainan bila diambil r sekaligus adalah
P =

n r

n!
( n r )!

Teorema :
Banyaknya permutasi yang berlainan dari n benda bila n1 diantaranya berjenis pertama, n2
berjenis kedua, ., nk berjenis ke k adalah :
n!
n 1 ! n 2 !........n k !

Teorema :
Banyaknya cara menyekat n benda dalam r sel, masing-masing bersisi n1 elemen dalam sel
pertama, n2 dalam sel kedua, dst. adalah :
(

n
n 1 , n 2 ,..., n 1

n!
n 1 ! n 2 !........n k !

Teorema :
Jumlah kombinasi dari n benda yang berlainan bila diambil sebanyak r adalah
n

(r )

n!
r! ( n r )!

6.5 PENGERTIAN TENTANG PROBABILITAS


Agus
Statistika 1 - 42

Purnomo

Teori probabilitas merupakan cabang ilmu matematika terapan (applied mathemattics) dan yang
menelaah perilaku faktor untung-untungan (chance factor). Faktor untung-untungan tersebut
umumnya dihubungkan dengan pengertian tentang peluang atau kemungkinan (probability or
likelihood). Sebab, jika hasilnya tidak pasti karena hasil tersebut merupakan akibat faktor
untung-untungan, maka kita hanya dapat menyatakan peluang atau tingkat kepastian (degree of
certainty) timbulnya suatu kejadian. Pcluang atau tingkat kepastian sedemikian itu tidak dapat
diduga dengan pasti tetapi dapat dianalisa atas dasar logika ilmiah.
Teori probabilitas sebetulnya memberikan cara pengukuran kuantitatif tentang peluang atau
tingkat kepastian tentang terjadinya suatu peristiwa. Pada hakekatnya, dasar perumusan tentang
probabilitas atau penentuan besaran yang dapat mengukur tingkat kepastian timbulnya suatu
peristiwa dapat dibedakan dalam 3 cara.
a. Perumusan Klasik
Probabilitas diinterprestasikan atas dasar pengertian tentang rangkaian peristiwa yang bersifat
saling lepas dan yang memiliki kesempatan yang sama untuk terwujud (mutually exclusive and
equally likely sets of events). Tetapi apakah patokan mengenai kesempatan yang sama (equally
likely) bagi timbulnya serangkaian kejadian? Dari Ars Conjectandi, dapat disimpulkan bahwa 2
kejadian yang mungkin timbul dianggap memiliki kesempatan yang sama untuk timbul jika
sesudah mempertimbangkan segala bukti yang relevan, timbulnya salah satu kejadian tersebut
tidak dapat lebih diharapkan dari pada yang lain.
Sebagai penjelasan yang sederhana, sebuah contoh tentang suatu percobaan pclemparan sebutir
dadu yang memiliki sisi enarn. Apakah kesempatan terwujudnya tiap mata X = 1, 2, ... , 6 itu
sama? Jika dadu tersebut setimbang (misalnya berbentuk kubus umum, bahannya serba sama
(homogen) dan sebagainya), maka atas dasar perumusan di atas, tiap mata dadu akan memiliki
kesempatan untuk timbul yang sama sebesar 1/6 dari hasil keseluruhan. Hal yang sama akan
berlaku bagi hasil pelemparan sekeping mata uang logam katakanlah 50 rupiah. Jika mata uang
logam tersebut setimbang, maka sisi 1 (Head) dan sisi 0 (Tail) mata uang yang bersangkutan
akan memiliki kesempatan untuk timbul yang sama sebesar 1/2.
Definisi :
Pada kondisi-kondisi yang diketahui, jika terdapat sejumlah n kejadian yang mungkin
timbul dan jika kejadian tersebut lengkap terbatas jumlahnya (exhaustive), saling lepas dan
memiliki kesempatan yang sama untuk timbul, maka jika sejumlah m dari kejadian di atas
merupakan peristiwa E, probabilitas peristiwa E tersebut dapat dirumuskan sebagai suatu
rasio m/n atau secara umum dinyatakan sebagai :
P(E) = m/n
Contoh 12 :
Dalam soal percobaan pclemparan sebutir dadu, kejadian yang mungkin timbul ialah mata dadu
X = 1, 2,..., 6. Jika E merupakan peristiwa munculnya mata dadu 3 dan karena mata dadu 3
mcrupakan satu dari ke enam kemungkinan kejadian, maka probabilita peristiwa menjadi P(E) =
m/n = 1/6.
b. Perumusan atas dasar konsep Frekuensi Relatif
Perumusan secara klasik memiliki beberapa keterbatasan, karena dalam kenyataan banyak
peristiwa atau kejadian sukar sekali diteliti apakah rangkaian peristiwa tersebut memiliki
kesempatan yang sama untuk timbul. Dalam hal demikian, perumusan probabilitas atas dasar
peristiwa frekuensi relatif akan lebih bermanfaat.
Definisi :
Jika m merupakan jumlah perwujudan kejadian yang khusus, katakanlah peristiwa E dalam
serangkaian n percobaan dalam jumlah yang tidak terhingga, maka probabilitas peristiwa E
Agus
Statistika 1 - 43

Purnomo

mcrupakan frekuensi relatif m/n dan dinyatakan sebagai :


P(E) = lim m/n
n
Contoh 13:
Misalnya, dilakukan suatu percobaan yang terdiri dari serangkai pelemparan sebutir dadu yang
bersisi enam sebanyak 1.000 kali. Andaikan dadu yang digunakan dalam percobaan tersebut
setimbang, maka hasilnya sbg. berikut :
Frekuensi timbulnya mata dadu X = 1, 2, ..., 6
dalam serangkaian percobaan n = 1000.
X
1
2
3
4
5
6
m
166
169
165
167
169
164
Frckuensi relatif kejadian X = 1, 2, ..., 6 ialah nilai-nilai m dibagi jumlah pelemparan sebanyak n
= 1000, sehingga hasilnya sebagai berikut :

X
m/n

Frekuensi relatif timbulnya mata dadu X = 1,2, ...6


dalam serangkaian percobaan n = 1 000.
1
2
3
4
5
166/1000
169/1000
165/1000
167/1000
169/1000

6
164/1000

Frekuensi relatif tiap X mungkin berbeda. Tetapi jelas sekali frekuensi f tiap X berkisar sekitar
1/6. Jika percobaan random di atas dilakukan berkali-kali dalam jumlah besar sekali, katakanlah
dalam jumlah tidak terhingga, maka m/n dari X akan memiliki tendensi untuk berkonvergensi ke
suatu nilai konstanta yang kita anggap sebagai probabilita E atau yaitu sebesar 1/6.
c. Perumusan atas dasar Subyektivitas
Tidak semua kejadian dapat timbul secara berulang-ulang seperti hasil serangkaian percobaan
atau pemilihan sampel. Ada kalanya suatu kejadian atau peristiwa hanya timbul sekali saja.
Misalnya, berapakah probabilitas menteri X diganti dengan Y ? Berapakah probabilitas manajer
perusahaan X mau kompromi dengan serikat pekerja perusahaannya yang menuntut kenaikan
gaji sebesar 20 persen dari gaji asal? Probabilita yang dirumuskan sebagai pengukuran
keyakinan pribadi terhadap suatu hipotesis yang tertentu atau terjadinya suatu peristiwa tertentu,
dinarnakan probabilita subyektif (subjective probability).
Misalnya, jika peristiwa A dan B terjadi dalam suatu kondisi yang sama jika kita dua kali lebih
yakin akan terjadinya peristiwa A jika dibanding dengan terjadinya peristiwa B, maka
probabilitas A atau p(A) seharusnya menjadi 2/3 dan p(B) menjadi sebesar 1/3.
Dari ketiga perumusan di atas, kita dapat menarik suatu kesan bahwa probabilitas dirumuskan
sebagai rasio atau proporsi.
6.6 AZAS-AZAS MENGHITUNG PROBABILITAS PERISTIWA
Definisi : Peristiwa yang saling lepas (mutually exclusive)
Dua peristiwa merupakan peristiwa yang saling lepas bila kedua peristiwa tersebut tidak dapat
terjadi pada waktu yang bersamaan. Secara matematis, himpunan A dan B dikatakan
saling lepas atau terpisah (disjoint) bila dan hanya bila mereka tidak memiliki unsur yang
sama dan A B =
A1

A2
A3

Agus
Statistika 1 - 44

P (A B) = P(A) + P(B)
AB=
Purnomo

A4
P(A B) = P() = 0
A5
Peristiwa yang saling lepas
Contoh 14 :
Bila sebutir dadu dilempar sekali, berapakan probabilitas timbulnya mata dadu 1 atau mata dadu
5?
A = peristiwa timbulnya mata dadu 1, B = peristiwa timbulnya mata dadu 5
P (A B) = P(A) + P(B) = 1/6 + 1/6 = 1/3
Teorema :
Bila terdapat beberapa peristiwa yang saling lepas A1, A2, , Am dalam sebuah ruang sampel,
maka :
P (A1A2 Am) = P (A1) + P(A2) + + P(Am)
Definisi :
Dua persitiwa dikatakan tidak saling lepas bila kedua peristiwa tersebut tidak terpisah (joint)

A B

Teorema :
Peristiwa A dan B merupakan gabungan (union)
dan tidak saling lepas, maka :
P (A B) = P(A) + P(B) P(A B)

Peristiwa Bukan Saling Lepas


Contoh 15 :
Probabilitas seorang mahasiswa lulus Statistik I 2/3 dan probabilitas lulus Statistik II 4/9. Bila
probabilitas lulus kedua mata kuliah 1/4 berapakah probabilitas lulus paling sedikit satu mata
kuliah ?
Bila A menyatakan kejadian lulus Statistik I & B lulus Statistik II, maka :
P (A B) = P(A) + P(B) P(A B) = 2/3 + 4/9 1/4 = 31/36

AB
AC ABC

P (A B C) = P(A) + P(B) + P(C)


P(A B) P(AC) P(BC) +
P(ABC)

B
BC

C
Peristiwa A, B dan C yang tidak Saling Lepas
P(ABCD) = P(A) + P(B) + P(C) + P(D) P(AB) P(AC) P(AD) P(BC)
P(BD) P(CD) + P(ABC) + P(ABD) + P(ACD) +
P(BCD) P(ABCD)
S=U
Agus
Statistika 1 - 45

Definisi : Partisi (Partition)


Purnomo

A1

A2

A5
A4

A3

Peristiwa Bukan Saling Lepas

Bila peristiwa yang saling lepas A1, A2, , Am


saling lepas dan lengkap terbatas (exhaustive)
sehingga lepas A1A2, Am = S, maka
sejumlah m peristiwa di atas akan membentuk
partisi ruang sampel S ke dalam m sub
himpunan.
P (A1) + P(A2) + + P(Am) = P(A1A2,
Am) = P(S) = 1

Soal-soal :
1. Tiga buah koin dilantunkan sekaligus, berapa probabilitas mendapatkan :
a. Dua H satu T?
b. Dua T satu H?
c. Tidak satupun T?
2. Kantong A berisi 5 bola Merah dan 4 bola Putih, sedangkan Kantong B berisi 6 bola Merah
dan 3 bola Hitam. Tanpa melihat 1 buah bola diambil secara random dari Kantong A,
kemudian dimasukkan ke Kantong B. Selanjutnya 1 buah bola diambil secara random dari
Kantong B. Hitunglah probabilitas :
a.
Di Kantong A mendapatkan bola Putih dan di Kantong B mendapatkan bola Hitam!
b.
Di kedua kantong mendapatkan bola yang berwarna sama!
3. Jika kita melemparkan dua buah dadu, ditanyakan :
a. Probabilitas jumlah angka yang dimunculkan oleh kedua buah dadu itu = 8 ?
b. Probabilitas jumlah angka yang dimunculkan, antara 7 dan 11 ?
c. Probabilitas angka yang dimunculkan oleh dadu yang kedua lebih besar dari dadu yang
pertama ?
d. Probabilitas sedikitnya sebuah dadu memunculkan angka = 6 ?
e. Probabilitas kedua dadu memunculkan angka 5 ?
f. Probabilitas setidaknya sebuah dadu memunculkan angka 5 ?
g. Probabilitas tidak sebuah dadupun memunculkan angka > 4 ?
h. Probabilitas kedua memunculkan angka genap ?
i. Probabilitas paling tidak sebuah dadu memunculkan angka ganjil ?
4. Dua orang A dan B berjanji akan bertemu di suatu tempat antara jam 07.00 08.00, dengan
ketentuan bahwa yang datang terlebih dahulu harus menunggu selama 10 menit. Berpa
probabilitas A dan B akan bertemu ?
5. C dan D berjanji ingin bertemu di suatu tempat dengan ketentuan yang datang terlebih
dahulu harus menunggu yang lainnya selama 10 menit. C memastikan bahwa dia akan berada
di tempat itu sekitar jam 13.00 14.00. D mengatakan akan berada disitu sekitar jam 13.30
14.00. Berpa probabilitas A dan B bakal bertemu ?
6. Tiap mahasiswa baru harus mengambil matakuliah fisika, kimia, dan matematika. Bila
seorang mahasiswa dapat memilih satu dari 6 kuliah fisika, satu dari 4 kuliah kimia, dan satu
dari 4 kuliah matematika, berapa banyak cara dia dapat menyusun programnya?
7. Suatu perusahaan perumahan menawarkan rumah dalam 4 pilihan model, 3 macam sistem
pendingin, dengan atau tanpa garasi, dan dengan atau tanpa beranda. Berapa macam pilihan
yang berbeda tersedia bagi seorang pembeli?
8. Dalam penelitian bahan bakar yang lebih murah, masing-masing dari ke 3 mobil balap diuji
menggunakan 5 jenis bensin yang berlainan pada 7 tempat percobaan di daerah yang
berlainan. Bila 2 pengemudi digunakan dalam penelitian tersebut, dan uji coba dikerjakan
sekali pada setiap persyaratan, berapa banyak uji coba yang diperlukan?
Agus
Statistika 1 - 46

Purnomo

9. Sembilan orang pergi ke gunung dengan tiga mobil, masing-masing dapat membawa 2, 4 dan
5 penumpang. Berapa carakah dapat dibuat untuk membawa kesembilan orang tersebut ke
gunung?
10. Suatu kotak berisi 500 amplop, 75 diantaranya berisi uang Rp 100, 150 berisi Rp 25, dan 275
berisi . Tuliskanlah Rp 10. Sebuah amplop dijual seharga Rp 25 ruang sampel untuk ketiga
macam jumlah uang dan berilah peluang pada tiap titik sampel, kemudian hitunglah peluang
bahwa amplop pertama berisi uang kurang dari Rp 100.
9. Suatu dadu dibuat sedemikian rupa schingga angka 1 atau 2 muncul dua kali lebih sering
daripada 5, angka 1 atau 2 yang muncul tigakali lebih sering daripada 3, 4, atau 6. Bila dadu
digulirkan sekali, cari peluang bahwa yang muncul :
a. angka genap;
b. angka yang merupakan kuadrat murni;
c. angka yang lebih besar dari 4.
10. Peluang suatu lndustri akan membangun pabriknya di Bekasi 0,7, peluang membangun
pabriknya di Bandung 0,4, dan peluang membangun di Bekasi atau di Bandung atau keduaduanya 0,8. Berapa peluang pabrik itu dibangun :
a. di kedua kota?
b. tidak di salah satupun dari keduanya?

Agus
Statistika 1 - 47

Purnomo

PROBABILITAS BERSYARAT
Probabilitas terjadinya suatu kejadian B bila diketahui bahwa kejadian A telah
terjadi disebut probabilitas bersyarat dan dinyatakan dengan P(B\A). Lambang
P(B\A) dibaca probabilitas B, bila A diketahui.
Perhatikan ilustrasi berikut ini :
S = 500
A
20

465

B
10 5

= 30

N(A)

P(A)

= 30/500

N(B)

= 15
P(B)
= 15/500 =
0,03
Nilai probabilitas tergantung dari sample space-nya

N ( AB)
P(B\A)

= 10
= 10\30

P ( AB )
=
1/3

= 10/500

0,06

0,02

20

D I
10

N(D I)
N(I)
N(D I) / N(S) P(D I)
P(D \ I)

P(I)
N(I) / N(S)
P(D \ I)

Agus
Statistika 1 - 48

Purnomo

Definisi :
Apabila A dan B sembarangan event di dalam S dan P(B) 0 , maka
probabilitas bersyarat A bila B diketahui (probabilitas bersyarat A terhadap
kondisi B):
P(A B)
P(A \ B)
P(B)
Teorema :

Apabila A dan B sembarangan events didalam S , maka :


P(AB) = P(A) . P(B\A) jika P(A) 0
= P(B) . P(A\B) jika P(B) 0

Teorema :

Apabila A dan B adalah event yang independent, maka :


P(AB) = P(A) . P(B)

2.8 THEOREMA BAYES


Sebuah pabrik assembling alat elektronik memperoleh travo dari 3
pemasok yang berbeda yaitu dari B 1= 60% , B2 = 30% B3 = 10% diketahui bahwa
95 % travo berasal dari B1, 80 % travo dari B2 dan 65 % travo dari B3, dapat
berfungsi dengan baik bila diambil sebuah travo yang berfungsi dengan baik ?
Misalnya : A = travo yang berfungsi baik.

0,95

0,80

0,65

0,60

0,30

0,10

Agus
Statistika 1 - 49

Purnomo

Travo yang berasal dari B1 pasti bukan dari B2 dan


B3, jadi mutually exclusive.

A B1
A A B3
A B2
B

=
A [B1 B2 B3]
=(A B1) (A B2) (A B3) dan :
P (A B1) + P (A B2) + P (A B3)
=
0,6 ;
P (B2)
=
0,3

P(A) =
P (B1)
;
P (B3)
=
0,10
P (A\B1)
=
0,95 ;
P (A\B2)
=
0,80 ;P (A\B3) =
0,65
A
= Travo yang tidak berfungsi dengan baik
P ( A \B1) =
0,05 ;
P ( A \B2) =
0,80 ;
P ( A \B3) =
0,35
P(A) =
P (A B1) + P (A B2) + P (A B3)
=
P (B1) . P (A\B1) + P (B2) . P (A\B2) + P (B3) . P (A\B3)
=
(0,60) . (0,95) + (0,30) . (0,80) + (0,10) . (0,05)
=
0,875
Teorema :

Apabila B , B , ..... , B adalah event-event yang bersifat


mutually exclusive dan salah satunya harus terjadi (Collectively
Exhausive) maka:

n
P(A) P(Bi) P(A \ Bi)
i 1

P(B

P(B

B1

P(A\B

) B2

P(A\B

Bn

P(A\Bn)

A
A

P(Bn
)

Berapa probabilitas sebuah travo yang berfungsi dengan baik berasal dari B3 ?
Agus
Statistika 1 - 50

Purnomo

P(A B) P(B3) P(A \ B3)


n
P(A)
P(Bi) P(A \ Bi)
i 1
(0,10) (0,65)

0,074
(0,60) (0,95) + (0,30) (0,80) + (0,10) (0,65)

P(B3 / A)

P(B2 / A)

P(A B2)
0,06

0,125
P(A)

Teorema :

Apabila B ,B , ..... , B adalah event-event mutualy exclusive


yang salah satunya harus terjadi maka berlaku:

P(Br) P(A \ Br)


P(Br \ A) n
P(Bi) P(A \ Bi)
i 1

r = 1, 2, ... , n

Joint Probability Table

B1
A

B2

AB1

B3

AB2

AB3

0,24
A B2

0,065
A B3

0,06

0,035

0,
57
A B1
03
0,60

0,

0,30

0,10

0,875

0,125
1,000

Contoh soal:
Berdasarkan data masa lalu seorang supervisor dari sebuah perusahaan elektronik
mengetahui bahwa program training pada saat diterjunkan dilapangan 82 %
diantaranya akan memenuhi target produksi, sedangkan para pegawai baru yang
tidak mengikuti program training pada saat diterjunkan dilapangan hanya 33 %
yang memenuhi target produksi jika 80% pegwaia baru mengikuti program
training maka:
a) Berapa probabilitas seorang pegawai baru pada saat diterjunkan dilapangan
Agus
Statistika 1 - 51

Purnomo

akan memenuhi target porduksi ?


b) Berapa probabilitas seorang pegawai baru pada saat diterjunkan dilapangan
akan dapat memenuhi target produksi & telah mengikuti program training ?
c) Berapa probabilitas bahwa seorang pegawai baru pada saat diterjunkan
dilapangan akan dapat memenuhi target produksi tetapi tidak mengikuti
program trainning ?
B1 = mengikuti program training
A
=
memenuhi
target produksi
B2 = tidak mengikuti program training
A = tidak memenuhi target produksi

0,1440
0,0660

0,1340

7
0,6

\
P(A

0
P(A ,33
\B

A
)

0,20
2

8
0,1

P(B

\
P(A

0,80
P(B

0,6560

0
P(A ,82
\B

B
)

a)
b)

P (A)
=
0,6560 + 0,0660 =
0,7220
P (AB1)
=
0,6560
c) P (AB2)
=
0,0660
Soal-soal :
1. Seorang pegawai mempunyai dua mobil, satu sedan & satu lagi Toyota Kijang.
Untuk pergi bekerja dia menggunakan sedan 75 % & Kijang 25 %. Bila dia
menggunakan sedan biasanya dia tiba kembali di rumah pukul 17.30 sebanyak
75 % (75 dari 100 kali) sedangkan bila menggunakan Kijang dia tiba pukul
17.30 kira-kira 60 %. Bila suatu hari dia tiba di rumah pukul 17.30, berapakah
probabilitas dia memakai sedan ?
2. Suatu serum kejujuran yang diberikan kepada tertuduh diketahui 90 %
terandalkan bila orang tersebut bersalah, dan 99 % terandalkan bila ia tidak
bersalah. Dengan kata lain, 10 % dari yang bersalah diketemukan tidak bersalah
oleh serum dan 1 % dari yang tidak bersalah ditemukan bersalah. Bila si
tertuduh dipilih dari sekelompok tertuduh yang hanya 5 % yang pernah
melakukan kejahatan dan serum menyatakan bahwa dia bersalah, berpakah
probabilitas orang itu tidak bersalah ?
3. Polisi merencanakan memantau batas kecepatan dengan menggunakan
perangkap radar di 4 tempat yang berlainan di suatu kota. Radar di setiap
tempat T1, T2, T3, & T4 di pasang 40 %, 30 %, 20 %, & 10 % dari waktu sehari,
bila seseorang yang ngebut ke kantor berpeluang masing-masing 0.2, 0.1, 0.5,
Agus
Statistika 1 - 52

Purnomo

dan 0.2 melalui tiap tempat, (a) berapa probabilitas dia akan kena tilang?
(b)berapa probabilitas dia melewati perangkap radar di tempat T2?
4. Dari suatu daerah diketahui berdasarkan pengalaman masa lalu bahwa
probabilitas memilih seorang dewasa di atas 40 tahun yang kena kanker 0.02.
Bila probabilitas seorang dokter dengan tepat mendiagnosa seseorang yang
kena kanker sebagai terserang kanker 0.78 dan probabilitas keliru mendiagnosa
seseorang yang tdk. kena kanker sebagai terserang kanker 0.06
(a) Berapa probabilitas seseorang didiagnosa sbg. terserang kanker ?
(b) Berapa probabilitas seseorang yang didiagnosa terserang kanker memang
kena kanker ?
EKSPEKTASI MATEMATIK VARIABEL RANDOM DISKRIT
Ekspektasi (harapan) dari suatu variabel random dilakukan untuk memperoleh
suatu pengukuran pusat dari distribusi probabilitas.
Definisi :
Nilai Ekspektasi, E(X), dari suatu variabel random X, didefenisikan :

E(X) x P x( x )
x

Nilai Ekspektasi dari suatu variabel random disebut juga mean,


Contoh 1 :
Hasil pemeriksaan halaman suatu textbooks ditemukan 81 % dari seluruh
halamannya tidak ditemukan kesalahan penulisan, 17 % dari seluruh halamannya
mengandung 1 kesalahan, dan sisanya 2 % mengandung 2 kesalahan penulisan.
Berapa mean jumlah kesalahan penulisan per halaman ?
Mean jumlah kesalahan penulisan per halaman :

x E(X) x P x(x)
x

= 0 (0.81) + 1(0.17) + 2(0.02) = 0.21


Dapat disimpulkan dari keseluruhan halaman, ekspektasi ditemukannya kesalahan
penulisan per halaman rata-rata 0.21
0.8

0.4

0
Agus
Statistika 1 - 53

x
Purnomo

Gambar-2.1 Fungsi Probabilitas untuk jumlah kesalahan penulisan


per halaman dari suatu textbooks dan lokasi mean populasi
Definisi :
Misalkan X suatu variabel random diskrit dengan fungsi probabilitas P X(x),
dan misalkan g(x) merupakan fungsi lain dari x. Nilai Ekspektasi, E[g(x)],
dari fungsi ini adalah :
E[g( x )] g( x ) Px ( x )
x

Contoh 2 :
Misalkan X suatu variabel random dengan distribusi probabilitas sbb :
x
0
1
2
3
PX(x)
1/3
1/2
0
1/6
Hitunglah ekspektasi : Y = ( X 1 )2
Jawab :
3

E [( X 1 )2] = ( X 1)

Px( X )

X 0

= (-1)2 Px(0) + (0)2 Px(1) + (1)2 Px(2) + (2)2 Px(3)


= 1 (1/3) + 0 (1/2) + 1 (0) + 4 (1/6)
= 1
Definisi :
Misalkan
X merupakan suatu variabel random diskrit. Ekspektasi
penyimpangan kuadrat dari mean, ( X - X)2, disebut Variansi, x2 :
= E [( X - X)2] =
( x - X)2 PX(x)
x
atau :
x2 = E (X2) - x2
=
x2 PX(x) - x2
x
x2

Contoh 3 :
Dari Contoh 1 diperoleh X = 0.21. Untuk memperoleh variansi, maka pertama
dicari dahulu :
E (X2) =
x2 PX(x) = (0)2 (0.8) + (1)2 (0.17) + (2)2 (0.02) = 0.25
x
Variansinya :
x2 = E (X2) - x2 = 0.25 (0.21)2 = 0.2059
Standar deviasi :
X = x2 = 2059 = 0.4538
Agus
Statistika 1 - 54

Purnomo

Teorema :
Misalkan X variabel random dengan mean X dan variansi x2 , dan misalkan
a dan b merupakan konstanta. Didefenisikan variabel random Z = a + b X .
Maka mean dan variansi dari Z adalah :
Z = E (a + b X ) = a + b x
2Z = Var (a + b X ) = b2 x2
dan :
Z = b
X
standar deviasi Z :
Contoh 4 :
Sebuah kontraktor tertarik pada ongkos total suatu proyek yang akan dikerjakan.
Diestimasi ongkos material $ 25,000 dan ongkos pekerja $ 900 per hari. Jika
proyek dikerjakan selama X hari, total ongkos pekerja adalah 900 X dollar dan
total ongkos proyek ($) akan menjadi : C = 25,000 + 900 X
Perkiraan (estimasi) kontraktor tentang probabilitas waktu penyelesaian proyek
Waktu penyelesaian
X (hari)
10
11
12
13
14
Probabilitas
0.1
0.3
0.3
0.2
0.1
Hitunglah Mean & Variansi waktu penyelesaian X !

x E(X) x P x(x)
x

= 10 (0.1) + 11 (0.3) + 12 (0.3) + 13 (0.2) + 14 (0.1) = 11.9 hari


dan

= E [( X - X)2] =
( x - X)2 PX(x)
x
= (10-11.9)2 (0.1) + (11-11.9)2 (0.3) + . + (14-11.9)2 (0.1) = 1.29
Mean dan Variansi ongkos total C adalah :
C = E(25,000 + 900 X) = 25,000 + 900 X
= 25,000 + 900 (11.9) = $ 35,710
2
C = Var (25,000 + 900 X) = (900)2 x2
= 810,000 (1.29) = 1,044,900
standar deviasinya :
C = C2 = $ 1,022.20
x2

Soal-soal :
1. Dalam suatu permainan seseorang mendapat Rp. 5 bila muncul semua muka
atau semua belakang jika tiga uang logam dilantunkan dan membayar Rp. 3 bila
muncul muka satu atau dua, berapakah harapan kemenangannya ?
2. Sebuah distribusi akan menerima keuntungan $20 /unit jika produk yang
dikirim baik $12 /unit jika ada produk yang rusak. dari data masa lalu diperoleh
bahwa 80% barang yang dikirim berada dalam keadaan baik. Berapa ekspektasi
Agus
Statistika 1 - 55

Purnomo

(harapan) keuntungan / unit dari distributor ?


3. Seorang investor sedang mempertimbangkan
3 strategi untuk
menginvestasikan uangnya sebesar $ 1,000. Probabilitas return diestimasi
sebagai berikut :
Strategi 1 :
Strategi 2 :
Strategi 3 :

Profit $ 10,000 dengan probabilitas 0.15 dan kerugian $ 1,000 dengan


probabilitas 0.85
Profit $ 1,000 dengan probabilitas 0.5, Profit $ 500 dengan probabilitas
0.3, dan kerugian $ 500 dengan probabilitas 0.2
Pasti memperoleh profit $ 400
Strategi mana yang memberikan ekspektasi profit tertinggi ? Akankah
anda menganjurkan investor untuk memilih strategi tersebut ?

4. Suatu pengiriman pesawat televisi berisi dua yang rusak. Sebuah hotel membeli
tiga pesawat secara random (acak) dari kelompok tadi. Bila X menyatakan
banyaknya pesawat yang rusak yang dibeli hotel tersebut, hitunglah nilai
ekspektasi variabel random X.
5. Dengan membeli sejenis saham tertentu seseorang dapat memperoleh
keuntungan setahun sebesar Rp. 3000,- dengan probabilitas 0.3 atau rugi
Rp.1000,- dengan probabilitas 0.7. Berapa ekspektasi keuntungannya ?
6. Seorang pembalap ingin mengasuransikan mobilnya selama musim balapan
mendatang sebesar $ 10,000. Perusahaan asuransi mengestimasi terjadinya
kerugian total $ 10,000 dengan probabilitas 0.002, kerugian 50 % dengan
probabilitas 0.01, kerugian 25 % dengan probabilitas 0.1. Jika kerugian
lainnya diabaikan, berapa besar premi yang seharusnya ditagih oleh perusahaan
asuransi tiap musim balapan agar mendapat keuntungan $100 ?
7. Seorang manager pabrik mempertimbangkan untuk menggantian mesin
tempanya. Dari data masa lalu menunjukkan distribusi probabilitas untuk
jumlah breakdown (keruskan) mesin ini dalam seminggu :
Jumlah Kerusakan
0
1
2
3
4
Probabilitas
0.10
0.26
0.42
0.16
0.06
a. Berapa mean & standar deviasi jumlah kerusakan ?
b. Jika estimasi biaya setiap kerusakan $ 1,500 berapa mean & standar deviasi
biaya kerusakan mingguan dari mesin ini ?
8. Anak panah diarahkan pada lingkaran yang beradius 8 inchi. Jika mengenai
pusat sampai garis lingkaran berjari-jari 1 inchi, menang $ 10. Jika mengenai
daerah antara 1 dan 3 inchi dari pusat, menang $ 5. Jika tidak mengenai salah
satu daerah di atas, maka membayar $ 4. Berapa nilai ekspektasi
kemenangannya?
EKSPEKTASI MATEMATIK VARIABEL RANDOM KONTINU
Agus
Statistika 1 - 56

Purnomo

Nilai Ekspektasi variabel random Kontinu X :


E(X) =

fX(x) dx

Jika g(x) merupakan fungsi lain dari variabel random kontinyu X, maka
ekspektasi dari fungsi ini merupakan rata-rata nilai dari fungsi dalam
pengulangan percobaan independent dari jumlah percobaan yang sangat besar.
Ekspektasinya adalah :

E[g(X)] =

g(x) fX(x) dx

Contoh 1:
Misalkan X variabel acak yang menyatakan umur dalam jam sejenis bola lampu.
Fungsi padat peluangnya :
2000
f(x)
;
x > 100
x3
= 0
untuk x lainnya
Berapa ekspektasi umur bola lampu tersebut ?
20.000
Jawab:
E(X) x
dx
3
x
100

x 20.000 dx
100 x2
= 200
Jadi bola lampu tersebut dapat diharapkan berumur 200 jam.
Contoh 2 :
Misalkan suatu variabel random dengan fungsi padat :
f(x) = 1/3 x2 ; -1 < x < 2
= 0
; untuk x lainnya
Hitunglah nilai ekspektasi g(x) = 2x - 1
Jawab :
E(2x-1) =

1/3 (2x-1) x2 dx

= 1/3

( 2x3 x2 ) dx

= 3/2
Definisi :
Misalkan X merupakan variabel random kontinyu :
(i) Mean dari X ; X ; merupakan ekspektasi nilai X :
X = E(X)
(ii) Variansi dari X ; x2 ; merupakan ekspektasi dari penyimpangan kuadrat,
( X - X )2 :
x2 = E[ ( X - X )2 ]
atau
Agus
Statistika 1 - 57

Purnomo

= E(X2) - x2
(iii) Standar deviasi dari X, X ;
X = x2
x2

Misalkan X merupakan variabel random kontinyu dengan mean X dan


variansi x2 , dan misalkan a dan b merupakan konstanta. Maka varaibel
random Z adalah :
Z=a+bX
Mean dan varainsi dari Z adalah :
Z = E (a + b X ) = a + b x
dan
2Z = Var (a + b X ) = b2 x2
standar deviasi dari Z :
Z = b
X
untuk kasus khusu dengan mean 0 dan variansi 1, variabel randomnya :
Z =

X X
X

Contoh 3:
Seorang pemilik rumah ingin mengestimasi dengan menggunakan temperatur dari
tagihan rekening listrik terhadap penggunaan AC pada bulan Juni. Persamaan
tagihan rekening listriknya ($) : Y = 290 - 5 T
Dengan T merupakan rata-rata temperatur ( derajat Celcius) bulan Juni. Jika ratarata temperatur pada bulan Juni bisa dinyatakan sebagai variabel random dengan
mean 32 OC dan standar deviasi 4 OC, berapa mean & standar deviasi tagihan
rekening listrik pemilik rumah tersebut pada bulan Juni ?
Jawab :
Variabel random T mempunyai mean dan standar deviasi : T = 32 dan T = 4
Ekspektasi mean tagihan listrik adalah :
Y = 250 - 5 T
= 290 5 (32) = $ 130
Ekspektasi standar deviasi tagihan listrik : Y = -5 T = (5) (4) = $ 20
Soal-soal :
1. Fungsi padat variabel random kontinu X, jumlah jam, dalam satuan 100 jam,
mesin pengisap debu digunakan setahun oleh keluarga berbetuk :

x
0<x<1
f(x) =
2x
1 x<2
0
untuk x yang lainnya
Carilah rata-rata jumlah jam setahun keluarga tadi menggunakan mesin !
2. Misalkan X menyatakan hasil yang muncul bila suatu dadu yang setangkup
dilantunkan. Hitunglah :
Agus
Statistika 1 - 58

Purnomo

g(x) , bila g(x) = 3 x2 + 4


3. Misalkan X variabel acak dengan distribusi probabilitas berikut :
x
-3
6
9
f(x)
1/6
1/2
1/3
Carilah g(x) , bila g(x) = (2 x + 1)2
4. Suatu perusahaan besar membeli beberapa mesin pada akhir tiap tahun,
banyaknya tergantung pada seringnya perbaikan pada tahun sebelumnya.
Misalkan banyaknya mesin, X, yang dibeli tiap tahun mempunyai distribusi
probabilitas berikut :
x
0
1
2
3
f(x)
1/10
3/10
2/5
1/5
Bila harga mesin dalam ribuan rupiah, tetap 1200 sepanjang tahun ini dan
potongan 50 x2 ribu rupiah diberikan terhadap tiap pembelian, berapa banyak
perusahaan tadi diharapkan membelanjakan uangnya membeli mesin baru pada
akhir tahun ini ?

Agus
Statistika 1 - 59

Purnomo

BAB VII
DISTRIBUSI PROBABILITAS DISKRET
Sering lebih mudah bila semua peluang suatu variabel random X dinyatakan dalam suatu rumus.
Rumus seperti itu tentunya merupakan fungsi nilai numerik x yang akan dinyatakan dengan f(x),
g(x), r(x), dst. Jadi ditulis f(x) = P(X = x); yaitu f(3) = P(X = 3). Himpunan pasang terurut
(x,f(x)) disebut fungsi peluang (probabilitas) atau distribusi probabilitas variabel random diskret
X.
Definisi :

Fungsi F(x) adalah suatu fungsi probalitias atau distribusi probabilitas


suatu variabel acak diskret X bila , untuk setiap hasil yang mungkin :
1. f (x) 0

2. f ( x ) 1
x

3. P(X = x) = f(x)
Contoh :
Hitunglah distribusi probabilitas banyaknya head yang muncul bila suatu mata uang yang
setangkup dilantunkan 2 kali.!

P(X = 0)
P(X = 1)
P(X = 2)

Kejadian yang mungkin

HH

HT

TH

TT

=
=
=

P(TT)
P(HTTH)
P(HH)

f(x)

1/4

1/2

1/4

Agus
Statistika 1 - 60

=
1/4
=
P(HT) + P(TH) = 1/4 + 1/4 = 1/2
= 1/4

Purnomo

f(x)

f(x)
1/2

1/2

1/4

Distribusi Probabilitas Diskret


Definisi :

Distribusi kumulatif F(x) suatu variabel acak X dengan distribusi peluang


f (x) dinyatakan oleh:

F( x) P(X x ) f(t)
tx

Contoh :
Hitunglah distribusi kumulatif variabel random (acak) X pada contoh 1:
F(0)

f(0)

F(1)

f(0) + f(1)

F(2)

f(0) + f(1) + f(2)

Agus
Statistika 1 - 61

= 1/4
=

1/4 + 1/2 = 3/4


=

1/4 + 1/2 + 1/4 = 1

Purnomo

F(x)
1

1/4

3/4
1/2

1/2

1/4

1/4
0

Distribusi Kumulatif Diskret


7.1 VARIABEL ACAK ( RANDOM VARIABLE )
Definisi :

suatu fungsi bernilai real harganya ditentukan oleh tiap anggota dalam
ruang sampel disebut variabel acak.

Yang menarik perhatian bukan titik sampel melainkan gambaran numerik dari hasil.
Suatu variabel acak dinyatakan dengan huruf besar, misalnya X, sedangkan harganya
dinyatakan dengan huruf kecil yang berpadanan misalnya: x
Contoh 1 :
Dua bola diambil satu demi satu dikembalikan dari suatu kantong berisi empat bola merah
dan bola hitam bila Y menyatakan jumlah bola merah yang diambil maka nilai y yang
mungkin dari variabel Y adalah :
Kejadian yang mungkin

MM

MH

HM

HH

Contoh 2 :
Pak Ali , Badu dan Cokro menitipkan pecinya di pagi hari pada seorang anak. soreharinya si
anak mengembalikan peci tersebut secara acak pada ketiga petani bila pak Ali , Badu dan
Cokro dalam urutan seperti itu menerima peci dari si anak maka tuliskan titik sampel untuk
semua urutan yang mungkin mengdapatkan peci tersebut dan kemudian cari nilai m dari
variabel acak M yang menyatakan jumlah urutan yang cocok !
Bila A, B, C menyatakan masing-masing peci yang dibagikan berturut-turut pada pak Ali,

Agus
Statistika 1 - 62

Purnomo

Badu, Cokro maka :


Kejadian yang mungkin

ABC

ACB

BAC

BCA

CAB

CBA

7.2 BEBERAPA DISTRIBUSI PROBABILITAS DISKRET


Apakah distribusi peluang diskret disajikan secara grafik dalam bentuk histogram, dalam bentuk
tabel, atau melalui rumus bukan masalah, yang ingin dilukiskan ialah kelakuan peubah acak
tersebut. Sering, pengamatan yahg dihasilkan melalui percobaan statistika yang berbeda
mempunyai bentuk kelakuan umum yang sama. Karenanya, peubah acak diskret yang
berkenaan.dengan percobaan tersebut pada dasarnya dapat dilukiskan dengan distribusi peluang
yang sama dan karena itu dapat dinyatakan oleh rumus yang sama. Malahan, kita hanya
memerlukan beberapa distribusi peluang yang penting untuk menyatakan banyak peubah acak
diskret yang ditemui dalam praktek.
7.2.1 DISTRIBUSI SERAGAM (UNIFORM)
Distribusi peluang diskret yang paling sederhana ialah yang peubah acaknya memperoleh semua
nilainya dengan peluang yang sama. Distribusi peluang semacam itu disebut distribusi seragam
diskret.
Bila variabel random (acak) X mendapat nilai X1, X2, ......., Xk , dengan probabilitas yang sama,
maka Distribusi Uniform (seragam) diskret :
f(x;k) = 1/k
;
x = x1, x2, ......., xk
Teorema :
Rataan dan variansi distribusi seragam diskret f(x;k) adalah:

k
xi
i1
k

k
( xi )2

dan
2 i 1
k

Contoh l :
Bila sebuah bola lampu dipilih secara acak dari sekotak bola lampu yang berisi 1 yang 40-watt, 1
yang 60 watt, 1 yang 75-watt, dan 1 yang 100-watt, maka tiap unsur ruang sampel T={40, 60,
75, 100} muncul dengan peluang . Jadi distribusinya seragam dengan
f(x;4) = ;
x = 40, 60, 75, 100
Contoh 2 :
Seorang dipilih secara random dari 10 karyawan untuk mengawasi suatu proyek. Tiap karyawan
berpeluang sama untuk terpilih , yaitu 1/ 10. Misalnya karyawan tersebut telah dinomori dari 1
Agus
Statistika 1 - 63

Purnomo

sampai 10 , distribusi adalah seragam dengan f ( x ; 10 ) = 1/ 10 , x = 1, 2 , ......, 10

7.2.2 Distribusi Binomial


Suatu percobaan sering terdiri atas beberapa usaha, tiap usaha dengan dua kemungkinan hasil
yang dapat diberi nama sukses atau gagal. Misalnya pada pengujian barang hasil produksi,
dengan tiap pengujian atau usaha dapat menunjukkan apakah suatu barang cact atau tidak cacat.
Kita dapat menentukan atau memilih salah satu hasil sebagai sukses. Proses seperti ini disebut
proses Bernoulli, tiap usahanya disebut usaha Bernoulli.

Syarat Percobaan Bernoulli :


1. Pada setiap trial (percobaan ) hanya dimungkinkan terjadinya 2 jenis out come yaitu
sukses atau gagal. (Sukses atau gagal sesuai dengan definisi yang dikehendaki / sifat
Dichotomi)
2. Probabilitas terjadinya sukses pada setiap trial adalah sama (sifat Replacement)
3. Percobaan terdiri atas n trial (usaha) yang berulang, dimana n = konstanta
4. Tiap trial (usaha) bersifat independent (bebas dengan usaha lainnya)

Pandanglah suatu kelompok usaha Bernoulli yang berupa pengambilan 4 (empat) unit hasil
produksi suatu pabrik, dan kemudian unit yang cacat dipisahkan dari yang baik. Produk yang
cacat akan disebut (didefinisikan) sebagai sukses(S). Produk yang baik didefinisikan sebagai
gagal (F).
Definisikan : P (sukses) =
p
;
P (gagal)
=
1-p
Contoh salah satu outcome yang muncul dari percobaan di atas yaitu :
P(SSFS)
=
P(S) . P(S) . P(F) . P(S)

independent trial
=
p . p . (1-p). p
=
p3 ( 1 - p )
Hasil lengkap dari seluruh outcome yang mungkin dari percobaan di atas disajikan pada tabel
berikut ini :
Outcome
Observasi
Proba-bilitas
Outcome
Observasi
Proba-bilitas
x
x
SSSS
4
p4
FSFS
2
p2 (1-p) 2
SSSF
3
p3 (1-p)
FFSS
2
p2 (1-p) 2
3
SSFS
3
p (1-p)
FSSF
2
p2 (1-p) 2
SFSS
3
p3 (1-p)
SFFF
1
p(1-p) 3
3
FSSS
3
p (1-p)
FSFF
1
p(1-p) 3
2
2
SSFF
2
p (1-p)
FFSF
1
p(1-p) 3
SFSF
2
p2 (1-p) 2
FFFS
1
p(1-p) 3
2
2
SFFS
2
p (1-p)
FFFF
0
(1-p) 4

P(SSSF)

b (x ; 4 , p)
b (3 ; 4 , p)
=
P(FSSS)
b (x ; 4 , p)

x = 0, 1, 2, 3, 4
P(SSFS)
+

P(SFSS)

=
4p3 ( 1 - p )
Jumlah outcome dengan x = 3
Probabilitas dari setiap outcome dengan x 3

n
Agus S S S . . . . S F F F . . . F
Statistika 1 - 64

Purnomo

(n - x)

P (Sukses)=

px

P (Gagal)=

(1 - p) n - x

A-1

A-1
...

.....
x ; objek
n(n - 1)

(n - 2)

...

x (n - 1)

. . . (n - x + 2)

(n - x + 1)

x!

n(n 1)(n 2)....(n x 1)


x!

misal :

10 !
10 . 9 . 8 . 7 . 6 . 5 (4 . 3 . 2 . 1)
6 . 5 . 4 . 3 . 2 . 1 (4 . 3 . 2 . 1)

6!

6!

6!
(10 - 6) !

x!

n!
(n - x) !

(10 - 6) !

Sehingga :
b ( x ; n , p) =

n!
p x (1 p) n x
x! (n x)!

x = 0, 1, .... , n

Definisi Distribusi Binomial


Suatu usaha Bernoulli dapat menghasilkan sukses dengan peluang p dan gagal dengan peluang q
= 1-p, maka distribusi peluang variabel acak Binomial X, yaitu banyaknya sukses dalam n usaha
bebas (Probability untuk mendapatkan x sukses dari n trial independent dengan probabilitas
terjadinya sukses pada setiap trial = p dan probabilitas gagal = 1- p) :

b(x:n,p)

b (x ; n , p)
b (x ; n , p)
B (x ; n , p)
b (x ; n , p)

n!
p x (1 p) n x ;
x!(n x)!
=
=
=
=

x = 0, 1, ..... ,n

B (x ; n , p) B (x - 1 ; n , p)
b {(n - x ; n , ( 1 - p)}
1 - B {(n - x - 1) ; n , (1 -p)}
B (n - x ; n , 1 - p) - B (n - x - 1 ; n , 1 - p)

Mean
Variance
Standard Deviation
Coefficient of Skewness
Coeffisient of Kurtosis
Agus
Statistika 1 - 65

= np

2 npq

npq

q p
npq
1 6 pq
4 3
npq

Purnomo

Moment Generating Function


Characteristis Function

M (t ) (q pet )n
( w) (q pei )n

Soal-soal :
1. Sebuah perusahaan industri yang memproduksi alat-alat plastik mengetahui secara teknis
bahwa 20 % dari alat-alat plastik yang diproduksi dengan mesin tertentu akan tidak
memenuhi kualitas standar dan dianggap rusak. jika 20 buah alat-alat plastik yang dihasilkan
dengan mesin diatas dipilih secara random dari seluruh hasil produksi, berapakah
probabilitas :
a. Tepat 5 yang rusak ? = tepat 15 yang baik?
b. Tidak lebih dari 4 yang rusak ? tidak kurang 15 yang baik ?
c. Lebih besar dari 7 yang rusak ? kurang dari 13 yang baik ?
d. Tidak kurang dari 10 yang rusak ? tidak lebih dari 10 yang baik?
e. Semua yang diperiksa baik ? semua yang diperiksa rusak ?
Tidak lebih dari x / sebanyak-banyaknya

x
Lebih kecil dari x / kurang dari x

<x
Lebih besar dari x

>x
Tidak kurang dari x / sekurang-kurang x

x
Tepat pada x

=x
2. Dalam pengujian sejenis ban truk melalui jalan yang kasar ditemukan 25 % truk mengalami
kegagalan karena ban pecah . Berapakah peluang 5 sampai 10 truk dari 15 yang diuji akan
mengalami pecah ban ?
3. Seorang petani jeruk mengeluh karena 60% dari panen jeruknya terserang sejenis virus. Cari
peluangnya bahwa di antara 4 buah jeruk yang diperiksa dari hasil panen ini
a. semuanya terserang virus tersebut;
b. antara 1 sampai 3 yang terserang virus tersebut.
4. Menurut suatu survey, 0.3 dari perusahaan di AS memberi karyawannya cuti 4 minggu
setelah bekerja di perusahaannya selama 15 tahun. Cari peluangnya bahwa di antara 6
perusahaan yang disurvey secara acak, banyaknya perusahaan yang memberi karyawannya
cuti 4 minggu setelah 15 tahun kerja
a. antara 2 sampai 5;
b. kurang dari 3.
5. Menurut suatu penelitian yang dilakukan oleh sekelompok sosiolog dari Universitas
Massachusetts, sekitar 60 % pengguna Valium di negara bagian Massachusetts mula-mula
menggunakan Valium karena persoalan psikologi. Cari peluangnya bahwa diantara 8
pengguna yang diwawancarai selanjutnya dari negara bagian tersebut :
a. tepat 3 mula-mula menggunakan Valium karena persoalan psikologi.
b. paling sedikit 5 mula-mula menggunakan Valium karena persoalan yang bukan psikologi.
6. Suatu survey nasional di AS pada mahasiswa tingkat empat yang dilakukan oleh Universitas
Michigan menunjukkan bahwa hampir 70 % dari mereka yang tidak menyetujui merokok
ganja tiap hari menurut laporan Parade, 14 September 1980. Bila 12 mahasiswa tingkat
empat dipilih secara acak dan ditanya pendapatnya, cari peluangnya bahwa banyaknya yang
tidak setuju merokok ganja tiap hari
a. dari 7 sampai 9 orang;
b. paling banyak 5 orang;
c. tidak kurang dari 8 orang.
7. Seorang lnsiyur pengawas lalu lintas melaporkan bahwa 75 % kendaraan yang melintasi
suatu daerah pemeriksaan berasal dari DKI. Berapakah peluang bahwa kurang dari 4 dari 9
kendaraan mendatang yang melalui pemeriksaan tersebut berasal dari luar DKI ?
Agus
Statistika 1 - 66

Purnomo

8. Suatu penelitian yang dilakukan di Universitas George Washington dan Institut Kesehatan
Nasional di AS meneliti sikap masyarakat terhadap obat penenang. Penelitian itu
menunjukkan bahwa sekitar 70 % penduduk percaya obat penenang tidaklah mengobati
apapun, obat itu hanyalah menutupi penyakit sesungguhnya. Menurut penelitian ini, berapa
peluangnya bahwa paling sedikit 3 dari 5 penderita yang dipilih secara acak berpendapat
sepert! itu ?
9. Suatu survey penduduk di suatu kota di AS menunjukkan bahwa 20% lebih menyenangi
telepon berwarna putih dari pada warna lainnya. Berapakah peluang bahwa lebih dari
setengah dari 20 pesawat yang akan dipasang di kota tersebut akan berwarna putih ?
10. Diketahul bahwa 40% dari tikus yang disuntik dengan sejenis serum terlindung dari serangan
sejenis penyakit. Bila 5 tikus disuntik, berapakah peluang bahwa
a. tidak ada yang terserang penyakit tersebut;
b. kurang dari 2 yang terserang;
c. lebih dari 3 yang terserang.
11. Misalkan bahwa mesin pesawat terbang bekerja bebas satu dari yang lain dalam penerbangan
dan rusak dengan peluang 0,4. Bila dimisalkan bahwa sebuah pesawat terbang melakukan
penerbangan dengan selamat jika paling sedikit, setengah mesinnya bekerja, tentukan apakah
pesawat bermesin empat atau bermesin dua yang lebih tinggi keselamatan penerbangannya ?
7.2.3 DISTRIBUSI HIPERGEOMETRIK
Cara paling mudah melihat perbedaan antara distribusi binomial dan distribusi hipergeometrik
terletak pada cara pengambilan sampelnya. Macam penggunaan distribusi hipergeometrik amat
mirip dengan binomial. Untuk kasus binomial, diperlukan kebebasan antara usaha. Akibatnya,
bila binomial diterapkan, misalnya, pada pengambilan dari sejumlah barang (sekotak kartu,
sejumlah barang produksi), sampel harus dikerjakan dengan pengembalian setiap barang setelah
diamati. Dipihak lain, distribusi hipergeometrik tidak memerlukan kebebasan dan didasarkan
pada sampel tanpa pengembalian.
Penggunaan distribusi hipergeometrik terdapat di banyak bidang, terbanyak pada penerimaan
sampel (acceptance sampling), pengujian elektronik, dan pengendalian mutu. Tentunya, dalam
banyak bidang ini pengujian dilakukan terhadap barang yang diuji yang mengakibatkan, pada
akhirnya, barang yang diuji tersebut menjadi rusak, jadi tidak dapat dikembalikan. Penyampelan
harus dikerjakan tanpa pengembalian.
Sifat Percobaan Hipergeometrik :
Populasi
=
Jumlah sukses
=
Jumlah sampel size =
Tidak terjadi replacement
Sifat dichotomous

n n!

x x!(n x)!
Agus
Statistika 1 - 67

N terbatas
a
n

N N !

n n ! (N n ) !
Purnomo

N
a
sukses

x
sukses

(N - a)
gagal

(n - x)
gagal
n

Definisi Distribusi Hipergeometrik :


Distribusi probabilitas variabel random Hipergeometrik X, yaitu banyaknya sukses dalam sampel
acak ukuran n yang diambil dari N benda yang mengandung a bernama sukses dan N a
bernama gagal.

h ( x ; n ; a ; N) =

a N a

x nx
N

x = 0, 1, .... , n

Teorema :
Rataan dan variansi distribusi hipergeometrik h (x; n; a; N) adalah :

na
N

Nn
a
a
n 1
n
N
N 1

Contoh soal :
Suatu pabrik menggunakan rencana penerimaan dalam produksi barangnya sebelum pengiriman.
Suatu kotak (dus) berisi 40 suku cadang dikatakan dapat diterima bila dari sampel acak (random)
ukuran 5 suku cadang mengandung paling banyak 1 yang cacat. Berapa probabilitas mendapat
Agus
Statistika 1 - 68

Purnomo

tepat satu yang cacat dalam sampel bila kotak tersebut mengandung 3 suku cadang yang cacat ?
n = 5 ; x = 1 ; N = 40 ; a = 3

h ( x ; n ; a ; N) =

Agus
Statistika 1 - 69

a N a

x nx
N

Purnomo

h ( 1 ; 5 ; 3 ; 40 ) =

3 403

1 51
40

= 0,3011

Soal-soal :
1. Sebuah perusahaan ingin menilai cara pemeriksaan yang sekarang dimana setiap lot berisi 50
barang. cara ini mengambil sampel sebesar 5 dan lolos pemeriksaan bila berisi tidak lebih
dari dua yang cacat berapakah probabilitas lot yang mengandung 20 % cacat akan lolos
pemeriksaan ?
2. Suatu lot berisi 50 unit barang yang 10 % diantaranya cacat untuk dapat dipasarkan maka lot
harus menjalani pemeriksaan dengan cara pengambilan sampel sebagai berikut:
sampel 1 : Berukuran 10 jika dari sampel ini dijumpai 4 unit atau lebih yang cacat maka lot
ditolak jika ditemui cacat kurang dari 2 unit, lot diterima jika ditemui cacat dari 2
sampai 3 unit maka pemeriksaan dilanjutkan dengan sampel kedua.
sampel 2 : berukuran 5 unit, jika tidak dijumpai barang cacat maka lot diterima.
a. Berapa probabilitas lot ditolak di sampel kedua ?
b. Berapa Probabilitas lot diterima disampel ke satu ?
3. Suatu pabrik menggunakan rencana pengiriman bertahap dua dari barang produksinya,
sebelum dikirim sejumlah kotak masing-masing berisi 25 butir disiapkan untuk dikirim dan
sampel berukuran 3 butir barang dari setiap kotak diperiksa. Bila ada yang cacat dari ketiga
butir barang tersebut maka kotak dikembalikan dan seluruh isinya diperiksa. bila dari
ketiganya tidak ada yang cacat maka kotak dikirimkan.
a. Berapa probabilitas sebuah kotak yang berisi 5 butir barang yang cacat akan dikirm ?
b. Berapa probabilitas kotak yang berisi 1 butir barang yang cacat akan dikembalikan dan
seluruh isinya diperiksa ?
4. Untuk mengelabui petugas pabean, seorang pelancong menaruh 6 tablet narkotik dalam
sebuah botol yang berisi 9 pil vitamin yang sama bentuk dan warnanya. Bila petugas pabean
Agus
Statistika 1 - 70

Purnomo

memeriksa 3 tablet secara acak untuk dianalisis, berapakah peluang pelancong tersebut akan
ditahan karena membawa narkotik ?
5. Seseorang menanam 6 bibit di pekarangannya, yang diambil secara acak dari sebuah kotak
berisi 5 bibit gladiol dan 4 daffodil. Berapakah peluang dia menanam 2 bibit daffodil dan 4
gladiol ?
6. Dari kotak berisi 10 peluru, diambil 4 secara acak dan kemudian ditembakkan. Bila kotak itu
mengandung 3 peluru yang cacat yang tidak akan meledak, berapakah peluang bahwa
a. keempatnya meledak ?; b. paling banyak 2 yang tidak akan meledak?
7. Berapakah peluangnya sebuah bar menolak menjual minuman beralkohol pada 2 siswa bila
pelayan secara acak memeriksa KTP 5 siswa dari 9 siswa, yang 4 di antaranya di bawah
umur ?
8. Misalkan perusahaan di soal 3 memutuskan mengganti rencana penerimaannya. Menurut
rencana baru ini seorang pemeriksa mengambil secara acak 1 barang, memeriksanya,
kemudian mengembalikannya ke dalam kotak; pemeriksa kedua juga bekerja dengan cara
yang sama. Akhirnya, pemeriksa ketiga juga mengikuti cara yang sama. Suatu kotak tidak
akan dikirim bila salah satu dari ketiga pemeriksa menemukan 1 yang cacat. Jawablah
pertanyaan a dan b pada soal 3 menurut rencana baru.
9. Disuatu kampung diperkirakan 4.000 dari 10.000 penduduknya yang berhak memilih Pak Ali
sebagai lurah. Bila 15 penduduk yang berhak memilih diambil secara acak dan pilihannya
untuk lurah ditanya, berapakah peluang paling banyak 7 diantaranya yang ingin memilih Pak
Ali sebagai lurah ?
10. Suatu kampung terdiri atas 1200 keluarga. Bila setengah dari seluruh keluarga di kampung
itu memiliki pesawat televisi, berapakah peluang bahwa suatu sampel sebesar 10 keluarga
paling sedikit 3 diantaranya memiliki televisi ?
Pendekatan Distribusi Binomial terhadap Distribusi Hipergeometrik :
Bila n kecil dibandingkan dengan N maka peluang tiap penarikan akan berubah sedikit. Jadi
pada dasarnya percobaan adalah binomial dan dapat menghampiri distribusi hipergeometrik;
dengan menggunakan distribusi binomial dengan

p = a / N.

Rataan dan variansinya

adalah :
np

na

; 2 = npq = n (a/n ) (1 a/n)

N
Contoh soal :
Dalam suatu lot terdapat 100 travo dimana yang cacat ada 25 bila diperiksa 10 berapa
probabilitas tepat 2 travo yang cacat ?

Solusi :

Agus
Statistika 1 - 71

Purnomo

x = 2 ; n = 10 ; a = 25 ; N = 100

; h ( 2; 10; 25; 100 ) =

257

2 8
0,29
10

10

Dengan pendekatan Binomial :

x=2 ; n=10; p=25/100 = 0,25; b(2; 10; 0,25) =

10 2 8
(0,25) (10,25) 0,28
2

Soal-soal :
1. Dari 150 petugas pajak disuatu kota hanya 30 wanita. Bila 10 daripadanya yang dipilih
secara acak untuk ditugaskan memeriksa pajak sebuah perusahaan, gunakan pendekatan
(hampiran) binomial untuk menghitung peluangnya bahwa paling sedikit 3 wanita yang
terpilih ?
2. Suatu survey nasional di AS pada 17.000 mahasiswa tingkat empat yang dilakukan oleh
Universitas Michigan menunjukkan bahwa hampir 70% mereka tidak menyetujui merokok
ganja tiap hari menurut laporan di Parade, 14 September 1990. Bila 18 dari mahasiswa ini
diambil secara acak dan ditanya pendapatannya, berapakah peluangnya bahwa lebih dari 9
tapi kurang dari 14 yang tidak menyetujui merokok ganja ?
7.2.4 DISTRIBUSI POISSON
Percobaan yang menghasilkan variabel acak X yang bernilai numerik, yaitu banyaknya hasil
selama selang waktu tertentu atau dalam daerah tertentu, disebut percobaan Poisson. Panjang
selang waktu tersebut boleh berapa saja, semenit, sehari, seminggu, sebulan, atau malah setahun.
Agus
Statistika 1 - 72

Purnomo

Jadi percobaan Poisson dapat menghasilkan pengamatan untuk variabel acak X yang menyatakan
banyaknya hubungan telepon per jam yang diterima suatu kantor, banyaknya hari sekolah ditutup
karena banjir, banyaknya pertandingan sepakbola yang terpaksa diundurkan karena hujan selama
musim hujan. Daerah yang dimaksud dapat berupa sepotong garis, suatu luas daerah, suatu isi
benda, atau pun barangkali sepotong benda. Dalam hal seperti ini X mungkin menyatakan
banyaknya tikus sawah per hektar, banyaknya bakteri dalam suatu kultur, ataupun banyaknya
salah tik per halaman.
Syarat Percobaan Poisson :
1. Banyaknya hasil yang terjadi dalam suatu selang waktu atau daerah tertentu tidak
terpengaruh oleh (bebas dari) apa yang terjadi pada selang waktu atau daerah lain yang
terpisah. Dalam hubungan ini proses Poisson dikatakan tak punya ingatan.
2. Peluang terjadinya suatu hasil (tunggal) dalam selang waktu yang amat pendek atau dalam
daerah yang kecil sebanding dengan panjang selang waktu atau besarnya daerah dan tidak
tergantung pada banyaknya hasil yang terjadi di luar selang waktu atau daerah tersebut.
3. Peluang terjadinya lebih dari satu hasil dalam selang waktu yang pendek atau daerah yang
sempit tersebut dapat diabaikan.
Banyaknya hasil X dalam suatu percobaan Poisson dlsebut suatu peubah acak Poisson dan
distribusi peluangnya disebut distribusi Poisson. Rataan banyaknya hasil dihitung dari = t ,
bila t menyatakan 'waktu' atau 'daerah' khas yang menjadi perhatian. Karena peluangnya
tergantung pada , laju terjadinya hasil akan kita nyatakan dengan lambang p(x; t).
= rata-rata banyaknya sukses yang terjadi dalam suatu selang waktu atau daerah tertentu
Definisi Distribusi Poisson :
Distribusi peluang peubah acak Poisson X, yang menyatakan banyaknya sukses yang terjadi
dalam suatu selang waktu atau daerah tertentu dinyatakan dengan t, diberikan oleh
x e
f ( x, )
x = 0, 1, 2, ....
; e = 2,7183
x!
Teorema :
Rataan dan variansi distribusi Poisson :
=

dan
2 =

0.7
0.6
0.5

, )

f(x

Px

x!

rata-rata kedatangan / satuan waktu

t 0,5
0.4

t 1

0.3
0.2

t 2

0.1
0
Agus
Statistika 1 - 73

Purnomo

Distribusi Probabilitas Poisson


Distribusi Probabilitas Eksponensial

1,0

t) 1 e t

P(T

P(T

t)

O t
P(T
t ) prob. waktu antar kedatangan
T suatu waktu t tertentu
Ekspektasi waktu antar kedatangan
(kelahiran) :
E(T)

1 /

Sifat Memoryless:
Kejadian suatu even tidak dipengaruhi oleh even sebelumnya.
Sifat Memoryless dimiliki :
Distribusi Diskrit : Poisson
Pdf Poisson = Pdf Eksponensial
Distribusi Kontinu : Eksponensial
Jika jumlah kedatangan berdistribusi poisson maka waktu antar kedatangan berdistribusi
eksponensial.

Contoh soal :
1. Pemeriksaan lempengan timah dari suatu proses elektrolit yang kontinu, diperoleh cacat
yang berupa bintik-bintik rata-rata permenit 0,2. Berapa probabilitas cacat tersebut :
a) Tepat 1 yang cacat dalam 3 menit ?
b) Sekurang-kurangnya 2 yang cacat dalam 5 menit?
c) Paling banyak 1 yang cacat dalam 15 menit ?
Solusi :
rata-rata permenit = 0,2 rata-rata jl. bintik/menit
a) 3 menit

= n . p = 3 x 0,2 = 0,6
f ( 1; 0, 6 ) = F (1; 0, 6) - F(0; 0, 6)
= 0,878 - 0,549 = 0.329
b) 5
menit
= 1,0
f (x 2 ; 1,0 ) =
1 - F (1; 1,0) = 1 - 0.7358 = 0.2642
c) 15 menitn =
15
x 0,2 = 3,0
f ( x 1 ; 3, 0 )
=
F (1; 3,0 )
= 0,1991
f (4 x 9; 3, 0)
=
F (9 ; 3, 0) - F( 3 ; 3,0)
Agus
Statistika 1 - 74

Purnomo

2. Rata-rata banyaknya tanker minyak yang tiba tiap hari di suatu pelabuhan adalah 10.
Pelabuhan tersebut hanya mampu menerima paling banyak 15 tanker sehari. Berapakah
peluang pada suatu hari tertentu tanker terpaksa ditolak karena pelabuhan tak mampu
melayaninya ?
Misalkan X menyatakan banyaknya tanker yang tiba tiap hari dan = 10 tanker/hari (ratarata jl tanker datang/hari)
f ( X > 15 ) = f ( X 16 ) = 1 f (X 15)
15

= 1

x 0

f (X; 10) = 1 - 0.9513 = 0.0487

Seperti distribusi Binomial, distribusi Poisson banyak digunakan dalam pengendalian mutu,
pertanggungan mutu, dan penerimaan sampel. Disamping itu, beberapa distribusi kontinu
yang penting yang digunakan dalam teori kehandalan dan teori antrian bergantung pada
proses poisson.
PENDEKATAN POISSON TERHADAP BINOMIAL :
Bila n besar p dekat dengan nol, distribusi Poisson dapat digunakan dengan =np, untuk
menghampiri peluang binomial. Bila p dekat dengan 1, distribusi Poisson masih dapat
dipakai untuk menghampiri peluang Binomial dengan mempertukarkan apa yang telah
dinamai dengan sukses dan gagl, jadi dengan mengganti p dengan suatu nilai yang dekat
dengan 0.
Teorema :
Misalkan X variabel acak Binomial dengan distribusi probabilitas b(x; n;p).
Bila n , p 0, dan = np tetap sama, maka :
b(x; n;p) f(x; )
Pendekatan ini akan baik jika n 20 dan p 0,05 ; jika n 100 maka np 10
Contoh soal :
1. Diketahui 5 % dari hasil penjilidan suatu buku mengandung cacat. Berapa probabilitas 2 dari
100 buku yang dijilid akan mengandung cacat, pergunakan :
a) formulasi distribusi Binomial !
b) pendekatan Poisson untuk Binomial !
Solusi :
Probabilitas sukses : p=0,05 ;
n = 100 dan sukses x = 2
a)

b(x;n,p)

b ( 2 ; 100 ; 0,05 )

10 2 98
(0, 5) (0,95)
2

n!
p x (1 p) n x
x! (n x)

= 0,081

=n . p =(0,05) (100) = 5
x
f ( x ; ) = e
x!

b) x = 2 ;

Agus
Statistika 1 - 75

Purnomo

52 e5
0,084
2!
dg. tabel = F(2:5) F(1;5) = 0.1247 - 0.0404 = 0.0843b
f(2;5)=

2. Dalam suatu proses produksi yang menghasilkan barang dari gelas, terjadi gelembung atau
cacat yang kadang-kadang menyebabkan barang tersebut sulit dipasarkan. Diketahui bahwa
rata-rata 1 dari 1000 barang yang dihasilkan mempunyai 1 atau lebih gelembung. Berapakah
probabilitas bahwa sampel sebesar 8000 barang akan berisi kurang dari 7 yang bergelembung
?
Solusi : Probabilitas sukses p = 1/1000 = 0.001 ; n = 8000 ; = n p = 8
B (6; 8000; 0.001) = F (6; 8) = 0.3134
Soal-soal :
1. Pada suatu pompa bensin rata-rata datang 2 kendaraan dalam 10 menit.
a) Berapa kemungkinan di dalam waktu 1 jam akan datang tepat 10 kendaraan ?
b) Berapa kemungkinan di dalam waktu 1 jam akan datang paling sedikit 10 kendaraan ?
c) Berapa kemungkinan di dalam waktu 1 jam akan datang paling banyak 10 kendaraan ?
2. Di suatu simpang jalan rata-rata terjadi 3 kecelakaan seminggu. Berapakah peluang pada
suatu minggu tertentu
a. tepat 5 kecelakaan akan terjadi ?
b. kurang dari 3 kecelakaan akan terjadi ?
c. paling sedikit 2 kecelakaan akan terjadi ?
3. Seorang tukang tik rata-rata melakukan 2 kesalahan per halaman. Berapakah peluang dia
melakukan
a. 4 atau lebih kesalahan pada halaman berikut yang dia ketik ?
b. tidak ada kesalahan ?
4. Suatu daerah di bagian timur Amerika Serikat, ratarata ditimpa 6 angin topan setahun.
Carilah peluang di suatu tahun tertentu
a. tidak sampai 4 angin topan yang akan menimpa daerah tersebut;
b. antara 6 sampai 8 angin topan akan menimpa daerah tersebut.
5. Dalam suatu penelitian inventors (persediaan barang) diketahui bahwa permintaan rata-rata
dari gudang terhadap suatu bahan tertentu 5 kall sehari. Berapakah.peluang pada suatu hari
tertentu bahan tersebut
a. diminta lebih dari 5 kali ? b. tidak diminta sama,sekali ?
6. Peluang seseorang meninggal karena suatu infeksi pernafasan adalah 0,002. Carilah peluang
bila 2000 orang yang terserang infeksi tersebut, kurang dari 5 orang yang akan meninggal.
7. Misalkan rata-rata l dari tiap 1000 orang melakukan salah perhitungan dalam menghitung
pajaknya. Bila 10.000 isian pajak diambil secara acak dan diperiksa, hitunglah peluangnya
bahwa 6, 7, atau 8 isian tersebut akan salah hitung.
b(6) =
b(7)=
b(8)=
8. Peluang seorang murid gagal dalam pemeriksaan scoliosis (lengkungan tulang belakang)
yang diadakan oleh sekolah diketahui sebesar 0,004. Dari sebanyak 1875 murid yang
diperiksa, carilah peluangnya bahwa
a. kurang dari 5 yang gagal dalam pemeriksaan;
b. 8, 9, atau 10 yang gagal.

7.2.5 DISTRIBUSI BINOMIAL NEGATIF


Suatu percobaan yang berbagai sifatnya sama dengan percobaan Binomial,
Agus
Statistika 1 - 76

kecuali usaha
Purnomo

diulangi sampai tercapai sejumlah sukses tertentu.


Jadi sebagai ganti mencari probabilitas x sukses dalam n usaha, bila n telah tertentu, sehingga
akan dicari probabilitas sukses ke-k terjadi pada usaha ke-x.
Definisi Distribusi Binomial Negatif :
Bila usaha yang saling bebas (independent) dilakukan berulang kali menghasilkan sukses dengan
probabilitas p sedangkan gagal dengan probabilitas q = 1 - p maka distribusi probabilitas variabel
random X ; yaitu banyaknya usaha yang berakhir tepat pada sukses ke - k yaitu :

b(x;k;p)

x 1 k x k
p q
k 1

x = k, k + 1, k + 2, ....

Contoh soal :
Carilah probabilitas bahwa seseorang yang melantunkan tiga uang logam sekaligus akan
mendapat semuanya muka (H) atau semuanya belakang (T) untuk kedua kalinya pada lantunan
kelima !
Solusi : x = 5 ; k = 2 ; dan p = 1/4

b (5; 2 ;1/4 )

4 1 2 3 3

1 4 4

= 0.1051

Soal-soal:
1. Probabilitas pembelian suatu tv berwarna di suatu toko tv adalah 0,3 Hitunglah probabilitas
bahwa pembelian tv yang kesepuluh di toko tersebut akan merupakan pembelian tv berwarna
yang ke lima ? b ( x=10;k=5; p=0,3) = 0,0515
2. Seorang peneliti menyuntik beberapa ekor tikus, satu demi satu dengan sejenis bibit penyakit
sampai dia menemukan dua ekor yang telah terserang penyakit itu, bila probabilitas terserang
penyakit itu 1/6. Berapakah Probabilitas bahwa delapan ekor tikus yang perlu disuntik ?
3. Misalkan peluangnya 0,8 bahwa setiap orang akan percaya tentang desas-desus mengenai
hubungan gelap seorang bintang terkenal. Berapakah peluangnya bahwa :
a. orang keenam yang mendengar desas-desus ini merupakan orang keempat yang
mempercayainya ?
b. orang ketiga yang mendengar desas-desus ini merupakan orang pertama yang
mempercayainya ?
4. Carilah peluang seseorang yang melantunkan suatu uang logam mendapat
a. muka yang ketiga pada lantunan ketujuh;
b. muka yang pertama pada lantunan keempat.

Agus
Statistika 1 - 77

Purnomo

7.2.6 DISTRIBUSI GEOMETRI


Tesis Distribusi Geometric :
Menghitung Probabilitas (kemungkinan) terjadinya sukses/gagal yang pertama pada x trial
(usaha)
sukses yang pertama
1

3 (x-1)

x+1 .

gagal
( 1 p )X-1

kemungkinan sukses pertama dalam x trial


Definisi Geometrik :
Bila usaha yang saling bebas dan dilakukan berulang kali menghasilkan sukses dengan peluang
p, gagal dengan peluang q = 1 p, maka distribusi peluang variabel random X, yaitu banyaknya
usaha samapi saat terjadinya sukse yang pertama, yaitu :
g (x ; p) = p ( 1 - p ) x 1
;
x = 1, 2, 3, ....
Teorema :
Rataan dan variansi variabel random distribusi geometrik, adalah :
=
1/p
dan
2
=
(1 - p) / p2
Contoh Soal :
1. Diketahui kemungkinan seorang lulusan SMTA mendapat pekerjaan 0,2 Berapakah
probabiitas seorang lulusan SMTA mendapat pekerjaan pada saat lamaran ke- 4 ?
Solusi :
g ( 4 ; 0,2 ) =
0,2 ( 1 - 0,2 )4 - 1
= 0,102
2. Dalam suatu proses produksi diketahui bahwa rata-rata diantara 100 butir hasil produksi,
terdapat 1 yang cacat. Berapakah probabilitas bahwa setelah 5 butir yang diperiksa baru
menemukan cacat pertama ?
Solusi : x = 5 dan p = 0.01
g ( 5 ; 0.01 )
=
0.01 ( 1 0.01 )5 - 1 = 0,0096
Soal-soal :
1. Peluang bahwa seseorang lulus ujian praktek mengendarai mobil adalah 0,7. Carilah peluang
seseorang yang lulus
a) pada ujian yang ketiga;
b) sebelum ujian keempat.
2. Seorang jago tembak : 95 % dari tembakannya berhasil mengenai sasaran. Berapa
Probabilitas tembakan yang ke-15 merupakan tembakan yang pertama yang tidak mengenai
sasaran ? 0,0244
3. Pada waktu sibuk suatu sentral telepon hampir mencapai batas daya sambungannya,
sehingga orang tidak mendapat sambungan. Ingin diketahui banyaknya usaha yang
diperlukan agar mendapat sambungan. Misalkan probabilitas mendapat sambungan selama
waktu sibuk 0.05. Berapa probabilitas diperlukan 5 usaha agar sambungan berhasil ?
Agus
Statistika 1 - 78

Purnomo

7.2.7 DISTRIBUSI MULTINOMIAL


Percobaan Binomial menjadi percobaan Multinomial bila tiap usaha dapat memberikan lebih dari
2 hasil yang mungkin.
Ada k jenis out come yang mutually exclusive yang mungkin
k

E1, E2,,Ek dengan probabilitas : P1, P2, ......., Pk dimana :

i 1

Pi = 1

maka distribusi Multinomial akan memberikan probabilitas ( peluang ) bahwa E 1 terjadi


sebanyak x1 kali , E2 sebanyak x2 kali, ......, Ek sebanyak xk kali dalam n usaha bebas dengan
k
xi n
i 1
Definisi Distribusi Multinomial :
Bila suatu usaha tertentu dapat menghasilkan k macam hasil E 1, E2,,Ek dengan P1, P2, .......,
Pk , maka distribusi probabilitas variabel acak X 1, X2,,Xk yang menyatakan banyak
terjadinya E1, E2,,Ek dalam n uasaha bebas ialah :
f (x1, x2, ... , xk) =

n!

x1 x2
xk
P P
...P
1
2
k
x1! x2! ... xk!

dengan xi = 0, 1 , 2 , ....., n

k
xi n
i 1

dan

k
pi 1
i 1

Contoh Soal :
1. Ada 3 merk kendaraan Niaga yang sering dipergunakan masyarakat Bandung :
Merk
Yang beredar di pasaran
x1 = Daihatsu
40 %
x2 = Suzuki
45 %
x3 = Mitsubishi
15 %
Jika kita mengamati 10 mobil niaga yang sedang parkir di Alun-alun Bandung, maka berapa
probabilitas terdapat Daihatsu 3 , Suzuki 4 dan Mitsubishi 3 ?
Solusi : f ( 3, 4, 3 )

10!
(0,4)3 (0,45)4 (0,15)3
3! 4! 3!

= 0,037
2. Terdapat sebuah kotak yang berisi 100 buah bola : 25 H , 50 P, 5 B , 20 K. Bila dilakukan 5
kali pengambilan bola dengan pengembalian, dan diperoleh 1P, 1K ,2H , 1B, berapa
besarnya probabilitasnya ?
P (H) = 1/4
; P(P) = 1/2
; P(B) = 1/20
; p(KP) = 1/5

Agus
Statistika 1 - 79

Purnomo

P ( 2H , 1P , 1K , 1B )

2
1
1
= 5 ! (1/ 4) (1/ 2) (1/ 20) (1/ 5)1
2! 1! 1! 1!

Soal-soal :
1. Suatu papan sasaran anak panah berbentuk lingkaran mempunyai pusat berbentuk lingkaran
kecil disebut lesan dan 20 daerah berbentuk kue tar bernomor 1 sampai 20. Tiap daerah
yang berbentuk tar terbagi lagi atas tiga bagj.an sehingga bila seseorang melempar anak
panah dan mengenai nomor tertentu maka ia mendapat nilai sama dengan nomor tersebut,
dua kali nomor tersebut, atau tiga kali nomor tersebut, tergantung pada bagian mana dari
ketiga daerah yang kena. Bila peluang seseorang mengenal lesan 0,01, peluang mengenai
nilai ganda adalah 0,10, peluang mengenai nilai ganda tiga adalah 0,05, peluang tidak
mengenai papan adalah 0,02, berapakah peluangnya dalam 7 lemparan menghasilkan: tidak
mengenai lesan, tidak mendapat nilai ganda tiga, mendapat nilai ganda dua kall, dan tidak
mengenai papan satu kali ?
2. Menurut teori genetika, persilangan tertentusejenis marmut akan menghasilkan keturunan
berwarna merah, hitam, dan putih dalam perbandingan 8 : 4 : 4. Carilah peluang bahwa 5
dari 8 turunan akan berwarna merah, 2 hitam, dan 1 putih.
3. Delegasi ke suatu konferensi akan tiba dengan pesawat terbang, bus, mobil sendiri, atau
kereta api masing-masing dengan peluang 0,4, 0,2, 0,3, dan 0,1. Berapa peluangnya bahwa
diantara 9 delegasi yang dipilih secara acak, 3 tiba dengan pesawat terbang, 3 tiba dengan
bus, 1 tiba dengan mobil sendiri, dan 2 tiba dengan kereta api ? 0,0077

Agus
Statistika 1 - 80

Purnomo

BAB VIII
DISTRIBUSI PROBABILITAS KONTINU
8.1 FUNGSI PADAT PELUANG (PROBABILITY DENSITY FUNCTION)
Suatu variabel acak kontinu mempunyai peluang nol pada setiap titik x. Karena itu,
distribusi peluangnya tak mungkin disajikan dalam bentuk tabel. Hal ini mungkin mengejutkan
pada permulaan, tetapi akan mudah dipahami dengan contoh berikut. Pandanglah suatu variabel
acak yang nilainya menyatakan tinggi badan semua orang di atas 21 tahun. Di antara dua
sembarang nilai, misalnya 163,5 dan 164,5 cm, ataupun antara 163,99 dan 164,0l cm terdapat
tinggi yang takberhingga banyaknya, salah satu diantaranya ialah 164 cm. Peluang memilih
secara acak seseorang yang tingginya tepat 164 cm tidak kurang atau lebih sedikit pun juga,
tentunya sangatlah kecil dan karena ltu peluang kejadian tersebut diberi nilai nol. Namun lain
halnya, bila yang ditanya ialah peluang memilih seseorang yang tingginya paling sedikit 163 cm
tetapi tidak lebih dari 165 cm. Sekarang yang dipandang ialah nilai suatu selang dan bukan nilai
suatu titik dari peubah acak.
Selanjutnya akan dijelaskan perhitungan peluang untuk berbagai selang dari variabel acak
kontinu seperti P(a < X < b), P(W > c), dan seterusnya. Perhatikan bahwa bila X kontinu :
P (a < X b) = P (a < X < b) + P (X = b) - P(a < X < b).
Yaitu, tidaklah menjadi soal apakah titik ujung selang diikutsertakan atau tidak. Hal ini tidak
benar, tentunya, bila X diskret.
Kendati distribusi peluang variabel acak kontinu tidak dapat disajikan dalam bentuk tabel,
mungkin dapat disajikan dalam bentuk rumus. Rumus seperti itu tentunya merupakan fungsi
dari nilai yang berbentuk bilangan (numerik) dari variabel kontinu X dan karena itu akan
dinyatakan dengan lambang fungsi f(x). Jika menyangkut variabel yang kontinu, f(x) dinamakan
fungsi padat peluang, atau disingkat fungsi padat dari X. Karena X didefinisikan pada ruang
sampel yang kontinu, mungkin saja f(x) tidak kontinu pada beberapa titik yang terhingga
banyaknya. Akan tetapi, kebanyakan fungsi padat yang mempunyai penggunaan praktis dalam
analisis data statistika bersifat kontinu dan grafiknya, beberapa di antaranya, dapat berbentuk
salah satu dari bentuk pada gambar berikut ini. Karena peluang akan dinyatakan sebagai luas
dan peluang merupakan bilangan positif maka fungsi padat haruslah seluruhnya terletak di atas
sumbu X.
f(x)

f(x)

f(x)

f(x)

Bentuk Khas Fungsi Padat


Agus
Statistika 1 - 81

Purnomo

Fungsi padat peluang dituliskan sedemikian rupa sehingga luas daerah, di antara kurva dan
sumbu x yang dihitung atas semua rentangan harga X pada daerah f(x) terdefinisi, adalah 1.
Kalau seluruh nilai X terletak pada selang berhingga, selalu mungkin memperluas selang
tersebut sehingga mencakup seluruh himpunan bilangan real dengan mendefinisikan f(x) sama
dengan nol pada semua titik pada selang perluasan tadi.
Peluang X mempunyai nilai antara a dan b = Luas daerah yang diarsir yaitu :
P( a< X < b)=

b
f (x) dx
a

Karena tidak satu titik ; maka :


(a x b) = (a x < b) = (a < x b) = (a < x < b)
Definisi :
Fungsi f (x) adalah fungsi padat peluang variabel random kontinu X , yang didefinisikan di
atas himpunan semua bilangan real R , bila :
1. f (x) 0 ; untuk semua x R

2. f (x) dx 1

3. P ( a < X < b ) =
f (x) dx

f(x)

Contoh Soal :
x2 / 3 untuk -1 < x < 2
f (x) =
0
Apakah itu PDF ? dan kontinu ?
Jawab :
f (x) 0
PDF
2

2 x
x3 2 8 1
f
(x)
dx

dx

] 1

9 1 9 9

1 3
1/4 x
f (x)

untuk

untuk x yang lainnya

CDF
0 x 4

Agus
Statistika 1 - 82

Purnomo

untuk

x lain

f (x) 0
41
1 24
bukan kontinu (PDF)
4 xdx 8 x | 2
0
0
1/4 x
untuk
0 x a
f (x)
=
0
untuk
x lain
Agar PDF berapa harga a ?
f (x) 0

a1
1 2a
x
dx

x | 1
4
8
0
0
1
= a2 1
8
2

kx
f (x)

2 x 4

=
0
Berapa k agar PDF ?
f (x) 0

a2 = 8 a =
untuk
untuk

x lain

4
2
k x dx 1
2
4
1
k x3 | 1
3
2
64k 8k

1
3
3
56k
1
3
3
k
56

Saya pergi bekerja dengan menggunakan bus dan setiap 5 menit bus tiba pada tempat
pemberhentian karena waktu meninggalkan rumah waktunya bervariasi maka saya tidak
selalu tiba pada pemberhentian pada waktu yang sama, berarti waktu menunggu x untuk
bus berikutnya berupa variabel random kontinu dikatakan sekumpulan nilai x yang mungkin
pada interval [ 0 , 5 ] dengan pdf-nya :
1/5
untuk
0 x 5
f(x) =
0
untuk
x yang lainnya
f(x)

1/5

Agus
Statistika 1 - 83

Purnomo

a. Probabilitas saya menunggu antara 1 sampai 3 menit :

31

15

P (1 x 3) = f(x) dx

dx

x3 2
|
51 5

b. Probabilitas saya menunggu paling sedikit 4 menit :

1
= dx
45

P(x 4)

51

5 dx 0 dx
4
5
=
=

x5
|
54

1
5

Soal-soal :
3/4 (1 - x2)
1. Diket :

2.

a)
b)
c)
d)

f (x)

untuk

-1 x 1

0
untuk
x lain
a) Apakah pdf dan cdf ?
b) Buat grafik f (x) ?
c) Hitung P (x > 0) !
d) Hitung P ( - 0,5 < x < 0,5 ) ?
Seorang profesor suatu Universitas tidak pernah menghentikan kuliahnya sebelum bel
berbunyi dan selalu mengakhiri kuliahnya diantara satu menit sesudah bel bel berbunyi. Jika
x = waktu antara bel dan kuliah berakhir dan Pdf-nya :
k x2
untuk
0 x 1
f (x) =
0
untuk
x lain
Tentukan nilai K ?
Berapakah prob. bahwa kuliah selesai 1/2 menit setelah bel berbunyi ?
Berapakah probabilitas bahwa kuliah berlanjut antara 15 sampai dengan 30 detik setelah bel
berbunyi ?
Berapakah probabilitas kuliah berlanjut paling sedikit 40 detik setelah bel berbunyi ?

Definisi :
Distribusi kumulatif F (x) suatu variabel random kontinu X dengan fungsi padat f(x) :

x
F (x) = P ( X x ) = f(t) dt

untuk

-<x <

P ( a < X < b ) = F (b) - F (a)


dan

f (x) =

d F (x)
dx

bila fungsi turunan ini ada

Contoh Soal :
Carilah F (x) dari fungsi padat peluang :
Agus
Statistika 1 - 84

Purnomo

2
f (x) = x
3
Solusi :
F(x) =
jadi

, kemudian hitung P( 0 < x 1 )

x
x t2
t 3 x x3 1
f(t)
dt

dt

9 1
9

1 3

: P( 0 < X 1) = F(1) - F(0) = 2/9 - 1/9 = 1/9

8.2 DISTIBUSI NORMAL


Distribusi peluang kontinu yang terpenting dalam seluruh bidang statistika adalah distribusi
normal. Grafiknya, disebut kurva normal, berbentuk lonceng, yang menggambarkan dengan
cukup baik banyak gejala yang muncul di alam, lndustri, dan penelitian. Pengukuran fisik di
bidang seperti percobaan meteorologi, penelitian curah hujan, dan pengukuran suku cadang yang
diproduksi sering dengan baik dapat diterangkan menggunakan distribusi normal. Di samping
itu error dalam pengukuran ilmiah dapat dihampiri dengan sangat baik oleh distribusi normal.
Pada tahun 1733, Abraham DeMoivre menemukan persamaan matematika kurva normal. Ini
merupakan dasar bagi banyak teori statistika lnduktif. Distribusi normal sering pula disebut
distribusi Gauss untuk menghormati Karl Friedrich Gauss (1777-1855), yang juga menemukan
persamaannya waktu meneliti error dalam pengukuran yang berulang-ulang mengenai bahan
yang sama.
Persamaan matematika distribusi peluang peubah normal kontinu bergantung pada dua parameter
mean dan Variansi 2, yaitu rataan dan simpangan bakunya.
Distribusi Normal : Fungsi padat varaibel acak normal X, dengan rataan dan Variansi 2
, ialah :
F (x ; ; ) =
dengan

1
e
2


)
1 (x

= 3,14159

; - < x <
dan

= 2,71828

Mempunyai 2 parameter :

= menunjukkan letak titik tengah.

= menunjukkan seberapa jauh sebaran.
Begitu diketahui maka seluruh kurva normal diketahui.
Distribusi probabilitas normal dengan mean yang sama dan standar deviasi berbeda ;

Agus
Statistika 1 - 85

Purnomo

1 1

1 < 2 < 3

2 5

3 10

100

Distribusi probabilitas normal dengan mean berbeda dan standar deviasi sama ;
5

20

40

60

Distribusi probabilitas normal dengan mean berbeda dan standar deviasi yang berbeda ;
10
20
30

50

100

150

Sifat kurva normal :


Mean, median , mode : terletak pada center line ; x =
Kurva setungkup terhadap center line yang melalui Mean
Kurva mempunyai titik belok pada x = , cekung dari bawah bila - < X < + ,
dan cekung dari atas untuk nilai x lainnya.
Kedua ujung kurva normal mendekati asimtot sumbu datar bila nilai x bergerak menjauhi
baik ke kiri maupun ke kanan.
Seluruh luas dibawah kurva dan diatas sumbu datar = 1
Luas dibawah kurva normal :

Agus
Statistika 1 - 86

Purnomo

x1

x2

P(x1 < X <x2) = luas daerah yang diarsir


x2
P(x1 X x2) f(x; , )dx
x1


1 (x )
x 2 2
1

e
2 x1

2
dx

P (x1 < X < x2) untuk kurva normal yang berbeda ?


Integral dari fungsi diatas sulit dan tidak praktis karena itu dibuat distribusi normal standar ,

II

x1

x2

x
2

yang memiliki : = 0 dan = 1


Definisi :
Bila Z merupakan variabel random yang kemungkinan harga-harganya menyatakan bilanganbilangan riil - dan + , maka Z dinamakan variabel normal standar bila dan hanya bila
probabilitas interval dari Z1 ke Z2 menyatakan luas Z1 ke Z2 antara sumbu Z dengan kurva
normalnya dan persamaan sebagai berikut :
f (Z;0,1)

1 Z2
1
2
e
2

Setiap variabel random X dapat di tranformasikan menjadi variabel random Z


dengan :

Agus
Statistika 1 - 87

Purnomo

DITRANSFORMASI

KE BENTUK STANDAR
X1

X2

P(x1 < X < x2)

1 ( x ) 2

x
2

1
2
e
2 x1

Z2
1 Z 2 z2 / 2
e
dz
=

f (Z, 0, 1) dz
2 Z1
Z1

=
=

P ( z1 < Z < z2 )

Perbandingan area dibawah kurva normal untuk satu, dua dan tiga standar deviasi dari mean.
16 % dari Area

16 % dari Area
68 %
AREA

2,28 % dari Area

2,28 % dari Area

95,4 % AREA

0,15 % dari Area

0,15 % dari Area


99,7 % AREA

Agus
Statistika 1 - 88

Purnomo

Contoh Soal :
Diketahui suatu distribusi normal dengan
mendapatkan harga antara - 8 dan 4
4

= 2 dan = 4 carilah probabilitas bahwa X

2
4 1
(1/ 2) ( x )/
P(-8 < X < 4) =
e
dx
8 2

-8

x 2 22
Z 0
4 4

-2,5

x1 8
4
x2 4
4

0,5

8 2
Z 25,
4
42
Z 05,
4
Jadi ; P( -8 < X < 4 ) = P( -2,5 < Z < 0,5 )

Soal-soal
1. Bila diketahui distribusi normal dengan = 40 dan = 6 maka rubahlah (tranformasikan )
kebentuk distribusi normal standar untuk ;
a. Luas lebih kecil dari 32
b. Luas lebih besar dari 27
c. luas antara 42 dan 51
2. Bila diketahui distribusi normal dengan = 200 dan 2 = 100 maka rubahlah kebentuk
distribusi normal standar untuk :
a. Luas dibawah 214
b. Luas diatas 179
c. Luas antara 188 dan 206
3. Tinggi rata-rata mahasiswa UNPAS adalah 165 cm dan simpangan bakunya 10 cm
a.) Berapa kemungkinan mahasiswa
UNPAS yang
tingginya lebih besar atau sama
dengan 170 cm.
b). Berapa kemungkinan
mahasiswa UNPAS yang tingginya antara 155 cm - 170
cm ?
4. Sebuah pabrik memproduksi poros kendaraan bermotor dengan batas spesifikasi diameter :

Agus
Statistika 1 - 89

Purnomo

40 0,20 mm
spesifikasi
atau (39,80 40,20) mm

Dari hasil penelitian sebelumnya diperoleh data


mesin adalah sebagai berikut :

untuk diameter poros yang dihasilkan

3998, mm
hasil proses
= 0,02 mm

Berapa persenkah produk yg. memenuhi syarat (spesifikasi) dari proes produksi tsb. ?
5. Didalam proses pengantongan semen diperoleh berat satu sak semen = 40 kg, dengan
simpangan baku = 0,2 kg. Berapa kemungkinan didalam satu sak semen terdapat lebih kecil
atau sama dengan 39,5 kg ?
6. Suatu mesin minuman diatur sedemikian rupa sehingga mengeluarkan rata-rata 207 mililiter
per cangkir bila banykanya minuman berdisttribusi normal dengan simpangan baku 15
mililiter ;
a. Berapa probabilitas cangkir akan berisi lebih besar dari 231 ml ?
b. Berapa peluang suatu cangkir berisi antara 198 dan 216 ml ?
c. Berapa cangkir yang akan kepenuhan (sehingga tumpah) bila digunakan 1000 cangkir
berukuran 237 ml ?
d. Dibawah nilai berapakah terdapat 25 % dari jumlah cangkir dengan isi terkecil ?
7. Diameter sebelah dalam suatu cincin torak berdistribusi normal dengan rata-rata 10 cm dan
simpangan baku 0,03 cm
a. Berapa proporsi cincin yang mempunyai diameter dalam melebihi 10,075 cm?
b. Berapa peluang suatu cincin torak berdiameter dalam antara 9,97 dan 10,03 cm ?
c. Jika spesifikasi ( 10 d ) cm , tentukanlah harga d sehingga spesifikasi tersebut
mencakup 90 % dari hasil produksi ?
8. Umur rata-rata sejenis mesin 10 tahun dengan simpangan baku 2 tahun, pabriknya akan
mengganti dengan gratis semua mesin yang rusak selama masa garansi. Bila pabrik tersebut
bersedia hanya mengganti 3 % dari mesin rusak, berapa lamakah masa garansi yang
seharusnya ditawarkan bila umur mesin berdistribusi normal ?
9. Bila nilai ujian statistik suatu kelas berdistribusi normal dengan rata-rata 74 dan simpangan
baku 7,9 hitunglah :
a. Nilai lulus terendah bila mahasiswa dengan nilai 10 % terendah mendapatkan E ( gagal)
b. Nilai B tertinggi bila mahasiswa dg. nilai 5 % tertinggi mendapat A ?
c. Nilai B terendah bila mahasiswa dengan nilai 10 % tertinggi mendapat A dan 25 %
berikutnya mendapat B ?
10. IQ 600 pelamar ke suatu perguruan tinggi berdistribusi hampiran normal dengan rataan 115
dan simpangan baku 12. Bila perguruan tinggi itu hanya menerima yang mempunyai IQ
paling rendah 95, berapa banyakkah pelamar yang akan ditolak jika hanya didasarkan atas
ketentuan ini tanpa memandang kemampuan yang lain ?

PENDEKATAN NORMAL TERHADAP BINOMIAL


Syarat :
Baik sekali bila n besar
Cukup baik bila n kecil asalkan p cukup dekat dengan 1/2
Agus
Statistika 1 - 90

Purnomo

Teorema : Bila X variabel acak binomial dengan rata-rata = np dan


variasi 2 = npq maka bentuk limit distribusi :

X np
npq

bila n ialah distribusi normal baku n ( Z, 0,1 )


Contoh Soal :
Peluang seseorang penderita sembuh dari suatu penyakit darah yang jarang muncul 0.4. Bila
diketahui ada 100 orang yang telah terserang penyakit ini, berapa peluangnya bahwa kurang dari
30 orang yang sembuh ?
Solusi : = np = 100 (0.4) = 40 ; = npq = (100)(0.6)(0.4) = 4.899
Z

29.5 40
2.14
4.899

P(X<30) = P(Z< -2.14) = 0.0162


0.014775

Soal-soal :
1. Peluang seseorang sembuh dari suatu operasi jantung adalah 0,9 berapakah peluang antara
dan termasuk 84 dan 95 dari 100 orang yang dioperasi akan sembuh ?
2. Suatu perusahaan farmasi menyatakan bahwa suatu jenis obat dapat menyembuhkan rata-rata
80% penderita suatu penyakit darah. Untuk memeriksa kebenarannya badan pengujian
pemerintah mencoba obat tersebut pada sampel 100 penderita dan akan memutuskan obat itu
baik bila 75 penderita atau lebih sembuh.
a. Berapakah probabilitas bahwa obat itu akan ditolak padahal probabilitas sembuh
sesungguhnya benar 0,8 ?
b. Berapakah peluang bahwa obat itu akan diterima badan pemerintah padahal peluang
sembuh serendah 0,7 ?
3. Suatu proses produksi menghasilkan 10% barang yang cacat. Bila 100 barang diambil secara
acak dari proses tersebut, berapa peluang banyaknya yang cacat : a. melebihi 13 ? b.
kurang dari 8?
4. Peneliti di George Washington University dan National Institute of Health menyatakan kirakira 75% orang percaya bahwa 'obat penenang amat membantu membuat orang menjadi
lebih tenang dan santai'. Dari 80 orang yang diwawancarai, berapa peluangnya bahwa
a. paling sedikit 50 yang berpendapat demikian ?
b. paling banyak 56 yang berpendapat demikian ?
5. Seperenam dari mahasiswa pria tahun pertama yang masuk ke suatu perguruan tinggi negeri
di suatu propinsi berasal dari luar propinsi itu. Bila para mahasiswa dimasukkan secara acak
ke asrama (semua harus masuk asrama) 180 orang dalam satu gedung, berapakah peluang
bahwa dalam suatu gedung tertentu, seperlima mahasiswa berasal dari luar propinsi itu ?
6. Suatu perusahaan farmasi mengetahui bahwa rata-rata 5% dari sejenis pil mempunyai
campuran di bawah kekuatan minimum, sehingga tak memenuhi persyaratan. Berapakah
peluang bahwa kurang dari 10 dalam contoh 200 pil tak memenuhi persyaratan?
7. Menurut statistik yang dikeluarkan National Highway Traffic Safety Administration dan
National Safety Council di AS.pada malam Minggu rata-rata 1 dari setiap 10 pengemudi di
jalan dalam keadaan mabuk. Bila 400 pengemudi diperiksa secara acak pada Sabtu malam,
berapa peluangnya bahwa banyaknya pengemudi yang mabuk
a. kurang dari 32 ?
b. lebih dari 49 ?
c. paling sedikit 35 tapi kurang dari 47 ?
Agus
Statistika 1 - 91

Purnomo

8.3 DISTRIBUSI GAMMA DAN EKSPONENSIAL


Distribusi Eksponensial dan Gamma memainkan peran yang penting dalam teori antrian dan
teori keandalan (reliabilitas). Jarak antara waktu tiba di fasilitas pelayanan (misalnya bank
dan pintu jalan tol), dan lamanya waktu sampai rusaknya suku cadang dan alat listrik, sering
menyangkut dsitribusi eksponensial. Hubungan antara gamma dan eksponensial
memungkinkan penggunaan distribusi gamma dalam jenis persoalan yang sama. Distribusi
gamma mendapat namanya dari fungsi gamma yang sudah dikenal luas, dipelajari dalam
banyak bidang matematika
Definisi : Fungsi Gamma

( ) X 1 e x dx
0

; untuk > 0

Fungsi gamma dipakai dalam mendefinisikan distribusi gamma


Distribusi Gamma : Variabel acak kontinu X berdistribusi gamma dengan parameter dan
, bila fungsi padatnya berbentuk :
1
1e x /
f(x)
x
untuk x > 0
( )
= 0
untuk x lainnya
bila = 0 dan > 0
Teorema : Rataan dan variansi distribusi gamma adalah :
Mean
() =

Variansi
( 2 ) =
2
Untuk setiap integer positif n :

(n) (n 1) !
1

2

(1) = 1

Agus
Statistika 1 - 92

Purnomo

f(x)
1,0

1, 1

0,5

2, 1

4, 1
x
0

Distribusi Gamma
Distribusi Gamma yang khas :
Distribusi Gamma yang khusus dengan = 1, distribusi gamma berubah menjadi Distribusi
Eksponensial.
Distribusi Eksponensial, Variabel acak kontinu X berdistribusi Eksponensial dengan parameter
, bila fungsi padatnya berbentuk :
1
11 x /
f(x)
x
e
untuk x > 0
1
(1)
= 0
untuk yang lainnya
sehingga :

1 x/

untuk x 0

f ( x)
0

dengan > 0

untuk x lainnya
;

Rataan dan variansi distribusi eksponensial adalah :


Mean
() =

2
Variansi ( ) =
2

PENERAPAN DISTRIBUSI EKSPONENSIAL DAN GAMMA


Berikut disajikan dasar bagi penerapan distribusi eksponensial dalam 'waktu sampai tiba' atau
persoalan waktu sampai kejadian Poisson. Di sini akan diberikan ilustrasi kemudian diteruskan
dengan pembahasan peran distribusi gamma dalam penerapan ini. Perhatikan bahwa rataan
Agus
Statistika 1 - 93

Purnomo

distribusi eksponensial adalah parameter , kebalikan dari parameter pada distribusi Poisson.
Parameter yang penting adalah rataan waktu antara kejadian. Teori keandalan (reliabilitas)
yang menyangkut kegagalan peralatan sering memenuhi proses Poisson ini, di sini disebut
rataan waktu antara kegagalan. Banyak kerusakan peralatan memenuhi proses Poisson, dan
karena itu distribusi eksponenisal dapat diterapkan di situ.
Pada contoh berikut diberikan suatu penerapan sederhana distribusi eksponensial pada soal
dalam keandalan. Distribusi binomial juga berperan dalam penyelesaiannya.
Contoh soal eksponensial:
1. Misalkan suatu sistem mengandung sejenis komponen yang daya tahannya dalam tahun
dinyatakan oleh variabel acak T yang berdistribusi eksponensial dengan parameter waktu
rataan sampai gagal = 5. Bila sebanyak 5 komponen tersebut dipasang dalam sistem yang
berlainan, berapakah peluang bahwa paling sedikit 2 masih akan berfungsi pada akhir tahun
kedelapan ?
Jawab
Peluang bahwa suatu komponen tertentu masih akan berfungsi setelah 8 tahun adalah :
P(T > 8)

t
1 5
e
dt
5 8
8
=
e 5

0.2

Misalkan X menyatakan banyaknya komponen yang masih berfungsi setelah 8 tahun. Dengan
menggunakan distribusi binomial diperoleh :
b ( x 2 ; 5 , 0.2 ) = 1 B(1; 5; 0.2)
= 0.2627
2. Rata - rata 3 truk yang datang perjam untuk membongkar muatan pada suatu gudang. Berapa
probabilitas waktu antar kedatangan truk-truk berikutnya :
a) Lebih kecil dari 5 menit ?
= 1/3
;
5 menit
=
1/12 jam
1
1/12 3x
dx 1 e 4 0,221
3e
0

b) Paling sedikit 45 menit ?

9
3x
4 0,105
3
e
dx

3/ 4

Pentingnya distribusi gamma terletak pada kenyataan bahwa distribusi ini merupakan suatu
keluarga distribusi yang distribusi lainnya merupakan hal khusus. Tetapi gamma sendiri
mempunyai terapan penting dalam waktu menunggu dan teori keandalan. Jika distribusi
eksponensial memberikan waktu sampai terjadinya kejadian Poisson (atau waktu antara kejadian
Poisson) maka waktu (atau ruang) terjadinya sampai sejumlah tertentu kejadian Poisson terjadi
merupakan variabel acak yang fungsi padatnya diperikan oleh distribusi gamma. Jumlah tertentu
kejadian ini ialah parameter dalam fungsi padat gamma. Karena itu mudah dipahami bahwa
bila = 1 hal khusus distribusi eksponensial berlaku. Fungsi padat gamma dapat diperoleh dari
hubungannya dengan proses Poisson mirip dengan cara memperoleh fungsi padat eksponensial.
Berikut adalah contoh numerik penggunaan distribusi gamma dalam penerapan waktu
menunggu.
Contoh soal :
Agus
Statistika 1 - 94

Purnomo

Misalkanlah bahwa hubungan telepon tiba di suatu gardu (sentral) memenuhi proses Poisson
dengan rata-rata 5 hubungan masuk per menit. Berapakah peluangnya bahwa setelah semenit
berlalu baru 2 sambungan masuk ke gardu tadi?
Solusi : = 1/ = 1/5
dan = 2
Misalkan variabel acak X menyatakan waktu dalam menit yang berlalu sebelum 2 hubungan
masuk.

x 1
x /
xe
dx
P (X x) =
2
0
1
5x
P (X 1) = 25 x e
dx
0
= [ 1 e 5(1) (1+5) ] = 0.96

8.4 DISTRIBUSI KHI-KUADRAT


Distribusi Gamma khas yang kedua adalah distribusi Khi-Kuadrat ( 2 ) jika =/2 ; = 2 ,
= bilangan bulat positif.
Distribusi ini mempunyai parameter tunggal yaitu = derajat kebebasan.
Definisi Distribusi Khi-Kuadrat :
variabel random kontinu X berdistribusi khi-kuadrat dengan derajat kebebasan maka density
function-nya :

/2
2 ( / 2)

x /21e x/2

x0

f(x)

untuk x lainnya

dengan bilangan bulat positif


Rataan dan Variansi distribusi Khi-Kuadrat adalah :
Mean
() =
variansi ( 2 ) = 2
Distribusi Khi-Kuadrat tidak hanya dikaitkan dengan distribusi normal, tetapi juga digunakan
Agus
Statistika 1 - 95

Purnomo

untuk pengujian hipotesis dan penaksiran.

8.5 DISTRIBUSI BETA


Probability Density Function untuk suatu variabel random yang mempunyai interval nilai dari 0
sampai dengan 1 didekati dengan distribusi Beta, probabilitas density-nya :

( ) 1 1
x (1 x) untuk 0 x 1, 0, 0

f(x) ( )()
0

Mean

Variansi

untuk x yang lainnya


()


( )2 ( 1)

( 2 ) =

f(x)
2

x
0

0,2

0,4

0,6

0,8

1,0

Distribusi Beta dengan = 3 dan = 2


Contoh Distribusi Beta :
Jalan raya di suatu daerah memerlukan perbaikan setiap tahun diman variabel randomnya
merupakan distribusi beta dengan = 3 dan = 2 hitunglah ?
a) Persentase rata-rata perbaikan jalan raya setiap tahun

0,60 60 %
3 2

b) Probabilitas sebanyak-banyaknya setengah dari jalan raya tersebut akan membutuhkan


perbaikan setiap tahun ?
(5) = 4 ! =24; (3)= 2 ! = 2
; (2) = 1 ! = 1
Agus
Statistika 1 - 96

Purnomo

sehingga :
1/2
2
3
4 1/2
12 x (1 x) dx 4x 3x |
0
0

5
0,3125
16

8.6 DISTRIBUSI WEIBULL


Teknologi modern telah memungkinkan orang merancang banyak sistem yang rumit yang
penggunaannya, atau barangkali keamanannya, bergantung pada keandalan berbagai komponen
dalam sistem tersebut. Sebagal contoh, suatu sekering mungkin putus, tiang baja mungkin
melengkung, atau alat pengindera panas tak bekerja. Komponen yang sama dalam lingkungan
yang sama akan rusak dalam waktu yang berlainan yang tak dapat diramalkan. Telah kita lihat
peran yang dimainkan oleh distribusi gamma dan eksponensial dalam jenis persoalan seperti lni.
Salah satu distribusi lain yang telah banyak sekali dipakai akhir-akhir ini dalam menangani
masalah seperti ltu ialah distribusi Weibull yang diperkenalkan oleh fisikawan Swedia Waloddi
Weibull pada 1939.
Definisi Distribusi Weibull :
Variabel acak kontinu X berdistribusi Weibull, dengan parameter dan , jika density
function-nya :

1 x
untuk x 0, 0, 0
f(x) x e
0
untuk x lainnya
Distribusi Weibull ( = 1)

0,5

Jika

Agus
Statistika 1 - 97

1,0

1,5

Distribusi Eksponensial
Purnomo

Jika

Mean

Variansi

>

1
()

( 2)

Mendekati Distribusi Normal

1
1/ 1
=

2 / 3 1


2
1
1

Contoh Soal Distribusi Weibull:


Masa hidup suatu batery ( dalam jam ) merupakan variabel random yang berdistribusi weibull
dengan = 0,1 dan = 0,5 hitunglah
a. Mean masa hidup dari batterry tersebut

=
1/ (1 1 / )
=
(0,1)-2 (3) =
200
jam
b. Probabilitas masa hidup battery akan lebih besar dari 300 jam ?

0,5
0,5
f(t) (0,05) t 0,5e0,1 t dt e0,1(300) 0,177
300

Soal-soal :
1. Bila peubah acak X berdistribusi gamma dengan =2 dan =1, hitunglah P(1,8 < X < 2,4).
2. Di suatu kota, pemakaian air sehari (dalam jutaan liter) berdistribusi hampiran gamma
dengan =2 dan =3. Bila kemampuan menyediakan air 9 juta liter sehari, berapakah
peluang pada suatu hari tertentu persediaan air tidak mencukupi ?
3. Misalkan waktu, dalam jam, yang diperlukan untuk memperbaiki pompa panas berbentuk
peubah acak X berdistribusi gamma dengan parameter =2 dan =1/2. Berapa peluangnya
bahwa perbaikan berikutnya akan memerlukan
a. paling lama 1 jam?
b. paling sedikit 2 jam?
4. Di suatu kota, pemakaian tenaga listrik harian, dalam jutaan kilowatt-jam, berbentuk variabel
acak X yang berdistribusi gamma dengan rataan = 6 dan variansi 2 = 12.
a. Cari nilai dan .
b. Cari peluangnya bahwa pada suatu hari tertentu pemakaian harian tenaga listrik akan
melebihi 12 juta kilowatt-jam.
5. Lamanya waktu untuk melayani seseorang di suatu kafetaria merupakan suatu variabel acak
berdistribusi eksponensial dengan rataan 4 menit. Berapakah peluang seseorang akan
dilayani dalam waktu kurang dari 3 menit pada paling sedikit 4 dari 6 hari berikut?
6. Umur dalam tahun suatu jenis tombol listrik berdistribusi eksponensial dengan tingkat
kegagalan = 2. Bila 100 alat semacam ini dipasang dalam sistem yang berlaianan,
berapakah peluang paling banyak 30 akan gagal selama tahun pertama ?
7. Para insinyur pabrik busi merk STN untuk kendaraan roda empat menyatakan bahwa
umur pakai busi buatan (dalam jam ) memiliki random variabel yang mengikuti distribusi
weibull, dengan = 0,2 dan = 0,4 kita sebagai konsumen busi tersebut ingin mengetahui
berapa ekspektasi umur pakai dan standar deviasinya serta probabilitas busi tersebut akan
berumur lebih dari 700 jam ?
Agus
Statistika 1 - 98

Purnomo

8. Misalkan bahwa panjang umur, dalam tahun, baterai alat bantu pendengaran berbentuk
variabel acak yang berdistribusi Weibull dengan =1/2 dan =2.
a. Berapa lama baterai tersebut dapat diharapkan tahan ?
b. Berapa peluangnya baterai tersebut masih dapat dipakai setelah 2 tahun ?
9. Variabel acak kontinu X berdistribusi beta dengan parameter dan bila fungsi padatnya

( ) 1 1
x (1 x) untuk 0 x 1, 0, 0

f(x) ( )()
0

untuk x yang lainnya

Bila proporsi suatu televisi merk tertentu membutuhkan perbaikan selama tahun pertama
pemakaiannya merupakan suatu peubah acak berdistribusi beta dengan =3 dan = 2,
berapakah peluang paling sedikit 80 % televisi baru merk tersebut yang terjual memerlukan
perbaikan dalam tahun pertama pemakaiannya ?
10. Menurut suatu penelitian yang diterbitkan oleh sekelompok sosiolog di University of
Massachusetts, sekitar 49 % pengguna Vallum di negara bagian Massachusetts adalah
karyawan berkerah putlh. Berapakah peluangnya bahwa sebanyak 482 sampal 510 dari 1000
pengguna Valium yang dipilih secara acak adalah karyawan berkerah putih ?
11. Distribusi eksponensial sering digunakan pada waktu menunggu antara keberhasilan dalam
proses Poisson. Bila banyaknya sambungan telepon per jam yang diterima oleh suatu sentral
telepon berbentuk variabel acak Poisson dengan parameter = 6, dan kita tahu bahwa waktu,
dalam jam, antara sambungan yang berhasil berdistribusi eksponensial dengan parameter =
1/6. Berapa peluangnya menunggu lebih dari 15 menit antara sembarang 2 sambungan yang
berturutan ?
12. Suatu Pabrik mesin besar ingin membeli paku keling dari satu di antara dua pabrik yang ada.
Diinginkan daya tahan tiap keling melebihi 10.000 psi. Dua pabrik (A dan B) memasukkan
penawaran. Keduanya mempunyai keling yang daya tahannya berdistribusi normal. Rataan
daya tahan dari masing-masing A dan B 14.000 psi dan 13.000 psi dengan simpangan baku
2000 psi dan 1000 psi. Pabrik yang mana yang menghasilkan, pada rata-ratanya, paling
sedikit jumlah keling yang cacat ?
13. Menurut Consumers Digest terbitan Mei/Juni 1981, hsl. sensus menunjukkan bahwa di tahun
1978 hampir 53 % dari semua rumah tangga di AS hanya terdiri atas 1 atau 2 orang.
Misalkanlah bahwa persentasi ini masih berlaku sekarang, berapakah peluangnya sebanyak
490 sampai 515 dari 1000 rumah tangga di AS yang dipilih secara acak akan terdiri atas 1
atau 2 orang ?
14. Umur sejenis alat menurut iklannya mempunyai tingkat kegagalan 0,01 per jam. Tingkat
kegagalannya tdk. berubah & mengikuti dist. eksponensial.
a. Berapa rataan waktunya sampai gagal ?
b. Berapa peluangnya bahwa 200 jam berlalu sebelum suatu kegagalan diamati?
15. Dalam pabrik pemrosesan kimia penting dijaga agar kualitas dari gugusan hasil jenis tertentu
berada di atas 80 %. Bila kualitasnya di bawah 80 % untuk jangka waktu yang agak panjang
maka perusahaan akan merugi. Gugus hasil yang cacat yang muncul sekali~sekali tidak
menimbulkan persoalan, jadi tidak perlu dirisaukan. Tetapi bila beberapa gugus yang cacat
dihasilkan sehari maka pabrik diberhentikan dan perbaikan dilakukan. Diketahui bahwa
hasilnya berdistribusi normal dengan simpangan baku 4 %.
Agus
Statistika 1 - 99

Purnomo

a. Berapakah peluangnya 'lampu merah palsu menyala' (hasil di bawah 80%) padahal rataan
hasilnya 85 % ?
b. Berapa peluangnya bahwa iugus hasil berada di atas 80% padahal rataan hasil 79 % ?
16. Pandanglah tingkat kegagalan suatu komponen listrik sekali setiap 5 jam. Ingin diselidiki
waktu yang diperlukah agar 2 komponen gagal.
a. Andaikan di sini distribusi gamma berlaku, berapakah rataan waktu yang diperlukan
untuk kegagalan 2 komponen ?
b. Berapakah peluangnya 12 jam telah berlalu sebelum 2 komponen gagal ?
17. Pemuaian suatu batang baja bila diberi beban tertentu telah diketahui berdistribusi normal
dengan rataan 0,05 cm dan = 0,01 cm. Carilah peluangnya bahwa pemuaian
a. lebih dari 0,1 cm; b. kurang dari 0,04 cm; c. antara 0,025 dan 0,065 cm.
18. Suatu satelit terkendali diketahui mempunyai error (jarak dari sasaran) yang berdistribusi
normal dengan rataan nol dan simpangan baku 4 m. Pembuat satelit tersebut menetapkan
'keberhasilan' bila peluncuran menempatkan satelit dalam jarak 10 m dari sasaran. Hitunglah
peluangnya satelit gagal.
19. Seorang tukang merencanakan menguji sejenis damar yang dikembangkan di laboratorium
untuk menentukan waktu yang diperlukan sebelum perekatan terjadi. Diketahui bahwa
rataan waktu untuk merekat adalah 3 jam dan simpangan baku 0,5 jam. Hasil dianggap tidak
memuaskan bila waktu merekatnya kurang dari 1 jam ataupuh lebih dari 4 jam. Beri
komentar tentang kegunaan damar tadi. Berapa seringkah hasilnya dianggap tidak
memuaskan ?

HUBUNGAN TIMBAL BALIK ANTARA BEBERAPA DISTRIBUSI

Agus
Statistika 1 - 100

Purnomo

Negatif
Binomial
p,k

k=1

Geometrik

Hypergeometrik
N,n,k

np
n

Poisson

k
N

0,5

Binomial
n.p

np

npq

Bernoulli

Normal

Normal
Standar

Gamma

1
Chi - squared
Exponential

1
Weibull

PARAMETERISASI DISTRIBUSI KONTINU


Parameter distribusi kontinu bisa diklasifikasi berdasarkan interprestasi secara fisik atau
Agus
Statistika 1 - 101

Purnomo

geometrik, yaitu :
Parameter Lokasi , menunjukkan suatu titik lokasi pada absscissa ( x axis) dari nilai range
distribusi. Biasanya merupakan titik tengah (seperti, mean distribusi normal) atau titik
terendah dari range distribusi. Pada beberapa kasus, parameter lokasi kadang-kadang disebut
parameter geser (shift parameters), karena bila berubah, maka distribusi akan berubah ke kiri
atau ke kanan tanpa ada perubahan yang lain.
Parameter Skala , menentukan skala (atau unit) dari pengukuran nilai dalam suatu range
distribusi. Perubahan nilai menyebabkan mengecil (compresses) atau membesar (expands)
distribusi yang berhubungan tanpa merubah bentuk dasarnya.
Parameter Bentuk , menentukan jarak dari lokasi dan skala, bentuk dasar dari suatu distribusi
dalam famili umum atau distribusi yang bersangkutan. Perubahan menyebabkan perubahan
padaaproperti distribusi (seperti skewness), perubahan ini lebih fundamental dari pada perubahan
lokasi atau skala. Beberapa distribusi, seperti Exponensial dan Normal, tidak mempunyai
parameter bentuk, sementara distribusi yang lain seperti Beta mempunyai dua parameter bentuk.

Agus
Statistika 1 - 102

Purnomo