ii
6 SEBARAN PELUANG TEORITIS ................................................................................ 42
6.1 Sebaran Binom ................................................................................................. 42
6.2 Sebaran Hipergeometrik ................................................................................ 44
6.3 Sebaran Poisson ............................................................................................... 46
6.4 Sebaran Seragam ............................................................................................. 47
6.5 Sebaran Normal ............................................................................................... 48
6.6 Latihan Soal ...................................................................................................... 51
7 SEBARAN PERCONTOHAN ....................................................................................... 54
7.1 Contoh Acak...................................................................................................... 54
7.2 Teori Pengambilan Contoh............................................................................. 54
7.3 Sebaran Contoh dari Rataan (Mean) ............................................................ 55
7.4 Sebaran contoh dari (n-1)S2/ 2 .................................................................. 56
7.5 Sebaran t-student............................................................................................ 56
7.6 Sebaran F .......................................................................................................... 57
7.7 Sebaran Contoh Bagi Beda Dua Nilaitengah ............................................... 57
7.8 Latihan Soal ...................................................................................................... 58
8 PENDUGAAN PARAMETER ....................................................................................... 59
8.1 Penduga Paramater......................................................................................... 59
8.2 Pendugaan Nilai tengah.................................................................................. 60
8.3 Pendugaan Beda Dua Nilai Tengah Populasi ............................................... 61
8.4 Pendugaan Proporsi......................................................................................... 63
8.5 Pendugaan Beda Dua Proporsi....................................................................... 64
8.6 Latihan Soal ...................................................................................................... 65
9 PENGUJIAN HIPOTESIS............................................................................................ 67
9.1 Hipotesis Statistik............................................................................................ 67
9.2 Pengujian Hipotesis......................................................................................... 68
Keadaan yang sesungguhnya .................................................................................... 68
9.3 Uji Satu Arah Dan Dua Arah ........................................................................... 71
9.4 Uji Rataan Populasi ......................................................................................... 72
9.5 Latihan Soal ...................................................................................................... 77
10 ANALISIS REGRESI DAN KORELASI...................................................................... 78
10.1 Regresi Linear Sederhana ........................................................................... 78
10.2 Pendugaan Koefisien Regresi ..................................................................... 79
10.3 Pengujian Hipotesis Bagi Koefisien Regresi ............................................ 80
10.4 Peramalan / Pendugaan Bagi Y ................................................................. 82
10.5 Kesesuaian Model......................................................................................... 83
10.6 Korelasi .......................................................................................................... 84
10.7 Latihan Soal .................................................................................................. 89
DAFTAR PUSTAKA ........................................................................................................... 90
iii
1 PENDAHULUAN
2
Tidak ada alasan tertentu kategori mana yang disebut di awal dan mana yang di
akhir.
2. Peubah Ordinal, yaitu jenis peubah yang pengkategoriannya bisa diurutkan
berdasarkan kriteria tertentu yang bermakna. Yang termasuk dalam jenis peubah
ini, misalnya :
- pendidikan : SD, SMP, SMA, Diploma, S1, S2, S3. Urutan tersebut merupakan
urutan pendidikan rendah ke tinggi.
- tingkat kesetujuan : sangat tidak setuju, tidak setuju, netral, setuju, sangat
setuju. Urutan tersebut dari tingkat yang paling tidak setuju hingga setuju.
3
Atau kalau misalnya yang diukur adalah diameter ujung bolpoin pada suatu
pemeriksaan pengendalian mutu produk (diukur dalam mm). Kemudian dikategorikan
seperti berikut :
- < 1 mm atau > 2 mm dinyatakan tidak memenuhi syarat
- 1 mm s/d 2 mm dinyatakan memenuhi syarat
Pada akhirnya diameter bolpoin dinyatakan menjadi dua kategori : memenuhi syarat dan
tidak memenuhi syarat, dan ini adalah peubah nominal.
Pengetahuan tentang jenis peubah ini sangat perlu untuk diketahui karena menyangkut
analisis yang digunakan dan ketajaman analisisnya. Setiap analisis hanya bisa untuk jenis
peubah tertentu, tidak sembarangan. Jadi perlu diperhatikan benar analisis apa yang bisa
untuk data kita.
4. Data
Data adalah semua bentuk keterangan yang berhubungan dengan variabel tertentu yang
dicatat dari objek yang sedang menjadi perhatian. Dilihat dari rentang waktu
pengumpulannya, data dapat dibedakan ke dalam tiga kelompok, yaitu data runtun waktu,
data cross section, dan data panel. Data runtun waktu adalah hasil pengukuran pada satu
atau lebih variabel yang pengamatannya dilakukan secara teratur sepanjang periode
tertentu. Data cross section adalah data yang tersusun dari satu atau lebih variabel yang
dikumpulkan dari banyak objek pada satu masa tertentu. Sedangkan data panel adalah
data yang tersusun dari satu atau lebih variabel yang berasal dari banyak objek yang
dicatat secara teratur sepanjang periode tertentu.
4
Industri: perencanaan desain produk yang bisa diterima pasar, pemilihan bahan baku yang
sesuai
Sosial: penentuan faktor-faktor demografi yang mempengaruhi keberhasilan pembangunan,
penentuan strategi penyuluhan, penentuan strategi peningkatan motivasi
Ekonomi: hubungan antar peubah ekonomi, pemodelan ekonometrika
Percepatan penerapan statistika menjadi semakin berkembang secara luas dengan
adanya kemajuan di bidang komputer dan tekhnologi software. Dengan adanya komputer
penghitungan statistik menjadi semakin cepat, teliti, dan akurat, sehingga peranan statistika
menjadi semakin berkembang di berbagai bidang kehidupan terutama dalam analisis data dan
keperluan perencanaan. Beberapa contoh paket program statistika antara lain:
SAS (Statistics Analysis System)
SPSS (Statistics Program Science For Social)
MINITAB
2. Data apa kiranya akan dicatat seorang kepala desa untuk mengukur:
a. produktivitas lahan sawah di desanya
b. tingkat penghasilan penduduk di desanya
c. potensi tenaga kerja di desanya
d. keberadaan kepala keluarga di desanya
e. kemajuan pelayanan kesehatan ibu dan anak di desanya
3. Seorang petugas keamanan jalan raya lintas cepat mencatat setiap peristiwa kecelakaan
lalu lintas yang terjadi di jalan raya itu. Yang dicatat adalah:
a. jenis kendaraan bermotor yang mengalami kecelakaan
b. warna kendaraan bermotor itu
c. umur pengemudi
d. panjang batas tapak mengerem di jalan raya sebelum kendaraan tersebut bertabrakan
e. ruas jalan tempat kecelakaan itu terjadi
f. Jalur alan tempat kecelakaan terjadi
manakah dari data yang dicatat tersebut menghasilkan:
(i) data numerik
(ii) data kategorik berskala nominal
(iii) data kategorik berskala ordinal
5
2 PENYAJIAN DATA
2.1 Pendahuluan
Data yang telah dikumpulkan, baik dari populasi maupun dari sampel, perlu ditata atau
diorganisir, diolah dan disajikan secara sistematis dan rapi sehingga mudah dan cepat dipahami
dan dimengerti.
Teknik penyajian data umumnya disesuaikan dengan jenis peubah yang akan disajikan.
Namun secara garis besar ada dua cara penyajian data, yaitu tabel dan grafik/gambar. Ada
beberapa bentuk tabel yang biasanya digunakan, seperti tabel frekuensi. Sedangkan beberapa
bentuk gambar, seperti diagram batang, diagram lingkaran, diagram dahan daun, histogram,
diagram kotak garis dan scater plot. Penggunaan beberapa teknik penyajian data tersebut
disesuaikan dengan tipe peubahnya.
6
Dari peubah-peubah yang diamati, yang termasuk peubah kategorik adalah jenis kelamin,
agama dan pendidikan. Penyajian data dari ketiga peubah tersebut dapat dilakukan dengan:
1. Tabel frekuensi
Tabel atau daftar merupakan kumpulan angka yang disusun menurut kategori-kategori
data. Tabel frekuensi merupakan gambaran frekuensi atau banyaknya objek menurut
kategori yang ada. Selain menyajikan frekuensi data, untuk memudahkan interpretasi
biasanya dalam tabel juga disajikan persentase dari masing-masing kategori yang
merupakan rasio dari frekuensi masing-masing kategori terhadap total objek yang ada. Ada
tiga jenis tabel frekuensi berdasarkan banyaknya peubah yang terdapat pada tabel, yaitu
tabel satu arah, dua arah dan multi arah.
a. tabel satu arah yaitu tabel yang hanya terdiri dari satu kategori atau peubah
misalnya akan disajikan tabel banyaknya anggota koperasi menurut jenis kelamin, maka
tabel yang diperoleh adalah:
b. tabel dua arah, yaitu tabel yang terdiri dari dua kategori atau dua peubah
misalnya akan disajikan tabel banyaknya anggota koperasi menurut jenis kelamin dan
tingkat pendidikan, maka tabel yang diperoleh adalah:
Pendidikan *)
Jenis Kelamin Total
Data 0 1 2 3 4
perempuan N 2 2 4 1 9
% Baris 22.2% 22.2% 44.4% 11.1% 0.0% 100.0%
% Kolom 66.7% 40.0% 66.7% 25.0% 0.0% 45.0%
% Total 10.0% 10.0% 20.0% 5.0% 0.0% 45.0%
Laki-laki N 1 3 2 3 2 11
% Baris 9.1% 27.3% 18.2% 27.3% 18.2% 100.0%
% Kolom 33.3% 60.0% 33.3% 75.0% 100.0% 55.0%
% Total 5.0% 15.0% 10.0% 15.0% 10.0% 55.0%
Total N 3 5 6 4 2 20
% Baris 15.0% 25.0% 30.0% 20.0% 10.0% 100.0%
% Kolom 100.0% 100.0% 100.0% 100.0% 100.0% 100.0%
% Total 15.0% 25.0% 30.0% 20.0% 10.0% 100.0%
Keterangan: *) 0=Tidak sekolah; 1=SD; 2=SLTP; 3=SLTA; 4=S0/S1/S2/S3
7
2. Gambar
Penyajian data dengan gambar/grafik adakalanya lebih efektif dalam menyajikan
informasi/karakteristik suatu data. Pesan visual yang diberikan oleh gambar selain lebih
menarik untuk dilihat juga lebih memudahkan dalam melakukan pembandingan.
Gambar/grafik yang biasanya digunakan untuk data dengan peubah kategorik adalah:
a. diagram batang. Diagram ini berupa batang-batang yang menggambarkan nilai dari
masing-masing kategori. Untuk membuat diagram batang, data yang diambil biasanya
diambil setelah dalam bentuk tabel frekuensi atau tabel kontingensi. Pada contoh di
atas, jika frekuensi jenis kelamin anggota koperasi disajikan dalam bentuk grafik akan
berupa:
12
10
8
Frekuensi
6
4
2
0
Perempuan Laki-laki
Jenis Kelamin
Sedangkan jika frekuensi jenis kelamin dan tingkat pendidikan dari anggota koperasi
disajikan dalam bentuk grafik akan berupa:
5
4
Frekuensi
3
2
1
0
perempuan Laki-laki
Jenis Kelamin
Pendidikan:
0 1 2 3 4
b. Diagram lingkaran. Diagram ini berupa lingkaran yang terbagi-bagi dalam beberapa
bagian. Masing-masing bagian merupakan representasi dari berbagai kategori, dan luas
dari bagian itu berdasarkan persentase masing-masing kategori. Jika frekuensi anggota
8
koperasi menurut jenis kelamin disajikan dalam bentuk diagram lingkaran, maka
langkah-langkah pembuatannya adalah:
- hitung luas masing-masing kategori:
Perempuan = 360o x 45% = 162o
Laki-laki = 360o x 55% = 198o
- gambarkan masing-masing kategori berdasarkan besar luasannya
Stem-and-leaf of Tinggi N = 20
Leaf Unit = 1.0
1 14 9
2 15 4
4 15 59
10 16 012234
10 16 556789
4 17 002
1 17 5
9
Sedangkan untuk peubah berat badan adalah:
Stem-and-leaf of Berat N = 20
Leaf Unit = 1.0
1 4 6
2 4 8
6 5 0011
9 5 333
10 5 5
10 5 67
8 5 889
5 6 01
3 6 3
2 6 5
1 6
1 6 9
9 untuk n 250
c
1 3.3 log n untuk n 250
c. Hitung lebar selang kelas yaitu rasio antara rentang data dengan banyaknya kelas
d. Hitung banyaknya pengamatan pada setiap kelas
e. Hitung frekuensi relatif tiap-tiap kelas yang merupakan rasio antara frekuensi kelas
dengan total pengamatan (n).
Misalnya akan dibuat tabel frekuensi untuk peubah tinggi badan. Bentuk tabelnya adalah:
Nilai
frekuensi
Selang tengah Frekuensi
relatif
kelas
148.5 - 151.5 150 1 0.05
151.5 - 154.5 153 1 0.05
154.5 - 157.5 156 1 0.05
157.5 - 160.5 159 2 0.10
160.5 - 163.5 162 4 0.20
163.5 - 166.5 165 4 0.20
166.5 - 169.5 168 3 0.15
169.5 - 172.5 171 3 0.15
172.5 - 175.5 174 1 0.05
Total 20 1.00
10
3. Histogram
Histogram merupakan grafik dari tabel distribusi frekuensi. Histogram digambarkan pada
sistem salib sumbu X-Y. Kelas-kelas selang diletakkan pada sumbu X, sedangkan frekuensi
kelas diletakkan pada sumbu Y. Misalkan tabel frekuensi tinggi badan dibuat dalam bentuk
histogram, akan diperoleh gambar seperti berikut ini.
Berdasarkan histogram yang terbentuk, dapat diketahui bentuk sebaran dari data tinggi
badan. Bentuk histogram ini dapat mengalami perubahan tergantung banyaknya kelas dan
lebar selang. Dengan adanya komputer, berbagai histogram dengan lebar selang yang
berbeda-beda dapat dibuat. Dari berbagai hasil itu kemudian dapat dipilih histogram yang
memberikan gambaran yang diinginkan.
Selain menggunakan data dari tabel distribusi frekuensi, histogram juga dapat dibuat
berdasarkan tabel distribusi frekuensi relatif. Bentuk histogramnya sama, yang berbeda
hanya skala pada sumbu Y.
4. Scatter Plot
Plot ini merupakan grafik yang digunakan untuk melihat hubungan antara dua buah peubah
numerik. Misalkan kita ingin tahu hubungan antara tinggi badan dengan berat badan.
Grafik yang diperoleh mungkin akan berupa grafik sebagai berikut :
11
80
70
Berat badan (kg)
60
50
40
30
20
10
0
145 150 155 160 165 170 175 180
1. a. Mengapa data perlu disajikan dengan menggunakan tabel dan grafik, jelaskan!
b. Dalam hal tertentu mengapa penyajian data dengan grafik lebih baik daripada dengan
tabel ?
2. a. sebutkan beberapa cara penyajian data dengan tabel
b. sebutkan beberapa cara penyajian data dengan grafik
3. buatlah disain tabel :
a. tabel satu arah mengenai data pendidikan yaitu jumlah mahasiswa menurut fakultas .
b. tabel dua arah mengenai data pembelian barang yaitu banyaknya barang yang dibeli
oleh perusahaan menurut jenis barang dan harga.
c. Tabel tiga arah mengenai data investasi menurut negara asal, lokasi usaha dan jenis
usaha.
4. Buatlah contoh grafik garis, batang, dan lingkaran untuk menggambarkan suatu
karakteristik data tertentu.
12
3 UKURAN PEMUSATAN DAN PENYEBARAN DATA
3.1 Pendahuluan
Pada setiap upaya pengumpulan data untuk menjawab suatu masalah, selalu diperoleh
hasil pengukuran atau pencacahan berupa angka-angka yang cukup banyak. Oleh karena itu
setiap kegiatan pengumpulan data diikuti oleh suatu kegiatan meringkas data sehingga
mendapatkan bentuk yang lebih mudah dipahami. Peringkasan data dimaksudkan untuk
mencari sesederhana mungkin informasi dari data yang dikumpulkannya tapi memiliki
pengertian yang dapat menjelaskan data secara keseluruhan. Untuk keperluan ini dalam
statistika dikenal istilah ukuran pemusatan dan ukuran penyebaran.
Modus
Suatu nilai data yang paling sering terjadi atau yang mempunyai frekuensi paling tinggi.
Suatu kumpulan data mungkin saja mempunyai modus lebih dari satu buah.
Contoh 3.1
Berikut ini adalah data sampel rata-rata pendapatan 25 rumah tangga desa A per bulan (dalam
juta rupiah).
1.5 0.9 0.5 1.3 1.0 1.2 1.5 1.4 1.7 1.8 1.2 1.0 1.9
2.0 2.0 2.4 3.0 2.2 1.5 1.6 1.6 1.5 1.0 0.8 1.5
Median
Median adalah suatu nilai data yang membagi dua sama banyak kumpulan data yang
telah diurutkan. Apabila banyaknya data ganjil, median adalah data yang tepat ditengah-
tengah, sedangkan bila banyaknya data genap, median adalah rata-rata dua data yang ada
ditengah.
Langkah-langkah yang dapat digunakan untuk mencari nilai median cara sebagai berikut:
Urutkan data amatan mulai amatan terkecil sampai data amatan terbesar
13
Posisi median (nmed) = (n+1)/2
Jika posisi median bernilai bulat maka median adalah X[(n+1)/2] sedangkan jika bernilai
pecahan maka median adalah rata-rata dari X[n/2] dan X[n/2+1]
Contoh 3.2
Berdasarkan data pada contoh 3.1, maka nilai mediannya dapat dihitung dengan tahapan:
1. urutkan data menggunakan diagram dahan daun:
Stem-and-leaf of C1 N = 25
Leaf Unit = 0.10
1 0 5
1 0
3 0 89
6 1 000
9 1 223
(6) 1 455555
10 1 667
7 1 89
5 2 00
3 2 2
2 2 4
1 2
1 2
1 3 0
Kuartil
Kuartil adalah nilai-nilai yang menyekat gugus data menjadi empat kelompok data yang
masing-masing terdiri dari 25% amatan. Nilai-nilai yang menyekat data menjadi empat
kelompok data tersebut dikenal dengan sebutan kuartil 1 (Q1), kuartil 2 (Q2) dan kuartil 3 (Q3).
Kuartil 1 (Q1) adalah nilai data yang menyekat kumpulan data yang telah diurutkan
sehingga banyaknya data yang lebih kecil dari Q1 adalah 25 % dan yang lebih besar dari Q1
adalah 75 %.
Kuartil 2 (Q2) sama dengan median yang merupakan nilai pembatas 50% data disebelah
kiri Q2 dan 50% data disebelah kanan Q2.
Kuartil 3 (Q3) adalah nilai data yang menyekat kumpulan data yang telah diurutkan
sehingga banyaknya data yang lebih kecil dari Q3 adalah 75 % dan yang lebih besar dari Q3
adalah 25 %.
Langkah-langkah perhitungan yang dapat digunakan sebagai pedoman dalam menentukan nilai-
nilai kuartil adalah sebagai berikut:
Urutkan data mulai data amatan terkecil sampai data amatan yang terbesar
Hitung posisi kuartil 2 (nq2), caranya sama dengan perhitungan posisi median, nq2 = (n+1)/2
14
Jika posisi kuartil 2 bernilai bulat maka kuartil 2 adalah X[(n+1)/2] sedangkan jika bernilai
pecahan maka kuartil 2 adalah rata-rata dari X[n/2] dan X[n/2+1]
Hitung posisi kuartil 1 dan 3 dengan menggunakan rumus berikut:
nq1 = (posisi kuartil 2 terpangkas +1) / 2 = (nq2* + 1) = nq3
Penetapan nilai kuartil 1 dan kuartil 3 prinsipnya sama dengan penentuan kuartil 2. Nilai
kuartil 1 posisi dihitung mulai pengamatan terkecil sedangkan nilai kuartil 3 dihitung dari
pengamatan terbesar.
Contoh 3.3
Berdasarkan data pada contoh 3.1, maka nilai kuartilnya dapat dihitung dengan tahapan:
1. urutkan data
0.5 0.8 0.9 1 1 1 1.2 1.2 1.3 1.4 1.5 1.5 1.5
1.5 1.5 1.6 1.6 1.7 1.8 1.9 2 2 2.2 2.4 3
2. hitung q2:
a. nq2 = (n+1)/2 = 26/2 = 13
b. q2 = X[13] = 1.5
3. hitung q1:
a. nq1 = (nq2* +1)/2 = (13+1)/2 = 7
b. q1 = X[7] = 1.2
4. hitung q3:
a. nq3 = (n+1) – nq1 = (25+1) – 7 =19
b. q3 = X[19] = 1.8
Selain dengan cara seperti di atas, untuk mencari nilai kuartil dapat juga dilakukan dengan
cara interpolasi, yaitu dengan tahapan sebagai berikut:
1. urutkan data
Contoh 3.4
Misalkan untuk menentukan nilai kuartil pada contoh 3.3 digunakan cara interpolasi, maka
hasilnya adalah:
1. posisi kuartil:
15
a. nq1= (n+1)/4 = 26/4 = 6.5
2. nilai kuartil:
b. q2 = x[13] = 1.5
Desil
Desil adalah nilai-nilai yang membagi segugus pengamatan menjadi 10 bagian yang sama. Nilai-
nilai pembaginya ada 9, dilambangkan dengan D1, D2, …, D9, mempunyai sifat bahwa 10% data
jatuh di bawah D1, 20% jatuh di bawah D2, …, dan 90% jatuh di bawah D9.
Dengan cara interpolasi seperti dalam penentuan kuartil, maka tahapan dalam menentukan
desil adalah:
1. urutkan data
Contoh 3.5
Berdasarkan data pada contoh 3.1, maka nilai desil ke-3 dapat dihitung dengan tahapan:
1. urutkan data (hasil seperti contoh 3.3)
3. nilai d3:
Persentil
Persentil adalah nilai-nilai yang membagi segugus pengamatan menjadi 100 bagian yang sama.
Nilai-nilai pembaginya ada 99, dilambangkan dengan P1, P2, …, P99, bersifat bahwa 1% dari
seluruh data terletak di bawah P1, 2% terletak di bawah P2, …, dan 99% terletak di bawah P99.
16
Dengan cara interpolasi seperti dalam penentuan desil, maka tahapan dalam menentukan
persentil adalah:
1. urutkan data
Contoh 3.6
Nilai persentil 10 dan 90 Dari data pada contoh 3.1, dapat dicari dengan tahapan perhitungan
sebagai berikut:
1. urutkan data (hasil seperti contoh 3.3)
2. posisi persentil:
3. nilai persentil:
Rata-rata
Rata-rata sering juga disebut dengan nilai tengah. Nilai ini merupakan ukuran pemusatan data
yang menimbang data menjadi dua kelompok data yang memiliki massa yang sama. Dengan
kata lain nilai tengah merupakan titik keseimbangan massa dari segugus data. Apabila x 1, x2,
...,xN adalah anggota suatu populasi terhingga berukuran N, maka nilai tengah populasinya
adalah:
N
1
N X
i 1
i
sedangkan jika x1, x2, ...,xn adalah anggota suatu contoh berukuran n, maka nilai tengah contoh
tersebut adalah:
n
x
1
n X
i 1
i
17
Contoh 3.7
Berdasarkan data pada contoh 3.1, maka nilai rata-ratanya adalah:
n
1 1 38
x
n
i 1
Xi
25
(1 . 5 0 . 9 ... 1 . 5 )
25
1 . 52
Rata-rata terpangkas
Karena dalam menentukan nilai rata-rata suatu data mempertimbangkan seluruh nilai
pengamatan, maka sifat nilai rata-rata tidak “kekar” (unrobust) artinya nilai rata-rata
terpengaruh oleh nilai ekstrim. Jika ada nilai ekstrim besar, maka rata-rata akan bergeser ke
kanan (ke nilai besar). Sebaliknya jika ana nilai yang ekstrim kecil, rata-rata akan bergeser ke
kiri 9 ke nilai kecil). Dengan demikian diperlukan kehati-hatian dalam menggunakan rata-rata.
Untuk mengatasi keberadaan data ekstrim sering disarankan untuk menggunakan rata-rata
terpangkas (trimmed mean). Misalkan rata-rata terpangkas 5%, artinya kita menghitung rata-
rata setelah membuang 5% data terkecil dan 5% data terbesar.
Contoh 3.8
Berdasarkan data pada contoh 3.1, jika akan dihitung rata-rata terpangkas 5%, maka
tahapannya adalah:
1. urutkan data
0.5 0.8 0.9 1 1 1 1.2 1.2 1.3 1.4 1.5 1.5 1.5
1.5 1.5 1.6 1.6 1.7 1.8 1.9 2 2 2.2 2.4 3
2. buang 5% nilai pengamatan terkecil dan 5% terbesar (25 x 5% = 1.25 1). Jadi nilai yang
dibuang adalah 0.5 dan 3.
3. hitung nilai rata-rata dari 23 data lainnya (tanpa 0.5 dan 3)
n*
1 1 34.5
x* *
n
i 1
Xi
23
( 0 . 8 0 . 9 ... 2 . 4 )
23
1 .5
Wilayah (Range)
Ukuran penyebaran data yang paling sederhana adalah mencari selisih pengamatan terkecil
dengan pengamatan terbesar.
w = xmax-xmin
18
Ukuran ini cukup baik digunakan untuk mengukur penyebaran data yang simetrik dan nilai
pengamatannya menyebar merata. Tetapi ukuran ini akan menjadi tidak relevan jika nilai
pengamatan maksimum dan minimum merupakan data-data ekstrem.
Contoh 3.9
Berdasarkan data pada contoh 3.1, wilayah dari data tersebut adalah: W=3.0 – 0.5 = 2.5
Contoh 3.10
Jangkauan antarkuartil dari data pada soal 3.1 adalah: JAK=q3 – q1 = 1.8 – 1.2 = 0.6
Ragam (Variance)
Ukuran penyebaran data yang paling sering digunakan adalah ragam. Ragam merupakan ukuran
penyebaran data yang mengukur rata-rata jarak kuadrat semua titik pengamatan terhadap titik
pusat (rataan). Apabila x1, x2, ...,xN adalah anggota suatu populasi terhingga berukuran N,
maka ragam populasinya adalah:
N
1
2 (Xi )2
N
i 1
dan apabila x1, x2, ...,xn adalah anggota suatu contoh berukuran n, maka ragam contoh
tersebut adalah:
n
1
s2
n -1
(X
i 1
i x)2
Bentuk rumus di atas dapat diuraikan menjadi lebih sederhana untuk memudahkan perhitungan
yaitu:
2
n n
n
x n(x )
i
2 2
n x xi
i
2
s 2
i 1
i 1 i 1
n 1 n ( n 1)
Akar dari ragam dikenal dengan simpangan baku yang dinotasikan dengan , sedangkan
simpangan baku contoh dilambangkan dengan s.
19
Contoh 3.11
Ragam dari data pada soal 3.1 adalah:
2
n
n
n x i2 x i
i 1 25 (1 .5 0 .9 ... 1 .5 ) 38
2 2 2 2
s 2 i 1
n ( n 1) 25 ( 25 1)
25 ( 64 .94 ) 1444
0 .299
600
Sedangkan simpangan bakunya adalah:
s s2 0 .299 0 .547
Koefisien keragaman
Ukuran penyebaran data seperti jangkauan, ragam, simpangan baku, dan jangkauan antar
kuartil merupakan keragaman mutlak. Ukuran keragaman ini tidak dapat dipakai untuk
membandingkan penyebaran dua kelompok data atau lebih. Untuk tujuan tersebut, ukuran
keragaman yang dipakai merupakan keragaman relatif. Salah satu ukuran keragaman relatif
yang sangat terkenal adalah koefisien keragaman (KK) yang dirumuskan sebagai berikut :
S
KK 100%
x
Contoh 3.12
Koefisien keragaman dari data pada contoh 3.1 adalah:
KK = (0.547/1.52) x 100% = 35.97%
Perlu diketahui bahwa sebagian besar data (sekitar 70%) berada pada kisaran x s . Gabungan
informasi dari kedua nilai tersebut akan lebih berguna dalam menyajikan informasi mengenai
data dibandingkan hanya nilai rata-rata saja.
Perhatikan hasil ringkasan terhadap data pendapatan rumah tangga (juta rupiah per bulan) dari
dua desa berikut ini:
Jika kita hanya menyajikan nilai rata-rata saja dari kedua desa, maka dapat dinyatakan bahwa
rumah tangga di kedua desa memiliki pendapatan yang relatif sama. Penjelasan yang lebih
banyak akan diperoleh jika kita melihat nilai simpangan bakunya. Desa A memiliki simpangan
baku yang lebih besar daripada desa B. Artinya pendapatan rumah tangga di desa A lebih
heterogen dibanding di desa B.
20
3.4 Kemiringan distribusi data
Kemiringan adalah derajat atau ukuran dari ketidaksimetrisan suatu distribusi data. Salah satu
cara yang dipakai untuk menghitung derajat kemiringan distribusi data adalah rumus pearson,
yaitu :
x mod 3( x med )
atau
s s
dengan : derajat kemiringan pearson
x : rata-rata hitung
mod : modus
s : standar deviasi
med : median
Jika :
0 distribusidata simetris
0 distribusidata miring/menjulur ke kiri
0 distribusidata miring/menjulur ke kanan
Semakin besar nilai || maka distribusi data akan semakin miring artinya semakin tidak
simetris.
Contoh 3.13
Berdasarkan data pada contoh 3.1, derajat kemiringan dari distribusi datanya adalah:
21
JAK 1
(q q1 )
k 2 3
p90 p10 p 90 p10
q1 : kuartil 1
q3 : kuartil 3
Contoh 3.14
Derajat keruncingan distribusi dari data pada contoh 3.1 adalah:
1
(q3 q1 ) 12 (1.85 1.1) 0.75
k 2
0.528
p90 p10 2.28 0.86 1.42
Karena nilai k > 0.263, maka distribusi datanya leptokurtis yaitu data yang memiliki puncak
relatif tinggi.
22
Bagan kotak garis dapat digambarkan sebagai berikut:
Contoh 3.15
Bentuk diagram kotak garis dari data pada contoh 3.1 dapat dibuat dengan tahapan sebagai
berikut:
a. batas bawah: BB1 = q1 – 3/2(q3-q1) = 1.1 – 3/2(1.85 – 1.1) = -0.025, untuk BB2 tidak
perlu dihitung karena sudah tidak ada nilai pengamatan yang kurang dari nilai BB1.
3. grafiknya adalah:
23
3.7 Latihan Soal
1. Berikut ini adalah 40 data nilai MK. Metode Statistika I, program studi D3 Statistika
semester 1 :
40 21 54 26 98 74 54 35 46 65
54 23 47 85 75 78 65 34 23 20
56 55 40 41 75 65 26 63 51 50
74 25 45 54 65 35 35 36 39 46
a. Buatlah diagram daun untuk data di atas, bagaimana pola sebaran datanya?
b. Tentukan nilai rata-rata dan ragam dari data di atas
c. Tentukan nilai kuartil dan jangkauan antar kuartilnya
d. Buatlah tabel distribusi frekuensi kemudian buat histogramnya.
e. Buatlah diagram kotak garisnya. Apakah ada data ekstrim?
2. Pemerintah ingin mengevaluasi besarnya subsidi minyak yang akan disalurkan kepada
masyarakat pedesaan dan perkotaan. Untuk mengevaluasi besarnya subsidi yang disalurkan,
pemerintah melimpahkan tugas ini kepada suatu lembaga riset. Penelitian dilakukan pada
10 desa/kelurahan yang berstatus pedesaan dan 15 desa/kelurahan yang berstatus
perkotaan. Data konsumsi minyak tanah (liter) per kapita diperoleh sebagai berikut:
Pedesaan:
0.20 0.16 0.17 0.15 0.11 0.13 0.14 0.15 0.17 0.28
Perkotaan:
0.10 0.26 0.27 0.15 0.18 0.19 0.15 0.19 0.21 0.25 0.18 0.15 0.16 0.21 0.33
24
4 KONSEP DASAR PELUANG
4.1 Pendahuluan
Statistika adalah ilmu pengetahuan tentang pengumpulan dan analisis data dengan tujuan
untuk menarik kesimpulan/inferensia mengenai populasi. Bila data telah terkumpul, kita dapat
menggunakan inferensia statistika untuk memilih di antara berbagai model alternatif yang
tersedia. Proses penarikan inferensia ini sangat bergantung pada teori peluang.
Bila statistika pada hakekatnya merupakan suatu penalaran induktif (yaitu dari hal
khusus/sampel yang diketahui ke hal umum/populasi yang tidak diketahui), maka teori peluang
bekerja dalam arah sebaliknya, yaitu bersifat deduktif (dari hal umum/populasi yang diketahui
ke hal khusus/sampel yang tidak diketahui).
Teori peluang memberi kerangka dan model-model bagi statistika. Model pada hakekatnya
adalah suatu mekanisme acak dan teori peluang mempelajari model ini untuk mengetahui
konsekuensinya. Model-model ini didasar kepada asumsi tertentu. Statistika memilih satu atau
lebih model untuk menganalisis data/sampel yang diambil dari populasi dengan cara tertentu
(acak). Bila model sesuai terhadap data, maka model dapat digunakan untuk menganalisis data.
Bila model tidak sesuai, maka harus dicari model lain yang sesuai.
Perhatikan sebuah percobaan acak sederhana berupa pelemparan sebuah dadu bersisi enam
yang seimbang. Hasil yang mungkin diperoleh dari percobaan ini ialah munculnya sisi 1, 2, 3, 4,
5, atau 6. Percobaan ini termasuk acak karena kita tidak bisa memastikan sisi apa yang akan
25
muncul. Dengan menggunakan konsep himpunan, suatu himpunan/gugus yang memuat semua
hasil yang berbeda, yang mungkin terjadi dari suatu percobaan dinamakan ruang sampel
(sample space). Sedangkan unsur-unsur dari suatu ruang sampel disebut titik sampel.
Ruang sampel dapat dipandang sebagai himpunan semesta bagi permasalahan yang dihadapi.
Ruang sampel dilambangkan dengan S. Dengan demikian, ruang sampel dari percobaan di atas
ialah S={1, 2, 3, 4, 5, 6}.
Ruang kejadian adalah himpunan bagian (anak gugus) dari ruang sampel, yang memiliki
karakteristik tertentu. Ada dua jenis kejadian, yaitu kejadian dasar dan kejadian majemuk.
Kejadian dasar hanya terdiri dari satu unsur, sedangkan kejadian majemuk minimal terdiri dari
satu unsur. Dengan demikian, suatu kejadian dasar juga merupakan kejadian majemuk. Suatu
kejadian dinotasikan dengan huruf kapital (A, B, ..., dan seterusnya).
Sebagai contoh, kejadian terambilnya kartu hati dari seperangkat (52 helai) kartu bridge dapat
dinyatakan sebagai A = {hati} yang merupakan himpunan bagian dari ruang contoh S={hati,
sekop, klaver, wajik}. Jadi A adalah kejadian sederhana. Kejadian B yaitu terambilnya kartu
merh merupakan kejadian majemuk, karena B = {hati wajik} = {hati, wajik}. Perhatikan
bahwa gabungan atau paduan beberapa kejadian sederhana menghasilkan kejadian majemuk
yang tetap menjadi himpunan bagian ruang contohnya.
Suatu kejadian mungkin saja berbentuk himpunan bagian yang meliputi seluruh ruang contoh S.
demikian juga sebaliknya, suatu kejadian dapat berbentuk himpunan bagian dari S yang tidak
mengandung satu pun anggota yang disebut dengan ruang nol atau himpunan kosong dan
.
Suatu keuntungan dari penggunaan notasi himpunan bagi kejadian adalah kita dapat melakukan
operasi himpunan terhadap kejadian. Beberapa operasi himpunan yang dapat dilakukan untuk
kejadian:
Komplemen suatu kejadian A terhadap S adalah himpunan semua unsur S yang tidak
termasuk A, biasanya dinotasikan dengan lambang Ac.
26
Contoh 4.1
Ruang contoh melempar sebuah dadu : S={1,2,3,4,5,6}
Jika A = {1,3,5}, maka Ac = {2,4,6}
Irisan dua kejadian A dan B adalah kejadian yang unsurnya termasuk dalam A dan B,
dinotasikan dengan lambang A B.
Contoh:
Ruang contoh melempar sebuah dadu : S={1,2,3,4,5,6}
Jika A = {1,2,3} dan B = {2,4,6}, maka A B = {2}
Gabungan dua kejadian A dan B adalah kejadian yang mengandung semua unsur yang
termasuk A atau B atau keduanya, yang dinotasikan dengan lambang A B.
Contoh 4.2
Ruang contoh melempar sebuah dadu : S={1,2,3,4,5,6}
Jika A = {1,2,3} dan B = {2,4,6}, maka A B ={1,2,3,4,6}.
Kejadian A dan B dikatakan saling terpisah (mutually exclusive) bila A dan B tidak memiliki
unsur persekutuan (bila A B =)
Contoh 4.3
Ruang contoh melempar sebuah dadu : S={1,2,3,4,5,6}
Jika A = {1,3,5} dan B = {2,4,6}, maka A dan B saling terpisah, karena A B =.
Kejadian A dan B dikatakan saling bebas bila A dan B tidak saling mempengaruhi.
Contoh 4.4
Pada pelemparan dua uang logam, kejadian munculnya sisi muka dari uang logam
pertama dan uang logam kedua saling bebas
Berdasarkan banyaknya unsur suatu ruang sampel, ruang sampel dapat dibedakan menjadi dua
jenis yaitu ruang sampel diskret dan ruang sampel kontinu. Suatu ruang sampel dikatakan
diskret jika banyaknya unsur dari ruang sampel tersebut berhingga atau tidak berhingga
27
terhitung (countable). Sedangkan ruang sampel dikatakan kontinu jika ruang sampel memuat
semua bilangan dalam suatu interval tertentu.
Jika ruang contoh suatu percobaan terdiri atas kejadian dasar yang diskret terhingga, ada tiga
kaidah dasar cara menghitung banyaknya ukuran ruang contoh, yaitu:
1. pengisian tempat yang tersedia
ada dua kaidah yang dapat digunakan untuk pengisian tempat yang tersedia, yaitu kaidah
penggandaan dan kaidah penjumlahan. Pada kaidah penggandaan, misalnya n 1 adalah
banyaknya cara mengisi tempat pertama, n2 adalah banyaknya cara mengisi tempat kedua
setelah tempat pertama terisi dan nk adalah banyaknya cara mengisi tempat ke-k setelah
(k-1) tempat-tempat sebelumnya terisi, maka banyaknya cara mengisi k tempat yang
tersedia adalah:
n1.n2. ... .nk
Contoh 4.5
Pada sebuah dealer motor tersedia 4 merk sepeda motor. Masing-masing merk
menyediakan 3 jenis kapasitas silinder. Masing-masing sepeda motor dikeluarkan dengan 2
macam warna. Jika seorang pengojek hendak membeli sepeda motor baru, berapa macam
pilihan yang dapat dilakukan olehnya?
Pikiran pengojek sewaktu memilih merk bercabang empat, sewaktu memilih kapasitas
silinder bercabang tiga dan sewaktu memilih warna bercabang dua. Jadi, pilihannya ada
4 x 3 x 2 = 24 macam
Kaidah penjumlahan digunakan jika dalam mengisi tempat kedua setelah tempat pertama
terisi tidak dapat dilakukan menggunakan benda-benda yang digunakan sebagai pilihan
untuk mengisi tempat pertama. Jadi, misalnya n1 adalah banyaknya cara mengisi tempat
pertama, n2 adalah banyaknya cara mengisi tempat kedua dan nk adalah banyaknya cara
mengisi tempat ke-k, maka banyaknya cara mengisi k tempat yang tersedia adalah:
n1 + n2 + ... + nk
Contoh 4.6
Dari Jakarta kita dapat pergi ke Bogor menggunakan kendaraan bermotor melalui (1)
Parung, (2) jalan lama Cibinong, atau (3) jalan tol Jagorawi. Dari Bogor kita dapat ke
Bandung melalui (1) Sukabumi atau (2) Cianjur. Dari Jakarta kita juga dapat ke Bandung
melalui (1) jalan tol Cikampek atau (2) jalan lama Bekasi lewat Purwakarta. Hanya ada satu
jalan raya dari Purwakarta menuju Bandung. Ada berapa pilihan untuk pergi ke Bandung
dari Jakarta?
28
Jika melalui Bogor ada 3x2 pilihan dan jika melalui Purwakarta ada 2x1 pilihan. Jadi,
banyaknya pilihan ada 3x2 + 2x1 = 8 macam
2. permutasi
Pemilihan benda-benda dari suatu gugus benda-benda S = {e1, e2, …, en} dapat dilakukan
dengan permutasi. Permutasi merupakan kejadian dimana susunan objek yang terpilih
diperhatikan. Misalkan memilih orang untuk membentuk kepengurusan suatu organisasi,
dimana jika Si A terpilih menempati posisi ketua berbeda maknanya dengan Si A terpilih
menempati posisi wakil ketua.
Contoh 4.8
Banyaknya permutasi yang berbeda yang dapat disusun dari huruf-huruf dalam kata “LATIH”
adalah 5! = 120
Banyaknya permutasi n benda berlainan jika diambil r benda sekaligus (r<n) adalah:
n!
Pr
(n r )!
n
Contoh 4.9
Dari 5 orang kandidat akan dibentuk susunan pengurus (Ketua, Wakil, Bendahara)
N(S) = P53 = 5!/(5-3)! = 60
Contoh 4.10
Dalam suatu ruangan diskusi dengan bentuk meja melingkar, akan berlangsung diskusi yang
akan diikuti 6 peserta. Banyaknya cara keenam orang tersebut duduk pada 6 kursi yang
disusun melingkar adalah (6 – 1)! = 5! = 120 cara.
Banyaknya permutasi yang berlainan dari n benda jika n1 diantaranya berjenis pertama, n2
berjenis kedua, …, nk berjenis ke k adalah:
n!
n1!n 2 ! n k !
29
Contoh 4.11
Banyaknya permutasi yang berbeda yang dapat disusun dari huruf-huruf dalam kata “CACAH”
adalah 5!/(2!2!1!) = 30
Banyaknya cara menyekat suatu himpunan n benda dalam r sel, masing-masing berisi n1 unsur
dalam sel pertama, n2 dalam sel kedua, …, adalah:
n n!
,
n1 , n 2 ,, nr n1!n2 ! n r !
dengan n1+n2+…+nr = n
Contoh 4.12
Ada suatu kelas yang terdiri atas 12 orang. Banyaknya cara untuk membagi kelas tersebut
dalam tiga kelompok yang terdiri atas 5, 4, dan 3 orang adalah 12!/(5!4!3!)=27720
cara
3. kombinasi
Selain permutasi, Pemilihan benda-benda dari suatu gugus benda-benda S = {e1, e2,
…, en} juga dapat dilakukan dengan cara kombinasi . Kombinasi merupakan kejadian dimana
susunan objek yang terpilih tidak diperhatikan. Misalkan memilih sejumlah orang untuk
menempati suatu sejumlah kursi tempat duduk, dimana susunan tempat duduk tidak menjadi
perhatian. Kombinasi tingkat r dari n unsur/objek dapat dirumuskan sebagai berikut:
n! nx (n 1) x (n 2) x...x 0!
Crn
(n r )!r! (n r ) x (n r 1) x...x 0! xr!
Contoh 4.13
Dari 5 orang akan dibentuk tim cepat tepat yang beranggotakan 3 orang.
N(S) = C53 = 5!/(5-3)!3! = 10
30
2. peluang suatu kejadian dapat dihitung berdasarkan kepada frekuensi relatif yang
teramati dari serangkaian percobaan;
3. peluang suatu kejadian ditentukan secara subyektif berdasarkan pandangan pribadi.
Berdasarkan aksioma (3), misalnya, kita dapat menentukan peluang suatu kejadian sebagai
jumlah peluang masing-masing titik sampel yang menjadi anggota kejadian tersebut.
Beberapa sifat peluang:
1. untuk sembarang dua kejadian A dan B yang merupakan himpunan bagian S, maka
peluang paduan dua kejadian tersebut adalah:
P(AB)= P(A) + P(B) – P(AB)
2. untuk sembarang dua kejadian A dan B yang merupakan himpunan bagian S berlaku:
P(B) = P(BA) + P(BAc)
3. untuk setiap kejadian A berlaku:
P(A) = 1 - P(Ac)
4. Jika A dan B saling bebas, maka P(AB) = P(A) + P(B)
5. Jika A1, A2, ..., An saling bebas, maka
P(A1A2...An)= P(A1) + P(A2) + ... + P(An)
Contoh 4.14
Jika sebuah dadu seimbang digulirkan, maka ruang contohnya adalah S={1, 2, 3, 4, 5, 6}.
Jika A adalah kejadian munculnya dadu yang bersisi genap, maka P(A)=P{2, 4, 6} = ½. Bila
ada informasi tambahan bahwa sisi yang muncul lebih besar dari 3, maka ruang sampelnya
adalah S*={4, 5, 6}, sehingga peluang memperoleh sisi genap dengan adanya informasi ini
adalah P(A)=P{4, 6} = 2/3.
31
Dari teladan di atas terlihat bahwa informasi tambahan berakibat ruang contohnya
menyempit dari S={1, 2, 3, 4, 5, 6} menjadi S*={4, 5, 6}, dan pada gilirannya akan
mengubah nilai peluang.
Permasalahan peluang seperti tersebut di atas disebut peluang bersyarat. Jika A dan B dua
kejadian, peluang bersyarat bagi A setelah B dilambangkan oleh P (A|B) didefinisikan
sebagai
P ( A B)
P( A | B) , asalkan P(B) 0
P( B )
Dari definisi di atas, kita memperoleh kaidah penggandaan berikut, yang penting untuk
menentukan peluang irisan dua atau lebih kejadian.
P(AB) = P(A)P(B|A)
P(ABC) = P(A)P(B|A)P(C|(AB))
Contoh 4.15
Dalam sebuah kotak berisi 2 bola merah dan 3 bola biru. Jika diambil dua buah bola tanpa
pemulihan. Tentukanlah:
a. peluang kedua bola yang terambil berwarna merah!
b. Peluang terambilnya bola merah pada pengambilan pertama dan biru pada
pengambilan kedua!
Jawab
Karena bola hanya dibedakan menurut warna, maka sebagai ruang sampelnya adalah:
S={M1M2, M1B2, B1M2, B1B2}, dengan M1M2 artinya terambilnya bola merah pada pengambilan
pertama dan merah pada pengambilan kedua.
Dengan demikian,
a. P(M1M2) = P(M1)P(M2|M1) =(2/5)(1/4) = 2/20
b. P(M1B2) = P(M1)P(B2|M1) =(2/5)(3/4) = 6/20
Penerapan penting dari peluang bersyarat adalah pada masalah kebebasan antar dua kejadian.
Di dalam bahasa sehari-hari, dua kejadian dikatakan bebas bila kejadian yang satu tidak ada
kaitannya dengan kejadian yang lain. Namun, secara tepat dalam pengertian statistik,
pengertian kebebasan antar dua kejadian adalah:
1. dua kejadian A dan B dikatakan bebas (stokastik) bila P(A|B) = P(A)
2. berdasarkan kaidah penggandaan untuk irisan dua atau lebih kejadian, dua kejadian A
dan B dikatakan bebas bila P(AB) = P(A)P(B)
32
4.7 Kaidah Bayes
Penerapan menarik lainnnya dari peluang bersyarat adalah apa yang disebut peluang pasterior;
hal ini diberikan oleh Kaidah Bayes. Pada teladan di atas, dengan mudah kita dapat menjawab
pertanyaan berapa peluang terambilnya bola biru pada ambilan kedua, bila pada ambilan
pertama terambil bola merah?
Karena pada ambilan pertama diperoleh merah, maka di dalam kotak masih ada 1 merah dan 3
biru, sehingga peluang terambilnya bola biru pada ambilan kedua bila pada ambilan pertama
terambil bola merah adalah ¾. Sekarang pertanyaannya dibalik. Bila pada ambilan kedua
terambil bola biru, berapa peluang pada ambilan pertama terambil bola merah, P(M1|B2)?
Menurut rumus peluang bersyarat,
P ( M 1 B2 )
P ( M 1 | B2 )
P ( B2 )
Akan tetapi,
P(M1B2) = P(M1)P(B2|M1)
Dan
P(B2) = P(M1B2) + P(B1B2)
= P(M1)P(B2|M1) + P(B1)P(B2|B1)
Sehingga
P ( M 1 ) P ( B2 | M 1 )
P ( M 1 | B2 )
P( M 1 ) P( B2 | M 1 ) P( B1 ) P( B2 | B1 )
(2 / 5)(3 / 4) 1
(2 / 5)(3 / 4) (3 / 5)(2 / 4) 2
Perhatikan bahwa informasi terjadinya B2 telah mengubah peluang awal dari P(M1)=2/5 menjadi
P(M1|B2)=1/2.
Contoh di atas mengilustrasikan teorema berikut yang dikenal sebagai Kaidah Bayes:
Bila kejadian-kejadian B1, B2, ..., Bk merupakan sekatan dari ruang sampel S dengan P(Bi) 0
untuk i = 1, 2, ..., k, maka untuk sembarang kejadian A yang bersifat P(A) 0,
P ( B j ) P( A | B j )
P( B j | A) ; j 1, 2, , k
P( B1 ) P ( A | B1 ) P ( B2 ) P( A | B2 ) P( Bk ) P( A | Bk )
33
4.8 Latihan Soal
1. Suatu kesebelasan sepak bola memiliki:
a. kaus oblong biru, kuning, merah dan hijau
b. celana pendek putih dan hitam
c. kaus kaki putih, hitam dan hijau
Berapa macam kombinasi warna seragam kesebelasan yang dapat disusun?
2. Ada berapa banyak cara 6 orang dapat didudukkan pada sebuah sofa jika yang tersedia
hanya 4 tempat duduk?
3. Ada berapa banyak cara 7 buku dapat disusun pada rak jika:
a. sembarang susunan dimungkinkan
b. 3 buku tertentu harus selalu berdiri berdampingan
c. 2 buku tertentu harus menempati ujung-ujung?
4. Dari 4 apel merah, 5 hijau, dan 6 kuning, berapa banyak kemungkinan pilihan yang terdiri
atas 9 apel bila setiap warna harus diambil 3?
5. Agen penjual komputer ECS Pentium IV mempunyai stock barang sebanyak 5 buah, dua
diantaranya dalam kondisi rusak. Seorang mahasiswa membeli tiga buah komputer,
hitunglah:
a. Berapa banyaknya kemungkinan komputer yang terpilih
b. Berapa banyak kemungkinan dua komputer yang terpilih dalam keadaan rusak
c. Berapa banyak kemungkinan ketiganya dalam kondisi baik?
6. Dari 5 buah bilangan yaitu 1,2,3,4,5 diambil 3 bilangan secara serentak.
a. Berapakah banyak kemungkinan bilangan yang terpilih ketiganya ganjil
b. Berapakah banyak kemungkinan bilangan yang terpilih dua genap dan satu ganjil
c. Jika ketiga bilangan terpilih disusun menjadi sebuah bilangan, ada berapa kemungkinan
bahwa bilangan tersebut bernilai ganjil.
7. Dari 5 orang sarjana ekonomi dan 7 orang sarjana tehnik akan dibentuk suatu tim yang
terdiri atas 2 sarjana ekonomi dan 3 sarjana tehnik. Ada berapa banyak tim itu dapat
dibentuk jika:
a. Setiap sarjana ekonomi dan tehnik boleh ikut dalam tim.
b. Seorang sarjana tehnik tertentu harus masuk tim
c. Dua orang sarjana ekonomi tidak boleh ikut dalam tim itu.
8. Dua kartu diambil secara acak (satu-satu) dari sekumpulan 52 kartu Bridge yang dikocok
dengna baik. Tentukan probabilitas untuk memperoleh 2 kartu as jika :
a. pengambilan kartu pertama dikembalikan
34
b. pengambilan kartu kedua tidak dikembalikan
9. Satu kantong berisi 5 bola putih dan 3 bola merah. Satu kantong yang lain lagi berisi 4 bola
4 bola putih dan 5 bola merah. Jika dari setiap kantong diambil sebuah bola, tentukan
peluang kejadian terambilnya :
a. dua bola itu putih
b. keduanya merah
c. satu putih dan satu merah
10. Dalam suatu penelitian menunjukkan bahwa setiap 100 produk yang dihasilkan suatu pabrik
pada siang hari (S) 2 diantaranya cacat (C), dan setiap 100 produk yang dihasilkan pada
malam hari (M) 5 diantaranya cacat. Selama 24 jam kerja, 100 produk dihasilkan pada siang
hari, dan 60 produk dihasilkan pada malam hari. Dengan rumus bayes, hitunglah peluang
bahwa suatu produk cacat yang dipilih secara acak dari 160 ptoduk yang dihasilkan selama
24 jam :
a. diproduksi pada malam hari
b. diproduksi pada siang hari
11. Sejumlah kelereng berwarna dimasukkan ke dalam tiga kotak yang tidak dapat dibedakan
sebagai berikut :
Warna Kotak 2 Kotak 1 Kotak 3
Merah 2 4 3
Putih 3 1 4
Biru 5 3 3
Sebuah kotak diambil secara acak dan kemudian dari kotak yang terpilih tersebut diambil
secara acak sebuah kelereng
a. hitung peluang terambilnya kelereng putih
b. bila diketahui kelerengnya putih, berapa peluang bahwa kelereng itu berasal dari kotak
2
35
5 KONSEP DASAR PEUBAH ACAK
36
Contoh 5.1
Pada pelemparan tiga uang logam, bila X menyatakan banyaknya muncul sisi angka, tentukan :
a. nilai-nilai peubah acak X
b. Sebaran peluang X
Penyelesaian :
Pelemparan tiga uang logam mempunyai ruang contoh :
S={(AAA), (AAG),(AGA),(GAA),(GGA),(GAG),(AGG),(GGG)}
a. Karena X menyatakan banyaknya muncul sisi angka, pada S, maka nilai-nilai dari X adalah :
X={0, 1, 2, 3}
X=0, artinya tidak ada sisi angka yang muncul
X=1, artinya ada satu sisi angka yang muncul
X=2, artinya ada dua sisi angka yang muncul
X=3, artinya ketiganya muncul sisi angka
b. Peluang dari nilai-nilai X adalah :
P(X=0)=P(GGG)=1/8
P(X=1)=P(GGA)+P(GAG)+P(AGG)=1/8+1/8+1/8=3/8
P(X=2)=P(AAG)+P(AGA)+P(GAA)=1/8+1/8+1/8=3/8
P(X=3)=P(AAA)=1/8
Sehingga sebaran peluang X adalah :
X=x 0 1 2 3
P(X=x) 1/8 3/8 3/8 1/8
x 0 1 2 3
P(X=x) 1/8 3/8 3/8 1/8
Perhatikan bahwa nilai-nilai X mencakup semua kemungkinan sehingga total peluangnya sama
dengan 1
Seringkali, suatu peluang peubah acak dinyatakan dalam sebuah rumus, yang
merupakan fungsi nilai-nilai x. Biasanya dilambangkan dengan f(x), g(x), r(x) dan sebagainya.
37
Himpunan semua pasangan berurutan (x,f(x)) disebut fungsi peluang atau sebaran peluang bagi
peubah acak X.
Sifat-sifat peubah acak diskret :
a. f(x)=P(X=x)
b. f(x) 0
c. f ( x) 1
x
b. f(x) 0
c. f ( x)dx 1
38
5.4 Nilai Harapan Peubah Acak
Nilai harapan dari peubah acak adalah pemusatan dari nilai peubah acak jika percobaannya
dilakukan secara berulang-ulang sampai tak berhingga kali.
n
xx p( xi ), jika X p.a diskret
i 1
Ε( X )
x f ( x )dx, jika X p.a kontinu
i i
Contoh 5.2
Jika diketahui distribusi peluang dari peubah acak X sebagai berikut:
Contoh 5.3
Ruang contoh untuk percobaan dua buah uang logam adalah
S = {GG, GA, AG, AA}
Karena keempat titik contoh berpeluang sama untuk terjadi, peluang-peluang tersebut dapat
dipandang sebagai frekuensi relatif bagi kejadian-kejadian itu dalam jangka panjang. Sehingga
jika seseorang melemparkan dua uang logam yang setimbang berulang-ulang kali, maka rata-
rata ia akan memperoleh 1 sisi gambar perlemparan adalah 1, yang didapat dari
X X1 X2 ……. Xn
P(X=x) F(x1) F(x2) ……. F(xn)
39
Maka nilai tengah atau nilai harapan peubah acak g(X) adalah
n
g ( x ) E ( g ( X )) g ( xi ) f ( xi )
i 1
aX b a x b a b
b. Nilai harapan jumlah atau selisih dua atau lebih peubah acak sama dengan jumlah atau
selisih nilai harapan masing-masing peubah.
X Y X Y dan X Y X Y
c. Nilai harapan hasilkali dua atau lebih peubah acak yang bebas satu sama lain sama
dengan hasilkali nilai harapan masing-masing peubah acak. Jadi jika X dan Y bebas,
maka
XY X Y
d. Bila X suatu peubah acak dan b konstanta, maka
X2 b X2 2
e. Bila X peubah acak dan a adalah konstanta, maka
aX
2
a 2 X2 a 2 2
f. Ragam jumlah atau selisih dua atau lebih peubah acak yang bebas sama dengan jumlah
ragam masing-masing peubah acak. Jadi bila X dan Y bebas, maka
X2 Y X2 Y2 dan X2 Y X2 Y2
40
5.7 Latihan Soal
1. Dalam suatu gudang terdapat 7 pesawat televisi. Dua diantaranya rusak. Sebuah hotel
membeli secara acak 3 dari ketujuh televisi tersebut. Bila X menyatakan banyaknya
televisi yang rusak yang terbeli oleh hotel tersebut, tentukanlah :
a. Peluang semua tv yang terbeli tidak ada yang rusak.
b. Peluang ada satu tv yang rusak
c. Tentukanlah nilai X
d. Carilah fungsi sebaran peluang X
e. Hitunglah nilai tengah dan ragam X.
2. Suatu peubah acak diskret X mempunyai sebaran peluang
3 x 3 x
f ( x) 14 34 untuk x 0,1,2,3
x
Tentukan nilai tengah X
3. Tentukan nilai harapan banyaknya kaset jazz, bila 4 kaset diambil secara acak dari
sebuah koleksi yang terdiri dari 5 kaset jazz, 2 kaset klasik dan 3 kaset polka.
4. Misalkan sebuah peubah acak X memiliki sebaran peluang sebagai berikut
X 0 1 2 3
P(X=x) 8/27 4/9 2/9 1/27
Tentukan nilaitengah X
5. Dengan menanamkan modalnya dalam suatu stock tertentu, seseorang dapat menerima
keuntungan $4000 setahun dengan peluang 0.3 atau kerugian $1000 setahun dengan
peluang 0.7. Tentukan nilai harapan penerimaan orang ini dari stock tersebut.
6. Misalkan X menyatakan hasil bila sebuah dadu setimbang dilemparkan. Tentukan
g ( X ) , bila g ( X ) 3 X 2 4
X 2 3 4 5 6
P(X=x) 0.01 0.25 0.4 0.3 0.04
Hitunglah ragam X
41
6 SEBARAN PELUANG TEORITIS
Secara garis besar, sebaran peluang teoritis dapat dibedakan atas sebaran diskret dan
sebaran kontinu. Sebaran diskret adalah fungsi peluang dari peubah-peubah acak diskret,
seperti Bernoulli, Binomial, Hipergeometrik, Poisson, dan lain-lain. Sedangkan sebaran kontinu
adalah fungsi peluang peubah-peubah acak kontinu, antar lain Seragam , Normal, dan lain-lain.
Berikut ini akan diuraikan beberapa jenis sebaran peluang diskret dan sebaran peluang
kontinu.
n
b( x; n, p ) p x q n x , untuk x = 0, 1, 2,…….,n
x
Nilai sebaran di atas diperoleh dari uraian berikut ini :
1. pandang peluang sukses x dan gagal n-x dalam suatu urutan tertentu. Karena ulangan
semuanya bebas, maka peluang tiap hasil yang berbeda dapat digandakan. Tiap sukses
terjadi dengan peluang p dan gagal dengan peluang q=1 – p. jadi peluang untuk urutan
tersebut adalah pxqn-x.
2. tentukan banyaknya semua titik contoh dalam percobaan tersebut yang menghasilkan x
yang sukses dan n-x yang gagal. Banyaknya ini sama dengan banyaknya cara memisahkan n
hasil menjadi dua kelompok sehingga x hasil berada pada kelompok pertama dan sisanya,
n-x hasil, pada kelompok kedua. Banyaknya x hasil yang sukses dapat dinyatakan dengan
n .
x
42
3. karena pembagian kelompok pada (2) saling terpisah, maka peluang x sukses diperoleh dari
hasil penggandaan n
x
dengan pxqn-x.
Nilai tengah dan ragam bagi sebaran binom b(x;n,p) adalah np dan 2 npq
Untuk memperoleh nilai peluang binomial kumulatif dapat menggunakan tabel sebaran
binomial.
Contoh 6.1
Dari hasil kajian akademik diperoleh bahwa peluang dosen hadir dalam kegiatan belajar
mengajar sebesar 90%. Jika proses belajar mengajar per semester dilakukan sebanyak 14 kali,
hitunglah :
a. peluang dosen hadir dalam kegiatan belajar mengajar sebanyak 10 kali !
b. peluang dosen hanya tidak hadir satu kali !
c. peluang dosen hanya tidak hadir pada pertemuan ke 14 !
d. peluang dosen hanya hadir pada pertemuan pertama !
Penyelesaian :
X = banyaknya dosen mengajar dalam satu semester
p = 0.9, n = 14
n 14
b( x; n, p ) p x q n x , sehingga b( x;14,0.9) 0.9x 0.114 x , x=0, 1, 2, …, 14
x x
14
0.910 0.11410 0.910 0.14 (1001)3.49 5 0.035
14 !
a. P(X=10)=
10 10!(14 10) !
Atau dengan melihat tabel binom :
P(X=10) = P(X10) – P(X9)
10 9
= b( x;14,0.9) b( x;14,0.9) = 0.0441- 0.0092 = 0.0349
x 0 x 0
43
b. Jika dosen tidak hadir sekali, maka ada 14 kemungkinan dosen tersebut tidak hadir dari 14
pertemuan. Dengan demikian peluangnya :
14
0.11 0.9141 14(0.1)(0.254) 0.356
1
c. Karena sudah ditentukan bahwa dosen tidak hadir pada pertemuan ke 14, maka peluangnya
:
Contoh 6.2
Seorang penjual mengatakan bahwa 25% dari seluruh dagangannya rusak akibat truk yang
membawa barang itu mengalami kecelakaan. Jika seseorang membeli barang dagangan itu
sebanyak 10 buah, tentukan :
a. peluang orang itu akan mendapat 5 barang yang rusak
b. peluang orang tersebut memperoleh minimal 3 tetapi kurang dari 7 barang yang rusak
c. rata-rata dan simpangan baku barang yang rusak
penyelesaian
Misalkan X = banyaknya barang yang rusak
p = 0.25, n = 10
a. P(X =5) =P(X5) – P(X4) = 0.9803 – 0.9219 = 0.0584
b. P(3X<7)=P(3X6) = P(X6) – P(X2) =0.9991-0.6778 = 0.3213
c. µ = n.p = 10x0.25 = 25, = n.p.(1-p) = 10x0.25x0.75 = 1.875
44
Bila dalam populasi N benda, k benda diantaranya diberi label sukses dan N-k benda
lainnya diberi label gagal maka sebaran peluang bagi peubah acak hipergeometrik X, yang
menyatakan banyaknya kesuksesan dalam contoh acak berukuran n, adalah
k N k
x n x
h( x; N , n, k ) , untuk x = 0,1,2,…..,k
N
n
Nilaitengah dan ragam bagi sebaran hipergeometrik h(x;N,n,k) adalah
nk N n k k
dan 2 .n. 1
N N 1 N N
Contoh 6.3
Dalam suatu kantong terdapat 10 bola merah dan 5 bola putih. Bila diambil 3 bola secara acak,
tentukan peluang untuk memperoleh 0, 1, 2, dan 3 bola merah!
Penyelesaian :
Misalkan :
N1 : banyaknya bola merah =10
N2 : banyaknya bola putih=5
N : banyaknya bola = N1 + N2 = 10+5=15
n : banyaknya sampel yang diambil
X : banyaknya bola merah yang diperoleh
10
Kombinasi bola merah yang diperoleh adalah
k
5
Kombinasi bola putih yang diperoleh adalah
3 k
15
Kombinasi semua sampel yang diperoleh adalah
3
Maka peluang untuk memperoleh banyaknya bola merah X=k dalam sampel tersebut adalah :
10 5
k 3 k
P( X k ) , k=0, 1, 2, 3
15
3
Dengan demikian :
45
10 5 10 5
0 3 1 2
P ( X 0) 100
10
, P ( X 1)
15 455 15 455
3 3
10 5 10 5
2 1 3 0
P ( X 2) 120
225
, P ( X 3)
15 455 15 455
3 3
Perhatikan bahwa P(X=0)+ P(X=1)+ P(X=2)+ P(X=3)=1
e x
p ( x; ) , untuk x = 1, 2, …..
x!
sedangkan dalam hal ini adalah rata-rata hasil percobaan yang terjadi selama selang waktu
atau dalam daerah yang dinyatakan, dan e = 2.71828….
Sebaran poisson cocok digunakan untuk n besar dan p kecil sekali, sedangkan binom cocok
untuk n kecil dan p besar.
np dan 2 np
Contoh 6.4
Bila variabel acak X mempunyai sebaran binom denagn n=100, p=0.005, hitunglah P(X=15)!
Jawab :
100
f(x)=P(X=x)= 0.005x 0.995100 x , x= 0, 1, 2, ……, 100
x
maka :
100
f(15)=P(X=15)= 0.00515 0.99585
15
46
Peluang ini sulit dihitung karena n=100 adalah besar dan p=0.005 adalah kecil. Oleh karena itu
kita pakai pendekatan sebaran poisson, yaitu :
np =100(0.005)=0.5
e x
p ( x; ) ,
x!
e 0.5 0.5
x
p( X x) , x= 0, 1, 2, ……, 100
x!
Maka
e 0.5 0.5
15
p ( X 15) 0.00000
15!
Sebaran peluang seragam adalah suatu bentuk sebaran peluang dimana untuk setiap titik
pengamatan pada suatu selang nilai tertentu mempunyai peluang yang sama.
Sebaran peluang seragam untuk data diskrit dapat dituliskan sebagai berikut:
P(X=x) = 1/n : x = 1, 2, ..., n
sedangkan sebaran peluang seragam untuk data kontinu dituliskan sebagai berikut:
1
f ( x) ;a xb
ba
47
6.5 Sebaran Normal
Suatu peubah acak kontinu X yang memiliki sebaran berbentuk genta disebut peubah acak
normal. Bila X adalah suatu peubah acak normal dengan nilaitengah dan ragam 2 , maka
persamaan kurva normalnya adalah
2
1 x
1
n( x; , ) e 2
, untuk - < x <
2
sedangkan dalam hal ini = 3.14159…. dan e = 2.71828….
Bila nilai-nilai dan diketahui, maka kurva normal itu telah tertentu dengan pasti.
Misalkan bila = 50 dan =5, maka ordinal-ordinat n(x;50,5) dengan mudah dapat dihitung
untuk berbagai nilai x, dan kemudian kurvanya dapat digambar.
Sifat-sifat kurva normal :
a. Modusnya hanya satu dan terletak di x =
b. Kurvanya simetris/setangkup terhadap garis tegak x =
c. Grafik selalu berada di atas sumbu x atau f(x)>0
d. Kurvanya mendekati sumbu x secara asimtotik dalam dua arah, jika semakin menjauhi
nilaitengahnya
e. Luas daerah di bawah kurva dan di atas sumbu x sama dengan 1
Kurva sembarang sebaran peluang kontinu atau fungsi kepekatan dibuat sedemikian
rupa sehingga luas daerah di bawah kurva yang dibatasi oleh x = x1 dan x = x2 sama dengan
peluang bahwa peubah acak X mengambil nilai antara x = x1 dan x = x2. Untuk menghitung nilai
peluang sebaran normal, dari kalkulus integral sangatlah rumit. Sehingga untuk menghindari hal
itu digunakan table kenormalan atau table normal baku, yaitu dengan mentransformasikan
setiap pengamatan dari peubah acak normal X menjadi suatu nilai peubah acak normal Z
dengan nilaitengah nol dan ragam satu. Transformasi normal baku atau transformasi Z yang
dimaksud adalah
X
Z
Nilaitengah Z adalah nol, karena
1 1
E(Z ) E ( X ) ( ) 0
48
1 2 2
Z2 2X 2X X 2 1
2
Sehingga sebaran normal baku adalah sebaran peubah acak normal dengan nilaitengah nol dan
simpangan baku 1.
Bila X berada di antara x = x1 dan x = x2 maka peubah acak Z akan berada di antara
nilai-nilai padanannya.
X1 X2
Z1 , dan Z2
Karena semua nilai X yang jatuh antara x1 dan x2 mempunyai nilai z padanannya antara z1 dan
z2, maka luas daerah di bawah kurva X sama dengan luas daerah di bawah kurva Z. Dengan
demikian
P(x1<X<x2) = P(z1<Z<z2)
2
1 x
1 2
b b
P ( a x b) f ( x)dx e
dx
a a 2
1 2 z2
z2 z2 1
P( z1 Z z 2 )
z1
f ( z )dz e
z1 2
dz
Contoh 6.5
Untuk sebaran normal dengan = 50 dan = 10, hitunglah peluang bahawa X mengambil
sebuah nilai antara 45 dan 62.
Jawab :
Diketahui
x1 = 45 dan x2 = 62
= 50 dan = 10
Ditanyakan P(45<X<62) = …….?
Nilai X harus ditransformasi ke nilai Z, yaitu
X1 X2
Z1 dan Z2
45 50 62 50
Z1 0.5 dan Z2 1.2
10 10
Dengan demikian
P(45<X<62) = P(-0.5<Z<1.2)
= P(Z<1.2) – P(Z<-0.5)
= 0.8849 - 0.3085
= 0.5764
49
Contoh 6.6
Untuk sebaran normal dengan = 300 dan = 50, hitunglah peluang peubah acak X mengambil
nilai yang lebih besar dari 362.
Jawab :
Diketahui
= 300 dan = 50
Ditanyakan P(X>362) = …..?
X
Z
362 300
Z = 1.24
50
P(X>362) = P(Z>1.24)
= 1 – P(Z<1.24)
= 1 – 0.8925
= 0.1075
Contoh 6.7
Suatu penelitian yang dilakukan oleh seorang mahasiswa menyebutkan bahwa secara rata-rata
seorang pengunjung mengeluarkan uang belanja di suatu pusat perbelanjaan adalah Rp
247.000,00 dengan simpangan baku Rp 84.600,00. Jika diasumsikan sebaran normal, berapakah
:
a. peluang orang itu mengeluarkan uang belanja paling sedikit Rp 300.000,00
b. peluang orang itu mengeluarkan uang belanja antara Rp 200.000,00 sampai Rp 400.000,00
c. jika diasumsikan banyaknya pengunjung mencapai 200 orang setiap hari, berapa banyaknya
orang yang diperkirakan mengeluarkan uangnya untuk berbelanja sebanyak-banyaknya Rp
150.000,00
penyelesaian
Misalkan X = besarnya pengeluaran uang belanjaan setiap pengunjung suatu pusat perbelanjaan
dalam ribuan rupiah.
247, 84,6 , n = 200
a. P(X300) = ….?
Nilai X harus ditransformasi ke nilai Z, yaitu
x 300 247
z z 0.63
84,6
dengan demikian
P(X300) = P(Z0.63) = 1 – P(Z<0.63) = 1 – 0.7357 = 0.2643
b. P(200X400) = ….?
50
x1 200 247
z1 z1 0.56
84,6
x2 400 247
z2 z2 1,81
84,6
P(200X400) = P(-0,56 Z 1,81) = P(Z1,81) – P(Z-0,56) = 0.9649 – 0.2877 = 0.6722
Contoh 6.7
Nilai ujian statistika sebagian besar mahasiswa mempunyai sebaran normal dengan rata-rata
=34 dan simpangan baku =4. Jika X menyatakan nilai-nilai mahasiswa tersebut, berapakah
batas nilai Xo agar 10% dari kelompok nilai terendah berada di bawah Xo ?
Penyelesaian :
Diketahui = 34 dan = 4
X X 34
Z Z
4
X 34 Xo 34
P(XXo)=0.1 P 0.1 P(ZZo) = 0.1
4 4
Dari tabel sebaran normal kumulatif diperoleh Zo=-1.282
Maka
Xo=34+(-1.282)4=28.87
Jadi batas atas nilai untuk 10% kelompok mahasiswa yang mendapat nilai terendah adalah
28.87
1. Peluang seseorang sembuh dari suatu penyakit darah adalah 0.4. Bila 15 orang
diketahui menderita penyakit ini, berapa peluang bahwa
a. sekurang-kurangnya 10 orang dapat sembuh
b. ada 3 sampai 8 orang yang sembuh
c. 5 orang yang sembuh
2. Pupuk urea yang ditawarkan kepada petani ada dua jenis yaitu urea tablet dan urea
biasa. Dari hasil survey diketahui 3/5 petani menggunakan pupuk urea tablet dan 2/5
petani menggunakan pupuk urea biasa. Jika empat petani dikunjungi ke lapangan,
hitunglah :
51
a. peluang tidak ada petani yang menggunakan pupuk urea tablet.
b. peluang tiga petani menggunakan pupuk urea tablet.
c. paling banyak dua petani menggunakan urea tablet.
4. Bila 5 kartu diambil secara acak dari seperangkat kartu brigde, berapa peluang
diperoleh 3 kartu hati
5. Putri hendak menanami halaman depan dan samping rumahnya dengan tanaman bunga.
Dari sebuah kotak yang berisi 3 umbi tulip, 4 umbi daffodil, dan 3 umbi hyacinth, ia
mengambil 5 umbi secara acak untuk ditanam di halaman depan dan 5 umbi sisanya di
halaman samping. Berapa peluang ketika musim bunga tiba di halaman depan
berbunga tulip, 2 daffodil dan 2 hyacinth
6. Misalkan bahwa secara rata-rata 1 orang di antara 1000 orang adalah pecandu alcohol.
Hitung peluang bahawa dalam suatu contoh acak 8000 orang terdapat kurang dari 7
pecandu alcohol.
8. Misalkan secara rata-rata 1 di antara 1000 orang membuat kesalahan angka dalam
melaporkan pajak pendapatannya. Bila 10000 formulir diambil secara acak dan
diperiksa, berapa peluang ada 6, 7, atau 8 formulir yang mengandung kesalahan
9. Pada ujian statistika, nilai rata-ratanya adalah 74 dan simpangan bakunya 7. Bila 12%
diantara peserta ujian akan diberi nilai A, dan nilai itu mengikuti sebaran normal,
berapakah batas terendah bagi A dan batas nilai tertinggi bagi nilai B
10. Rata-rata tinggi anjing pudel jenis tertentu adalah 30 cm, dan simpangan bakunya 4.1
cm. Berapa persentase banyaknya anjing pudel jenis tersebut yang tingginya lebih dari
35 cm, bila tinggi menyebar normal dan dapat diukur sampai ketelitian berapapun.
52
c. nilai terendah B bila 10% mendapat nilai B, dan 25% mendapat nilai C
12. Di suatu daerah diketahui 10% penduduknya tergolong kaya. Suatu sampel acak terdiri
dari 400 penduduk telah diambil. Tentukan peluang :
a. paling banyak 30 orang yang tergolong kaya
b. antara 30 sampai 50 orang yang tergolong kaya
c. 55 orang atau lebih yang tergolong kaya
13. Krisis moneter menyebabkan tingkat penjualan rumah mengalami penurunan. Dari
seluruh developer di Kota tertentu diketahui tingkat penjualan rata-rata 1 milyar
dengan simpangan baku 0.2 milyar. Jika diasumsikan tingkat penjualan menyebar
normal :
a. hitunglah peluang sebuah developer mempunyai tingkat penjualan minimal 1.2
milyar
b. Jika di daerah tersebut terdapat 50 developer, estimasikan jumlah developer
yang mempunyai tingkat penjualan 0.5 sampai 1 milyar.
53
7 SEBARAN PERCONTOHAN
Hasil suatu percobaan statistika dapat dicatat dalam bentuk numerik ataupun huruf.
Bila sepasang dadu dilantumkan dan jumlah mata dadu yang terjadi merupakan hal yang ingin
diselidiki, sehingga hasilnya dicatat dalam bentuk numerik.
Suatu POPULASI terdiri atas keseluruhan pengamatan yang menjadi pusat perhatian.
Banyaknya pengamatan dalam populasi dinamakan UKURAN populasi. Tiap pengamatan dalam
populasi merupakan satu nilai dari suatu peubah acak (X) dengan suatu sebaran peluang f(x).
Oleh karena itu, sering kita mendengar tentang istilah populasi binomial, populasi normal,
atau secara umum disebut sebagai populasi f(x). Istilah tersebut sebenarnya mengacu pada
harga peubah acak X yang memiliki sebaran binomial, normal atau sebaran peluang f(x).
Hal pokok yang menjadi pusat perhatian seorang statistikawan adalah menarik
kesimpulan tentang parameter populasi yang tidak diketahui. Pada populasi normal, misalnya,
parameter µ dan 2 mungkin tidak diketahui dan hendaknya ditaksir berdasarkan keterangan
yang diperoleh dari contoh yang mewakili suatu populasi. Contoh yang mewakili suatu populasi
disebut contoh acak, apabila setiap anggota populasi mempunyai peluang yang sama untuk
dipilih sebagai contoh. Dengan demikian dasar teori pengambilan contoh perlu dipelajari
dengan baik.
Misalkanlah x1, x2, x3, ...., xn merupakan n peubah acak bebas yang masing-masing memiliki
sebaran peluang f(x). Gugus x1, x2, x3, ..., xn didefinisikan sebagai contoh acak berukuran n
dari populasi f(x) dan sebaran peluang gabungannya ditulis sebagai:
f(x1,x2,x3,...,xn) = f(x1)f(x2)f(x3)...f(xn).
54
7.3 Sebaran Contoh dari Rataan (Mean)
Sebaran contoh yang penting untuk dibahas adalah rataan ( x ). Misalkan contoh acak
berukuran n pengamatan diambil dari populasi normal dengan rataan µ dan simpangan baku
(). Tiap pengamatan xi, i=1,2,...,n adalah contoh acak yang memiliki sebaran normal yang
sama dengan populasi yang menjadi pusat pengambilan contoh.
Rataan contoh mengikuti sebaran normal dengan rataan dan ragam adalah sebagai
berikut:
E( x)
x2 var(x ) 2 / n
Teorema Limit Pusat:
Jika contoh acak diambil dari populasi sembarang dengan rataan µ dan simpangan baku
, maka sebaran dari rataan ( x ) dapat dihampiri normal jika n cukup besar, dengan
rataan µ dan galat baku / n. Dengan kata lain,
x
Z ~ N ( 0 ,1)
/ n
Pertanyaan yang sering muncul akibat teorema di atas adalah seberapa banyak n yang
harus diambil dan berapa batasan n yang dapat dikatakan cukup besar ? Untuk menjawab
pertanyaan ini tentunya diperlukan hampiran n yang cukup baik. Berdasarkan pengalaman
diketahui bahwa jika n>30 maka sudah cukup digunakan sebagai pendekatan teorema limit
pusat.
Untuk data pengamatan yang mengikuti sebaran Binomial juga dapat dihampiri dengan
sebaran normal dan tidak bertentangan dengan teorema limit pusat. Untuk memahami
permasalahan ini, kita kembalikan lagi pada sebaran Bernoulli:
xi=1, jika percobaan sukses
xi=0, jika percobaan gagal
Peubah acak x1, x2, ..., xn adalah saling bebas, dan setiap pengamatan memiliki sebaran
peluang sebagai berikut:
x 0 1
----------------------------------
f(x) (1-p) p
dengan rata-rata p dan ragam p(1-p).
Akibat dari teorema limit pusat maka sebaran contoh dari rataan adalah mendekati
normal dengan rataan p dan ragam p(1-p)/n jika n besar. Dengan demikian proporsi contoh
dari kejadian sukses dalam percobaan Bernoulli mengikuti sebaran;
55
p p
Z ~ N ( 0,1)
p (1 p ) / n
(x
i 1
i x ) 2 ~ 2 db2 n 1
( n 1) S 2
~ db2 n 1
2
2 2
dengan demikian diperoleh bahwa (n-1)S / menyebar khi-kuadrat dengan derajat bebas n-1.
Teorema berikut tidak ditunjukkan dengan bukti yang lengkap.
Teorema :
Bila S2 ragam contoh acak berukuran n diambil dari populasi normal dengan ragam 2,
maka peubah acak,
2 = (n-1)S2/ 2
menyebar khi-kuadrat dengan derajat bebas n-1.
x
t
s/ n
dimana nilai ini adalah peubah acak yang menyebar t-student dengan derajat bebas n-1.
56
7.6 Sebaran F
Salah satu sebaran yang terpenting dalam statistika terapan adalah sebaran F. Statistik
F didefinisikan sebagai nisbah dua peubah acak khi-kuadrat yang saling bebas, masing-masing
dibagi dengan derajat bebasnya. Misal peubah acak U dan V menyebar khi-kuadrat dengan
derajat bebas v1 dan v2 dimana U>V maka sebaran F dapat ditulis sebagai berikut:
F = (U/v1) / (V/v2),
Teorema :
Bila S12 dan S22 adalah ragam contoh acak berukuran n1 dan n2 yang diambil dari
populasi normal masing-masing dengan 12 dan 22, bila S12 S22 maka,
{(n1 1)S1 / 21 } / v1
2
F
{(n2 1) S 2 / 2 2 } / v2
2
atau takhingga, masing-masing dengan nilaitengah 1 dan 2 ragam 12 dan 22 , maka beda
kedua nialitengah contoh, X 1 X 2 , akan menyebar menghampiri sebaran normal dengan
nilaitengah dan simpangan baku
12 22
X1 X 2 1 2 dan X1 X 2
n1 n2
Dengan demikian
( x1 x2 ) ( 1 2 )
z merupakan nilai normal baku Z
( 12 / n1 ) ( 22 / n 2 )
Bila dua peubah acak X dan Y bebas dan masing-masing menyebar normal dengan
nilaitengah x dan y dan ragam x2 dan y2 maka beda X-Y menyebar normal dengan
57
7.8 Latihan Soal
a. t 0.025 bila v 14
b. t 0.995 bila v 7
c. P(T<2.365) bila v = 7
d. P(-1.356<T<2.179) bila v = 12
e. P(T>-2.567) bila v = 17
f. P( t 0.005 T t 0.01 )
g. P( (T t 0.025 )
4. Diberikan sebuah contoh acak berukuran 24 yang ditarik dari suatu populasi normal,
tentukan k bila
a. P(-2.069<T<k) = 0.965
b. P(k<T<2.807) = 0.095
c. P(-k<T<k) = 0.9
5. Sebuah perusahaan menyatakan bahwa rokok yang diproduksinya mempunyai
kandungan nikotin rata-rata sebesra 1.83 mg perbatang. Bila diambil contoh acak 8
batang rokok jenis tersebut, dengan kandungan nikotin 2.0, 1.7, 2.1, 1.9, 2.2, 2.1, 2.0,
dan 1.6 mg, apakah Anda setuju dengan pernyataan perusahaan tersebut ?
58
8 PENDUGAAN PARAMETER
contoh, diantaranya nilai tengah contoh ( x ), ragam populasi (s2), proporsi populasi (p) dan
lain-lain.
Untuk memperoleh gambaran yang baik mengenai populasi, maka statistik ˆ yang
dipakai untuk menduga parameter haruslah merupakan penduga yang baik, yaitu penduga
yang mempunyai tiga ciri :
a. ˆ merupakan penduga tak bias dari , yaitu E( ˆ ) = , artinya harapan penduga ˆ , sama
dengan .
b. ˆ merupakan penduga yang efisien, artinya bila ada lebih dari satu penduga, maka penduga
yang efisien adalah penduga yang mempunyai variansi paling kecil
c. ˆ merupakan penduga yang konsisten, artinya bila sampel yang diambil makin besar, maka
ˆ dari sampel yang diambil dari populasi tersebut, maka statistik ˆ disebut pendugaan
titik.
Contoh :
a. x merupakan penduga titik bagi parameter populasi .
2
b. S merupakan penduga titik bagi 2
x
c. pˆ merupakan penduga titik bagi proporsi sebenarnya p
n
59
b. Pendugaan selang
Suatu dugaan selang bagi parameter populasi adalah suatu selang yang berbentuk
ˆ1 ˆ2 , dengan ˆ1 dan ˆ2 bergantung pada nilai statistik ̂ untuk suatu contoh
memperoleh suatu contoh acak yang menghasilkan suatu selang yang mengandung . Selang
ˆ1 ˆ2 , yang dihitung dari contoh yang terpilih, disebut selang kepercayaan (1-
)100%, nilai 1-, disebut koefisien kepercayaan atau derajat kepercayaan , dan kedua
titik ujungnya, ˆ1 dan ˆ2 , masing-masing disebut batas kepercayaan sebelah atas dan
sebelah bawah.
z / 2
2
s s
x t / 2 x t / 2 ,
n n
sedangkan t / 2 adalah nilai t dengan v = n – 1 derajat bebas yang di sebelah kanannya
terdapat daerah seluas /2.
60
Contoh 8.1
Dari data contoh berukuran 15 diperoleh nilai tengah contoh dan ragam contoh sebagai
berikut:
x = 10.366
s2 = 1.946
Penduga bagi parameter nilai tengah populasi adalah sebagai berikut:
x 10.366
sx s 2 / n 1.395 / 15 .....
Sedangkan penduga selang untuk nilai tengah populasi dengan tingkat kepercayaan 95 %
adalah:
12 22 12 22
( x1 x 2 ) z / 2 < 1 2 < ( x1 x 2 ) z / 2 ,
n1 n2 n1 n 2
sedangkan dalam hal ini z / 2 adalah nilai peubah normal baku z yang luas daerah di sebelah
kanannya sebesar /2.
Bila x1 dan x 2 masing-masing adalah nilaitengah contoh acak bebas berukuran kecil n1
dan n2 yang diambil dari dua populasi yang hampir normal dengan ragam sama 12 22 yang
tidak diketahui nilainya, maka selang kepercayaan (1-)100%, bagi 1 2 adalah :
1 1 1 1
( x1 x 2 ) t / 2 s p < 1 2 < ( x1 x 2 ) t / 2 s p ,
n1 n2 n1 n 2
sedangkan dalam hal ini sp adalah nilai dugaan gabungan bagi simpangan baku populasi, dan
t / 2 adalah nilai t dengan v = n1+n2-2 derajat bebas yang luas daerah di sebelah kanannya
sebesar /2.
61
(n1 1) s12 (n 2 1) s 22
s 2p
n1 n2 2
Contoh 8.2
Dua buah perusahaan yang saling bersaing dalam industri kertas karton saling mengklaim bahwa
produknya yang lebih baik, dalam artian lebih kuat menahan beban. Untuk mengetahui produk
mana yang sebenarnya lebih baik, dilakukan pengambilan data masing-masing sebanyak 10
lembar, dan diukur berapa beban yang mampu ditanggung tanpa merusak karton. Datanya
adalah :
Perusahaan A 30 35 50 45 60 25 45 45 50 40
Perusahaan B 50 60 55 40 65 60 65 65 50 55
n x12 xi
2
30 35 40 10(19025) - (425) 2
x1 42,5 s
2
106.94
n(n 1)
1
10 10(9)
n x 22 xi
2
50 60 55 10(32525) - (565) 2
x2 56,5 s
2
66.94
n(n 1)
2
10 10(9)
b. Buatlah selang kepercayaan 90% bagi selisih rataan perusahaan B dengan perusahaan A,
dengan mengasumsikan ragam kedua populasi sama.
Jawab
( x 2 x1 ) t ( , db )
s p (1 / n 2 ) (1 / n1 ) 2 1 ( x 2 x1 ) t ( , db )
s p (1 / n 2 ) (1 / n1 )
2 2
Bila x1 dan s12 , dan x 2 dan s 22 masing-masing adalah nilaitengah dan ragam contoh
acak bebas berukuran kecil n1 dan n2 yang diambil dari dua populasi yang mendekati normal
dengan ragam tidak sama 12 22 yang tidak diketahui nilainya, maka selang kepercayaan (1-
)100%, bagi 1 2 adalah :
62
s12 s 22 s12 s 22
( x1 x 2 ) t / 2 < 1 2 < ( x1 x 2 ) t / 2 ,
n1 n2 n1 n2
( s12 / n1 s 22 / n2 ) 2
v
[( s12 / n1 ) 2 /(n1 1)] [( s 22 / n 2 ) 2 /(n2 1)]
yang luas daerah di sebelah kanannya sebesar /2.
Contoh 8.3
Jika pada contoh 8.2 ingin diduga selang kepercayaan 90% bagi selisih rataan perusahaan B
dengan perusahaan A, dengan mengasumsikan ragam kedua populasi berbeda, maka dugaan
selangnya adalah:
( x 2 x1 ) t ( , db )
( s 22 / n2 ) ( s12 / n1 ) 2 1 ( x 2 x1 ) t ( , db )
( s 22 / n2 ) ( s12 / n1 )
2 2
(56,5 42,5) t ( 0,05;17 ) 66,94 / 10 106,94 / 10 2 1 (56,5 42,5) t ( 0,05;17 ) 66,94 / 10 106,94 / 10
14 1,74(4,17) 2 1 14 1,74(4,17)
6,74 2 1 21,26
pˆ qˆ pˆ qˆ
pˆ z / 2 ˆ z / 2
<p< p ,
n n
sedangkan dalam hal ini z / 2 adalah nilai peubah normal baku z yang luas daerah di sebelah
kanannya sebesar /2.
Bila p̂ digunakan sebagai nilai dugaan titik bagi p, maka kita dapat percaya (1-)100%,
pˆ qˆ
bahwa galatnya tidak lebih besar dari z / 2
n
63
Bila p̂ digunakan untuk menduga p, maka kita dapat percaya (1-)100%, bahwa
galatnya tidak melebihi suatu besaran tertentu e bila ukuran contohnya diambil sebesar
z2 / 2 pˆ qˆ
n
e2
Contoh 8.4
Suatu perusahaan mempunyai 1250 karyawan. Pihak manajemen ingin mengetahui besarnya
proporsi yang merasa kurang puas dengan jaminan sosial yang mereka terima. Untuk maksud itu
diambil sampel sebanyak 100 orang dan dari hasil wawancara ternyata ada 10 orang yang
menyatakan kurang puas dengan jaminan sosial yang diterimanya.
a. Bila manajer perusahaan itu dalam memperkirakan menggunakan interval kepercayaan
99%, maka dugalah interval proporsi karyawan di perusahaan tersebut yang kurang puas
dengan jaminan sosial yang mereka terima.
Jawab :
pˆ x / n 10 / 100 0,1
pˆ z pˆ (1 pˆ ) / n p pˆ z pˆ (1 pˆ ) / n
2 2
z2 / 2 2,565 2
n 1827,56 1828
4 g 2 4(0,03) 2
pˆ 1qˆ1 pˆ 2 qˆ 2 pˆ 1 qˆ1 pˆ 2 qˆ 2
( pˆ 1 pˆ 2 ) z / 2 ˆ 1 pˆ 2 ) z / 2
<p1-p2< ( p
n1 n2 n1 n2
sedangkan dalam hal ini z / 2 adalah nilai peubah normal baku z yang luas daerah di sebelah
kanannya sebesar /2.
64
8.6 Latihan Soal
65
filter dan 18 di antara 150 perokok lebih menyukai kretek. Buatlah interval kepercayaan
95% untuk perbedaan persentase penjualan dua jenis rokok tersebut. Simpulkan apakah
selisih sebesar 8% yang dinyatakan pimpinan perusahaan tersebut bisa diterima ?
7. Suatu sampel acak sebanyak 8 batang rokok merk tertentu mempunyai rata-rata kadar
nikotin 3.5 mg dan simpangan baku 1 mg. Buatlah interval kepercayaan 99% untuk rata-rata
nikotin yang sesungguhnya rokok merk itu, bilamana diasumsikan kadar nikotin tersebut
menyebar normal
8. Dari sampel acak 12 mahasiswi suatu perguruan tinggi, diperoleh bahawa rata-rata uang
saku bulanannya adalah Rp 500.000,00 denag simpangan baku Rp 50.000,00. Bila
diasumsikan uang saku menyebar normal, buatlah selang kepercayaan 90% untuk rata-rata
uang saku mahasiswi tersebut.
9. Data berikut menunjukkan masa putar (dalam puluhan menit) film yang diproduksi dua
perusahaan
Perusahaan A 11 9 10 7 15 12 8 10 13 14
Perusahaan B 10 9 12 9 8 7 9 6 8 15
Buatlah interval kepercayaan 95% untuk beda rata-rata masa putar film yang diprodukasi
oleh dua perusahaan tersebut, jika di asumsikan masa putar film mempunyai sebaran
normal dengan ragam tidak sama.
66
9 PENGUJIAN HIPOTESIS
Contoh 9.1
1. Pengujian hipotesis bahwa suatu jenis obat baru lebih efektif untuk menurunkan berat
badan. Maka rumusan hipotesisnya adalah :
H0 : obat baru = obat lama
H1 : obat baru lebih baik dari obat lama
2. Pengujian hipotesis bahwa teknologi baru dapat meningkatkan kualitas buah-buahan.
H0 : teknologi baru = teknologi lama
H1 : teknologi baru teknologi lama
67
3. Seorang dokter menyatakan bahwa, lebih dari 60% pasien yang menderita sakit paru-
paru di suatu rumah sakit adalah karena merokok.
H0 : p = 0.6
H1 : p 0.6
dilambangkan dengan H 0 . Ini menyatakan bahwa setiap hipotesis yang ingin diuji dinyatakan
dengan H0. Penolakan H 0 mengakibatkan penerimaan suatu hipotesis alternatif atau hipotesis
tandingan yang dilambangkan dengan H 1 . Suatu H0 mengenai suatu parameter populasi akan
selalu dinyatakan sedemikian rupa sehingga parameter tersebut nilainya tertentu (satu nilai),
sedangkan H1 memungkinkan beberapa nilai.
Ada beberapa dasar yang dapat digunakan untuk merumuskan hipotesis, antara lain (1)
berdasarkan pengetahuan yang diperoleh dari teori, (2) berdasarkan hasil penelitian
terdahulu, (3) berdasarkan pengalaman, atau (4) berdasarkan ketajaman berpikir.
Seperti telah dijelaskan sebelumnya bahwa kebenaran atau ketidakbenaran suatu
hipotesis tidak pernah diketahui secara pasti. Dengan adanya faktor ketidakpastian ini
mengakibatkan timbulnya suatu resiko/kesalahan yang harus ditanggung oleh pembuat
keputusan itu sendiri. Dalam pengujian hipotesis dikenal dua jenis kesalahan, yaitu kesalahan
jenis I (galat I) dan kesalahan jenis II (galat II). Galat I adalah kesalahan akibat menolak
hipotesis nol, padahal hipotesis nol benar. Sedangkan galat II adalah kesalahan akibat
menerima hipotesis nol padahal hipotesis nol tersebut salah.
Peluang melakukan galat I disebut taraf nyata uji dilambangkan dengan , sedangkan
peluang melakukan galat II dilambangkan dengan .
Hubungan antara hipotesis nol, keputusan, jenis kesalahan, dan peluang melakukan
jenis kesalahan secara ringkas disajikan pada tabel berikut.
68
Oleh karena menyatakan peluang menolak H0 yang benar, maka kita mengharapkan
nilai sekecil mungkin. Sebab tidaklah pantas sesuatu yang sesungguhnya benar kita tolak.
Demikian juga dengan yang menyatakan peluang menerima H0 yang salah, kita mengharapkan
nilainya juga sekecil mungkin, karena tidak pantas juga sesuatu yang salah kita terima. Namun
dalam kenyataannya memperkecil atau membuat dan sekecil mungkin secara sekaligus
tidaklah mungkin, karena ternyata ada hubungan antara dengan , yaitu memperkecil nilai
akan mengakibatkan membesarnya nilai , demikian juga sebaliknya. Usaha untuk memperkecil
nilai dan dapat dilakukan dengan memperbesar ukuran contoh.
Dalam praktek pengujian hipotesis, nilai yang sering digunakan adalah 0,05 dan 0,01.
Jika yang digunakan adalah 0,05, dapat diartikan bahwa kira-kira sebanyak 5 dari setiap 100
kasus bahwa kita akan menolak Ho yang benar. Dengan kata lain, ada keyakinan 95% bahwa kita
telah mebuat keputusan atau kesimpulan yang benar.
Untuk setiap pengujian dengan memakai nilai tertentu, kita dapat menghitung nilai
. Ternyata bahwa nilai ini tergantung pada nilai parameter populasi, yaitu , sehingga
dapat dinyatakan sebagai suatu fungsi, yaitu (), yang disebut fungsi ciri operasi (CO). Nilai K
= 1 - disebut kuasa uji. Kuasa uji adalah peluang menolak Ho bilai suatu tandingan tertentu
benar. Jika K() = 1 - (), maka K() disebut fungsi kuasa.
Beberapa sifat penting dalam pengujian hipotesis :
- Galat I dan galat II saling berhubungan. Menurunnya peluang yang satu akan menaikkan
peluang yang lain.
- Ukuran wilayah kritik, yang berarti juga peluang melakukan galat jenis I, selalu dapat
diperkecil dengan mengubah nilai kritiknya.
- Peningkatan ukuran contoh n akan memperkecil dan secara bersama-sama.
- Bila hipotesis nolnya salah, nilai akan sangat besar bila nilai parameternya dekat
dengan nilai yang dihipotesiskan. Semakin besar jarak antara nilai yang sesungguhnya
dengan nilai yang dihipotesiskan, maka semakin kecil nilai .
Contoh 9.2
Suatu jenis deterjen baru diduga dapat mencuci bersih 70% dari bercak pada pakaian. Untuk
menguji dugaan ini, deterjen ini digunakan pada 12 bercak yang dipilih secara acak. Bila
kurang dari 11 bercak yang hilang maka dugaan kemampuan deterjen tersebut dalam mencuci
70% dari bercak pakaian diterima.
a. hitunglah galat I dengan menganggap bahwa p = 0,7
b. hitunglah galat II jika ternyata p = 0,9
Jawab
Hipotesis : Ho : p = 0,7 vs H1 : p > 0,7
69
X = banyaknya bercak pakaian yang berhasil dicuci
Nilai kritis : 11
a. P( galat I ) P( X 11 | p 0,7)
12 10
b( x;12,0.7) 1 b( x;12,0.7) 1 0.915 0.085
x 11 x 0
10
b. P( galat II ) P( X 11 | p 0,9) b( x;12,0.9) 0.341
x 0
Contoh 9.3
Suatu contoh acak 400 pemilih di suatu kota ditanya apakah mereka mendukung kenaikan 4%
tarip listrik untuk penerangan jalan yang amat diperlukan. Bila lebih dari 220 tapi kurang dari
260 pemilih yang mendukung kenaikan tarip maka disimpulkan bahwa 60% pemilih mendukung.
a. cari peluang melakukan galat I bila 60% pemilih yang mendukung kenaikan tarif.
b. Berapa peluang melakukan galat II dalam prosedur pengujian ini bila sesungguhnya hanya
48% dari pemilih yang mendukung kenaikan tarif listrik ?
Jawab
Hipotesis : Ho : p = 0,6 vs H1 : p 0,6
Nilai kritis : 220 < X < 260
Karena n besar, maka untuk menghitung galat I dan galat II digunakan hampiran normal.
a. menghitung
= np = 400(0.6) = 240
= (npq) = {400(0.6)(0.4)} = 9.80
nilai kritis menjadi : 220.5 < X < 259.5
P( galat I ) P( X 220 | p 0.6) P( X 260 | p 0.6)
P( X 219.5 | 240) P( X 260.5 | 240)
X 219.5 240 X 260.5 240
P( ) P( )
9.80 9.80
P( Z 2.09) P( Z 2.09) 2 P( Z 2.09) 2(0.0183) 0.0366
b. menghitung
= np = 400(0.48) = 192
= (npq) = {400(0.48)(0.52)} = 9.99
P( galat II ) P(220 X 260 | p 0.48) P (220.5 X 259.5 | 192)
219.5 192 X 260.5 192
P( ) P(2.75 Z 6.86)
9.99 9.99
P( Z 6.86) P ( Z 2.75) 1 0.997 0.003
70
9.3 Uji Satu Arah Dan Dua Arah
Suatu uji hipotesis statistik yang alternatifnya bersifat satu-arah, seperti
H o : o
H1 : o
disebut uji dua arah, karena wilayah kritiknya dipisah menjadi dua bagian yang ditempatkan di
masing-masing ekor sebaran statistik ujinya. Hipotesis alternatif 0 menyatakan bahwa <
0 atau > 0.
Hipotesis nol, H0, akan selalu dituliskan dengan tanda kesamaan sehingga
menspesifikasi suatu nilai tunggal. Dengan cara demikian, peluang melakukan galat I dapat
dikendalikan. Apakah kita harus menggunakan uji satu-arah atau dua-arah, bergantung pada
kesimpulan yang akan ditarik bila H0 ditolak. Sebagai contoh, sebuah peusahaan rokok
menyatakan bahwa kadar nikotin rata-rata rokok yang diproduksinya tidak melebihi 2,5
miligram. Pernyataan dari perusahaan tersebut dapat ditolak jika rata-rata () lebih besar dari
2,5 miligram dan dapat diterima jika lebih kecil atau sama dengan 2,5 miligram. Dengan
demikian kita akan menguji
H0 : = 2,5
H1 : > 2,5
Meskipun kita menuliskan hipotesis nol-nya dengan tanda sama dengan, namun itu harus
dipahami sebagai mencakup semua nilai yang tidak dicakup oleh hipotesis alternatifnya.
Akibatnya, menerima H0 tidak boleh diimplikasikan bahwa tepat sama dengan 2,5 miligram,
namun harus diartikan bahwa kita tidak mempunyai bukti yang cukup untuk mendukung H1.
Beberapa langkah yang perlu diperhatikan dalam pengujian hipotesis:
a. Hipotesis sederhana
Hipotesis nol dan hipotesis alternatif sudah ditentukan pada nilai tertentu
H0 : = 0 vs H1 : = 1
H0 : 2 = 02 vs H0 : 2 = 12
H0 : P = P0 vs H0 : P = P1
71
b. Hipotesis majemuk
Hipotesis nol dan hipotesis alternatif dinyatakan dalam interval nilai tertentu
2. Deskripsikan data sampel yang diperoleh (hitung rataan, ragam, standard error dll)
5. Tarik kesimpulan
72
2 H0 : 0 vs Sda th < -t(; db=n-1)(tabel)
H1 : < 0
zh < -z()(tabel)
Contoh 9.4
Pemerintah berencana untuk melaksanakan sebuah program peningkatan mutu siswa. Dari
sebuah sekolah diketahui bahwa sebelum dilaksanakan program tersebut, rata-rata nilainya
adalah 7,1. Untuk melaksanakan program tersebut, sebanyak 40 siswa secara acak dipilih dari
sekolah tersebut. Data baru yang diperoleh memiliki rata-rata 7,3 dengan simpangan baku
0,15. Berhasilkah program tersebut (gunakan alpha 5%) ?
Jawab
Karena yang ingin diketahui apakah ada peningkatan mutu pendidikan setelah diadakan
program tersebut, maka :
- hipotesisnya : H0 : = 7.1 vs H1 : > 7.1.
- titik kritis : Z0,05 = 1,645 (digunakan uji Z karena n relatif besar , n = 40)
X o 7,1 7,3
- Stat. Uji : Z hitung 8,43
sx 0,15 / 40
- Karena Zhitung > 1,645 maka tolak H0, artinya ada peningkatan rata-rata nilai setelah
diadakan program peningkatan mutu siswa tersebut sehingga dapat dikatakan bahwa
program tersebut berhasil dilaksanakan.
Contoh 9.5
Batasan yang ditentukan oleh pemerintah terhadap emisi gas CO kendaraan bermotor adalah 50
ppm. Sebuah perusahaan baru yang sedang mengajukan ijin pemasaran mobil, diperiksa oleh
petugas pemerintah untuk menentukan apakah layak perusahan tersebut diberikan ijin.
Sebanyak 20 mobil diambil secara acak dan diuji emisi CO-nya. Dari data yang didapatkan,
rata-ratanya adalah 55 dan ragamnya 4.2. dengan menggunakan taraf nyata 5%, layakkan
perusahaan tersebut mendapat ijin ?
Jawab
- Hipotesis H0 : = 50 vs H1 : > 50
- titik kritis : t(0,05;19) = 1,729
X 55 50
- Stat. Uji : t 10,91
sx 2,05 / 20
- Karena thitung > 1,729 maka tolak H0, artinya emisi gas CO kendaraan bermotor yang
akan dipasarkan oleh perusahaan tersebut melebihi batasan yang ditentukan oleh
pemerintah sehingga perusahaan tersebut tidak layak untuk memperoleh ijin untuk
memasarkan mobilnya.
73
Contoh 9.6
Seorang pelamar untuk jabatan salesmen menyatakan bahwa dia sanggup melakukan penjualan
minimal 7 unit barang sehari. Untuk membuktikan hal itu, manajer personalia memberikan
waktu selama 12 hari. Hasil penjualan selama tes tersebut adalah sebagai berikut : 4, 5, 8, 3,
6, 4, 4, 8, 7, 3, 4, 5. Ujilah apakah pernyataan orang tersebut didukung oleh data (gunakan
alpha 10%).
Jawab
Untuk menguji pernyataan salesman bahwa dia sanggup menjual minimal 7 unit barang
sehari , maka : Hipotesis H0 : >= 7 vs H1 : < 7
- titik kritis 10% : t(0,10;11) = 1,363, gunakan titik kritis –1,363
- x
x i
4 5 ... 5
5,08 ;
n 12
s 2
x 2
i n( x ) 2
(4 2 5 2 ... 5 2 ) 12(5,08) 2
3,174
n 1 11
x 0 5,08 7
- Stat. Uji : t 3,73
sx 1,78 / 12
- Karena thitung < -1,363 maka tolak H0, artinya rata-rata penjualan barang oleh salesmen
tersebut tidak lebih dari 7 unit barang per hari tetapi kurang dari 7 unit.
Untuk menguji perbedaan dua nilai tengah populasi dapat dibedakan menjadi dua kasus
yaitu kasus saling bebas dan kasus berpasangan.
dimana:
1 1
s g ; 12 2
2
n1 n 2
s x1 x 2
s1
2
s 22
n ; 12 22
1 n2 |zh | > z(/2)(tabel)
b. Contoh besar atau ragam pop
diketahui
( x1 x 2 ) 0
zh
( x1 x2 )
74
2 H0 : 1-2 0 Sda th < -t(; db)(tabel)
vs
H1 : 1-2 < 0
zh < -z()(tabel)
Sedangkan berikut ini adalah uji hipotesis untuk dua contoh yang berpasangan
Kedua kasus tersebut dibedakan oleh metode pengambilan contohnya. Dua contoh dikatakan
saling bebas jika pemilihan unit-unit contoh pertama tidak tergantung pada bagaimana unit-
unit contoh kedua dipilih dan sebaliknya. Sedangkan dua contoh dikatakan berpasangan jika
pengambilan unit-unit contoh pertama memperhatikan bagaimana unit-unit contoh kedua
dipilih. Keterkaitan kedua contoh pada kasus berpasangan ditentukan oleh suatu peubah
kontrol (control variable) misal lokasi, kemiringan lahan, tingkat pendidikan, kondisi sosial
ekonomi dan lain-lain.
Contoh 9.7
Dua jenis program manajemen pemasaran diterapkan pada sebuah perusahaan retail untuk
mengkaji program mana yang lebih efisien meningkatkan penjualan mingguan. Kedua program
tersebut dievaluasi dengan cara mencatat penjualan selama 9 minggu. Program pertama
mampu memberikan rata-rata nilai penjualan mingguan sebesar 230 juta dengan simpangan
baku 10 juta, sedangkan program kedua rata-ratanya 210 juta dengan simpangan baku 9 juta.
75
Jika diasumsikan kedua kondisi sama, ujilah apakah kedua program memberikan hasil yang
berbeda ? (gunakan 5%)
Jawab
Untuk mengkaji program mana yang lebih efisien,
Hipotesisnya : H0 : 1 - 2 = 0 vs H1 : 1 - 2 0
- titik kritis untuk = 5% : t(0,025;16) = 2,120 (ingat : kondisi sama ragam sama,
sehingga db = n1+n2-2)
(n1 1) s12 (n2 1) s 22 8(100) 8(81)
ragam gabungan : s 90,5
2
-
n1 n 2 2
p
16
( x1 x 2 ) d 0 230 210 0
- Stat. Uji : t 4,46
s p (1 / n 1 ) (1 / n2 ) 9,51 1 / 9 1 / 9
- Karena |thitung| > 2,120 maka tolak H0, artinya ada perbedaan dalam tingkat efesiensi
peningkatan penjualan mingguan antara program pertama dan yang kedua, di mana
program yang lebih efisien adalah program yang pertama.
Contoh 9.8
Seorang mahasiswa Budidaya Pertanian ingin membandingkan produksi dari dua varietas kacang
tanah. Kemudian kedua varietas kacang tanah tersebut ditanam pada delapan lokasi yang
berbeda tetapi setiap varietas ada pada setiap lokasi. Data produksi (ton perhektar) kedua
varietas tersebut diperoleh sebagai berikut :
Varietas\lokasi 1 2 3 4 5 6 7 8
Var 1 6.25 5.30 7.10 6.45 6.00 4.83 5.40 6.80
Var 2 5.50 5.80 6.00 7.50 6.25 4.85 5.00 6.50
ujilah apakah kedua varietas memberikan hasil yang berbeda, jika berbeda mana yang
menurut anda lebih baik? (gunakan 5%)
Jawab
Kasus di atas termasuk kasus pengamatan berpasangan, sehingga perlu dicari beda dari
varietas 1 dan varietas 2, yaitu
di : 0.75, -0.5, 1.1, -1.05, -0.25, -0.02, 0.4, 0.3
- Hipotesis H0 : d = 0 vs H1 : d 0
- titik kritis : t(0,025;7) = 2,365
- nilai statistik :
d
di 0.75 ( 0.5) ... 0.3
0.091
n 8
s d2
d i2 n(d ) 2 3.4379 8(0.091) 2 0.482 s 0.694
n 1
d
7
d d 0.091 0
- Stat. Uji : t 0.371
sd / n 0.694 / 8
- Karena thitung < 2,365 maka terima H0, artinya belum cukup bukti untuk menyimpulkan
bahwa kedua varietas kacang tanah tersebut memberikan hasil produksi yang berbeda.
76
9.5 Latihan Soal
1. Jelaskan istilah berikut :
a. hipotesis b. hipotesis statistik c. pengujian hipotesis statistik
d. hipotesis nol e. hipotesis alternatif f. kesalahan jenis I
g. kesalahan jenis II h. taraf signikansi i. uji satu arah
j. uji dua arah k. niali kritis l. nilai kritis
m. satistik uji n. statistik hitung
2. Suatu perusahaan memproduksi lampu listrik yang umurnay mendekati sebaran normal
dengan nilai rata-rata 80 jam dan simpangan baku 40 jam. Dengan menggunakan sampel
acak sebanyak 30 lampu ternyata rata-rata umur lampu hanya 775 jam. Ujilah hipotesis
bahwa = 800 dan lawan alternatifnya 800 jam, denagn memakai taraf signifansi =
0.01
3. Seorang pimpinan perusahaan ingin meningkatkan kualitas sumber daya karyawannya di
bidang produksi. Dia berharap setelah mereka mengikuti kursus, cacat produksi bisa
berkurang 10%. Pada suatu saat tertentu setelah para karyawan mengikuti kursus diketahui
bahwa dari sampel sebanyak 20 produk yang diambilsecara acak ternyata terdapat 3 produk
yang cacat. Dengan menganggap distribusi menyebar normal, apakah harapan pimpinan itu
terbukti dalam sampel tersebut. Gunakan = 10%
4. Suatu perusahaan garmen ingin mengembangkan produksi kemeja. Pimpinan perusahaan
menyatakan bahwa bila paling sedikit sebanyak 30% yang berminat membeli kemeja
tersebut, maka perusahaan akan memperluas usahanya. Untuk itu diadakan penelitian yang
melibatkan 200 responden dan ternyata terdapat 70 responden yang tertarik membeli
kemeja tersebut. Dengan taraf = 1%, ujilah pernyataan pimpinan tersebut, apaakh ia
akan memperluas usahanya atau tidak, dengan asumsi populasi menyebar normal.
5. Sebuah sampel yang terdiri atas 100 kendaraan bermotor masing-masing telah dipilih dari
populasi kendaraan bermotor yang ada di Bekasi dan Bandung. Di Bandung ditemukan
sebanyak 72 kendaraan yang telah melunasi pajak kendaraan, sedangkan di Bekasi hanya 66
kendaraan saja yang telah melunasi pajak kendaraan. Ujilah perbedaan proporsi kendaraan
yang telah melunasi pajak di dua kota tersebut dengan memakai = 1%
77
10 ANALISIS REGRESI DAN KORELASI
Dalam penelitian ada kalanya dilakukan pengamatan terhadap lebih dari satu ciri
terhadap tiap-tiap anggota contoh. Hubungan antara ciri-ciri yang diamati itu sering menarik
perhatian, sehingga timbullah masalah korelasi dan regresi.
Pada masalah korelasi dibicarakan keeratan hubungan antara dua ciri atau lebih,
sedangkan pada masalah regresi kita menduga bentuk hubungan antara ciri-ciri tersebut.
Yi = + Xi ……………(1)
dengan :
Xi = peubah bebas
Dalam praktek, seringkali kita tidak dapat mengamati seluruh anggota populasi,
sehingga hanya mengamati n buah contoh acak dan diperoleh pengamatan berukuran n serta
dapat dilambangkan dengan {(xi, yi), I = 1, 2, …, n}.
Persamaan yang kita peroleh adalah dugaan dari persamaan (1) dan dapat dituliskan :
Yˆi a bX i ……..(2)
78
Untuk peubah bebas xi, nilai pengamatan yi tidak akan selalu tepat berada pada garis
persamaan (1) untuk garis regresi populasi atau pada persamaan (2) untuk garis regresi contoh.
Dengan demikian akan terdapat simpangan sebesar i untuk populasi atau ei untuk contoh,
sehingga diperoleh persamaan :
Untuk melihat pola hubungan antara X dan Y pertama-tama kita plotkan nilai
pengamatan (xi, yi) pada bidang kuadran dua. Jika hasil plot menunjukkan pola titik-titik yang
menyerupai garis lurus, maka penggunaan regresi linear sederhana untuk melihat pola
hubungan antara kedua peubah tersebut sudah tepat.
n
ei ˆi Yi Yˆi dan misalkan q ei2
i 1
maka untuk mendapatkan penduga kuadrat terkecil dari parameter regresi adalah dengan
meminimumkan nilai q, nilai q ini disebut juga JKG. Dengan menggunakan bantuan pelajaran
kalkulus maka nilai dugaan parameter regresi dapat diperoleh sebagai berikut :
n n n n
(x
i 1
i x )( yi y ) n xi y i xi y i
i 1 i 1 i 1
b n
2
dan a y bx
x x
n n
n x xi
2
2
i i
i 1 i 1 i 1
besaran nilai a dan b dapat diinterpretasikan sebagai berikut : pada saat x bernilai nol maka
besarny nilai dugaan y adalah sebesar a, sedangkan nilai b menunjukkan besarnya perubahan
nilai y jika terjadi perubahan pada nilai x satu-satuan.
79
10.3 Pengujian Hipotesis Bagi Koefisien Regresi
Seperti halnya dalam pendugaan nilai tengah, maka penilaian tentang tingkat
keyakinan terhadap hasil dugaan b memerlukan informasi tentang ragam dari b, atau lebih
tepatnya adalah informasi tentang pola sebaran b. Untuk dapat mengetahui informasi ini, kita
terlebih dahulu membuat beberapa asumsi mengenai model regresi.
Berdasarkan persamaan (3), beberapa asumsi yang harus dipenuhi yaitu i adalah bebas
terhadap sesamanya dan menyebar normal dengan nilai tengah nol dan ragam 2 [i (0, 2)].
Berdasarkan model (3) di atas, dengan konstanta dan sebagai parameter regresi dan xi
bukan sebuah peubah acak, maka yi adalah suatu peubah acak yang menyebar normal dengan
E(yi) = + xi dan Var(yi) = 2 untuk semua i.
Nilai a dan b merupakan dugaan bagi parameter dan . Dengan pengambilan contoh
acak berulangkali dapat diperoleh nilai dugaan yang berbeda bagi dan . Nilai-nilai dugan
tersebut dapat dipandang sebagai nilai-nilai peubah acak A dan B. nilai-nilai A dan B tersebut
tergantung pada keragaman nilai peubah acak Y1, Y2, …, Yn.
Penduga koefisien b adalah kombinasi linear dari peubah acak yi, yaitu berupa
(x i x )( y i y ) n n
b i 1
n
wi ( yi y ) wi y i w1 y1 w2 y 2 wn y n
x
i 1
i x
2 i 1 i 1
( xi x ) n n
dengan wi n
; dan karena w i 0, maka w y 0 i
x x i 1 i 1
2
i
i 1
n n n n n n
E (b) E ( wi y i ) wi E ( y i ) wi ( xi ) wi wi xi wi xi
i 1 i 1 i 1 i 1 i 1 i 1
n n n
karena nilai w i 1
i 0 maka x wi wi x 0
i 1 i 1
n n n n
sehingga w x w x w x w (x
i 1
i i
i 1
i i
i 1
i
i 1
i i x) 1
80
Ragam dari b adalah
n n n (x i x)2
2
Var (b) Var ( wi y i ) wi2Var ( y i ) 2 wi2 2 i 1
2
n
n
i 1 i 1 i 1
( xi x ) 2 (x i x)2
i 1 i 1
E (a ) E ( y bx ) E ( y ) x E (b) x x dan
(x) 2 1
2
(x)2 2 2
Var (a) Var ( y bx ) Var ( y ) ( x ) Var (b)
2
n n
n
n
( xi x ) 2 ( xi x ) 2
i 1 i 1
karena Y1, Y2, …, Yn bebas dan menyebar normal, maka A dan b juga menyebar normal dengan
nilai tengah dan ragam seperti di atas.
Karena ragam dari A dan B mengandung parameter 2 yang umumnya nilainya tidak
diketahui, maka perlu dilakukan pendugaan untuk nilai tersebut. Parameter 2 merupakan
ragam galat pada model yang menggambarkan keragaman acak dari keragaman galat percobaan
di sekitar garis regresi. Penduga tak bias bagi 2 adalah s2, yaitu
JKG i 1
e 2
J yy bJ xy J yy b 2 J xx
i
s
2
n2 n2 n2 n2
dengan :
2 2
n n
n n xi n n yi
J xx ( xi x ) x 2 2
i
i 1
n
; J yy ( y i y ) y
2 2
i
i 1
n
i 1 i 1 i 1 i 1
n n
n n xi y i
J xy (x
i 1
i x )( y i y ) x
i 1
i yi i 1 i 1
n
Untuk menguji hipotesis apakah intersep bernilai tertentu (miaslnya k) dapat diuji
dengan menggunakan statistik uji t, di mana hipotesisnya dapat dituliskan sebagai berikut :
H0 : = k lawan H1 : k
81
ak ak
t hitung
Var (a ) sa
nilai statistik uji ini mengikuti sebaran t-student dengan derajat bebas n-2. Jika |t-hitung| >
t(/2, db=n-2) atau jika peluang nyata lebih kecil dari nilai taraf nyata yang ditetapkan maka
hipotesis nol ditolak.
dari selang kepercayaan ini dapat kita lihat kisaran nilai intersep yang dapat diyakini dengan
tingkat keyakinan sebesar (1 - )100%.
Untuk melihat apakah peubah X berpengaruh terhadap peubah Y juga dapat diuji
dengan menggunakan uji t-student. Misalkan ingin diuji apakah perubahan setiap X satu-satuan
akan mengakibatkan Y akan berubah sebesar k satuan, naka hipotesis dari pertanyaan ini dapat
dituliskan sebagai berikut :
H0 : = k
H1 : k
bk bk
t hitung
Var (b) sb
nilai statistik uji ini mengikuti sebaran t-student dengan derajat bebas n-2. Jika |t-hitung| >
t(/2, db=n-2) atau jika peluang nyata lebih kecil dari nilai taraf nyata yang ditetapkan maka
hipotesis nol ditolak.
82
Persamaan Yi = a + bXi dapat digunakan untuk menduga y dari beberapa nilai y pada
nilai x tertentu dan dapat pula digunakan untuk menduga nilai tunggal y 0 bila x = x0. Bila y0 = a
+ bx0 maka y0 akan menyebar normal dengan nilai tengah y0 sama dengan y pada x = x0 dan
1 (x x) 2 1 n
y2ˆ 0 0
2
, dengan s 2
x
( xi x ) 2
n ( n 1) s x n 1 i 1
Penduga bagi y2ˆ0 adalah s 2yˆ0 . Untuk memperoleh nilai dugaan ini 2 diduga dengan s2.
Adapun selang kepercayaan (1 - )100% bagi y untuk x = x0 adalah :
Untuk mendapatkan selang kepercayaan bagi sembarang nilai tunggal y0 dari peubah Y0, maka
kita perlu menduga ragam selisih antara nilai ŷ 0 yang diperoleh dari garis regresi bila
pengambilan contohnya dilakukan berulang-ulang pada x=x0 dengan y0 yang sesungguhnya.
Kita dapat memandang yˆ 0 y 0 sebagai nilai peubah acak Yˆ0 Y0 , yang sebaran penarikan
contohnya menyebar normal dengan nilai tengah dan ragam sebagai berikut :
1 (x x)2 2
E (Yˆ0 Y0 ) 0 dan
2
1 0 2
n (n 1) s x
yˆ 0 y 0 yˆ 0 y0
Penduga bagi y2ˆ 0 y0 adalah s 2yˆ 0 y0 . Agar nilai dugaan ragam ini diperoleh, maka 2 diduga
dengan ragam contoh (s2).
1. koefisien determinasi (R2) yaitu suatu ukuran yang digunakan untuk melihat
kemampuan model dalam menerangkan keragaman nilai peubah Y. Kisaran nilai R 2
mulai dari 0 sampai 100%. Semakin besar nilai R2 berarti model semakin mampu
menerangkan perilaku peubah Y. Sebagai contoh, ingin diketahui pola hubungan antara
biaya iklan yang dikeluarkan oleh suatu perusahaan dengan banyaknya produknya yang
83
terjual, diperoleh nilai R2 sebesar 80%, ini berarti bahwa model regresi yang kita
peroleh menunjukkan bahwa 80% keragaman dari produk yang terjual sudah dapat
diterangkan oleh faktor biaya iklan yang dikeluarkan, sedangkan 20% lainnya keragaman
dari produk yang terjual dipengaruhi oleh faktor lain. Adapun rumus untuk menghitung
R2 adalah
JKG b 2 s x2
R2 1 2
JKT sy
2. Kuadrat tengah galat (KTG). Semakin kecil nilai KTG maka model regresi yang diperoleh
akan lebih baik dalam menggambarkan pola hubunagn antara peubah bebas dan peubah
tak bebas. Namun penggunaan KTG sering kali menemui masalah yaitu seberapa besar
nilai KTG agar model dikategorikan sebagai model yang baik. Permasalahan ini timbul
karena mengingat KTG tidak memiliki batasan yang jelas. Tetapi jika terdapat
beberapa model yang dibangun, maka penggunaan KTG sebagai alat untuk memilih
model terbaik akan cukup efektif.
3. membuat plot antara nilai sisaan, ei, dengan xi atau dengan ŷi . Perilaku ei yang
dianggap layak akan terlihat apabila nilai-nilai tersebut membentuk suatu pita yang
mendatar di sekitar garis e = 0. Jika tebaran nilai-nilainya berbentuk corong dapat
memberi petunjuk adanya keheterogenan ragam dan jika tebaran nilainya melengkung
menunjukkan kekurangtepatan dari model regresinya. Berdasarkan plot sisaan kita
juga dapat mendeteksi kemungkinan adanya pencilan dengan memeriksa apakah ada
nilai/titik yang memencil atau jauh dari nilai-nilai sisaan yang lain.
10.6 Korelasi
Ukuran korelasi linear antara dua peubah yang paling banyak digunakan adalah
koefisien korelasi contoh (r). Koefisien korelasi ini menggambarkan tingkat keeratan hubungan
linear antara dua peubah atau lebih. Besaran dari r tidak menggambarkan hubungan sebab
akibat antar dua peubah atau lebih tetapi semata-mata menggambarkan keterkaitan linear
antar peubah. Nilai dari r berkisar antara –1 sampai 1 (-1 r 1). Nilai r yang mendekati 1 atau
–1 menunjukkan semakin erat hubungan linear antara kedua peubah tersebut. Sedangkan nilai r
yang mendekati atau sama dengan nol menggambarkan tidak ada hubungan linear antara kedua
peubah tersebut, tetapi mungkin saja mempunyai hubungan yang tidak linear.
J xy s xy sx
r b
J xx J yy 2 2
s s
x y
sy
84
dengan s xy J xy /(n 1), s x2 J xx /( n 1), s 2y J yy /(n 1)
Koefisien korelasi contoh, r, merupakan sebuah nilai yang dihitung dari n pengamatan
contoh. Contoh acak berukuran n yang lain tetapi diambil dari populasi yang sama biasanya
akan menghasilkan nilai r yang berbeda. Dengan demikian kita dapat memandang r sebagai
suatu nilai dugaan bagi koefisien korelasi linear populasi, . Bila r dekat dengan nol, kita
cenderung menyimpulkan = 0. Tetapi jika nilai r mendekati –1 atau 1 disarankan agar kita
menyimpulkan 0. Masalahnya sekarang adalah bagaimana mendapatkan suatu uji yang akan
mengatakan kepada kita kapan suatu nilai r berada cukup jauh dari suatu nilai tertentu 0,
agar kita mempunyai cukup alasan untuk menolak hipotesis nol bahwa = 0 dan menerima
alternatifnya. Hipotesis alternatifnya, H1, biasanya salah satu diantara < 0, > 0, atau
0.
1 1 r
ln
2 1 r
yang merupakan suatu nilai peubah acak yang menyebar menghapiri normal dengan nilai
tengah (0,5)ln[(1+)/(1-)] dan ragam 1/(n-3). Jadi statistik ujinya adalah menghitung
n 3 1 1 r 1 1 0 n 3 (1 r )(1 0 )
Z hitung ln ln ln
2 2 1 r 2 1 0 2 (1 r )(1 0 )
jika taraf nyata yang digunakan sebesar , maka keputusan akan menolak H0 jika:
1. sebagai arah hubungan antara dua ukuran yang berarti mereka cenderung untuk
meningkat atau menurun bersama-sama (berhubungan secara positif), yang satu
meningkat yang lain menurun (berhubungan secara negatif), atau pergerakan mereka
terpisah (tidak berkorelasi).
2. sebagai suatu kekuatan asosiasi yang berarti bahwa jika nilai absolut korelasi bergerak
menjauhi nol maka dua ukuran berasosiasi semakin kuat.
85
Contoh
Sebuah penelitian dilakukan oleh seorang pengusaha untuk menentukan hubungan antara biaya
pemasangan iklan per minggu dan hasil penjualan produknya (dalam jutaan rupiah). Data yang
diperoleh adalah sebagai berikut :
Biaya iklan 6 2 1 2 1 7 6 3 5 4 2 8 4 3 5
Penjualan 57 40 33 37 34 58 54 43 49 49 38 62 47 45 51
a. Tentukan persamaan garis regresinya
b. Benarkah pernyataan pengusaha mengatakan bahwa dengan peningkatan biaya/
iklan per juta akan meningkatkan penjualan sebesar 5 juta rupiah ?
c. Dugalah besarnya penjualan mingguan bila pengeluaran untuk biaya iklan
sebesar 4,5 juta !
d. Buatlah selang kepercayaan 95% bagi penjualan mingguan rata-rata jika biaya
iklannya sebesar 2,5 juta !
e. Buatlah selang kepercayaan 90% bagi nilai dugaan penjualan mingguan bila
biaya iklan yang dikeluarkan sebesar 3 juta.
f. Bagaimana kesesuaian model regresi yang anda peroleh ?
g. Hitunglah koefisien korelasinya.
Jawab:
Biaya Penjualan
No. x2 y2 xy
iklan (x) (y)
6 57
1 36 3249 342
2 40
2 4 1600 80
1 33
3 1 1089 33
2 37
4 4 1369 74
1 34
5 1 1156 34
7 58
6 49 3364 406
6 54
7 36 2916 324
3 43
8 9 1849 129
5 49
9 25 2401 245
4 49
10 16 2401 196
2 38
11 4 1444 76
8 62
12 64 3844 496
4 47
13 16 2209 188
3 45
14 9 2025 135
5 51
15 25 2601 255
59 697 299 33517 3013
86
a.
n n n
n xi y i x i y i
15(3013) 59(697) 4072
b i 1 i 1 i 1
4,06
n
n
2
15(299) (59) 2 1004
n xi2 xi
i 1 i 1
a y bx
y i
b
x i
697
4,06
59
30,50
n n 15 15
Interpretasi :
Jika tidak ada biaya yang dikeluarkan untuk iklan, maka rata-rata hasil penjualan
produk perminggu mencapai 30,5 juta rupiah.
Jika biaya untuk iklan mengalami kenaikan satu juta, maka hasil penjualan akan
mengalami perubahan sebesar 4,06 juta rupiah.
b. pengujian
Hipotesis :
H0 : = 5 vs H1 : ≠ 5
Nilai = 5%, t(0,025,13) = 2,160
b 0 b 5 2
t hitung dimana s
b
sb sb n
(x
i 1
i x)2
2 2
n n
J yy b 2 J xx n yi n xi
ˆ s
2 2
; dengan J yy y 2 i 1
dan J xx x 2 i 1
n2
i n i n
i 1 i 1
2 2
(697) (59)
J yy 33517 1129,73 J xx 299 66,93
15 15
1129,73 ( 4,06) 2 (66,93)
s2 2,04
13
2,04
Sehingga s b 0,18
66,93
Dengan demikian
4,06 5
t hitung 5,22
0,18
karena |thitung| > 2,160 maka tolak H0, artinya tidak benar pernyataan pengusaha yang
mengatakan bahwa dengan peningkatan biaya/ iklan per juta akan meningkatkan penjualan
sebesar 5 juta rupiah.
c.
Penjualan = 30.5 + 4.06 Biaya iklan
= 30.5 + 4.06(4.5)
= 48.77
87
d. alpha 5%
untuk x = 2.5, maka y = 30.5 + 4.06(2.5) = 40.65
yˆ 0 t / 2,( n 2) s 2yˆ 0 y yˆ 0 t / 2,( n 2) s 2yˆ 0
1 (x x)2 2 1 (2.5 3.93) 2
dengan s 2yˆ 0 0 s 2.04 0.20
n J xx 15 66.93
SK 5% :
40.65 -2.16(0.2) ≤ y ≤ 40.65 + 2.16(0.2)
40.22 ≤ y ≤ 41.08
e. alpha 10%
untuk x = 3, maka y = 30.5 + 4.06(3) = 42.68
yˆ 0 t / 2,( n 2) s y2ˆ 0 y0 y 0 yˆ 0 t / 2,( n 2) s 2yˆ 0 y0
1 (x x) 2 2 1 (3 3.93) 2
1 0 2.04 2.20
2
dengan s
J xx s 15
yˆ 0 y 0
1
n 66.93
SK 10% :
42.68 -1.771(0.2) ≤ y0 ≤ 42.68 + 1.771(0.2)
42.33 ≤ y ≤ 43.03
f. Kesesuaian model
uji apakah biaya iklan berpengaruh nyata
Keakuratan model :
JKG b 2 s x2 b 2 J xx (4,06) 2 (66,93)
R2 1 2 x100% 97,66%
JKT sy J yy 1129,73
g. Koefisien Korelasi
r R 2 0,977 0,99
88
10.7 Latihan Soal
Berikut ini disajikan data mengenai laju pertumbuhan sektor ekonomi dan sektor industri
(dalam %) dari tahun 1994 sampai dengan tahun 2003.
Tahun
1994 1995 1996 1997 1998 1999 2000 2001 2002 2003
Laju pertumbuhan
2 4 7 3 6 5 6 8 7 7
sektor ekonomi
Laju pertumbuhan
1 2 12 5 9 11 12 14 13 10
sektor industri
a. Menurut Anda, manakah yang tepat sebagai variabel X dan variabel Y ? Jelaskan alasannya !
b. Buatlah plot dari data di atas ! Bagaimana pola penyebarannya (linear atau tidak) ?
c. Dugalah persamaan regresi linear sederhana y = a + bx. Interpretasikan model dugaan yang
Anda peroleh.
d. Ujilah pada taraf nyata 5% apakah laju pertumbuhan sektor industri berpengaruh positif
terhadap laju pertumbuhan sektor ekonomi ?
e. Dugalah nilai koefisien korelasi antara kedua variabel tersebut !
f. Apakah antara kedua variabel tersebut mempunyai hubungan yang positif ? uji pada taraf
nyata 1%.
g. Hitunglah koefisien determinannya! Apakah model regresi yang Anda peroleh pada point
(c ) cukup akurat ? Jelaskan !
89
DAFTAR PUSTAKA
90