Bab ini akan menjelaskan cara menduga parameter (karakteristik populasi) berdasarkan
data sampel yang di peroleh, pendugaan sedemikian di sebut sebagai pendugaan secara
statistik (statistical estimation). Dari data sampel yang di peroleh dapat di hitung nilai-nilai
statistik (atau statistic; ingat apa yang di maksud dengan statistik atau statistic itu?), yang
merupakan penduga dari parameter (karakteristik populasi).
Berikut beberapa konsep yang perlu di ingat kembali sebelum masalah pendugaan
secara statistik (statistical estimation) di jelaskan.
Populasi
Populasi (population) adalah suatu kumpulan orang, benda atau objek-objek lainnya
yang merupakan fokus perhatian dari penelitian pada waktu tertentu.
Contoh 4.1:
Contoh Populasi:
Populasi target atau sasaran bisa saja tidak bisa di cakup semuanya, karena adanya
beberapa alasan, seperti adanya beberapa daerah yang sangat terpencil atau memang kondisi
lapangan pada waktu hendak di survei tidak memungkinkan untuk mencakup semua unit
pengamatan seperti alasan keamanan. Dengan demikian, ada cakupan yang dengan sengaja di
keluarkan dari populasi sasaran, misal:
- Mestinya populasi sasaran adalah seluruh usaha mikro di Provinsi Aceh, tetapi karena
alasan keamanan, ada beberapa kabupaten yang tidak dapat di cakup, misal Kabupaten
KLM, sehingga populasi sasaran di revisi menjadi populasi yang di survei yaitu seluruh
usaha mikro di Provinsi Aceh, tidak termasuk usaha mikro di Kabupaten KLM, atau
- Mestinya populasi sasaran adalah seluruh rumah tangga di kota Bandung, tetapi karena
tidak tersedia daftar seluruh rumah tangga di kota Bandung di bulan Januari 2014,
maka di pakailah daftar rumah tangga yang terdapat di BUKU TELEPON Januari 2014,
sehingga populasi yang di survei sebenarnya adalah seluruh (kalau di cakup semua)
atau sebagian rumah tangga (kalau diambil sebagian) di Bandung yang mempunyai
sambungan telepon. Populasi ini jelas berbeda dan lebih kecil cakupannya daripada
populasi sasaran, yaitu seluruh rumah tangga di kota Bandung, bahkan bisa saja
populasi yang di survei ini juga tidak mencakup seluruh rumah tangga di Bandung yang
mempunyai saluran telepon (karena mungkin ada di antara mereka, karena satu atau
lebih alasan, tidak terdaftar di BUKU TELEPON tersebut).
Sampel (sample) adalah bagian dari populasi yang di ambil sebagai contoh/ teladan
dari populasi bersangkutan.
Contoh 4.3:
Dengan demikian, dalam statistik, sebuah sampel bukan berarti satu unit pengamatan,
tetapi adalah sebuah sampel yang unit pengamatannya adalah n (n<N), yang pada umumnya
lebih besar dari 1 (satu).
Parameter
Parameter (parameter) adalah ciri atau karakteristik atau angka ringkasan dari
populasi. Kalau Variabel yang di amati adalah X, misalnya, dan ukuran populasi adalah N,
maka nikai dari variabel X tersebut adalah X 1 , X 2 , X 3 , dan seterusnya sampai X N , maka
parameter sebenarnya adalah merupakan fungsi dari (tergantung kepada) semua X tersebut,
dan secara matematik di tulis sebagai berikut:
Contoh Parameter:
- Rata –rata pendapatan perkapita penduduk Indonesia pada suatu tahun tertentu;
- Rata- rata Indeks Prestasi (IP) seluruh mahasiswa Fakultas Ekonomi Universitas A pada
semester ganjil tahun tertentu.
Simbol parameter simpangan baku untuk itu adalah σ (menyebutkannya: sigma); sedangkan
varians di simbolkan dengan σ² (menyebutkannya: sigma kuadrat).
Statistik (Statistik)
Statistik (statistic) adalah ciri atau karakteristik atau angka ringkasan dari sampel. Kalau
variabel yang di amati adalah X, misalnya dan ukuran sampel adalah n, maka nilai dari
variabel X tersebut adalah X 1 , X 2 , X 3 , dan seterusnya sampai X n. Maka statistik sebenarnya
adalah merupakan fungsi dari (tergantung kepada) semua X tersebut, dan secara matematik di
tulis sebagai berikut :
t = f ( X 1 , X 2 , X 3 , X 4,… … … … X n,)
Contoh statistik:
- Rata-rata pendapatan per kapita dari 10% penduduk Indonesia pada suatu tahun tertentu
yang di ambil sebagai sampel;
- Rata-rata IP sebagian mahasiswa Fakultas Ekonomi Universitas A yang di ambil sebagai
sampel pada semester ganjil tahun tertentu.
Simbol statistik untuk rata-rata sampel seperti itu adalah x̅ (menyebutkannya: X-bar).
Simbol Statistik simpangan baku untuk sampel adalah s; sedangkan varians sampel di
simbolkan dengan s² (menyebutkannya: s-kuadrat).
Catatan :
Perlu di ingat biasanya untuk notasi dari ciri (atau parameter) populasi biasa di pakai
huruf besar (capital letters) sebagai notasi, seperti N (ukuran populasi – population size),
sedangkan notasi untuk ciri (atau statistik ) sampel biasa di pakai huruf kecil (small letters)
seperti n (ukuran sampel – sample size).
Contoh 4.5:
Dalam konsep pendugaan secara statistik (statistical estimation) di kenal konsep yang di
sebut sebagai BLUE, yaitu Best Linear Unbiased Estimator.
B = Best; pendugaan menghasilkan penduga yang terbaik, yang di cirikan oleh penduga
dengan varians yang terkecil (sehingga penduga tersebut merupakan yang paling
efisien- efficient estimate);
L = Linear; pendugaan bersifat linier (linear estimation) yaitu merupakan fungsi linear
dari x
U = Unbiased; pendugaan mengasilkan penduga yang tak bias, yaitu yang secara rata-
rata akan menghasilkan nilai yang sama besar dengan parameter. Bias merupakan
selisih antara nilai harapan (expected value) yaitu nilai rata-rata dari penduga
(estimator) terhadap nilai parameternya (true Value) yaitu [ E(θ^ ) – θ];
E = Expected value (nilai harapan), secara sederhana dapat di artikan “secara rata-rata”.
√ Ʃ (x−µ)2
N
Contoh 4.6
Bila lima sampel baut hasil produksi suatu perusahaan mempunyai diameter sebagai berikut
(dalam mm) : 6,33; 6,37; 6,36; 6,32; 6,37. Dugalah rata-rata dan varians diameter dari proses
produksi tersebut !
Jawab :
Rata- rata (mean) diameter kelima baut tersebut adalah :
Ʃ x i (6,33+6,37 +6,36+6,37)
x́ = = = 6,35mm
n 5
dan
Varians (variance) diameter kelima baut tersebut adalah :
( 6,33−6,35 )2 + ( 6,37−6,35 )2 + ( 6,36−6,35 )2 + ( 6,32−6,35 )2 +(6,37−6,35) ²
s² = Ʃ ¿ ¿ = =
(5−1)
0,00055 mm²
Jadi, dugaan rata-rata diameter baut populasi adalah x́ = 6,35 mm; dan dugaan varians
diameter baut populasi adalah s² = 0,00055 mm².
Pendugaan Titik
Pendugaan titik (point estimation) atau estimasi tunggal adalah suatu cara menduga
karakteristik populasi berdasarkan karakteristik sampel yang di nyatakan dalam satu bilangan
dugaan (a single number as estimate)
Contoh 4.7 :
Rata-rata dan varians diameter baut yang di hasilkan di atas, yaitu x́ = 6,35 mm; dan s² =
0,00055 mm² merupakan contoh dari pendugaan titik (point estimation). Disebut sebagai
pendugaan titik karena rata-rata dan varians diameter baut populasi di duga oleh satu nilai
(satu titik) saja, yaitu masing-masing adalah x́ = 6,35 dan s² = 0,00055 mm².
Contoh 4.8 :
Contoh lain :
Dari suatu populasi sapi di suatu perusahaan peternakan di pilih secara acak 10 ekor sapi.
Kesepuluh ekor sapi tersebut kemudian di beri pakan yang baik secara teratur. Setelah
beberapa lama, berat ke sepuluh sapi tersebut adalah sebagai berikut (dalam kg): 45, 109, 61,
80, 79, 93, 48, 35, 57, 63. Berdasarkan sampel sepuluh sapi tersebut, duga rata-rata berat dan
deviasi standar seluruh sapi (populasi)?
Jawab :
Dari data tersebut di hasilkan rata-rata dan deviasi standar sampel (dengan n = 10) adalah x́ =
67, dan s² = 530,4 atau s = 23,0. Maka pendugaan dari µ adalah x́ = 67, dan pendugaan dari
σ² adalah s² = 530,4 atau penduga dari σ adalah s = 23,0.
Tabel 4.1 di bawah ini memberikan ringkasan parameter dan statistik atau penduga yang
relevan.
Tabel 4.1 Beberapa Parameter dan Statistik Atau Penduga yang Relevan untuk Satu Populasi
Catatan :
N : ukuran populasi, sedangkan n = ukuran sampel
µ di baca myu, sedangkan σ di baca sigma
Ʃ juga di baca sigma, tetapi artinya penjumlahan.
A = banyaknya unit dalam populasi yang mempunyai ‘ciri’ (attribute) tertentu, misal ‘ setuju’
sehingga P = A/N adalah proporsi unit dalam populasi yang mempunyai ciri tertentu
tersebut.
a = banyaknya unit dalam sampel yang mempunyai ‘ciri’ tertentu (attribute) tertentu, misal
‘setuju’, sehingga p = a/n, adalah proporsi unit dalam sampel yang mempunyai ciri
tertentu tersebut.
Ingat bahwa bila proporsi dikalikan dengan 100%, maka proporsi akan menjadi
persentase.
Untuk deviasi standar di ambil nilai yang positif dari +√ Varians. ingat bahwa secara
matematik bahwa √ dari suatu bilanganbisa negatif bisa positif . Misal √ 9 = ± 3 dan
√ 16 = ± 4.
s
dengan σ̂ x́ = , dengan demikian, berdasarkan sampel sepuluh sapi tersebut, maka
√n
perkiraan kesalahan baku (standard error) dari rata-rata sampel adalah
s 23 23
σ̂ x́ = = = = 7,28.
√ n √10 3,16
Latihan 4.1
Data berikut ini merupakan hasil dari sebuah sampel random yang terdiri dari 15 unit
pengamatan / rumah tangga, yaitu pendapatan rumah tangga seminggu (dalam ratus ribu
rupiah):
8; 6; 7; 6; 6; 8; 9; 6; 9; 10; 6; 7; 6; 6; 8
1. Hitunglah nilai rata-rata sampel, deviasi standar sampel dan perkiraan kesalahan baku
dari rata-rata sampel dengan menggunakan kolom-kolom berikut ini:
Pendugaan Silang
Berbeda dengan pendugaan titik (point estimation) sebagaimana di jelaskan di atas,
dugaan selang memberikan dugaan terhadap nilai parameter dalam suatu estimasi selang
(interval estimate) yang mempunyai batas bawah (lower bound) dan batas atas (upper
bound). Kelebihan utama dari pendugaan atau estimasi selang ini adalah terdapatnya suatu
keyakinan seberapa jauh estimasi selang ini akan mencakup nilai sesungguhnya (yang tidak
di ketahui dan merupakan suatu bilangan tetap).
Singkatnya, pendugaan atau estimasi selang (interval estimation) adalah suatu cara
menduga nilai parameter yang di nyatakan dalam suatu selang (interval) dengan suatu tingkat
keyakinan tertentu bahwa selang tersebut akan mencakup nilai parameter yang akan di duga.
Pendugaan selang di kenal juga dengan istilah Interval Keyakinan (Convidence Interval).
Latihan 4.2
1. Jawab pertanyaan ini: berapa perkiraan jarak anda ke rumah Universitas dimana anda
kuliah ?
Jawab:
2. Jika salah seorang dari anda menjawab pertanyaan tersebut, misalnya:
a. Dengan menyatakan bahwa jarak rumah anda ke Universitas di perkirakan adalah 4 km
b. Dengan menyatakan bahwa jarak rumah anda ke Universitas di perkirakan antara 2
sampai 6 km
c. Dengan menyatakan bahwa jarak rumah anda ke Universitas di perkirakan antara 3
sampai 5 km
i. Mana dari ketiga pernyataan tersebut di atas yang merupakan perkiraan titik dan
mana yang merupakan perkiraan interval?
ii. Menurut anda mana yang lebih bermanfaat perkiraan b atau c?
Jawab:
(i)................................................................................................................................................
...................................................................................................................................................
(ii)...............................................................................................................................................
....................................................................................................................................................
....................................................................................................................................................
Selang kepercayaan
Bagaimana selang kepercayaan di peroleh? Selang kepercayaan (confidence interval) atau
estimasi selang (interval estimate) adalah estimasi nilai parameter populasi dalam nilai
selang atau dalam interval tertentu. Dalam estimasi selang, nilai estimasinya terletak dalam
selang tertentu yang di batasi oleh batas bawah dan batas atas estimasi.
Bila pengambilan sampel di lakukan dengan probability sampling maka distribusi sampling
(sampling distribution) dari penduga dapat di ketahui yang mencakup parameter yang akan
di duga. Dengan demikian, maka dapat di buat suatu estimasi selang atau pendugaan
interval (interval estimation) yang di sertai dengan suatu pernyataan keyakinan bahwa
interval yang di hitung tersebut akan mencakup nilai parameter yang tidak di ketahui. Inilah
esensi kelebihan dari pengambilan sampel berdasarkan teori peluang di bandingkan
pengambilan sampel tanpa menggunakan teori peluang yang tidak memungkinkan
pembuatan estimasi selang dengan suatu pernyataan keyakinan.
(1 – α)
−Z α /2 0 Z α /2
Gambar 4.1
(i) 1-α diambil 90%, yaitu α = 10%, maka nilai Z α /2 = Z 0,05= 1,64 atau 1,65 (baca petunjuk
cara membaca tabel dan lihat tabel Normal Baku pada Lampiran 3).
(ii) 1-α diambil 95%, yaitu α = 5%, maka nilai Z α /2 = Z 0,025= 1,96 (baca petunjuk cara
membaca tabel dan lihat tabel Normal Baku pada Lampiran 3).
(iii) 1-α diambil 99%, yaitu α= 1%, maka nilai Z α /2 = Z 0,005 = 2,58 (baca petunjuk cara
membaca tabel Normal Baku pada Lampiran 3).
Dengan kata lain secara teori peluang dapat di tuliskan sebagai barikut :
P (- Z α /2 < Z < + Z α /2 ) = 1- α, dan melalui substitusi Z dengan Z = ( x́ - µ) / (σ/√n), akan
di peroleh
P [- Z α /2 < x́ - µ)/ (σ/√n < Z α /2 ] = 1-α, dan selanjutnya dengan cara transformasi, dapat
di peroleh
P (x́ - Z α /2 σ/√n < µ < x́ + Z α /2 . σ/√n) = 1-α
Sehingga dari persamaan ini dapat di simpulkan bahwa pendugaan interval atau
estimasi selang untuk µ dengan tingkat keyakinan (1-α) adalah sebagai berikut :
x́ - Z α /2 . σ/√n < µ < x́ + Z α /2 . σ/√n
Persamaan di atas bisa di baca sebagai berikut: (1-α) % dari seluruh kemungkinan
estimasi selang yang dapat di buat dari seluruh kemungkinan sampel akan mencakup
nilai parameter µ (lihat gambar 4.2). Estimasi selang yang di gunakan adalah salah
satu dari seluruh kemungkinan estimasi selang tersebut. Dengan demikian, kita
mempunyai keyakinan (1-α) % bahwa estimasi selang yang kita punyai tersebut adalah
yang mencukup nilai µ.
Akan tetapi, sesungguhnya apakah estimasi selang yang kita punyai mencakup nilai µ
tidaklah kita ketahui. Perlu diingat bahwa µ adalah bilangan tetap (constant), bukan
variabel acak (random variabel), sehingga peluang bahwa µ berada di dalam selang
interval yang kita punyai adalah 0 atau 1. Akan tetapi, kita mempunyai keyakinan
sebesar (1-α) % bahwa estimasi selang yang di punyai akan mencakup nilai µ, karena
dari seluruh kemungkinan estimasi selang terdapat 1-α% yang mencakup nilai
sesungguhnya itu.
Analog dengan ini adalah contoh berikut: Misalkan dalam satu kotak terdapat 100 bola,
95 bola berwarna merah dan 5 bola berwarna putih. Satu bola kita ambil secara random,
sebelum kita melihat warna bola tersebut, maka probabilita bahwa bola yang terambil
adalah bola merah adalah 0,95 atau 95%.
Misalkan di gunakan tingkat keyakinan (confidence coefficient) 95%, maka nilai Z α /2 =
Z 0,05/ 2= Z 0,025adalah sebesar 1,96 (lihat tabel Normal Baku dengan luas antara - ~
sampai Z 0,025 adalah 97,5%) sehingga estimasi selang untuk µ dengan tingkat keyakinan
95% adalah:
x́ – 1,96. σ/√n < µ < x́ + 1,96. σ/√n
Karena x́ (dari data sampel) dan σ dalam hal ini diasumsikan di ketahui (bila tidak di
ketahui bisa di duga dari data sampel), sedemikian juga n, maka estimasi selang ini bisa
di hitung. Prosedur inilah yang secara teori di gunakan untuk menurunkan semua rumus
pendugaan interval atau estimasi selang dengan suatu tingkat keyakinan tertentu.
Catatan:
Besarnya σ x́ tergantung kepada apakah pengambilan sampel di anggab (i) dari
sampel random, dari populasi yang tidak terbatas (infinite) atau (ii) dari simple
random sampling with replacement dari populasi terbatas (finite) atau (iii) dari
simple random sampling with replacement dari populasi terbatas (finite). Lihat
pembahasan distribusi sampel untuk rata-rata pada bab 3).
Rumus dari σ x́ tergantung apakah nilai σ di ketahui atau tidak. Bila σ tidak berarti
di gunakan s sebagai penduga dari σ, jadi yang di gunakan bukan σ x́ tetapi penduga
dari yaitu σ^ x́ .
Zα
Besar 2
tergantung kepada besarnya tingkat kepercayaan yang di kehendaki,
yaitu (1-α)%, umumnya 90%, atau 95% atau 99%. Nilai ini di ambil dari kurva
Normal Baku (Standard Normal Distribution).
Estimasi selang di sebut juga Selang Keyakinan (Confidence Interval).
1.
2.
Adalah µx́ = µ 3.
Adalah X́ 4.
5.
6.
Gambar 4.2 Enam Contoh Selang Keyakinan dari Seluruh Kemungkinan Selang Keyakinan
Latihan 4.3
Gambar 4.2 di atas memberikan 6 (enam) selang keyakinan dari yang mungkin di buat dari
seluruh kemungkinan sampel untuk memperkirakan nilai µ yang tidak di ketahui. Jelaskan
arti gambar 4.2 di atas :
Jawab :........................................................................................................................................
......................................................................................................................................................
......................................................................................................................................................
.............
Catatan :
jika tingkat keyakinan (level of confidence) (1-α)% dalam selang interval dengan
menggunakan kurva normal di tentukan maka nilai Z a/ 2 dapat di peroleh,sebagai contoh
berikut:
Contoh 4.9
Latihan 4.4
Uraikan secara rinci bagaimana hasil pada contoh 4.10 di peroleh dan apa arti selang
kepercayaan ini?
Jawab :..........................................................................................................................
........................................................................................................................................
...
Contoh 4.11
Suatu perusahaan menghasilkan bola lampu listrik. Dari sampel 15 bola lampu di
ketahui bahwa rata-rata masa hidup bola lampu adalah 8900 jam dengan deviasi standar
500 jam. Dugalah rata-rata masa hidup bola lampu keseluruhan (populasi) dengan level
of confidence 90%. (Petunjuk : pada kasus ini, populasi di anggap tidak terbatas atau
infinite karena produksi bola lampu merupakan suatu proses yang berkelanjutan sehingga
banyaknya bola lampu yang di hasilkan dapat mencapai tidak terhingga atau infinite).
Jawab :
Dari soal tersebut di peroleh informasi bahwa x́ = σ/√n.= 8900 jam dan s = 500 jam.
Karena σ tidak di ketahui dan di perkirakan dengan s, maka dugaan selang rata-rata
(mean) masa hidup bola lampu populasi adalah :
x́- (t df ) σ x́ < µx < x́ + (t df ) σ x́
s
σ x́ akan di duga dengan σ^ x́ = s x́ = 500/ √15 = 129,199; sehingga
√n
Dugaan selang rata-rata masa hidup bola lampu populasi menjadi :
x́ - (t df ) s x́ < µx < x́ + (t df ) s x́
Dimana, df = n-1 = 15=1 = 14, dan (1-α)% = 95%, maka t df adalah
α
t df ; = t 14 ;0,025 = 1,761 (bagaimana nilai 1,761 di peroleh dari tabel t, lihat lampiran
2
2 dan 4).
Sehingga :
(8900)- (1,761)(129,199) < µx < (8900)+ (1,761)(129,199) 8672 < µx < 9128
Artinya : kita yakin 90% bahwa selang interval 8672 sampai dengan 9128 jam akan
mencakup nilai rata-rata masa hidup bola lampu yang di hasilkan
Kasus 4: persis sama dengan kasus 3, hanya sampel berukuran cukup besar,
biasanya di atas atau sama dengan 30, (n≥30, bahkan ada yang menganjurkan
mestinya n≥50)
Asumsi:
Sampel adalah samprl random dengan ukuran n
Populasi berdistribusi Normal, dengan rata-rata µ yang tidak di ketahui, dan σ tidak di
ketahui juga
Populasi tidak terbatas
Dalam kasus ini sebenarnya pendugaan interval harus tetap menggunakan selang
keyakinan dengan menggunakan distribusi student’s t, tetapi karena ukuran sampel
adalah cukup besar maka boleh (tidak harus) menggunakan pendekatan dengan
menggunakan distribusi Normal (sebagai bukti praktis, coba lihat nilai di tabel t akan
sama dengan nilai di tabel Normal baku bila n≥30), dengan tingkat keysakinan ,(1-α)%
yang sama)
Dapat di buktikan bahwa distribusi sampel dari rata-rata mengikuti sebaran Student’s t,
tetapi bila n mendekati tak terhingga, dapat di buktikan juga secara matematik statistik
bahwa distribusi sampel tersebut akan mendekati distribusi Normal.
Contoh 4.12:
Jika di ketahui bahwa rata-rata berat badan 100 mahasiswa sampel adalah 67,45 kg (x́ =
67,45 kg) dengan deviasi standar (s) = 2,93, dugalah rata-rata berat badan seluruh
mahasiswa (populasi) bila di tetapkan bahwa (1-α)% =95%
Jawab :
Karena n≥30, maka dalam kasus ini, pendekatan dugaan selang (interval estimate)
untuk rata-rata (mean) populasi dari data sampel adalah:
x́ – ( Z α /2 )σ x́ < µx < x́ + ( Z α /2 )σ x́
Besarnya x́ = 67,45 kg di ketahui dari data sampel; dan karena σ tidak di ketahui,
maka σ dapat di duga oleh σ^ x́ sebagai berikut:
s 2,93
σ^ x́ = = = 0,293
√ n √ 100
Masukan nilai x́ = 67,45 dan σ^ x́ = 0,293 ke dalam rumus di atas dan bila tetapkan
tingkat keyakinan (1-α)% =5% (yaitu, nilai Z α /2 = 1,96), maka selang keyakinan
menjadi:
(67,45)-(1,96)(0,293) < µx <(67,45)+(1,96)(0,293)(67,45-0,57)< µx <(67,45+0,57) 66,88
< µx <68,02
Artinya: dengan tingkat keyakinan 95% maka perkiraan selang 66,88 kg sampai
dengan 68,02 kg akan mencakup rata-rata berat badan (populasi) mahasiswa
tersebut.
Contoh 4.13 (contoh yang serupa dengan contoh 4 tetapi dengan (1-α)% = 99%):
Dengan soal yang sama dengan contoh 4, dugalah rata-rata berat badan seluruh
mahasiswa (populasi) bila di tetapkan bahwa (1-α)% =99%.
Jawab:
Hasil yang di peroleh: dugaan selang (interval estimate) untuk rata-rata berat badan
seluruh mahasiswa (populasi) adalah :
66,69 < µx < 68,21
Latihan 4.5
Uraikan secara rinci bagaimana hasil contoh 4.13 di peroleh dan apa arti perkiraan
selang ini?....................................................................................................................
......................................................................................................................................
Catatan:
Kasus 1 sampai dengan 4 di atas berasumsi bahwa sampel adalah sampel random
yang bisa di peroleh bila²:
a) Di lakukan pengambilan sampel dari populasi terbatas secara simple random
sampling, tetapi dengan pengembalian (with replacement), dalam hal ini populasi
menjadi tak terbatas (infinite) atau
b) Dilakukan n percobaan yang mengahasilkan n pengamatan dimana masing-masing
percobaan saling bebas satu dengan yang lain, dalam hal ini populasi menjadi tak
terbatas (infinite)
Contoh 4.14 :
Rata-rata nilai ujian statistik dari 50 mahasiswa (n) dari 200 mahasiswa (N) adalah
75 dengan deviasi standar 10. Dugalah rata-rata nilai ujian statistik seluruh
mahasiswa (populasi) bila di tetapkan bahwa (1-α)% = 95%.
Jawab :
Hasil yang di peroleh:dugaan selang (interval estimate) untuk rata-rata nilai ujian
Statistik seluruh mahasiswa (populasi) adalah:
72,6< µx <77,4
Latihan 4.6
Uraikan bagaimana hasil di atas di peroleh dan apa arti perkiraan interval ini?
........................................................................................................................................
........................................................................................................................................
........................................................................................................................................
dapat di tentukan.
Contoh dengan:
(1-α)% = 99%, maka nilai Z α /2 = Z 0,005 = 2,58
(1-α)% = 95%, maka nilai Z α /2 = Z 0,025 = 1,96
(1-α)% = 90%, maka nilai Z α /2 = Z 0,050 = 1,645
[Untuk tingkat keyakinan yang lain, lihat tabel distribusi Normal Baku di Lampiran
3].
Contoh 4.15: Asumsi populasi tidak terhingga, sampel random, ukuran sampel
besar
Untuk menguji keberhasilan produk yang di hasilkan oleh suatu perusahaan, sampel
sebanyak 230 unit produk perusahaan tersebut di teliti. Ternyata terdapat 54 unit
produk yang rusak. Dugalah proporsi produk secara keseluruhan (populasi) yang di
anggap baik (tidak rusak) dengan tingkat kepercayaan 90% (petunjuk: pada kasus ini
populasi dianggap sebagai tidak terbatas atau infinite karena mengenai produksi
suatu perusahaan).
Jawab:
Dugaan selang (interval estimate) untuk proporsi populasi (p) dari data sampel
adalah :
p- ( Z α /2 )σ p <P<p+( Z α /2 )σ p
Karena σ tidak di ketahui, maka akan di duga oleh σ^ , sehingga dugaan selang
untuk proporsi populasi dari data sampel menjadi:
p-¿ ¿)σ^ p <P<p+¿ ¿)σ^ p)
(230−54)
Besarnya proporsi produk yang tidak rusak atau p = = 0,765 dan q=
230
(1-p) =0,235 di ketahui dari data sampel; sedangkan σ^ p dapat di hitung sebagai
berikut:
pq
σ^ p =
√ n
(karena populasi tidak terbatas atau infinite)
( 0,765 ) (0,235)
=
√ 230
= 0,0279
Masukkan nilai P = 0,765 dan σ^ p=0,0279 ke dalam rumus di atas, dan bila di
tetapkan (1-α)%, misal 90%, (maka, nilai Z α /2 = 1,645), sehingga perkiraan
interval menjadi :
(0,765)-(1,645)(0,0279)<p<(0,7652)+ (1,645)(0,0279)
Sehingga :
0,7193<p<0,8111
Artinya: dengan tingkat keyakinan 90%, perkiraan selang antara 72% sampai
dengan 81% akan mencakup proporsi (populasi) produk yang baik yang di hasilkan
oleh perusahaan tersebut.
Dalam kasus ini maka perkiraan interval seperti dalam contoh 4.15 masih dapat di
lakukan, tetapi σ^ p harus menggunakan finite sampling correction correction (1-f)
seperti kasus 5 dalam pendugaan atau perkiraan interval untuk satu rata-rata
populasi.
Latihan 4.7
Lakukan kembali perkiraan di atas, tetapi gunakan finite sampling correction
dalam menghitung σ^ p serta dengan 99% confidence coefficient. Apa arti perkiraan
interval ini?
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
Dugaan selang untuk perbedaan dua rata-rata populasi berdasarkan data sampel dengan
tingkat keyakinan, (1-α)% adalah:
Catatan:
α/2
1-α/2
0 Z α /2 atau Z1−α /2
Gambar 5.1 perbedaan notasi yang bisa terjadi dalam penyajian Kurva Normal baku
Z α /2 bisa berarti Z dengan luas antar Z tersebut dan + ~ adalah α/2, sedangkan Z1−α /2
adalah Z dengan luas antara - ~ dan Z tersebut adalah (1-α/2). Dengan kata lain, titik atau
nilai Z yang sama bisa diberi notasi yang berbeda sesui dengan cara penulisan dan penyajian
Kurva Normal Baku yang digunakan.
Catatan:
Kasus 1:
Jika σ 1 ≠ σ 2dan diketahui nilainya, serta populasi tidak terbatas (atau pengambilan samapel
dengan pengembalikan), maka kesalahan baku dari ( x́ 1−x́ 2) adalah:
σ ²1 σ ²2
σ x́ −x́ = √ σ ² x́ + σ ² x́ =
1 2 1 2
√ n1
+
n2
Type equation here .
Kasus 2:
Seperti Kasus 1 tetapi σ 1 ≠ σ 2dan tidak diketahui nilainya, maka kesehatan baku dari (
x́ 1−x́ 2) diperkirakan sebagai:
s ² 1 s ²2
σ^ ¿¿¿ ^ ² x́ + σ^ ² x́ =
´ ¿ = √σ 1 2
√ n1
+
n2
Kasus 3:
Jika σ 1 = σ 2 = σ dan diketahui nilainya, dan populasi tidak terbatas (atau pengambilan
sampel dengan pengembalian), maka kesalahan baku dari ( x́ 1−x́ 2) adalah:
1 1
σ (x́ −x́ ) = √ σ ² x́ + σ ² x́ = σ
1 2 1 2
√ n1
+
n 2
Kasus 4:
Seperti Kasus 3, yaitu σ 1 = σ 2 = σ, tetapi tidak diketahui nilainya, maka σ dapat diduga
dengan standar deviasi gabungan ( S g ¿ ¿:
1 1
S x́ − x́ = S g .
1 2
√ +
n 1 n2
Perkiraan untuk kesalahan baku dari ( x́ 1−x́ 2) dalam kasus populasi yang terbatas dan
pengambilan sampel tanpa pengambilan adalah sama dengan 4 kasus di atas, tetapi jangan
N −n
lupa melakukan koreksi dengan faktor koreksi sebesar
√ N −1
dalam rumus-rumus
N −n
tersebut. Biasanya untuk memudahkan maka faktor koreksi ini didekati dengan
√ N
yang akan sama dengan √ 1−f di mana f = n/N, yang biasa disebut sampling fraction. Jadi
koreksi untuk rumus-rumus untuk perkiraan untuk kesalahan baku dari ( x́ 1−x́ 2) dalam 4
(empat) kasus di atas adalah dengan mengalikan dengan √ 1−f dan sebenarnya jika n
relatif sangat kecil dibandingkan dengan N, misal kurang dari 5% [ (n/N) < 5%], maka
√ 1−f akan mendekati 1, sehingga tanpa menggunakan faktor koreksipun tidak apa-apa.
Dengan kata lain, faktor koreksi ini akan tidak diperlukan bila n adalah relatif sangat
kecil dibandingkan dengan N, walaupun metode pengambilan sampel yang digunakan adalah
simple random sampling tanpa pengembalian dari populasi terbatas.
Contoh 5.1:
Asumsi:
- Dua populasi yang masing-masing berdistribusi Normal.
- Deviasi standar populasi tidak diketahui dan dianggap berbeda.
- Populasi tidak terbatas, atau pengambilan sampel dengan pengembalian.
Ini adalah contoh kasus 3 di atas.
Jawab:
Dugaan selang untuk perbedaan dua rata-rata populasi adalah:
( x́ 1−¿ x́ ¿) – ( Z α /2 )σ ¿¿< ( µ1−¿µ ¿) < ( x́ 1−¿ x́ ¿) + ¿ ¿)σ ¿¿
2 2 2
Karena σ ¿¿ tidak diketahui, maka akan diduga oleh σ^ ¿ ¿sehingga dugaan selang untuk
perbedaan dua rata-rata dari data sampel menjadi:
( x́ 1−¿ x́ ¿) – ( Z α /2 )σ^ ¿¿< ( µ1−¿µ ¿) < ( x́ 1−¿ x́ ¿) + ¿ ¿)σ^ ¿¿
2 2 2
Karena standar deviasi belanja populasi tidak diketahui, dan diasumsikan bahwa standar
deviasi populasi kedua kelompok dianggap sama, dan populasi yang tidak terbatas, maka
σ^ ¿¿ adalah:
s ² 1 s ²2 (6,6) ² (8,4) ²
σ^ ¿¿ = √ σ^ ² x́ + σ^ ² x́ =
1 2
√ n1
+
n2
=
100 √ +
200
= 0,8879
Besarnya rata-rata belanja kelompok 1 diketahui sebesar Rp 24,57 ribu, dan kelompok 2
sebesar Rp 19,60 ribu, dan dengan tingkat kepercayaan 95% maka nilai Z α /2 yaitu Z 0,025
adalah 1,96 (dari Tabel Normal Baku). Masukkan data tersebut ke dalam rumus
pendugaan interval di atas dan diperoleh:
(24,57-19,60) –(1,96) (0,8879) < ( µ1- µ2) < (24,57-19,60) + (1,96) (0,8879)
Sehingga:
(4,97-1,74) < ( µ1- µ2) < (4,97+1,74) 3,23 <( µ1- µ2) < 6,71
Artinya: dengan tingkat kepercayaan 95%. Perbedaan rata-rata belanja populasi kedua
kelompok tersebut akan dicakup oleh interval Rp 3,23 ribu sampai dengan Rp 6,71 ribu.
Latihan 5.1
Dari dua (tingkat l dan tingkat ll) di sebuah perguruan tinggi yang amat besar jumlah
mahasiswanya, masing-masing dipilih 100 dan 144 mahasiswa. Rata-rata berat mahasiswa di
tingkat l adalah 69 kg dengan simpangan baku 9 kg, dan di tingkat ll, rata-rata berat
mahasiswa 64 kg dengan simpangan baku 6 kg. Buatlah selang kepercayaan 95% bagi beda
dua rata-rata populasi tingkat l dan tingkat ll ( yaitu , µ1 - µ2). (Diambil dan direvisi dari Asra
and Rudi ansyah,2013).
Jawab: ........................................................................................................................................
......................................................................................................................................................
......................................................................................................................................................
......................................................................................................................................................
......................................................................................................................................................
......................................................................................................................................................
..............
Latihan 5.2
Sebuah perusahaan baterai sedang menguji lamanya dua jenis baterai, jenis A dan jenis B
Untuk keperluan tersebut diambil sebuah sampel (dengan ukuran sampel tertentu) dari setiap
dua jenis baterai tersebut dan dihitung rata-rata dan variasi lamanya hidup yang diperoleh
dari data dalam sampel. Hasilnya adalah sebagai berikut.
Jawab:
......................................................................................................................................................
......................................................................................................................................................
......................................................................................................................................................
......................................................................................................................................................
.....................................................................................................................................................
Dugaan Selang untuk Perbedaan Dua Proporsi
Karena distribusi dari variabel X yang bisa mengambil nilai 0 atau 1 adalah distribusi
Binomial, maka pendugaan selang di sini yang menggunakan sebaran Normal Baku adalah
berdasarkan asumsi bahwa ukuran sampel yang digunakan adalah cukup besar, dan biasanya
standar yang digunakan adalah kalau n ≥ 30 (bahkan ada yang menyarankan jika n ≥ 50).
Dengan asumsi ini dan sampel adalah sampel yang random (berdasarkan pengambilan
sampel dengan metode simple random sampling), maka dugaan selang untuk perbedaan dua
proporsi populasi adalah:
( p1- p2) – ( Z α /2 )σ ( p − p ) < ( P1- P2) < ( p1- p2) + ( Z α /2 )σ ( p − p )
1 2 1 2
standar dari X (adalah populasi 2), yaitu σ 2 = √ (P¿¿ 2)x ( 1−P2 ) ¿, tidak diketahui dan
diasumsikan tidak sama besar, atau dengan kata lain σ 1 ≠ σ 2serta populasi tidak terbatas
(atau terbatas tetapi pengambilan sampel dengan pengambilan), maka dugaan dari
kesehatan baku dari ( p1- p2) , yang merupakan penduga untuk P1- P2, adalah:
( p1 q1) ( p2 q2 )
σ^ ( p − p )= S p − p =
1 2 1 2
√ n1
+
n2
di mana:
p1+ q 1 = 1 dan p2+ q 2 = 2 dengan p1adalah proporsi pada sampel kelompok 1 dan p2
adalah proporsi pada sampel kelompok 2, dan n1dan n2 adalah besar sampel pada masing-
masing kelompok.
Dengan demikian, pendugaan interval untuk ( P1- P2) dengan tingkat keyakinan (1-α)%
adalah:
( p1- p2) – ( Z α /2 )σ^ ( p − p ) < ( P1- P2) < ( p1- p2) + ( Z α /2 )σ^ ( p − p )
1 2 1 2
Kasus 2:
Seperti Kasus 1, tetapi devisi standar dari X (adalah populasi 1), yaitu √ ¿ ¿)x(1- P1 ¿,
diasumsikan sama besar dengan deviasi standar dari X (adalah populasi 2), yaitu √ ¿ ¿)x(1-
P2 ¿, dengan kata lainσ 1 =σ 2 = √ ¿ ¿)x(1-P ¿ = √ PQ di mana P+Q = 1, maka kesalahan
baku dari ( p1- p2) yaitu merupakan penduga untuk P1- P2 diduga dengan:
σ^ ( p − p )= S p − p = pq ( 1 ¿ +1 )¿
1 2 1 2
√n1 n2
di mana:
p diduga dengan ( n1 . p 1+ n2 . p2 ¿ / (n1 +n 2 ¿, dengan p1 adalah proporsi pada kelompok 1
dan p2adalah proporsi pada kelompok 2, dan q = 1-p.
Dengan demikian, pendugaan interval untuk ( P1- P2) dengan tingkat keyakinan (1-α)%
adalah:
( p1- p2) – ( Z α /2 )σ^ ( p − p ) < ( P1- P2) < ( p1- p2) + ( Z α /2 )σ^ ( p − p )
1 2 1 2
Berbeda dengan untuk pendugaan beda dua rata-rata populasi, untuk pendugaan beda dua
proporsi biasanya hanya dua kasus, karena deviasi standar untuk variabel Binomial (hanya
bisa mengambil nilai 0 atau 1) juga tergantung kepada nilai proporsi (p) yang justru mau
dibuat pendugaan intervalnya. Akan tetapi, dalam pendugaan interval beda dua rata-rata
populasi, deviasi standar variabel X (yang bukan variabel berdistribusi Binomial) pada
populasi dapat diasumsikan saja diketahui (karena tidak tergntung kepada µ yang akan
diperkirakan).
Perkiraan untuk kesalahan baku dari ( p1- p2) dalam kasus populasi yang terbatas dan
pengambilan sampel tanpa pengembalian adalah sama dengan 2 kasus di atas, tetapi
N −n
jangan lupa melakukan koreksi dengan faktor koreksi sebesar
√ N −1
dalam rumus-rumus
N −n
tersebut. Biasanya untuk memudahkan maka faktor koreksi ini didekati dengan
√ N
yang akan sama dengan √ 1−f di mana f = n/N, yang biasa disebut sampling fraction. Jadi
koreksi untuk rumus-rumus untuk perkiraan untuk kesalahan baku dari ( p1- p2) dalam 2
(dua) kasus di atas adalah dengan mengalikan dengan √ 1−f dan sebenarnya jika n relatif
sangat kecil dibandingkan dengan N, misal kurang dari 5% [(n/N) < 5%)], maka √ 1−f
akan mendekati 1. Dengan kata lain, faktor koreksi ini akan tidak diperlukan bila n adalah
relatif sangat kecil dibandingkan dengan N, walaupun metode pengambilan sampel yang
digunakan adalah simple random sampling tanpa pengembalian dari populasi terbatas.
Contoh 5.2
Asumsi:
- Deviasi standar populasi tidak diketahui,dan
- Populasi tidak terbatas (atau terbatas tetapi pengambilan sampel dengan metode somple
random sampling dengan pengembalian), dan
- Sampel berukuran besar, misal n ≥30.
Ini adalah kasus 1
Manajer suatu kantor akuntan ingin mengetahui kepatuhan perusahaan-perusahaan wajib
pajak dalam membayar pajak di kota A dan B. Untuk maksud tersebut, dari kota A dan B
masing-masing diambil 100 perusahaan sampel dan hasilnya adalah sebagai berikut. Di kota
A terdapat 70 perusahaan yang patuh bayar pajak; di kota B terdapat 50 perusahaan yang
patuh bayar pajak. Buatlah dugaan perbedaan proporsi perusahaan yang patuh bayar pajak di
kedua kota dengan tingkat kepercayaan 95%.
Jawab:
Estimasi kesalahan standar perbedaan dua proporsi adalah:
( p1 q1) ( p2 q2 )
1 2
√
σ^ ( p − p )=
n1
+
n2
Karena:
p1= 70/100=0,7; dan q 1= 1- p1 = 1- 0,7 = 0,3; dan n1 = 100;
P2 = 50/100=0,5; dan q2 = 1-p2 = 1-0,5 = 0,5; dan n2 = 100, maka
( 0,70 ) (0,30)
¿¿¿ = = 0,0021
100
( 0,50 ) (0,50)
¿¿¿ = = 0,0025, sehingga
100
σ^ ( p − p )= √ 0,0021+0,0025 = √ 0,0678
1 2
Dugaan selang untuk perbedaan dua proporsi dengan tingkat kepercayaan (1-α)%, adalah:
( p1- p2) – ( Z α /2 )σ^ ( p − p ) < ( P1- P2) < ( p1- p2) + ( Z α /2 )σ^ ( p − p )
1 2 1 2
Sehingga:
(0,7-0,5) – (1,96) (0,0678) < ( P1- P2) < (0,7 – 0,5) + (1,96)(0,0678)
(0,2) – (0,1329) < ( P1- P2) < (0,2) + (0,1329)
0,0671 < ( P1- P2) < 0,3329
Artinya: kita percaya 95% bahwa pendugaan interval antara 6,7% sampai dengan 33,3%
akan mencakup nilai perbedaan proporsi perusahaan yang patuh bayar pajak di kedua
kota tersebut.
Latihan 5.3
Sedang dipertimbangkan untuk membuat aturan bawah memakai ‘seat belt’ adalah suatu
keharusan di provinsi A. Yang perlu diketahui adalah bahwa apakah persentase yang
menggunakan ‘seat belt’ sesudah adanya peraturan tersebut lebih besar dari sebelumnya
adanya peraturan. Katakan provinsi A sudah menerapkan peraturan tersebut dan ingin dilihat
apakah perbedaan persentase yang menggunakan seat belt di antara 2 (dua) periode (sebelum
dan sesudah) adalah cukup besar untuk menyatakan bawah peraturan tersebut pantas untuk
diperhitungkan. Data yang ada berdasarkan dua sampel terpisah di provinsi di A memberikan
informasi sebagai berikut:
Sebelum : n1= 124, dan a 1 = yang menggunakan seat belt 62 orang, sedangkan
Sebelum : n2 = 105, dan a 2 = yang menggunakan seat belt adalah 80 orang.
Buatlah dugaan interval dari beda persentase yang menggunakan seat belt di provinsi A
sesudah dan sebelum adanya peraturan dengan tingkat kepercayaan 99%. Berikan pendapat
saudara berdasarkan hasil tersebut. (Diilhami oleh Meier dan Brudney,2012).
Jawab:
......................................................................................................................................................
......................................................................................................................................................
......................................................................................................................................................
......................................................................................................................................................
......................................................................................................................................................
.....................................................................................................................................................