Bab 2 Estimasi Nilai Parameter PDF
Bab 2 Estimasi Nilai Parameter PDF
A. Deskripsi
Pada bab ini akan dibahas suatu metode untuk mengestimasi
parameter suatu populasi dengan menggunakan data sampel.
Parameter-parameter tersebut adalah proporsi, mean, variansi, dan
simpangan baku. Untuk melakukan estimasi tersebut, prosedur
standar yang digunakan adalah dengan mengkonstruksi selang
kepercayaan yang akan dijelaskan dalam bab ini. Selain itu, bab ini
juga akan membahas bagaimana menentukan ukuran sampel yang
diperlukan untuk memperkirakan parameter-parameter populasi
tersebut.
B. Relevansi
Salah satu tujuan statistika inferensial adalah untuk mengestimasi nilai
parameter suatu populasi dengan menggunakan data sampel. Untuk
itu, bab ini akan menjelaskan metode untuk melakukan estimasi
tersebut. Meskipun metode yang akan dibahas dalam bab ini mungkin
tergolong baru bagi Anda, tetapi Anda sudah familier dengan jajak
pendapat atau hitung cepat pemilu yang marak di media massa.
Metode-metode yang akan dijelaskan dalam bab ini sama dengan yang
digunakan oleh lembaga-lembaga survei pelaksana jajak pendapat dan
hitung cepat pemilu tersebut.
C. Capaian Pembelajaran
· Membuat selang kepercayaan untuk mengestimasi proporsi,
mean, variansi, dan simpangan baku suatu populasi, serta
menginterpretasikan selang kepercayaan tersebut.
· Mengidentifikasi persyaratan yang diperlukan untuk membuat
selang kepercayaan, dan memeriksa apakah persyaratan tersebut
terpenuhi.
29
121.980
p= = 0,107 = 10,7%
1.140.000
Dengan demikian, kita memperkirakan bahwa 10,7% penduduk
Indonesia masuk dalam katagori miskin.
Kerjakan Latihan 2 n
Tingkat kepercayaan
lebih tinggi
( ( ) )
Tingkat kepercayaan
lebih rendah
Benar: “Kita 95% yakin bahwa selang di antara 0,655 dan 0,845
benar-benar memuat nilai sebenarnya dari proporsi
populasi.” Hal ini berarti bahwa jika kita memilih banyak
sampel-sampel berukuran 80 yang berbeda dan membuat
selang kepercayaannya, 95% dari selang-selang tersebut akan
benar-benar memuat proporsi populasi. Nilai 95% di sini
merupakan persentase keberhasilan dari proses yang
digunakan untuk memperkirakan proporsi populasi.
Salah: “Terdapat kemungkinan 95% bahwa nilai sebenarnya p
berada di antara 0,655 dan 0,845.” Kita juga tidak benar jika
mengatakan “Dalam 95% sampel, proporsinya terletak di
antara 0,655 dan 0,845.”
Untuk lebih memahami interpretasi yang benar dan salah terhadap
selang kepercayaan di atas, perhatikan ilustrasi berikut. Misalkan
dosen Anda akan mengumumkan nilai kuis Anda. Tidak benar jika
Anda mengatakan bahwa peluang untuk mendapatkan nilai di atas 50
adalah 0,5. Nilai Anda akan lebih dari 50 atau tidak, tidak ada
hubungannya dengan peluang karena nilai Anda sudah ada
sebelumnya. Proporsi populasi p serupa dengan hasil kuis Anda yang
sudah memiliki nilai tertentu. Proporsi p adalah nilai yang sudah pasti,
sehingga selang kepercayaan yang terbentuk bisa memuat ataupun
tidak memuat p. Dengan demikian salah jika kita mengatakan bahwa
terdapat peluang 95% bahwa nilai sebenarnya p berada di antara 0,655
dan 0,845.
Kita juga harus mengingat bahwa selang kepercayaan berhubungan
dengan nilai sebenarnya dari parameter populasi. Dengan demikian,
pernyataan seperti, “Dalam 95% sampel, proporsinya terletak di antara
0,655 dan 0,845” adalah pernyataan yang salah. Selang kepercayaan
tidak membahas proporsi sampel, melainkan proporsi populasi.
Kerjakan Latihan 3 n
Pada Contoh 2 kita telah mencari nilai kritis zα/2 yang bersesuaian
dengan tingkat kepercayaan 95%. Nilai kritis untuk tingkat-tingkat
kepercayaan lainnya dirangkum dalam tabel berikut.
pˆ (1 - pˆ )
Rumus 2-1 E = za 2 Batas galat proporsi
n
Selang Kepercayaan
Dengan nilai batas galat
pˆ (1 - pˆ )
E = za 2
n
Selang kepercayaan yang digunakan untuk mengestimasi proporsi
populasi adalah sebagai berikut.
pˆ - E < p < pˆ + E
Selang kepercayaan tersebut juga bisa dituliskan dalam bentuk
ekuivalen seperti berikut.
p̂ ± E atau ( pˆ - E , pˆ + E )
p̂ ± E , atau
( pˆ - E, pˆ + E )
6. Bulatkan batas-batas selang kepercayaan sampai tiga angka di
belakang koma.
7. Interpretasikan hasilnya.
Tentu saja prosedur mulai nomor 1 sampai 7 tidak harus ditulis secara
eksplisit langkah-langkahnya. Prosedur tersebut hanya kita gunakan
sebagai panduan untuk membuat selang kepercayaan. Akan tetapi,
karena baru pertama kali kita berlatih untuk membuat selang
kepercayaan, maka pada Contoh 3 berikut akan ditunjukkan
bagaimana menggunakan prosedur tersebut secara jelas langkah-
langkahnya.
CONTOH 3—Menentukan Selang Kepercayaan
Pada Contoh 1 dijelaskan bahwa Badan Pusat Statistik melakukan
survei pada 1,14 juta penduduk Indonesia dan diperoleh bahwa
terdapat 121.980 penduduk miskin. Carilah selang kepercayaan 99%
untuk mengestimasi proporsi penduduk Indonesia yang miskin.
PEMBAHASAN Kita gunakan langkah-langkah dalam prosedur
membuat selang kepercayaan untuk p.
pˆ (1 - pˆ )
E = za 2
n
pˆ (1 - pˆ )
0,03 = 1,96
n
Untuk menentukan ukuran sampel n, kita perlu nilai p̂ . Kita belum
tahu p̂ karena kita belum memiliki sampelnya. Bagaimana cara
mengatasi masalah ini? Terdapat dua kemungkinan solusi: (1) kita
bisa menentukan p̂ berdasarkan penelitian pilot atau penelitian yang
pernah dilakukan sebelumnya, atau (2) kita gunakan kemungkinan
terburuk, yaitu ketika pˆ (1 - qˆ) menghasilkan nilai yang paling besar
dan akibatnya n juga besar, tetapi yang paling aman dengan memilih
p̂ = 0,5. Karena kita belum tahu proporsi sampelnya, maka kita pilih
kemungkinan yang kedua. Dengan demikian,
(0,5)(0,5)
0,03 = 1,96
n
0,03 n = 1,96 (0,5)(0,5)
1,96 (0,5)(0,5)
n=
0,03
2
æ 1,96 (0,5)(0,5) ö
n=ç ÷÷ = 1067,11
ç 0,03
è ø
Agar aman, kita bulatkan ke atas nilai n yang kita peroleh menjadi
1068. Dengan demikian, kita perlu 1068 responden agar selang
kepercayaan yang akan kita buat memiliki batas galat 3% dan tingkat
kepercayaan 95%.
Berdasarkan ilustrasi di atas, ukuran sampel yang digunakan untuk
membuat selang kepercayaan dapat ditentukan sebagai berikut.
Mencari Ukuran Sampel untuk Mengestimasi Proporsi
Populasi
Tujuan
Peran Ukuran Populasi Rumus 2-2 dan 2-3 membuka mata kita
bahwa seberapa besar ukuran sampel yang perlu kita pilih tidak
bergantung pada ukuran populasi N. Ukuran sampel tersebut hanya
tergantung pada tingkat kepercayaan dan batas galat yang kita
inginkan, serta kadang-kadang proporsi sampel p̂ yang telah
diketahui.
CONTOH 4—Menentukan Ukuran Sampel
Sebuah lembaga peduli pendidikan internasional akan memberikan
bantukan kepada negara Chad agar banyaknya penduduk yang bisa
baca tulis dalam negara tersebut meningkat. Oleh karena itu, lembaga
tersebut ingin mencari proporsi penduduk Chad berusia 15 – 24 tahun
yang bisa baca tulis. Tentukan banyaknya sampel yang diperlukan
agar tingkat kepercayaannya 95% dan batas galatnya tidak lebih dari
2%.
n = ë a 2û (
é z ù pˆ 1 - pˆ )
E2
2
[1,96] (0,308)(0,692)
=
0,022
= 2045 (dibulatkan ke atas)
Lembaga tersebut memerlukan sampel dengan ukuran paling
tidak 2045.
(b) Dengan asumsi tidak ada informasi terkait proporsi sebelumnya,
maka kita gunakan Rumus 2-3 pada bagian ini.
2
é z ù 0,25
n = ë a 2û
E2
[1,96]2 0,25
=
0,022
= 2401
Lembaga tersebut memerlukan sampel berukuran sedikitnya
2401.
Persyaratan
1. Sampel merupakan sampel acak sederhana.
2. Simpangan baku populasi σ diketahui.
3. Salah satu atau kedua kondisi berikut terpenuhi: Populasi
berdistribusi normal atau n ≥ 30.
Selang Kepercayaan
Selang kepercayaan bisa dituliskan ke dalam tiga bentuk, yaitu
x -E < m < x +E ,
x ± E , atau
( x - E, x + E )
dengan E ditentukan dengan rumus berikut.
s
E = za 2 Rumus 2-4
n
x - mx
z=
sx
(a) Dari Data 1, kita bisa mencari bahwa mean sampel dari
kecakapan matematika siswa Indonesia adalah 398,46. Mean
sampel inilah yang menjadi estimasi titik terbaik untuk mean
populasi. Dari sini apakah kita sudah bisa menyimpulkan bahwa
kecakapan matematika siswa Indonesia di bawah rata-rata, yaitu
500? Belum, kita harus membuat selang kepercayaan terlebih
dahulu.
(b) Dengan tingkat kepercayaan 0,95, kita peroleh α = 0,05 dan
dengan demikian zα/2 = 1,96 (lihat kembali Contoh 2 tentang
bagaimana menentukan nilai kritis). Selanjutnya karena σ = 90
dan dari Data 1 kita memiliki sampel dengan ukuran n = 576,
maka batas galatnya bisa ditentukan sebagai berikut.
s 90
E = za 2 = 1,96 × = 7,35
n 576
Dengan x = 398,46 dan E = 7,35, maka selang kepercayaannya
adalah
x -E < μ < x +E
398, 46 - 7,35 < μ < 398, 46 + 7,35
Persyaratan
Sampel harus berupa sampel acak sederhana.
Ukuran Sampel
2
é za 2s ù
n=ê ú Rumus 2-5
ëê E ûú
Serupa dengan Rumus 2-2 dan 2-3 untuk menentukan ukuran sampel
ketika kita ingin mengestimasi proporsi populasi, Rumus 2-5 juga
tidak bergantung pada ukuran populasi yang nilai meannya akan kita
estimasi. Seberapa besar ukuran sampel untuk mengestimasi mean
populasi tersebut hanya dipengaruhi oleh tingkat kepercayaan (yang
menghasilkan nilai zα/2), batas galat E, dan simpangan baku populasi σ.
Masalahnya adalah bagaimana kita bisa tahu simpangan baku
populasi? Nilai simpangan baku populasi tersebut bisa kita dekati
dengan simpangan baku sampel s, atau jika tersedia, kita bisa
menggunakan simpangan baku populasi berdasarkan penelitian yang
telah dilakukan sebelumnya.
CONTOH 6—Menentukan Ukuran Sampel
Sebuah perusahaan perangkat lunak komputer mengklaim bahwa
perangkat lunaknya dapat mempercepat proses pengunduhan film.
Dengan memanfaatkan versi uji coba terbatas perangkat lunak
tersebut, kita menggunakannya untuk mengunduh sebuah film
berulang kali dan berharap mendapatkan batas galat 3 menit. Kita
menduga bahwa simpangan baku populasi durasi pengunduhan video
tersebut adalah 8 menit. Berapa kali pengunduhan yang harus kita
lakukan agar mendapatkan selang kepercayaan 95%?
2
é za 2s ù é 1,96 × 8 ù 2
n=ê ú =ê ú = 28 (dibulatkan ke atas)
ëê E ûú ë 3 û
INTERPRETASI Kita memerlukan 28 kali pengunduhan film yang
sama secara acak sederhana agar kita 95% yakin bahwa mean sampel
x berada dalam selang 3 menit kurang atau lebihnya dari mean
populasi μ sebenarnya.
Kerjakan Latihan 10 n
Derajat bebas: df = n – 1
(a) (b)
Gambar 2-4
(a) (b)
Gambar 2-5
Gambar 2-7
x ± E , atau
( x - E, x + E )
Gambar 2-8
Dari diagram peluang, kita bisa melihat bahwa semua data berada di
dalam batas. Dengan demikian, data tersebut berasal dari populasi
berdistribusi normal. Semua persyaratan terpenuhi.
Gambar 2-9
Tidak seperti distribusi-distribusi sampling sebelumnya, distribusi
data pada Gambar 2-9 tidaklah berdistribusi normal. Distribusi data
tersebut condong ke kanan dan tidak pernah negatif. Distribusi
semacam ini dinamakan distribusi chi-square.
DEFINISI
Jika sebuah sampel acak sederhana berukuran n diperoleh dari
populasi yang berdistribusi normal dengan mean μ dan simpangan
baku σ, maka
c 2
=
( n - 1) s 2
s2
memiliki distribusi chi-square.
Derajat bebas: df = n – 1
0,025) yang semuanya dilihat pada baris df = 14. Setelah melihat tabel,
kita peroleh nilai-nilai kritisnya adalah c I2 = 5,629 dan c A2 = 26,119.
(n - 1)s 2
c I2 < < c A2
s 2
(n - 1)s 2 (n - 1)s 2
<s2 <
c 2
A c I2
Pertidaksamaan di atas merupakan selang kepercayaan untuk
mengestimasi variansi populasi.
Selang Kepercayaan untuk Mengestimasi Variansi atau
Simpangan Baku Populasi
Tujuan
Mengkonstruksi selang kepercayaan untuk mengestimasi variansi
atau simpangan baku populasi.
Notasi
σ = simpangan baku populasi
σ2 = variansi populasi
s = simpangan baku sampel
s2 = variansi sampel
n = ukuran sampel
c I2 = nilai kritis ujung kiri dari χ2
c A2 = nilai kritis ujung kanan dari χ2
Persyaratan
1. Sampel merupakan sampel acak sederhana.
2. Populasi harus berdistribusi normal.
Selang Kepercayaan untuk Variansi Populasi
(n - 1)s 2 (n - 1)s 2
< s 2
<
cA
2
cI
2
Berikut ini adalah kekuatan gempa (dalam SR) yang dipilih secara
acak dari Data 3 (tersedia daring). Data 3 merupakan data gempa
bumi di Inonesia pada kuartal pertama tahun 2018 yang diperoleh
dari BMKG.
(a)
(b)
Gambar 2-12
Dari uji normalitas formal dan diagram Q-Q normal tersebut, kita bisa
menyimpulkan bahwa sampel tersebut berasal dari populasi yang
berdistribusi normal. Dengan demikian, semua persyaratan terpenuhi.
Selanjutnya kita tentukan variansi sampel s2, nilai kritis kiri c I2 dan
nilai kritis kanan c I2 berderajat bebas df = n – 1 = 14 dengan
menggunakan teknologi, sehingga diperoleh
(n - 1)s 2 (n - 1)s 2
< s2 <
c A2 c I2
(15 - 1) × 0,58 (15 - 1) × 0,58
< s2 <
26,119 5,629
0,3109 < s 2 < 1, 4425
Dengan mengakarkan semua ruas, kita peroleh selang kepercayaan
untuk simpangan baku.
0,5576 < s < 1,2011
Berikutnya kita bulatkan selang kepercayaan tersebut menjadi dua
angka di belakang koma (karena data aslinya memuat satu angka di
belakang koma) untuk mendapatkan
Gambar 2-13
Dengan demikian, kita memerlukan sampel dengan ukuran sekitar
234 untuk mengestimasi simpangan baku yang nilai diperkirakan 50
dengan batas galat 5.
Masalah muncul ketika data sampel yang kita miliki tidak memenuhi
persyaratan-persyaratan yang telah disebutkan. Untuk mengatasi
permasalahan ini, kita bisa menggunakan metode bootstrap, yaitu
metode simulasi pensampelan ulang dari data yang telah kita miliki.
Metode ini tidak memerlukan sampel yang berasal dari distribusi
normal ataupun distribusi tertentu lainnya. Oleh karena itu, metode
ini disebut metode nonparametrik atau metode bebas distribusi.
Seperti yang telah disebutkan, metode ini melakukan pensampelan
ulang dari data awal untuk mendapatkan sampel-sampel bootstrap.
DEFINISI
Diberikan sampel acak sederhana berukuran n, sampel bootstrap
adalah sampel berukuran n yang nilai-nilai di dalamnya diperoleh
dengan mengambil secara acak dengan pengembalian dari nilai-nilai
dari sampel awal.
Sampel-Sampel Bootstrap
1 150,2 148,5 149,7 149,7 150,2 149,7 151,3 150,6 149,7 149,7
2 150,2 148,5 149,8 150,2 148,5 150,2 151,3 150,6 150,0 149,7
3 151,3 148,5 150,2 151,3 150,0 149,8 149,8 150,6 150,6 150,4
2.5 Rangkuman
1. Selang kepercayaan untuk membuat selang
digunakan untuk kepercayaan mean proporsi
mengestimasi parameter dan mean, sampel tersebut
suatu populasi dengan tingkat harus berukuran cukup besar,
kepercayaan tertentu. Tingkat n ≥ 30, atau berasal dari
kepercayaan tersebut populasi yang berdistribusi
menyatakan peluang bahwa normal. Syarat yang lebih
selang kepercayaan tersebut ketat muncul dalam membuat
memuat nilai parameter yang selang kepercayaan variansi
sebenarnya. atau simpangan baku, yaitu
2. Beberapa persyaratan harus bahwa sampel harus berasal
terpenuhi untuk dari populasi yang
mengkonstruksi selang berdistribusi normal,
kepercayaan. Sampel acak meskipun ukuran sampel
sederhana merupakan syarat besar.
yang selalu muncul. Selain itu,
Glosarium
Batas galat. Selisih maksimum Nilai kritis. Suatu nilai yang
yang mungkin antara statistik membatasi statistik-statistik
sampel dengan nilai parameter sampel yang sangat mungkin
sebenarnya dari populasi yang terjadi dengan yang sangat tidak
diperkiran. mungkin terjadi.
Pustaka
Agresti, A., & Coull, B. A. (1998). Approximate is better than “exact”
for interval estimation of binomial proportions. The American
Statistician, 52(2), 119-126.
Bonett, D. G. (2006). Approximate confidence interval for standard
deviation of nonnormal distributions. Computational Statistics &
Data Analysis, 50(3), 775-782.
Latihan
1. Ketika memperkirakan parameter suatu populasi, apa yang Anda
pilih agar peluang Anda untuk benar semakin tinggi? Estimasi
titik atau selang keperayaan? Jelaskan.
2. Kepuasan Kerja. Anda ingin mengetahui kepuasan kerja sopir-
sopir angkutan umum di kota Anda. Anda menanyai 63 sopir
angkutan umum secara acak dan diperoleh 48 di antaranya puas
terhadap perkerjaan mereka. Tentukan estimasi titik terhadap
proporsi sopir-sopir angkutan umum di kota Anda yang puas
terhadap perkerjaan mereka.
3. Bagaimana Anda menentukan nilai kritis zα/2 pada tingkat
kepercayaan 99% dengan menggunakan tabel?