Anda di halaman 1dari 53

BAB II ESTIMASI NILAI PARAMETER

A. Deskripsi
Pada bab ini akan dibahas suatu metode untuk mengestimasi
parameter suatu populasi dengan menggunakan data sampel.
Parameter-parameter tersebut adalah proporsi, mean, variansi, dan
simpangan baku. Untuk melakukan estimasi tersebut, prosedur
standar yang digunakan adalah dengan mengkonstruksi selang
kepercayaan yang akan dijelaskan dalam bab ini. Selain itu, bab ini
juga akan membahas bagaimana menentukan ukuran sampel yang
diperlukan untuk memperkirakan parameter-parameter populasi
tersebut.

B. Relevansi
Salah satu tujuan statistika inferensial adalah untuk mengestimasi nilai
parameter suatu populasi dengan menggunakan data sampel. Untuk
itu, bab ini akan menjelaskan metode untuk melakukan estimasi
tersebut. Meskipun metode yang akan dibahas dalam bab ini mungkin
tergolong baru bagi Anda, tetapi Anda sudah familier dengan jajak
pendapat atau hitung cepat pemilu yang marak di media massa.
Metode-metode yang akan dijelaskan dalam bab ini sama dengan yang
digunakan oleh lembaga-lembaga survei pelaksana jajak pendapat dan
hitung cepat pemilu tersebut.

C. Capaian Pembelajaran
· Membuat selang kepercayaan untuk mengestimasi proporsi,
mean, variansi, dan simpangan baku suatu populasi, serta
menginterpretasikan selang kepercayaan tersebut.
· Mengidentifikasi persyaratan yang diperlukan untuk membuat
selang kepercayaan, dan memeriksa apakah persyaratan tersebut
terpenuhi.

29
30

· Menentukan ukuran sampel yang diperlukan untuk


mengestimasi proporsi, mean, variansi, dan simpangan baku
suatu populasi.
· Terampil menggunakan teknologi informasi untuk
menyelesaikan permasalahan statistik terkait selang kepercayaan.
· Merefleksikan hasil analisis data, dan berdasarkan hasil analisis
tersebut memberikan tindak lanjut untuk kepentingan bersama.

2.1 Estimasi Proporsi Populasi


Bayangkan bahwa kita ingin mengetahui proporsi penduduk
Indonesia yang miskin. Penduduk miskin di sini artinya adalah
penduduk yang memiliki rata-rata pengeluaran per kapita per bulan di
bawah garis kemiskinan. Akan tidak masuk akal ketika kita berharap
bisa mensurvei seluruh penduduk Indonesia. Untuk itu, kita bisa
menggunakan sampel penduduk Indonesia yang diperoleh secara acak
untuk kemudian ditentukan proporsi sampelnya. Proporsi sampel p̂
inilah yang bisa kita gunakan untuk mengestimasi proporsi populasi p.
Karena p̂ hanya berupa satu nilai, maka nilai ini selanjutnya disebut
dengan estimasi titik.
DEFINISI
Suatu estimasi titik adalah nilai atau titik tunggal yang digunakan
untuk mengestimasi nilai parameter.

Di awal telah disampaikan bahwa proporsi sampel bisa digunakan


untuk mengestimasi proporsi populasi. Hal ini bisa dilakukan karena
alasan berikut.

Proporsi sampel p̂ merupakan estimasi titik terbaik


untuk proporsi populasi p.

Proporsi sampel p̂ merupakan estimasi titik terbaik untuk proporsi


populasi p karena nilai ini adalah nilai yang paling tidak bias dan
paling konsisten untuk mengestimasi p. Nilai p̂ tidak bias karena
31

distribusi samplingnya memiliki pusat di p (lihat kembali subbab 1.3).


Nilai ini juga konsisten karena simpangan bakunya cenderung lebih
kecil daripada estimasi titik yang mungkin lainnya.
CONTOH 1—Menentukan Estimasi Titik untuk Proporsi
Populasi
Badan Pusat Statistik melakukan survei secara acak kepada 300.000
rumah tangga yang tersebar di 34 provinsi dan 511 kabupaten/kota di
Indonesia pada tahun 2016 untuk mengetahui proporsi penduduk
Indonesia yang miskin. Dengan asumsi bahwa rata-rata banyaknya
anggota rumah tangga adalah 3,8, maka banyak penduduk yang
disurvei adalah 1,14 juta. Survei ini menemukan bahwa 121.980
rumah tangga masuk dalam golongan penduduk miskin. Tentukan
estimasi titik untuk proporsi penduduk miskin Indonesia.
PEMBAHASAN Karena proporsi sampel adalah estimasi titik terbaik
untuk proporsi populasi, maka kita hitung proporsi sampelnya.

121.980
p= = 0,107 = 10,7%
1.140.000
Dengan demikian, kita memperkirakan bahwa 10,7% penduduk
Indonesia masuk dalam katagori miskin.

Kerjakan Latihan 2 n

2.1.1 Selang Kepercayaan


Pada Contoh 1, dengan menggunakan satu sampel, kita bisa
memperkirakan bahwa proporsi penduduk miskin Indonesia adalah
10,7%. Sekarang coba pikirkan bagaimana jika BPS pada tahun yang
sama memilih sampel acak yang memuat 300.000 rumah tangga lagi?
Apakah masih akan menghasilkan p̂ = 10,7%? Tentu saja jawabannya
adalah tidak karena nilai p̂ akan berbeda dari sampel ke sampel.
Karena perbedaan proporsi sampel tersebut, kita perlu melaporkan
suatu selang beserta dengan seberapa besar kemungkinan selang
32

tersebut memuat proporsi populasi yang tidak diketahui. Selang


seperti ini disebut dengan selang kepercayaan.
DEFINISI
Selang kepercayaan (atau estimasi selang) adalah suatu selang
nilai-nilai yang digunakan untuk mengestimasi nilai sebenarnya
dari parameter populasi.

Untuk lebih memahami selang kepercayaan, perhatikan ilustrasi


berikut. Misalkan Anda diminta untuk memperkirakan persentase
mahasiswa di kampus Anda yang menggunakan Twitter. Untuk
memperkirakannya, Anda melakukan survei terhadap 80 mahasiswa
secara acak dan diperoleh 60 mahasiswa menggunakan Twitter.
Dengan demikian, proporsi sampelnya adalah p̂ = 0,75 atau 75%.
Dengan menggunakan hasil ini, Anda bisa memperkirakan bahwa
75% dari semua mahasiswa di kampus Anda menggunakan Twitter.

Karena dalam survei tersebut Anda tidak menanyai semua mahasiswa


di kampus Anda, maka perkiraan yang telah Anda lakukan mungkin
salah. Untuk mengurangi kesalahan tersebut, Anda bisa membuat
selang untuk memperkirakan di mana proporsi populasi yang
sebenarnya berada, misalkan 0,75 ± 0,05 atau di antara 0,70 dan 0,80.
Ketika Anda ditanya seberapa yakin Anda bahwa proporsi populasi
berada di antara 0,70 dan 0,80, mungkin jawaban Anda adalah, “Saya
70% yakin bahwa proporsi mahasiswa di kampus saya yang
menggunakan Twitter adalah di antara 0.70 dan 0,80.” Jika Anda ingin
agar keyakinan Anda naik, misalkan 95%, apa yang bisa Anda lakukan
terhadap selang tersebut? Anda harus memperlebar estimasi selang
Anda, misalkan 0,65 sampai 0,85, agar keyakinan Anda naik. Dengan
demikian, hubungan antara besarnya keyakinan dengan lebar estimasi
selang Anda bisa digambarkan pada Gambar 2-1.
33

Tingkat kepercayaan
lebih tinggi
( ( ) )
Tingkat kepercayaan
lebih rendah

Gambar 2-1 Tingkat kepercayaan dan lebar selang

Seberapa besar keyakinan tersebut selanjutnya disebut dengan tingkat


kepercayaan.
DEFINISI
Tingkat kepercayaan adalah peluang bahwa selang kepercayaan
yang terbentuk benar-benar memuat parameter populasi jika proses
estimasinya dilakukan secara berulang-ulang. Tingkat kepercayaan
dinotasikan dengan (1 – α) ∙ 100%.

Tingkat kepercayaan yang sering digunakan adalah 90% (dengan α =


0,1), 95% (dengan α = 0,05), dan 0,99 (dengan α = 0,01). Dari ketiga
pilihan tersebut, selang kepercayaan yang paling sering digunakan
adalah 95% karena nilai ini memberikan keseimbangan antara presisi
(yang ditunjukkan dengan lebar selang kepercayaan) dan reliabilitas
(yang ditunjukkan dengan tingkat kepercayaan).
2.1.2 Interpretasi Selang Kepercayaan
Melanjutkan ilustrasi yang dijelaskan sebelumnya, berikut ini adalah
contoh selang kepercayaan yang memperkirakan proporsi mahasiswa
di kampus Anda yang menggunakan Twitter.

Selang kepercayaan 0,95 (95%) mengestimasi bahwa


proporsi populasi p berada pada selang 0,655 < p < 0,845.
Kita harus ekstra hati-hati dalam melakukan interpretasi terhadap
selang kepercayaan tersebut. Berikut ini contoh interpretasi yang
benar dan beberapa kemungkinan interpretasi yang salah.
34

Benar: “Kita 95% yakin bahwa selang di antara 0,655 dan 0,845
benar-benar memuat nilai sebenarnya dari proporsi
populasi.” Hal ini berarti bahwa jika kita memilih banyak
sampel-sampel berukuran 80 yang berbeda dan membuat
selang kepercayaannya, 95% dari selang-selang tersebut akan
benar-benar memuat proporsi populasi. Nilai 95% di sini
merupakan persentase keberhasilan dari proses yang
digunakan untuk memperkirakan proporsi populasi.
Salah: “Terdapat kemungkinan 95% bahwa nilai sebenarnya p
berada di antara 0,655 dan 0,845.” Kita juga tidak benar jika
mengatakan “Dalam 95% sampel, proporsinya terletak di
antara 0,655 dan 0,845.”
Untuk lebih memahami interpretasi yang benar dan salah terhadap
selang kepercayaan di atas, perhatikan ilustrasi berikut. Misalkan
dosen Anda akan mengumumkan nilai kuis Anda. Tidak benar jika
Anda mengatakan bahwa peluang untuk mendapatkan nilai di atas 50
adalah 0,5. Nilai Anda akan lebih dari 50 atau tidak, tidak ada
hubungannya dengan peluang karena nilai Anda sudah ada
sebelumnya. Proporsi populasi p serupa dengan hasil kuis Anda yang
sudah memiliki nilai tertentu. Proporsi p adalah nilai yang sudah pasti,
sehingga selang kepercayaan yang terbentuk bisa memuat ataupun
tidak memuat p. Dengan demikian salah jika kita mengatakan bahwa
terdapat peluang 95% bahwa nilai sebenarnya p berada di antara 0,655
dan 0,845.

Kita juga harus mengingat bahwa selang kepercayaan berhubungan


dengan nilai sebenarnya dari parameter populasi. Dengan demikian,
pernyataan seperti, “Dalam 95% sampel, proporsinya terletak di antara
0,655 dan 0,845” adalah pernyataan yang salah. Selang kepercayaan
tidak membahas proporsi sampel, melainkan proporsi populasi.
Selang kepercayaan 95% menyatakan bahwa jika kita melakukan
pemilihan sampel-sampel dengan ukuran yang sama dan membuat
35

selang kepercayaan untuk masing-masing sampel tersebut, maka 95%


dari selang-selang tersebut akan benar-benar memuat proporsi
populasi. Misalkan nilai sebenarnya dari proporsi semua mahasiswa di
kampus Anda yang menggunakan Twitter adalah 0,85. Dengan
demikian, selang kepercayaan yang telah kita buat sebelumnya tidak
memuat proporsi populasi karena 0,85 tidak berada di antara 0,655
dan 0,845. Gambar 2-2 menunjukkan selang kepercayaan yang
dihasilkan dari 20 sampel. Dengan tingkat kepercayaan 95%, kita
menduga bahwa akan ada 19 dari 20 sampel yang menghasilkan selang
kepercayaan yang benar-benar memuat nilai sebenarnya dari proporsi
populasi.

Gambar 2-2 Selang kepercayaan dari 20 sampel


2.1.3 Nilai-Nilai Kritis
Banyak prosedur-prosedur statistika (termasuk prosedur untuk
membuat selang kepercayaan) menggunakan skor z yang memisahkan
statistik-statistik sampel yang sangat mungkin terjadi dan statistik-
statistik yang sangat mungkin tidak terjadi. Skor z ini disebut dengan
nilai kritis.
DEFINISI
Nilai kritis adalah suatu nilai yang menjadi batas antara statistik-
statistik sampel yang sangat mungkin terjadi dan statistik-statistik
36

yang sangat mungkin tidak terjadi. Bilangan zα/2 merupakan nilai


kritis yang memisahkan daerah di ujung kanan kurva normal baku
yang memiliki luas α/2. Perhatikan gambar di bawah.

Untuk mengetahui bagaimana menentukan nilai kritis, perhatikan


Contoh 2 berikut.
CONTOH 2—Menentukan Nilai Kritis
Tentukan nilai kritis zα/2 yang bersesuaian dengan tingkat kepercayaan
95%.
PEMBAHASAN Karena tingkat kepercayaan 95% sama dengan 1 – α,
maka α = 1 – 0,95 = 0,05 dan akibatnya α/2 = 0,025. Gambar 2-3
menunjukkan kurva normal baku yang daerah di ujung kanannya
(dan kirinya) yang memiliki luas 0,025 diarsir. Karena luas daerah di
kanan zα/2 sama dengan 0,025, maka luas daerah di kirinya sama
dengan 0,975. Dengan menggunakan Excel [dengan rumus
=NORM.S.INV(0.975)] , kita peroleh nilai kritis tersebut adalah zα/2 =
1,96.
37

Gambar 2-3 Menentukan nilai kritis

Kerjakan Latihan 3 n

Pada Contoh 2 kita telah mencari nilai kritis zα/2 yang bersesuaian
dengan tingkat kepercayaan 95%. Nilai kritis untuk tingkat-tingkat
kepercayaan lainnya dirangkum dalam tabel berikut.

Tingkat Kepercayaan α Nilai Kritis, zα/2


90% 0,10 1,645
95% 0,05 1,96
99% 0,01 2,576

2.1.4 Batas Galat


Kembali ke ilustrasi mengenai penggunaan Twitter di kalangan
mahasiwa, kita 95% yakin bahwa proporsi p berada pada selang di
antara 0,655 dan 0,845. Dengan kata lain, kita 95% percaya bahwa 0,75
± 0,095 dari seluruh mahasiswa di kampus Anda menggunakan
Twitter. Bilangan 0,095 ini disebut batas galat.
DEFINISI
Ketika data dari sampel acak sederhana digunakan untuk
mengestimasi parameter suatu populasi, batas galat atau margin of
error, yang dinotasikan dengan E, adalah selisih maksimum yang
38

mungkin (dengan peluang 1 – α) antara statistik sampel dan nilai


sebenarnya dari parameter populasi yang diestimasi.

Batas galat untuk mengestimasi proporsi populasi dapat ditentukan


dengan mengalikan nilai kritis dan simpangan baku proporsi sampel,
seperti yang ditunjukkan Rumus 2-1.

pˆ (1 - pˆ )
Rumus 2-1 E = za 2 Batas galat proporsi
n

Dalam Rumus 2-1 di atas, kita menggati p dengan p̂ dalam rumus


simpangan baku. Hal ini dikarenakan p tidak diketahui dan p̂
merupakan estimasi titik terbaik untuk p.

Berdasarkan definisi batas galat di atas, maka dalam selang


kepercayaan 95%, α = 0,05, terdapat peluang 0,05 bahwa proporsi
sampel memiliki galat lebih dari E. Setelah kita bisa menentukan batas
galat E, selanjutnya kita bisa membuat selang kepercayaan yang bisa
dirangkum sebagai berikut.

Selang Kepercayaan untuk Mengestimasi Proporsi Populasi


Tujuan
Membuat selang kepercayaan untuk mengestimasi proprosi suatu
populasi.
Persyaratan
1. Sampel merupakan sampel acak sederhana.
2. Syarat-syarat distribusi binomial terpenuhi, yaitu banyaknya
percobaan atau ukuran sampel sudah pasti, percobaan-
percobaan tersebut saling bebas, terdapat dua kategori hasil,
dan peluang hasil tersebut selalu tetap untuk masing-masing
percobaan.
3. Terdapat paling tidak 10 sukses dan 10 gagal. Dengan kata
lain, kita harus memeriksa apakah npˆ ≥ 10 dan n(1 - pˆ ) ≥ 10.
39

Selang Kepercayaan
Dengan nilai batas galat

pˆ (1 - pˆ )
E = za 2
n
Selang kepercayaan yang digunakan untuk mengestimasi proporsi
populasi adalah sebagai berikut.

pˆ - E < p < pˆ + E
Selang kepercayaan tersebut juga bisa dituliskan dalam bentuk
ekuivalen seperti berikut.

p̂ ± E atau ( pˆ - E , pˆ + E )

Pembulatan: Nilai-nilai dalam selang kepercayaan dibulatkan


sampai tiga angka di belakang koma.

Banyak konsep yang telah kita pelajari sebelum sampai kepada


bagaimana cara membuat selang kepercayaan. Secara ringkas,
prosedur dalam membuat selang kepercayaan dapat dilakukan sebagai
berikut.

Prosedur Membuat Selang Kepercayaan untuk p

1. Tentukan nilai proporsi sampel p̂ .


2. Periksa apakah semua persyaratan terpenuhi.
3. Tentukan nilai kritis zα/2, dengan menggunakan teknologi
ataupun tabel, yang sesuai dengan tingkat kepercayaan yang
diinginkan.
4. Hitung batas galat E dengan Rumus 2-1.
5. Substitusikan nilai proporsi sampel p̂ dan batas galat E untuk
membuat salah satu dari bentuk-bentuk selang kepercayaan
berikut.
pˆ - E < p < pˆ + E ,
40

p̂ ± E , atau
( pˆ - E, pˆ + E )
6. Bulatkan batas-batas selang kepercayaan sampai tiga angka di
belakang koma.
7. Interpretasikan hasilnya.
Tentu saja prosedur mulai nomor 1 sampai 7 tidak harus ditulis secara
eksplisit langkah-langkahnya. Prosedur tersebut hanya kita gunakan
sebagai panduan untuk membuat selang kepercayaan. Akan tetapi,
karena baru pertama kali kita berlatih untuk membuat selang
kepercayaan, maka pada Contoh 3 berikut akan ditunjukkan
bagaimana menggunakan prosedur tersebut secara jelas langkah-
langkahnya.
CONTOH 3—Menentukan Selang Kepercayaan
Pada Contoh 1 dijelaskan bahwa Badan Pusat Statistik melakukan
survei pada 1,14 juta penduduk Indonesia dan diperoleh bahwa
terdapat 121.980 penduduk miskin. Carilah selang kepercayaan 99%
untuk mengestimasi proporsi penduduk Indonesia yang miskin.
PEMBAHASAN Kita gunakan langkah-langkah dalam prosedur
membuat selang kepercayaan untuk p.

1. Terdapat 121.980 penduduk miskin dari n = 1.140.000 penduduk


yang disurvei. Dengan menggunakan hasil dari Contoh 1, kita
peroleh proporsi sampel p̂ = 0,107.
2. Selanjutnya kita periksa apakah semua persyaratan terpenuhi. (1)
Metode survei yang digunakan Badan Pusat Statistik untuk
memilih sampel dilakukan secara acak. (2) Semua persyarata
distribusi binomial terpenuhi karena banyaknya percobaan sudah
pasti (n = 1,14 juta), semua percobaan saling bebas (jawaban
seorang responden tidak mempengaruhi responden lainnya),
terdapat dua kategori hasil dalam masing-masing percobaan
(penduduk miskin dan tidak), dan peluangnya tetap konstan. (3)
41

Karena pˆ = 0,107 , maka banyaknya penduduk yang miskin dan


yang tidak secara berturut-turut adalah
npˆ = 1.140.000(0,107) = 121.980 ≥ 10, dan
n(1 - pˆ ) = 1.140.000(1 – 0,107) = 1.018.020 ≥ 10.
Dengan demikian, semua persyaratan terpenuhi.
3. Karena kita ingin tingkat kepercayaan 99%, maka dengan
menggunakan Excel [dengan rumus =NORM.S.INV(0.995)] kita
peroleh nilai kritisnya adalah zα/2 = 2,576.
4. Dengan mensubstitusikan nilai p̂ dan zα/2 yang telah dihitung
pada langkah 1 dan 3, serta n = 1.140.000 ke dalam Rumsu 2-1,
kita peroleh
pˆ (1 - pˆ ) 0,107 (1 - 0,107 )
E = za 2 = 2,576 = 0,000746
n 1.140.000
5. Setelah kita tahu nilai p̂ dan E, maka dengan mudah kita dapat
membuat selang kepercayaan sebagai berikut.
p̂ - E < p < p̂ + E
0,107 – 0,000746 < p < 0,107 + 0,000746
0,106254 < p < 0,107746
6. Setelah dibulatkan sampai tiga angka di belakang koma, kita
peroleh selang kepercayaan 0,106 < p < 0,108. Jika dituliskan ke
dalam persentase, kita peroleh 10,6% < p < 10,8%.
INTERPRETASI Kita 99% percaya bahwa proporsi penduduk
Indonesia yang miskin adalah di antara 10,6% dan 10,8%.
Kerjakan Latihan 6 n

2.1.5 Menentukan Ukuran Sampel untuk Mengestimasi p


Pertanyaan tentang seberapa besar ukuran sampel yang harus kita
pilih merupakan langkah penting dalam pelaksanaan penelitian.
Misalkan kita berencana melakukan survei dan ingin mengestimasi
proporsi populasi dengan batas galat 3% dan tingkat kepercayaan 95%,
maka dengan menggunakan Rumus 2-1 kita dapatkan
42

pˆ (1 - pˆ )
E = za 2
n
pˆ (1 - pˆ )
0,03 = 1,96
n
Untuk menentukan ukuran sampel n, kita perlu nilai p̂ . Kita belum
tahu p̂ karena kita belum memiliki sampelnya. Bagaimana cara
mengatasi masalah ini? Terdapat dua kemungkinan solusi: (1) kita
bisa menentukan p̂ berdasarkan penelitian pilot atau penelitian yang
pernah dilakukan sebelumnya, atau (2) kita gunakan kemungkinan
terburuk, yaitu ketika pˆ (1 - qˆ) menghasilkan nilai yang paling besar
dan akibatnya n juga besar, tetapi yang paling aman dengan memilih
p̂ = 0,5. Karena kita belum tahu proporsi sampelnya, maka kita pilih
kemungkinan yang kedua. Dengan demikian,

(0,5)(0,5)
0,03 = 1,96
n
0,03 n = 1,96 (0,5)(0,5)
1,96 (0,5)(0,5)
n=
0,03
2
æ 1,96 (0,5)(0,5) ö
n=ç ÷÷ = 1067,11
ç 0,03
è ø
Agar aman, kita bulatkan ke atas nilai n yang kita peroleh menjadi
1068. Dengan demikian, kita perlu 1068 responden agar selang
kepercayaan yang akan kita buat memiliki batas galat 3% dan tingkat
kepercayaan 95%.
Berdasarkan ilustrasi di atas, ukuran sampel yang digunakan untuk
membuat selang kepercayaan dapat ditentukan sebagai berikut.
Mencari Ukuran Sampel untuk Mengestimasi Proporsi
Populasi
Tujuan
43

Menentukan seberapa besar ukuran sampel yang diperlukan untuk


mengestimasi proporsi populasi p.
Notasi
p = proporsi populasi
p̂ = proporsi sampel
n = ukuran sampel
E = batas galat yang diinginkan
zα/2 = Nilai kritis
Persyaratan
Sampel harus sampel acak sederhana dari subjek-subjek yang saling
bebas.
Ukuran Sampel
2
é za 2 ù pˆ (1 - pˆ )
Ketika p̂ diketahui: n= ë û Rumus 2-2
E2
2
é za 2 ù 0,25
Ketika p̂ tidak diketahui: n = ë û Rumus 2-3
E2

Peran Ukuran Populasi Rumus 2-2 dan 2-3 membuka mata kita
bahwa seberapa besar ukuran sampel yang perlu kita pilih tidak
bergantung pada ukuran populasi N. Ukuran sampel tersebut hanya
tergantung pada tingkat kepercayaan dan batas galat yang kita
inginkan, serta kadang-kadang proporsi sampel p̂ yang telah
diketahui.
CONTOH 4—Menentukan Ukuran Sampel
Sebuah lembaga peduli pendidikan internasional akan memberikan
bantukan kepada negara Chad agar banyaknya penduduk yang bisa
baca tulis dalam negara tersebut meningkat. Oleh karena itu, lembaga
tersebut ingin mencari proporsi penduduk Chad berusia 15 – 24 tahun
yang bisa baca tulis. Tentukan banyaknya sampel yang diperlukan
44

agar tingkat kepercayaannya 95% dan batas galatnya tidak lebih dari
2%.

(a) Gunakan hasil survei UNESCO: Pada tahun 2016, proporsi


penduduk Chad dengan usia 15 – 24 tahun yang bisa baca tulis
adalah 30,8%.
(b) Asumsikan bahwa tidak ada informasi yang tersedia terkait
kemungkinan nilai dari proprosi.
PEMBAHASAN Dalam soal diketaui bahwa batas galat E = 0,02 dan
tingkat kepercayaan 95%. Dengan demikian, nilai kritisnya adalah zα/2
= 1,96.

(a) Dari survei sebelumnya yang dilakukan UNESCO pada tahun


2016, diketahui p̂ = 0,308. Dengan demikian, kita gunakan
Rumus 2-2 untuk menentukan ukuran sampel.
2

n = ë a 2û (
é z ù pˆ 1 - pˆ )
E2
2
[1,96] (0,308)(0,692)
=
0,022
= 2045 (dibulatkan ke atas)
Lembaga tersebut memerlukan sampel dengan ukuran paling
tidak 2045.
(b) Dengan asumsi tidak ada informasi terkait proporsi sebelumnya,
maka kita gunakan Rumus 2-3 pada bagian ini.
2
é z ù 0,25
n = ë a 2û
E2
[1,96]2 0,25
=
0,022
= 2401
Lembaga tersebut memerlukan sampel berukuran sedikitnya
2401.
45

INTERPRETASI Agar lembaga tersebut memiliki tingkat kepercayaan


95% dan batas galat maksimal 2%, maka mereka harus mendapatkan
sampel acak sederhana dengan ukuran minimal 2045 ketika mereka
menggunakan hasil survei UNESCO dan paling tidak 2401 jika
mereka tidak memiliki informasi mengenai proporsi sebelumnya. Kita
bisa melihat bahwa ketika kita tidak mengetahui hasil penelitian
sebelumnya, kita memerlukan ukuran sampel yang lebih besar untuk
memperoleh hasil yang sama.
Kerjakan Latihan 6 n

2.2 Estimasi Mean Populasi


Sebelumnya kita telah membuat selang kepercayaan untuk
mengestimasi proporsi populasi. Pada subbab ini, kita akan
melakukan prosedur yang serupa tetapi tujuannya adalah untuk
mengestimasi mean populasi. Untuk melakukannya kita
menggunakan mean sampel x sebagai estimasi titik dengan alasan
sebagai berikut.

Mean sampel x merupakan estimasi titik terbaik untuk


mean populasi μ.
Untuk membuat selang kepercayaan, kita akan membagi prosedurnya
menjadi dua bagian, yaitu ketika simpangan baku populasi σ diketahui
dan ketika simpangan baku populasi σ tidak diketahui.
2.2.1 Simpangan Baku Populasi σ Diketahui
Terdapat beberapa persyaratan jika kita ingin membuat selang
kepercayaan untuk mengestimasi mean populasi ketika simpangan
baku populasi tersebut diketahui. Pertama, sampel yang kita miliki
haruslah sampel acak sederhana. Kedua, populasi yang akan kita
estimasi meannya harus berdistribusi normal atau sampel yang kita
miliki berukuran paling tidak 30. Kondisi ini menjamin kita untuk
bisa menggunakan model distribusi normal sebagai distribusi
sampling dari mean sampel.
46

Metode untuk membuat selang kepercayaan sebagai estimasi mean


populasi ketika simpangan baku populasi tersebut diketahui dapat
dirangkum sebagai berikut.

Selang Kepercayaan untuk Mengestimasi Mean Populasi (σ


Diketahui)
Tujuan
Membuat selang kepercayaan untuk mengestimasi mean populasi
ketika simpangan baku populasi tersebut diketahui.
Notasi
μ = mean populasi
σ = simpangan baku populasi
x = mean sampel
n = ukuran sampel
E = batas galat
za 2 = nilai kritis yang sesuai dengan tingkat kepercayaan

Persyaratan
1. Sampel merupakan sampel acak sederhana.
2. Simpangan baku populasi σ diketahui.
3. Salah satu atau kedua kondisi berikut terpenuhi: Populasi
berdistribusi normal atau n ≥ 30.
Selang Kepercayaan
Selang kepercayaan bisa dituliskan ke dalam tiga bentuk, yaitu
x -E < m < x +E ,
x ± E , atau

( x - E, x + E )
dengan E ditentukan dengan rumus berikut.
s
E = za 2 Rumus 2-4
n
47

Pembulatan: Gunakan aturan pembulatan berikut dalam membuat


selang kepercayaan.
· Ketika data mentah atau data asli yang digunakan, bulatkan
selang kepercayaan sampai 1 angka di belakang koma lebihnya
dari nilai-nilai dalam data mentah tersebut.
· Ketika ringkasan statistik (n, x , s) yang diketahui, bulatkan
selang kepercayaan agar memiliki angka di belakang koma
yang sama dengan nilai mean sampel.

Mengapa Rumusnya Seperti Itu? Rumus untuk membuat selang


kepercayaan tersebut didasarkan pada karakteristik distribusi
sampling mean (lihat Subbab 1.1). Karakteristiknya mengatakan
bahwa distribusi sampling dari mean sampel-sampel berukuran n
akan berdistribusi normal dan berpusat di mean μ dan memiliki
simpangan baku s n . Padahal ketika kita mentransformasi
sembarang distribusi normal menjadi distribusi normal baku, kita
menggunakan rumus

x - mx
z=
sx

Padahal m x = m dan s x = s n . Dengan demikian, kita bisa


memperoleh
s
m = x -z
n
Dalam persamaan terakhir ini, setelah kita gunakan skor z yang bisa
positif dan negatif, serta suku yang paling kanan kita ganti menjadi E,
maka kita peroleh selang kepercayaan x ± E .
Setelah mengetahui bagaimana cara membuat selang kepercayaan
untuk mengestimasi mean populasi, maka langkah-langkah dalam
48

menyusun selang kepercayaan tersebut dapat dibagi menjadi beberapa


langkah berikut.

1. Periksa apakah semua persyaratan terpenuhi.


2. Tentukan nilai mean sampel x .
3. Tentukan nilai kritis zα/2 yang sesuai dengan tingkat kepercayaan
yang telah ditentukan. Nilai kritis ini bisa ditentukan dengan
menggunakan teknologi atau tabel.
4. Hitung batas galat E dengan rumus berikut.
s
E = za 2
n
5. Buat selang kepercayaan dengan mensubstitusi nilai mean sampel
x dan batas galat E pada salah satu dari bentuk-bentuk berikut.
x -E < m < x +E ,
x ± E , atau
( x - E, x + E )
6. Bulatkan selang kepercayaan sesuai dengan kesepakatan
pembulatan.
7. Interpretasikan hasilnya. Interpretasi selang kepercayaan yang
diperoleh bisa dilakukan dengan cara yang serupa dengan selang
kepercayaan untuk proporsi populasi.

Untuk lebih memahami bagaimana mengkonstruksi selang


kepercayaan untuk mengestimasi mean populasi, perhatikan Contoh 5
berikut.
CONTOH 5—Kecakapan Matematika Siswa Indonesia
Banyak pihak yang mengklaim bahwa kecakapan matematika siswa
Indonesia bisa dikatakan di atas rata-rata dengan memberikan bukti
bahwa banyak siswa Indonesia yang menjuarai olimpiade matematika
tingkat internasional. Akan tetapi, apakah kecakapan matematika
siswa Indonesia merata? Untuk menjawab pertanyaan ini, gunakan
49

hasil TIMSS dalam Data 1 (tersedia daring) dan asumsikan simpangan


baku populasi σ = 90.

(a) Tentukan estimasi titik terbaik untuk kecapakan matematika dari


populasi seluruh siswa Indonesia.
(b) Buatlah selang kepercayaan 95% untuk mengestimasi kecakapan
matematika seluruh siswa Indonesia.
(c) Dari semua negara-negara yang mengikuti TIMSS pada tahun
2015, kecakapan matematika siswanya memiliki mean 500.
Bagaimana posisi Indonesia terhadap mean tersebut?

PEMBAHASAN Data 1 dari hasil TIMSS tahun 2015 bisa diasumsikan


sebagai sampel acak sederhana. Dari soal diketahui bahwa simpangan
baku populasi σ = 90. Ukuran sampel dalam Data 1 adalah n = 576 ≥
30. Semua persyaratan terpenuhi.

(a) Dari Data 1, kita bisa mencari bahwa mean sampel dari
kecakapan matematika siswa Indonesia adalah 398,46. Mean
sampel inilah yang menjadi estimasi titik terbaik untuk mean
populasi. Dari sini apakah kita sudah bisa menyimpulkan bahwa
kecakapan matematika siswa Indonesia di bawah rata-rata, yaitu
500? Belum, kita harus membuat selang kepercayaan terlebih
dahulu.
(b) Dengan tingkat kepercayaan 0,95, kita peroleh α = 0,05 dan
dengan demikian zα/2 = 1,96 (lihat kembali Contoh 2 tentang
bagaimana menentukan nilai kritis). Selanjutnya karena σ = 90
dan dari Data 1 kita memiliki sampel dengan ukuran n = 576,
maka batas galatnya bisa ditentukan sebagai berikut.
s 90
E = za 2 = 1,96 × = 7,35
n 576
Dengan x = 398,46 dan E = 7,35, maka selang kepercayaannya
adalah
x -E < μ < x +E
398, 46 - 7,35 < μ < 398, 46 + 7,35
50

391,1 < μ < 405,8


(c) Berdasarkan selang kepercayaan yang telah terbentuk, skor 500
terletak jauh di atas selang tersebut. Dengan demikian, kecapakan
matematika siswa Indonesia secara signifikan berada di bawah
rata-rata kecakapan matematika siswa dari negara-negara yang
mengikuti TIMSS.
INTERPRETASI Dengan selang kepercayaan pada bagian (b), kita 95%
yakin bahwa selang kepercayaan tersebut memuat skor sebenarnya
dari mean kecakapan matematika seluruh siswa Indonesia. Artinya,
jika kita memilih lagi sampel-sampel berukuran 576 secara berulang-
ulang dan kita buat selang kepercayaan untuk masing-masing sampel
tersebut, maka 95% dari selang kepercayaan tersebut akan memuat
nilai sebenarnya dari mean populasi.

Kerjakan Latihan 9 n

Menentukan Ukuran Sampel. Pada Contoh 5 kita sudah bisa


membuat selang kepercayaan untuk mengestimasi mean populasi.
Sekarang, misalkan Anda akan mengestimasi kecakapan seluruh siswa
di Indonesia di bidang matematika dengan tingkat kepercayaan 95%.
Agar batas galatnya tidak lebih dari 5, seberapa besar sampel yang
Anda butuhkan? Untuk menjawab ini, kita bisa menyelesaikan n dari
Rumus 2-4 untuk mendapatkan Rumus 2-5 berikut.
Menentukan Ukuran Sampel untuk Mengestimasi Mean
Populasi
Tujuan
Menentukan seberapa besar sampel yang dibutuhkan untuk
melakukan estimasi mean dari suatu populasi, μ.
Notasi
μ = mean populasi
σ = simpangan baku populasi
E = batas galat yang diinginkan
zα/2 = nilai kritis z yang luas daerah di sebelah kanannya α/2.
51

Persyaratan
Sampel harus berupa sampel acak sederhana.
Ukuran Sampel
2
é za 2s ù
n=ê ú Rumus 2-5
ëê E ûú

Serupa dengan Rumus 2-2 dan 2-3 untuk menentukan ukuran sampel
ketika kita ingin mengestimasi proporsi populasi, Rumus 2-5 juga
tidak bergantung pada ukuran populasi yang nilai meannya akan kita
estimasi. Seberapa besar ukuran sampel untuk mengestimasi mean
populasi tersebut hanya dipengaruhi oleh tingkat kepercayaan (yang
menghasilkan nilai zα/2), batas galat E, dan simpangan baku populasi σ.
Masalahnya adalah bagaimana kita bisa tahu simpangan baku
populasi? Nilai simpangan baku populasi tersebut bisa kita dekati
dengan simpangan baku sampel s, atau jika tersedia, kita bisa
menggunakan simpangan baku populasi berdasarkan penelitian yang
telah dilakukan sebelumnya.
CONTOH 6—Menentukan Ukuran Sampel
Sebuah perusahaan perangkat lunak komputer mengklaim bahwa
perangkat lunaknya dapat mempercepat proses pengunduhan film.
Dengan memanfaatkan versi uji coba terbatas perangkat lunak
tersebut, kita menggunakannya untuk mengunduh sebuah film
berulang kali dan berharap mendapatkan batas galat 3 menit. Kita
menduga bahwa simpangan baku populasi durasi pengunduhan video
tersebut adalah 8 menit. Berapa kali pengunduhan yang harus kita
lakukan agar mendapatkan selang kepercayaan 95%?

PEMBAHASAN Diketahui bahwa E = 3 menit, σ = 8 menit, dan


tingkat kepercayaan 0,95, sehingga α = 0,05. Dengan demikian zα/2 =
1,96. Ukuran sampel yang dibutuhkan bisa ditentukan sebagai berikut.
52

2
é za 2s ù é 1,96 × 8 ù 2
n=ê ú =ê ú = 28 (dibulatkan ke atas)
ëê E ûú ë 3 û
INTERPRETASI Kita memerlukan 28 kali pengunduhan film yang
sama secara acak sederhana agar kita 95% yakin bahwa mean sampel
x berada dalam selang 3 menit kurang atau lebihnya dari mean
populasi μ sebenarnya.
Kerjakan Latihan 10 n

2.2.2 Simpangan Baku Populasi σ Tidak Diketahui


Metode yang digunakan untuk mengestimasi mean populasi pada
pembahasan sebelumnya membutuhkan σ, yang sangat jarang ditemui
pada permasalahan sehari-hari, khususnya permasalahan yang
melibatkan sampel-sampel berukuran kecil. Untuk itu, kita bisa
menggunakan simpangan baku s. Akan tetapi masalahnya adalah nilai
s tersebut bisa bervariasi dari sampel ke sampel. Akibat dari
ketidakpastian nilai s tersebut, maka kita perlu melonggarkan selang
kepercayaan kita (yang mengakibatkan bertambahnya batas galat E).
Bahkan orang pertama yang menyelidiki masalah ini, yaitu William
Gosset, telah menunjukkan bahwa tidak hanya bertambahnya batas
galat, tetapi penggunaan s tersebut juga mengubah keseluruhan
keluarga distribusi sampling yang bisa digunakan.
Berdasarkan temuan Gosset, distribusi sampling yang dimaksud
masih memiliki bentuk yang sama dengan distribusi normal, yaitu
berbentuk lonceng yang simetris, akan tetapi detailnya berbeda.
Perbedaan detail tersebut tergantung pada suatu nilai yang disebut
dengan derajat bebas dan distribusi yang ditemukan oleh Gosset
tersebut dinamakan distribusi t Student.
DEFINISI
Derajat bebas dari kumpulan data sampel adalah banyaknya nilai-
nilai dalam sampel yang bisa bervariasi setelah batasan tertentu
53

diberikan kepada semua nilai dalam sampel. Derajat bebas


dinotasikan dengan df.

Untuk lebih memahami derajat bebas, perhatikan ilustrasi berikut.


Misalkan Anda diberitahu bahwa mean dari skor kuis 5 orang
mahasiswa adalah 60. Mean skor kuis yang sama dengan 60 tersebut
membatasi semua nilai dalam sampel. Meskipun demikian, Anda
masih bisa membuat 4 skor kuis tersebut bebas, baru kemudian skor
kuis sisanya Anda tentukan agar meannya menjadi 60. Dengan
demikian, data sampel ini memiliki df = 4.
Setelah Anda memahami derajat bebas, sekarang mari kita bahas lebih
lanjut mengenai distribusi t Student. Perhatikan definisi berikut.
DEFINISI
Misalkan sebuah sampel acak sederhana berukuran n dipilih dari
suatu populasi. Jika populasi tersebut berdistribusi normal, maka
distribusi dari
x -m
t=
s
n
merupakan distribusi t Student dengan derajat bebas yang
bersesuaian. Dalam persamaan tersebut, x dan s secara berturut-
turut merupakan mean dan simpangan baku sampel.

Dalam pembahasan ini, derajat bebas dapat ditentukan dengan cukup


sederhana, yaitu sama dengan satu kurangnya ukuran sampel.

Derajat bebas: df = n – 1

Sampai sini mungkin Anda masih bertanya-tanya, bagaimana bentuk


dari distribusi t Student? Detail apa yang berbeda dari distribusi
tersebut dengan distribusi normal? Untuk menjawab pertanyaan ini,
perhatikan Contoh 7 berikut.
54

CONTOH 7—Distribusi Normal Baku dan Distribusi t Student


Diberikan suatu populasi berdistribusi normal dengan mean dan
simpangan bakunya secara berturut-turut μ = 50 dan σ = 10.

(a) Gunakan perangkat lunak, Minitab misalnya, untuk


mendapatkan 1500 sampel acak sederhana berukuran n = 5 dari
populasi tersebut.
(b) Hitunglah mean dan simpangan baku untuk masing-masing
sampel.
(c) Untuk masing-masing sampel, hitunglah nilai-nilai berikut.
x -m x -m
z= dan t =
s s
n n
(d) Gambarlah histogram untuk distribusi z dan t.
(e) Ulangi langkah (a) – (d) untuk 1500 sampel berukuran n = 10.
PEMBAHASAN Kita gunakan Minitab untuk memperoleh 1500
sampel acak sederhana berukuran n = 5, dan kemudian kita hitung
mean dan simpangan baku sampel-sampel tersebut. Setelah itu, kita
hitung juga nilai z dan t untuk masing-masing sampel tersebut untuk
kemudian kita gambarkan histogram dari distribusi kedua nilai
tersebut. Gambar 2-4(a) dan (b) berikut secara berturut-turut
menunjukkan histogram dari z dan t.

(a) (b)
Gambar 2-4
55

Sekarang kita cermati kedua histogram tersebut. Distribusi z pada


Gambar 2-4(a) berbentuk seperti lonceng dan simetris dengan pusat
di 0 dan grafiknya merentang dari –3,25 sampai 3,25. Dengan
demikian, nilai-nilai z dengan n = 5 berdistribusi normal baku. Pada
Gambar 2-4(b), kita melihat distribusi t juga berbentuk seperti
lonceng dan simetris di 0, tetapi lebih menyebar, yaitu dari –7,5
sampai 7,5. Dengan demikian, nilai-nilai t ini kemungkinan besar
tidak berdistribusi normal baku. Nilai-nilai t yang lebih menyebar ini
karena kita membagi dengan s n untuk mendapatkan nilai
tersebut.

Untuk distribusi z dan t pada sampel-sampel berukuran n = 10 yang


terlihat di Gambar 2-5(a) dan (b), kita masih bisa melihat bahwa
kedua histogram tersebut menyerupai lonceng dan simetris, tetapi
histogram t lebih menyebar. Dengan demikian, histogram t untuk n =
10 masih belum berdistribusi normal baku.

(a) (b)
Gambar 2-5

Meskipun sama-sama lebih menyebar daripada distribusi z, kita bisa


melihat bahwa distribusi t untuk n = 10 kurang menyebar jika
dibandingkan dengan distribusi t untuk n = 5.
INTERPRETASI Dari simulasi tersebut, kita bisa menyimpulkan
bahwa terdapat distribusi t yang berbeda untuk sampel dengan ukuran
yang berbeda. Ketika ukuran sampel bertambah, maka penyebaran
56

distribusi t semakin berkurang. Jika ukuran sampel semakin besar,


makan distribusi t akan mendekati distribusi normal baku.
Kerjakan Latihan 11 n

Berdasarkan Contoh 7, kita memperoleh karakteristik distribusi t


Student sebagai berikut.
Karakteristik Distribusi t Student
1. Distribusi t Student akan memiliki bentuk yang berbeda untuk
ukuran sampel yang berbeda (misalnya, lihat Gambar 2-6
untuk n = 3 dan n = 10).
2. Distribusi t Student memiliki bentuk menyerupai lonceng dan
simetris seperti distribusi normal baku, tetapi lebih menyebar.
3. Luas daerah di bawah kurva sama dengan 1.
4. Distribusi t Student memiliki mean t = 0 (serupa dengan
distribusi normal baku dengan meannya z = 0).
5. Simpangan baku distribusi t Student berbeda untuk ukuran
sampel yang berbeda, tetapi selalu lebih dari 1 (berbeda
dengan distribusi normal baku yang memiliki simpangan baku
σ = 1).
6. Ketika ukuran sampel n semakin besar, bentuk distribusi t
Student akan semakin mendekati distribusi normal baku.

Gambar 2-6 Distribusi normal baku dan


distribusi t Student dengan n = 3 dan n = 10
57

Setelah kita mengetahui karakteristik dari kurva distribusi t Student,


selanjutnya kita akan berlatih menemukan nilai kritis tα/2 yang luas
daerah di kanannya sama dengan α/2 (serupa dengan nilai zα/2 pada
distribusi normal baku). Teknologi atau tabel bisa digunakan untuk
menentukan nilai tα/2 tersebut.
CONTOH 8—Menentukan Nilai t
Sebuah sampel acak sederhana berukuran n = 5 dipilih dari populasi
yang berdistribusi normal. Tentukan nilai kritis tα/2 yang bersesuaian
dengan tingkat kepercayaan 95%.

PEMBAHASAN Dalam soal diberikan informasi ukuran sampel n = 5,


sehingga derajat bebasnya df = 5 – 1 = 4. Tingkat kepercayaan 95%
atau 0,95 bersesuaian dengan α = 0,05, yaitu luas yang dibagi sama
rata oleh dua daerah di ujung kiri dan kanan distribusi t, lihat Gambar
2-7. Dengan demikian, luas masing-masing daerah tersebut adalah
0,025. Karena tabel distribusi t Student menunjukkan luas daerah di
kiri nilai t tertentu, maka untuk menentukan nilai tα/2, kita tentukan
nilai t pada derajat bebas df = 4 yang luas daerah di kirinya sama
dengan 0,975. Dari tabel, kita menemukan nilai ini adalah tα/2 = 2,776.
Kita dapat mengkonfirmasi nilai ini dengan menggunakan Excel, yaitu
dengan menginputkan rumus =T.INV(0.975,4) untuk mendapatkan
nilai tα/2 = 2,776445.

Gambar 2-7

Perhatikan bahwa nilai kritis z yang daerah di kirinya sama dengan


0,975 lebih kecil daripada nilai t yang baru saja kita temukan, yaitu
58

1,96. Hal ini dikarenakan distribusi t Student lebih menyebar daripada


distribusi normal baku.
Kerjakan Latihan 12 n

Sampai di sini kita telah mengenail distribusi t Student,


mengidentifikasi karakteristik-karakteristiknya, serta menentukan
nilai kritisnya pada tingkat kepercayaan tertentu. Sekarang kita sudah
siap untuk mengkonstruksi selang kepercayaan mean suatu populasi.
Selang Kepercayaan untuk Mengestimasi Mean Suatu
Populasi Ketika σ Tidak Diketahui
Tujuan
Mengkonstruksi selang kepercayaan untuk mengestimasi mean
suatu populasi, yaitu μ, ketika simpangan baku σ tidak diketahui.
Notasi
μ = mean populasi
x = mean sampel
s = simpangan baku sampel
n = ukuran sampel
E = batas galat
tα/2 = nilai kritis t yang luas daerah di kanannya α/2
Persyaratan
1. Sampel merupakan sampel acak sederhana.
2. Salah satu kondisi berikut terpenuhi: Sampel berasal dari
populasi yang berdistribusi normal atau n ≥ 30.
Selang Kepercayaan
Dengan batas galat berikut,
s
E = ta 2
n
dan dengan derajat bebas df = n – 1, selang kepercayaan mean
populasi adalah
x -E < m < x +E ,
59

x ± E , atau
( x - E, x + E )

Selang kepercayaan mean populasi yang akan kita buat membutuhkan


mean sampel x dan batas galat E, dan untuk menentukan nilai E
tersebut kita harus terlebih dahulu menentukan simpangan baku
sampel s, nilai kritis tα/2, dan n. Untuk itu, secara sistematis, selang
kepercayaan untuk mengestimasi mean populasi ketika simpangan
baku populasi tersebut tidak diketahui dapat dikonstruksi dengan
mengikuti prosedur berikut.

1. Periksa semua persyaratan apakah terpenuhi atau tidak.


Periksalah apakah sampel yang diberikan merupakan sampel
acak sederhana. Selain itu, kita juga harus melihat ukuran
sampelnya karena jika sampel tersebut berukuran kecil, maka kita
harus menguji apakah sampel tersebut berasal dari populasi yang
berdistirbusi normal. Metode yang paling mudah untuk menguji
normalitas sampel tersebut adalah dengan menggunakan diagram
Q-Q normal.
2. Hitung nilai mean sampel x dan simpangan baku sampel s.
3. Tentukan nilai kritis tα/2 sesuai dengan tingkat kepercayaan yang
diinginkan.
4. Hitung batas galat E dengan rumus berikut.
s
E = ta 2
n
5. Buat selang kepercayaan dengan mensubstitusi nilai mean sampel
x dan batas galat E yang telah dihitung sebelumnya pada salah
satu dari bentuk-bentuk berikut.
x -E < m < x +E ,
x ± E , atau
( x - E, x + E )
60

6. Bulatkan selang kepercayaan sesuai dengan kesepakatan


pembulatan. Jika data berasal dari data mentah, bulatkan selang
kepercayaan sampai satu angka di belakang koma lebihnya dari
data mentah. Jika rangkuman statistik-statistik yang diberikan (n,
x , s) bulatkan selang kepercayaan agar banyaknya angka di
belakang koma sama dengan angka di belakang koma milik x .
7. Interpretasikan hasilnya.

CONTOH 9—Membuat Selang Kepercayaan


IMDb merupakan situs web yang menyediakan data film-film dari
studio dan para penggemar. Berikut ini merupakan durasi (dalam
menit) 10 film yang dipilih secara acak dari data mentah yang
disediakan oleh IMDb (datasets.imdbws.com).
97 100 95 105 93 87 79 130 90 85

Konstruksilah selang kepercayaan 95% untuk mengestimasi mean


durasi semua film.

PEMBAHASAN Berdasarkan informasi soal, sampel merupakan


sampel acak sederhana. Karena n = 10 yang kurang dari 30, maka kita
perlu menguji normalitas data tersebut. Gambar 2-8 menunjukkan
diagram peluang dari data tersebut yang dibuat di Minitab.

Gambar 2-8
Dari diagram peluang, kita bisa melihat bahwa semua data berada di
dalam batas. Dengan demikian, data tersebut berasal dari populasi
berdistribusi normal. Semua persyaratan terpenuhi.
61

Pertama, kita tentukan mean dan simpangan baku sampel yang


diberikan. Dengan menggunakan teknologi, kita peroleh nilai kedua
statistik ini adalah sebagai berikut.
x = 96,1 dan s = 14,11
Tingkat kepercayaan 95% mengakibatkan α = 0,05, sehingga dengan
df = 10 – 1 = 9, kita peroleh nilai kritis tα/2 = 2,262. Selanjutnya kita
tentukan batas galat sebagai berikut.
s 14,11
E = ta 2 = 2,262 × = 10,10
n 10
Jadi, selang kepercayaan 95% yang terbentuk setelah dilakukan
pembulatan adalah 96,1 ± 10,1 menit.
INTERPRETASI Kita 95% yakin bahwa mean durasi dari semua film
berada pada selang 96,1 ± 10,1 menit.
Kerjakan Latihan 14 n

2.3 Estimasi Variansi Populasi


Pada bahasan terakhir di Bab 2 kita akan mempelajari bagaimana
mengkonstruksi selang kepercayaan untuk mengestimasi variansi atau
simpangan baku. Selain itu, nanti kita juga akan membahas bagaimana
menentukan ukuran sampel yang digunakan untuk mengestimasi
variansi atau simpangan baku suatu populasi.
Pertanyaannya sekarang, mengapa kita perlu mengestimasi nilai
variansi suatu populasi? Banyak permasalahan sehari-hari yang tidak
hanya memerlukan nilai proporsi atau mean yang akurat, tetapi juga
memerlukan konsistensi. Bayangkan sebuah mesin kopi di swalayan
yang sering menuangkan kopi ke dalam gelas pelanggan secara
berlebih atau kurang, tetapi secara rata-rata volumenya tepat. Tentu
saja pelanggan akan merasa kecewa jika kopi mereka kurang atau
tumpah karena berlebih. Oleh karena itu, maka swalayan tersebut
62

harus mengestimasi variansi atau simpangan baku dari volume kopi


yang dituangkan mesin tersebut untuk mengetahui konsistensinya.

Pertama-tama kita akan selidiki distribusi sampling variansi sampel s2


melalui simulasi. Misalkan kita mendapatkan 3000 sampel acak
sederhana berukuran n = 15 dari suatu populasi dengan mean μ = 50
dan simpangan baku σ = 10. Selanjutnya, kita lakukan langkah-
langkah berikut.

1. Hitung variansi masing-masing sampel.


2. Untuk masing-masing sampel, hitung nilai berikut.
(n - 1) s 2 = 14s 2
s2 100
3. Gambar histogram dari distribusi nilai-nilai yang telah
ditentukan pada langkah 2. Histogram ini diperlihatkan pada
Gambar 2-9.

Gambar 2-9
Tidak seperti distribusi-distribusi sampling sebelumnya, distribusi
data pada Gambar 2-9 tidaklah berdistribusi normal. Distribusi data
tersebut condong ke kanan dan tidak pernah negatif. Distribusi
semacam ini dinamakan distribusi chi-square.
DEFINISI
Jika sebuah sampel acak sederhana berukuran n diperoleh dari
populasi yang berdistribusi normal dengan mean μ dan simpangan
baku σ, maka
63

c 2
=
( n - 1) s 2
s2
memiliki distribusi chi-square.

Nilai-nilai kritis distribusi chi-square bisa ditentukan dengan


teknologi ataupun tabel. Distribusi chi-square tersebut ditentukan
oleh derajat bebas (serupa dengan distribusi t Student). Dalam
pembahasan ini, kita gunakan derajat bebas n – 1.

Derajat bebas: df = n – 1

Sebelumnya kita sedikit mengetahui karakteristik dari distribusi chi-


square berdasarkan apa yang yang tampak di Gambar 2-9. Lebih
lengkapnya, karakteristik-karakteristik distribusi chi-square dijelaskan
sebagai berikut.
Karakteristik Distribusi Chi-Square
1. Distribusi chi-square tidak simetris. Ketika derajat bebasnya
bertambah, maka distribusi tersebut semakin simetris (lihat
Gambar 2-10).
2. Nilai-nilai chi-square tidak negatif.
3. Distribusi chi-square berbeda jika derajat bebasnya berbeda,
perhatikan Gambar 2-10. Derajat bebasnya adalah df = n – 1.

Gambar 2-10 Distribusi chi-square dengan n = 5, 10, dan 20


64

Karena distribusi chi-square tidak simetris, maka selang kepercayaan


untuk mengestimasi σ2 tidak berbentuk s2 ± E, tetapi kita harus
mencari batas-batas galat kanan dan kirinya secara terpisah dengan
menggunakan nilai-nilai kritis yang berbeda. Bagaimana menentukan
nilai-nilai kritis pada distribusi chi-square? Perhatikan Contoh
berikut.

CONTOH 10—Menentukan Nilai-Nilai Kritis untuk χ2


Tentukan nilai-nilai kritis yang digunakan untuk mengkonstruksi
selang kepercayaan variansi populasi dengan tingkat kepercayaan 95%
dan ukuran sampel n = 15.

PEMBAHASAN Dengan ukuran sampel n = 15, maka derajat bebasnya


df = n – 1 = 14. Karena tingkat kepercayaan 95%, maka α = 0,05. Nilai
ini merupakan luas daerah yang dibagi sama besar di ujung kiri dan
kanan distribusi chi-square. Luas masing-masing daerah ini adalah
0,25. Untuk menentukan nilai-nilai kritisnya, kita sketsa distribusi chi-
square terlebih dahulu, seperti pada Gambar 2-11 berikut.

Gambar 2-11 Nilai-nilai kritis distribusi chi-square


Jika kita menggunakan tabel, catat bahwa badan tabel tersebut
memuat nilai-nilai χ2 yang bersesuaian dengan luas daerah yang
diberikan pada kepala kolomnya, dan luas ini merupakan luas
kumulatif sebelah kanan χ2 tersebut. Dengan demikian, nilai kritis
yang di sebelah kanan, yaitu c A2 , dapat ditentukan dengan melihat
kepala kolom 0,025, sedangkan nilai kritis sebelah kiri c I2 dapat
ditentukan dengan melihat kepala kolom 0,975 (diperoleh dari 1 –
65

0,025) yang semuanya dilihat pada baris df = 14. Setelah melihat tabel,
kita peroleh nilai-nilai kritisnya adalah c I2 = 5,629 dan c A2 = 26,119.

Selain dengan menggunakan tabel, kita bisa memanfaatkan teknologi


(seperti Excel dan Minitab) untuk menentukan nilai-nilai kritis
dengan mudah. Selain itu, teknologi dapat digunakan untuk
sembarang derajat bebas dan tingkat kepercayaan.

Kerjakan Latihan 16 n

Estimasi Titik untuk σ2. Untuk mengestimasi variansi populasi σ2,


kita gunakan variansi sampel s2 karena variansi sampel merupakan
estimasi titik terbaik untuk variansi populasi.

Variansi sampel s2 merupakan estimasi titik terbaik untuk


variansi populasi σ2.
Variansi sampel menjadi estimasi titik terbaik untuk variansi sampel
karena nilai tersebut tidak bias. Artinya, variansi sampel akan
cenderung berpusat ke variansi populasi.
Meskipun variansi sampel menjadi estimasi titik yang tidak bias untuk
variansi populasi, tidak demikian dengan simpangan baku sampel.
Simpangan baku sampel s merupakan estimasi titik yang bias untuk
simpangan baku populasi σ. Akan tetapi, pada prakteknya simpangan
baku sampel tersebut sering digunakan sebagai estimasti titik
simpangan baku populasi. Dengan demikian, untuk kepentingan
praktis, dalam pembahasan selanjutnya kita gunakan simpangan baku
sampel untuk mengestimasi simpangan baku populasi.

Simpangan baku sampel s biasa digunakan sebagai


estimasi titik simpangan baku populasi σ meskipun nilai
tersebut menghasilkan estimasi yang bias.

Walaupun variansi sampel merupakan estimasi titik terbaik untuk


variansi populasi, kita tidak tahu seberapa baik estimasinya. Oleh
66

karena itu, sekarang kita akan menemukan suatu metode untuk


membuat selang kepercayaan dari variansi populasi.

Misalkan kita memilih suatu sampel acak sederhana berukuran n dari


populasi berdistribusi normal dengan mean μ dan simpangan baku σ,
maka c 2 = (n - 1)s 2 s 2 berdistribusi chi-square dengan derajat bebas
df = n – 1. Dengan demikian, terdapat peluang 1 – α bahwa nilai χ2
terletak di antara c I2 dan c A2 . Artinya, terdapat 1 – α kemungkinan
bahwa pernyataan berikut benar.

(n - 1)s 2
c I2 < < c A2
s 2

Pertidaksamaan terakhir ini ekuivalen dengan pertidaksamaan


berikut.

(n - 1)s 2 (n - 1)s 2
<s2 <
c 2
A c I2
Pertidaksamaan di atas merupakan selang kepercayaan untuk
mengestimasi variansi populasi.
Selang Kepercayaan untuk Mengestimasi Variansi atau
Simpangan Baku Populasi
Tujuan
Mengkonstruksi selang kepercayaan untuk mengestimasi variansi
atau simpangan baku populasi.
Notasi
σ = simpangan baku populasi
σ2 = variansi populasi
s = simpangan baku sampel
s2 = variansi sampel
n = ukuran sampel
c I2 = nilai kritis ujung kiri dari χ2
c A2 = nilai kritis ujung kanan dari χ2
67

Persyaratan
1. Sampel merupakan sampel acak sederhana.
2. Populasi harus berdistribusi normal.
Selang Kepercayaan untuk Variansi Populasi
(n - 1)s 2 (n - 1)s 2
< s 2
<
cA
2
cI
2

Selang Kepercayaan untuk Simpangan Baku Populasi


(n - 1)s 2 (n - 1)s 2
<s <
c A2 c I2

Agar konstruksi selang kepercayaan variansi atau simpangan baku


yang kita lakukan sistematis, kita bisa mengikuti langkah-langkah
berikut dalam membuat selang kepercayaan tersebut.

1. Periksa semua persyaratan apakah terpenuhi atau tidak. Untuk


menguji normalitas populasi, kita bisa menggunakan metode
grafik atau uji normalitas formal.
2. Hitung nilai variansi sampel s2, nilai kritis ujung kiri c I2 , dan
nilai kritis ujung kanan c A2 dengan derajat bebas df = n – 1.
3. Konstruksilah selang kepercayaan dengan mensubstitusikan nilai
pada langkah 2 ke dalam bentuk berikut.
(n - 1)s 2 (n - 1)s 2
<s2 <
c A2 c I2
4. Hitunglah akar kuadrat dari batas atas dan batas bawah selang
kepercayaan pada langkah 3 untuk mendapatkan selang
kepercayaan simpangan baku populasi.
5. Bulatkan batas atas dan batas bawah selang kepercayaan. Aturan
pembulatan sama dengan aturan ketika kita mengkonstruksi
selang kepercayaan mean populasi.
6. Interpretasikan hasilnya.
CONTOH 11—Mengkonstruksi Selang Kepercayaan
68

Berikut ini adalah kekuatan gempa (dalam SR) yang dipilih secara
acak dari Data 3 (tersedia daring). Data 3 merupakan data gempa
bumi di Inonesia pada kuartal pertama tahun 2018 yang diperoleh
dari BMKG.
2,4 3,1 3,4 2,9 4,9 3 3 4,3
3,6 3,8 4,6 2,5 3,1 3,5 2,5
Konstruksilah selang kepercayaan untuk mengestimasi variansi dan
simpangan baku dari kekuatan gempa bumi di Indonesia pada kuartal
pertama tahun 2018.
PEMBAHASAN Pertama kita periksa persyaratan untuk membuat
selang kepercayaan variansi dan simpangan baku populasi. Seperti
yang dikatakan dalam soal, sampel tersebut merupakan sampel acak
sederhana. Untuk memeriksa apakah sampel tersebut berasal dari
populasi yang berdistribusi normal, kita gunakan uji normalitas
formal dan diagram Q-Q normal melalui SPSS, perhatikan Gambar 2-
12(a) dan (b).

(a)

(b)
Gambar 2-12
69

Dari uji normalitas formal dan diagram Q-Q normal tersebut, kita bisa
menyimpulkan bahwa sampel tersebut berasal dari populasi yang
berdistribusi normal. Dengan demikian, semua persyaratan terpenuhi.

Selanjutnya kita tentukan variansi sampel s2, nilai kritis kiri c I2 dan
nilai kritis kanan c I2 berderajat bebas df = n – 1 = 14 dengan
menggunakan teknologi, sehingga diperoleh

s2 = 0,58, c I2 = 5,629, c A2 = 26,119

Kita substitusi nilai-nilai tersebut pada selang kepercayaan seperti


berikut.

(n - 1)s 2 (n - 1)s 2
< s2 <
c A2 c I2
(15 - 1) × 0,58 (15 - 1) × 0,58
< s2 <
26,119 5,629
0,3109 < s 2 < 1, 4425
Dengan mengakarkan semua ruas, kita peroleh selang kepercayaan
untuk simpangan baku.
0,5576 < s < 1,2011
Berikutnya kita bulatkan selang kepercayaan tersebut menjadi dua
angka di belakang koma (karena data aslinya memuat satu angka di
belakang koma) untuk mendapatkan

0,31 < s 2 < 1, 44 dan 0,56 < s < 1,20

INTERPRETASI Berdasarkan hasil ini, kita 95% yakin bahwa variansi


populasi berada di antara 0,31 dan 1,44, sedangkan simpangan baku
populasi bernilai di antara 0,56 dan 1,20.
Kerjakan Latihan 17 n

Menentukan Ukuran Sampel. Tidak seperti ketika kita menentukan


ukuran sampel untuk mengestimasi proporsi atau mean populasi,
70

penentuan ukuran sampel untuk mengestimasi variansi atau


simpangan baku populasi lebih kompleks. Akan tetapi kita bisa
menggunakan Minitab untuk menentukan ukuran sampel. Untuk
melakukannya, pada baris menu klik Stat, Power and Sample Size,
kemudian pilih Sample Size for Estimation, dan pilih Standard
Deviation (normal) atau Variance (normal). Untuk menentukan
ukuran sampel dalam Minitab tersebut, kita akan diminta untuk
memasukkan perkiraan simpangan baku (atau variansi) dan batas
galat yang diinginkan. Sebagai contoh, kita dapat menentukan ukuran
sampel untuk mengestimasi simpangan baku dengan menginginkan
batas galat 5 dan perkiraan simpangan bakunya 50. Gambar 2-13
berikut menampilkan hasil perhitungan yang dilakukan Minitab.

Gambar 2-13
Dengan demikian, kita memerlukan sampel dengan ukuran sekitar
234 untuk mengestimasi simpangan baku yang nilai diperkirakan 50
dengan batas galat 5.

2.4 Metode Estimasi dengan Teknologi: Bootstrap


Metode-metode konstruksi selang kepercayaan yang telah dibahas
sebelumnya memerlukan persyaratan terkait normalitas data.
Konstruksi selang kepercayaan untuk proporsi dan mean memerlukan
sampel yang berasal dari populasi berdistribusi normal atau sampel
yang berukuran cukup besar, yaitu n ≥ 30. Persyaratan yang lebih
ketat muncul ketika kita membuat selang kepercayaan variansi atau
simpangan baku, yaitu sampel yang digunakan harus berasal dari
populasi yang berdistribusi normal, meskipun sampel tersebut
berukuran besar.
71

Masalah muncul ketika data sampel yang kita miliki tidak memenuhi
persyaratan-persyaratan yang telah disebutkan. Untuk mengatasi
permasalahan ini, kita bisa menggunakan metode bootstrap, yaitu
metode simulasi pensampelan ulang dari data yang telah kita miliki.
Metode ini tidak memerlukan sampel yang berasal dari distribusi
normal ataupun distribusi tertentu lainnya. Oleh karena itu, metode
ini disebut metode nonparametrik atau metode bebas distribusi.
Seperti yang telah disebutkan, metode ini melakukan pensampelan
ulang dari data awal untuk mendapatkan sampel-sampel bootstrap.
DEFINISI
Diberikan sampel acak sederhana berukuran n, sampel bootstrap
adalah sampel berukuran n yang nilai-nilai di dalamnya diperoleh
dengan mengambil secara acak dengan pengembalian dari nilai-nilai
dari sampel awal.

Ada dua catatan penting terkait bagaimana membuat sampel


bootstrap. Pertama, ukuran sampel bootstrap sama dengan ukuran
sampel awal, yaitu n. Kedua, proses pengambilan dilakukan secara
acak dan dengan pengembalian. Dengan demikian, ketika suatu nilai
sampel dipilih, maka nilai tersebut dikembalikan terlebih dahulu
sebelum proses pengambilan berikutnya. Untuk lebih memahami
sampel bootstrap, perhatikan Contoh 12 berikut.
CONTOH 12—Sampel Bootstrap
Demi kesederhanaan dan kepraktisan, misalkan suatu sampel memuat
nilai-nilai 1, 2, 3, dan 4. Susunlah satu sampel bootstrap dari sampel
awal tersebut.
PEMBAHASAN Sampel bootstrap harus berukuran sama dengan
sampel awal, sehingga ukurannya adalah n = 4. Setelah dilakukan
pemilihan secara acak dengan pengembalian, salah satu kemungkinan
sampel bootstrap adalah {3, 1, 3, 4}.
72

Sampel Awal Sampel Bootstrap


1 3
2 1
3 3
4 4
Perhatikan bahwa nilai 3 bisa muncul dua kali karena setelah terpilih
pada pengambilan pertama, nilai tersebut dikembalikan lagi. Oleh
karena itu, pada pengambilan berikutnya nilai ini ada kemungkinan
terpilih kembali.
Kerjakan Latihan 18 n

Setelah memahami bagaimana menentukan sampel bootstrap,


sekarang kita sudah siap untuk membuat selang kepercayaan dengan
metode bootstrap. Prosedur untuk membuat selang kepercayaan
tersebut bisa dilakukan dengan langkah-langkah berikut.

1. Diberikan sampel acak sederhana berukuran n, buatlah banyak


sampel bootstrap (1000 atau lebih) dengan ukuran yang sama
dengan sampel awal, yaitu n.
2. Tentukan statistik dari masing-masing sampel bootstrap yang
bersesuaian dengan parameter populasi yang akan diestimasi.
3. Urutkan statistik-statistik tersebut dari yang paling kecil sampai
yang paling besar.
4. Dengan menggunakan statistik-statistik yang sudah terurut,
buatlah selang kepercayaan dengan menentukan nilai-nilai
persentil yang sesuai.

Contoh 13 berikut mendemonstrasikan bagaimana menggunakan


metode bootstrap untuk mengkonstruksi selang kepercayaan
simpangan baku populasi.
CONTOH 13—Membuat Selang Kepercayaan
73

Sebuah perusahaan air minum melakukan kontrol kualitas berkala


terkait volume air minum dalam setiap botolnya. Dalam kontrol
kualitas tersebut, mereka mengukur volume air minum dalam 10
botol secara acak dan diperoleh data sebagai berikut.
150,0 150,2 150,6 149,7 151,3
149,8 149,7 148,5 150,4 150,6
Buatlah selang kepercayaan untuk mengestimasi simpangan baku dari
volume air minum dalam semua botol dengan menggunakan metode
bootstrap.

PEMBAHASAN Pertama, kita buat 100.000 sampel bootstrap dengan


menggunakan Minitab. Tabel berikut menunjukkan 3 sampel
bootstrap pertama. Mungkin 3 sampel pertama Anda berbeda.

Sampel-Sampel Bootstrap
1 150,2 148,5 149,7 149,7 150,2 149,7 151,3 150,6 149,7 149,7
2 150,2 148,5 149,8 150,2 148,5 150,2 151,3 150,6 150,0 149,7
3 151,3 148,5 150,2 151,3 150,0 149,8 149,8 150,6 150,6 150,4

Karena kita akan mengestimasi simpangan baku populasi, maka kita


tentukan simpangan baku untuk setiap sampel-sampel bootstrap yang
terbentuk. Untuk melakukannya, kita bisa menggunakan Minitab dan
sekaligus menggambarkan histogram dari distribusi simpangan-
simpangan baku tersebut. Perhatikan Gambar 2.14.
Sekarang kita identifikasi 95% nilai yang terletak di tengah-tengah
distribusi dari 100.000 simpangan baku sampel. Dari distribusi
tersebut, dengan menggunakan Minitab kita bisa menemukan
persentil ke-2,5 adalah 0,32 dan persentil ke-97,5 adalah 1,03. Dengan
kata lain, 95% semua sampel-sampel bootstrap tersebut memiliki
simpangan baku di antara 0,32 dan 1,03. Inilah yang menjadi selang
kepercayaan simpangan baku populasi.
74

Gambar 2-14 Histogram simpangan baku sampel-sampel bootstrap


INTERPRETASI Kita 95% yakin bahwa simpangan baku volume air
dalam semua botol berada di antara 0,32 dan 1,03.
Kerjakan Latihan 19 n

2.5 Rangkuman
1. Selang kepercayaan untuk membuat selang
digunakan untuk kepercayaan mean proporsi
mengestimasi parameter dan mean, sampel tersebut
suatu populasi dengan tingkat harus berukuran cukup besar,
kepercayaan tertentu. Tingkat n ≥ 30, atau berasal dari
kepercayaan tersebut populasi yang berdistribusi
menyatakan peluang bahwa normal. Syarat yang lebih
selang kepercayaan tersebut ketat muncul dalam membuat
memuat nilai parameter yang selang kepercayaan variansi
sebenarnya. atau simpangan baku, yaitu
2. Beberapa persyaratan harus bahwa sampel harus berasal
terpenuhi untuk dari populasi yang
mengkonstruksi selang berdistribusi normal,
kepercayaan. Sampel acak meskipun ukuran sampel
sederhana merupakan syarat besar.
yang selalu muncul. Selain itu,
75

3. Ukuran sampel penting sampel tersebut berhubungan


dipertimbangkan untuk erat dengan tingkat
mengestimasi nilai parameter kepercayaan, batas galat, dan
populasi dengan selang perkiraan nilai parameter.
kepercayaan karena ukuran

Glosarium
Batas galat. Selisih maksimum Nilai kritis. Suatu nilai yang
yang mungkin antara statistik membatasi statistik-statistik
sampel dengan nilai parameter sampel yang sangat mungkin
sebenarnya dari populasi yang terjadi dengan yang sangat tidak
diperkiran. mungkin terjadi.

Derajat bebas. Banyaknya nilai- Selang kepercayaan. Suatu


nilai dalam suatu sampel yang selang yang berisi nilai-nilai yang
bisa bervariasi setelah batasan mungkin menjadi nilai
tertentu diberikan kepada semua sebenarnya dari parameter
nilai dalam sampel tersebut. populasi.

Estimasi titik. Suatu nilai yang Tingkat kepercayaan. Peluang


digunakan untuk bahwa suatu selang kepercayaan
memperkirakan parameter suatu benar-benar memuat nilai
populasi. sebenarnya dari parameter
populasi.

Pustaka
Agresti, A., & Coull, B. A. (1998). Approximate is better than “exact”
for interval estimation of binomial proportions. The American
Statistician, 52(2), 119-126.
Bonett, D. G. (2006). Approximate confidence interval for standard
deviation of nonnormal distributions. Computational Statistics &
Data Analysis, 50(3), 775-782.
76

Degree of Freedom. (2008). In The Concise Encyclopedia of Statistics.


New York, NY: Springer.
International Association for the Evaluation of Educational
Achievement (IEA). (2015). [International Database].
Unpublished raw data.
Schenker, N., & Gentleman, J. F. (2001). On judging the significance
of differences by examining the overlap between confidence
intervals. The American Statistician, 55(3), 182-186.
Sub Direktorat Statistik Rumah Tangga. (2016). Indonesia – Survei
Sosial Ekonomi Nasional 2016 Maret (KOR). Retrieved March 25,
2018, from
https://microdata.bps.go.id/mikrodata/index.php/catalog/769/

Tate, R. F., & Klett, G. W. (1959). Optimal confidence intervals for the
variance of a normal distribution. Journal of the American
statistical Association, 54(287), 674-682.
UNESCO Institute for Statistics. (2016). [Youth literacy rate,
population 15-24 years, both sexes (%)]. Unpublished raw data.

Latihan
1. Ketika memperkirakan parameter suatu populasi, apa yang Anda
pilih agar peluang Anda untuk benar semakin tinggi? Estimasi
titik atau selang keperayaan? Jelaskan.
2. Kepuasan Kerja. Anda ingin mengetahui kepuasan kerja sopir-
sopir angkutan umum di kota Anda. Anda menanyai 63 sopir
angkutan umum secara acak dan diperoleh 48 di antaranya puas
terhadap perkerjaan mereka. Tentukan estimasi titik terhadap
proporsi sopir-sopir angkutan umum di kota Anda yang puas
terhadap perkerjaan mereka.
3. Bagaimana Anda menentukan nilai kritis zα/2 pada tingkat
kepercayaan 99% dengan menggunakan tabel?
77

4. Untuk statistik-statistik sampel yang sama, tingkat kepercayaan


mana yang menghasilkan selang kepercayaan yang paling lebar?
90%, 95%, atau 99%? Jelaskan.
5. Membuat Kesimpulan. Tim peneliti ingin mengetahui pengaruh
suplemen makanan terhadap peningkatan berat badan sapi. Dari
89 sapi yang diteliti, mean peningkatan berat badannya adalah 25
kg, dan dengan tingkat kepercayaan 95%, diperoleh batas galat ±5
kg. Berdasarkan penelitian ini, beberapa mahasiswa menuliskan
kesimpulan berikut. Adakah mahasiswa yang membuat
kesimpulan dengan tepat? Jelaskan mengapa.
(a) 95% dari semua sapi yang diteliti mengalami kenaikan berat
badan 20 kg sampai 25 kg.
(b) Kita 95% yakin bahwa seekor sapi yang diberi suplemen
makanan tersebut berat badannya naik antara 20 kg sampai
25 kg.
(c) Kita 95% yakin bahwa mean kenaikan berat badan semua
sapi yang diteliti tersebut di antara 20 kg sampai 25 kg.
(d) Jika suplemen makanan tersebut diujikan pada sampel sapi
lain, peluangnya 95% bahwa berat badan sapi-sapi dalam
sampel tersebut naik antara 20 kg sampai 25 kg.
6. Koneksi Internet. Tim peneliti dari International Association for
Evaluation of Educational Achievement (IEA) pada tahun 2015
melakukan survei secara acak kepada siswa-siswa dari beberapa
negara. Berikut ini adalah banyaknya responden dalam negara-
negara tersebut yang memiliki koneksi internet di rumahnya.
Konstruksilah selang kepercayaan 95% untuk mengestimasi
proporsi populasi.
Banyak Siswa yang
Negara Memiliki Koneksi Internet Ukuran Sampel
Finlandia 4799 4973
Indonesia 834 3894
78

Jepang 3004 4355


Kuwait 2634 3268
7. Belanja Daring. Sebelum Anda memutuskan untuk membuat
toko daring, Anda ingin tahu berapa persentase orang-orang
yang telah belanja secara daring. Untuk itu, Anda akan
melakukan survei terhadap hal tersebut. Jika Anda menginginkan
tingkat kepercayaan 95% dan batas galat yang tidak lebih dari 3%,
berapa banyak orang yang harus Anda survei?
(a) Asumsikan bahwa ada survei sebelumnya yang
menunjukkan bahwa 80% orang sudah pernah belanja secara
daring.
(b) Asumsikan tidak ada informasi terkait kemungkinan
proporsi populasinya.
8. Gambar berikut adalah tampilan Minitab menunjukkan statistik
deskriptif dari suatu sampel.

(a) Identifikasi estimasi titik terbaik untuk μ dan batas galat E


dari gambar tersebut.
(b) Dalam membuat selang kepercayaan untuk mengestimasi μ,
Apakah Anda perlu memeriksa apakah sampel tersebut
berasal dari populasi yang berdistribusi normal? Jelaskan.
9. Tekanan Darah. Empat belas mahasiswa kedokteran mengukur
tekanan darah satu orang pada waktu yang berbeda-beda. Hasil
pengukurannya sebagai berikut.
143 140 135 140 120 125 120
130 130 144 138 130 130 150
79

Dengan mengasumsikan simpangan baku populasi diketahui 10


mmHg, buatlah selang kepercayaan 95% yang mengestimasi
mean populasi. Idealnya, seperti apakah selang kepercayaan
dalam permasalahan ini?
10. Media Sosial. Misalkan Anda ingin mengetahui rata-rata berapa
kali seorang remaja memeriksa akun media sosialnya dalam
sehari. Berapa remaja yang secara acak harus dipilih agar Anda
bisa membuat selang kepercayaan 95% dengan batas galat tidak
lebih dari 5. Asumsikan simpangan baku populasinya 20.
11. Deskripsikan bagaimana bentuk, pusat, dan penyebaran
distribusi t Student ketika derajat bebasnya bertambah.
12. Dengan menggunakan tabel atau teknologi, tentukan
(a) Nilai kritis tα/2 untuk selang kepercayaan 95% dengan derajat
bebas df = 7.
(b) Nilai kritis tα/2 untuk selang kepercayaan 99% dengan derajat
bebas df = 102.
13. Deskripsikan bagaimana perubahan nilai kritis tα/2 untuk tingkat
kepercayaan 95% ketika derajat bebasnya semakin besar.
14. Gempa Bumi. Berikut ini adalah kedalaman (dalam meter) titik
pusat gempat bumi yang dipilih secara acak dari Data 3. Gempa
bumi tersebut tercatat pada bulan Januari – Maret 2018.
10 50 10 20 67 10 49 47 14
Buatlah selang kepercayaan 95% untuk mengestimasi kedalaman
pusat gempa dalam kuartal pertama tahun 2018.
15. Gempa Bumi, Ditinjau Kembali. Bukalah situs web BMKG dan
carilah data mengenai gempa bumi yang disediakan situs
tersebut. Pada periode dasawarsa terakhir, pilihlah 20 kejadian
gempa bumi secara acak untuk membuat selang kepercayaan 95%
untuk mengestimasi mean kedalaman pusat gempa bumi pada
periode tersebut. Bandingkan jawabanmu dengan hasil pada
latihan nomor 14.
16. Gunakan tabel atau teknologi untuk menentukan
80

(a) Nilai-nilai kritis χ2 untuk selang kepercayaan 95% jika


ukuran sampelnya 7.
(b) Nilai-nilai kritis χ2 untuk selang kepercayaan 99% jika
derajat bebasnya 116.
17. Telepon Pintar. Berikut ini adalah daftar harga (dalam jutaan
rupiah) dua merek telepon pintar yang dipilih secara acak dari
berbagai toko daring.
iPhone 6S: 7,56 8,05 11,5 5,8 8,35 8,2 5,7 7,55
Samsung S6: 7,15 10,99 5,51 6,4 5,4 4 7,95 6,6
(a) Buatlah selang kepercayaan 95% untuk mengestimasi
simpangan baku harga iPhone 6S.
(b) Buatlah selang kepercayaan 95% untuk mengestimasi
simpangan baku harga Samsung S6.
(c) Apa yang bisa Anda katakan setelah membandingkan hasil
pada bagian (a) dan (b)?
18. Dalam membuat sampel-sampel bootstrap yang ukurannya sama
dengan sampel awal, pemilihan nilai-nilainya dilakukan secara
acak dan dengan pengembalian. Bagaimana jika pemilihan nilai-
nilai dari sampel awal tersebut dilakukan tanpa pengembalian?
19. Kuliah Daring. Dalam sebuah survei, delapan mahasiswa dipilih
secara acak dan ditanya apakah mereka pernah mengikuti kuliah
daring di luar kampusnya, dan hasilnya adalah sebagai berikut: 0,
0, 1, 0, 0, 0, 1, 0 (0 = tidak pernah, 1 = pernah). Gunakan metode
bootstrap untuk mengestimasi proporsi populasi p, proporsi
banyaknya mahasiswa yang pernah mengikuti kuliah daring di
luar kampusnya.

Umpan Balik dan Tindak Lanjut


Dalam Bab 2 kita telah mempelajari berbagai macam metode untuk
mengkonstruksi selang kepercayaan yang digunakan untuk
mengestimasi proporsi, mean, variansi, dan simpangan baku suatu
populasi. Untuk melakukan hal tersebut, kita menggunakan distribusi
81

sampling untuk statistik-statistik tersebut. Ada tiga distribusi sampling


yang kita gunakan dalam bab ini, yaitu distribusi normal, distribusi t
Student, dan distribusi chi-square.
Bagaimana mengkonstruksi selang kepercayaan untuk mengestimasi
proporsi populasi sudah kita bahas dalam Subbab 2.1, khususnya
dalam Contoh 3. Pada Contoh 5 dan 9 dalam Subbab 2.2 kita telah
belajar mengkonstruksi selang kepercayaan untuk memperkirakan
nilai mean suatu populasi, baik ketika simpangan baku populasi
tersebut diketahui atau tidak. Pada Subbab 2.3 kita telah membahas
bagaimana mengkonstruksi selang kepercayaan variansi atau
simpangan baku populasi. Selain selang kepercayaan, ketiga subbab
tersebut juga menjelaskan bagaimana cara menentukan ukuran
sampel jika kita ingin membuat selang kepercayaan dengan tingkat
kepercayaan dan batas galat tertentu. Contoh 4 dan 6
mendemonstrasikan hal tersebut.
Salah satu tujuan statistika inferensial untuk mengestimasi parameter
suatu populasi sudah kita lakukan dalam bab ini. Pada bab berikutnya,
kita akan mencapai tujuan lain dari statistika inferensial, yaitu
menguji suatu hipotesis atau klaim tentang suatu parameter populasi.

Anda mungkin juga menyukai