Salah satu aspek dari statistik inferensial adalah estimasi, yaitu proses
memperkirakan nilai suatu parameter dari informasi yang diperoleh dari suatu
sampel. Karena populasi dari mana nilai-nilai ini diperoleh besar, nilai-nilai ini
hanya perkiraan dari parameter yang sebenarnya dan berasal dari data yang
dikumpulkan dari sampel.
Prosedur statistik untuk memperkirakan mean populasi, proporsi, varians, dan
standar deviasi akan dijelaskan dalam bagian ini. Sebuah pertanyaan penting
dalam estimasi adalah ukuran sampel. Berapa besar sampel yang harus diambil
untuk membuat perkiraan yang akurat? Pertanyaan ini tidak mudah dijawab
karena ukuran sampel tergantung pada beberapa faktor, seperti akurasi yang
diinginkan dan kemungkinan membuat perkiraan yang benar. Pertanyaan tentang
ukuran sampel akan dijelaskan dalam bab ini juga.
Teknik statistik inferensial memiliki berbagai asumsi yang harus dipenuhi
sebelum dapat diperoleh kesimpulan yang valid. Salah satu asumsi umum adalah
bahwa sampel harus dipilih secara acak. Asumsi umum lainnya adalah bahwa
ukuran sampel harus lebih besar atau sama dengan 30 atau populasi harus
berdistribusi normal atau mendekati normal jika ukuran sampel kurang dari 30.
Tujuan utama dari bagian ini adalah untuk menunjukkan prosedur memperkirakan
nilai rata-rata populasi yang tidak diketahui ketika standar deviasi populasi
diketahui.
Misalkan seorang pimpinan perguruan tinggi (PT) ingin memperkirakan usia rata-
rata mahasiswa yang menghadiri kelas semester ini. Pimpinan PT dapat memilih
sampel acak dari 100 mahasiswa dan menemukan usia rata-rata mahasiswa ini,
katakanlah, 22,3 tahun. Dari rata-rata sampel, pimpinan PT dapat menyimpulkan
bahwa usia rata-rata semua mahasiswa adalah 22,3 tahun. Jenis estimasi ini
disebut estimasi titik.
Estimasi titik adalah estimasi nilai numerik spesifik dari suatu parameter.
Estimasi titik terbaik dari mean populasi adalah mean sampel X .
1
Penaksir yang baik harus memenuhi tiga sifat yang dijelaskan selanjutnya.
Tiga Sifat Penaksir yang Baik
1. Penaksir harus merupakan penaksir tak bias. Artinya, nilai yang diharapkan
atau rata-rata dari estimasi yang diperoleh dari sampel dengan ukuran tertentu
sama dengan parameter yang diestimasi.
2. Penaksir harus konsisten. Untuk estimator yang konsisten, dengan
bertambahnya ukuran sampel, nilai estimator mendekati nilai parameter yang
diestimasi.
3. Penaksir harus merupakan penaksir yang relatif efisien. Artinya, dari semua
statistik yang dapat digunakan untuk mengestimasi suatu parameter, estimator
yang relatif efisien memiliki varians yang paling kecil.
Pertanyaan lain kemudian muncul. Mengapa 95%? Mengapa tidak 99 atau 99,5%?
Jika Anda ingin lebih percaya diri, seperti 99 atau 99,5% percaya diri, maka Anda
harus membuat interval yang lebih besar. Misalnya, interval kepercayaan 99%
untuk usia rata-rata mahasiswa mungkin 21,7 < 𝜇 < 22,9, atau 22,3 ± 0,6. Oleh
karena itu, terjadi pertukaran. Untuk lebih yakin bahwa interval berisi rata-rata
populasi sebenarnya, Anda harus membuat interval lebih lebar.
2
Interval kepercayaan adalah estimasi interval spesifik dari parameter yang
ditentukan dengan menggunakan data yang diperoleh dari sampel dan dengan
menggunakan tingkat keyakinan spesifik dari estimasi.
Interval yang dibangun dengan cara ini disebut interval kepercayaan. Tiga
interval kepercayaan umum digunakan: interval kepercayaan 90%, 95%, dan 99%.
Teorema batas pusat menyatakan bahwa ketika ukuran sampel besar, kira-kira
95% rata-rata sampel dari sampel berukuran sama yang diambil dari suatu
populasi akan berada dalam ± 1,96 kesalahan standar rata-rata populasi, yaitu,
( )
X ± 1,96
σ
√n
akan berisi 𝜇, seperti yang akan ditunjukkan nanti. Dinyatakan dengan cara lain,
X −1,96( ) σ
√n ( )
< μ< X +1,96
σ
√n
Oleh karena itu, kita dapat 95% yakin bahwa rata-rata populasi terkandung dalam
interval tersebut ketika nilai-nilai variabel terdistribusi secara normal dalam
populasi.
Nilai yang digunakan untuk interval kepercayaan 95%, 1,96, diperoleh dari Tabel
Z. Untuk interval kepercayaan 99%, nilai 2,58 digunakan sebagai pengganti 1,96
dalam rumus.
Hubungan antara dan tingkat kepercayaan adalah bahwa tingkat kepercayaan yang
dinyatakan adalah persentase yang setara dengan nilai desimal 1−α, dan
sebaliknya. Ketika interval kepercayaan 95% akan ditemukan, α = 0,05, karena
1−0,05 = 0,95, atau 95%.
Ketika α = 0,01, maka 1− α = 1− 0,01 = 0,99, dan interval kepercayaan 99%
sedang dihitung.
3
Rumus untuk interval keyakinan dari mean untuk α (alpha) tertentu
untuk σ diketahui
X −Z α /2
σ
( )
√n
< μ< X +Z α /2
( )
σ
√n
Istilah Z α/2 ( √σn ) disebut margin of error (juga disebut error maksimum dari
penaksiran). Untuk nilai tertentu, katakanlah, = 0,05, 95% rata-rata sampel akan
berada dalam nilai kesalahan ini di kedua sisi rata-rata populasi, seperti yang
dijelaskan sebelumnya. Lihat Gambar 1.
Asumsi akan dinyatakan dalam soal-soal latihan, tetapi asumsi harus sering
diperiksa untuk melihat bahwa asumsi ini telah terpenuhi sebelum melanjutkan.
Beberapa teknik statistik disebut robust. Artinya distribusi variabel agak
menyimpang dari normalitas, dan masih dapat diperoleh kesimpulan yang valid.
4
Solusi
Estimasi titik terbaik dari mean populasi adalah 54 hari. Untuk interval
kepercayaan 95% gunakan z = 1,96.
Oleh karena itu, seseorang dapat mengatakan dengan keyakinan 95% bahwa
interval antara 52,3 dan 55,7 hari memang mengandung rata-rata populasi,
berdasarkan sampel 50 mobil.
Solusi
Estimasi titik terbaik dari mean populasi adalah 18. Tingkat kepercayaan 99%
adalah
Ukuran Sampel
Rumus untuk ukuran sampel diturunkan dari rumus margin of error.
5
di mana E adalah margin kesalahan. Jika perlu, bulatkan jawaban untuk
mendapatkan bilangan bulat.
Artinya, jika ada pecahan atau bagian desimal dalam jawaban, gunakan bilangan
bulat berikutnya untuk ukuran sampel n.
Solusi
Karena = 0,01 (atau 1 0,99), zα/2 = 2,58 dan E = 2. Substitusi ke dalam rumus :
Bulatkan nilainya menjadi 30. Oleh karena itu, agar 99% yakin bahwa perkiraan
berada dalam 2 mobil dari rata-rata yang sebenarnya, sosiolog perlu mengambil
sampel pencurian setidaknya selama 30 hari.
Jika σ diketahui dan ukuran sampel 30 atau lebih, atau populasi terdistribusi
normal jika ukuran sampel kurang dari 30, interval kepercayaan untuk rata-rata
dapat ditemukan dengan menggunakan distribusi z. Akan tetapi, seringkali nilai σ
tidak diketahui, sehingga harus diestimasi dengan menggunakan s, yaitu standar
deviasi sampel. Ketika s digunakan, terutama ketika ukuran sampel kecil, nilai
kritis lebih besar dari nilai zα/2 digunakan dalam interval kepercayaan untuk
menjaga interval pada tingkat tertentu, seperti 95%. Nilai-nilai ini diambil dari
distribusi t Student, yang paling sering disebut distribusi t.
Untuk menggunakan metode ini, sampel harus sampel acak sederhana, dan
populasi dari mana sampel diambil harus berdistribusi normal atau mendekati
normal, atau ukuran sampel harus 30 atau lebih.
6
Karakteristik Distribusi t
Misalnya, jika rata-rata dari 5 nilai adalah 10, maka 4 dari 5 nilai tersebut bebas
untuk bervariasi. Tetapi setelah 4 nilai dipilih, nilai kelima harus berupa bilangan
tertentu untuk mendapatkan jumlah 50, karena 50 ÷ 5 = 10. Oleh karena itu,
derajat kebebasannya adalah 5 − 1 = 4, dan nilai ini memberi tahu peneliti kurva t
mana yang digunakan. Simbol df (dk) akan digunakan untuk derajat kebebasan.
Derajat kebebasan untuk interval kepercayaan untuk rata-rata ditemukan dengan
mengurangkan 1 dari ukuran sampel. Artinya, df = n − 1.
Catatan: Untuk beberapa uji statistik yang digunakan kemudian dalam buku ini,
derajat kebebasan tidak sama dengan n − 1.
7
Contoh 4 :
Temukan nilai tα/2 untuk selang kepercayaan 95% ketika ukuran sampel adalah 22.
Solusi
df = 22 - 1, atau 21. Temukan 21 di kolom kiri dan 95% di baris berlabel
Confidence Intervals. Perpotongan tempat keduanya bertemu memberikan nilai
tα/2, yaitu 2.080. Lihat Gambar 3.
Gambar 3 : Tabel F
Ketika df lebih besar dari 30, mungkin berada di antara dua nilai tabel. Misalnya,
jika df = 68, nilainya antara 65 dan 70. Banyak teks mengatakan untuk
menggunakan nilai terdekat, misalnya, 68 lebih dekat ke 70 daripada 65; namun,
dalam teks ini digunakan pendekatan konservatif. Dalam hal ini, selalu bulatkan
ke bawah ke nilai tabel terdekat. Dalam hal ini, 68 dibulatkan menjadi 65.
8
sampel adalah 8°F. Tentukan selang kepercayaan 95% dari rata-rata populasi
untuk suhu.
Solusi
X = 42 s=8 n = 12
Karena kσ tidak diketahui dan s harus menggantikannya, distribusi t (Tabel F)
harus digunakan untuk selang kepercayaan. Jadi, dengan 11 derajat kebebasan, t α/2
= 2,201. Interval kepercayaan 95% dapat ditemukan dengan mengganti rumus:
Oleh karena itu, seseorang dapat yakin 95% bahwa rata-rata populasi untuk suhu
pada Hari Thanksgiving adalah antara 36,92°F dan 47,08°F.
Salah satu jenis interval kepercayaan yang paling umum adalah yang
menggunakan proporsi. Banyak studi statistik melibatkan pencarian proporsi
populasi yang memiliki karakteristik tertentu. Pada bagian ini, Anda akan belajar
bagaimana menemukan interval kepercayaan untuk suatu populasi.
Proporsi dapat diperoleh dari sampel atau populasi. Simbol berikut akan
digunakan.
p = proporsi populasi
^p (baca “p hat”) = proporsi sampel
x n−x
^p= dan q^ = atau q^ =1− ^p
n n
dimana
X = jumlah unit sampel yang memiliki karakteristik yang diinginkan
n = ukuran sampel.
Misalnya, dalam sebuah penelitian, 200 orang ditanya apakah mereka puas
dengan pekerjaan atau profesi mereka; 162 mengatakan puas. Dalam hal ini, n =
9
x 62
200, X=162, dan ^p= = = 0,81. Dapat dikatakan bahwa untuk sampel ini,
n 200
0,81 atau 81% dari mereka yang disurvei merasa puas dengan pekerjaan atau
profesinya. Proporsi sampel adalah ^p = 0,81.
Proporsi orang yang tidak menanggapi dengan baik ketika ditanya apakah mereka
n−x
puas dengan pekerjaan atau profesi mereka merupakan q^ , di mana q^ = .
n
200−62 38
Untuk survei ini, q^ = =¿ , atau 0,19, atau 19%. Jika ^p dan q^
200 200
dinyatakan dalam desimal atau pecahan, ^p + q^ = 1. Jika ^p dan q^ dinyatakan
dalam persentase, ^p+q^ 100%. Maka, berikut, bahwa q^ = 1 - ^p, atau ^p = 1 - q^ ,
ketika ^p dan q^ dalam bentuk desimal atau pecahan. Untuk sampel survei kepuasan
kerja, q^ juga dapat dicari dengan menggunakan q^ = 1- ^p, atau 1 - 0,81 = 0,19.
Alasan serupa berlaku untuk proporsi populasi; yaitu, p = 1-q, q=1-p, dan p+q=1,
jika p dan q dinyatakan dalam bentuk desimal atau pecahan. Jika p dan q
dinyatakan dalam persentase, p+q=100%, p=100% - q, dan q = 100% - p.
Solusi
Dalam hal ini, X = 45 dan n = 150.
Juga q^ dapat ditemukan dengan menggunakan rumus q^ = 1 - ^p, Dalam hal ini, q^
=1-0,30 = 0,70. Jadi 70% dari korban menggunakan beberapa tindakan pembelaan
diri terhadap penjahat.
Interval keyakinan
Untuk membangun interval kepercayaan tentang proporsi, Anda harus
menggunakan margin kesalahan, yaitu:
10
Interval kepercayaan tentang proporsi harus memenuhi kriteria n ^p ≥5 dan n q^ ≥ 5.
^p−z α /2
dengan n ^p ≥5 dan n q^ ≥ 5
√ ^p q^
n √
< p< ^p + z α / 2
^p q^
n
Solusi
Langkah 1
Tentukan ^p dan q^ .
Langkah 2
Tentukan nilai kritis.
Langkah 3
Substitusikan ke dalam rumus
11
Oleh karena itu, Anda dapat 90% yakin bahwa persentase siswa yang membayar
pendidikan perguruan tinggi mereka dengan pinjaman mahasiswa adalah antara
21,1 dan 24,9%.
Solusi
Karena zα/2 = 1,96, E = 0,02, ^p = 0,40, dan q^ = 0,60, maka
yang jika dibulatkan adalah 2305 orang untuk diwawancarai. Jadi peneliti harus
mewawancarai 2305 orang.
12
Untuk alasan ini, interval kepercayaan untuk varians dan standar deviasi adalah
diperlukan. Untuk menghitung interval kepercayaan ini, diperlukan distribusi
statistik baru. Ini disebut distribusi chi-kuadrat. Variabel chi-kuadrat mirip
dengan variabel t dalam distribusinya adalah keluarga kurva berdasarkan jumlah
derajat kebebasan. Simbol untuk chi-kuadrat adalah x 2 (huruf Yunani chi,
diucapkan “ki”). Beberapa distribusi ditunjukkan pada Gambar 4, bersama dengan
s2
derajat kebebasan yang sesuai. Distribusi chi-kuadrat diperoleh dari nilai ( n−1 ) 2
σ
ketika sampel acak dipilih dari populasi yang berdistribusi normal yang
variansnya σ 2.
Variabel chi-kuadrat tidak boleh negatif, dan distribusinya miring ke kanan. Pada
sekitar 100 derajat kebebasan, distribusi chi-kuadrat menjadi agak simetris. Area
di bawah setiap distribusi chi-kuadrat sama dengan 1,00, atau 100%.
13
Contoh 9
Tentukan nilai χ2 kanan dan χ2 kiri untuk selang kepercayaan 90% ketika n = 25.
Solusi
Untuk mencari χ2 kanan, kurangi 1 - 0,90 = 0,10; kemudian bagi 0,10 dengan 2
untuk mendapatkan 0,05. Untuk mencari χ2 kiri, kurangi 1 - 0,05 = 0,95.
Kemudian gunakan kolom 0,95 dan 0,05 dengan d.f. = n − 1 = 25 − 1 = 24. Lihat
Gambar 6.
Gambar 6 : Tabel χ2
Gambar 7 : Kurva χ2
Jika angka untuk derajat kebebasan tidak diberikan dalam tabel, gunakan nilai
terendah terdekat dalam tabel. Misalnya, untuk d.f. = 53, gunakan d.f. = 50. Ini
adalah pendekatan konservatif.
14
Rumus untuk Interval Keyakinan untuk Deviasi Standar
Ingat bahwa s2 adalah simbol untuk varians sampel dan s adalah simbol untuk
standar deviasi sampel. Jika soal memberikan deviasi standar sampel s, pastikan
untuk mengkuadratkannya saat Anda menggunakan rumus. Tetapi jika soal
memberikan varians sampel s2, jangan kuadratkan saat Anda menggunakan
rumus, karena varians sudah dalam satuan kuadrat.
Solusi
Karena = 0,05, dua nilai kritis, dengan hormat, untuk tingkat 0,025 dan 0,975
untuk 29 derajat kebebasan adalah 45,722 dan 16,047.
Substitusi ke dalam rumus:
Oleh karena itu, Anda dapat 95% yakin bahwa varians sebenarnya untuk usia
adalah antara 17,2 dan 48,9 tahun.
Untuk simpangan baku, selang kepercayaannya adalah
Oleh karena itu, Anda dapat 95% yakin bahwa standar deviasi sebenarnya dari
variabel usia adalah antara 4,1 dan 7,0 berdasarkan sampel 30 wanita.
15