3 STr A
● Konsep Estimasi
● Estimator yang baik
● Jenis-jenis Estimator
● Estimasi untuk pendugaan Rata-rata
● Estimasi untuk pendugaan Proporsi
Latar belakang
● Inferensi statistik adalah proses pengambilan kesimpulan mengenai suatu
populasi berdasarkan data sampel yang berasal dari populasi tersebut. Inferensi
statistik terdiri atas dua bagian utama, yaitu estimasi parameter dan uji hipotesis.
● Telah dijelaskan bahwa walaupun kita hanya mengambil sampel, sebenarnya
kita ingin mengetahui nilai populasi. Dalam teorema limit pusat dinyatakan
bahwa distribusi sampling terjadi jika sampel diambil berulang kali. Dalam
kenyataan sehari-hari tidak mungkin kita melakukan pengambilan sampel
berulang kali. Selain tidak mudah, juga mungkin tidak perlu karena dengan
menggunakan sifat-sifat teorema tersebut kita dapat melakukan estimasi atau
perkiraan terhadap nilai populasi.
● Estimasi adalah suatu metode dimana kita dapat memperkirakan nilai populasi
(parameter) dengan memakai nilai sampel (statistik).
Pengertian Estimasi
Estimasi merupakan suatu metode dimana kita dapat memperkirakan
nilai Populasi dengan memakai nilai sampel.
1. Tidak Bias
Maksud dari estimator yang
tidak bias adalah memiliki
nilai harapan yang
mendekati atau sama
dengan parameter yang
diestimasi.
Penduga tak bias artinya penduga yang dengan tepat mengenai sasaran, seperti
ditunjukkan oleh gambar 2 sedangkan penduga bias artinya penduga yang tidak tepat
mengenai sasaran atau disebut meleset , seperti ditunjukkan oleh gambar 3
Estimator yang baik
2. Efisien
Maksud efisien disini yaitu estimator
yang memiliki nilai variansi yang
paling kecil. Kenapa disini kita
melihat nilai variansi, karena variansi
adalah alat ukur untuk melihat variasi
suatu data.
Pada Gambar 4 untuk sample dengan E = = . Dimana 1 memiliki variansi lebih
kecil dari pada 2 dan 3, artinya disini 2 dan 3 data nya lebih beragam/bervarian
daripada 1 . Oleh karena 1 mempunyai variansi paling kecil, maka dikatakan 1
merupakan penduga yang efisien. Jadi semakin beragam suatu data maka
variasinya akan semakin besar. Sementara estimator yang baik adalah tingkat
keberagaman/variansi nya kecil.
Estimator yang baik
3. Konsisten
Estimator semakin baik sejalan
dengan ukuran sampel yang
semakin besar. Jadi jika sampel
nya besar maka estimatornya
juga semakin baik.
Pada Gambar 5 ditunjukkan bahwa ukuran sampel 1, yaitu n1, lebih kecil daripada
ukuran sampel 2, yaitu n2 , dan lebih kecil dari ukuran sampel 3, yaitu n3. Terlihat
bahwa semakin besar ukuran sampel, maka statistik penduga makin mendekati
parameter dari populasi dimana distribusi sampel konsisten bergerak kekiri.
Jenis – jenis Estimasi
Estimasi parameter adalah penaksiran (pengestimasian)
nilai parameter populasi berdasarkan data sampel.
Estimasi parameter dibedakan atas estimasi titik dan
estimasi interval.
ESTIMASI
ESTIMASI TITIK
INTERVAL
Estimasi Titik
● Titik estimasi merupakan salah satu cara untuk mengadakan estimasi terhadap
parameter populasi yang tidak diketahui (Nar: 2011). Titik estimasi ialah nilai tunggal
yang digunakan untuk mengadakan estimasi terhadap parameter populasi. Titik
estimasi yang dapat digunakan untuk mengadakan estimasi parameter populasi ialah
rata-rata sampel terhadap rata-rata populasi, proporsi sampel terhadap proporsi
● populasi, jumlah variabel tertentu yang terdapat dalam sampel untuk menaksir jumlah
variabel tersebut dalam populasi, dan varians atau simpangan baku sampel untuk
menaksir simpangan baku populasi.
µ diestimasi sama dengan
s diestimasi sama dengan
Estimasi titik ini memiliki kelemahan : kita tidak dapat mengetahui berapa
kuat kebenaran dugaan kita dan kemungkinan besar akan salah. Sehingga
kelemahan estimasi titik ini dapat dihilangkan dengan melakukan estimasi
selang/interval.
Contoh Estimasi Titik
Sebagai contoh, dari suatu penelitian ● Sebenarnya nilai populasi atau µ
terhadap suatu sampel ibu hamil di Kab bisa kita duga dari bermacam-
Cianjur dari 210 ibu didapatkan Hb rata- macam nilai di dalam sampel
rata 7,5 gr%. Jika kita menduga kadar seperti nilai median ataupn nilai
Hb ibu hamil di daerah Cianjur dengan mode atau salah satu dari nilai
estimasi titik, kita katakan kadar Hb ibu pengamatan, namun yang
hamil di Kab Cianjur adalah 7,5 gr%. dikatakan tidak bias adalah nilai
mean
Estimasi Interval/Selang
Estimasi yang lebih baik untuk disajikan pada inferensi statistik adalah estimasi interval,
yaitu pernyataan estimasi dalam suatu rentang interval dengan disertai pernyataan tingkat
keyakinan akan kebenaran pernyataan tersebut. Estimasi interval yang ideal adalah
estimasi dengan interval yang sempit (presisi tinggi) dan tingkat keyakinan yang tinggi,
namun dalam kenyataannya kedua karakteristik ini saling bertentangan: Semakin tinggi
tingkat keyakinan pengestimasian, semakin lebar interval estimasinya. Pengestimasian
dengan tingkat keyakinan sama dengan satu (= 100%) akan memiliki lebar interval tak
berhingga. Jarak dari batas tertinggi dan terendah ini ditentukan sebagai confiden interval
= confiden limit yaitu luas daerah di bawah kurva normal ditentukan dengan presentase
misalnya 90%, 95%, 99%.
Nilai parameter pada populasi menggunakan beberapa nilai statistic yang
ada pada suatu interval, misalkan dinotasikan :
2 (nilai parameter berada di antara 1 dan 2)
Atau :
X̅ - Z.SE X̅ + Z.SE
SELANG KEPERCAYAAN
Dari suatu sampel random sebanyak 100 orang ibu hamil yang diambil di Kab Cianjur
didapatkan Hb = 9,6 gr%. Simpangan baku di dalam populasi 5gr%. Dengan confiden
interval 95% akan dihasilkan kadar Hb ibu hamil di Kab Cianjur adalah:
● X mean sampel = 9,6 gr%
● n sampel = 100
●
●
= 5 gr%
● SE = 5/100 = 0,5 gr%
● CI = 95%...Z = 1,96 (Sk 95% nilai = 1,96)
9,5 gr% - 1,96 x 0,5 gr% ≤ ≤ 9,5 gr% + 1,96 x 0,5 gr%
8,52 gr% ≤ ≤ 10,48 gr%
Artinya :
1. Kita yakin 95% bahwa Hb ibu hamil di Cianjur terletak antara 8,52 gr%
sampai 10,48 gr%
2. Jika kita ambil berulang kali sampel yang besarnya 100 ibu di daerah
tersebut, maka 95% dari mean sampel-sampel tersebut berada pada nilai 8,25
gr%
● sampai 10,48 gr%.
● Dengan estimasi interval kita mengakui bahwa dengan confiden interval
95%, 90% ataupun 99% kebenaran taksiran ini benar. Dengan kata lain,
jujur diakui kemungkinan (peluang) salah adalah 100%-95% = 5% atau
10% atau 1% (dikenal sebagai ).
● Di dalam contoh di atas dinyatakan simpangan baku di dalam populasi
( diketahui. Biasanya jika kita mengambil suatu sampel jarang simpangan
baku populasi diketahui. Jika sampel yang diambil ibu hamil di Cianjur
tersebut tidak 100 ibu, tetapi 25 ibu saja dan tidak diketahui maka distribusi
●
sampling kita asumsikan berdistribusi seperti distribusi “student,t” di mana
untuk menentukan nilai “t” diperlukan, di samping juga derajat kebebasan
(degree of freedom) yang besarnya n-1…..
● Dengan demikian rumus umum menjadi :
Contoh :
Jika dari 25 ibu hamil yang diambil secara random didapatkan kadar Hb =
9 gr%, simpangan baku sampel 7,7 gr%. Maka nilai pendugaan akan
menjadi:
X̅ = 9 gr%
s = 7,7 gr%
n = 25 Ibu
SE = 7,7/√25 = 1,54 gr%
CI = 95% σ = 5%, df = 25-1 = 24 .... t = 2,064
9 gr% - 2,064 x 1,54 gr% ≤ μ ≤ 9 gr% + 2,064 x 1,54 gr%
5,82 gr% ≤ μ ≤ 12,19 gr%
Dengan demikian kita akan menyatakan kadar Hb ibu hamil di Kab
Cianjur berada pada 5,82 gr%; 12,19 gr% (CI 95%).
Rentang Interval dapat dipersempit dengan tiga cara :
1. Memperkecil confiden interval, misalnya dari 95% menjadi 90%
2. Memperbesar n (besar sampel)
3. Meningkatkan ketelitian sehingga didapatkan varian sampel yang kecil.
Estimasi / pendugaan untuk rata-rata
Pada sub bab ini akan melakukan prosedur yang serupa tetapi tujuannya adalah
untuk mengestimasi mean populasi. Untuk melakukannya menggunakan mean
sampel x sebagai estimasi titik dengan alasan sebagai berikut:
Jika n ≥ 30
Untuk Finite Population
Jika n ≥ 30
Z0 = nilai kritis
σ = simpangan baku populasi
n = ukuran sampel
xbar = mean sampel
μ = mean populasi
c. Simpangan Baku Populasi σ Tidak Diketahui
• Tetapi masalahnya adalah nilai s tersebut bisa bervariasi dari sampel ke sampel.
Akibat dari ketidakpastian nilai s tersebut, maka kita perlu melonggarkan selang
kepercayaan kita (yang mengakibatkan bertambahnya batas galat E).
• William Gosset, telah menunjukkan bahwa tidak hanya bertambahnya batas galat,
tetapi penggunaan s tersebut juga mengubah keseluruhan keluarga distribusi
sampling yang bisa digunakan.
Distribusi t Student
df (derajat bebas) = n − 1
tα/2 : nilai kritis t yang luas daerah di kanannya α/2
Soal-soal Estimasi Rata-rata
1. Telah diambil secara acak sampel yang terdiri dari 100 orang mahasiswa
sebuah universitas di Jakarta. Melalui test IQ terhadap 100 mahasiswa tersebut
diperoleh rata-rata IQ sebesar 112 dan varians 100. Dengan menggunakan
tingkat keyakinan (confidence level) sebesar 95%, tentukan interval konfidens
untuk nilai rata-rata IQ seluruh mahasiswa universitas tersebut.
2
s 100 s 10
P X Z0.5 s X Z0.5 s 1
Diketahui: n = 100 X 112 n n
Jawab:
1 – = 0.95 0.5 = 0.025 Z0.025 = 1.96 10 10
P112 1.96 112 1.96 0.95
100 100
Ditanyakan : P( . . . . . . ) = 0.95
P112 1.96 112 1 .96 0 .95
dimana
b. Kasus σ1 σ1 diketahui :
Untuk Infinite Population
σ2 = variansi populasi
dimana
c. Kasus σ1 = σ1 tidak diketahui
Untuk Infinite Population
dimana
df = n1 n2 – 2
s2 = variansi sampel
d. Kasus σ1 σ1 tidak diketahui :
Untuk Infinite Population
Untuk Finite Population
dimana
t1w1 t 2 w 2 s12 s22
t' w1 w 2
w1 w 2 n1 n2
Soal-soal Estimasi Beda Dua Rata-rata
Sampel acak yang terdiri dari 22 orang buruh perusahaan A telah diperiksa ternyata
rata-rata waktu menyelesaikan pekerjaannya per unit barang adalah 12 menit dengan
standar deviasi 2 menit. Sedangkan dari perusahaan B yang sejenis diambil sampel
acak berukuran 20, setelah diperiksa ternyata rata-rata menyelesaikan pekerjaan yang
sama adalah 11 menit dengan standar deviasi 3 menit. Tentukanlah interval keyakinan
sebesar 95% untuk mengestimasi beda rata-rata waktu penyelesaian pekerjaan semua
buruh di perusahaan A dan perusahaan B. Asumsi 1 = 2
Diketahui: n1 = 22 s = 2 n1 = 20 s = 3
Karena 1 = 2 tidak diketahui, maka digunakan rumus interval konfidens untuk
kasus C. Sehingga 1 – = 0.95 = 0.05 dengan 0.5 = 0.025 dan df = 40
dari tabel t diperoleh t0.025; df= 40 = 2.021
Kita merasa yakin sebesar 95% bahwa beda rata-rata waktu penyelesaian pekerjaan
semua buruh di perusahaan A dan perusahaan B antara – 0.58 dan 2.58 menit
Estimasi / Pendugaan Untuk
Proporsi
Proporsi sampel pˆ merupakan estimasi titik terbaik untuk proporsi populasi p.
Proporsi sampel pˆ merupakan estimasi titik terbaik untuk proporsi populasi p
karena nilai ini adalah nilai yang paling tidak bias dan paling konsisten untuk
mengestimasi p. Nilai pˆ tidak bias karena distribusi samplingnya memiliki pusat di
p. Nilai ini juga konsisten karena simpangan bakunya cenderung lebih kecil
daripada estimasi titik yang mungkin lainnya.
a. Kasus Sampel Besar (n 30)
Pada data proporsi dengan sampel berukuran besar, dsitribusi sampling nilai rata-
ratanya(=proporsinya) dapat dianggap berdistribusi normal. Misalkan dimiliki variable
random Y yang berskala dikotomi dari populasi tak terhingga, dengan proporsi ‘sukses’
dalam populasi P, dan misalkan dimiliki pula sampel acak berukuran n dari populasi tersebut
dengan proporsi’sukses’ dalam sampel P.
pˆ = proporsi sampel
b. Kasus Sampel Kecil (n 30)
Untuk Infinite Population
Untuk Finite Population
dengan df = n − 1
Soal-soal Estimasi Proporsi
Dari hasil survey yang dilakukan suatu research agency mengenai kebiasaan ibu rumah
tangga menyaksikan tayangan iklan di TV Swasta. Ternyata diperoleh hasil bahwa 76
orang dari 180 orang ibu rumah tangga yang dipilih secara acak, biasa menyaksikan
tayangan iklan paling sedikit 2 jam per minggu. Jika peneliti tersebut menggunakan
taraf konfidens sebesar 90%, maka tentukan interval estimasi seluruh ibu rumah tangga
yang biasa menyaksikan tayangan iklan paling sedikit 2 jam per minggu.
Diketahui : Misalkan X adalah ibu rumah tangga yang biasa menyaksikan tayangan
iklan paling sedikit 2 jam per hari. n = 180 dan X = 76 sehingga
1 – = 0.90 0.5 = 0.05 Z0.05 = 1.645
Ditanyakan : P( . . . p . . . ) = 0.90
p̂ (1 p̂ ) p̂ (1 p̂ )
P p̂ Z0.5 p p̂ Z0.5 1
n n
Jawab :
Kita merasa yakin sebesar 90% bahwa proporsi ibu-ibu yang biasa menyaksikan
tayangan iklan paling sedikit 2 jam per hari antara 35.9% dan 48.1%
Estimasi Beda Dua Proporsi
Kasus Sampel Besar Kasus Sampel Kecil
Dua sampel acak masing-masing terdiri 700 mahasiswa dan 500 mahasiswi yang
mengunjungi suatu bazar buku murah. Ternyata setelah kedua sampel tersebut
diperiksa, terdapat 392 mahasiswa dan 325 mahasiswi yang merasa puas dengan
adanya bazar tersebut. Tentukan interval konfidens sebesar 98% untuk
mengestimasi perbedaan proporsi mahasiswa dan mahasiswi yang merasa puas
terhadap bazar buku murah tersebut.
392
p̂ 1 0 . 56
Diketahui: n1 = 700 x1 = 392 700
325
p̂ 2 0 .65
n2 = 500 x2 = 325 500
Ditanyakan: P( … p1 – p2 … ) = 0.98
Jawab
p̂ 1(1 p̂ 1) p̂ 2 (1 p̂ 2 )
d Z0.5
n1 n2
0 .56(1 0 .56) 0 .65(1 0 .65)
d 2 .32 0 .065905969
700 500
P(p̂ 1 p̂ 2 ) d p 1 p 2 (p̂ 1 p̂ 2 ) d 1
Kita merasa yakin sebesar 98% proporsi mahasiswi yang merasa puas terhadap
bazar buku lebih besar daripada mahasiswa antara 2.4% dan 15.6%.
Menentukan Ukuran Sampel Dalam Estimasi Parameter Secara
Statistis
p (1 p ) p (1 p ) Z0.5 p (1 p
Z0.5 d Z0 .5 d n
n n d
2
Z0.5 p (1 p ) Z0 .5 p (1 p )
n n
d d
Kesimpulan
Statistik inferensial adalah statistika yang dengan segala informasi dari sample
digunakan untuk menarik kesimpulan mengenai karakteristik populasi dari mana
sample itu di ambil. Untuk menarik kesimpulan tersebut dapat dilakukan dengan dua
cara, yaitu: penaksiran parameter dan pengujian hipotesis. Estimasi merupakan suatu
metode dimana kita dapat memperkirakan nilai Populasi dengan memakai nilai sampel.
Sedangkan Estimator adalah setiap statistik (mean sampel, presentase sampel, varians
sampel, dan lain lain) yang digunakan untuk mengestimasi sebuah parameter. Terdapat
dua jenis estimasi yaitu estimasi titik dan estimasi interval/selang.Lalu estimasi
pendugaan rata-rata adalah untuk mengestimasi mean populasi dalam sampel yang
besar maupun kecil. Estimasi/pendugaan untuk proporsi Proporsi sampel merupakan
estimasi titik terbaik untuk proporsi populasi dan didalam estimasi proporsi terdapat
perhitungan untuk menentukan kasus dalam sampel besar maupun kecil.
DAFTAR PUSTAKA