Anda di halaman 1dari 28

6.

Teori Estimasi
EL2002-Probabilitas dan Statistik
Dosen: Andriyan B. Suksmono

Pendahuluan
Inferensi statistik adalah metoda untuk menarik inferensi atau membuat generalisasi dari suatu populasi. Ada dua metoda penting:
Klasik: inferensi hanya berdasar pada hasil yng diperoleh dari cuplikan acak populasi Bayesian: menggunakan pengetahuan prior subyektif mengenai sebaran populasi sebagai tambahan terhadap informasi cuplikan populasi.

Inferensi ada dua kategori:


Estimasi: Mis. Pengambilan 100 cuplikan untuk mengetahui sebaran perolehan kandidat beberapa calon Walikota Bandung. Pengetahuan ttg sebaran cuplikan akan membantu mendapatkan derajat kepercayaan hasil estimasi. Uji hipotesa: Mis. Seorang ibu rumah tangga menganggap sabun merek A lebih baik dari merek B. Setelah beberapa pengujian, akan disimpulkan hipotesanya dapat diterima atau ditolak.

6.2 Metoda Estimasi Klasik

Ruang keputusan
Estimasi dari populasi dapat berupa estimasi titik atau estimasi selang. Estimasi titik dari parameter adalah suatu nilai tunggal ^ dari statistik ^. Contoh: nilai x dari statistik X yng dihitung dari n-buah cuplikan dari populasi merupakan estimasi parameter dari populasi. (Besaran) Statistik yang dipakai seseorang untuk menentukan estimasi titik disebut estimator atau fungsi keputusan. Dngan demikian, keputusan S yang merupakan fungsi dari cuplikan acak adalah estimator dari dan estimasi s adalah tindakan yang diambilnya. DEFINISI 6.1 Himpunan semua tindakan yang mungkin, yang dapat diambil dalam permasalahan estimasi disebut sebagai ruang tindakan atau ruang keputusan. Estimator selalu memberikan kesalahan. Untuk suatu cuplikan tertentu, mis. 2, 5, 11, estimasi dari dpt menghasilkan x=6 jika dipakai mean cuplikan atau x~=5 jika dipakai median. Disini X~ menghasilkan nilai yng lebih baik. Sebaliknya, cuplikan 2, 6, 7 memberikan x=5 dan x~=6 dimana X lebih baik. Yang mana sebaiknya dipilih?

Estimator takbias dan estimator efisien


Misalkan ^ adalah estimator yang nilai ^-nya adalah estimasi titik dari parameter populasi tak diketahui . Tentu diinginkan bahwa sebaran cuplikan ^ akan memiliki mean yang sama dengan parameter yng diestimasi. Parameter yng spt ini disebut bersifat takbias.

DEFINISI 6.2 Suatu statistik ^ disebut estimator takbias dari parameter jika = E(^)= .
Dapat ditunjukkan (lihat buku) bahwa S2 adalah estimator takbias dari 2, akan tetapi S sendiri adalah estimator yang bias. Jika 1^ dan 2^ adalah dua estimator takbias dari populasi yang

sama dengan parameter , estimator dengan variansi terkecil-lah yang akan dipilih. Dengan demikian, jika 21 < 22, maka ^1 disebut lebih efisian daripada ^2.

DEFINISI 6.3 Estimator dengan nilai variansi terkecil disebut sebagai estimator yang paling efisien.

Pemilihan estimator
^1

^2

^3 ^

Dari ketiga estimator diatas, ^1 dan ^2 bersifat takbias karena sebarannya memusat di satu nilai . Dari kedua estimator tak bias tersebut, ^1 lebih efisien karena variansinya terkecil. Dengan demikian kita akan memilih ^1 sebagai estimator.

Selang estimasi
Selang estimasi dari parameter populasi adalah interval yang berbentuk ^1<<^2, dimana kedua batasnya tergantung pada statistik ^ suatu cuplikan dan juga sebarannya. Dari sebaran cuplikan ^ kita akan dapat menentukan ^1 dan ^2 sedemikian hingga P(^1< <^2) sama dengan nilai tertentu yang diinginkan. Untuk P(^1< <^2)=0.95 berarti bahwa kita memiliki peluang 0.95 untuk memilih cuplikan acak yang menghasilkan interval tsb mengandung . Selang ini disebut juga selang kepercayaan (confident interval). Artinya:
Kita percaya 95% bahwa selang yang kita pilih akan mengandung parameter populasi yang sebenarnya. Memperbesar peluang (derajat kepercayaan) menjadi 99% belum tentu memberikan informasi yang lebih baik karena akan melebarkan selang kepercayaan.

Selang kepercayaan
Pada umumnya, sebaran ^ akan memungkinkan kita menghitung suatu nilai k sedemikian hingga P(^ -k < < ^ + k)=1- , 0<<1. Selang yang dihitung dari suatu cuplikan akan disebut selang kepercayaan (1-)100%. Dengan demikian, jika =0.05 kita akan memiliki 95% selang kepercayaan; sedangkan =0.01 akan menghasilkan 99% selang kepercayaan. Bagian atau fraksi (1-) ini disebut juga koefisien kepercayaan; sedangkan kedua titik ujungnya, yakni (^-k) dan (^+k), disebut batas kepercayaan atau batas fiducial.

Estimasi Mean

Selang kepercayaan mean cuplikan


Estimator titik dari mean populasi adalah statistik X. Sebaran statistik ini berpusat pada dan variansinya lbh kecil dari estimator lain. Berdasarkan LCM, kita tahu bahwa semakin besar cuplikan akan menghasilkan variansi yang semakin kecil: 2X= 2/n. Selang kepercayaan dari populasi tersebar normal, atau jika cuplikannya cukup besar, dapat diturunkan. Dari gambar 6.3 disamping, P(-z/2 <Z<z/2) = 1 - dimana Z = (X-)/(/n), dng demikian P(-z/2 < (X-)/(/n) <z/2) = 1 - atau P[ X - z/2 (/n) <<X+z/2(/n)] = 1 -

1- /2 /2 z

-z/2

z/2

Cuplikan acak berukuran n dari suatu populasi dengan variansi 2 yang diketahui dan mean x yang dihitung akan menghasilkan (1-)100% selang kepercayaan X - z/2 (/n) < <X+z/2(/n)

SELANG KEPERCAYAAN UNTUK ; DIKETAHUI. Suatu (1)100% selang kepercayaan untuk adalah x - z/2 (/n) < < x+z/2(/n) dimana x adalah mean cuplikan berukuran n dari suatu populasi dengan variansi 2 yang diketahui dan z/2 adalah nilai sebaran normal yang menghasilkan luas /2 disebelah kanannya. Contoh 6.2: Mean dan simpangan baku dari IPK sekelompok 36 orang mahasiswa adalah 2.6 dan 0.3. Tentukan selang kepercayaan 95% dan 99% untuk nilai mean-nya. Jawab: Titik estimasi adalah x = 2.6. Karena cuplikan berukuran besar, simpangan baku dapat didekati dengan s=0.3. Nilai z yang memberikan luas daerah dibawah kurva sebesar 0.025 disebelah kanan, atau 0.975 disebelah kiri, adalah z0.025 = 1.96 (dari Tabel IV). Oleh karena itu, selang kepercayaan 95% adalah 2.6 - (1.96)(0.3/36) < < 2.6 + (1.96)(0.3/36) atau: 2.50 < < 2.70

Dengan cara yang sama, selang kepercayaan 99% memerlukan z0.005 = 2.575 dan selang kepercayaan ini adalah: 2.6 - (2.575)(0.3/36) < < 2.6 + (2.575)(0.3/36) atau: 2.47 < < 2.73 Terlihat selang ini lebih lebar dari sebelumnya.

Kesalahan estimasi
Selang kepercayaan (1-)% memberikan ketelitian estimasi titik. Jika adalah titik pusat selang, x mengestimasi tanpa kesalahan. Pada umumnya akan ada kesalahan yang besarnya adalah beda antara x dengan , dan kita percaya (1-)100% bahwa perbedaan ini kurang dari z/2(/n). error

x - z/2(/n)

x + z/2(/n)

TEOREMA 6.1 Jika x digunakan sebagai estimasi dari , kita dapat percaya (1-)100% bahwa nilai kesalahannya akan kurang dari z/2(/n)
Pada contoh 6.2, kita percaya 95% bahwa mean cuplikan x=2.6 berbeda sebesar 0.1 dari nilai sebenarnya dan percaya 99% bahwa nilainya berbeda sebesar 0.13.

Seringkali kita ingin tahu seberapa besar cuplikan yang kita inginkan untuk memastikan bahwa kesalahan estimasi dari kurang dari nilai tertentu e. Berdasarkan Teorema 6.1, kita harus memilih n sedemikian hingga z/2(/n)=e. TEOREMA 6.2 Jika x dipakai untuk mengestimasi , kita dapat percaya (1-)100% bahwa kesalahannya akan kurang dari nilai e tertentu jika jumlah cuplikannya adalah: n = (z/2/e)2 Teorema diatas dapat diterapkan jika variansi populasi diketahui, atau tersedia n30 untuk melakukan estimasi variansi tsb.

Contoh 6.3
Soal: Seberapa banyak jumlah cuplikan yang diperlukan pada contoh 6.2 jika kita ingin percaya 95% bahwa estimasi kita kurang dari 0.05? Jawab: Simpangan baku cuplikan s=0.3 diperoleh dari cuplikan asal 36 akan dipakai untuk menentukan . Sebelumnya juga telah diperoleh z/2 = 1.96, maka berdasarkan Teorema 6.2,

n = (z/2/e)2 = [(1.96)(0.3)/0.05]2 = 138.3 Dengan demikian, kita dapat percaya 95% percaya bahwa cuplikan acak sebesar 139 akan memberikan hasil estimasi x yang berbeda dibawah 0.05 dari .

Cuplikan sedikit
Bagaimana jika syarat n30 untuk menghitung variansi populasi tidak dapt dipenuhi? Gunakan sebaran T sebagai ganti sebaran Gauss! disini T =(X - )/(S/n). Prosedur lain sama dengan yang sebelumnya.
1- /2 /2 t

-t/2

t/2

Mengacu ke Gambar 6.5 diatas, nilai peluang pada daerah diarsir P(-t/2 <T< t/2 ) = 1- dimana t/2 adalah nilai t untuk derajat bebas n-1. Luas sebelah kanan nilai ini adalah /2, dan berdasarkan simetri, luas sebelah kiri dari -t/2 juga /2. Substitusi untuk T menghasilkan P(-t/2 <(X - )/(S/n)< t/2 ) = 1- P(X (t/2S) /n <<x + (t/2S) /n) = 1- dengan demikian, untuk n cuplikan, mean x dan simpangan baku s, interval kepercayaan (1-)100% diberikan oleh x (t/2s) /n << x + (t/2s) /n

Selang kepercayaan saat n<30


SELANG KEPERCAYAAN UNTUK ; TAKDIKETAHUI. Suatu selang kepercayaan (1-)100% untuk adalah x - t/2 (s/n) < < x+t/2(s/n) dimana x dan s adalah mean dan simpangan baku cuplikan berukuran n<30 dari suatu populasi yang tersebar mendekati normal, dan t/2 adalah nilai sebaran-t dengan derajat bebas sebesar v = n-1 yang menghasilkan luas /2 disebelah kanannya.

Contoh 6.4
Soal: Ada 7 kontainer serupa yang berisi asam sulfat dengan volume: 9.8, 10.2, 10.4, 9.8, 10.0, 10.2, dan 9.6 liter. Tentukan selang kepercayaan 95% untuk mean dari kontainer-2 tsb jika sebarannya mendekati normal. Jawab: Dari data yang diberikan, mean dan simpangan cuplikan sbb: x = 10.0 dan s= 0.283 Berdasarkan Tabel V, kita dapatkan t0.025 = 2.447 untuk derajat bebas v=6. Karena itu, selang kepercayaan 95% dair adalah 10.0 - (2.447)(0.283/7)< <10.0 + (2.447)(0.283/7) atau: 9.74< <10.26.

6.7 Estimasi Variansi

Pendahuluan
Estimasi takbias dari variansi populasi 2 diberikan oleh variansi cuplikan s2, maka statistik S2 disebut estimator dari 2. Selang estimasi dari 2 diberikan oleh X2 = (n-1)S2/2 Berdasarkan Teorema 5.16, statistik dari X2 akan tersebar secara chikuadrat dengan derajat bebas n-1 saat cuplikan diambil dari populasi normal. Berdasarkan Gambar 6.7 disamping, maka P ( 21-/2<X2<2/2) = 1- dimana 21-/2 dan 2/2 adalah nilai dari sebaran chi-kuadrat 1- dengan n-1 derajat bebas, dengan /2 /2 2 daerah seluas 1-/2 disebelah kiri 21-/2 0 21-/2 dan seluas /2 di kanannya. Substitusi X2 = (n-1)S2/2 menghasilkan P ( 21-/2< (n-1)S2/2 <2/2) = 1-

Selang kepercayaan 2
Pembagian dengan (n-1)S2 pada pertidaksamaan dan pengaturan suku menghasilkan P [ (n-1)S2 /2/2 < 2 < (n-1)S2 /21-/2 ] = 1- Untuk cuplikan sejumlah n, variansi cuplikan sebesar s2 dan (1)100% menghasilkan selang kepercayaan (n-1)s2 /2/2 < 2 < (n-1)s2 /21-/2 SELANG KEPERCAYAAN UNTUK 2. Suatu selang kepercayaan (1-)100% untuk variansi 2 dari populasi tersebar normal adalah (n-1)s2 /2/2 < 2 < (n-1)s2 /21-/2 dimana s2 merupakan variansi dari pencuplikan acak berukuran n, dan 2/2 dan 21-/2 menyatakan nilai sebaran chi-kuadrat dengan derajat bebas v=n-1, sehingga luas disebelah kiri dan kanannya adalah /2 dan 1- /2.

Contoh 6.12
Soal: Pencuplikan 10 buah kemasan berisi gabah (biji beras) produksi suatu perusahaan tertentu menghasilkan berat dalam decigram sbb: 46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 46.9, 45.2, dan 46.0 Tentukan selang kepercayaan 95% dari variansi berat kemasan tsb . Jawab: Tentukan terlebih dahulu variansi cuplikan, yaitu s2 = {(10)(21,273.12)-(461.2)2}/{(10)(9)} = 0.286 Untuk mendapatkan 95% selang kepercayaan, dipilih =0.05. Lalu dengan Table VI untuk derajat bebas v=9, kita temukan 20.025 = 19.023 dan 20.975 = 2.700. Substitusi ke rumus

(n-1)s2 /2/2 < 2 < (n-1)s2 /21-/2 akan menghasilkan 95% interval kepercayaan [(9)(0.286)/19.023]< 2 < [(9)(0.286)/2.700] atau 0.135< 2 <0.953

6.10 Metoda Estimasi Bayes

Pengantar
Metoda estimasi yang telah dijelaskan terdahulu didasarkan pada informasi dari cuplikan semata. Ini disebut sebagai peluang obyektif. Metoda Bayes menggabungkan informasi dari cuplikan dengan informasi lain yang diketahui atau prior. Yang demikian ini dinamakan peluang subyektif. Ilustrasi: Akan ditentukan estimasi titik parameter dari populasi f(x; ). Dalam pendekatan klasik (obyektif), maka yang dilakukan adalah mencuplik sebanyak n secara acak dan menggantikan informasi yang diperoleh ke estimator atau fungsi keputusan. Andaikan informasi tambahan tentang diberikan, misalnya bahwa sebarannya mengikuti f(). Fungsi f() disebut sebagai sebaran prior dari parameter takdiketahui yang menyatakan tingkat kepercayaan kita pada lokasi sebelum diadakan pencuplikan. Teknik Bayesian menggunakan informasi prior f() bersama dengan sebaran gabungan cuplikan f(x1,x2, ,xn; ) untuk menghitung sebaran posterior f(|x1,x2, ,xn)

Estimasi Bayes untuk


Selanjutnya f(x1,x2, ,xn; ) akan dituliskan sebagai f(x1,x2, , xn|) untuk menandakan bahwa parameter juga suatu peubah acak. Sebaran gabungan peubah acak X1, X2, , Xn dan parameter adalah f(x1,x2, ,xn; ) = f(x1,x2, ,xn|)f() Sehingga diperoleh sebaran marjinal g(x1,x2, ,xn) = f(x1,x2, ,xn; ) (diskrit) = - f(x1,x2, ,xn; )d (kontinyu) Dengan demikian sebaran posterior-nya adalah f(|x1,x2, ,xn) = f(x1,x2, ,xn, )/g(x1,x2, ,xn) DEFINISI 6.4. Nilai mean dari sebaran posterior f(|x1,x2, ,xn), yang dinyatakan sebagai *, disebut sebagai estimasi Bayes dari .

Contoh 6.15
Soal: dengan menggunakan cuplikan acak sebanyak 2 buah, lakukan estimasi perbandingan dari produk cacat p yang dibuat oleh sebuah mesin jika diketahui sebaran prior-nya adalah: p | 0.1 0.2 ----------|--------------f(p) | 0.6 0.4 Jawab: Andaikan X jumlah cacat didalam cuplikan, maka sebarannya adalah f(x|p) = b(x;n,p) = C(2,x)pxq2-x ; x=0, 1, 2 Dari kenyataan bahwa f(x,p) = f(x|p)f(p), kita bisa membuat tabel berikut f(x,p) p 0.1 0.2 x 0 0.486 0.256 1 0.108 0.128 2 0.006 0.016

Lanjutan
Dengan demikian, sebaran marjinal dari X adalah x |0 1 2 -------------|----------------------------------g(x) | 0.742 0.236 0.022 Kita bisa mendapatkan sebaran posterior dari formula f(p|x)=f(x,p)/g(x), yakni: p | 0.1 0.2 -------------|------------------f(p|x=0) | 0.655 0.345 p | 0.1 0.2 -------------|-------------------f(p|x=1) | 0.458 0.542

p | 0.1 0.2 -------------|------------------f(p|x=2) | 0.273 0.727 akhirnya diperoleh: p* = (0.1)(0.655)+(0.2)(0.345) = 0.1345, = (0.1)(0.458)+(0.2)(0.542) = 0.1542, = (0.1)(0.273)+(0.2)(0.727) = 0.1727,

jika x=0; jika x=1; jika x=2;

Latihan
Bab.5: 39; Bab.6: 9, 35, 46