Anda di halaman 1dari 44

Estimasi

(Pendugaan)

Kelompok 5
Seta Aji Dwi Anggara (20170120145)
Leviana Noer Ramadhani (20170120105)
Radya Yudha Nugroho (20170120146)
Muh Fauzi Ramadhan (20170120162)
Daftar Isi
• Teori Estimasi
• Estimasi Rerata,
• Proporsi, dan Varians
• Metode Estimasi Bayes
• Teori Keputusan
• Resum jurnal
• Daftar pustaka
Teori Estimasi
Teori Estimasi (Pendugaan) dikenal dengan 2 jenis yaitu :
• Estimasi Titik (Pendugaan Titik)
• Bila nilai parameter
  dari populasi hanya diduga dengan memakai satu
nilai statistik  dari sampel yang diambil dari populasi tersebut
• Estimasi Interval (Pendugaan Interval)
• Bila nilai parameter  dari populasi diduga dengan memakai beberapa  nilai
statistik  (topi) yang berada dalam suatu interval, misalnya 1 <  <  2
Metide estimasi
Estimasi Titik
• Estimasi titik untuk  • Estimasi titik untuk P

X 
 X  X
p
n n
• Estimasi titik untuk 2

S 2

 (X  X ) 2

n 1
Estimasi Interval
• Estimasi Interval (Pendugaan Interval)
Bila nilai parameter  dari populasi diduga dengan memakai beberapa  nilai
statistik  (topi) yang berada dalam suatu interval, misalnya 1 <  <  2
Estimasi Mean Populasi
Terdapat beberapa hal yg terlebih dahulu harus diperhatikan yaitu:
1. Ukuran sampel (apakah besar n>30 atau kecil n<30)
2. Informasi tentang distribusi populasinya (apakah distribusi normal
atau tidak)
3. Deviasi standard populasinya (diketahui atau tidak)
4. Pemilihan jenis distribusi yang menjadi dasar estimasi.
Mengestimasi Mean jika Deviasi Standard diketahui dan
Jumlah Data Lebih dari 30 (n>30)
• Jika anggota populasinya tak terhingga:
x
x 
n
• Jika anggota populasinya terhingga sejumlah N:
x N n
x 
n N 1
• Selanjutnya estimate interval mean populasi dapat dibentuk
dengan cara:
x  z x   x  x  z x
Contoh soal
Seorang manajer di perusahaan kertas “papirus” ingin mengestimasi
waktu rata-rata yg dibutuhkan oleh sebuah mesin baru untuk
memproduksi satu rim kertas. Suatu sampel acak sejumlah 36 rim
menunjukkan bahwa rata-rata waktu yg dibutuhkan adalah 1,5 menit
untuk setiap rimnya. Informasi dari perusahaan pembuat mesin
menyatakan bahwa deviasi standard dari waktu produksi adalah 0,3
menit dan manajer itu mengasumsikan hal yg sama dalam
estimasinya. Maka tentukanlah estimate interval dg tingkat
kepercayaannya 95 %!
Jawab
X = 1,5 ;  x = 0,3 ; n = 36 ; tingkat kepercayaan = 95%
Error standard-nya:
x 0,3
x    0,05
n 36
TK = 95 %, maka dengan melihat tabel nilai z = 1,96.
Jadi estimate interval dari nilai rata-rata sesungguhnya adalah:
x  z x   x  x  z x
1,5  (1,96)(0,05)   x  1,5  (1,96)(0,05)
1,402   x  1,598

Dengan kata lain, sang manajer mengestimasi dengan tingkat keyakinan 95 %


bahwa waktu rata-rata untuk memproduksi 1 rim kertas
dengan mesin yang baru tersebut adalah antara 1,402 menit sampai 1,598 menit.
Mengestimasi Mean jika Deviasi Standard Tidak
diketahui dan Jumlah Data Lebih dari 30 (n>30)
Jadi deviasi standard populasi harus diestimasi juga bersama-sama dengan
mean populasinya:

( x  x ) 2
s
n 1
Error standard dapat diestimasi dengan
s
• Jika anggota populasinya tak terhingga:  x 
n
s N n
x 
• Jika anggota populasinya terhingga sejumlah N: n N 1
• Selanjutnya estimate interval mean populasi dapat dibentuk dengan cara :
x  z x   x  x  z x
Contoh Soal
Data pengujian kekuatan tarik dari 40 sampel jenis logam adalah
923 1051 1090 1141 1162 1196 1225 1264 1302 1368
924 1051 1094 1146 1163 1197 1231 1270 1303 1393
931 1055 1095 1146 1170 1200 1233 1273 1312 1399
939 1055 1106 1150 1171 1205 1233 1273 1314 1406
Maka estimasi rata-rata kekuatan tarik sesungguhnya (populasi) dari
logam tersebut dapat dihitung dg tingkat kepercayaan 90% yaitu:
 923  924  931  ...  1399  1406
x  1179
40
(923  1179) 2  (924  1179) 2  ...  (1399  1179) 2  (1406  1179) 2
s  128
40  1
s 128
x    20,24
n 40
Dengan TK = 90%, nilai z = 1,645.
Jadi estimasi interval dari kekuatan rata-rata sesungguhnya adalah:

x  z x   x  x  z x
1179  (1,645)(20,24)   x  1179  (1,645)(20,24)
1145,705   x  1212,295
Mengestimasi Mean dengan Ukuran Sampel Kurang dari
30 (n<30)
Estimate interval dari mean populasinya berbentuk:
x  t  x   x  x  t  x
2 ,v 2 ,v
t
2 ,v = nilai kritis t yg tergantung pada tingkat kepercayaan dan
derajat kebebasan
α = 1 – tingkat kepercayaan (sering disebut chance of error)
V = derajat kebebasan (df) = n - 1
Contoh Soal
Pengukuran temperatur ruang pemanas 5 buah oven sejenis, yg
dilakukan setelah beberapa waktu lamanya pemanasan dilakukan sampai
bacaan temperatur stabil (sesuai kondisi operasi yg ditetapkan),
menunjukkan nilai sebagai berikut (dalam derajat celsius): 101, 88, 94,
96, dan 103.
Estimasikan temperatur rata-rata ruang pemanas sesungguhnya
(populasi) dari oven jenis tersebut dengan tingkat kepercayaan 95 % !
Jawab
 101  88  94  96  103
x  96,4
5

(101  96,4) 2  (88  96,4) 2  (94  96,4) 2  (96  96,4) 2  (103  96,4) 2
s  5,94
5 1
α = 1 – 95% = 5% = 0,05
Derajat kebebasan (df), v = n – 1 = 5 – 1 = 4
Dari tabel distribusi t, t0.025, 4 = 2,766
Estimate interval mean populasi:
x  t0.025, 4 x   x  x  t0.025, 4 x
96,4  (2,766)(2,66)   x  96,4  (2,766)(2,66)
89,02   x  103,78
Estimasi Proporsi Populasi
Sampel ukuran besar dg kriteria np (perkalian ukuran sampel dengan
persentase sampel) >_500 (distribusi samplingnya membentuk distribusi normal).
Error standard dapat diestimasi dengan cara
• Jika anggota populasi tak terhingga
 p (100  p )
p
n
• Jika anggota populasi terhingga sejumlah N
 p (100  p ) N  n
p
n N 1
• Selanjutnya

estimate interval persentase populasi dapat dibentuk sebagai:
p  z p    p  z p
Contoh Soal
Suatu jajak pendapat terhadap konsumen merupakan salah satu
contoh pemakaian interval persentase populasi. Misalkan suatu jajak
pendapat pada 1200 orang memiliki kendaraan, menunjukkan bahwa
532 orang diantaranya memilih menggunakan minyak pelumas lokal,
sementara sisanya menggunakan minyak pelumas import.
Estimasikan persentase populasi pemakai minyak pelumas lokal
dengan tingkat keyakinan 95% !
Jawab
n = 1200; p = 532/1200 = 44,33%; TK = 95%;
 p (100  p ) 44,33(100  44,33)
p   1,43
n 1200

Dengan TK 95%, nilai z = 1,96; sehingga estimate intervalnya adalah:


 
p  z p    p  z p
44,33  1,96(1,43)    44,33  1,96(1,43)
41,53    47,13
Jadi dari populasi pemilik kendaraan diperkirakan pemakai minyak pelumas lokal antara
41,53% sampai 47,13%.
Estimasi Varians Populasi
Sangat diperlukan untuk mengetahui sejauh mana
sebaran nilai parameter sehingga dapat dijadikan untuk
mengambil langkah-langkah dalam mengendalikannya.
Misalnya: yang berkaitan dengan suatu tingkat kualitas
produk, diinginkan agar bukan hanya rata-rata nilai
parameternya yg memenuhi suatu persyaratan tetapi juga
konsistensi dari nilai tersebut harus bisa terjamin.
Estimasi Varians Populasi
Estimasi interval varians populasi berbentuk:
vs 2 vs 2
 x 
2

  / 2 ,v
2
12 / 2,v
Dimana:
2 / 2,v = nilai kritis  2 yg tergantung tingkat kepercayaan dan derajat
kebebasan
α = 1 – tingkat kepercayaan (sering disebut chance of error)
v = derajat kebebasan (df) = n – 1
Contoh Soal
Suatu mesin pengisi gandum ke dalam kemasan dirancang
untuk bekerja mengisi gandum ke dalam kotak rata-rata
sebanyak 25 kg. Suatu pemeriksaan terhadap 15 kotak
menunjukkan bahwa deviasi standard pengisian gandum itu
adalah 0,0894 kg.
Estimasikan deviasi standard populasi dengan tingkat
kepercayaan 95% !
Jawab
s = 0,0894 -> 𝑠 2 = 0,008 ; n =15; v = n-1 = 14;
TK 95% -> α = 1 – 0,95 = 0,05
Estimate interval variansnya adalah:
14(0,008) 14(0,008)
 x 
2

 2
0.025,14  02.975,14
Dengan menggunakan tabel  2
diperoleh:

14(0,008) 14(0,008)
 x 
2

26,1 5,63
0,0043   x  0,0199
2

0,066   x  0,141
Metode Estimasi Bayes
Naive Bayes merupakan sebuah Naive Bayes didasarkan pada asumsi
pengklasifikasian probabilistik sederhana penyederhanaan bahwa nilai atribut
yang menghitung sekumpulan probabilitas secara kondisional saling bebas jika
dengan menjumlahkan frekuensi dan diberikan nilai output. Dengan kata lain,
kombinasi nilai dari dataset yang diberikan nilai output, probabilitas
diberikan. Algoritma mengunakan teorema mengamati secara bersama adalah produk
Bayes dan mengasumsikan semua atribut dari probabilitas individu[8]. Keuntungan
independen atau tidak saling penggunaan Naive Bayes adalah bahwa
ketergantungan yang diberikan oleh nilai metode ini hanya membutuhkan jumlah
pada variabel kelas. Definisi lain data pelatihan (Training Data) yang kecil
mengatakan Naive Bayes merupakan untuk menentukan estimasi paremeter
pengklasifikasian dengan metode yang diperlukan dalam proses
probabilitas dan statistik yang dikemukan pengklasifikasian. Naive Bayes sering
oleh ilmuwan Inggris Thomas Bayes, yaitu bekerja jauh lebih baik dalam kebanyakan
memprediksi peluang di masa depan situasi dunia nyata yang kompleks dari
berdasarkan pengalaman di masa pada yang diharapkan.
sebelumnya.
Persamaan Metode
Naive Bayes
Di mana :
• X :Data dengan class yang belum
diketahui
• H : Hipotesis data merupakan suatu
class spesifik
• P(H|X) :Probabilitas hipotesis H
berdasar kondisi X (posteriori
probabilitas)
• P(H) : Probabilitas hipotesis H (prior
probabilitas)
• P(X|H) :Probabilitas X berdasarkan
kondisi pada hipotesis H
• P(X) : Probabilitas X
Teori Keputusan
Setiap pengambilan keputusan selalu akan menghadapai empat
keadaan, yaitu :
a) Kepastian (certainty)
b) Ketidakpastian (uncertainty)
c) Risiko (risk)
d) Konflik (conflict)
• Teori keputusan dalam ilmu statistik berhubungan dengan resiko
dan ketidak pastian.
• Keputusan dengan kondisi kepastian terjadi apabila semua
informasi yang dijadikan dasar keputusan tersedia dan valid atau
informasi bersifat sempurna dan tidak bias.
• Keputusan dalam kondisi ketidak pastian menunjukkan kondisi
suatu keputusan tidak mempunyai informasi yang sempurna dan
probabilitas suatu kejadian tidak diketahui.
• Keputusan dalam kondisi beresiko terjadi apabila suatu keputusan
tidak mempunyai informasi yang sempurna, namun mempunyai
kemungkinan atau probabilitas suatu peristiwa akan terjadi.
Setiap keputusan dalam statistika mempunyai elemen yang terdiri
dari :
a) tindakan atau alternatif yang tersedia
b) state of nature yaitu peristiwa atau kejadian yang tidak dapat
dihindati atau dikendalikan oleh pengambil keputusan
c) hasil atau payoff dari setiap alternatif keputusan
Pengambilan keputusan Beresiko, memperhatikan:
a) nilai yang diharapkan (expected value-EV). Nilai EV yang tinggi
merupakan keputusan yang terbaik.
b) memperhatikan kehilangan kesempatan terbaik (expected
opportunity loss-EOL). Nilai dengan EOL terendah adalah keputusan
yang terbaik.
c) memperhatikan informasi yang sempurna (expected value of
perfect informations-EVPI). EVPI memperhatikan faktor informasi
yang sempurna sehingga dapat mengoptimalkan tingkat keuntungan
Pengambilan keputusan dalam Ketidakpastin, beberapa cara untuk
mengambil keputusan diantaranya :
a) Kriteria Laplace yaitu memberikan probabilitas yang sama
terhadap setiap kejadian.
b) Kriteria Maximin yaitu memilih peristiwa yang pesimis dan
memilih alternatif yang terbaik.
c) Kriteria Maximax yaitu memilih peristiwa yang optimis dan
memilih alternatif yang terbaik.
d) Kriteria Hurwicz yaitu membuat koefisien optimis yang
mengukur berapa keyakinan terhadap peristiwa optimis dan
sebaliknya pesimis.
e) Kriteria Regret yaitu menentukan hasil dengan opportunity loss,
dan mencari nilai yang terendah dari regret maksimum.
Salah satu alat yang digunakan untuk mengambil keputusan dalam
teori keputusan adalah “Diagram Pohon Keputusan / Decision Tree”
yang berguna untuk menyusun beberapa alternatif dengan hasil
bersyarat (conditonal payoff), keputusan yang terbaik adalah dengan
nilai EV yang tertinggi
Implementasi Metode Klasifikasi
Naïve Bayes Dalam Memprediksi
Besarnya Penggunaan Listrik
Rumah Tangga
Ringkasan Jurnal
Tujuan
Memprediksi besarnya penggunaan listrik tiap rumah tangga agar
lebih mudah mengatur penggunaan listrik dari 60 data penggunaan
listrik rumah tangga yang diuji dengan Metode Naïve Bayes
Metode
1. Analisis Masalah dan Studi Literatur
Tahap ini adalah langkah awal untuk menentukan rumusan masalah dari penelitian.
Dalam hal ini mengamati permasalahan yang berhubungan dengan faktor-faktor
penyebab besarnya pemakaian listrik rumah tangga.
2. Mengumpulkan Data
Prosedur sistematik yang digunakan untuk mengumpulkan data yaitu dengan
mengajukan pertanyaan-pertanyaan kepada responden
3. Implementasi dan Pengujian
Sesuai dengan pengolahan data maka pada tahap implementasi adalah tentang
bagaimana pengolahan datanya diterapkan dalam sebuah tools. Tools yang akan
digunakan dalam implementasi penelitian ini adalah dengan menggunakan Software
Weka. Selanjutnya Pengujian dilakukan untuk mengetahui apakah penelitian yang
dilakukan telah sesuai dengan tujuan yang diharapkan.
Hasil dan Pembahasan
Naive Bayes didasarkan pada asumsi penyederhanaan bahwa
nilai atribut secara kondisional saling bebas jika diberikan nilai output.
Dengan kata lain, diberikan nilai output, probabilitas mengamati
secara bersama adalah produk dari probabilitas individu. Keuntungan
penggunaan Naive Bayes adalah bahwa metode ini hanya
membutuhkan jumlah data pelatihan (Training Data) yang kecil untuk
menentukan estimasi paremeter yang diperlukan dalam proses
pengklasifikasian. Dalam metode Naive Bayes data String yang
bersifat konstan dibedakan dengan data numerik yang bersifat
kontinyu, perbedaan ini akan terlihat pada saat menentukan nilai
probabilitas setiap kriteria baik itu kriteria dengan nilai data string
maupun kriteria dengan nilai data numerik. Adapun penerapan
metode Naive Bayes sebagai berikut:
Untuk menentukan data yang nantinya akan dianalisis dengan
metode Naive Bayes maka langkah pertama yang dilakukan adalah
membaca data latih
A. Kriteria dan Probabilitas
Adapun nilai probabilitas setiap kriteria sebagai berikut :
1. Probabilitas Kriteria Jumlah Tanggungan

2. Probabilitas Kriteria Luas Rumah


A. Kriteria dan Probabilitas
3. Probabilitas Kriteria Pendapatan

4. Probabilitas Daya Listrik


A. Kriteria dan Probabilitas
5. Probabilitas Perlengkapan

6. Probabilitas Penggunaan Listrik


B. Pengujian Metode Naïve Bayes
Dari nilai-nilai probabilitas tersebut akan diuji data sebanyak 60 data dan
diselesaikan dengan menggunakan tools weka sehingga dihasilkan hasil klasifikasi
penggunaan listrik seperti berikut :
Kesimpulan
Berdasarkan penelitian tentang memprediksi penggunaan listrik
rumah tangga dapat ditarik beberapa kesimpulan sebagai berikut :
1. Metode Naive Bayes memanfaatkan data training untuk
menghasilkan probabilitas setiap kriteria untuk class yang berbeda,
sehingga nilai-nilai probabilitas dari kriteria tersebut dapat
dioptimalkan untuk memprediksi penggunaan listrik berdasarkan
proses klasifikasi yang dilakukan oleh metode Naive Bayes itu
sendiri.
2. Berdasarkan data rumah tangga yang dijadikan data training,
metode Naive Bayes berhasil mengklasifikasikan 47 data dari 60 data
yang diuji. Sehingga metode Naive Bayes berhasil memprediksi
besarnya penggunaan listrik rumah tangga dengan persentase
keakuratan sebesar 78,3333%.
Daftar Pustaka
• https://www.researchgate.net/publication/304284464_Implementasi
_Metode_Klasifikasi_Naive_Bayes_Dalam_Memprediksi_Besarny
a_Penggunaan_Listrik_Rumah_Tangga
• https://www.kompasiana.com/apriancos/56f3427f1393736c054e8e
65/estimasi-dan-interval-estimasi-rangkuman?page=1
• http://lautanilmumahasiswasttpln.blogspot.com/2013/06/estimasi-
mean_9.html?m=1
• https://www.google.com/amp/s/statinsi3502.wordpress.com/2013/0
5/21/estimasi-populasi-estimasi-varians/amp/
• https://id.wikipedia.org/wiki/Teorema_Bayes
• https://www.academia.edu/35171110/METODE_ESTIMASI_PARA
METER
• http://andihm.weblog.esaunggul.ac.id/2014/04/04/teori-keputusan/

Anda mungkin juga menyukai