(Pendugaan)
Kelompok 5
Seta Aji Dwi Anggara (20170120145)
Leviana Noer Ramadhani (20170120105)
Radya Yudha Nugroho (20170120146)
Muh Fauzi Ramadhan (20170120162)
Daftar Isi
• Teori Estimasi
• Estimasi Rerata,
• Proporsi, dan Varians
• Metode Estimasi Bayes
• Teori Keputusan
• Resum jurnal
• Daftar pustaka
Teori Estimasi
Teori Estimasi (Pendugaan) dikenal dengan 2 jenis yaitu :
• Estimasi Titik (Pendugaan Titik)
• Bila nilai parameter
dari populasi hanya diduga dengan memakai satu
nilai statistik dari sampel yang diambil dari populasi tersebut
• Estimasi Interval (Pendugaan Interval)
• Bila nilai parameter dari populasi diduga dengan memakai beberapa nilai
statistik (topi) yang berada dalam suatu interval, misalnya 1 < < 2
Metide estimasi
Estimasi Titik
• Estimasi titik untuk • Estimasi titik untuk P
X
X X
p
n n
• Estimasi titik untuk 2
S 2
(X X ) 2
n 1
Estimasi Interval
• Estimasi Interval (Pendugaan Interval)
Bila nilai parameter dari populasi diduga dengan memakai beberapa nilai
statistik (topi) yang berada dalam suatu interval, misalnya 1 < < 2
Estimasi Mean Populasi
Terdapat beberapa hal yg terlebih dahulu harus diperhatikan yaitu:
1. Ukuran sampel (apakah besar n>30 atau kecil n<30)
2. Informasi tentang distribusi populasinya (apakah distribusi normal
atau tidak)
3. Deviasi standard populasinya (diketahui atau tidak)
4. Pemilihan jenis distribusi yang menjadi dasar estimasi.
Mengestimasi Mean jika Deviasi Standard diketahui dan
Jumlah Data Lebih dari 30 (n>30)
• Jika anggota populasinya tak terhingga:
x
x
n
• Jika anggota populasinya terhingga sejumlah N:
x N n
x
n N 1
• Selanjutnya estimate interval mean populasi dapat dibentuk
dengan cara:
x z x x x z x
Contoh soal
Seorang manajer di perusahaan kertas “papirus” ingin mengestimasi
waktu rata-rata yg dibutuhkan oleh sebuah mesin baru untuk
memproduksi satu rim kertas. Suatu sampel acak sejumlah 36 rim
menunjukkan bahwa rata-rata waktu yg dibutuhkan adalah 1,5 menit
untuk setiap rimnya. Informasi dari perusahaan pembuat mesin
menyatakan bahwa deviasi standard dari waktu produksi adalah 0,3
menit dan manajer itu mengasumsikan hal yg sama dalam
estimasinya. Maka tentukanlah estimate interval dg tingkat
kepercayaannya 95 %!
Jawab
X = 1,5 ; x = 0,3 ; n = 36 ; tingkat kepercayaan = 95%
Error standard-nya:
x 0,3
x 0,05
n 36
TK = 95 %, maka dengan melihat tabel nilai z = 1,96.
Jadi estimate interval dari nilai rata-rata sesungguhnya adalah:
x z x x x z x
1,5 (1,96)(0,05) x 1,5 (1,96)(0,05)
1,402 x 1,598
x z x x x z x
1179 (1,645)(20,24) x 1179 (1,645)(20,24)
1145,705 x 1212,295
Mengestimasi Mean dengan Ukuran Sampel Kurang dari
30 (n<30)
Estimate interval dari mean populasinya berbentuk:
x t x x x t x
2 ,v 2 ,v
t
2 ,v = nilai kritis t yg tergantung pada tingkat kepercayaan dan
derajat kebebasan
α = 1 – tingkat kepercayaan (sering disebut chance of error)
V = derajat kebebasan (df) = n - 1
Contoh Soal
Pengukuran temperatur ruang pemanas 5 buah oven sejenis, yg
dilakukan setelah beberapa waktu lamanya pemanasan dilakukan sampai
bacaan temperatur stabil (sesuai kondisi operasi yg ditetapkan),
menunjukkan nilai sebagai berikut (dalam derajat celsius): 101, 88, 94,
96, dan 103.
Estimasikan temperatur rata-rata ruang pemanas sesungguhnya
(populasi) dari oven jenis tersebut dengan tingkat kepercayaan 95 % !
Jawab
101 88 94 96 103
x 96,4
5
(101 96,4) 2 (88 96,4) 2 (94 96,4) 2 (96 96,4) 2 (103 96,4) 2
s 5,94
5 1
α = 1 – 95% = 5% = 0,05
Derajat kebebasan (df), v = n – 1 = 5 – 1 = 4
Dari tabel distribusi t, t0.025, 4 = 2,766
Estimate interval mean populasi:
x t0.025, 4 x x x t0.025, 4 x
96,4 (2,766)(2,66) x 96,4 (2,766)(2,66)
89,02 x 103,78
Estimasi Proporsi Populasi
Sampel ukuran besar dg kriteria np (perkalian ukuran sampel dengan
persentase sampel) >_500 (distribusi samplingnya membentuk distribusi normal).
Error standard dapat diestimasi dengan cara
• Jika anggota populasi tak terhingga
p (100 p )
p
n
• Jika anggota populasi terhingga sejumlah N
p (100 p ) N n
p
n N 1
• Selanjutnya
estimate interval persentase populasi dapat dibentuk sebagai:
p z p p z p
Contoh Soal
Suatu jajak pendapat terhadap konsumen merupakan salah satu
contoh pemakaian interval persentase populasi. Misalkan suatu jajak
pendapat pada 1200 orang memiliki kendaraan, menunjukkan bahwa
532 orang diantaranya memilih menggunakan minyak pelumas lokal,
sementara sisanya menggunakan minyak pelumas import.
Estimasikan persentase populasi pemakai minyak pelumas lokal
dengan tingkat keyakinan 95% !
Jawab
n = 1200; p = 532/1200 = 44,33%; TK = 95%;
p (100 p ) 44,33(100 44,33)
p 1,43
n 1200
/ 2 ,v
2
12 / 2,v
Dimana:
2 / 2,v = nilai kritis 2 yg tergantung tingkat kepercayaan dan derajat
kebebasan
α = 1 – tingkat kepercayaan (sering disebut chance of error)
v = derajat kebebasan (df) = n – 1
Contoh Soal
Suatu mesin pengisi gandum ke dalam kemasan dirancang
untuk bekerja mengisi gandum ke dalam kotak rata-rata
sebanyak 25 kg. Suatu pemeriksaan terhadap 15 kotak
menunjukkan bahwa deviasi standard pengisian gandum itu
adalah 0,0894 kg.
Estimasikan deviasi standard populasi dengan tingkat
kepercayaan 95% !
Jawab
s = 0,0894 -> 𝑠 2 = 0,008 ; n =15; v = n-1 = 14;
TK 95% -> α = 1 – 0,95 = 0,05
Estimate interval variansnya adalah:
14(0,008) 14(0,008)
x
2
2
0.025,14 02.975,14
Dengan menggunakan tabel 2
diperoleh:
14(0,008) 14(0,008)
x
2
26,1 5,63
0,0043 x 0,0199
2
0,066 x 0,141
Metode Estimasi Bayes
Naive Bayes merupakan sebuah Naive Bayes didasarkan pada asumsi
pengklasifikasian probabilistik sederhana penyederhanaan bahwa nilai atribut
yang menghitung sekumpulan probabilitas secara kondisional saling bebas jika
dengan menjumlahkan frekuensi dan diberikan nilai output. Dengan kata lain,
kombinasi nilai dari dataset yang diberikan nilai output, probabilitas
diberikan. Algoritma mengunakan teorema mengamati secara bersama adalah produk
Bayes dan mengasumsikan semua atribut dari probabilitas individu[8]. Keuntungan
independen atau tidak saling penggunaan Naive Bayes adalah bahwa
ketergantungan yang diberikan oleh nilai metode ini hanya membutuhkan jumlah
pada variabel kelas. Definisi lain data pelatihan (Training Data) yang kecil
mengatakan Naive Bayes merupakan untuk menentukan estimasi paremeter
pengklasifikasian dengan metode yang diperlukan dalam proses
probabilitas dan statistik yang dikemukan pengklasifikasian. Naive Bayes sering
oleh ilmuwan Inggris Thomas Bayes, yaitu bekerja jauh lebih baik dalam kebanyakan
memprediksi peluang di masa depan situasi dunia nyata yang kompleks dari
berdasarkan pengalaman di masa pada yang diharapkan.
sebelumnya.
Persamaan Metode
Naive Bayes
Di mana :
• X :Data dengan class yang belum
diketahui
• H : Hipotesis data merupakan suatu
class spesifik
• P(H|X) :Probabilitas hipotesis H
berdasar kondisi X (posteriori
probabilitas)
• P(H) : Probabilitas hipotesis H (prior
probabilitas)
• P(X|H) :Probabilitas X berdasarkan
kondisi pada hipotesis H
• P(X) : Probabilitas X
Teori Keputusan
Setiap pengambilan keputusan selalu akan menghadapai empat
keadaan, yaitu :
a) Kepastian (certainty)
b) Ketidakpastian (uncertainty)
c) Risiko (risk)
d) Konflik (conflict)
• Teori keputusan dalam ilmu statistik berhubungan dengan resiko
dan ketidak pastian.
• Keputusan dengan kondisi kepastian terjadi apabila semua
informasi yang dijadikan dasar keputusan tersedia dan valid atau
informasi bersifat sempurna dan tidak bias.
• Keputusan dalam kondisi ketidak pastian menunjukkan kondisi
suatu keputusan tidak mempunyai informasi yang sempurna dan
probabilitas suatu kejadian tidak diketahui.
• Keputusan dalam kondisi beresiko terjadi apabila suatu keputusan
tidak mempunyai informasi yang sempurna, namun mempunyai
kemungkinan atau probabilitas suatu peristiwa akan terjadi.
Setiap keputusan dalam statistika mempunyai elemen yang terdiri
dari :
a) tindakan atau alternatif yang tersedia
b) state of nature yaitu peristiwa atau kejadian yang tidak dapat
dihindati atau dikendalikan oleh pengambil keputusan
c) hasil atau payoff dari setiap alternatif keputusan
Pengambilan keputusan Beresiko, memperhatikan:
a) nilai yang diharapkan (expected value-EV). Nilai EV yang tinggi
merupakan keputusan yang terbaik.
b) memperhatikan kehilangan kesempatan terbaik (expected
opportunity loss-EOL). Nilai dengan EOL terendah adalah keputusan
yang terbaik.
c) memperhatikan informasi yang sempurna (expected value of
perfect informations-EVPI). EVPI memperhatikan faktor informasi
yang sempurna sehingga dapat mengoptimalkan tingkat keuntungan
Pengambilan keputusan dalam Ketidakpastin, beberapa cara untuk
mengambil keputusan diantaranya :
a) Kriteria Laplace yaitu memberikan probabilitas yang sama
terhadap setiap kejadian.
b) Kriteria Maximin yaitu memilih peristiwa yang pesimis dan
memilih alternatif yang terbaik.
c) Kriteria Maximax yaitu memilih peristiwa yang optimis dan
memilih alternatif yang terbaik.
d) Kriteria Hurwicz yaitu membuat koefisien optimis yang
mengukur berapa keyakinan terhadap peristiwa optimis dan
sebaliknya pesimis.
e) Kriteria Regret yaitu menentukan hasil dengan opportunity loss,
dan mencari nilai yang terendah dari regret maksimum.
Salah satu alat yang digunakan untuk mengambil keputusan dalam
teori keputusan adalah “Diagram Pohon Keputusan / Decision Tree”
yang berguna untuk menyusun beberapa alternatif dengan hasil
bersyarat (conditonal payoff), keputusan yang terbaik adalah dengan
nilai EV yang tertinggi
Implementasi Metode Klasifikasi
Naïve Bayes Dalam Memprediksi
Besarnya Penggunaan Listrik
Rumah Tangga
Ringkasan Jurnal
Tujuan
Memprediksi besarnya penggunaan listrik tiap rumah tangga agar
lebih mudah mengatur penggunaan listrik dari 60 data penggunaan
listrik rumah tangga yang diuji dengan Metode Naïve Bayes
Metode
1. Analisis Masalah dan Studi Literatur
Tahap ini adalah langkah awal untuk menentukan rumusan masalah dari penelitian.
Dalam hal ini mengamati permasalahan yang berhubungan dengan faktor-faktor
penyebab besarnya pemakaian listrik rumah tangga.
2. Mengumpulkan Data
Prosedur sistematik yang digunakan untuk mengumpulkan data yaitu dengan
mengajukan pertanyaan-pertanyaan kepada responden
3. Implementasi dan Pengujian
Sesuai dengan pengolahan data maka pada tahap implementasi adalah tentang
bagaimana pengolahan datanya diterapkan dalam sebuah tools. Tools yang akan
digunakan dalam implementasi penelitian ini adalah dengan menggunakan Software
Weka. Selanjutnya Pengujian dilakukan untuk mengetahui apakah penelitian yang
dilakukan telah sesuai dengan tujuan yang diharapkan.
Hasil dan Pembahasan
Naive Bayes didasarkan pada asumsi penyederhanaan bahwa
nilai atribut secara kondisional saling bebas jika diberikan nilai output.
Dengan kata lain, diberikan nilai output, probabilitas mengamati
secara bersama adalah produk dari probabilitas individu. Keuntungan
penggunaan Naive Bayes adalah bahwa metode ini hanya
membutuhkan jumlah data pelatihan (Training Data) yang kecil untuk
menentukan estimasi paremeter yang diperlukan dalam proses
pengklasifikasian. Dalam metode Naive Bayes data String yang
bersifat konstan dibedakan dengan data numerik yang bersifat
kontinyu, perbedaan ini akan terlihat pada saat menentukan nilai
probabilitas setiap kriteria baik itu kriteria dengan nilai data string
maupun kriteria dengan nilai data numerik. Adapun penerapan
metode Naive Bayes sebagai berikut:
Untuk menentukan data yang nantinya akan dianalisis dengan
metode Naive Bayes maka langkah pertama yang dilakukan adalah
membaca data latih
A. Kriteria dan Probabilitas
Adapun nilai probabilitas setiap kriteria sebagai berikut :
1. Probabilitas Kriteria Jumlah Tanggungan