DM 05 Fungsi Prediksi
DM 05 Fungsi Prediksi
DATA MINING
Ide Dasar
Misalkan ada dua jenis ikan (bandeng dan kakap) yang berjalan melalui
conveyor.
Kita diminta mengamati objek-objek tersebut lewat di conveyor secara
random dan memprediksi ikan apa yang akan lewat selanjutnya.
Akan ada dua kemungkinan: misalkan h1 mewakili ikan bandeng dan h2
mewakili ikan kakap.
Jika sebelumnya diketahui bahwa jumlah ikan bandeng dan kakap yang
ditangkap sama banyak, maka peluang munculnya kedua ikan tersebut
sama besar.
5.1 Naïve Bayes Classifier
Formula
Bentuk umum teorema Bayes:
atau
Contoh Soal 1:
Diketahui suatu kondisi sbb:
Latihan
Suatu generator telekomunikasi nirkabel mempunyai 3 pilihan tempat untuk
membangun pemancar sinyal yaitu di: Tengah kota, Kaki bukit , dan Tepi pantai,
dengan masing-masing mempunyai peluang 0.2, 0.3, dan 0.5.
Bila pemancar dibangun di tengah kota, peluang terjadi ganguan sinyal adalah
0.05. Bila pemancar dibangun di kaki bukit, peluang terjadinya ganguan sinyal
adalah 0.06. Bila pemancar dibangun di tepi pantai, peluang ganguan sinyal
adalah 0.08.
Pertanyaan:
A. Berapakah peluang terjadinya ganguan sinyal?
B. Bila diketahui telah terjadinya gangguan pada sinyal, berapa peluang bahwa
operator tsb ternyata telah membangun pemancar di tepi pantai?
5.1 Naïve Bayes Classifier
Jawaban:
Contoh Soal 2:
Diketahui suatu tabel data sebagai berikut:
5.1 Naïve Bayes Classifier
Pembahasan:
Ubah tabel data menjadi seperti berikut:
On time
= 14
Late
=2
Very late
=3
Cancelled =1
5.1 Naïve Bayes Classifier
Sehingga:
5.1 Naïve Bayes Classifier
Contoh Soal 3:
Diketahui suatu tabel data sebagai berikut:
Bagaimana jika:
Cuaca Cerah, Temperatur Dingin, Kelembaban Tinggi, dan Angin
Besar?
5.1 Naïve Bayes Classifier
End of 5.1
5.2 Decision Tree Learning
Ide Dasar
Metode pohon keputusan mengubah fakta yang sangat besar menjadi
pohon keputusan yg merepresentasikan aturan.
Pohon keputusan berguna untuk mengeksplorasi data, menemukan
hubungan tersembunyi antara sejumlah calon variabel input dengan
sebuah variabel target.
Sebuah model pohon keputusan terdiri dari sekumpulan aturan untuk
membagi sejumlah populasi yang heterogen menjadi lebih kecil, lebih
homogen dengan memperhatikan pada variabel tujuannya.
5.2 Decision Tree Learning
Formula:
n
Entropy ( S ) ( pi 2 log pi )
i 1
n
Si
Gain( S , A) Entropy ( S ) Entropy ( Si )
i 1 S
S = Himpunan kasus
A = Atribut
n = Jumlah partisi atribut A
Si = Jumlah kasus pada partisi ke-i
S = Jumlah kasus dalam S
pi = Proporsi dari Si terhadap S
5.2 Decision Tree Learning
Contoh kasus:
Terdapat suatu data seperti berikut:
Buat Latihan Ya
Buatlah pohon keputusan untuk data seperti berikut:
5.2 Decision Tree Learning
Ini jawabannya:
End of File