Contoh 1
Data Atribut
Kode Nama
A1 OUTLOOK
A2 TEMPERATURE
A3 HUMDITY
A4 WINDY
A5 PLAY
Atribut PLAY merupakan label/klasifikasi yang akan dicari berdasarkan dari data atribut yang diketahui.
Data Uji
Sebelum melakukan proses algoritma naive bayes, berikut adalah data uji yang akan dicari klasifikasinya.
OUTLOOK : rainy
TEMPERATURE : hot
HUMIDITY : high
WINDY : true
PLAY :?
Mencari Probabilitas
Langkah pertama dalam perhitungan naive bayes adalah mencari probabilitas setiap nilai atribut sesuai
data latih.
Page 2
Berikut probabilitas kemunculan nilai atribut label:
• OUTLOOK
o P(sunny | no) = (OUTLOOK: sunny berlabel no/ jumlah label no) (3/4) = 0.75
o P(sunny | yes) = (OUTLOOK: sunny berlabel yes/ jumlah label yes) (2/10) = 0.2
o P(cloudy | yes) = (OUTLOOK: cloudy berlabel yes/ jumlah label yes) (4/10) = 0.4
o P(rainy | yes) = (OUTLOOK: rainy berlabel yes/ jumlah label yes) (4/10) = 0.4
o P(rainy | no) = (OUTLOOK: rainy berlabel no/ jumlah label no) (1/4) = 0.25
• TEMPERATURE
o P(hot | no) = (TEMPERATURE: hot berlabel no/ jumlah label no) (2/4) = 0.5
o P(hot | yes) = (TEMPERATURE: hot berlabel yes/ jumlah label yes) (2/10) = 0.2
o P(mild | yes) = (TEMPERATURE: mild berlabel yes/ jumlah label yes) (4/10) = 0.4
o P(mild | no) = (TEMPERATURE: mild berlabel no/ jumlah label no) (2/4) = 0.5
o P(cool | yes) = (TEMPERATURE: cool berlabel yes/ jumlah label yes) (4/10) = 0.4
• HUMIDITY
o P(high | no) = (HUMIDITY: high berlabel no/ jumlah label no) (4/4) = 1
o P(high | yes) = (HUMIDITY: high berlabel yes/ jumlah label yes) (4/10) = 0.4
o P(normal | yes) = (HUMIDITY: normal berlabel yes/ jumlah label yes) (6/10) = 0.6
• WINDY
o P(false | no) = (WINDY: false berlabel no/ jumlah label no) (2/4) = 0.5
o P(false | yes) = (WINDY: false berlabel yes/ jumlah label yes) (6/10) = 0.6
o P(true | no) = (WINDY: true berlabel no/ jumlah label no) (2/4) = 0.5
o P(true | yes) = (WINDY: true berlabel yes/ jumlah label yes) (4/10) = 0.4
Page 3
OUTLOOK rainy 0.4 0.25
TEMPERATURE hot 0.2 0.5
TEMPERATURE mild 0.4 0.5
TEMPERATURE cool 0.4 0
HUMDITY high 0.4 1
HUMDITY normal 0.6 0
WINDY false 0.6 0.5
WINDY true 0.4 0.5
Pada tahap ini, setiap nilai label akan dihitung propabilitasnya berdasarkan tabel probabilitas dan nilai data
uji.
OUTLOOK(rainy) = 0.25
TEMPERATURE(hot) = 0.5
HUMIDITY(high) = 1
WINDY(true) = 0.5
OUTLOOK(rainy) = 0.4
TEMPERATURE(hot) = 0.2
HUMIDITY(high) = 0.4
WINDY(true) = 0.4
Page 4
Berdasarkan perhitungan label yang paling tinggi adalah no dengan nilai 0.0179. Sehingga hasil
klasifikasi untuk data uji adalah no.
Contoh 2
Asumsi/pendapat:
Dan apabila cuaca cerah dan kecepatan angin kencang, maka apakah orang akan berolahraga?
P( X1=cerah,X3=kencang | Y=ya )
= { P(X1=cerah|Y=ya).P(X3=kencang|Y=ya) } . P(Y=ya)
Page 5
= { (1) . (1/4) } . (4/6) = 1/6.
P( X1=cerah,X3=kencang | Y=tidak )
= { P(X1=cerah|Y=tidak).P(X3=kencang|Y=tidak) } . P(Y=tidak)
Page 6