Anda di halaman 1dari 19

Naive Bayes

Algoritma klasifikasi
Kelompok
 Nasruddin
 Wira prayana

The Power of PowerPoint - thepopp.com


Naive Bayes SEARCH
Click icon to add picture

Naive Bayes
merupakan salah satu metoda pemelajaran mesin yang memanfaatkan perhitungan
probabilitas dan statistik yang dikemukakan oleh ilmuwan Inggris Thomas Bayes,
yaitu memprediksi probabilitas di masa depan berdasarkan pengalaman di masa
sebelumnya.

The Power of PowerPoint - thepopp.com


cara kerja naive bayes
No jenis kelamin status pelajar status perkawinan ipk smst 1-6 status kelulusan

1 laki-laki mahasiswa belum 3.17 tepat

2 laki-laki bekerja belum 3.30 tepat

3 perempuan mahasiswa be;lum 3.01 tepat

4 perempuan mahasiswa menikah 3.25 tepat

5 laki-laki bekerja menikah 3.20 tepat

• Penjelasan mengenai tahapan- 6 laki-laki bekerja menikah 2,50 terlambat


tahapan pengerjaan algoritma 7 perempuan bekerja menikah 3,00 terlambat
Naïve Bayes akan menggunakan
contoh berikut untuk 8 perempuan bekerja belum 2.70 terlambat
mempermudah pemahaman:
9 laki-laki bekerja belum 2.40 terlambat
• Di sebuah universitas,
terdapat data set 10 perempuan mahasiswa menikah 2,50 terlambat
mahasiswa sebagai berikut: 11 perempuan mahasiswa belum 2,50 terlambat

12 perempuan mahasiswa belum 3,50 tepat

13 laki-laki bekerja menikah 3.30 tepat

14 laki-laki mahasiswa menikah 3.25 tepat

15 laki-laki mahasiswa belum 2.30 terlambat


The Power of PowerPoint - thepopp.com
Click icon to add picture

dimana
Berpegangan pada Y = status kelulusan à kelas kejadian

rumus berikut: X1 = jenis kelamin à variabel pertama


X2 = status mahasiswa à variabel kedua
X3 = status pernikahan à variabel ketiga
X4 = IPK à variabel keempat
Click icon to add picture

• Kemudian universitas ingin menambah sebuah data sebagai


berikut:

• Universitas akan menggunakan Naïve Bayes untuk mendapatkan hasil mengenai status
kelulusan mahasiswa tersebut.
Step 1: Menghitung
probabilitas total setiap • Tahap pertama yang perlu dilakukan adalah menghitung
probabilitas total masing-masing kelas kejadian. Caranya
kelas kejadian adalah dengan membagi jumlah data kelas kejadian
dengan jumlah seluruh data di tabel.
• Untuk contoh di atas, maka perhitungan menjadi seperti
berikut:
• P(Y = tepat) = 8/15 à jumlah data kelas “tepat” pada kejadian
“status kelulusan” dibagi jumlah seluruh data
• P(Y = terlambat) = 7/15 à jumlah data kelas “terlambat” pada
kejadian “status kelulusan” dibagi jumlah seluruh data

The Power of PowerPoint - thepopp.com


Step 2: Menghitung • Tahap kedua adalah menghitung probabilitas setiap
kasus. Perhitungan dilakukan dengan menghitung jumlah
probabilitas detil variabel kasus yang terjadi di masing-masing variabel, sesuai
yang bersangkutan dengan data tambahan, dengan
dalam kelas masing-masing kelas kejadian.
• Untuk contoh di atas, maka perhitungannya adalah
sebagai berikut

The Power of PowerPoint - thepopp.com


Variabel jenis kelamin (X1):

• P(jenis kelamin = laki-laki | Y = tepat) = 5/8 à jumlah


data jenis kelamin “laki-laki” dengan kejadian status
kelulusan “tepat” dibagi jumlah data kelas “tepat”.
• P(jenis kelamin = laki-laki | Y = terlambat) = 3/7 à
jumlah data jenis kelamin “laki-laki” dengan kejadian
status kelulusan “terlambat” dibagi jumlah data kelas
“terlambat”.

The Power of PowerPoint - thepopp.com


Variabel status mahasiswa (X2)

• P(status mahasiswa = mahasiswa | Y = tepat) = 5/8 à


jumlah data status mahasiswa “mahasiswa” dengan
kejadian status kelulusan “tepat” dibagi jumlah data
kelas “tepat”.
• P(status mahasiswa = mahasiswa | Y = terlambat) =
3/7 à jumlah data status mahasiswa “mahasiswa”
dengan kejadian status kelulusan “terlambat” dibagi
jumlah data kelas “terlambat”.

The Power of PowerPoint - thepopp.com


Variabel status pernikahan (X3):

• P(status pernikahan = belum | Y = tepat) = 4/8 à


jumlah data status pernikahan “belum” dengan
kejadian status kelulusan “tepat” dibagi jumlah data
kelas “tepat”.
• P(status pernikahan = belum | Y = terlambat) = 4/7 à
jumlah data status pernikahan “belum” dengan
kejadian status kelulusan “terlambat” dibagi jumlah
data kelas “terlambat”.

The Power of PowerPoint - thepopp.com


Variabel IPK (X4):

• P(IPK = 2.70| Y = tepat) = 0/8 à jumlah data IPK


“2.70” dengan kejadian status kelulusan “tepat”
dibagi jumlah data kelas “tepat”.
• P(IPK = 2.70| Y = terlambat) = 1/7 à jumlah data IPK
“2.70” dengan kejadian status kelulusan “terlambat”
dibagi jumlah data kelas “terlambat”.

The Power of PowerPoint - thepopp.com


• Tahap ketiga adalah mengalikan semua hasil variabel
pada setiap kelas kejadian. Untuk contoh di atas, maka
Step 3: Mengalikan semua perhitungannya adalah sebagai berikut:
• Kelas kejadian status kelulusan “tepat”:
variabel kelas • P (jenis kelamin = laki-laki), (status mahasiswa =
mahasiswa), (status pernikahan = belum), (IPK =
2.70 ) | TEPAT)
= P(jenis kelamin = laki-laki |Y = tepat)
x P(status mahasiswa = mahasiswa | Y = tepat)
x P(status pernikahan = belum | Y = tepat)
x P(IPK = 2.70 | Y = tepat)
= 5/8 x 5/8 x 4/8 x 0/8 x 8/15
=0
The Power of PowerPoint - thepopp.com
• Kelas kejadian status kelulusan “terlambat”:
• P (jenis kelamin = laki-laki), (status mahasiswa =
mahasiswa), (status pernikahan = belum), (IPK = 2.70 ) |
TERLAMBAT)
= P(jenis kelamin = laki-laki |Y = terlambat)
x P(status mahasiswa = mahasiswa | Y = terlambat)
x P(status pernikahan = belum | Y = terlambat)
x P(IPK = 2.70 | Y = terlambat)
= 3/7 x 3/7 x 4/7 x 1/7 x 7/15
= 0,00699

The Power of PowerPoint - thepopp.com


• Pada tahap terakhir ini, yang perlu dilakukan hanya
membandingkan hasil akhir kelas-kelas yang ada. Hasil
atau keputusan yang diambil adalah hasil yang paling
Step 4: Membandingkan besar.
hasil antar kelas • Untuk contoh di atas, hasilnya adalah:
• P(tepat) = 0
• P(terlambat) = 0,00699
• Hasil P(terlambat) lebih besar dari P(tepat) maka
keputusannya adalah “TERLAMBAT”.

The Power of PowerPoint - thepopp.com


1. Menangani kuantitatif dan data diskrit

2. Kokoh untuk titik noise yang diisolasi, misalkan titik yang


dirata – ratakan ketika mengestimasi peluang bersyarat data.

3. Hanya memerlukan sejumlah kecil data pelatihan untuk


mengestimasi parameter (rata – rata dan variansi dari
KELEBIHAN NAIVE BAYES variabel) yang dibutuhkan untuk klasifikasi.

4. Menangani nilai yang hilang dengan mengabaikan instansi


selama perhitungan estimasi peluang

5. Cepat dan efisiensi ruang

6. Kokoh terhadap atribut yang tidak relevan


1. Tidak berlaku jika probabilitas

KEKURANGAN NAIVE kondisionalnya adalah nol, apabila nol maka

BAYES probabilitas prediksi akan bernilai nol juga

2. Mengasumsikan variabel bebas


Thank you

Anda mungkin juga menyukai