Anda di halaman 1dari 11

MAKALAH

KLASIFIKASI NAÏVE BAYES

Oleh :

Nama : Zahrul Mubaraq


Nim : 1757301057
Kelas : TI - 3.A
Dosen Pembimbing : Zulfan Khairil S, S.T., M.T

PROGRAM STUDI TEKNIK INFORMATIKA


JURUSAN TEKNOLOGI INFORMASI DAN KOMUNIKASI
POLITEKNIK NEGERI LHOKSEUMAWE
2020
DAFTAR ISI

DAFTAR ISI..................................................................................................2
BAB I PENDAHULUAN..............................................................................3
1.1 Latar Belakang.....................................................................................3
BAB II PEMBAHASAN...............................................................................4
2.1 Pengertian dan kegunaan Naïve Bayes.................................................4
2.2 Kekurangan dan kelebihan Naïve Bayes..............................................5
2.3 Cara kerja Naïve Bayes.........................................................................6
BAB III PENUTUP.......................................................................................10
3.1. Kesimpulan..........................................................................................10
DAFTAR PUSTAKA....................................................................................11

2
BAB I
PENDAHULUAN

1.1 Latar Belakang


Naïve Bayes merupakan metode klasifikasi yang berdasarkan
pada Teorama Bayes. Dinamakan Teorema Bayes karena disesuaikan
dengan nama penemunya, yaitu Reverend Thomas Bayes, walaupun
sebenarnya ada beberapa penelitian yang mengatakan bahwa Teorema
Bayes telah ditemukan oleh orang lain sebelum Reverend Thomas Bayes.
Metode Naive Bayes ini akan memudahkan pengguna dalam melakukan
pengklasifikasian atau pengelompokan artikel. Dokumen teks artikel
kesehatan dapat dikelompokkan berdasarkan masing-masing kategori
menggunakan klasifikasi teks dengan metode Naive
.

3
BAB II
PEMBAHASAN

2.1 Tentang Algoritma Naïve Bayes


Algoritma Naïve Bayes kurang lebih ditemukan pada pertengahan
abad ke-18. Pada saat itu, algoritma ini dikenal dengan banyak nama.
Meskipun begitu, algoitma ini populer dikenal sebagai metode
pengelompokkan teks dan pengkategorian menggunakan frekuensi kata-kata.
Sesuai namanya, algoritma Naïve Bayes disebut demikian karena cirinya
yang “naïve”, yaitu mengasumsikan bahwa setiap variabelnya independen,
bebas antara satu sama lain, tidak memiliki hubungan atau korelasi yang bisa
memengaruhi hasilnya.
Walaupun Naïve Bayes dianggap memiliki asumsi yang terlalu sederhana,
namun Naïve Bayes telah bekerja dengan baik untuk menangani masalah-
masalah nyata yang rumit. Seperti pada tahun 2004, sebuah hasil analisis
menyatakan bahwa ada alasan mengenai keakuratan Naïve Bayes yang mana
keakuratan tersebut bertentangan dengan anggapan orang-orang. Pada tahun
2006, pengklasifikasian dengan Naïve Bayes menampilkan performa dan
hasil yang lebih baik dibandingkan dengan metode-metode lain seperti
random forest dan boosted trees.

 Kegunaan Naïve Bayes


 Mengklasifikasikan dokumen teks seperti teks berita ataupun teks
akademis
 Sebagai metode machine learning yang menggunakan probabilitas
 Untuk membuat diagnosis medis secara otomatis
 Mendeteksi atau menyaring spam

4
2.2 Kekurangan dan kelebihan Naïve Bayes
 Kelebihan Naïve Bayes
 Bisa dipakai untuk data kuantitatif maupun kualitatif
 Tidak memerlukan jumlah data yang banyak
 Tidak perlu melakukan data training yang banyak
 Jika ada nilai yang hilang, maka bisa diabaikan dalam perhitungan
 Perhitungannya cepat dan efisien
 Mudah dipahami
 Mudah dibuat
 Pengklasifikasian dokumen bisa dipersonalisasi, disesuaikan dengan
kebutuhan setiap orang
 Jika digunakan dalaam bahasa pemrograman, code-nya sederhana
 Bisa digunakan untuk klasifikasi masalah biner ataupun multiclass

 Kekurangan Naïve Bayes


 Apabila probabilitas kondisionalnya bernilai nol, maka probabilitas
prediksi juga akan bernilai nol
 Asumsi bahwa masing-masing variabel independen membuat
berkurangnya akurasi, karena biasanya ada korelasi antara variabel
yang satu dengan variabel yang lain
 Keakuratannya tidak bisa diukur menggunakan satu probabilitas saja.
Butuh bukti-bukti lain untuk membuktikannya.
 Untuk membuat keputusan, diperlukan pengetahuan awal atau
pengetahuan mengenai masa sebelumnya. Keberhasilannya sangat
bergantung pada pengetahuan awal tersebut
 Banyak celah yang bisa mengurangi efektivitasnya
 Dirancang untuk mendeteksi kata-kata saja, tidak bisa berupa gambar

5
2.3 Cara kerja Naïve Bayes

Tabel 1 Contoh Data Mahasiswa

 Berpegangan pada rumus berikut:

dimana
Y = status kelulusan à kelas kejadian
X1 = jenis kelamin à variabel pertama
X2 = status mahasiswa à variabel kedua
X3 = status pernikahan à variabel ketiga
X4 = IPK à variabel keempat
 Kemudian universitas ingin menambah sebuah data sebagai berikut:

6
 Universitas akan menggunakan Naïve Bayes untuk mendapatkan hasil
mengenai status kelulusan mahasiswa tersebut.
Step 1: Menghitung probabilitas total setiap kelas kejadian
 Tahap pertama yang perlu dilakukan adalah menghitung probabilitas total
masing-masing kelas kejadian. Caranya adalah dengan membagi jumlah
data kelas kejadian dengan jumlah seluruh data di tabel.
 Untuk contoh di atas, maka perhitungan menjadi seperti berikut:
o P(Y = tepat) = 8/15 à jumlah data kelas “tepat” pada kejadian
“status kelulusan” dibagi jumlah seluruh data
o P(Y = terlambat) = 7/15 à jumlah data kelas “terlambat” pada
kejadian “status kelulusan” dibagi jumlah seluruh data
Step 2: Menghitung probabilitas detil variabel dalam kelas
 Tahap kedua adalah menghitung probabilitas setiap kasus. Perhitungan
dilakukan dengan menghitung jumlah kasus yang terjadi di masing-masing
variabel, sesuai yang bersangkutan dengan data tambahan, dengan masing-
masing kelas kejadian
 Untuk contoh di atas, maka perhitungannya adalah sebagai berikut:
o Variabel jenis kelamin (X1):
 P(jenis kelamin = laki-laki | Y = tepat) = 5/8 à jumlah data jenis
kelamin “laki-laki” dengan kejadian status kelulusan “tepat” dibagi
jumlah data kelas “tepat”
 P(jenis kelamin = laki-laki | Y = terlambat) = 3/7 à jumlah data
jenis kelamin “laki-laki” dengan kejadian status kelulusan
“terlambat” dibagi jumlah data kelas “terlambat”.
o Variabel status mahasiswa (X2)
 P(status mahasiswa = mahasiswa | Y = tepat) = 5/8 à jumlah data
status mahasiswa “mahasiswa” dengan kejadian status kelulusan
“tepat” dibagi jumlah data kelas “tepat”.
 P(status mahasiswa = mahasiswa | Y = terlambat) = 3/7 à jumlah
data status mahasiswa “mahasiswa” dengan kejadian status

7
kelulusan “terlambat” dibagi jumlah data kelas “terlambat”.

o Variabel status pernikahan (X3):


 P(status pernikahan = belum | Y = tepat) = 4/8 à jumlah data status
pernikahan “belum” dengan kejadian status kelulusan “tepat”
dibagi jumlah data kelas “tepat”.
 P(status pernikahan = belum | Y = terlambat) = 4/7 à jumlah data
status pernikahan “belum” dengan kejadian status kelulusan
“terlambat” dibagi jumlah data kelas “terlambat”.

o Variabel IPK (X4):


 P(IPK = 2.70| Y = tepat) = 0/8 à jumlah data IPK “2.70” dengan
kejadian status kelulusan “tepat” dibagi jumlah data kelas “tepat”.
 P(IPK = 2.70| Y = terlambat) = 1/7 à jumlah data IPK “2.70”
dengan kejadian status kelulusan “terlambat” dibagi jumlah data
kelas “terlambat”.

Step 3: Mengalikan semua variabel kelas


 Tahap ketiga adalah mengalikan semua hasil variabel pada setiap kelas
kejadian. Untuk contoh di atas, maka perhitungannya adalah sebagai
berikut:
o Kelas kejadian status kelulusan “tepat”:
 P (jenis kelamin = laki-laki), (status mahasiswa = mahasiswa),
(status pernikahan = belum), (IPK = 2.70 ) | TEPAT)
= P(jenis kelamin = laki-laki |Y = tepat)
   x P(status mahasiswa = mahasiswa | Y = tepat) 
   x P(status pernikahan = belum | Y = tepat)
   x P(IPK = 2.70 | Y = tepat)
= 5/8 x 5/8 x 4/8 x 0/8 x 8/15
=0

8
o Kelas kejadian status kelulusan “terlambat”:
 P (jenis kelamin = laki-laki), (status mahasiswa = mahasiswa),
(status pernikahan = belum), (IPK = 2.70 ) | TERLAMBAT)
= P(jenis kelamin = laki-laki |Y = terlambat)
   x P(status mahasiswa = mahasiswa | Y = terlambat)
   x P(status pernikahan = belum | Y = terlambat)
   x P(IPK = 2.70 | Y = terlambat)
= 3/7 x 3/7 x 4/7 x 1/7 x 7/15
= 0,00699

Step 4: Membandingkan hasil antar kelas


 Pada tahap terakhir ini, yang perlu dilakukan hanya membandingkan hasil
akhir kelas-kelas yang ada. Hasil atau keputusan yang diambil adalah hasil
yang paling besar.
 Untuk contoh di atas, hasilnya adalah:
o P(tepat) = 0
o P(terlambat) = 0,00699
o Hasil P(terlambat) lebih besar dari P(tepat) maka keputusannya adalah
“TERLAMBAT”.

9
BAB III
PENUTUP
3.1 Kesimpulan
Naïve Bayes merupakan metode klasifikasi yang berdasarkan pada
Teorama Bayes.Algoritma Naïve Bayes kurang lebih ditemukan pada
pertengahan abad ke-18. Pada saat itu, algoritma ini dikenal dengan banyak
nama. Meskipun begitu, algoitma ini populer dikenal sebagai metode
pengelompokkan teks dan pengkategorian menggunakan frekuensi kata-kata.

10
DAFTAR PUSTAKA

D. A. Muthia, “Analisis Sentimen Pada Review Buku Menggunakan Algoritma


Naive Bayes,” J. Paradig., vol. 17, Mar. 2014

Intan C G, Drs Sujalwo M.kom,dkk, “Metode Naive Bayes”.Naskah Publikasi,


2014

Nugroho, A., & Subanar. (2013). Klasifikasi Naive Bayes. Berkala MIPA , 23 (3),
297-308.

11

Anda mungkin juga menyukai