BI-Makalah NBC - Kelompok 3

Mata Kuliah : Dosen Pengampu :
Business Intellegence M. Afdal, ST., M.Kom
ALGORITMA NAÏVE BAYES

(Manual)
Oleh Kelompok 3 :
Astia Weni Syaputri 11653201237

Insanul Kamila 11653201531
Pita Sari 11653200328
Riszki Fadillah 11653100779
Yuni Aulia Mirza 11653203628
Kelas Business Intellegence B
PRODI SISTEM INFORMASI

FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI SULTAN SYARIF KASIM RIAU
2019
BAB I
REVIEW JURNAL
1.1. LATAR BELAKANG PENELITIAN
2. Judul :ALGORITMA NAÏVE BAYES UNTUK

PENENTUAN JURUSAN PADA SISWA
MADRASAH ALIYAH
Nama Jurnal : Technologia
Penulis : Fakhriani Ekawati
Volume :9
Nomor :1
Tahun : 2018
Dengan diterbitkannya kurikulum pada tahun 2006 oleh pemerintah yaitu Kurikulum
Tingkat Satuan Pendidikan (KTSP) hanya saja terdapat kekurangan dalam kurikulum tersebut,
yaitu kurang terpenuhinya tujuan dari pendidikan nasional yang tertuang dalam UndangUndang
Nomor 20 Tahun 2003. Dikarenakan terdapat kekurangan dalam KTSP maka pada tahun 2013
pemerintah menyempurnakan KTSP dengan nama baru yang disebut dengan Kurikulum 2013.
Dan hal ini berpengaruh terhadap penentuan jurusan di setiap sekolah yang telah siap
melaksanakan Kurikulum 2013 seperti Madrasah Aliyah Negeri 2 Model Banjarmasin Jurusan-
jurusan yang ada di MAN 2 (Madrasah Aliyah Negeri) merupakan suatu wadah untuk seorang
siswa dimana wadah tersebut disesuaikan dengan bakat, minat, dan kemampuan siswa, sehingga
penjurusan ini sangat penting dan besar dampaknya pada masa depan seseorang. Di Madrasah
Aliyah Negeri terdapat tiga jurusan yang dikenal oleh siswa, tiga jurusan tersebut yaitu, Jurusan
MIA (Matematika Ilmu Alam), Jurusan IIS (Ilmu-Ilmu Sosial), dan Jurusan IKA
(IlmuKeagamaan).
1.2. RUMUSAN MASALAH
Rumusan masalah pada penelitian ini adalah “Bagaimana hasil Penentuan Jurusan Pada
Siswa Madrasah Aliyah menggunakan metode Algoritma Naive Bayes sesuai Kurikulum 2013,
berdasarkan data nilai MAN 2 Model Banjarmasin?”
1.3. TUJUAN PENELITIAN

Penelitian ini bertujuan untuk mengetahui hasilPenentuan Jurusan Pada Siswa Madrasah
Aliyah menggunakan metode Algoritma Naive Bayes sesuai Kurikulum 2013, berdasarkan data
nilai MAN 2 Model Banjarmasin.
1.4. METODOLOGI PENELITIAN

Metode pengumpulan data yang dilakukan dalam penulisan ini dengan tahapan dalam
skema penelitian seperti berikut :
a. Metode Pengumpulan Data (Data Gathering)
b. Metode yang Diusulkan (Proposed Method)
c. Eksperimen dan Pengujian Method/Model (Metode Test and Experiment)
d. Evaluasi dan Validasi (Evaluation and Validation)
1.5. HASIL PENELITIAN

Dari hasil penelitian ini diketahui bahwa MAN 2 Model Banjarmasin
1.6. KESIMPULAN
Berdasarkan dari hasil pembahasan bab sebelumnya, maka hasil penelitian dapat disimpulkan
1.7. KELEBIHAN JURNAL

Kelebihan dari jurnal penelitian ini adalah:
1. Penjelasan sangat detail
2. Bahasa yang digunakan mudah dimengerti
3. Menggunakan dasar teori yang sesuai dengan pembahasan
Menangani kuantitatif dan data diskrit
BAB II
LANDASAN TEORI
2.1. Knowledge Discovery in Database (KDD)

Adapun beberapa definisi dari Knowledge Discovery in Database (KDD)sebagai berikut:
Knowledge Discovery in Database (KDD) merupakan sebuah proses dengan beberapa tingkatan,
tidak sepele,interaktif dan berulang untuk identifikasi polayang dipahami, sah, baru dan secara
potensialberguna mulai dari sekumpulan data yangsangat besar (Silvia dan Germano, 2009).
KDDadalah kegiatan yang meliputi pengumpulan,pemakaian data, historis untuk
menemukanketeraturan, pola atau hubungan dalam set data berukuran besar (Mujib dkk, 2013),
selain ituKDD juga didefinisikan sebagai proses yang terdiri dari urutan interaktif mulai
daripembersihan data, integrasi data, penyeleksian data, transformasi data, Data Mining,
evaluasipola dan presentasi pengetahuan.
Dari beberapa definisi di atas bisa ditarik kesimpulan bahwa Knowledge Discovery in
Database (KDD)merupakan sebuah kegiatan yang bertahap guna menggali informasi dari
sekumpulan data yangsangat besar.KDD dikarakteristikkan sebagai sebuah proses yang terdiri
dari beberapa tahapoperasional : Preprocessing, Data Mining dan Post Processing. Pada gambar
1 akan menunjukan tahapan karakteristik KDD(Silviadan Germano, 2009).
a. Tahap Preprocessing.
Pada tahap Preprocessing memahami fungsi – fungsi yang berhubungan dengan
penerimaan, organisasi dan untuk perawatan data, tahap ini sebagai tujuan penyusunan data
untuk mengikuti tahap dalam Data Mining.
b. Tahap Data Mining.
Pada tahap Data Mining mendefinisikan teknik– teknik dan algoritma – algoritma yang
digunakan oleh masalah di dalam pertanyaan, sebagai contoh dari teknik yang bisa
digunakan dalam tahap ini seperti Neural Network, RoughSet, Genetic Algorithms,
Statistik dan Probabilistik. Pemilihan teknik tergantung, dalam banyak hal, pada jenis tugas
yang harus dikembangkan.
c. Tahap Post Processing.
Dalam tahap Post Processing pemeliharaan dari pengetahuan diperoleh selama tahap Data
Mining. tahap ini tidak selalu dibutuhkan namun hal itu memungkinkan validasi kegunaan
dari pengetahuan yang ditemukan
2.2. Data Mining

Data Mining merupakan proses pengekstraksian informasi dari sekumpulan data yang
sangat besar melalui penggunaan algoritma dan teknik penarikan dalam bidangstatistik,
pembelajaran mesin dan sistem manajemen basis data (Shyara dan Saroj, 2013). Data Mining
adalah proses menganalisa datadari perspektif yang berbeda dan menyimpulkannya menjadi
informasi-informasi penting yang dapat dipakai untuk meningkatkankeuntungan, memperkecil
biaya pengeluaran, atau bahkan keduanya (Angga dan Riani,2012). Definisi lain mengatakan
Data Mining adalah kegiatan yang meliputi pengumpulan, pemakaian data hostoris untuk
menemukanketeraturan, pola atau hubungan dalam data berukuran besar (Subekti, 2011).
Dari beberapa definisi di atas dapat ditarik kesimpulan bahwa Data Mining merupakan
proses ataupun kegiatan untuk mengumpulkan data yang berukuran besar kemudian
mengekstraksi datatersebut menjadi informasi – informasi yang nantinya dapat digunakan.
a. Integrasi data (Data Integration)

Integrasi data merupakan penggabungan data dari berbagai database ke dalam satu
database baru.
b. Seleksi data (Data Selection)
Data yang ada pada database sering kali tidak semuanya dipakai, oleh karena itu hanya
datayang sesuai untuk dianalisis yang akan diambil dari database.
c. Transformasi data (Data Transformation)
Data diubah atau digabung ke dalam format yang sesuai untuk diproses dalam Data
Mining.
d. Proses Mining
Merupakan suatu proses utama saat metode diterapkan untuk menemukan pengetahuan
berharga dan tersembunyi dari data. Beberapa metode yang dapat digunakan berdasarkan
pengelompokan Data Mining.
e. Evaluasi pola (Pattern Evaluation)
Untuk mengidentifikasi pola-pola menarik ke dalam knowledge based yang ditemukan.
f. Presentasi pengetahuan (Knowledge Presentation)
Merupakan visualisasi dan penyajian pengetahuan mengenai metode yang digunakan untuk
memperoleh pengetahuan yang diperoleh pengguna.
2.3. Pengertian Nieve Bayes

Naïve Bayes merupakan pengklasifikasian dengan metode probabilitas dan statistik yang
dikemukakan oleh ilmuwan Inggris Thomas Bayes. Menurut Olson dan Delen (2008, p102)
menjelaskan Naïve bayes untuk setiap kelas keputusan, menghitung probabilitas dengan syarat
bahwa kelas keputusan adalah benar, mengingat vektor informasi obyek. Algoritma ini
mengasumsikan bahwa atribut obyek adalah independen. Probabilitas yang terlibat dalam
memproduksi perkiraan akhir dihitung sebagai jumlah frekuensi dari "master" tabel keputusan.
Sedangkan menurut Han dan Kamber (2011, p351) Proses dari The Naïve Bayesian classifier,
atau Simple Bayesian Classifier, sebagai berikut:
1. Variable D menjadi pelatihan set tuple dan label yang terkait dengan kelas. Seperti biasa,
setiap tuple diwakili oleh vektor atribut ndimensi, X = (x1, x2, ..., xn), ini menggambarkan
pengukuran dibuat pada tuple dari atribut n, masing-masing, A1, A2, ..., An.
2. Misalkan ada kelas m, C1, C2, ..., Cm. Diberi sebuah tuple, X, classifier akan memprediksi
X yang masuk kelompok memiliki probabilitas posterior tertinggi, kondisi-disebutkan pada
X. Artinya, classifier naive bayesian memprediksi bahwa X tuple milik kelas Ci jika dan
hanya jika :
𝑃(𝐶𝑖 |𝑋) > 𝑃(𝐶𝑗 |𝑋) 𝑓𝑜𝑟 1 ≤ 𝑗 ≤ 𝑚, 𝑗 ≠ 𝑖.
Jadi memaksimalkan P (Ci | X). Ci kelas yang P (Ci | X) dimaksimalkan disebut hipotesis
posteriori maksimal. Dengan teorema Bayes:
𝑃(𝑋|𝐶𝑖 )𝑃(𝐶𝑖 )
𝑃(𝐶𝑖 |𝑋) =
𝑃(𝑋)
Keterangan :
P(Ci|X) = Probabilitas hipotesis Ci jika diberikan fakta atau record X (Posterior
probability)
P(X|Ci) = mencari nilai parameter yang memberi kemungkinan yang paling besar
(likelihood)
P(Ci) = Prior probability dari X (Prior probability)
P(X) = Jumlah probability tuple yg muncul
1. Ketika P (X) adalah konstan untuk semua kelas, hanya P (X | Ci) P (Ci) butuh
dimaksimalkan. Jika probabilitas kelas sebelumnya tidak diketahui, maka umumnya
diasumsikan ke dalam kelas yang sama, yaitu, P (C1) = P (C2) = · · · = P (Cm), maka
dari itu akan memaksimalkan P (X | Ci). Jika tidak, maka akan memaksimalkan P (X |
Ci) P (Ci). Perhatikan bahwa probabilitas sebelum kelas dapat diperkirakan oleh P (Ci)
= | Ci, D | / | D |, dimana | Ci, D | adalah jumlah tuple pelatihan kelas Ci di D.
2. Mengingat dataset mempunyai banyak atribut, maka akan sangat sulit dalam
mengkomputasi untuk menghitung P(X|Ci). Agar dapat mengurangi perhitungan dalam
mengevaluasi P(X|Ci), asumsi naïve independensi kelas bersyarat dibuat. Dianggap
bahwa nilai-nilai dari atribut adalah kondisional independen satu sama lain, diberikan
kelas label dari tuple (yaitu bahwa tidak ada hubungan ketergantungan diantara atribut )
dengan demikian :
𝑃(𝑋|𝐶𝑖 ) = ∏ 𝑃(𝑥𝑘 |𝐶𝑖 )

𝑘=1
= 𝑃(𝑥1 |𝐶𝑖 ) × 𝑃(𝑥2 |𝐶𝑖 ) × … × 𝑃(𝑥𝑛 |𝐶𝑖 )
Maka dapat dengan mudah memperkirakan probabilitas P (x1 |Ci), P (x2 | Ci),. . . , P (xn |
Ci) dari pelatihan tuple. Ingat bahwa di sini xk mengacu pada nilai atribut Ak untuk tuple
X. Untuk setiap atribut, dilihat dari apakah atribut tersebut kategorikal atau continuous-
valued . Misalnya, untuk menghitung P (X | Ci) mempertimbangkan hal-hal berikut:
a. Jika Ak adalah kategorikal, maka P (Xk | Ci) adalah jumlah tuple kelas Ci di D memiliki
nilai Xk untuk atribut Ak, dibagi dengan | Ci, D |, jumlah tuple kelas Ci di D.
b. Jika Ak continuous-valued , maka perlu melakukan sedikit lebih banyak pekerjaan, tapi
perhitunganya cukup sederhana. Sebuah atribut continuous-valued biasanya
diasumsikan memiliki distribusi Gaussian dengan rata-rata µ dan standar deviasi σ,
didefinisikan oleh:
1 𝑥−𝜇2
−
𝑔(𝑥, 𝜇, 𝜎) = 𝑒 2𝜎2
√2𝜋𝜎
Sehingga,
𝑃(𝑥𝑘 |𝐶𝑖 ) = 𝑔(𝑥𝑘 , 𝜇𝐶𝑖 , 𝜎𝐶𝑖 )
Setelah itu hitung µCi dan σCi, yang merupakan deviasi mean (rata-rata) dan standar
masing-masing nilai atribut k untuk tuple pelatihan kelas Ci. Setelah itu gunakan kedua
kuantitas dalam Persamaan, bersama-sama dengan xk, untuk memperkirakan P (xk | Ci).
3. Untuk memprediksi label kelas x, P(X|Ci)P(Ci) dievaluasi untuk setiap kelas Ci. Classifier
memprediksi kelas label dari tuple x adalah kelas Ci, jika
𝑃(𝑋|𝐶𝑖 )𝑃(𝐶𝑖 ) > 𝑃(𝑋|𝐶𝑗 )𝑃(𝐶𝑗 ) 𝑓𝑜𝑟 1 ≤ 𝑗 ≤ 𝑚, 𝑗 ≠ 𝑖
BAB III
PEMBAHASAN
3.1. Pembahasan dan Penerapan Algoritma Naïve Bayes
Dalam pembahasan yang dilakukan kali ini dengan menggunakan Data Set (Data Training)
berupa nilai siswa dan menggunakan 2 data Training seperti pada table dibawah ini
RATA- RATA-
NO RATA-RATA RATA-RATA RATA-RATA RATA-RATA RATA-RATA
NAMA SISWA JURUSAN RATA RATA
PENDF PAI B.IND PKN B INGGRIS IPA
IPS MTK
161 YOHAN ANDRIAN SAPUTRA IPS 9,000 75,000 73,667 74,000 87,333 68,000 74,000
001 WINDA AULIA NISA IPA 89,333 89,000 81,333 88,667 86,667 78,333 77,667
001 NUR AVIVA ZAHARA IPS 82,333 79,000 77,333 80,333 79,000 76,667 76,667
002 MARDHIA IPA 87,667 90,000 87,667 82,667 74,667 82,333 86,000
002 AMALIAH GUSVITA SARI IPS 80,333 79,667 77,333 80,333 80,000 76,333 75,333
SYIFA FATIMATUL ZAHRA
003 IDRIS IPA 86,667 87,333 86,333 84,667 80,333 76,333 88,000
003 MUS ARDICKY AKBAR IPS 80,000 72,333 78,667 72,333 78,333 76,000 75,333
004 DESKA PATURAHMAN IPA 88,667 76,333 73,000 71,333 81,000 81,333 83,333
004 RIFKI HIDAYAT IPS 81,667 79,667 79,333 79,333 82,000 74,000 75,000
005 NURUL AZIZAH IPA 88,000 86,667 84,667 90,667 90,000 81,333 81,667
ANGGA PRANOTO
005 WIJAKSONO IPS 81,667 77,667 80,667 76,667 85,333 76,333 85,000
006 FITRA DIKA IPA 84,333 80,333 80,667 84,000 79,667 75,667 77,000
006 M. RIZKI IPS 81,000 80,000 77,667 80,000 87,000 78,000 72,333
007 RIZKA CARNELIA PUTRI IPA 93,667 96,000 95,000 86,000 85,000 81,333 92,333
007 FIRDAUS IPS 94,333 81,000 84,000 83,000 91,333 81,667 80,667
008 RIFKI ALKHUSAIRI IPA 82,667 79,333 76,667 85,667 79,333 75,667 75,000
008 FADIL ALFARIZI IPS 83,333 82,000 79,000 80,333 84,333 77,000 75,667
009 YOLA APRIANI IPA 82,667 86,667 82,000 80,000 80,333 77,667 80,333
009 ALWY ANDIKA IPS 78,667 73,667 76,667 79,333 86,667 76,333 78,667
010 ZAHRA AGRAINI IPA 77,667 81,667 79,000 82,000 77,667 82,667 76,000
3.1.1. Penetuan Perhitungan Fakta Umum Data
Data set diatas mempunyai 2 variabel yaitu variable IPA dan IPS dan memiliki 7
variabel atribut. Banyaknya data label dari Jurusan IPA yaitu 9 dari 18 sampel data yang
digunakan. Sedangkan untuk label dari Jurusan IPS yaitu 9 dari 18 sampel data. Kemudian
untuk mendapatkan Perhitungan Fakta Umum yaitu dengan membagi antara banyaknya data
label jurusan dengan jumlah sample data yang digunakan. Misalnya pada jurusan IPA yaitu
P(9/18) = 0,5. Dan seterusnya hinggal didapat seperti pada table dibawah ini :
Jumlah Kelas
IPA 9
IPS 9
Probabilitas 0,5
0,5
3.1.2. Perhitungan Nilai Probabilitas Data

Selanjutnya yaitu menetukan nilai probabilitas data. Namun sebelum menentukan nilai
probabilitas tersebut dilakukan pemisahan antara variable Jurusan IPA dan IPS sehingga
didapatkan Tabel dibawah ini :
Data Jurusan IPA
NO RATA-RATA RATA-RATA RATA-RATA RATA-RATA RATA-RATA RATA-RATA RATA-

NAMA SISWA JURUSAN
PENDF PAI B.IND PKN B INGGRIS IPA IPS RATA MTK
002 MARDHIA IPA 87,667 90,000 87,667 82,667 74,667 82,333 86,000
SYIFA FATIMATUL ZAHRA
003 IDRIS IPA 86,667 87,333 86,333 84,667 80,333 76,333 88,000
004 DESKA PATURAHMAN IPA 88,667 76,333 73,000 71,333 81,000 81,333 83,333
005 NURUL AZIZAH IPA 88,000 86,667 84,667 90,667 90,000 81,333 81,667
006 FITRA DIKA IPA 84,333 80,333 80,667 84,000 79,667 75,667 77,000
007 RIZKA CARNELIA PUTRI IPA 93,667 96,000 95,000 86,000 85,000 81,333 92,333
008 RIFKI ALKHUSAIRI IPA 82,667 79,333 76,667 85,667 79,333 75,667 75,000
009 YOLA APRIANI IPA 82,667 86,667 82,000 80,000 80,333 77,667 80,333
Data Jurusan IPS
NO RATA-RATA RATA-RATA RATA-RATA RATA-RATA RATA-RATA RATA-RATA RATA-RATA

NAMA SISWA JURUSAN
PENDF PAI B.IND PKN B INGGRIS IPA IPS MTK
YOHAN ANDRIAN
161 SAPUTRA IPS 90,000 75,000 73,667 74,000 87,333 68,000 74,000
001 NUR AVIVA ZAHARA IPS 82,333 79,000 77,333 80,333 79,000 76,667 76,667
AMALIAH GUSVITA
002 SARI IPS 80,333 79,667 77,333 80,333 80,000 76,333 75,333
003 MUS ARDICKY AKBAR IPS 80,000 72,333 78,667 72,333 78,333 76,000 75,333
004 RIFKI HIDAYAT IPS 81,667 79,667 79,333 79,333 82,000 74,000 75,000
ANGGA PRANOTO
005 WIJAKSONO IPS 81,667 77,667 80,667 76,667 85,333 76,333 85,000
006 M. RIZKI IPS 81,000 80,000 77,667 80,000 87,000 78,000 72,333
007 FIRDAUS IPS 94,333 81,000 84,000 83,000 91,333 81,667 80,667
008 FADIL ALFARIZI IPS 83,333 82,000 79,000 80,333 84,333 77,000 75,667
Setelah dilakukan pengelompokan berdasarkan Jurusan selanjutnya yaitu melakukan
Perhitungan Nilai Probabilitas Data sesuai dengan Mata pelajaran atau Variable atribut.
Misalnya :
Pada Variable Jrursan IPA dengan Variable atribut nilai PAI, dengan jumlah data yaitu 9.
Dari data tersbut dijumlahkan seluruh nilai rata-rata PAI pada variable jurusan IPA, misalkan
untuk nilai rata-rata nilai PAI yaitu : 89,333 + 87, 667 + 86,667 + 88,667 + 88,000 + 84,333
+ 93,667 + 82,667 + 82,667 = 87,07407 . Setelah mendapatkan jumlah dari nilai rata-rata
nilai PAI pada jurusan IPA maka dari jumlah nilai rata-rata tersebut di tentukan Nilai
Standart Deviasi yaitu 3,51496. Dan selanjutnya sehingga didapatkan hasil seperti pada table
dibawah ini :
a. Nilai Probabilitas Rata-rata PAI

Probabilitas Rata-rata PAI
No IPS IPA
1 90,000 89,333
2 82,333 87,667
3 80,333 86,667
4 80,000 88,667
5 81,667 88,000
6 81,667 84,333
7 81,000 93,667
8 94,333 82,667
9 83,333 82,667
MEANS 83,85185 87,07407

STANDAR DEV. 4,93882 3,51496
b. Nilai Probabilitas Rata-rata B.Indo
Probabilitas Rata-rata
B.INDO
No IPS IPA
1 75,000 89,000
2 79,000 90,000
3 79,667 87,333
4 72,333 76,333
5 79,667 86,667
6 77,667 80,333
7 80,000 96,000
8 81,000 79,333
9 82,000 86,667
MEANS 78,481 85,74074

STANDAR DEV. 3,05556 6,09366
c. Nilai Probabilitas Rata-rata PKN

Probabilitas Rata-rata PKN
No IPS IPA
1 73,667 81,333
2 77,333 87,667
3 77,333 86,333
4 78,667 73,000
5 79,333 84,667
6 80,667 80,667
7 77,667 95,000
8 84,000 76,667
9 79,000 82,000
MEANS 78,62963 83,03704

STANDAR DEV. 2,79605 6,41276
d. Nilai Probabilitas Rata-rata B.Ing
B.INGG
No IPS IPA
1 74,000 88,667
2 80,333 82,667
3 80,333 84,667
4 72,333 71,333
5 79,333 90,667
6 76,667 84,000
7 80,000 86,000
8 83,000 85,667
9 80,333 80,000
MEANS 78,48148 83,74074

STANDAR DEV. 3,44444 5,60203
e. Nilai Probabilitas Rata-rata IPA

IPA
No IPS IPA
1 87,333 86,667
2 79,000 74,667
3 80,000 80,333
4 78,333 81,000
5 82,000 90,000
6 85,333 79,667
7 87,000 85,000
8 91,333 79,333
9 84,333 80,333
MEANS 83,85185 81,88889

STANDAR DEV. 4,36880 4,57651
f. Nilai Probabilitas Rata-rata IPS
IPS
No IPS IPA
1 68,000 78,333
2 76,667 82,333
3 76,333 76,333
4 76,000 81,333
5 74,000 81,333
6 76,333 75,667
7 78,000 81,333
8 81,667 75,667
9 77,000 77,667
MEANS 76,00000 78,88889

STANDAR DEV. 3,63624 2,71314
g. Nilai Probabilitas Rata-rata MTK

MTK
No IPS IPA
1 74,000 77,667
2 76,667 86,000
3 75,333 88,000
4 75,333 83,333
5 75,000 81,667
6 85,000 77,000
7 72,333 92,333
8 80,667 75,000
9 75,667 80,333
MEANS 76,66667 82,37037

STANDAR DEV. 3,85141 5,64566
3.1.4. Perhitungan Naïve Bayes
Perhitungan Naïve Bayes yang pertama yaitu dengan menggunakan Data Testing yaitu
seperti dibawah ini :
RATA- RATA- RATA- RATA- RATA- RATA- RATA-

NO
NAMA SISWA JURUSAN RATA RATA RATA RATA B RATA RATA RATA
PENDF
PAI B.IND PKN INGGRIS IPA IPS MTK
009 ALWY ANDIKA IPS 78,667 73,667 76,667 79,333 86,667 76,333 78,667
Berikut adalah perhitungan Naïve Bayes dengan menggunakan Data Training tersebut
dapat dilihat pada table perhitungan dibawah ini :
a. Perhitungan Naïve Bayes pada rata-rata nilai PAI
IPS IPA
MEANS 83,85185 87,07407
STANDAR
π 3,51496
3,14 DEV. 4,93882
Rata-rata PAI
= 78,667
(2 × 𝜋 1 (𝑥 − µ) (𝑥 (𝑥 − µ)2 𝑒− HASIL
× 𝜎) √2 × 𝜋 × 𝜎 √2 × 𝜋 × 𝜎 − µ)2 𝜎2 2 2×𝜎2
IPS 31,01581 5,56918 0,17956 -5,18519 ×𝜎2
26,88615 24,39198 48,78395 0,55113 0,57630 0,10348
IPA 22,07394 4,69829 0,21284 -8,40741 70,68450 12,35494 24,70988 2,86058 0,05724 0,01218
b. Perhitungan Naïve Bayes pada rata-rata nilai B.Indo
IPS IPA
MEANS 78,4815 85,7407
STANDAR
π 3,14 DEV. 3,05556 6,09366
Rata-rata B.indo = 73,66666667
(2 × 𝜋 1 (𝑥 − µ) (𝑥 (𝑥 − µ)2 𝑒 − HASIL
2
× 𝜎) √2 × 𝜋 × 𝜎 √2 × 𝜋 × 𝜎 − µ) 𝜎 2 2 2×𝜎2
2
IPS 19,18888889 4,3805124 0,228283796 ×𝜎
-4,81481 23,1824 9,33642 18,67284 1,241506 0,2889 0,065962
IPA 38,26819709 6,18612941 0,161651969 -12,0741 145,783 37,1327 74,265432 1,963003 0,1404 0,022702
c. Perhitungan Naïve Bayes pada rata-rata nilai PKN
IPS IPA
MEANS 78,6296 83,037
STANDAR
π 3,14 DEV. 2,79605 6,41276
Rata-rata PKN = 76,66666667

1
(2 × 𝜋 √2 × 𝜋 × 𝜎 (𝑥 − µ) (𝑥 (𝑥 − µ)2 𝑒− HASIL
× 𝜎) √2 × 𝜋 × 𝜎 − µ)2 𝜎2 2 2×𝜎2
- ×𝜎2
IPS 17,55920032 4,19036995 0,238642414 1,96296 3,85322 7,8179 15,635802 0,2464359 0,7816 0,186518
-
IPA 40,27211614 6,34603153 0,157578795 6,37037 40,5816 41,1235 82,246914 0,4934121 0,6105 0,096208
d. Perhitungan Naïve Bayes pada rata-rata nilai B.Ing
IPS IPA
MEANS 78,4815 83,7407
STANDAR
π 3,14 DEV. 3,44444 5,60203
Rata-rata B.ING = 79,33333333
(2 × 𝜋 1 (𝑥 − µ)(𝑥 (𝑥 − µ)2 𝑒 − HASIL

× 𝜎) √2 × 𝜋 × 𝜎 √2 × 𝜋 × 𝜎 − µ)2 𝜎2 2 2×𝜎2
2
IPS 21,63111111 4,65092583 × 𝜎
0,215010954 0,85185 0,72565 11,8642 23,728395 0,0305816 0,9699 0,208535
-
IPA 35,18073491 5,931335 0,168596109 4,40741 19,4252 31,3827 62,765432 0,3094895 0,7338 0,123719
e. Perhitungan Naïve Bayes pada rata-rata nilai IPA
IPS IPA
MEANS 83,8519 81,8889
STANDAR
π 3,14 DEV. 4,3688 4,57651
Rata-rata IPA = 86,66666667
(2 × 𝜋 1 (𝑥 − µ)
(𝑥 (𝑥 − µ)2 𝑒 − HASIL
2
× 𝜎) √2 × 𝜋 × 𝜎 √2 × 𝜋 × 𝜎 − µ) 𝜎2 2 2×𝜎2
2
IPS 27,43606854 5,23794507 ×𝜎
0,190914564 2,81481 7,92318 19,0864 38,17284 0,2075607 0,8126 0,15513
IPA 28,74048326 5,36101513 0,186531837 4,77778 22,8272 20,9444 41,888889 0,5449455 0,5799 0,108165
f. Perhitungan Naïve Bayes pada rata-rata nilai IPS
IPS IPA
MEANS 76 78,8889
STANDAR
π 3,14 DEV. 3,63624 2,71314
Rata-rata IPS = 76,33333333
(2 × 𝜋 1 (𝑥 − µ) (𝑥 (𝑥 − µ)2 𝑒 − HASIL
× 𝜎) √2 × 𝜋 × 𝜎 √2 × 𝜋 × 𝜎 − µ)2 𝜎2 2 2×𝜎2
2
IPS 22,83557069 4,77865783 0,20926378 × 𝜎
0,33333 0,11111 13,2222 26,444444 0,0042017 0,9958 0,208386
IPA 17,03849889 4,12777166 0,242261463 -2,55556 6,53086 7,36111 14,722222 0,4436059 0,6417 0,155464
g. Perhitungan Naïve Bayes pada rata-rata nilai MTK
IPS IPA
MEANS 76,6667 82,3704
STANDAR
π 3,14 DEV. 3,85141 5,64566
Rata-rata MTK = 78,66666667
(2 × 𝜋 1 (𝑥 − µ)
(𝑥 (𝑥 − µ)2 𝑒 − HASIL
2
× 𝜎) √2 × 𝜋 × 𝜎 √2 × 𝜋 × 𝜎 − µ) 𝜎2 2 2×𝜎2
2
IPS 24,18683388 4,91801117 0,203334227 2 ×𝜎
4 14,8333 29,666667 0,1348315 0,8739 0,177686
IPA 35,45473365 5,95438776 0,167943379 -3,7037 13,7174 31,8735 63,746914 0,2151857 0,8064 0,135428
Perhitungan Naïve Bayes yang pertama yaitu dengan menggunakan Data Testing yaitu seperti dibawah ini :
NO RATA- RATA-RATA RATA- RATA-RATA RATA-RATA RATA-RATA RATA-RATA

NAMA SISWA JURUSAN
PENDF RATA PAI B.IND RATA PKN B INGGRIS IPA IPS MTK
ZAHRA
010 AGRAINI IPA 77,667 81,667 79,000 82,000 77,667 82,667 76,000
Berikut adalah perhitungan Naïve Bayes dengan menggunakan Data Training tersebut dapat dilihat pada table perhitungan dibawah ini:
a. Perhitungan Naïve Bayes pada rata-rata nilai PAI
IPS IPA
MEANS 83,85185 87,07407
π 3,14 STANDAR DEV. 4,93882 3,51496
Rata-rata PAI
= 77,667
1
(𝑥 − µ)2
√2 × 𝜋 × 𝜎 √2 × 𝜋 × 𝜎
𝜎2 2×𝜎2 2×𝜎2
(2 × 𝜋 (𝑥 (𝑥 𝑒− HASIL
× 𝜎) − µ) − µ)2
IPS 31,01581 5,56918 0,17956 -6,18519 38,25652 24,39198 48,78395 0,78420 0,45648 0,08197
IPA 22,07394 4,69829 0,21284 -9,40741 88,49931 12,35494 24,70988 3,58154 0,02783 0,00592
b. Perhitungan Naïve Bayes pada rata-rata nilai B.Indo
IPS IPA
MEANS 78,48148148 85,74074074
π 3,14 STANDAR DEV. 3,055555556 6,093661957
Rata-rata B.indo = 81,66666667

1 (𝑥 − µ)2
√2 × 𝜋 × 𝜎 √2 × 𝜋 × 𝜎 2×𝜎2
× 𝜎) − µ) − µ)2 𝜎2 2
IPS 19,18888889 4,3805124 0,228283796 ×𝜎2
3,185185185 10,14540466 9,336419753 18,67283951 0,543324151 0,580814326 0,132590499
-
IPA 38,26819709 6,186129411 0,161651969 4,074074074 16,59807956 37,13271605 74,2654321 0,223496708 0,799717525 0,129275913
c. Perhitungan Naïve Bayes pada rata-rata nilai PKN
IPS IPA
MEANS 78,62962963 83,03703704
π 3,14 STANDAR DEV. 2,796051007 6,412757347
Rata-rata PKN = 79
1 (𝑥 − µ)2
√2 × 𝜋 × 𝜎 √2 × 𝜋 × 𝜎 2×𝜎2
× 𝜎) − µ) − µ)2 𝜎2 2
IPS 17,55920032 4,190369951 0,238642414 ×𝜎2
0,37037037 0,137174211 7,817901235 15,63580247 0,008773084 0,991265287 0,236557941
-
IPA 40,27211614 6,346031527 0,157578795 4,037037037 16,29766804 41,12345679 82,24691358 0,198155375 0,820242398 0,129252809
d. Perhitungan Naïve Bayes pada rata-rata nilai B.Ing
IPS IPA
MEANS 78,48148148 83,74074074
π 3,14 STANDAR DEV. 3,444444444 5,602027852
Rata-rata B.ING = 82
1 (𝑥 − µ)2
√2 × 𝜋 × 𝜎 √2 × 𝜋 × 𝜎 2×𝜎2
× 𝜎) − µ) − µ)2 𝜎2 2
IPS 21,63111111 4,650925834 0,215010954 ×𝜎2
3,518518519 12,37997257 11,86419753 23,72839506 0,521736617 0,593488989 0,127606634
-
IPA 35,18073491 5,931335002 0,168596109 1,740740741 3,030178326 31,38271605 62,7654321 0,048277821 0,952869023 0,160650009
e. Perhitungan Naïve Bayes pada rata-rata nilai IPA
IPS IPA
MEANS 83,85185185 81,88888889
π 3,14 STANDAR DEV. 4,368800723 4,576510073
Rata-rata IPA
= 77,66666667
1 (𝑥 − µ)2
√2 × 𝜋 × 𝜎 √2 × 𝜋 × 𝜎 2×𝜎2
× 𝜎) − µ) − µ)2 𝜎2 2
- ×𝜎2
IPS 27,43606854 5,237945068 0,190914564 6,185185185 38,25651578 19,08641975 38,17283951 1,002192037 0,367073919 0,070079757
-
IPA 28,74048326 5,361015133 0,186531837 4,222222222 17,82716049 20,94444444 41,88888889 0,425582081 0,653389349 0,121877915
f. Perhitungan Naïve Bayes pada rata-rata nilai IPS
IPS IPA
MEANS 76 78,88888889
π 3,14 STANDAR DEV. 3,636237372 2,713136766
Rata-rata IPS = 82,66666667

1 (𝑥 − µ)2
√2 × 𝜋 × 𝜎 √2 × 𝜋 × 𝜎 2×𝜎2
× 𝜎) − µ) − µ)2 𝜎2 2
IPS 22,83557069 4,778657834 0,20926378 ×𝜎2
6,666666667 44,44444444 13,22222222 26,44444444 1,680672269 0,186248725 0,038975112
IPA 17,03849889 4,127771662 0,242261463 3,777777778 14,27160494 7,361111111 14,72222222 0,969392034 0,379313578 0,091893062
g. Perhitungan Naïve Bayes pada rata-rata nilai MTK
IPS IPA
MEANS 76,66666667 82,37037037
π 3,14 STANDAR DEV. 3,851406669 5,645658225
Rata-rata MTK = 76
1 (𝑥 − µ)2
√2 × 𝜋 × 𝜎 √2 × 𝜋 × 𝜎 2×𝜎2
× 𝜎) − µ) − µ)2 𝜎2 2
- ×𝜎2
IPS 24,18683388 4,918011172 0,203334227 0,666666667 0,444444444 14,83333333 29,66666667 0,014981273 0,985130388 0,200310726
IPA 35,45473365 5,954387765 0,167943379 -6,37037037 40,58161866 31,87345679 63,74691358 0,636605231 0,529085502 0,088856407
Hasil akurasi
B IV
KESIMPULAN

BI-Makalah NBC - Kelompok 3

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

BI-Makalah NBC - Kelompok 3

Diunggah oleh

Hak Cipta:

Format Tersedia

Mata Kuliah : Dosen Pengampu :

Business Intellegence M. Afdal, ST., M.Kom

ALGORITMA NAÏVE BAYES

Astia Weni Syaputri 11653201237

Kelas Business Intellegence B

PRODI SISTEM INFORMASI

1.1. LATAR BELAKANG PENELITIAN

2. Judul :ALGORITMA NAÏVE BAYES UNTUK

1.3. TUJUAN PENELITIAN

1.4. METODOLOGI PENELITIAN

1.5. HASIL PENELITIAN

1.7. KELEBIHAN JURNAL

2.1. Knowledge Discovery in Database (KDD)

2.2. Data Mining

a. Integrasi data (Data Integration)

2.3. Pengertian Nieve Bayes

𝑃(𝑋|𝐶𝑖 ) = ∏ 𝑃(𝑥𝑘 |𝐶𝑖 )

= 𝑃(𝑥1 |𝐶𝑖 ) × 𝑃(𝑥2 |𝐶𝑖 ) × … × 𝑃(𝑥𝑛 |𝐶𝑖 )

3.1. Pembahasan dan Penerapan Algoritma Naïve Bayes

3.1.2. Perhitungan Nilai Probabilitas Data

NO RATA-RATA RATA-RATA RATA-RATA RATA-RATA RATA-RATA RATA-RATA RATA-

Data Jurusan IPS

NO RATA-RATA RATA-RATA RATA-RATA RATA-RATA RATA-RATA RATA-RATA RATA-RATA

a. Nilai Probabilitas Rata-rata PAI

MEANS 83,85185 87,07407

MEANS 78,481 85,74074

c. Nilai Probabilitas Rata-rata PKN

MEANS 78,62963 83,03704

MEANS 78,48148 83,74074

e. Nilai Probabilitas Rata-rata IPA

MEANS 83,85185 81,88889

MEANS 76,00000 78,88889

g. Nilai Probabilitas Rata-rata MTK

MEANS 76,66667 82,37037

RATA- RATA- RATA- RATA- RATA- RATA- RATA-

b. Perhitungan Naïve Bayes pada rata-rata nilai B.Indo

Rata-rata B.indo = 73,66666667

Rata-rata PKN = 76,66666667

d. Perhitungan Naïve Bayes pada rata-rata nilai B.Ing

Rata-rata B.ING = 79,33333333

(2 × 𝜋 1 (𝑥 − µ)(𝑥 (𝑥 − µ)2 𝑒 − HASIL

Rata-rata IPA = 86,66666667

f. Perhitungan Naïve Bayes pada rata-rata nilai IPS

Rata-rata IPS = 76,33333333

Rata-rata MTK = 78,66666667

NO RATA- RATA-RATA RATA- RATA-RATA RATA-RATA RATA-RATA RATA-RATA

b. Perhitungan Naïve Bayes pada rata-rata nilai B.Indo

Rata-rata B.indo = 81,66666667

d. Perhitungan Naïve Bayes pada rata-rata nilai B.Ing

f. Perhitungan Naïve Bayes pada rata-rata nilai IPS

Rata-rata IPS = 82,66666667

Anda mungkin juga menyukai