BI-Makalah NBC - Kelompok 3
BI-Makalah NBC - Kelompok 3
Oleh Kelompok 3 :
Dengan diterbitkannya kurikulum pada tahun 2006 oleh pemerintah yaitu Kurikulum
Tingkat Satuan Pendidikan (KTSP) hanya saja terdapat kekurangan dalam kurikulum tersebut,
yaitu kurang terpenuhinya tujuan dari pendidikan nasional yang tertuang dalam UndangUndang
Nomor 20 Tahun 2003. Dikarenakan terdapat kekurangan dalam KTSP maka pada tahun 2013
pemerintah menyempurnakan KTSP dengan nama baru yang disebut dengan Kurikulum 2013.
Dan hal ini berpengaruh terhadap penentuan jurusan di setiap sekolah yang telah siap
melaksanakan Kurikulum 2013 seperti Madrasah Aliyah Negeri 2 Model Banjarmasin Jurusan-
jurusan yang ada di MAN 2 (Madrasah Aliyah Negeri) merupakan suatu wadah untuk seorang
siswa dimana wadah tersebut disesuaikan dengan bakat, minat, dan kemampuan siswa, sehingga
penjurusan ini sangat penting dan besar dampaknya pada masa depan seseorang. Di Madrasah
Aliyah Negeri terdapat tiga jurusan yang dikenal oleh siswa, tiga jurusan tersebut yaitu, Jurusan
MIA (Matematika Ilmu Alam), Jurusan IIS (Ilmu-Ilmu Sosial), dan Jurusan IKA
(IlmuKeagamaan).
1.2. RUMUSAN MASALAH
Rumusan masalah pada penelitian ini adalah “Bagaimana hasil Penentuan Jurusan Pada
Siswa Madrasah Aliyah menggunakan metode Algoritma Naive Bayes sesuai Kurikulum 2013,
berdasarkan data nilai MAN 2 Model Banjarmasin?”
1.6. KESIMPULAN
Berdasarkan dari hasil pembahasan bab sebelumnya, maka hasil penelitian dapat disimpulkan
a. Tahap Preprocessing.
Pada tahap Preprocessing memahami fungsi – fungsi yang berhubungan dengan
penerimaan, organisasi dan untuk perawatan data, tahap ini sebagai tujuan penyusunan data
untuk mengikuti tahap dalam Data Mining.
b. Tahap Data Mining.
Pada tahap Data Mining mendefinisikan teknik– teknik dan algoritma – algoritma yang
digunakan oleh masalah di dalam pertanyaan, sebagai contoh dari teknik yang bisa
digunakan dalam tahap ini seperti Neural Network, RoughSet, Genetic Algorithms,
Statistik dan Probabilistik. Pemilihan teknik tergantung, dalam banyak hal, pada jenis tugas
yang harus dikembangkan.
c. Tahap Post Processing.
Dalam tahap Post Processing pemeliharaan dari pengetahuan diperoleh selama tahap Data
Mining. tahap ini tidak selalu dibutuhkan namun hal itu memungkinkan validasi kegunaan
dari pengetahuan yang ditemukan
Keterangan :
P(Ci|X) = Probabilitas hipotesis Ci jika diberikan fakta atau record X (Posterior
probability)
P(X|Ci) = mencari nilai parameter yang memberi kemungkinan yang paling besar
(likelihood)
P(Ci) = Prior probability dari X (Prior probability)
P(X) = Jumlah probability tuple yg muncul
1. Ketika P (X) adalah konstan untuk semua kelas, hanya P (X | Ci) P (Ci) butuh
dimaksimalkan. Jika probabilitas kelas sebelumnya tidak diketahui, maka umumnya
diasumsikan ke dalam kelas yang sama, yaitu, P (C1) = P (C2) = · · · = P (Cm), maka
dari itu akan memaksimalkan P (X | Ci). Jika tidak, maka akan memaksimalkan P (X |
Ci) P (Ci). Perhatikan bahwa probabilitas sebelum kelas dapat diperkirakan oleh P (Ci)
= | Ci, D | / | D |, dimana | Ci, D | adalah jumlah tuple pelatihan kelas Ci di D.
2. Mengingat dataset mempunyai banyak atribut, maka akan sangat sulit dalam
mengkomputasi untuk menghitung P(X|Ci). Agar dapat mengurangi perhitungan dalam
mengevaluasi P(X|Ci), asumsi naïve independensi kelas bersyarat dibuat. Dianggap
bahwa nilai-nilai dari atribut adalah kondisional independen satu sama lain, diberikan
kelas label dari tuple (yaitu bahwa tidak ada hubungan ketergantungan diantara atribut )
dengan demikian :
Maka dapat dengan mudah memperkirakan probabilitas P (x1 |Ci), P (x2 | Ci),. . . , P (xn |
Ci) dari pelatihan tuple. Ingat bahwa di sini xk mengacu pada nilai atribut Ak untuk tuple
X. Untuk setiap atribut, dilihat dari apakah atribut tersebut kategorikal atau continuous-
valued . Misalnya, untuk menghitung P (X | Ci) mempertimbangkan hal-hal berikut:
a. Jika Ak adalah kategorikal, maka P (Xk | Ci) adalah jumlah tuple kelas Ci di D memiliki
nilai Xk untuk atribut Ak, dibagi dengan | Ci, D |, jumlah tuple kelas Ci di D.
b. Jika Ak continuous-valued , maka perlu melakukan sedikit lebih banyak pekerjaan, tapi
perhitunganya cukup sederhana. Sebuah atribut continuous-valued biasanya
diasumsikan memiliki distribusi Gaussian dengan rata-rata µ dan standar deviasi σ,
didefinisikan oleh:
1 𝑥−𝜇2
−
𝑔(𝑥, 𝜇, 𝜎) = 𝑒 2𝜎2
√2𝜋𝜎
Sehingga,
𝑃(𝑥𝑘 |𝐶𝑖 ) = 𝑔(𝑥𝑘 , 𝜇𝐶𝑖 , 𝜎𝐶𝑖 )
Setelah itu hitung µCi dan σCi, yang merupakan deviasi mean (rata-rata) dan standar
masing-masing nilai atribut k untuk tuple pelatihan kelas Ci. Setelah itu gunakan kedua
kuantitas dalam Persamaan, bersama-sama dengan xk, untuk memperkirakan P (xk | Ci).
3. Untuk memprediksi label kelas x, P(X|Ci)P(Ci) dievaluasi untuk setiap kelas Ci. Classifier
memprediksi kelas label dari tuple x adalah kelas Ci, jika
𝑃(𝑋|𝐶𝑖 )𝑃(𝐶𝑖 ) > 𝑃(𝑋|𝐶𝑗 )𝑃(𝐶𝑗 ) 𝑓𝑜𝑟 1 ≤ 𝑗 ≤ 𝑚, 𝑗 ≠ 𝑖
BAB III
PEMBAHASAN
Dalam pembahasan yang dilakukan kali ini dengan menggunakan Data Set (Data Training)
berupa nilai siswa dan menggunakan 2 data Training seperti pada table dibawah ini
RATA- RATA-
NO RATA-RATA RATA-RATA RATA-RATA RATA-RATA RATA-RATA
NAMA SISWA JURUSAN RATA RATA
PENDF PAI B.IND PKN B INGGRIS IPA
IPS MTK
161 YOHAN ANDRIAN SAPUTRA IPS 9,000 75,000 73,667 74,000 87,333 68,000 74,000
001 WINDA AULIA NISA IPA 89,333 89,000 81,333 88,667 86,667 78,333 77,667
001 NUR AVIVA ZAHARA IPS 82,333 79,000 77,333 80,333 79,000 76,667 76,667
002 MARDHIA IPA 87,667 90,000 87,667 82,667 74,667 82,333 86,000
002 AMALIAH GUSVITA SARI IPS 80,333 79,667 77,333 80,333 80,000 76,333 75,333
SYIFA FATIMATUL ZAHRA
003 IDRIS IPA 86,667 87,333 86,333 84,667 80,333 76,333 88,000
003 MUS ARDICKY AKBAR IPS 80,000 72,333 78,667 72,333 78,333 76,000 75,333
004 DESKA PATURAHMAN IPA 88,667 76,333 73,000 71,333 81,000 81,333 83,333
004 RIFKI HIDAYAT IPS 81,667 79,667 79,333 79,333 82,000 74,000 75,000
005 NURUL AZIZAH IPA 88,000 86,667 84,667 90,667 90,000 81,333 81,667
ANGGA PRANOTO
005 WIJAKSONO IPS 81,667 77,667 80,667 76,667 85,333 76,333 85,000
006 FITRA DIKA IPA 84,333 80,333 80,667 84,000 79,667 75,667 77,000
006 M. RIZKI IPS 81,000 80,000 77,667 80,000 87,000 78,000 72,333
007 RIZKA CARNELIA PUTRI IPA 93,667 96,000 95,000 86,000 85,000 81,333 92,333
007 FIRDAUS IPS 94,333 81,000 84,000 83,000 91,333 81,667 80,667
008 RIFKI ALKHUSAIRI IPA 82,667 79,333 76,667 85,667 79,333 75,667 75,000
008 FADIL ALFARIZI IPS 83,333 82,000 79,000 80,333 84,333 77,000 75,667
009 YOLA APRIANI IPA 82,667 86,667 82,000 80,000 80,333 77,667 80,333
009 ALWY ANDIKA IPS 78,667 73,667 76,667 79,333 86,667 76,333 78,667
010 ZAHRA AGRAINI IPA 77,667 81,667 79,000 82,000 77,667 82,667 76,000
3.1.1. Penetuan Perhitungan Fakta Umum Data
Data set diatas mempunyai 2 variabel yaitu variable IPA dan IPS dan memiliki 7
variabel atribut. Banyaknya data label dari Jurusan IPA yaitu 9 dari 18 sampel data yang
digunakan. Sedangkan untuk label dari Jurusan IPS yaitu 9 dari 18 sampel data. Kemudian
untuk mendapatkan Perhitungan Fakta Umum yaitu dengan membagi antara banyaknya data
label jurusan dengan jumlah sample data yang digunakan. Misalnya pada jurusan IPA yaitu
P(9/18) = 0,5. Dan seterusnya hinggal didapat seperti pada table dibawah ini :
Jumlah Kelas
IPA 9
IPS 9
Probabilitas 0,5
0,5
Pada Variable Jrursan IPA dengan Variable atribut nilai PAI, dengan jumlah data yaitu 9.
Dari data tersbut dijumlahkan seluruh nilai rata-rata PAI pada variable jurusan IPA, misalkan
untuk nilai rata-rata nilai PAI yaitu : 89,333 + 87, 667 + 86,667 + 88,667 + 88,000 + 84,333
+ 93,667 + 82,667 + 82,667 = 87,07407 . Setelah mendapatkan jumlah dari nilai rata-rata
nilai PAI pada jurusan IPA maka dari jumlah nilai rata-rata tersebut di tentukan Nilai
Standart Deviasi yaitu 3,51496. Dan selanjutnya sehingga didapatkan hasil seperti pada table
dibawah ini :
No IPS IPA
1 90,000 89,333
2 82,333 87,667
3 80,333 86,667
4 80,000 88,667
5 81,667 88,000
6 81,667 84,333
7 81,000 93,667
8 94,333 82,667
9 83,333 82,667
No IPS IPA
1 75,000 89,000
2 79,000 90,000
3 79,667 87,333
4 72,333 76,333
5 79,667 86,667
6 77,667 80,333
7 80,000 96,000
8 81,000 79,333
9 82,000 86,667
No IPS IPA
1 73,667 81,333
2 77,333 87,667
3 77,333 86,333
4 78,667 73,000
5 79,333 84,667
6 80,667 80,667
7 77,667 95,000
8 84,000 76,667
9 79,000 82,000
No IPS IPA
1 74,000 88,667
2 80,333 82,667
3 80,333 84,667
4 72,333 71,333
5 79,333 90,667
6 76,667 84,000
7 80,000 86,000
8 83,000 85,667
9 80,333 80,000
No IPS IPA
1 87,333 86,667
2 79,000 74,667
3 80,000 80,333
4 78,333 81,000
5 82,000 90,000
6 85,333 79,667
7 87,000 85,000
8 91,333 79,333
9 84,333 80,333
No IPS IPA
1 68,000 78,333
2 76,667 82,333
3 76,333 76,333
4 76,000 81,333
5 74,000 81,333
6 76,333 75,667
7 78,000 81,333
8 81,667 75,667
9 77,000 77,667
No IPS IPA
1 74,000 77,667
2 76,667 86,000
3 75,333 88,000
4 75,333 83,333
5 75,000 81,667
6 85,000 77,000
7 72,333 92,333
8 80,667 75,000
9 75,667 80,333
Berikut adalah perhitungan Naïve Bayes dengan menggunakan Data Training tersebut
dapat dilihat pada table perhitungan dibawah ini :
a. Perhitungan Naïve Bayes pada rata-rata nilai PAI
IPS IPA
MEANS 83,85185 87,07407
STANDAR
π 3,51496
3,14 DEV. 4,93882
Rata-rata PAI
= 78,667
(2 × 𝜋 1 (𝑥 − µ) (𝑥 (𝑥 − µ)2 𝑒− HASIL
× 𝜎) √2 × 𝜋 × 𝜎 √2 × 𝜋 × 𝜎 − µ)2 𝜎2 2 2×𝜎2
IPS 31,01581 5,56918 0,17956 -5,18519 ×𝜎2
26,88615 24,39198 48,78395 0,55113 0,57630 0,10348
IPA 22,07394 4,69829 0,21284 -8,40741 70,68450 12,35494 24,70988 2,86058 0,05724 0,01218
IPS IPA
MEANS 78,4815 85,7407
STANDAR
π 3,14 DEV. 3,05556 6,09366
(2 × 𝜋 1 (𝑥 − µ) (𝑥 (𝑥 − µ)2 𝑒 − HASIL
2
× 𝜎) √2 × 𝜋 × 𝜎 √2 × 𝜋 × 𝜎 − µ) 𝜎 2 2 2×𝜎2
2
IPS 19,18888889 4,3805124 0,228283796 ×𝜎
-4,81481 23,1824 9,33642 18,67284 1,241506 0,2889 0,065962
IPA 38,26819709 6,18612941 0,161651969 -12,0741 145,783 37,1327 74,265432 1,963003 0,1404 0,022702
c. Perhitungan Naïve Bayes pada rata-rata nilai PKN
IPS IPA
MEANS 78,6296 83,037
STANDAR
π 3,14 DEV. 2,79605 6,41276
IPS IPA
MEANS 78,4815 83,7407
STANDAR
π 3,14 DEV. 3,44444 5,60203
IPS IPA
MEANS 83,8519 81,8889
STANDAR
π 3,14 DEV. 4,3688 4,57651
(2 × 𝜋 1 (𝑥 − µ)
(𝑥 (𝑥 − µ)2 𝑒 − HASIL
2
× 𝜎) √2 × 𝜋 × 𝜎 √2 × 𝜋 × 𝜎 − µ) 𝜎2 2 2×𝜎2
2
IPS 27,43606854 5,23794507 ×𝜎
0,190914564 2,81481 7,92318 19,0864 38,17284 0,2075607 0,8126 0,15513
IPA 28,74048326 5,36101513 0,186531837 4,77778 22,8272 20,9444 41,888889 0,5449455 0,5799 0,108165
IPS IPA
MEANS 76 78,8889
STANDAR
π 3,14 DEV. 3,63624 2,71314
(2 × 𝜋 1 (𝑥 − µ) (𝑥 (𝑥 − µ)2 𝑒 − HASIL
× 𝜎) √2 × 𝜋 × 𝜎 √2 × 𝜋 × 𝜎 − µ)2 𝜎2 2 2×𝜎2
2
IPS 22,83557069 4,77865783 0,20926378 × 𝜎
0,33333 0,11111 13,2222 26,444444 0,0042017 0,9958 0,208386
IPA 17,03849889 4,12777166 0,242261463 -2,55556 6,53086 7,36111 14,722222 0,4436059 0,6417 0,155464
g. Perhitungan Naïve Bayes pada rata-rata nilai MTK
IPS IPA
MEANS 76,6667 82,3704
STANDAR
π 3,14 DEV. 3,85141 5,64566
(2 × 𝜋 1 (𝑥 − µ)
(𝑥 (𝑥 − µ)2 𝑒 − HASIL
2
× 𝜎) √2 × 𝜋 × 𝜎 √2 × 𝜋 × 𝜎 − µ) 𝜎2 2 2×𝜎2
2
IPS 24,18683388 4,91801117 0,203334227 2 ×𝜎
4 14,8333 29,666667 0,1348315 0,8739 0,177686
IPA 35,45473365 5,95438776 0,167943379 -3,7037 13,7174 31,8735 63,746914 0,2151857 0,8064 0,135428
Perhitungan Naïve Bayes yang pertama yaitu dengan menggunakan Data Testing yaitu seperti dibawah ini :
Berikut adalah perhitungan Naïve Bayes dengan menggunakan Data Training tersebut dapat dilihat pada table perhitungan dibawah ini:
a. Perhitungan Naïve Bayes pada rata-rata nilai PAI
IPS IPA
MEANS 83,85185 87,07407
π 3,14 STANDAR DEV. 4,93882 3,51496
Rata-rata PAI
= 77,667
1
(𝑥 − µ)2
√2 × 𝜋 × 𝜎 √2 × 𝜋 × 𝜎
𝜎2 2×𝜎2 2×𝜎2
(2 × 𝜋 (𝑥 (𝑥 𝑒− HASIL
× 𝜎) − µ) − µ)2
IPS 31,01581 5,56918 0,17956 -6,18519 38,25652 24,39198 48,78395 0,78420 0,45648 0,08197
IPA 22,07394 4,69829 0,21284 -9,40741 88,49931 12,35494 24,70988 3,58154 0,02783 0,00592
IPS IPA
MEANS 78,48148148 85,74074074
π 3,14 STANDAR DEV. 3,055555556 6,093661957
IPS IPA
MEANS 78,62962963 83,03703704
π 3,14 STANDAR DEV. 2,796051007 6,412757347
Rata-rata PKN = 79
1 (𝑥 − µ)2
√2 × 𝜋 × 𝜎 √2 × 𝜋 × 𝜎 2×𝜎2
(2 × 𝜋 (𝑥 (𝑥 𝑒− HASIL
× 𝜎) − µ) − µ)2 𝜎2 2
IPS 17,55920032 4,190369951 0,238642414 ×𝜎2
0,37037037 0,137174211 7,817901235 15,63580247 0,008773084 0,991265287 0,236557941
-
IPA 40,27211614 6,346031527 0,157578795 4,037037037 16,29766804 41,12345679 82,24691358 0,198155375 0,820242398 0,129252809
IPS IPA
MEANS 78,48148148 83,74074074
π 3,14 STANDAR DEV. 3,444444444 5,602027852
Rata-rata B.ING = 82
1 (𝑥 − µ)2
√2 × 𝜋 × 𝜎 √2 × 𝜋 × 𝜎 2×𝜎2
(2 × 𝜋 (𝑥 (𝑥 𝑒− HASIL
× 𝜎) − µ) − µ)2 𝜎2 2
IPS 21,63111111 4,650925834 0,215010954 ×𝜎2
3,518518519 12,37997257 11,86419753 23,72839506 0,521736617 0,593488989 0,127606634
-
IPA 35,18073491 5,931335002 0,168596109 1,740740741 3,030178326 31,38271605 62,7654321 0,048277821 0,952869023 0,160650009
e. Perhitungan Naïve Bayes pada rata-rata nilai IPA
IPS IPA
MEANS 83,85185185 81,88888889
π 3,14 STANDAR DEV. 4,368800723 4,576510073
Rata-rata IPA
= 77,66666667
1 (𝑥 − µ)2
√2 × 𝜋 × 𝜎 √2 × 𝜋 × 𝜎 2×𝜎2
(2 × 𝜋 (𝑥 (𝑥 𝑒− HASIL
× 𝜎) − µ) − µ)2 𝜎2 2
- ×𝜎2
IPS 27,43606854 5,237945068 0,190914564 6,185185185 38,25651578 19,08641975 38,17283951 1,002192037 0,367073919 0,070079757
-
IPA 28,74048326 5,361015133 0,186531837 4,222222222 17,82716049 20,94444444 41,88888889 0,425582081 0,653389349 0,121877915
IPS IPA
MEANS 76 78,88888889
π 3,14 STANDAR DEV. 3,636237372 2,713136766
IPS IPA
MEANS 76,66666667 82,37037037
π 3,14 STANDAR DEV. 3,851406669 5,645658225
Rata-rata MTK = 76
1 (𝑥 − µ)2
√2 × 𝜋 × 𝜎 √2 × 𝜋 × 𝜎 2×𝜎2
(2 × 𝜋 (𝑥 (𝑥 𝑒− HASIL
× 𝜎) − µ) − µ)2 𝜎2 2
- ×𝜎2
IPS 24,18683388 4,918011172 0,203334227 0,666666667 0,444444444 14,83333333 29,66666667 0,014981273 0,985130388 0,200310726
IPA 35,45473365 5,954387765 0,167943379 -6,37037037 40,58161866 31,87345679 63,74691358 0,636605231 0,529085502 0,088856407
Hasil akurasi
B IV
KESIMPULAN