HALAMAN JUDUL
PENERAPAN BAYESIAN NETWORK DALAM MEMPREDIKSI
MAHASISWA PENERIMA BEASISWA REKTOR
Oleh:
Komang Meike Diyantari
NIM 1513011017
Dosen Pembimbing :
Dr. I Nyoman Gita, M. Si.
NIP. 196208221989031001
Hari : Kamis
Tanggal : 28 Desember 2017
Mengetahui,
Dosen Pembimbing
Om Swastyastu
Puji syukur penulis panjatkan ke hadirat Tuhan Yang Maha Esa karena atas
berkat rahmat dan anugerah-Nya penulis dapat menyelesaikan makalah seminar
matematika tepat pada waktunya. Adapun judul makalah Seminar Matematika
yang penulis buat adalah “Penerapan Bayesian Network dalam Memprediksi
Mahasiswa Penerima Beasiswa Rektor”. Pada kesempatan ini penulis
mengucapkan terima kasih kepada:
1. Bapak Dr. I Nyoman Gita, M.Si. selaku dosen pembimbing dan dosen
pengampu mata kuliah seminar yang telah banyak membimbing serta
memotivasi penulis dalam pembuatan makalah ini.
2. Semua pihak yang telah membantu dalam penyusunan makalah ini.
Penulis menyadari bahwa makalah ini jauh dari sempurna, sehingga dengan
kerendahan hati penulis mohon maaf sebesar-besarnya jika ada kesalahan yang
terdapat dalam makalah ini dan penulis juga mengharapkan kritik dan saran yang
bersifat membangun dari para pembaca untuk lebih menyempurnakan makalah
ini. Semoga makalah ini bisa bermanfaat bagi semua pihak. Akhir kata penulis
sampaikan terimakasih atas perhatiannnya.
Om Santih, Santih, Santih, Om
Penulis
iv
PENERAPAN BAYESIAN NETWORK DALAM MEMPREDIKSI
MAHASISWA PENERIMA BEASISWA REKTOR
Oleh:
Komang Meike Diyantari
NIM. 1513011017
Program Studi S1 Pendidikan Matematika
Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Pendidikan Ganesha
ABSTRAK
Bayesian Network adalah pemodelan graf yang terdiri dari sekumpulan node
yang merepresentasikan variabel acak dan panah yang menunjukkan keterkaitan
antar node. Struktur Bayesian Network terdiri dari dua komponen yaitu Direct
Acyclic Graph (DAG dan Conditional Probability Table (CPT). Bayesian
Network merupakan suatu graf yang memperlihatkan besar perubahan peluang
suatu variabel jika satu atau lebih variabel lain berubah. Bayesian Network dapat
digunakan untuk memprediksi probabilitas dan dapat digunakan sebagai alat
pengambilan keputusan untuk memperbaharui tingkat kepercayaan informasi.
Langkah dalam membangun struktur Bayesian Network adalah pertama membuat
graf dengan memperhatikan hubungan dari masing-masing node kemudian
menentukan nilai peluang dari masing-masing node. Salah satu penerapannya
yaitu dapat digunakan dalam memprediksi apakah seorang mahasiswa akan
menerima beasiswa atau tidak.
v
DAFTAR ISI
HALAMAN JUDUL................................................................................................ i
LEMBAR PENGESAHAN ................................................................................... iii
SURAT PERNYATAAN....................................................................................... iii
KATA PENGANTAR ........................................................................................... iv
ABSTRAK .............................................................................................................. v
DAFTAR ISI .......................................................................................................... vi
DAFTAR GAMBAR ............................................................................................ vii
DAFTAR TABEL ................................................................................................ viii
BAB I PENDAHULUAN
1.1 Latar Belakang .......................................................................................... 1
1.2 Rumusan Masalah ..................................................................................... 3
1.3 Tujuan Penulisan ....................................................................................... 3
1.4 Manfaat Penulisan ..................................................................................... 3
1.5 Batasan Masalah ....................................................................................... 3
BAB II KAJIAN PUSTAKA
2.1 Teorema Bayes.......................................................................................... 4
2.2 Bayesian Network ..................................................................................... 5
2.3 Mutual Information ................................................................................... 9
BAB III PEMBAHASAN
3.1 Algoritma Membangun Struktur Bayesian Network............................... 10
3.2 Penerapan Metode Bayesian Network untuk Memprediksi Mahasiswa
Penerima Beasiswa Rektor ..................................................................... 11
BAB IV PENUTUP
4.1 Simpulan ................................................................................................. 19
4.2 Saran ....................................................................................................... 19
DAFTAR PUSTAKA
vi
DAFTAR GAMBAR
vii
DAFTAR TABEL
viii
BAB I
PENDAHULUAN
1
Conditional Probability Table (CPT) sebagai parameter. Struktur Bayesian
Network dapat dibangun dari data, dengan menggunakan berbagai algoritma yang
secara umum dikelompokkan ke dua metode, yaitu metode search and scoring
dan metode dependency analysis, masing-masing metode ini memandang
Bayesian Network dari sudut yang berbeda. Pada metode search and scoring
dilakukan pencarian untuk mendapatkan struktur yang cocok dengan data, dimana
proses konstruksi dilakukan secara iteratif, dimulai dari sebuah graf tanpa edge
kemudian menggunakan metode pencarian untuk menambahkan sebuah edge pada
graf dan berhenti ketika tidak ada struktur baru yang lebih baik dari struktur
sebelumnya, sedangkan pada metode dependency analysis, Bayesian Network
dipandang sebagai sebuah struktur yang merepresentasikan sekumpulan
kebebasan kondisional diantara variabel. Hubungan kebebasan kondisional
tersebut dapat ditemukan dengan menggunakan pengujian statistik misalnya
mutual information.
Naïve Bayes adalah metode pengklasifikasin dengan peluang yang mirip
dengan Bayesian Network. Bayesian Network dan Naïve Bayes merupakan metode
pengklasifikasian yang berdasarkan pada penerapan teorema Bayes. Namun
Bayesian Network dan Naïve Bayes memiliki perbedaan dalam menangani
hubungan antar variabel. Naïve Bayes mengasumsikan bahwa setiap variabel
saling bebas atau independen, dengan kata lain pada Naïve Bayes mengabaikan
korelasi antar variabel, sedangkan Bayesian Network adalah metode yang mampu
menangani variabel yang dependen dengan menggunakan bantuan DAG. Secara
teknis Naïve Bayes merupakan kasus khusus dari model Bayesian Network.
Menurut penelitian yang dilakukan oleh Renaldo Malau mahasiswa Universitas
Sanata Dharma pada tahun 2015, menyatakan bahwa algoritma Bayesian Network
lebih akurat dibandingkan dengan algoritma Naïve Bayes.
Berdasarkan latar belakang di atas, penulis pada kesempatan ini akan
menyajikan informasi tentang algoritma untuk membangun struktur Bayesian
Network dan penerapan metode Bayesian Network untuk memprediksi calon
penerima beasiswa dalam suatu makalah yang berjudul “Penerapan Bayesian
Network dalam Memprediksi Mahasiswa Penerima Beasiswa Rektor”.
2
1.2 Rumusan Masalah
Berdasarkan pemaparan latar belakang di atas, maka dapat dirumuskan
masalah yaitu sebagai berikut.
1. Bagaimana algoritma untuk membangun struktur Bayesian Network?
2. Bagaimana penerapan metode Bayesian Network untuk memprediksi
mahasiswa penerima Beasiswa Rektor?
3
BAB II
KAJIAN PUSTAKA
P( A Bn ) P( Bn )
P( Bn A) n 1,2,3,..., N
P( A B1 ) P( B1 ) ... P( A BN ) P( BN )
Dengan :
P( Bn ) : probabilitas prior, yaitu probabilitas berdasarkan informasi yang
ada.
P( A Bn ) : probabilitas transisi, yaitu probabilitas dimana terjadinya suatu
4
2.2 Bayesian Network
Definisi Bayesian Network menurut beberapa tokoh yakni, menurut
Heckerman (1995) “ A Bayesian Network is a graphical model that encodes
probabilistic relationships among variabel of interest”. Menurut Neapolitan,
Bayesian Network dapat mempresentasikan hubungan sebab akibat diantara
variabel-variabel yang terdapat pada struktur Bayesian Network. Menurut Korb
(2011) Bayesian Network adalah sebuah struktur grafis yang mempresentasikan
domain yang tidak pasti, node dalam Bayesian Network merepresentasikan
sekumpulan variabel acak. Bayesian Network menurut Vidakovic merupakan
directed acyclic graph (DAG) dimana node merepresentasikan variabel acak dan
arah panah menunjukkan ketergantungan. Berdasarkan beberapa definisi tersebut
dapat disimpulkankan bahwa Bayesian Network adalah pemodelan graf yang
terdiri dari sekumpulan node yang merepresentasikan variabel acak dan panah
yang menunjukkan keterkaitan antar node. Sebagai contoh, Bayesian Network
dapat mewakili hubungan antara penyakit dan gejala. Bayesian Network dapat
digunakan untuk menghitung probabilitas dari berbagai gejala penyakit dan dapat
digunakan sebagai alat pengambilan keputusan untuk memperbaharui tingkat
kepercayaan informasi.
Bayesian Network merupakan teori yang berasal dari teorema Bayes.
Bayesian Network (BN) adalah sebuah model grafik yang merepresentasikan
sebuah interaksi antar variabel. Bayesian Network merupakan suatu graf yang
memperlihatkan besar perubahan peluang suatu variabel jika satu atau lebih
variabel lain berubah. Bayesian Network digambarkan sebagai graf yang terdiri
dari node yang menunjukkan variabel acak dan panah yang menunjukkan
hubungan antar node. Misalkan terdapat node X dan node Y, jika terdapat panah
dari node X ke node Y maka ini menunjukkan variabel X ada pengaruhnya
terhadap variabel Y. Pengaruh ini dinyatakan dengan peluang bersyarat P(Y X ) .
Node X merupakan parent (induk) dari node Y, dan node Y adalah child (anak)
dari node X.
5
X Y
Bayesian Network terdiri dari dua komponen yaitu komponen kualitatif dan
komponen kuantitatif. Komponen kualitatif berupa sebuah directed acyclic graph
(DAG) yang terdiri dari node yang menggambarkan suatu variabel acak dan anak
panah menggambarkan suatu probabilistic dependence. Komponen kuantitatif
berupa hubungan keterkaitan antar variabel yang ditunjukkan dengan conditional
probability untuk setiap variabel di dalam jaringan yang biasa disajikan dalam
bentuk tabel atau dikenal dengan conditional probability table (CPT). Jika node Y
tidak memiliki induk, maka tabel hanya berisi peluang prior yaitu P(Y). Jika node
Y hanya memiliki satu induk, misal node X, maka tabel berisi peluang bersyarat
P(Y X ) . Jika node Y memiliki banyak induk ( X1, X2, …, Xk), maka tabel akan
P( A) P(B)
A B
P(C A, B) C D
P ( D B)
P( E C )
F
P( F C, E)
6
2.2.1 Tipe Koneksi dalam Bayesian Network
1. Koneksi Serial
Ilustrasi tipe koneksi serial terlihat pada Gambar 2.3. Nilai node A akan
memengaruhi probabilitas node B dan nilai node B akan memengaruhi
probabilitas node C, demikian juga sebaliknya nilai node C akan memengaruhi
probabilitas node B dan nilai node B akan memengaruhi probabilitas node A.
A B C
B F
C D E
7
3. Koneksi Konvergen
D
C E
B
F
Gambar 2.5 merupakan ilustrasi dari tipe koneksi konvergen. Jika tidak ada
informasi yang diketahui pada node A, maka informasi diantara node-node parent
dari A, yaitu B, C, …,F akan independen, sehingga nilai yang berada pada node-
node parent tersebut tidak akan mempengaruhi probabilitas node-node lain.
Tetapi ketika nilai dari A diketahui maka node-node parent A akan menjadi saling
tergantung, yaitu nilai untuk node-node parent akan mempengaruhi probabilitas
node parent yang lain.
Sebagai contoh, JPD dari struktur Bayesian Network pada Gambar 2.2
adalah
P(U ) P( A, B, C , D, E , F )
P( A) P( B) P(C A, B) P( D B) P( E C) P( F C, E)
8
2.2.3 Conditional Independence dan d-Separation
Conditional independence atau bebas bersyarat dinotasikan dengan
I ( X , Y Z ) yang menunjukkan bahwa variabel X dan Y disebut bebas bersyarat
jika nilai dari variabel Z diketahui. Variabel X dan Y akan saling bebas
berdasarkan Z jika memenuhi persamaan P( X Y , Z ) P( X Z ) . Persamaan
tersebut menunjukkan bahwa jika nilai dari variabel Z diketahui maka tidak ada
informasi dari Y yang akan mempengaruhi probabilitas dari variabel X. Contoh
dari hubungan bebas bersyarat dapat dilihat pada Gambar 2.2, node A, C, dan F.
Node A dan node F dikatakan bebas bersyarat jika nilai dari node C telah
diketahui.
Sedangkan d-separation merupakan bagian dari konsep bebas bersyarat.
Node X dikatakan d-separation dengan node Y oleh node Z, jika semua jalur yang
menghubungkan node X ke node Y diblok oleh node Z.
9
BAB III
PEMBAHASAN
Dimana P ( A, B )
min( A, B) .................................................... (2)
N
P ( A)
( A) , dan P( B) ( B) .............................................. (3)
N N
Apabila nilai MI lebih dari 0 selanjutnya akan ditentukan arah relasi dari
node-node tersebut. Untuk menentukan arah relasi antara dua node dari
struktur BN yang akan dibangun dapat menggunakan hasil perhitungan
conditional probability sebagai berikut
P( A, B) P( A, B)
P( A B) dan P( B A) ................................... (4)
P( B) P( A)
10
2. Menentukan probabilitas setiap node, Bayesian Network didasari dengan
pendekatan statistik yaitu dengan teorema Bayes. Dalam teorema ini
digunakan conditional probability yang merupakan peluang suatu kejadian
A dengan syarat kejadian B sudah terjadi sebelumnya yang dinotasikan
dengan P( A B) . Selain itu, terdapat juga joint probability yang merupakan
11
Tabel 3.1 Data Penerima Beasiswa Rektor
Mengikuti Penghasilan
No Semester IPK >3 Keputusan
Ekstrakulikuler Orang Tua
1 1 Ya Ya 1 Juta Lulus
2 5 Ya Tidak 1 Juta Lulus
3 1 Tidak Ya 1 Juta Tidak Lulus
4 1 Ya Tidak 1 Juta Lulus
5 3 Tidak Tidak >1 Juta Tidak Lulus
6 3 Ya Ya >1 Juta Lulus
7 5 Ya Tidak >1 Juta Tidak Lulus
8 5 Ya Tidak 1 Juta Lulus
9 5 Ya Ya 1 Juta Lulus
10 1 Tidak Tidak >1 Juta Tidak Lulus
11 1 Ya Tidak >1 Juta Tidak Lulus
12 1 Ya Tidak >1 Juta Tidak Lulus
13 3 Ya Ya 1 Juta Lulus
14 5 Tidak Ya >1 Juta Tidak Lulus
15 1 Tidak Tidak 1 Juta Tidak Lulus
16 3 Ya Tidak 1 Juta Lulus
17 1 Ya Tidak 1 Juta Lulus
18 1 Ya Tidak 1 Juta Lulus
19 5 Tidak Tidak >1 Juta Tidak Lulus
20 3 Ya Ya 1 Juta Lulus
12
Hasil pembobotan sebagai berikut.
Tabel 3.2 Pembobotan Data Penerima Beasiswa Rektor
No Semester IPK >3 Mengikuti Penghasilan Keputusan
Ekstrakulikuler Orang Tua
1 1 1 1 1 1
2 0 1 0 1 1
3 1 0 1 1 0
4 1 1 0 1 1
5 1 0 0 0 0
6 1 1 1 0 1
7 0 1 0 0 0
8 0 1 0 1 1
9 0 1 1 1 1
10 1 0 0 0 0
11 1 1 0 0 0
12 1 1 0 0 0
13 1 1 1 1 1
14 0 0 1 0 0
15 1 0 0 1 0
16 1 1 0 1 1
17 1 1 0 1 1
18 1 1 0 1 1
19 0 0 0 0 0
20 1 1 1 1 1
Σ 14 14 7 12 11
13
Nilai kolom P(Node 1) dan P(Node 2) dapat dicari dengan persamaan (3). Untuk
kolom P(Node 1, Node 2) menggunakan persamaan (2) dan nilai kolom MI(Node
1, Node 2) menggunakan persamaan (1). Setelah diperoleh nilai MI dari masing-
masing node, selanjutnya ditentukan node-node yang memiliki relasi yaitu dengan
syarat MI(Node 1, Node 2) >0. Berdasarkan tabel diatas maka node-node yang
memiliki relasi adalah Semester-IPK, Semester-Ekstra, IPK-Ekstra, IPK- Lulus,
Ekstra-Lulus, dan Penghasilan-Lulus. Selanjutnya yaitu memnentukan arah dari
relasi yang memiliki hubungan detentukan dengan menghitung nilai conditional
probability dengan menggunakan persamaan (4).
Tabel 3.4 Hasil Perhitungan Conditional Probability
P( Node1 Node2) P( Node2 Node1)
Node 1 Node 2 Arah Relasi
Ekstra
Semester Lulus
IPK Penghasilan
14
Langkah selanjutnya yaitu menentukan nilai probabilitas dari masing-
masing node. Adapun nilai probabilitas tersebut sebagai berikut.
Tabel 3.5 Nilai Probabilitas Node Ekstrakulikuler
Ekstra
P(E) 0,35
15
3.2.2 Contoh Pengambilan Keputusan Menggunakan Bayesian Network
Pada sub bab sebelumnya telah diperoleh struktur dari Bayesian Network
baik itu graf asiklik yang mempresentasikan keterkaitan antar node/kriteria
maupun CPT dari masing-masing node/kriteria dari data penerima beasiswa
rektor. Struktur inilah yang dapat digunakan untuk memprediksi suatu keputusan
apabila ada seorang pelamar ingin mengajukan lamaran penerimaan beasiswa
rektor.
Berikut akan disajikan tiga kasus prediksi untuk menentukan seseorang akan
lulus menerima beasiswa (L) atau tidak (~𝐿).
1. Kasus 1 : Tanpa informasi awal
Kasus ini belum ada informasi yang diketahui dari pelamar. Jadi untuk
dapat memprediksi dia akan lulus atau tidak dapat ditentukan dengan
membandingkan nilai probabilitas lulus (L) dengan tidak lulus (~𝐿). Nilai
m
probabilitasnya dapat diperoleh dengan dengan rumus P( xi ) P( xi , y j ) .
j i
16
Selanjutanya nilai probabilitas seorang pelamar lulus jika diketahui
penghasilan orang tua di bawah atau sama dengan 1 juta diperoleh sebagai berikut
𝑃(𝑃|𝐿) ×𝑃(𝐿)
𝑃(𝐿|𝑃) = 𝑃(𝑃)
0,909×0,55
= 0,6
= 0,883
P(~𝐿|𝑃)= 1- 𝑃(𝐿|𝑃)= 1- 0,883 = 0,167
Jadi dari hasil perhitungan tersebut dapat disimpulkan bahwa pelamar
dengan orang tua yang penghasilannya di bawah atau sama dengan 1 peluang
untuk lulus itu lebih besar.
17
1×0,714
= 1×0,714+0×0,286
=1
Jadi dapat disimpulkan bahwa apabila pelamar memiliki nilai IPK di atas 3
dan aktif mengikuti ekstrakulikuler pelamar sangat berpeluang untuk lulus atau
menerima beasiswa rektor.
18
BAB IV
PENUTUP
4.1 Simpulan
Berdasarkan pembahasan pada bab sebelumnya, dapat disimpulkan hal-hal
sebagai berikut.
a. Bayesian Network adalah suatu graf yang digunakan untuk
mempresentasikan suatu kondisi yang tidak pasti. Bayesian Network
merupakan suatu graf yang memperlihatkan besar perubahan peluang
suatu variabel jika satu atau lebih variabel lain berubah. Graf tersebut
terdiri dari dua komponen yaitu Direct Acyclic Graph (DAG dan
Conditional Probability Table (CPT).
b. Metode Bayesian Network merupakan salah satu metode yang dapat
digunakan untuk mempermudah dalam mengambil keputusan. Bayesian
Network dapat digunakan untuk memprediksi peluang suatu kejadian
apabila kejadian lain diketahui. Salah satu penerapannya yaitu dalam
memprediksi keputusan yang diperoleh oleh pelamar beasiswa rektor.
Dengan Bayesian Network seseorang dapat mengetahui besar peluang ia
lulus atau tidak lulus.
4.2 Saran
Pembahasan yang dikaji dalam makalah seminar ini adalah bagaimana
langkah dalam membuat struktur Bayesian Network dan bagaimana penerapan
dalam memprediksi mahasiswa yang menerima beasiswa rektor. Apabila pembaca
ingin mengkaji lebih lanjut tetang topik yang serupa, maka disarankan
kembangkanlah mengenai penerapan Bayesian Network dalam kasus lainnya.
19
DAFTAR PUSTAKA