Anda di halaman 1dari 6

Bayesian Networks

Bayesian network adalah representasi dari distribusi probabilitas gabungan satu set variabel acak
dengan kemungkinan hubungan kausal timbal balik. Jaringan terdiri dari node yang mewakili
variabel acak, edges antara pasangan node yang mewakili hubungan sebab akibat dari node ini,
dan distribusi probabilitas bersyarat di masing-masing node. Tujuan utama dari metode ini adalah
untuk memodelkan distribusi probabilitas kondisional hasil posterior dari variabel hasil (seringkali
kausal) setelah mengamati bukti baru. Bayesian networks dapat dibangun baik secara manual
dengan pengetahuan tentang domain yang mendasarinya, atau secara otomatis dari dataset besar
dengan perangkat lunak yang sesuai.

1 Introduction
Terkadang kita perlu menghitung probabilitas penyebab yang tidak pasti karena diberikan
beberapa bukti yang diamati. Sebagai contoh, kami ingin mengetahui kemungkinan penyakit
tertentu ketika kami mengamati gejala pada pasien. Masalah seperti itu seringkali sangat kompleks
dengan banyak variabel yang saling terkait. Mungkin dengan banyak gejala, dan bahkan lebih
banyak penyebab potensial. Dalam praktiknya, biasanya hanya dimungkinkan untuk mendapatkan
probabilitas kondisional yang terbalik (reversed conditional probability), yaitu probabilitas dari
bukti yang diberikan penyebabnya, probabilitas untuk mengamati gejala jika pasien memiliki
penyakit. Pendekatan Bayesian sesuai dalam kasus ini, sementara jaringan Bayesian, atau model
grafis alternatif, adalah alat yang sangat berguna untuk menangani tidak hanya dengan
ketidakpastian, tetapi juga dengan kompleksitas dan (bahkan lebih penting) kausalitas, Murphy
(1998). Jaringan Bayesian telah menemukan aplikasi mereka dalam penelitian hasil kesehatan dan
dalam analisis keputusan medis, tetapi pemodelan kejadian acak kausal dan distribusi probabilitas
mereka mungkin sama-sama membantu dalam ekonomi kesehatan atau dalam penelitian kesehatan
masyarakat.
Laporan teknis ini menyajikan ikhtisar singkat tentang metode ini dan memberikan pembaca
dengan instruksi dasar untuk menerapkan metode ini dalam praktik penelitian. Bagian 2
menjelaskan secara singkat latar belakang teoritis jaringan Bayesian. Selanjutnya, bagian 3
menyajikan instruksi tentang cara membangun jaringan Bayesian. Bagian 4 meninjau perangkat
lunak yang tersedia dan akhirnya bagian 5 dapat digunakan sebagai panduan melalui literatur yang
bermanfaat untuk studi lebih lanjut

2 Theoretical background
Bayesian network mewakili hubungan probabilistik kausal di antara seperangkat variabel acak,
ketergantungan kondisionalnya, dan menyediakan representasi kompak dari distribusi probabilitas
gabungan (joint probability distribution), Murphy (1998). Ini terdiri dari dua bagian utama:
directed acyclic graph dan satu set distribusi probabilitas bersyarat (set of conditional probability
distributions). Directed acyclic graph adalah seperangkat variabel acak yang diwakili oleh node.
Untuk pengukuran kesehatan, sebuah simpul (node) mungkin merupakan domain kesehatan, dan
status simpul tersebut akan menjadi respons yang mungkin untuk domain tersebut. Jika ada
ketergantungan probabilistik kausal antara dua variabel acak dalam graph, dua node yang sesuai
dihubungkan oleh directed edge, Murphy (1998), sedangkan directed edge dari node A ke node B
menunjukkan bahwa variabel acak A menyebabkan variabel acak B. Karena directed edges
mewakili ketergantungan probabilistik kausal statis, siklus (cycles) tidak diperbolehkan dalam
graph. Distribusi probabilitas bersyarat (conditional probability distribution) didefinisikan untuk
setiap node dalam grafik. Dengan kata lain, distribusi probabilitas bersyarat dari suatu simpul
(variabel acak) didefinisikan untuk setiap kemungkinan hasil dari simpul sebab akibat sebelumnya.
Sebagai ilustrasi, perhatikan contoh sepele berikut dari Cowel et al. (1999). Misalkan kita berusaha
menyalakan komputer kita, tetapi komputer itu tidak memulai (pengamatan/bukti). Kami ingin
tahu yang mana kemungkinan penyebab kegagalan komputer. Dalam ilustrasi yang
disederhanakan ini, kami mengasumsikan hanya dua kemungkinan penyebab kemalangan ini:
kegagalan listrik dan kerusakan komputer. Directed acyclic graph yang sesuai digambarkan pada
Gambar 1. Dua penyebab dalam contoh dangkal ini dianggap independen (tidak ada edge antara
dua node kausal), tetapi asumsi ini tidak diperlukan secara umum. Kecuali ada siklus dalam graph,
Bayesian networks mampu menangkap sebanyak mungkin hubungan sebab akibat yang diperlukan
untuk menggambarkan situasi kehidupan nyata secara kredibel.

Karena directed acyclic graph merepresentasikan suatu susunan hierarkis, maka tidak diragukan
untuk menggunakan istilah-istilah seperti parent, child, ancestor, atau descendant untuk simpul-
simpul tertentu, Spiegelhalter (1998). Pada Gambar 1, kegagalan listrik (electricity failure) dan
kerusakan komputer (computer malfunction) adalah nenek moyang (ancestors) dan orang tua dari
kegagalan komputer (computer failure); analoginya kegagalan komputer (computer failure) adalah
keturunan (descendant) dan anak dari kegagalan listrik (electricity failure) dan kerusakan
komputer (computer malfunction).
Tujuannya adalah untuk menghitung distribusi probabilitas bersyarat posterior (posterior
conditional probability distribution) dari masing-masing kemungkinan penyebab yang tidak
teramati mengingat bukti yang diamati, yaitu P [Cause|Evidence]. Namun, dalam praktiknya kita
sering hanya dapat memperoleh distribusi probabilitas kondisional sebaliknya (converse
conditional probability distribution) dari bukti mengamati diberikan penyebabnya, P[Evidence|
Cause]. Seluruh konsep Bayesian networks dibangun di atas teorema Bayes, yang membantu kita
untuk mengekspresikan distribusi probabilitas bersyarat (conditional probability distribution) dari
sebab yang diberikan bukti yang diamati menggunakan probabilitas kondisional sebaliknya dari
mengamati bukti yang memberikan penyebabnya:

Setiap simpul dalam Bayesian network selalu conditionally independent dari semua
nondescendants given that node’s parents. Oleh karena itu, distribusi probabilitas gabungan (joint
probability distribution) dari semua variabel acak dalam graph memfaktorkan ke dalam
serangkaian distribusi probabilitas kondisional dari variabel-variabel acak yang diberikan kepada
orang tua mereka. Oleh karena itu, kita dapat membangun model probabilitas penuh dengan hanya
menentukan distribusi probabilitas bersyarat (conditional probability distribution) di setiap node,
Spiegelhalter (1998).
Kembali ke contoh kita, kita mengandaikan bahwa kegagalan listrik (electricity failure),
dilambangkan dengan E, terjadi dengan probabilitas , dan kerusakan
komputer (computer malfunction), dilambangkan dengan M, terjadi dengan probabilitas
. Masuk akal untuk menganggap kegagalan listrik dan kerusakan
komputer sebagai independen. Lebih jauh kami berasumsi jika tidak ada masalah dengan listrik
dan komputer tidak memiliki kerusakan, komputer berfungsi dengan baik. Dengan kata lain, jika
C menunjukkan kegagalan komputer, maka . Jika tidak ada
masalah dengan listrik, tetapi komputer memiliki kerusakan, probabilitas kegagalan komputer
adalah . Akhirnya, jika listrik dimatikan, komputer
tidak akan mulai terlepas dari potensi kerusakannya, dan
. Dalam pengaturan ini, probabilitas kegagalan komputer
dapat dihitung sebagai
Kita dapat memahami probabilitas sebagai probabilitas kegagalan umum
komputer sebelumnya, sebelum kita mengamati bukti apa pun. Graphical model dengan distribusi
probabilitas sebelumnya, yaitu sebelum mengamati bukti apa pun, digambarkan pada Gambar 2.

Asumsikan sekarang bahwa kami telah mencoba menyalakan komputer, tetapi itu tidak dimulai.
Dengan kata lain, kami mengamati C = tidak dengan probabilitas 1 (no with probability 1) dan
kami bertanya-tanya bagaimana distribusi probabilitas kegagalan listrik E dan kerusakan komputer
M berubah mengingat bukti yang diamati. Menggunakan rumus Bayes, kami temukan

Model grafis dengan distribusi probabilitas posterior, yaitu setelah mengamati bukti (kegagalan
computer/computer failure), digambarkan pada gambar 3.
Perhatikan bahwa kegagalan yang diamati telah menyebabkan ketergantungan yang kuat antara
kemungkinan penyebab independen semula; misalnya, jika satu penyebab dapat dikesampingkan,
yang lainnya pasti terjadi, Cowel et al. (1999). Meskipun demikian, hasil di atas masih sangat tidak
membantu. Asumsikan perpanjangan contoh dengan memasukkan sepotong bukti lain dalam
model, khususnya kegagalan ringan (light failure) L. Kami berasumsi bahwa light failure tidak
tergantung pada kerusakan komputer (computer malfunction). Seperti sebelumnya, jika listrik
dimatikan, lampu tidak akan bersinar dalam keadaan apa pun, P[L = yes | E = yes] = 1. Jika tidak
ada masalah dengan listrik, kami menganggap masih ada 0,2 kemungkinan bahwa cahaya akan
padam (bola lampu rusak), P[L = yes | E = no] = 0.2. Dengan menggunakan algoritma yang sama
seperti sebelumnya, kami mendapatkan bahwa probabilitas sebelumnya P[L = yes] = 0.28. Model
grafis diperluas dengan distribusi probabilitas sebelumnya, sebelum mengamati bukti apa pun,
digambarkan pada Gambar 4.

Anda mungkin juga menyukai