Process Discovery
Semester Ganjil 2022/2023
FAKULTAS INFORMATIKA
AGENDA
• Alpha miner
• Heuristics miner
• Fuzzy miner
• Inductive miner
FAKULTAS INFORMATIKA
PROCESS DISCOVERY
• Algoritma alpha (a) atau alpha miner (van der Aalst, 2004a) adalah salah satu algoritma process
discovery pertama yang dapat menghasilkan Petri net berdasarkan data dalam event log.
• Algoritma a sederhana dan dapat mengatasi konkurensi, tapi tidak dapat mengatasi masalah
dengan noise, pola yang jarang muncul/ tidak lengkap, dan struktur yang kompleks.
• Input awal dari algoritma a adalah event log L yang mengandung aktivitas 𝒜, yaitu, 𝐿 ∈ 𝔹(𝒜 ∗ ).
Kumpulan aktivitas (A, B, … Í 𝒜) terdiri atas aktivitas individual (a, b, .. Î 𝒜). Output dari
algoritma a adalah Petri net yang bertanda.
FAKULTAS INFORMATIKA
• Sebagai contoh, L1 = [<a, b, c, d>3, <a, c, b, d>2, <a, e, d>]. Dari L1 dapat ditemukan relasi:
• >!! = {(a, b), (a, c), (a, e), (b, c), (c, b), (b, d), (c, d), (e, d)}
• →!! = {(a, b), (a, c), (a, e), (b, d), (c, d), (e, d)}
• #!! = {(a, a), (a, d), (b, b), (b, e), (c, c), (c, e), (d, a), (d, d), (e, b), (e, c), (e, e)}
• Algoritma heuristics miner (Weijters, van der Aalst and Medeiros, 2006) menggunakan konsep dasar graf
dependensi, menggunakan representasi serupa dengan causal nets dan membangun model dengan
mempertimbangkan frekuensi beserta urutan events.
• Algoritma heuristics miner melakukan process discovery dengan menganalisis dependensi kausal, yaitu jika
sebuah aktivitas selalu diikuti oleh aktivitas lain maka kemungkinan ada relasi dependensi antara kedua
aktivitas tersebut.
• Algoritma heuristics miner menambahkan relasi urutan aktivitas, sebagai berikut:
• 𝑎 >𝐿 𝑏 (directly follow) jika dan hanya jika ada trace 𝜎 =< 1, 𝑡2 , 𝑡3 , . . . , 𝑡𝑛 > dan 𝑖 ∈ {1, … , 𝑛 − 1} dimana 𝜎 ∈ 𝐿 dan 𝑡𝑖 = 𝑎 dan 𝑡𝑖+1 = 𝑏;
• 𝑎 →𝐿 𝑏 (dependency) jika dan hanya jika 𝑎 >𝐿 𝑏 dan 𝑏 ≯𝐿 𝑎;
• 𝑏||𝐿 𝑎 (concurrent) jika dan hanya jika 𝑎 >𝐿 𝑏 dan 𝑏 >𝐿 𝑎; dan
• 𝑎#𝐿 𝑏 (never follow) jika dan hanya jika 𝑎 ≯𝐿 𝑏 dan 𝑏 ≯𝐿 𝑎.
• 𝑎 >>𝐿 𝑏 (short loop) jika dan hanya jika ada trace 𝜎 =< 1, 𝑡2 , 𝑡3 , . . . , 𝑡𝑛 > dan 𝑖 ∈ {1, … , 𝑛 − 2} dimana 𝜎 ∈ 𝐿 dan 𝑡𝑖 = 𝑎 dan 𝑡𝑖+1 = 𝑏 dan
𝑡𝑖+2 = 𝑎;
• 𝑎 >>>𝐿 𝑏 (eventually follow) jika dan hanya jika ada trace 𝜎 =< 1, 𝑡2 , 𝑡3 , . . . , 𝑡𝑛 > dan i < j dan 𝑖, 𝑗 ∈ {1, … , 𝑛} dimana 𝜎 ∈ 𝐿 dan 𝑡𝑖 = 𝑎 dan
𝑡𝑗 = 𝑏;
FAKULTAS INFORMATIKA
• Contoh event log L2 yang akan digunakan untuk menjelaskan konsep dasar algoritma heuristics miner.
L2 = [<a, e>5, <a, b, c, e>10, <a, c, b, e>10, <a, b, e>1, <a, c, e>1, <a, d, e>10, <a, d, d, e>2, <a, d, d, d, e>1]
• Jika diasumsikan bahwa tiga traces dengan frekuensi satu adalah noise, maka tersisa 37 traces dari L2.
• Petri net dengan algoritma alpha:
FAKULTAS INFORMATIKA
• Heuristics miner mengatasi persoalan ini dengan mempertimbangkan frekuensi. Tabel frekuensi relasi
directly follows: | >𝑳 | a b c d e
a 0 11 11 13 5
b 0 0 10 0 11
c 0 10 0 0 11
d 0 0 0 4 13
e 0 0 0 0 0
• Selanjutnya, dihitung nilai dependensi antara setiap pasang activities, dengan rumus:
𝑎 >; 𝑏 − 𝑏 >; 𝑎
𝑖𝑓 𝑎 ≠ 𝑏
𝑎 >; 𝑏 + 𝑏 >; 𝑎 + 1
𝑎 ⇒; 𝑏 =
𝑎 >; 𝑎
𝑖𝑓 𝑎 = 𝑏
𝑎 >; 𝑎 +1
FAKULTAS INFORMATIKA
• Graf dependensi:
FAKULTAS INFORMATIKA
• Algoritma ini menerapkan konsep peta jalan, dimana pengguna peta dapat berfokus pada detail
peta yang berbeda, misalnya hanya menampilkan jalan utama, menampilkan jalan utama dan
rumah-rumah makan, menampilkan detail sampai ke gang-gang terkecil, menampikan lokasi-
lokasi wisata di daerah tertentu, mengabaikan detail yang tidak perlu, memberikan penekanan
berupa warna, ukuran, atau kontras, dst.
• Dengan fuzzy miner, analis process mining dapat memilih detail aktivitas dalam proses dengan
frekuensi tertentu, memilih nama-nama aktivitas yang hendak dianalisis, serta memilih dengan
karakteristik lain yang ditentukan.
FAKULTAS INFORMATIKA
• Signifikansi dapat diterapkan pada activities dan relasi antar activities, untuk mengukur tingkat kepentingan relatif.
Salah satu cara mengukur signifikansi adalah dengan frekuensi, yaitu events atau relasi yang sering muncul berarti
lebih signifikan.
• Sedangkan korelasi berkaitan dengan relasi antar events, untuk mengukur seberapa dekat relasi antara dua
events. Dua events yang memiliki korelasi tinggi adalah dua events yang sering muncul bersama dalam dataset.
• Berdasarkan kedua metriks tersebut, proses simplifikasi dalam fuzzy miner dilakukan dengan pendekatan:
- Perilaku dengan signifikansi tinggi dipertahankan/ ditampilkan dalam model proses.
- Perilaku yang kurang signifikan tapi korelasinya tinggi diagregasi, yaitu dibungkus dalam bentuk ringkasan pada model proses.
- Perilaku yang kurang signifikan dan korelasinya rendah diabstraksikan, yaitu dihapus dari model proses.
FAKULTAS INFORMATIKA
• Process tree adalah representasi abstrak dari jaringan block-structure. Process tree bersifat hirarkis dan
terdiri atas banyak nodes dengan cabang-cabang anaknya.
• Dalam process tree, sebuah node menggambarkan perilaku cabang2 anaknya. Terdapat enam tipe nodes,
yaitu:
FAKULTAS INFORMATIKA
• Sebagai contoh, sebuah process tree yang terdiri atas: sequence(xor(a,b), concurrent(c,d), interleaved(e,f))
Terimakasih