Abstrak—Kecelakaan lalu lintas merupakan suatu peristiwa dijalan yang tidak dapat diduga dan tidak disengaja yang
melibatkan kendaraan atau dengan tanpa pengguna jalan lain yang mengakibatkan korban manusia dan kerugian harta benda.
Selama tahun 2013 sampai 2017 telah terjadi kecelakaan lalu lintas (Lakalantas) sebanyak 1726 kasus di Kota Pekanbaru dan
terus bertambah setiap tahunnya. Dimana data-data kecelakaan lalu lintas tersebut hanya digunakan sebagai bahan
rekapitulasi dan publikasi bagi pihak Polresta atau bagi pihak terkait. Berdasarkan permasalahan yang terjadi maka
digunakan suatu teknik datamining yang dapat mencari pola kecelakaan lalu lintas. Asosiasi merupakan suatu prosedur untuk
mencari hubungan tiap item dalam suatu dataset yang digunakan dan algoritma yang digunakan adalah FP-Growth yang
merupakan salah satu algoritma dalam penentuan himpunan data yang paling sering muncul pada sekumpulan data. Hasil dari
penggunaan algoritma FP-Growth dengan minimum support 1% dan confidence 10% menghasilkan 5557 pola dari seluruh data
kecelakaan dan 168 pola yang mencapai tujuan penelitian yaitu pola 5 itemset.
Kata Kunci: asosiasi, confidence, datamining, frequent itemset, FP-Growth, kecelakaan lalu lintas, support
Abstract—Traffic accidents are an unpredictable and unintentional road event involving a vehicle or with no other road user
resulting in human casualties and property losses. During the years 2013 to 2017 there have been traffic accidents (Lakalantas) as
many as 1726 cases in Pekanbaru and continue to grow every year. Where traffic accident data is only used as a recapitulation
material and publication for the party of Polresta or for related parties. Based on the problems that occur then used a datamining
technique that can find the pattern of traffic accidents. The Association is a procedure to search for the relationship of ea ch item in
a dataset used and the algorithm used is FP-Growth which is one of the algorithms in determining the dataset that most commonly
appears in a set of data . Results of the use of FP-Growth algorithms with a minimum of 1% support and confidence 10% resulted in
5557 patterns of the entire data accident and 168 patterns that reached the research goal of pattern 5 itemset.
Keywords: associations, confidence, datamining, frequent itemset , FP-Growth, traffic accidents, support
sebuah metode dalam data mining untuk mencari frequent 1. Luka ringan adalah korban yang mengalami luka-
itemset tanpa menggunakan candidate generation. FP- luka yang tidak harus dirawat lama seperti luka
growth ini merupakan pengembangan dari algoritma goresan.
apriori. Kekurangan dari algoritma apriori diperbaiki 2. Luka berat adalah korban yang kerena luka-lukanya
dengan menghilangkan candidate generation, karena FP- menderita cacat tetap atau harus dirawat dalam
growth menggunakan konsep pembangunan tree dalam jangka waktu lebih dari 30 hari sejak terjadinya
pencarian frequent itemset. Hal tersebut membuat kecelakaan.
algoritma FP-growth lebih cepat dibandingkan algoritma 3. Meninggal adalah korban yang dipastikan mati
apriori. sebagai akibat kecelakaan lalu lintas dalam waktu
Penelitian yang dilakukan [9] “implementasi paling lama 30 hari setelah kejadian tersebut.
algoritma FP-Growth pada aplikasi prediksi persediaan
sepeda motor”. FP-Growth merupakan salah satu
algoritma yang dapat digunakan untuk menentukan B. Pengertian Umur
himpunan data yang paling sering muncul (frequent Umur adalah lamanya waktu hidup yaitu terhitung
itemset) dalam sekumpulan data. Berdasarkan penelitian sejak lahir sampai dengan sekarang. Penentuan umur
[2] “penerapan data mining menggunakan algoritma FP- dilakukan dengan menggunakan hitungan tahun. usia
Tree dan FP-Growth pada data transaksi penjualan obat” adalah “umur individu yang terhitung mulai saat dilahirkan
algoritma FP-growth dapat diimplementasi dengan sampai berulang tahun”[3].
menggunakan database penjualan obat karena dapat Pembagian umur berdasarkan psikologi
menemukan pola kombinasi itemsets. Sehingga informaasi perkembangan [11] terbagi atas tingkatan umur manusia
tersebut dapat membantu mengembangkan strategi pada Tabel 1.
.
penjualan terhadap konsumen. Tabel 1. Pembagian Umur
Pada penelitian ini, peneliti telah menganalisi No Masa Umur
variabel-variabel yang akan digunakan dalam penelitian 1 Bayi Dari lahir hingga 18 atau 24 bulan
ini. Variabel atau atribut yang akan digunakan adalah jenis 2 Anak awal 24 bulan - 5 atau 6 tahun
kelamin, umur, tempat kejadian (kecamatan), kendaraan, 3 Anak tengah 6 - 11 tahun
4 Remaja awal 12 - 15 tahun
jenis luka. Penelitian ini menggunakan teknik association 5 Remaja akhir 15 - 19 tahun
rule dengan menggunakan algoritma FP-growth untuk 6 Dewasa awal 20 – 30 tahun
mengetahui pola yang terbentuk dari faktor-faktor yang 7 Dewasa tengah 31 – 59 tahun
mempengaruhi terjadinya kecelakaan lalu lintas. Penelitian 8 Dewasa akhir 60 - kematian
ini diharapkan dapat membantu sistem yang ada untuk
menghasilkan pengetahuan baru yang lebih bermanfaat C. Association Rule
bagi pihak Satuan Lalu Lintas Polresta Pekanbaru.
Association Rule merupakan suatu prosedur untuk
mencari hubungan tiap item dalam suatu dataset yang
II. LANDASAN TEORI
digunakan. Pada assotiation rule memberikan informasi
dalam bentuk “ if - then” atau “jika - maka”. Istilah jika
diwakili dengan antecedent sedangkan maka diwakili
A. Kecelakan Lalu Lintas dengan istilah consequent.
“Kecelakaan lalu lintas merupakan suatu kejadian atau Pada association rule terdapat istilah support.
peristiwa dimana beberapa kendaraan saling Support merupakan suatu ukuran yang menunjukkan
bersinggungan sehingga menyebabkan kerugian baik seberapa besar tingkat dominasi suatu itemset dari
dalam bentuk materi maupun kesehatan. Terdapat lima kesuluruhan transaksi. Untuk mencari nilai support 1-
jenis dan bentuk kecelakaan lalu lintas, yaitu: berdasarkan itemset menggunakan persamaan (1) sedangkan untuk
korban kecelakaan, berdasarkan lokasi kejadian, mencari nilai 2-itemset menggunakan persamaan (2) di
berdasarkan waktu terjadinya, berdasarkan posisi bawah ini.
kecelakaan, dan berdasarkan jumlah kendaraan yang ( )
terlibat” [1].
............(1)
Kecelakaan lalu lintas merupakan suatu masalah yang
perlu mendapatkan perhatian yang lebih dari pihak ( )
pemerintah maupun masyarakat. Ada beberapa faktor yang ........(2)
menyebabkan terjadinya kecelakaan lalu lintas diantara
sebagai berikut: Untuk mencari hubungan antara dua atau lebih item
secara conditional disebut dengan istilah confidence.
1. Faktor manusia Misalnya “jika A maka B” bentuk demikian disebut sebagi
2. Faktor kendaraan pola hubungan. Jika pola hubungan nilai confidence
3. Faktor jalan dan lainnya
dibawah threshold maka bisa diabaikan. Persamaan rumus
4. Faktor cuaca
confidence dijelaskan pada persamaan 2.3 di bawah ini:
PP RI No. 43 tahun 1993 tentang prasarana dan lalu ( )
lintas mendefinisikan kriteria korban kecelakaan lalu lintas
.......(3)
sebagai berikut:
92 Seminar Nasional dan Expo Teknik Elektro 2019
Salah satu algoritma yang merupakan teknik asosiasi pada support count akan dibangkitkan dengan conditional
data mining adalah algoritma Frequent Pattern Growth FP-Tree.
(FP-growth).
3. Pencarian Frequent item set
1. Algoritma Frequent Pattern-Growth (FP-Growth) Pada tahapan ini penentuan conditional FP-Tree. Jika
Frequent Pattern-Growth (FP-Growth) merupakan conditional FP-Tree yang terbentuk adalah lintasan
salah satu alternative algoritma yang bisa digunakan dalam tunggal (single path) maka dapat melakukan
penentuan himpunan data yang paling sering muncul kombinasi item untuk setiap conditional FP-
(frequent itemset) pada sebuah kumpulan data [9]. Treedengan tujuan untuk memperoleh frequent item
Untuk mencari frequent itemset dengan menggunakan set.
FP-growth adalah dengan cara menggunakan FP-tree yang
merupakan perluasan dari pohon prefix. Langkah pertama 4. Lift Rasio
yang dilakukan yaitu pembentukan FP-tree. Setelah Untuk mengevaluasi kuat tidaknya sebuah aturan
pembentukan FP-tree dapat diterapkan algoritma FP- asosiasi maka bisa menggunakan lift rasio. Lift rasio
growth untuk langsung mengekstrak frequent itemset dari merupakan perbandingan antara confidence sebuah aturan
FP-tree yang telah ada dengan menggunakan prinsip dengan dengan nilai benchmark confidence. Sedangkan
devide and conquer. Benchmark Confidence merupakan perbandingan antara
jumlah semua item yang menjadi consequent terhadap
2. Pembentukan Frequent Pattern Tree (FP-Tree) jumlah total transksi.
Untuk mencari frequent itemset dengan algoritma Rumus untuk mencari adalah
FP-Growth dapat menggunakan struktur data perluasan
..............(4)
dari penggunaan sebuah pohon prefix atau disebut FP-
Tree. Setelah menggunakan FP-Tree maka algoritma FP- Keterangan :
Growth bisa mengekstrak frequen titemset dari FP-Tree Nc = Jumlah transaksi dengan item yang menjadi
yang telah dibentuk dengan menggunakan prinsip devide consequent.
and conquer [9]. N = Jumlah transaksi basis data
FP-Tree dibangun dengan cara memetakan setiap Sedangkan rumus untuk mencari lift rasio yaitu :
( )
data transaksi ke dalam lintasan tertentu. Jika terdapat ..............(5)
( )
transaksi yang memiliki item yang sama maka lintasan
Jika nilai lift rasio lebih besar dari 1 maka
yang terbentuk akan tejadinya saling menimpa. Proses
menunjukkan rule atau aturan tersebut ada manfaat dan
pemampatan dengan struktur FP-Tree akan efektif jika
bisa digunakan. Lebih tinggi nilai lift rasio maka lebih
banyak terdapat data transaksi yang memiliki item yang
besar kekuatan asosiasinya.
sama [9].
Pembangunan FP-Tree dimulai dari pembentukan
sebuah akar yang diberi label null, selanjutnya terdiri dari III. METODOLOGI PENELITIAN
sekumpulan pohon yang beranggotakan item-item tertentu.
Pada setiap simpul FP-Tree memiliki beberapa informasi, Dalam melakukan sebuah penelitian perlu adanya
yaitu Label item menjelaskan jenis item yang suatu prosedur yang dapat menjadi alur peneliti, sehingga
direpresentasikan oleh simpul tersebut, Support count terbentuk suatu hasil yang diharapkan. Maka dibuatlah
merepresentasikan total lintasan transaksi yang melalui metodologi penelitian yang akan dijelaskan dalam Gambar
simpul tersebut dan Pointer merupakan penghubung yang 1.
menghubungkan simpul-simpul dengan label item sama
pada tiap lintasan yang ditandai dengan garis panah putus- A. Analisa Kebutuhan Data
putus. Pada tahapan ini dilakukan pengumpulan data yang
akan digunakan pada penelitian. Dimana penjelasan
3. Penerapan Frequent Pattern Growth (FP-growth) terhadap sumber data, periode data dan jumlah data yang
Setelah tahap pembangunan FP-tree dari sekumpulan akan digunakan seperti berikut ini:
data selesai maka langkah selanjutnya yaitu penerapan 1. Sumber data penelitian diperoleh dari Polresta
algoritma FP-growth yang bertujuan untuk mencari Pekanbaru
frequent itemset. Algoritma FP-Growth terdiri dari 3 2. Data yang digunakan dari tahun 2013 sampai 2017.
langkah utama [9], yaitu : 3. Jumlah data terdiri 1726 record dengan 11 atribut.
1. Pembangkitan Conditional Pattern Base 4. Adapun atribut dari data tersebut dapat dillihat pada
Pada tahapan ini dilakukan pembangkitan conditional Tabel 2.
pattern base. Conditional Pattern Base adalah
subdata yang memiliki lintasan prefix (prefix path )
dan pola akhiran (suffix pattern). Pembangkitan ini
diperoleh dari hasil pembangunan FP-Tree.
2. Pembangkitan Conditional FP-Tree
Pada tahapan ini dilakukan penjumlahan terhadap
support count dari setiap item pada setiap
conditional pattern base. Setiap itemyang jumlah
support count lebih besar atau sam dengan minimum
Irwanto dkk.: Penerapan Algoritma Fp-Growth dalam Menentukan Pola Kecelakaan Lalu 93
Lintas
Data_Kedaraan Input_data_latih
Data_Jenis_luka
Operator
Hasil_FP-Growth
(Unit Laka)
4
Data Master FP-Growth Pengolahan FP-growth
Data Latih
Data Latih FP-growth
Data Latih
Hasil_FP-Growth
FP-Growth
Hasil FP-Growth Pengujian FP-Growth Hasil FP-Growth
D. Implementasi Sistem
Pada hasil implementasi dari analisa dan perancangan
Gambar 2. Flowchart SKLL yang telah dijelaskan pada bab sebelumnya. Implementasi
akan menampilkan interface dari penerapan algoritma fp-
growth dalam menentukan pola kecelakaan lalu lintas
B. Context Diagram/ Data Flowdiagram ( DFD Level 0)
diperlihatkan pada Gambar 5.
Context diagram adalah gambaran umum dari proses
sistem kecelakaan lalu lintas (SKLL) yang terjadi. Bentuk
context diagram pada analisa perancangan dapat dilihat
pada Gambar 3.
Login
User
Jenis_kelamin Login
Umur User
Kecamatan Data_latih
jam
Kendaraan
Jenis luka
Data_latih
Administrator FP-Growth Operator
(Afdal) SISTEM (unit laka)
SKLL
Info_user
Data_kecamatan
Data_kendaraan
Data_umur Data_latih
Data_jam FP-Growth
Jenis luka
Data latih
FP-Growth Gambar 5. Interface Halaman Login
C. Data Flow Diagram (DFD) Level 1 Halaman dahsboard merupakan halaman awal sistem
Pada Data Flow Diagram Level 1 menampilkan kecelakaan lalu lintas yang terdiri dari data master, data
Entitas, Proses, Data store dan aliran data yang akan latih dan FP-Growth. Adapun implementasi dari halaman
menunjukan alur jalannya data didalam system. Dapat dashboard administrator dapat dilihat dalam Gambar 6.
dlihat pada Gambar 4.
Irwanto dkk.: Penerapan Algoritma Fp-Growth dalam Menentukan Pola Kecelakaan Lalu 95
Lintas
E. Kesimpulan Pengujian
Halaman data latih merupakan halaman tempat Berdasarkan pengujian yang telah dilakukan
penyimpanan data yang akan diolah kedalam proses sebelumnya didapatlah kesimpulan sebagai berikut:
mining yaitu. Halaman berikut merupakan halaman data
latih yang dapat dilihat pada Gambar 8. 1. Setelah dilakukan pengujian dengan
menggunakan blackbox dan white box dapat
disimpulkan bahwa sistem kecelakaan lalu lintas
yang dibuat sudah berjalan dan berfungsi sesuai
yang diharapkan.
2. Setelah dilakukan pengujian menggunakan tools
SPMF menggunakan algoritma fp-growth dengan
nilai minumum support 1% dan confidence 10%,
maka dapat disimpulkan bahwa sistem yang
dibangun sesuai dengan tools.
3. Dari hasil pengujian sistem dengan menerapkan
algoritma FP-Growth dengan minimum support
1% dan confidence 10% menghasilkan 168 pola
dengan 5 itemset. Hasil keluaran rule (selanjutnya
dapat dilihat pada lampiran C):
a. Jika laki-laki berumur 31–59 tahun naik
Gambar 8. Halaman Data Latih
sepeda motor di Tenayan Raya maka
Halaman FP-growth merupakan halaman tempat berpotensi mengalami kecelakaan luka
pengolahan data mining. Halaman berikut merupakan ringan.
halaman yang dapat dilihat pada Gambar 9. b. Jika perempuan berumur 31-59 tahun naik
sepeda motor pada jam 15.01-18.00 WIB
maka berpotensi mengalami kecelakaan luka
ringan.
c. Jika laki-laki berumur 2-6 tahun di Payung
Sekaki pada jam 06.01-09.00 WIB maka
96 Seminar Nasional dan Expo Teknik Elektro 2019
REFERENSI
[1] Depkimpraswil. 2004. “Penanganan Lokasi
Kecelakaan Lalu Lintas.” Jakarta: Departemen
Pemukiman Dan Prasaran Wilayah.
[2] Dwi Lestari, Yuyun. 2015. “Penerapan Data
Mining Menggunakan Algoritma FP-Tree dan
FP-Growth Pada Data Transaksi Penjualan Obat”.
Jurnal SNASTIKOM. ISBN 976-602-19837-9-9.
[3] Elizabeth, B. H. 2005. Pengembangan Anak.
Erlangga: Jakarta.
[4] Fayyad, dkk. 1996. “From Data Mining to
Knowledge Discovery in Databases.” American
Association for Artificial Intelligence.
[5] Han, J and Kamber, M. 2006. “Data Mining:
Concepts and Techniques,” 2nd Edition. Morgan
Kauffman Publishers : San Fransisco.Han, J.,
Kamber, M., & Pei, J. Data Mining Concepts and
Techniques (Third Edit), Elsevier Inc. 2012
[6] Kusrini, Dkk. 2009. “Algoritma Data Mining.”
Andi Offset: Yogyakarta.