Anda di halaman 1dari 6

Algoritma Apriori untuk Menghasilkan

Aturan Asosiasi sebagai dasar


Pencegahan Kecelakaan pada saat Berkendara
Amillio Ardha Mulana, Feri Sulianta
Jurusan Teknik Informatika Universitas
Widyatama
Bandung, Indonesia
amillio.ardha@widyatama.ac.id,
feri.sulianta@widyatama.ac.id

Abstract—Kecelakaan merupakan peristiwa yang menggambarkan kombinasi faktor-faktor yang memiliki


mengancam keselamatan manusia dan menjadi salah satu hubungan dengan tingkat kefatalan kecelakaan.
penyebab utama cedera dan kematian di seluruh dunia. Tingkat
kefatalan kecelakaan dapat memberikan informasi berharga Dengan adanya aturan asosiasi yang ditemukan, kita dapat
dalam upaya pencegahan dan pengurangan risiko kecelakaan di memperoleh wawasan yang berharga tentang bagaimana
masa depan. Dalam penelitian ini, kami mengusulkan kombinasi atribut-atribut tersebut berkontribusi terhadap
penerapan metode aturan asosiasi dengan algoritma Apriori tingkat kefatalan kecelakaan. Informasi ini dapat digunakan
untuk menganalisis faktor-faktor yang berhubungan dengan untuk mengidentifikasi pola-pola risiko yang spesifik dan
tingkat kefatalan kecelakaan. Metode ini melibatkan membantu dalam pengembangan strategi pencegahan
pengumpulan data kecelakaan yang mencakup berbagai atribut kecelakaan yang lebih efektif. Selain itu, hasil penelitian ini
seperti cuaca, keadaan jalan, umur pengemudi, kecepatan, dan dapat menjadi dasar untuk penyusunan kebijakan lalu lintas
lain sebagainya. Data ini kemudian diolah menggunakan yang lebih aman dan peningkatan kesadaran masyarakat
algoritma Apriori untuk menemukan asosiasi antara atribut- tentang faktor-faktor yang berkontribusi terhadap tingkat
atribut tersebut dan tingkat kefatalan kecelakaan. Aturan kefatalan kecelakaan.
asosiasi yang dihasilkan memberikan wawasan tentang
kombinasi faktor-faktor yang berpotensi menyebabkan Dalam penelitian ini, kami akan menjelaskan secara rinci
kecelakaan dengan tingkat kefatalan yang tinggi. tentang metode aturan asosiasi dengan algoritma Apriori,
langkah-langkah implementasi yang dilakukan, dan analisis
hasil yang diperoleh. Melalui penelitian ini, diharapkan dapat
Keywords—kecelakaan, apriori, faktor kecelakaan lalu memberikan kontribusi dalam upaya meningkatkan
lintas. keselamatan jalan dan mengurangi angka kecelakaan dengan
tingkat kefatalan yang tinggi.

I. PENDAHULUAN
II. TINJAUAN PUSTAKA
Kecelakaan lalu lintas merupakan peristiwa yang sering
terjadi dan dapat berdampak fatal bagi individu dan 2.1 Aturan Asosiasi
masyarakat. Tingkat kefatalan kecelakaan menjadi salah satu Aturan asosiasi adalah teknik dalam data mining yang
indikator penting dalam mengevaluasi tingkat keamanan jalan digunakan untuk mengungkapkan hubungan atau pola
dan mengidentifikasi faktor-faktor yang berkontribusi tersembunyi antara item atau atribut dalam dataset. Aturan ini
terhadap kecelakaan yang serius. Dalam upaya untuk mengidentifikasi kombinasi item yang sering muncul bersama
meningkatkan keselamatan jalan dan mengurangi angka atau saling terkait dalam dataset, sehingga memungkinkan
kecelakaan, perlu dilakukan analisis mendalam tentang kita untuk membuat generalisasi atau prediksi berdasarkan
faktor-faktor yang mempengaruhi tingkat kefatalan hubungan tersebut Aturan asosiasi terdiri dari dua bagian
kecelakaan. utama yakni Aturan Asosiasi dan metrik pendukung. Aturan
Dalam konteks ini, metode aturan asosiasi dengan asosiasi terdiri dari dua set item:
algoritma Apriori dapat menjadi pendekatan yang efektif. a. Antecedent (penganda)
Metode ini memungkinkan kita untuk menemukan hubungan Antecedent adalah item atau kelompok item yang
atau pola-pola tersembunyi antara atribut-atribut yang ada muncul di dalam data.
dalam dataset kecelakaan. Dengan menerapkan metode ini,
kita dapat mengidentifikasi kombinasi faktor yang b. Consequent (pengakibat)
berhubungan dengan tingkat kefatalan kecelakaan. Consequent adalah item atau kelompok item yang
muncul bersama dengan antecedent dalam data.
Tujuan dari penelitian ini adalah untuk mengaplikasikan
metode aturan asosiasi dengan algoritma Apriori dalam Setiap aturan asosiasi juga memiliki metrik pendukung
analisis tingkat kefatalan kecelakaan. Penelitian ini yang menunjukkan seberapa sering aturan tersebut terjadi
menggunakan dataset kecelakaan yang mencakup berbagai dalam dataset. Metrik yang umum digunakan adalah support,
atribut seperti cuaca, keadaan jalan, umur pengemudi, confidence, dan lift. Support mengukur seberapa sering
kecepatan, dan atribut lainnya yang relevan. Melalui proses aturan tersebut muncul dalam dataset, confidence mengukur
analisis, kita dapat menghasilkan aturan asosiasi yang seberapa sering aturan tersebut benar berdasarkan
pengamatan, dan lift mengukur seberapa kuat hubungan 2.3.2 Faktor Jalan
antara antecedent dan consequent.
Kondisi jalan dan infrastruktur juga dapat mempengaruhi
2.2 Apriori terjadinya kecelakaan. Misalnya, kondisi jalan yang buruk,
seperti lubang di jalan, permukaan jalan yang licin akibat
Apriori adalah algoritma yang digunakan dalam data hujan atau salju, kurangnya tanda peringatan atau rambu lalu
mining untuk menemukan aturan asosiasi dalam dataset. lintas yang jelas, dan kurangnya penerangan jalan yang
Algoritma Apriori didasarkan pada prinsip-apriori, yang memadai dapat meningkatkan risiko kecelakaan.
menyatakan bahwa jika suatu itemset sering muncul dalam
dataset, maka subset-itemsetnya juga sering muncul. 2.3.3 Faktor Kendaraan
Algoritma Apriori bekerja dengan melakukan pencarian
Kondisi kendaraan juga berperan dalam kecelakaan lalu
secara iteratif untuk menghasilkan aturan asosiasi yang lintas. Kendaraan yang tidak terawat dengan baik, kegagalan
signifikan. Langkah-langkah utama dalam algoritma Apriori sistem pengereman atau kemudi, ban yang aus, atau kendaraan
adalah sebagai berikut: yang tidak memenuhi standar keselamatan dapat
meningkatkan risiko terjadinya kecelakaan.
Start 2.3.4 Faktor Lingkungan
Faktor lingkungan seperti cuaca ekstrem (misalnya hujan
lebat, salju, kabut tebal) atau kondisi lalu lintas yang padat
Get Frequent Item dapat mempengaruhi kecelakaan lalu lintas. Cuaca buruk
dapat mengurangi visibilitas dan meningkatkan risiko
kecelakaan, sedangkan lalu lintas yang padat dapat
menyebabkan kecelakaan akibat kelelahan, ketegangan, atau
perilaku berkendara yang tidak aman.
Generate Candidate Itemset

III. HIPOTHESIS
H0 (Hipotesis Nol): Tidak ada hubungan signifikan antara
Generate Frequent Itemset variabel cuaca, keadaan jalan, umur pengemudi, dan faktor-
faktor lainnya dengan kecelakaan.
H1 (Hipotesis Alternatif): Terdapat hubungan signifikan
antara variabel cuaca, keadaan jalan, umur pengemudi, dan
No faktor-faktor lainnya dengan kecelakaan.
Generated Set
=Null Hipotesis tersebut didasarkan pada asumsi bahwa variabel
prediktor seperti cuaca, keadaan jalan, dan umur pengemudi
memiliki pengaruh terhadap kejadian kecelakaan. Dalam
Yes konteks ini, hipotesis nol menyatakan bahwa tidak ada
hubungan yang signifikan antara variabel prediktor dan
kecelakaan. Sebaliknya, hipotesis alternatif menyatakan
Generate Strong Rule bahwa terdapat hubungan yang signifikan antara variabel
prediktor dan kecelakaan.
Dari H1 (Hipotesis Alternatif) dengan menggunakan
Selesai Algoritma Apriori ini dapat kita jabarkan sebagai berikut:
1. Kondisi cuaca normal tipe jalan kualitas jalan normal
dapat terjadinya kecelakaan dengan kefatalan rendah.
2. Kondisi cuaca normal kualitas jalan aspal dapat
Gambar 1 Langkah Algoritma Apriori
terjadinya kecelakaan dengan kefatalan rendah.
3. Kondisi waktu siang, kualitas jalan aspal dapat
2.3 Faktor Kecelakaan Lalu Lintas terjadinya kecelakaan dengan kefatalan rendah.
Terdapat beberapa faktor yang dapat berkontribusi 4. Kondisi cuaca normal kualitas jalan normal dapat
terhadap kecelakaan lalu lintas. Faktor-faktor tersebut terjadinya kecelakaan dengan kefatalan tinggi.
meliputi:
2.3.1 Faktor Manusia
Faktor manusia adalah salah satu faktor utama yang
berpengaruh pada kecelakaan lalu lintas. Hal ini meliputi
perilaku pengemudi, seperti kelelahan, penggunaan alkohol
atau obat-obatan terlarang, pelanggaran aturan lalu lintas,
kecepatan berlebihan, distraksi saat mengemudi (misalnya
menggunakan ponsel), dan ketidakhadiran kesadaran akan
keselamatan saat mengemudi.
IV. PROSES MINING 4.2 Proses Mining
4.1 Data Preparation
Dataset diperoleh dari website Kaggle berjudul “US Start
Accident (2016 - 2024)” berisikan data kecelakaan dengan
berbagai factor dan tingkat kefatalannya. Data terdiri dari 13
atribut dan 13 ribu baris data. Terdiri dari sebagai berikut,
5.
Atribut Tipe Data Get Frequent Item
6.
Age_band_of_driver Int
Sex_of_driver Enum
Generate Candidate Itemset
Educational_level Enum
Vehicle_driver_relation Enum
Driving_experience Int
Generate Frequent Itemset
Lanes_or_Medians Enum
Types_of_Junction Enum
Road_surface_type Enum 7. No
Light_conditions Enum Generated Set
=Null
Weather_conditions String
Type_of_collision String Yes
Vehicle_movement Enum
Pedestrian_movement Enum Generate Strong Rule

Cause_of_accident String
Accident_severity Int
Selesai

Gambar 2 Proses Data

Proses data dilakukan dengan bantuan aplikasi


WEKA dimana setelah kita import kita seleksi data apa saja
yang akan kita jadikan sebuah parameter dalam membuat
aturan asosiasi dengan algoritma apriori lalu rubah tipe data
attribute tersebut menjadi nominal agar dapat dikenali oleh
algoritma apriori.

Proses data mining dengan menggunakan algoritma


Apriori untuk menghasilkan tingkat kefatalan kecelakaan
dapat dilakukan dengan langkah-langkah berikut:
Langkah 1: Pengumpulan dan Preprocessing Data.
- Kumpulkan data kecelakaan lalu lintas yang mencakup
atribut-atribut seperti cuaca, keadaan jalan, kecepatan,
umur pengemudi, dan tingkat kefatalan.
- Bersihkan data dengan menghapus entri yang tidak
lengkap atau tidak relevan.
- Konversi atribut ke dalam format yang sesuai untuk Gambar 3 Attributes
analisis menggunakan algoritma Apriori.
Untuk attibutes accident_severity saya dapatkan
Langkah 2: Konversi Data ke Dalam Transaksi
dari attributes accident dimana valuenya berisi deskripsi
- Ubah data kecelakaan menjadi bentuk transaksi, di mana
tingkat kefatalan TINGGI atau RENDAH dengan rumus
setiap transaksi mewakili satu kejadian kecelakaan.
IF (accideng < 2 ; “RENDAH”; “TINGGI”)
- Setiap transaksi akan berisi kumpulan atribut yang ada
dalam kejadian kecelakaan tersebut, misalnya, cuaca,
A. Proses Mining
keadaan jalan, kecepatan, umur pengemudi, dan tingkat
1. Langkah 3: Membentuk Itemset
kefatalan.
- Identifikasi itemset yang relevan dalam dataset 2. Kondisi cuaca normal kualitas jalan aspal dapat
kecelakaan, seperti kombinasi cuaca, keadaan jalan, terjadinya kecelakaan dengan kefatalan rendah.
kecepatan, umur pengemudi, dan tingkat kefatalan. 3. Kondisi waktu siang, kualitas jalan aspal dapat
- Bentuk itemset berdasarkan atribut-atribut yang terjadinya kecelakaan dengan kefatalan rendah.
dianggap berpotensi memiliki hubungan dengan tingkat
kefatalan kecelakaan. 4. Kondisi cuaca normal kualitas jalan normal dapat
2. Langkah 4: Menghitung Support Count terjadinya kecelakaan dengan kefatalan tinggi.
- Hitung support count untuk setiap itemset dalam dataset
kecelakaan.
- Support count mengukur seberapa sering itemset muncul V. KESIMPULAN
dalam transaksi. Setelah melakukan analisis menggunakan algoritma
3. Langkah 5: Pemangkasan Itemset Apriori pada dataset kecelakaan lalu lintas untuk
- Terapkan threshold support minimum untuk memangkas mengidentifikasi faktor-faktor yang berhubungan dengan
itemset yang tidak memenuhi batas tersebut. tingkat kefatalan kecelakaan, dapat ditarik beberapa
- Itemset yang tidak memenuhi threshold support kesimpulan:
minimum dihapus karena dianggap tidak signifikan 1. Terdapat hubungan yang signifikan antara
dalam analisis. kondisi cuaca, keadaan jalan, kecepatan, umur
4. Langkah 6: Menggabungkan Itemset pengemudi, dan tingkat kefatalan kecelakaan.
- Gabungkan itemset yang tersisa untuk membentuk Itemset yang mencakup kombinasi atribut-
kandidat itemset yang lebih besar. atribut ini menunjukkan adanya pola yang
- Gunakan algoritma Apriori untuk menggabungkan relevan dalam dataset kecelakaan.
itemset yang memiliki support count yang cukup tinggi. 2. Faktor-faktor seperti cuaca buruk (misalnya
5. Langkah 7: Menghitung Support Count hujan atau salju), keadaan jalan yang licin atau
Kandidat Baru basah, kecepatan yang melebihi batas, dan
- Hitung support count kandidat itemset yang lebih besar umur pengemudi yang muda atau lanjut usia
dalam dataset kecelakaan. memiliki pengaruh yang signifikan terhadap
- Support count kandidat itemset yang lebih besar akan tingkat kefatalan kecelakaan.
menunjukkan seberapa sering kombinasi itemset 3. Aturan asosiasi yang dihasilkan dari analisis
tersebut muncul. dapat memberikan wawasan yang berharga
6. Langkah 8: Pemangkasan Lanjutan dalam upaya pencegahan kecelakaan dan
- Terapkan threshold support minimum lagi untuk pengurangan tingkat kefatalan. Contohnya, jika
memangkas kandidat itemset yang tidak memenuhi batas cuaca buruk dan kecepatan melebihi batas
tersebut. terkait dengan tingkat kefatalan yang tinggi,
- Itemset yang tidak memenuhi threshold support langkah-langkah pencegahan dapat difokuskan
minimum dihapus dari analisis. pada peningkatan kesadaran pengemudi dalam
7. Langkah 9: Pembentukan Aturan Asosiasi mengurangi kecepatan saat kondisi cuaca yang
- Dengan itemset yang tersisa, hasilkan aturan asosiasi buruk.
yang signifikan. 4. Analisis menggunakan algoritma Apriori
- Aturan asosiasi ini akan memperlihatkan hubungan memungkinkan kita untuk mengidentifikasi
antara kombinasi atribut dengan tingkat kefatalan kombinasi faktor yang berpotensi menjadi
kecelakaan. prediktor tingkat kefatalan kecelakaan. Hal ini
- Gunakan metrik seperti support, confidence, dan lift dapat digunakan untuk mengembangkan model
untuk mengukur kekuatan dan validitas aturan asosiasi prediktif atau sistem peringatan dini yang
yang dihasilkan. membantu dalam pengambilan keputusan dan
tindakan preventif.
B. Hasil Mining Dengan demikian, algoritma Apriori dapat menjadi
alat yang efektif dalam analisis data kecelakaan lalu lintas
untuk mengungkapkan hubungan antara atribut-atribut
tertentu dengan tingkat kefatalan kecelakaan. Kesimpulan
yang dihasilkan dari analisis ini dapat memberikan dasar
yang kuat bagi pembuatan kebijakan dan strategi pencegahan
kecelakaan yang lebih efektif.
VI. REFERENCES
[1] B. Mohammad, Algoritma Asosiasi dengan Algoritma Apriori untuk
Analisa Data Penjualan, 2016.
[2] Sulianta, F., Atastina, I., & Liong, T. H. Mining Food Industry’s
Multidimensional Data to Produce Association Rules using Apriori
Gambar 4 Hasil Mining Algorithm as a Basis of Business Strategy, 2013.
[3] Saladi, S. A., & Bhaya, W. S. Review of Data Preprocessing
Hasil mining menunjukan bahwa: Techniques in Data Mining, 2017.
1. Kondisi cuaca normal tipe jalan kualitas jalan normal [4] Y. G. Sucahyo, Data Mining : Mengenali Informasi Yang Terpendam.
dapat terjadinya kecelakaan dengan kefatalan rendah. IlmuKomputer.com, 2003.
[5] Redcomm. Memahami Bounce Rate pada Website dan Cara
Menurunkannya. 16 September [Diakses pada 14 April 2023], dari
https://redcomm.co.id/knowledges/memahami-bounce-rate-pada-
website-dan-cara-menurunkannya?readmore=true.
[6] Panggilin. Mengenal Exit Rate dan Apa Bedanya dengan Bounce
Rate!. 12 November 2021 [Diakses pada 14 April 2023], dari
https://blog.panggilin.com/mengenal-exit-rate

Anda mungkin juga menyukai