Algoritma Apriori Untuk Menghasilkan Aturan Asosiasi Saat Berkendara
Algoritma Apriori Untuk Menghasilkan Aturan Asosiasi Saat Berkendara
I. PENDAHULUAN
II. TINJAUAN PUSTAKA
Kecelakaan lalu lintas merupakan peristiwa yang sering
terjadi dan dapat berdampak fatal bagi individu dan 2.1 Aturan Asosiasi
masyarakat. Tingkat kefatalan kecelakaan menjadi salah satu Aturan asosiasi adalah teknik dalam data mining yang
indikator penting dalam mengevaluasi tingkat keamanan jalan digunakan untuk mengungkapkan hubungan atau pola
dan mengidentifikasi faktor-faktor yang berkontribusi tersembunyi antara item atau atribut dalam dataset. Aturan ini
terhadap kecelakaan yang serius. Dalam upaya untuk mengidentifikasi kombinasi item yang sering muncul bersama
meningkatkan keselamatan jalan dan mengurangi angka atau saling terkait dalam dataset, sehingga memungkinkan
kecelakaan, perlu dilakukan analisis mendalam tentang kita untuk membuat generalisasi atau prediksi berdasarkan
faktor-faktor yang mempengaruhi tingkat kefatalan hubungan tersebut Aturan asosiasi terdiri dari dua bagian
kecelakaan. utama yakni Aturan Asosiasi dan metrik pendukung. Aturan
Dalam konteks ini, metode aturan asosiasi dengan asosiasi terdiri dari dua set item:
algoritma Apriori dapat menjadi pendekatan yang efektif. a. Antecedent (penganda)
Metode ini memungkinkan kita untuk menemukan hubungan Antecedent adalah item atau kelompok item yang
atau pola-pola tersembunyi antara atribut-atribut yang ada muncul di dalam data.
dalam dataset kecelakaan. Dengan menerapkan metode ini,
kita dapat mengidentifikasi kombinasi faktor yang b. Consequent (pengakibat)
berhubungan dengan tingkat kefatalan kecelakaan. Consequent adalah item atau kelompok item yang
muncul bersama dengan antecedent dalam data.
Tujuan dari penelitian ini adalah untuk mengaplikasikan
metode aturan asosiasi dengan algoritma Apriori dalam Setiap aturan asosiasi juga memiliki metrik pendukung
analisis tingkat kefatalan kecelakaan. Penelitian ini yang menunjukkan seberapa sering aturan tersebut terjadi
menggunakan dataset kecelakaan yang mencakup berbagai dalam dataset. Metrik yang umum digunakan adalah support,
atribut seperti cuaca, keadaan jalan, umur pengemudi, confidence, dan lift. Support mengukur seberapa sering
kecepatan, dan atribut lainnya yang relevan. Melalui proses aturan tersebut muncul dalam dataset, confidence mengukur
analisis, kita dapat menghasilkan aturan asosiasi yang seberapa sering aturan tersebut benar berdasarkan
pengamatan, dan lift mengukur seberapa kuat hubungan 2.3.2 Faktor Jalan
antara antecedent dan consequent.
Kondisi jalan dan infrastruktur juga dapat mempengaruhi
2.2 Apriori terjadinya kecelakaan. Misalnya, kondisi jalan yang buruk,
seperti lubang di jalan, permukaan jalan yang licin akibat
Apriori adalah algoritma yang digunakan dalam data hujan atau salju, kurangnya tanda peringatan atau rambu lalu
mining untuk menemukan aturan asosiasi dalam dataset. lintas yang jelas, dan kurangnya penerangan jalan yang
Algoritma Apriori didasarkan pada prinsip-apriori, yang memadai dapat meningkatkan risiko kecelakaan.
menyatakan bahwa jika suatu itemset sering muncul dalam
dataset, maka subset-itemsetnya juga sering muncul. 2.3.3 Faktor Kendaraan
Algoritma Apriori bekerja dengan melakukan pencarian
Kondisi kendaraan juga berperan dalam kecelakaan lalu
secara iteratif untuk menghasilkan aturan asosiasi yang lintas. Kendaraan yang tidak terawat dengan baik, kegagalan
signifikan. Langkah-langkah utama dalam algoritma Apriori sistem pengereman atau kemudi, ban yang aus, atau kendaraan
adalah sebagai berikut: yang tidak memenuhi standar keselamatan dapat
meningkatkan risiko terjadinya kecelakaan.
Start 2.3.4 Faktor Lingkungan
Faktor lingkungan seperti cuaca ekstrem (misalnya hujan
lebat, salju, kabut tebal) atau kondisi lalu lintas yang padat
Get Frequent Item dapat mempengaruhi kecelakaan lalu lintas. Cuaca buruk
dapat mengurangi visibilitas dan meningkatkan risiko
kecelakaan, sedangkan lalu lintas yang padat dapat
menyebabkan kecelakaan akibat kelelahan, ketegangan, atau
perilaku berkendara yang tidak aman.
Generate Candidate Itemset
III. HIPOTHESIS
H0 (Hipotesis Nol): Tidak ada hubungan signifikan antara
Generate Frequent Itemset variabel cuaca, keadaan jalan, umur pengemudi, dan faktor-
faktor lainnya dengan kecelakaan.
H1 (Hipotesis Alternatif): Terdapat hubungan signifikan
antara variabel cuaca, keadaan jalan, umur pengemudi, dan
No faktor-faktor lainnya dengan kecelakaan.
Generated Set
=Null Hipotesis tersebut didasarkan pada asumsi bahwa variabel
prediktor seperti cuaca, keadaan jalan, dan umur pengemudi
memiliki pengaruh terhadap kejadian kecelakaan. Dalam
Yes konteks ini, hipotesis nol menyatakan bahwa tidak ada
hubungan yang signifikan antara variabel prediktor dan
kecelakaan. Sebaliknya, hipotesis alternatif menyatakan
Generate Strong Rule bahwa terdapat hubungan yang signifikan antara variabel
prediktor dan kecelakaan.
Dari H1 (Hipotesis Alternatif) dengan menggunakan
Selesai Algoritma Apriori ini dapat kita jabarkan sebagai berikut:
1. Kondisi cuaca normal tipe jalan kualitas jalan normal
dapat terjadinya kecelakaan dengan kefatalan rendah.
2. Kondisi cuaca normal kualitas jalan aspal dapat
Gambar 1 Langkah Algoritma Apriori
terjadinya kecelakaan dengan kefatalan rendah.
3. Kondisi waktu siang, kualitas jalan aspal dapat
2.3 Faktor Kecelakaan Lalu Lintas terjadinya kecelakaan dengan kefatalan rendah.
Terdapat beberapa faktor yang dapat berkontribusi 4. Kondisi cuaca normal kualitas jalan normal dapat
terhadap kecelakaan lalu lintas. Faktor-faktor tersebut terjadinya kecelakaan dengan kefatalan tinggi.
meliputi:
2.3.1 Faktor Manusia
Faktor manusia adalah salah satu faktor utama yang
berpengaruh pada kecelakaan lalu lintas. Hal ini meliputi
perilaku pengemudi, seperti kelelahan, penggunaan alkohol
atau obat-obatan terlarang, pelanggaran aturan lalu lintas,
kecepatan berlebihan, distraksi saat mengemudi (misalnya
menggunakan ponsel), dan ketidakhadiran kesadaran akan
keselamatan saat mengemudi.
IV. PROSES MINING 4.2 Proses Mining
4.1 Data Preparation
Dataset diperoleh dari website Kaggle berjudul “US Start
Accident (2016 - 2024)” berisikan data kecelakaan dengan
berbagai factor dan tingkat kefatalannya. Data terdiri dari 13
atribut dan 13 ribu baris data. Terdiri dari sebagai berikut,
5.
Atribut Tipe Data Get Frequent Item
6.
Age_band_of_driver Int
Sex_of_driver Enum
Generate Candidate Itemset
Educational_level Enum
Vehicle_driver_relation Enum
Driving_experience Int
Generate Frequent Itemset
Lanes_or_Medians Enum
Types_of_Junction Enum
Road_surface_type Enum 7. No
Light_conditions Enum Generated Set
=Null
Weather_conditions String
Type_of_collision String Yes
Vehicle_movement Enum
Pedestrian_movement Enum Generate Strong Rule
Cause_of_accident String
Accident_severity Int
Selesai