Abstrak
Kecelakaan lalu lintas kerap menjadi masalah utama dalam pemerintahan dan sosial karena
dapat menyebabkan kerugian dari segi biaya dan keselamatan manusia.DataMining telah terbukti
sebagai teknik yang dapat dipercaya untuk menganalisa data kecelakaan lalu lintas dan memberikan
hasil yang produktif. Kebanyakan analisis data kecelakaan lalu lintas, hanya terfokus
mengidentifikasi faktor-faktor yang mempengaruhi seberapa parah kecelakaan tersebut. Terkadang,
kecelakaan terjadi lebih sering pada suatu lokasi tertentu. Analisis pada lokasi tersebut dapat
membantu mengidentifikasi penyebab terjadinya kecelakaan yang membuat kecelakaan lalu lintas
lebih sering terjadi di lokasi tersebut. Dari 2620 data kecelakaan yang tercatat di dalam basis data
Resor Kendari, data tersebut diseleksi menjadi 500 data. Data tersebut kemudian dianalisis
menggunakan algoritma K-Means Clustering dengan bantuan aplikasi RapidMiner Studio. Hasil
analisis menunujukan frekuensi tingkat kecelakaan di tiap lokasi beserta waktu-waktu rawan yang
berpotensi terjadi kasus kecelakaan.
yang dianggap dapat mempengaruhi data dan memeriksa data yang tidak konsisten.
kecelakaan secara signifikan dan juga Adapun beberapa teknik membersihkan data,
mencocokan dengan atribut-atribut yang yakni mengisi missing value dan
digunakan pada data panggilan darurat mengidentifikasi atau membuang outlier.
ambulan tentang kecelakaan yang juga pernah a. Missing value adalah informasi yang tidak
digunakan untuk klasifikasi daerah rawan tersedia untuk sebuah objek (kasus).
kecelakaan [3]. Missing value terjadi karena informasi
untuk sesuatu tentang objek tidak
Tabel 1. Daftar Atribut yang Digunakan diberikan, sulit dicari, atau memang
informasi tersebut tidak ada. Missing value
Nama pada dasarnya tidak bermasalah bagi
No. Nilai
Attribut keseluruhan data, apalagi jika jumlahnya
1 Hari 1,....,7 hanya sedikit, misal hanya 1 % dari seluruh
2 Bulan 1,....,12 data. Namun jika persentase data yang
3 Jam 0,....,23 hilang tersebut cukup besar, maka perlu
Lokasi dilakukan pengujian apakah data yang
4 1,....,171
(no.lokasi) mengandung banyak missing tersebut
Karakteristik lurus, tikungan, pertigaan, masih layak diproses lebih lanjut ataukah
5
Jalan perempatan, tanjakan
tidak.
6 Cuaca cerah, mendung, hujan
b. Data outlier (pencilan) adalah data yang
Keadaan beraspal, tidak beraspal,
7 secara nyata berbeda dengan data-data yang
Jalan rusak
Keadaan ramai, agak ramai, sedang, lain.
8
Lalu Lintas agak sepi, sepi
Kelurahan
9 (no. 1,....,71
kelurahan)
Kecamatan
10 (no. 1,....,16
kecamatan)
kawasan pemukiman,
kawasan pertokoan (mall),
Lingkungan
11 pusat perbelanjaan
Sekitar
(pasar), tempat hiburan,
kawasan wisata, lain-lain
kab/kota, propinsi, Gambar 1 Missing Value dan Data Outlier
12 Daerah (Sumber : (missing value & outlier)
nasional,desa
depan-samping, depan- file.upi.edu/Direktori/FPIPS/.../Modul_Ana
depan, depan-belakang, lisis_Missing_Value_%26_Outlier.pdf)
Jenis tabrak manusia, tungal,
13
Kecelakaan tabrak lari, samping- 2. Data integrasi
samping, beruntun, lain-
lain Menggabungkan data dari beberapa
batas kecepatan, tidak sumber (database, data cube, atau file) ke
Kondisi tertib, lengah, pengaruh dalam penyimpanan data yang sesuai.
14
Pengendara alkohol, lelah, mengantuk, 3. Data transformasi
sakit Normalisasi dan pengumpulan data
sehingga menjadi sama.
Tahapan dalam melakukan data mining 4. Data reduksi
salah satunya adalah preprosesing data yaitu Menguraikan data ke dalam bentuk yang
data perlu di bersihkan sebelum diproses, hal lebih kecil ukurannya tetapi tetap
ini terjadi karena biasanya data yang akan menghasilkan hasil analitis yang sama.
digunakan belum baik.
Teknik atau metode yang digunakan 5. Data diskretisasi
dalam data preprocessing, diantaranya: Bagian dari data reduksi tetapi memiliki
1. Data cleaning arti penting tersendiri, terutama untuk data
Data cleaning adalah menghilangkan nilai- numerik.
nilai data yang salah, memperbaiki kekacauan
Title of manuscript is short and clear, implies research results (First Author)
60 Implementasi K-Means Clustering pada RapidMiner untuk Analisis Daerah…
Pada contoh kasus analisis data kecelakaan, operator seperti yang dapat terlihat pada
kami menggunakan konfigurasi data dan Gambar 2.
5. SARAN
DAFTAR PUSTAKA
4. KESIMPULAN