Anda di halaman 1dari 28

LAPORAN ANALISA :

MENGURANGI ANGKA KECELAKAAN


DI JALAN RAYA TAHUN 2021

Prepared by :
GROUP 5 PA #1 BATCH 13 :
Raihan Ilham Ramadhan – anggota
Astuti Aryanti – anggota
Alwalid Nouvatie – Ketua
Alfrida Ramadhani – anggota
Makmur Anggara Saputra Manurung – anggota
Mukti Aly – anggota

1
Daftar Isi

1. Pendahuluan
1.1 Latar Belakang 3
1.2 Tujuan Penelitian 3
1.3 Ruang Lingkup Penelitian 3
2. Analisis Data
2.1 Gambaran Umum Data 3
2.2 Penyiapan Data 6
3. Temuan
3.1 Kondisi Yang Meningkatkan Risiko Kecelakaan 7
3.2 10 Teratas Negara Bagian Di Mana Kecelakaan Paling Banyak Terjadi 9
3.3 Jumlah Rerata Kecelakaan Yang Terjadi Setiap Jam 13
3.4 Persentase Kecelakaan Yang Disebabkan Oleh Pengemudi Yang Mabuk 15
3.5 Persentase Kecelakaan Di Daerah Pedesaan Dan Perkotaan 15
3.6 Jumlah Kecelakaan Berdasarkan Hari 16
4. Kesimpulan dan Saran
4.1 Kesimpulan 18
4.2 Saran 19
5. Lampiran 20

2
1. Pendahuluan
1.1 Latar Belakang
National Highway Traffic Safety Administration (NHTSA) yang merupakan
departemen pemerintah Amerika Serikat yang bertugas untuk mengurangi
angka kecelakaan di jalan raya. Saat ini NHTSA sedang menggodok regulasi
baru untuk mengurangi angka kecelakaan di jalan raya.
Regulasi tersebut akan diterapkan pada tahun depan. Untuk memperkuat
penerapan regulasi tersebut dibutuhkan analisa data yang cukup akurat
sebagai dasar pertimbangan untuk keputusan pemberlakukan regulasi
tersebut.
1.2 Tujuan
Tujuan dari pembuatan laporan ini adalah untuk memberikan sejumlah
rekomendasi tentang cara mengurangi angka kecelakaan di jalan raya
dengan memecahkan beberapa permasalahan yang ada kepada NHTSA.
1.3 Ruang Lingkup & Metodologi
Penelitian ini mencakup kecelakaan yang terjadi selama tahun 2021 di 50
negara bagian Amerika Serikat dan datanya teregister/tercatat di NHTSA.
Dalam menganalis data tersebut tim penulis fokus untuk mengidentifikasi
beberapa pertanyaan hipotesa yang telah ditentukan di bawah ini untuk
didapatkan rekomendasinya.
Pertanyaan-pertanyaan itu adalah :
1. Kondisi yang meningkatkan risiko kecelakaan
2. 10 teratas negara bagian di mana kecelakaan paling banyak terjadi
3. Jumlah rerata kecelakaan yang terjadi setiap jam
4. Persentase kecelakaan yang disebabkan oleh pengemudi yang mabuk
5. Persentase kecelakaan di daerah pedesaan dan perkotaan
6. Jumlah kecelakaan berdasarkan hari.

Dalam menjawab pertanyaan-pertanyaan di atas tim penulis menggunakan


pengolahan data baik menggunakan tools analisis (sql) dan grafik
(spreadsheet) serta analisa naratif sebagai konklusinya.

2. Analisa Data
2.1 Gambaran Umum Data
Data yang tim penulis terima yaitu data “crash” terdiri dari 19 kolom atribut
dengan 35.451 baris. Adapun deskripsi dari atribut tersebut sebagai berikut :

No Nama Kolom Pengertian Kolom


1. consecutive_number Nomor kasus unik yang ditetapkan
untuk setiap kecelakaan. Dua karakter
awal untuk Kode Negara diikuti
dengan empat karakter untuk Nomor
Kasus.
2. state_name Negara bagian tempat kecelakaan
terjadi.
3. number_of_vehicle_forms_sub Jumlah seluruh kendaraan yang

3
mitted_all terlibat kecelakaan dan mengisi
formulir.
4. number_of_motor_vehicles_in Jumlah kendaraan bermotor dalam
_transport_mvit perjalanan yang terlibat dalam
kecelakaan.
5. number_of_parked_working_v Jumlah kendaraan yang sedang parkir
ehicles dan terlibat dalam kecelakaan.
6. number_of_forms_submitted_f Jumlah formulir kepolisian yang
or_persons_not_in_motor_veh terkumpul untuk mencatat berapa
icles banyak orang yang tidak berada di
dalam kendaraan bermotor namun
terlibat di dalam kecelakaan.
7. number_of_persons_in_motor Jumlah orang di dalam kendaraan
_vehicles_in_transport_mvit yang terlibat dalam kecelakaan,
disebut juga dengan pengendara yang
terlibat kecelakaan. Pengendara
meliputi pengemudi dan penumpang
di dalam kendaraan.
8. number_of_persons_not_in_m Jumlah orang yang tidak berada di
otor_vehicles_in_transport_mv dalam kendaraan bermotor yang
it sedang berjalan, atau disebut juga
non-pengendara. Meliputi pejalan
kaki, pengendara sepeda, penumpang
kendaraan bermotor yang tidak
diangkut, orang yang menunggang
kuda, penumpang kendaraan yang
ditarik hewan, orang yang terkait
dengan kendaraan yang tidak
diangkut, dan sebagainya.
9. city_name Kota yang menjadi lokasi kecelakaan
terjadi.
10. land_use_name 1 Pedesaan (Rural),
2 Perkotaan (Urban),
6 Jalan Tidak Masuk Inventaris Negara
(Trafficway Not in State Inventory),
8 Tidak Dilaporkan (Not Reported),
9 Tidak Diketahui (Unknown).
11. functional_system_name 01 Antar Negara Bagian (Interstate),
02 Arteri Utama – Jalan Bebas
Hambatan dan Jalan Tol lainnya
(Principal Arterial – Other Freeways
and Expressways),
03 Arteri Utama – lainnya (Principal
Arterial – Other),
04 Arteri Kecil (Minor Arterial),
05 Kolektor Utama (Major Collector),
06 Kolektor Kecil (Minor Collector),

4
07 Lokal (Local),
96 Jalan Lalu Lintas yang Tidak
Termasuk dalam Inventarisasi Negara
Bagian (Trafficway Not in State
Inventory),
98 Tidak Dilaporkan (Not Reported),
99 Tidak Diketahui (Unknown).
12. Milepoint Titik jarak terdekat dari lokasi di mana
kecelakaan terjadi.
13. manner_of_collision_name Elemen data ini menjelaskan
orientasi/arah dua kendaraan
bermotor dalam pengangkutan ketika
mereka terlibat dalam "Kejadian
Berbahaya Pertama" dari kecelakaan
tabrakan.

Jika "Kejadian Berbahaya Pertama"


bukan merupakan tabrakan antara
dua kendaraan bermotor dalam
perjalanan, maka diklasifikasikan
seperti itu.
14. type_of_intersection_name Identifikasi jenis persimpangan:
1 Bukan Persimpangan (Not an
Intersection),
2 Persimpangan Empat Arah (Four-
way Intersection),
3 Persimpangan T (T-intersection),
4 Persimpangan Y (Y-intersection),
5 Lingkaran Lalu Lintas (Traffic-
Circle),
6 Bundaran (Roundabout),
7 Lima Titik, atau Lebih (Five-point, or
More),
10 Persimpangan L (L-intersection),
98 Tidak Dilaporkan (Not Reported),
99 Tidak Diketahui (Unknown),
15. light_condition_name Jenis/tingkat cahaya yang ada pada
saat kecelakaan.
16. atmospheric_conditions_1_na kondisi atmosfer yang ada pada saat
me kecelakaan.
17. number_of_fatalities Jumlah korban luka berat dan tewas
dalam kecelakaan.
01-99 Jumlah korban tewas yang
terjadi dalam kecelakaan.
18. number_of_drunk_drivers Jumlah pengemudi mabuk yang
terlibat dalam kecelakaan.
00-99 Jumlah pengemudi mabuk yang

5
terlibat dalam kecelakaan fatal.
19. timestamp_of_crash Elemen data ini mencatat tanggal dan
waktu terjadinya kecelakaan.

2.2 Penyiapan Data


Agar dapat mendapat hasil analisa data yang optimal maka diperlukan data
yang valid dan dapat dipertanggungjawabkan maka tim penulis melakukan
pembersihan data.
Untuk kasus ini tim penulis melakukan pembersihan data 2 tahap sebagai
berikut :
● Penyesuaian zona waktu (time zone)
Geografi negara-negara bagian yang luas menyebabkan adanya perbedaan
zona waktu dan berdasarkan analisa data maka tim penulis membagi zona
waktu menjadi 6 zona sebagaimana terlihat dari CTE timezone_usa
(terlampir di lampiran).
● Validitas data atribut
Beberapa data atribut yang tidak diikutsertakan karena tim penulis anggap
tidak lengkap dalam analisis terdiri dari :
- Milepoint dengan isi kolom 99998 dan 99999, karena datanya tidak
dilaporkan dan tidak diketahui titik poinnya.
- City_name yang berisi ‘Not Applicable’, ‘Not Reported’, dan ‘Unknown’,
karena data dianggap tidak mewakili kota manapun sehingga tidak bisa
diikutsertakan dalam perhitungan.
- Land_use_name yang berisi ‘Not Reported’, dan ‘Unknown’, karena
data dianggap tidak mewakili jenis daerah tertentu sehingga tidak bisa
diikutsertakan dalam perhitungan.
- Functional_system_name yang berisi ‘Unknown’ dan ‘Not Reported’,
karena data dianggap tidak mewakili jenis jalan fungsional tertentu
sehingga tidak bisa diikutsertakan dalam perhitungan.
- Manner_of_collision_name yang berisi ‘Not Reported’ dan ‘Reported
as Unknown’, karena data dianggap tidak mewakili variasi arah dan
posisi tabrakan tertentu, sehingga tidak bisa diikutsertakan dalam
perhitungan.
- Type_of_intersection_name yang berisi ‘Unknown’ dan ‘Not
Reported’, karena data dianggap tidak mewakili jenis persimpangan
jalan tertentu, sehingga tidak bisa diikutsertakan dalam perhitungan.
- Light_condition_name yang berisi ‘Not Reported’ dan ‘Reported as
Unknown’, karena data dianggap tidak mewakili jenis atau tingkat
cahaya tertentu pada saat terjadinya kecelakaan, sehingga tidak bisa
diikutsertakan dalam perhitungan.
- Atmospheric_conditions_1_name yang berisi ‘Not Reported’ dan
‘Reported as Unknown’, karena data dianggap tidak mewakili

6
atmosfer/cuaca tertentu pada saat terjadinya kecelakaan, sehingga
tidak bisa diikutsertakan dalam perhitungan.

Validitas data atribut ini tim penulis lakukan dengan menggunakan parent
query CTE timezone_usa (terlampir dalam lampiran).

Setelah melakukan 2 tahap tersebut di atas tim penulis membuat table baru
bernama crash_clean.

3. Temuan
Setelah melakukan proses analisa data dengan fokus pada identifikasi atas 6
pertanyaan tersebut di atas yaitu 1) Kondisi yang meningkatkan risiko
kecelakaan, 2) Sepuluh teratas negara bagian di mana kecelakaan paling banyak
terjadi, 3) Jumlah rerata kecelakaan yang terjadi setiap jam, 4) Persentase
kecelakaan yang disebabkan oleh pengemudi yang mabuk, 5) Persentase
kecelakaan di daerah pedesaan dan perkotaan, dan 6) Jumlah kecelakaan
berdasarkan hari. Maka dapat tim penulis sampaikan temuan sebagai berikut :
3.1 Kondisi Yang Meningkatkan Risiko Kecelakaan
Berdasarkan hasil analisa data, ada 4 faktor kondisi yang meningkatkan
risiko kecelakaan yaitu :
a. Faktor Cuaca (atmospheric condition)

Dari hasil identifikasi atas faktor cuaca (atmospheric conditions),


ditemukan bahwa kecelakaan terbesar terjadi pada kondisi cuaca clear,
yaitu sebanyak 9.880 kali kecelakaan (78%) dari total 12.648 kecelakaan
atau selama tahun 2021.

b. Faktor Jenis Persimpangan Jalan (type of intersection)

7
Dari data yang ada, jenis-jenis persimpangan jalan (types of intersection)
juga bisa meningkatkan risiko terjadi kecelakaan di jalan raya. Dari hasil
identifikasi data, terlihat bahwa justru di “jalan yang bukan merupakan
persimpangan” (not an intersection) kecelakaan paling sering terjadi
selama tahun 2021, yaitu sebanyak 8.870 kali kecelakaan.

c. Faktor Kondisi Pencahayaan (light condition)

Faktor kondisi pencahayaan (light condition) juga merupakan salah satu


factor yang diindikasi bisa meningkatkan risiko kecelakaan di jalan raya.
Berdasarkan hasil identifikasi terlihat bahwa kecelakaan banyak terjadi
saat daylight yaitu sebanyak 5.213 kali kecelakaan selama tahun 2021.

d. Faktor Pengendara yang Mabuk (number of drunk driver)

8
Kondisi terakhir yang kemungkinan bisa menjadi faktor peningkatan
resiko kecelakaan di jalan raya adalah “pengendara yang mabuk”
(number of drunk driver). Tetapi dari hasil analisa, justru terlihat bahwa
kecelakaan yang terjadi selama tahun 2021, disebabkan oleh pengendara
yang tidak mabuk (not drunk driver) sebesar 9.568 kali kejadian.

3.2 Sepuluh Teratas Negara Bagian Di Mana Kecelakaan Paling Banyak Terjadi
Hasil analisis data dari semua negara bagian, diketahui 10 (sepuluh) negara
bagian yang memiliki angka tertinggi kecelakaan di tahun 2021 yaitu :
California, Texas, Illinois, Tennessee, Arizona, Georgia, Michigan, Ohio, New
Jersey, dan North Carolina. Adapun urutan sebagaimana grafik di bawah ini :

Untuk lebih jelas lagi dalam bentuk persentase sebagai berikut :

9
Dari data dan grafik di atas terlihat bahwa negara bagian California adalah
negara bagian dengan angka kecelakaan tertinggi dari 50 negara bagian
yang ada di Amerika Serikat.

Selama tahun 2021, ada sebanyak 2.045 kecelakaan terjadi di California


yang kemudian disusul oleh Texas sebanyak 1.851 kecelakaan. Sedangkan 8
negara bagian lainnya yaitu Illinois, Tennessee, Arizona, Georgia, Michigan,
Ohio, New Jersey, North Carolina mencatatkan kecelakaan di bawah 1.000
kali (<1.000) selama tahun 2021.

Selain itu, untuk mencari keterkaitan sepuluh negara bagian yang memiliki
angka kecelakaan tertinggi di tahun 2021, tim penulis menggali lebih dalam
lagi dengan mengaitkan dengan faktor kepadatan populasi serta jenis
persimpangan jalan dan pengendara mabuk.
a. Kepadatan Populasi
Berdasarkan data dari website statista (www.statista.com) yang mencatat
kepadatan populasi (penduduk) di Amerika Serikat pada tahun 2021 untuk
10 (sepuluh) negara bagian yang mempunyai angka kecelakaan tertinggi
tahun 2021 sebagaimana tercantum pada table di bawah ini.

10
Tabel : Jumlah Kepadatan Penduduk di 10 Negara Bagian dengan Jumlah
Kecelakaan Tertinggi di Amerika Serikat pada tahun 2021 (termasuk District of
Columbia)
No. Nama Negara Bagian Jumlah Kepadatan Ranking berdasarkan
Penduduk per mil Jumlah Kepadatan
Penduduk
(Tertinggi ke Terendah)
1. California 251,9 13 dari 52
2. Texas 113,04 26 dari 52
3. Illinois 228,24 14 dari 52
4. Tennessee 169,16 22 dari 52
5. Arizona 64,05 34 dari 52
6. Georgia 187,82 19 dari 52
7. Michigan 177,8 20 dari 52
8. Ohio 288,32 12 dari 52
9. New Jersey 1260,15 3 dari 52
10. North Carolina 217,02 17 dari 52

Sedangkan jika menggunakan data 20 negara bagian tertinggi (tanpa


menyertakan District of Columbia) maka akan diperoleh hasil seperti
dalam grafik berikut ini :

Sumber : https://www.statista.com/statistics/183588/population-density-in-the-federal-states-of-the-
us/

Dari grafik terlihat bahwa dari 10 negara bagian dengan tingkat


kecelakaan tertinggi, ada 8 negara yang termasuk dalam daftar negara
bagian dengan tingkat kepadatan penduduk tertinggi. Negara-negara
bagian tersebut adalah sebagai berikut:
1. New Jersey

11
2. Ohio
3. California
4. Illinois
5. North Carolina
6. Georgia
7. Michigan
8. Tennessee
Sedangkan Texas menduduki peringkat ke-24 dan Arizona peringkat ke-
33.

Dimana New Jersey menduduki tingkat pertama kepadatan penduduk


dengan 1.260 penduduk per square mile (sqm).

Kepadatan penduduk ini berkaitan dengan kepadatan lalu lintas atau


penggunaan jalan, dimana jumlah kendaraan pada jalan raya akan
semakin meningkat dengan penambahan atau jumlah besarnya penduduk
di suatu negara. Sehingga hal tersebut bisa meningkatkan risiko
kecelakaan di jalan raya.

b. Jumlah Pengendara Mabuk (number of drunk driver)


Dengan menambahkan faktor ini, tim penulis memperlihatkan grafik di
bawah ini :

Berdasarkan grafik di atas dapat terlihat bahwa dari 50 negara bagian, 10


negara bagian tersebut di atas adalah negara-negara yang kecelakaannya
memiliki penyebab oleh pengendara yang mabuk yang lebih tinggi
dibanding negara bagian lainnya, kecuali New Jersey ada diperingkat ke-

12
11 (dan ada tambahan Missouri di peringkat 5). Meski bukan merupakan
penyebab utama dan jumlah angka kecelakaannya tidak lebih banyak
daripada jumlah kecelakaan yang terjadi pada pengendara yang tidak
mabuk, namun jumlah kasusnya juga tidak bisa dianggap sangat sedikit,
sehingga bisa pengendara yang mabuk bisa dianggap sebagai salah satu
faktor yang mempengaruhi tingginya jumlah kasus kecelakaan pada 10
negara bagian tersebut.

c. Jenis Persimpangan Jalan (type of intersection)


Sesuai dengan analisa faktor jenis persimpangan sebagaimana disebutkan
di poin 3.1.b bahwa kecelakaan yang paling terjadi pada jenis
persimpangan “not an intersection” atau jalan tanpa persimpangan
(lurus), ketika faktor ini ditambahkan ke analisa data 10 negara bagian
dengan angka kecelakaan tertinggi maka terlihat pada grafik di bawah
ini :

Berdasarkan grafik di atas, jikalau data dilimitasi hanya menjadi 10


negara dengan jumlah kecelakaan tertinggi pada kondisi jalan ‘not an
intersection’, maka 9 dari 10 negara dengan angka kecelakaan tertinggi
di Amerika Serikat (seperti yang telah disebutkan sebelumnya
berdasarkan hasil dari query utama) termasuk dalam urutan 10 negara
teratas. Hanya New Jersey yang tidak termasuk di dalam tabel di atas,
karena New Jersey ada di urutan ke-11 (seandainya data dilimitasi
menjadi 11 data, maka New Jersey akan termasuk di dalamnya). Untuk
negara bagian yang berada di luar 10 negara dengan angka kecelakaan
tertinggi namun termasuk di dalam tabel yaitu Missouri yang berada di
urutan ke-10.
Berdasarkan grafik tersebut dapat terlihat bahwa memang 10 negara
bagian dengan angka kecelakaan tertinggi di Amerika Serikat memiliki
jumlah angka kecelakaan tertinggi pada kondisi jalan “not an
intersection”. Jalanan yang bukan merupakan persimpangan (not an
intersection) menjadi salah satu penyebab terjadinya kecelakaan.
Dimana pada tipe persimpangan ini awareness pengendara cenderung
lebih menurun atau lebih mudah lengah.
3.3 Jumlah Rerata Kecelakaan Yang Terjadi Setiap Jam
Selanjutnya untuk menjawab pertanyaan pada bagian ini, tim penulis
perlihatkan dalam grafik di bawah ini :

13
Dari yang terlihat pada diagram di atas, untuk rentang jam 0 (00.00-00.59
waktu setempat) rata-rata terdapat sekitar 0-1 kasus kecelakaan. Pada
rentang jam 1 (01.00-01.59 waktu setempat) rata-rata terdapat sekitar 0-1
kecelakaan. Jumlah rata-rata yang hampir sama terus berlanjut hingga
rentang jam 4 (04.00-04.59 waktu setempat).
Kemudian pada rentang jam 5 (05.00-05.59 waktu setempat) rata-rata
terdapat sekitar 1 kecelakaan. Demikian pula untuk rentang jam 6 (06.00-
06.59 waktu setempat) hingga rentang jam 10 (10.00-10.59 waktu
setempat) diperoleh rata-rata sekitar 1-2 kecelakaan.
Pada rentang jam 11 (11.00-11.59 waktu setempat) rata-rata terdapat
sekitar 2-3 kecelakaan. Untuk rentang selanjutnya hingga di rentang jam 16
(16.00-16.59 waktu setempat) juga diperoleh hasil rata-rata yang sama
yaitu terdapat sekitar 2-3 kasus kecelakaan.
Selanjutnya, pada rentang jam 17 (17.00-17.59 waktu setempat) hingga
rentang jam 22 (22.00-22.59 waktu setempat) ditemukan rata-rata terdapat
sekitar 1-2 kasus kecelakaan. Dan terakhir untuk rentang jam 23 (23.00-
23.59 waktu setempat) rata-rata terdapat sekitar 0-1 kasus kecelakaan.
Berdasarkan dari hasil identifikasi dan analisa data dan grafik yang dihasilkan
terlihat bahwa jumlah rata-rata kecelakaan yang terjadi setiap jam nya
sering terjadi pada pukul 11.00 sampai dengan 16.00 waktu setempat.
Dengan rata-rata antara 2,02 – 2,27 kali kecelakaan per jam nya.
Rentang waktu tersebut berhubungan dengan identifikasi dimana light
condition clear, dimana mencatatkan angka kecelakaan tertinggi sepanjang
tahun 2021.

3.4 Persentase Kecelakaan Yang Disebabkan Oleh Pengemudi Yang Mabuk

14
Berdasarkan hasil analisis data, persentase kecelakaan yang disebabkan oleh
drunk driver selama tahun 2021 hanya sebesar 24,6% atau sejumlah
3.118 kecelakaan dari 12.648 kecelakaan yang terjadi.
Sehingga bisa disimpulkan secara keseluruhan di Amerika Serikat pada tahun
2021, kecelakaan yang terjadi mayoritas tidak disebabkan oleh pengendara
yang mabuk (drunk driver). Melainkan sebanyak 75,4% (9.568 kali)
disebabkan oleh pengendara yang tidak mabuk (not drunk driver).

Walaupun berdasarkan data dan grafik terlihat bahwa kecelakaan yang


melibatkan pengemudi mabuk bukanlah penyebab dominan terjadinya
kecelakaan selama tahun 2021. Namun, walau secara statistik dan terlihat
grafik hanya 24,6% , tetapi tetap harus menjadi perhatian (alert) karena
artinya setiap 1.000 kecelakaan yang terjadi maka 246 kecelakaan
melibatkan pengemudi yang mabuk.

3.5 Persentase Kecelakaan Di Daerah Pedesaan Dan Perkotaan


Selanjutnya untuk menjawab pertanyaan poin 3.5 ini tim penulis tampilkan
dalam bentuk grafik sebagai berikut :

15
Terlihat bahwa kecelakaan banyak terjadi di area kawasan urban yaitu
sebesar 85,8% atau 10.855 kali kejadian dibandingkan kecelakaan di area
rural yang hanya 14,2% atau 1.792 kali.
Hal ini dapat menjelaskan bahwa kecelakaan kendaraan bermotor yang
dilaporkan paling banyak terjadi di daerah perkotaan (urban), dimana pada
umumnya jalan-jalan di daerah perkotaan lebih padat dikarenakan jumlah
mobilitas penduduk yang tinggi jika dibandingkan dengan daerah pedesaan
dan karena memiliki jumlah kepadatan penduduk yang lebih tinggi, serta
lebih banyak infrastruktur dibandingkan daerah pedesaan.

Sehingga tim penulis bisa simpulkan bahwa penyebab tinggi kecelakaan pada
daerah urban (kota) adalah sebagai berikut :
1. Jumlah jalanan yang bebas hambatan (not an intersection) lebih banyak
disbanding area kawasan rural;
2. Di daerah urban, banyak tempat kawasan hiburan yang mana identik
dengan penyediaan atau menjual minuman beralkohol. Sehingga banyak
kecelakaan terjadi karena pengendara dibawah pengaruh alcohol (drunk
driver); dan
3. Tingkat kepadatan penduduk yang cukup tinggi, sehingga secara tidak
langsung mempengaruhi kepemilikan jumlah kendaraan dan menyebabkan
kepadatan lalu lintas (traffic).

3.6 Jumlah Kecelakaan Berdasarkan Hari


Untuk menjelaskan pertanyaan poin 3.6 tim penulis menyertakan 2 grafik
sebagai komparasi dan keterkaitan antara jumlah kecelakaan tertinggi
berdasarkan hari dengan penyebab kecelakaan yang melibatkan pengendara
mabuk.

16
Terlihat dari grafik, bahwa tingkat kecelakaan tertinggi terjadi pada
weekend yaitu pada hari sunday sebanyak 2.274 kecelakaan, kemudian
pada hari saturday yaitu 2.072 kecelakaan.
Sedangkan pada weekdays, kecelakaan tertinggi terjadi pada hari friday
yaitu sebanyak 1.814 kecelakaan.
Banyaknya kecelakaan terjadi pada weekend sangat berkaitan dengan
beberapa hal, terutama kecelakaan yang disebabkan oleh drunk driver.
Untuk melihat keterkaitan kesimpulan di paragraph sebelumnya mari kita
lihat grafik komparasi jumlah kecelakaan dengan penyebab kecelakaan yang
melibatkan pengendara mabuk pada hari Jumat (Friday), Sabtu (Saturday)
dan Minggu (Sunday).

Dari grafik terlihat bahwa kecelakaan yang disebabkan oleh pengemudi


mabuk (drunk driver) pada hari Jumat sampai dengan Minggu mengalami
peningkatan, yaitu sebagai berikut:
1. Pada hari friday, terjadi kecelakaan yang disebabkan oleh drunk driver
sebanyak 353 kali atau 19%;
2. Pada hari saturday, terjadi kecelakaan yang disebabkan oleh drunk driver
sebanyak 595 kali atau 29%; dan

17
3. Pada hari sunday, terjadi kecelakaan yang disebabkan oleh drunk driver
sebanyak 732 kali atau 32%.

Hal ini cukup relevan dikarenakan pada ke-3 hari tersebut banyak orang
yang pergi berwisata atau ketempat-tempat hiburan yang biasanya
menyediakan berbagai jenis minuman beralkohol.

4. Kesimpulan dan Saran


4.1 Kesimpulan
Dari hasil tahapan tersebut di atas, tim penulis dapat menyimpulkan bahwa
kecelakaan di jalan raya pada tahun 2021 di Amerika Serikat sebagai
berikut:
1. 10 teratas negara bagian di mana kecelakaan paling banyak terjadi
Dari hasil identifikasi dan analisa 10 negara bagian di Amerika dengan
angka kecelakaan tertinggi yaitu California, Texas, Illinois, Tennessee,
Arizona, Georgia, Michigan, Ohio, New Jersey, dan North Carolina.
2. Jumlah rata-rata kecelakaan yang terjadi setiap jam
Hasil rata-rata kecelakaan tertinggi yaitu sekitar 2-3 kasus kecelakaan
per jam yang terjadi di rentang pukul 11.00 – 16.00 waktu setempat.
3. Persentase kecelakaan yang disebabkan oleh pengendara yang mabuk
Pengendara dibawah pengaruh alcohol (drunk driver) bisa menjadi salah
satu faktor penyebab terjadinya kecelakaan, meskipun hal tersebut
bukan merupakan faktor utama. Tetapi untuk negara-negara bagian
tertentu dan hari-hari tertentu ditemukan bahwa kecelakaan yang
dikarenakan pengendara mabuk (drunk driver) cukup tinggi. Dari hasil
identifikasi didapatkan persentase kecelakaan yang diakibatkan oleh
pengendara mabuk (drunk driver) sebesar 24,6%.
4. Persentase kecelakaan di daerah pedesaan dan perkotaan
Perbandingan persentase kecelakan di daerah pedesaaan (rural) dan
perkotaan (urban) menunjukkan bahwa kecelakaan lebih banyak
terjadi di perkotaan (urban) yaitu sebesar 85,8% dibandingkan di
daerah pedesaan (rural) yang hanya sebesar 14,2% untuk daerah
pedesaaan (rural). Hal ini antara lain disebabkan oleh tingkat kepadatan
penduduk, banyaknya tempat hiburan yang menyediakan minuman
beralkohol dan banyaknya jalan yang bebas hambatan atau highway atau
not an intersection.
5. Jumlah kecelakaan berdasarkan hari
Kecelakaan banyak terjadi pada weekend terutama pada hari sunday,
kemudian saturday. Sedangkan pada weekdays kecelakaan tertinggi
terjadi pada friday. Hal ini relevant dengan dimana banyak orang
bepergian ke tempat-tempat hiburan yang menyediakan minuman
beralkohol selepas kerja dan meningkatkan kepadatan berkendaraan di
jalan raya karena berdarma wisata.
6. Kondisi yang meningkatkan risiko kecelakaan

18
Berdasarkan hasil identifikasi dan analisa, terdapat beberapa penyebab
utama kecelakaan yang terjadi di Amerika Serikat:
a) Tipe Jalan Persimpangan (type of intersection), dimana banyak
kecelakaan terjadi dijalanan yang bukan merupakan persimpangan
atau not an intersection. Jalanan yang bukan persimpangan (not
an intersection) menyebabkan pengendara lack of awareness;
b) Kondisi Pencahayaan (light condition), pada kondisi pencahaan
yang terang/cerah atau clear kecelakaan di jalan raya banyak
terjadi. Hal ini berkaitan dengan rata-rata waktu terjadinya
kecelakaan per hari dimana pada pukul 11.00-16.00 waktu setempat
jumlah rata-rata kecelakaan cukup tinggi dibandingkan rentang
waktu yg lain. Kondisi matahari atau cuaca yg terang benderang
(silau) ini pada sebagaian pengendara bisa menimbulkan temporary
blindness sehingga mempengaruhi kestabilan dalam berkendara.
c) Pengendara Yang Mabuk (number of drunk driver), meskipun
secara keseluruhan kecelakaan yang disebabkan oleh pengendara
yang bauk (drunk driver) hanya 25%, tetapi angka tersebut cukup
tinggi. Dimana angka kecelakaan yang disebabkan oleh drunk driver
ini meningkat cukup signifikan pada hari-hari tertentu yaitu Friday,
Saturday dan Sunday dan pada 10 negara bagian dimana angka
kecelakaan tertinggi.

4.2 Saran
Adapun saran tim penulis kepada NATIONAL HIGHWAY TRAFFIC SAFETY
ADMINISTRATION (NHTSA) atas kondisi kecelakaan tahun 2021 adalah
sebagai berikut :
1. Meningkatkan jumlah petugas patrol jalanan yang melakukan random test
pada pengendara yang ditengarai dalam pengaruh alkohol, terutama pada
hari friday, saturday dan sunday;
2. Menentukan ambang batas pengaruh alkohol yang dapat ditoleransi pada
saat berkendaraan di jalan raya;
3. Memperbanyak rambu-rambu peringatan pada jalanan yang bebas
hambatan atau not an intersection;
4. Memperbanyak rest area di jalur yang banyak/padat kendaraan pada
pukul 11.00-16.00 waktu setempat dimana kondisi negara
bagiannya sebagian cerah (sunny).

19
5. Lampiran
1. Query Pembersihan Data:
-- 6 Timezone di USA
CREATE TABLE crash_clean as
WITH timezone_in_usa as (
SELECT x.*
FROM (
SELECT crash.*,
CASE
WHEN state_name IN ( 'Connecticut', 'Delaware', 'Georgia', 'Maine',
'Maryland', 'Massachusetts', 'Michigan', 'New Hampshire',
'New Jersey', 'New York', 'North Carolina', 'Ohio', 'Pennsylvania',
'Rhode Island', 'South Carolina', 'Vermont','Virginia', 'West
Virginia','District of Columbia', 'Florida', 'Indiana','Tennessee')
THEN timestamp_of_crash AT TIME ZONE 'EST'
WHEN state_name IN ( 'Alabama', 'Arkansas', 'Illinois', 'Iowa',
'Louisiana', 'Michigan', 'Minnesota', 'Mississippi' ,'Missouri',
'Nebraska', 'Oklahoma', 'Wisconsin','Kentucky','South Dakota')
THEN timestamp_of_crash AT TIME ZONE 'CST'
WHEN state_name IN ( 'Arizona', 'Colorado', 'Montana', 'New Mexico',
'North Dakota','Texas', 'Utah', 'Wyoming','Kansas')
THEN timestamp_of_crash AT TIME ZONE 'MST'
WHEN state_name IN ( 'California', 'Nevada', ‘Washington','Idaho',
'Oregon' )
THEN timestamp_of_crash AT TIME ZONE 'PST'
WHEN state_name IN ('Main Part of Alaska', 'Anchorage', 'Juneau',
'Nome' )
THEN timestamp_of_crash AT TIME ZONE 'AKST'
WHEN state_name IN ('Alaska', 'Hawaii' )
THEN timestamp_of_crash AT TIME ZONE 'HST'
END converted_timestamp
FROM crash) x
WHERE EXTRACT (YEAR FROM converted_timestamp)='2021')

SELECT *
FROM timezone_in_usa
where milepoint not in (99998, 99999)
and city_name != 'NOT APPLICABLE'
and city_name != 'Not Reported'
and city_name != 'Unknown'
and land_use_name != 'Not Reported'
and land_use_name != 'Unknown'
and functional_system_name != 'Unknown'
and functional_system_name != 'Not Reported'
and manner_of_collision_name != 'Not Reported'
and manner_of_collision_name != 'Reported as Unknown'
and type_of_intersection_name != 'Unknown'
and type_of_intersection_name != 'Not Reported'
and light_condition_name != 'Not Reported'
and light_condition_name != 'Reported as Unknown'
and atmospheric_conditions_1_name!='Not Reported'
and atmospheric_conditions_1_name!='Reported as Unknown'

***

20
2. Query Pembahasan Soal

Nomor 1. Kondisi yang memperbesar resiko kecelakaan


1a. Faktor Cuaca (atmospheric conditions)
Query Utama:
SELECT DISTINCT
atmospheric_conditions_1_name, count(1)
FROM crash_clean
GROUP BY 1
ORDER BY 2 DESC
LIMIT 5
1b. Faktor persimpangan jalan (type of intersection)
Query Utama:
SELECT DISTINCT
type_of_intersection_name, count(1)
FROM crash_clean
GROUP BY 1
ORDER BY 2 DESC
LIMIT 5
1c. Faktor kondisi cahaya (light conditions)
Query Utama:
SELECT DISTINCT
light_condition_name, count(1)
FROM crash_clean
GROUP BY 1
ORDER BY 2 DESC
LIMIT 5

1d. Faktor pengemudi mabuk (number of drunk drivers)


Query Utama 1d:
SELECT DISTINCT
number_of_drunk_drivers, count(1)
FROM crash_name
GROUP BY 1
ORDER BY 2 DESC
LIMIT 5

Query tambahan di 1d:


Query kasus kecelakaan dengan pengendara mabuk

select
count(number_of_drunk_drivers) as total_kecelakaan_per_drunk_drivers
from crash_clean
where number_of_drunk_drivers > 0

Query kasus kecelakaan dengan pengendara tidak mabuk

21
select count(consecutive_number) as jumlah_kecelakaan_
non_drunk_drivers
from crash_clean
where number_of_drunk_drivers = 0

***
Nomor 2. 10 negara bagian teratas dengan angka kecelakaan tertinggi
Query Utama:
select state_name, count(consecutive_number)
from crash_clean
group by 1
order by 2 desc
limit 10

Tabel tambahan nomor 2

POPULATION DENSITY IN US - 2021 (district of Colombia dikeluarkan)

No. State Name


1 New Jersey 1.260
2 Rhode Island 1.060
3 Massachussetts 895
4 Connecticut 745
5 Maryland 635
6 Delaware 515
7 New York 421
8 Florida 406
9 Pennsylvania 290
10 Ohio 288
11 California 252
12 Illinois 228
13 Hawai 224
14 Virginia 219
15 North Carolina 217
16 Indiana 190
17 Georgia 188
18 Michigan 178
19 South Carolina 173
20 Tennessee 169
21 New Hamphshire 155
22 Washington 116

22
23 Kentucky 114
24 Texas 113
25 Wisconsin 109
26 Louisiana 107
27 Alabama 100
28 United States 94
29 Missouri 90
30 West Virginia 74
31 Minnesota 72
32 Vermont 70
33 Arizona 64
34 Mississippi 63
35 Arkansas 58
36 Oklahoma 58
37 Iowa 57
38 Colorado 56
39 Maine 44
40 Oregon 44
41 Utah 41
42 Kansas 36
43 Nevada 29
44 Nebraska 25
45 Idaho 23
46 New Mexico 17
47 South Dakota 12
48 North Dakota 11
49 Montana 8
50 Wyoming 6
51 Alaska 1

Query 2 : 10 negara tersebut adalah negara-negara dimana kecelakaan tertinggi


disebabkan oleh "drunk driver" :
select distinct state_name,
count(case when number_of_drunk_drivers = 0 then 1 end) as
accident_not_by_drunk_drivers,
count(case when number_of_drunk_drivers > 0 then 1 end) as
accident_by_drunk_drivers
from crash_clean
group by state_name
order by accident_by_drunk_drivers desc
Hasil:

23
Tabel : Perbandingan Jumlah Kecelakaan dengan Pengendara Mabuk dengan Jumlah
Kecelakaan dengan Pengendara Tidak Mabuk

no. state_name accident_not_by_drunk_drivers accident_by_drunk_drivers


1. California 1576 469
2. Texas 1412 439
3. Ohio 318 169
4. Tennessee 469 142
5. Missouri 292 129
6. Michigan 373 128
7. Illinois 527 118
8. Georgia 439 115
9. Arizona 466 112
10. North Carolina 331 100
11. New Jersey 347 88
12. Kentucky 237 84
13. Connecticut 184 81
14. West Virginia 146 74
15. Alabama 259 71
16. Oklahoma 193 71
17. Louisiana 225 65
18. Washington 150 64
19. Maine 74 63
20. New York 216 57
21. Minnesota 104 46
22. Utah 168 44
23. South Carolina 112 42
24. Arkansas 93 35
25. New Hampshire 62 35
26. Wisconsin 77 28
27. Iowa 74 25
28. Nebraska 38 23
29. Rhode Island 37 23
30. Maryland 67 19
31. Idaho 20 18
32. Massachusetts 58 17
33. Oregon 86 14
34. Alaska 32 11
35. Hawaii 10 11
36. South Dakota 16 11
37. Vermont 32 11
38. Colorado 23 10
39. Delaware 41 10
40. District of 24 8
Columbia
41. Wyoming 15 8
42. Pennsylvania 46 6
43. Virginia 19 6
44. Florida 14 5

24
45. Montana 4 5
46. Kansas 29 4
47. North Dakota 14 3
48. Nevada 8 1
49. Indiana 4 0
50. Mississippi 7 0

10 Negara bagian dari query utama termasuk ke dalam 11 Besar negara bagian dengan
jumlah drunk_drivers tertinggi

Query 3 : Kecelakaan yang banyak terjadi pada type of intersection name

select distinct type_of_intersection_name, count(*)


from crash_clean
group by 1
order by 2 desc

Hasil: Jumlah Kecelakaan Yang Terjadi di Tipe Persimpangan


type_of_intersection_name count
Not an Intersection 8870
Four-Way Intersection 2390
T-Intersection 1250
Y-Intersection 121
Five Point, or More 23
L-Intersection 10
Traffic Circle 9
Roundabout 7
Other Intersection Type 5

Query 4: 10 negara bagian dengan kecelakaan tertinggi pada kondisi jalan


Not an intersection

select distinct state_name, type_of_intersection_name,


count(*)
from crash_clean
where type_of_intersection_name = 'Not an Intersection'
group by 1,2
order by 3 desc
limit 10

25
Hasil: Jumlah Kecelakaan Yang Terjadi Pada Not an Intersection
state_name type_of_intersection_name count
California Not an Intersection 1375
Texas Not an Intersection 1365
Tennessee Not an Intersection 453
Illinois Not an Intersection 433
Georgia Not an Intersection 403
Arizona Not an Intersection 391
Ohio Not an Intersection 333
North Carolina Not an Intersection 316
Michigan Not an Intersection 315
Missouri Not an Intersection 304

***
Nomor 3. Rata-rata kecelakaan per hari berdasarakan jam
Query:
-- menghitung rata-rata kecelakaan per jam--

select
extract(HOUR from converted_timestamp) as jam_kecelakaan,
COUNT(consecutive_number)/365.00 as rerata_kecelakaan_per_jam
from crash_clean
group by extract(HOUR from converted_timestamp)
order by jam_kecelakaan ASC

***
Nomor 4. Persentase kecelakaan akibat pengemudi mabuk
Query:
-- PERSENTASE KECELAKAAN YANG DISEBABKAN OLEH PENGEMUDI MABUK --

SELECT
COUNT(CASE WHEN number_of_drunk_drivers = 0 THEN 1 END) as
not_drunk_driver,
COUNT (CASE WHEN number_of_drunk_drivers > 0 THEN 1 END) as
drunk_driver,
CAST(COUNT(CASE WHEN number_of_drunk_drivers > 0 THEN 1 END) *
100.0 / COUNT(number_of_drunk_drivers) AS numeric(5,2))
AS persentase_mabuk
FROM crash_clean
***

Nomor 5. Persentase kecelakaan di area Pedesaan dan Perkotaan

26
Query:
SELECT land_use_name,
COUNT(*) AS jumlah_kecelakaan,
SUM(COUNT(*)) OVER (PARTITION BY NULL) AS kecelakan_keseluruhan,
(COUNT(*) * 100.0 / SUM(COUNT(*)) OVER (PARTITION BY NULL)) AS
persentase
FROM
crash_clean
WHERE
land_use_name!='Trafficway Not in State Inventory'
GROUP BY
land_use_name;

***
6. Angka kecelakaan berdasarkan hari kecelakaan terjadi
Query untuk mencari hari:
--Angka kecelakaan berdasarkan hari terjadinya kecelakaan--
WITH hari_kecelakaan AS
(select converted_timestamp,
to_char (converted_timestamp, 'D-Day') as nama_hari
from crash_clean)

SELECT nama_hari, COUNT(*) as jumlah_kecelakaan_per_hari


FROM hari_kecelakaan
GROUP BY nama_hari
ORDER BY nama_hari ASC

Setelah diurutkan, hasilnya paling banyak terdapat kecelakaan di hari Minggu, paling
sedikit kecelakaan terjadi di hari Selasa.

Query Utama:
--Angka kecelakaan terbanyak berdasarkan hari terjadinya kecelakaan--

WITH hari_kecelakaan AS
(select converted_timestamp,
to_char (converted_timestamp, 'D-Day') as nama_hari
from crash_clean)

SELECT nama_hari, COUNT(*) as jumlah_kecelakaan_per_hari


FROM hari_kecelakaan
GROUP BY nama_hari
ORDER BY jumlah_kecelakaan_per_hari DESC

27
Query tambahan:
-- Query for melihat banyak drunk driver pada hari weekend
SELECT
TO_CHAR(converted_timestamp, 'Day') AS hari,
--EXTRACT(DOW FROM converted_timestamp) AS hari,
COUNT(*) AS jumlah_kecelakaan,
SUM(CASE WHEN number_of_drunk_drivers > 0 THEN 1 ELSE 0 END) AS
jumlah_drunk_driver
FROM
crash_clean
GROUP BY
hari
ORDER BY
hari;

28

Anda mungkin juga menyukai