Kecelakaan lalu lintas merupakan salah satu penyebab utama kematian dan cedera di Indonesia. Faktor-faktor yang berkontribusi terhadap tingkat keparahan kecelakaan antara lain adalah kondisi jalan dan gangguan yang ada pada jalan tersebut.
Penelitian ini bertujuan untuk menganalisis pengaruh jenis gangguan jalan dan bentuk jalan terhadap tingkat keparahan kecelakaan dengan pendekatan machine learning. Data sekunder kecelakaan lalu lintas di Kabupaten Sukoharjo dari tahun 2019 hingga 2023 dianalisis menggunakan algoritma Random Forest, XGBoost, DBSCAN, K-Means.
Hasil penelitian menunjukkan bahwa gangguan jalan seperti jalan rusak dan bentuk jalan persimpangan berkontribusi terhadap peningkatan tingkat keparahan kecelakaan. Algaroitma Random Forest mampu memprediksi tingkat keparahan kecelakaan dengan tingkat akurasi setinggi 98%, memberikan wawasan penting bagi perencanaan dan kebijakan keselamatan lalu lintas di daerah tersebut.