Abstrak |
: |
DKI Jakarta merupakan kota metropolitan dengan aktivitas manusia yang menyebabkan peningkatan emisi. Peningkatan emisi ini mempengaruhi penurunan kualitas udara. Berdasarkan pemantauan kualitas udara dunia pada tahun 2021 yang dilakukan IQAir menempatkan DKI Jakarta di posisi 12 sebagai ibu kota negara paling berpolusi di dunia. Indonesia memiliki standar pencemaran udara yang diatur oleh kementrian lingkungan hidup dan kehutanan yakni Indeks Standar Pencemaran Udara (ISPU). Penentuan kategori ISPU dapat dilakukan menggunakan proses klasifikasi dari data mining. Tujuan penelitian merupakan mengklasifikasikan kualitas udara DKI Jakarta dan mendapatkan algoritma yang lebih baik antara random forest dan naive Bayes berdasarkan nilai accuracy, precision, recall, dan F1-score. Random Forest merupakan algoritma untuk menyelesaikan klasifikasi data berdasarkan proses voting dari pohon keputusan yang terbentuk. Naive Bayes merupakan algoritma untuk memprediksi peluang di masa depan berdasarkan data di masa lalu berbasis probabilitas. Variabel data yang digunakan dalam penelitian ini merupakan kualitas udara dengan kategori berdasarkan ISPU sebagai variabel terikat dan terdapat enam variabel bebas. Variabel bebas penelitian ini berupa data partikulat 10 (PM10), partikulat 2,5 (PM2,5), karbon monoksida (CO), nitrogen dioksida (NO2), sulfur dioksida (SO2), dan ozon (O3). Hasil klasifikasi yang diperoleh menunjukkan algoritma random forest memiliki performa lebih baik dibandingkan dengan algoritma naive Bayes dengan nilai accuracy yaitu sebesar 99,3%, nilai precision yaitu sebesar 99,0%, nilai recall yaitu sebesar 99,0?n nilai F1-score yaitu sebesar 99,0%. Selain itu, berdasarkan hasil analisis diperoleh tiga variabel yang paling berpengaruh terhadap klasifikasi ini secara berturut-turut merupakan partikulat 2,5 (PM2,5), partikulat 10 (PM10), dan nitrogen dioksida (NO2). |