Abstrak


PERBANDINGAN PERFORMA SELEKSI FITUR CORRELATION BASED FEATURE SELECTION DAN SYMMETRICAL UNCERTAINTY PADA ALGORITMA KLASIFIKASI UNTUK PREDIKSI MAHASISWA DROP OUT


Oleh :
Indah Paksi Larasati - M0519049 - Fak. Teknologi Informasi dan Sains Data

Tingkat dropout tinggi dapat mengancam lembaga pendidikan karena berpotensi menyebabkan lulusan universitas kurang berkualitas di masa depan. Educational Data Mining (EDM) menawarkan cara baru untuk menganalisis performa akademik siswa. Dalam EDM, seleksi fitur berfungsi untuk menghilangkan atribut yang tidak relevan dalam dataset akademik, sehingga mempercepat proses penambangan data. Meskipun banyak upaya telah dilakukan untuk mengatasi masalah drop out, penelitian tentang kombinasi klasifikasi dengan teknik seleksi fitur untuk meningkatkan kinerja prediksi masih terbatas. Penelitian ini melakukan analisis perbandingan kinerja Correlation-based Feature Selection (CFS) dan Symmetrical Uncertainty (SU) dalam memprediksi mahasiswa yang drop out dengan menggunakan tiga algoritma klasifikasi: decision tree, SVM, dan Naive Bayes. Selain itu, penelitian ini mengidentifikasi atribut-atribut yang paling berpengaruh terhadap mahasiswa yang memiliki potensi drop out berdasarkan kedua metode seleksi fitur. Hasil penelitian menunjukkan bahwa seleksi fitur SU memiliki kinerja yang lebih baik dalam memprediksi mahasiswa yang drop out dibandingkan CFS. Penerapan seleksi fitur pada klasifikasi menunjukkan bahwa Decision Tree dan SVM dengan seleksi fitur SU memiliki efek yang lebih positif dibandingkan CFS. Sebaliknya, Naïve Bayes memberikan dampak yang positif dengan seleksi fitur CFS. Akurasi tertinggi dalam klasifikasi tercapai ketika menggunakan SVM dengan seleksi fitur SU, mencapai 98,16%. Hasil Penelitian ini juga menemukan faktor yang mempunyai pengaruh signifikan pada potensi mahasiswa drop out,  antara lain jumlah SKS semester 4, Indeks Prestasi  pada semester 1 hingga 4, jenis kelamin, dan domisili mahasiswa.