Abstrak
Analisis Komparatif Algoritma Machine Learning Dengan Seleksi Fitur RFE-CV Untuk Prediksi Dropout Mahasiswa
Oleh :
Sekar Gesti Amalia Utami - M0521071 - Fak. Teknologi Informasi dan Sains Data
Tingginya angka mahasiswa dropout pada perguruan tinggi
menjadi persoalan yang dihadapi institusi pendidikan karena berdampak pada
penilaian kualitas institusi dan menjadi salah satu kriteria penting dalam
evaluasi akreditasi oleh BAN-PT. Penelitian ini bertujuan mengembangkan model
prediksi dini mahasiswa berpotensi dropout menggunakan data demografi dengan
pendekatan learning analytics. Lima algoritma klasifikasi digunakan dalam
penelitian ini, yaitu Random Forest (RF), Decision Tree (DT), Logistic Regression
(LR), Light Gradient Boosting Machine (LGBM), dan Support Vector Machine (SVM).
Dataset yang digunakan terdiri dari data mahasiswa S1 Universitas Sebelas Maret
tahun 2013 (n=2476) yang diproses melalui teknik preprocessing, resampling
dengan SMOTE, serta validasi menggunakan K-Fold Cross-Validation. Hasil
penelitian menunjukkan bahwa model RF memberikan performa terbaik dengan akurasi sebesar
96,01%, diikuti oleh LGBM (95,26%), DT (91,24%), LR (83,68%), dan SVM
(83,19%). Penggunaan metode seleksi fitur Recursive Feature Elimination with
Cross-Validation (RFE-CV) mampu meningkatkan efisiensi model dengan mengurangi
jumlah fitur tanpa menurunkan performa secara signifikan. Seleksi fitur terbaik
diperoleh saat menggunakan 75% fitur, yang memberikan keseimbangan optimal
antara jumlah fitur dan akurasi model. Fitur-fitur yang paling berkontribusi
meliputi IPS_range (Indeks Prestasi Semester), penghasilan orang tua, asal
daerah mahasiswa, serta beberapa faktor demografis lainnya. Penelitian ini
diharapkan membantu institusi pendidikan dalam mendeteksi mahasiswa berisiko
dropout sejak dini sehingga dapat dirancang intervensi yang tepat guna
meningkatkan retensi mahasiswa.