Abstrak


Analisis Komparatif Algoritma Machine Learning Dengan Seleksi Fitur RFE-CV Untuk Prediksi Dropout Mahasiswa


Oleh :
Sekar Gesti Amalia Utami - M0521071 - Fak. Teknologi Informasi dan Sains Data

Tingginya angka mahasiswa dropout pada perguruan tinggi menjadi persoalan yang dihadapi institusi pendidikan karena berdampak pada penilaian kualitas institusi dan menjadi salah satu kriteria penting dalam evaluasi akreditasi oleh BAN-PT. Penelitian ini bertujuan mengembangkan model prediksi dini mahasiswa berpotensi dropout menggunakan data demografi dengan pendekatan learning analytics. Lima algoritma klasifikasi digunakan dalam penelitian ini, yaitu Random Forest (RF), Decision Tree (DT), Logistic Regression (LR), Light Gradient Boosting Machine (LGBM), dan Support Vector Machine (SVM). Dataset yang digunakan terdiri dari data mahasiswa S1 Universitas Sebelas Maret tahun 2013 (n=2476) yang diproses melalui teknik preprocessing, resampling dengan SMOTE, serta validasi menggunakan K-Fold Cross-Validation. Hasil penelitian menunjukkan bahwa model RF memberikan performa terbaik dengan akurasi sebesar 96,01%, diikuti oleh LGBM (95,26%), DT (91,24%), LR (83,68%), dan SVM (83,19%). Penggunaan metode seleksi fitur Recursive Feature Elimination with Cross-Validation (RFE-CV) mampu meningkatkan efisiensi model dengan mengurangi jumlah fitur tanpa menurunkan performa secara signifikan. Seleksi fitur terbaik diperoleh saat menggunakan 75% fitur, yang memberikan keseimbangan optimal antara jumlah fitur dan akurasi model. Fitur-fitur yang paling berkontribusi meliputi IPS_range (Indeks Prestasi Semester), penghasilan orang tua, asal daerah mahasiswa, serta beberapa faktor demografis lainnya. Penelitian ini diharapkan membantu institusi pendidikan dalam mendeteksi mahasiswa berisiko dropout sejak dini sehingga dapat dirancang intervensi yang tepat guna meningkatkan retensi mahasiswa.