Abstrak


Prediksi prestasi dan waktu kelulusan mahasiswa menggunakan algoritma c4.5


Oleh :
Rizkya Nur Majid - M0512051 - Fak. MIPA

Evaluasi prestasi mahasiswa diwakili dengan nilai Indeks Prestasi  Kumulatif (IPK) dan lamanya mahasiswa menyelesaikan masa studi. Prediksi prestasi mahasiswa yang diwakili oleh IPK dan waktu kelulusan menjadi penting bagi universitas dikarenakan universitas dapat mengantisipasi mahasiswa yang membutuhkan pembelajaran tambahan sejak dini (tahun pertama) guna meningkatkan kinerja mahasiswa. Penelitian ini dilakukan untuk menyelidiki akurasi penggunaan algoritma C4.5 dalam membangun model decision tree prediksi kelas prestasi (IPK) dan kelas waktu kelulusan mahasiswa.
Parameter data yang digunakan adalah data demografis dan Indeks Prestasi (IP) tahun ajaran pertama mahasiswa Universitas Sebelas Maret. Data dibagi berdasarkan rumpun ilmunya, yaitu ilmu pengetahuan alam dan ilmu pengetahuan sosial karena setiap ilmu pengetahuan memiliki ukuran standar penilaian yang berbeda. Model dibangun dengan data training  hasil kombinasi dari (1) kelas prediksi Indeks Prestasi Kumulatif (IPK), (2)  kelas prediksi waktu kelulusan, (3) data mahasiswa ilmu sains, (4) data mahasiswa ilmu sosial. Data training memiliki imbalanced class sehingga teknik oversampling dan pruning diimplementasikan ke dalam kombinasi data training. Sehingga, data training yang digunakan berjumlah sebanyak 8 jenis data. Hasil pengujian sebelum dan setelah oversampling dan pruning akan dibandingkan untuk mencari pengaruh terhadap akurasi model decision tree. 
Hasil penelitian menunjukkan model decision tree terbaik untuk mengklasifikasikan kelas IPK dibangun menggunakan data mahasiswa sains. Model data sains untuk klasifikasi kelas ipk (akurasi: 72.94%, precision : 0.700, recall : 0.729. Sedangkan untuk model decision tree terbaik untuk mengklasifikasikan kelas waktu kelulusan adalah data mahasiswa sosial. Model data sosial untuk klasifikasi kelas lulus (akurasi : 75.45%, precision : 0.739, dan recall : 0.755).  Penelitian ini menunjukkan penggunaan oversampling menurunkan nilai akurasi. Namun sebaliknya, penggunaan pruning pada model berhasil menaikan nilai akurasi model decision tree. 

Kata Kunci : C4.5, data mining, kelulusan mahasiswa, klasifikasi, prestasi mahasiswa