×
Data mining merupakan proses eksplorasi terhadap data yang berukuran
besar untuk menemukan pola dalam pengambilan keputusan. Salah satu teknik
dalam pengambilan keputusan adalah klasifikasi. Klasifikasi adalah teknik dalam
data mining dengan menerapkan metode pohon keputusan untuk membentuk
data dalam grup atau kelas. Algoritme yang digunakan dalam pohon keputusan
adalah algoritme C4.5.
Pada dunia pendidikan, proses penentuan jurusan siswa adalah hal penting
yang perlu diputuskan dengan benar. Tujuan dalam penelitian ini untuk
menentukan penjurusan siswa SMA menggunakan algoritme C4.5. Berdasarkan
pembahasan dapat disimpulkan bahwa algoritme C4.5 dapat digunakan dalam
klasifikasi penjurusan karena memiliki akurasi tinggi.
Dalam penelitian ini, penentuan jurusan diperoleh dengan menghitung jumlah
kasus IPA dan IPS tiap atribut, entropy, gain, split info dan gain ratio. Hasil
pengujian terhadap nilai siswa SMA Negeri 2 Surakarta pada data testing yang
dilakukan sebanyak lima kali secara random, diperoleh rata-rata persentase keakuratan
sebesar 86,82% dengan recall 92,19% dan presisi 88,17%. Sedangkan
hasil pengujian secara keseluruhan presentase keakuratan sebesar 89,78%.
Kata kunci: data mining, klasifikasi, algoritme C4.5