Abstrak


Perbandingan Metode K-Nearest Neighbor (K-Nn) dan Support Vector Machine (Svm) dalam Klasifikasi Dokumen Multi-Label (Studi Kasus Tugas Akhir Mahasiswa S1 Informatika UNS)


Oleh :
Ahmad Syarifuz Zaki - M0515002 - Fak. MIPA

Klasifikasi adalah proses pengelompokkan objek yang memiliki karakteristik atau ciri yang sama ke dalam beberapa kelas. Klasifikasi dokumen dapat dilakukan dengan menggunakan ciri atau fitur kata yang muncul pada dokumen latih. Namun apabila suatu ciri yang menjadi ciri dari satu dokumen merupakan ciri dari dokumen lainnya maka dokumen tersebut memiliki lebih dari satu topik atau disebut multi-label. Penelitian ini membandingkan metode klasifikasi K-Nearest Neighbor dengan Support Vector Machine dalam klasifikasi dokumen multi-label. Menggunakan metode pendekatan Problem Tranformation yaitu Binary Relevance (BR) dan Label Powerset (LP) untuk mengadaptasi metode K-Nearest Neighbor dan Support Vector Machine dalam membangun klasifikasi. Dataset yang digunakan adalah skripsi mahasiswa S1 Informatika UNS. Penelitian ini diuji dengan menggunakan validasi 10-fold cross validation. Sehingga nilai peforma terbaik untuk accuracy dan hamming loss pada SVM sebesar 0.66 dan 0.14 sedangkan untuk KNN sebesar 0.64 dan 0.17. Menurut hasil tersebut, metode SVM memiliki peforma yang lebih baik dari pada metode KNN.

Kata kunci: klasifikasi, multi-label, k-nearest neighbor, support vector machine, problem Tranformation, skripsi.