Abstrak


Klasifikasi trending topic twitter untuk single-label menggunakan multinomial naive bayes (MNB) dan multi-label menggunakan k-nearest neighbors (KNNn)


Oleh :
Kartini Aprilia Pratiwi Nuzry - M0514026 - Fak. MIPA

Trending Topic merupakan salah satu fitur yang terdapat dalam twitter berupa topik singkat yang sedang trend. Namun, topik yang singkat tersebut terkadang sulit dipahami penggunanya, sehingga mendorong peneliti melakukan penelitian yang bertujuan mengklasifikasikan trending topic menjadi kategori umum sehingga lebih mudah dalam memahami trending topic. Untuk mengatasi masalah tersebut digunakan pengelompokan trending topic yaitu politik, olahraga, hiburan, pariwisata, bisnis dan berita lainnya. Masalah lain yang muncul adalah adanya multi-label pada klasifikasi. Klasifikasi single-label akan mengklasifikasikan suatu trending topic kedalam satu label saja, sedangkan klasifikasi multi-label mengklasifikasikan kedalam lebih dari satu label. Pada penelitian ini dilakukan klasifikasi single-label menggunakan Multinomial Naive Bayes (MNB) dan klasifikasi multi-label menggunakan K-Nearest Neighbors (KNN). Langkah pada penelitian ini yaitu mengumpulkan data trending topic beserta tweetnya, labelling dan text preprocessing, pembobotan TF-IDF, klasifikasi single-label menggunakan MNB dan klasifikasi multi-label menggunakan KNN dengan pendekatan Binary Relevance, terakhir evaluasi dan analisa hasil. Dari hasil penelitian, Akurasi untuk single-label menggunakan MNB mendapatkan hasil terbaik yaitu 82,53% sementara untuk multi-label menggunakan KNN dengan K=3 mendapatkan hasil terbaik yaitu 88,05%.

 

Kata kunci: trending topic, single-label, multi-label, multinomial naive bayes, k- nearest neighbors, tf-idf, binary relevance