Abstrak


Clustering Berita Berbahasa Jawa Krama Alus Menggunakan Algoritma Hierarchical dan K-Means Clustering


Oleh :
Lafenia Merta Tri Utami - M0514030 - Fak. MIPA

ABSTRAK
Berita pada umumnya dipublikasikan oleh lembaga penyedia berita. Lembaga penyedia berita dalam mempublikasikan berita terkadang tidak dikelompokkan dalam beberapa kategori berita. Hal tersebut memungkinkan pembaca merasa kesulitan dalam mencari berita karena berita-berita yang dicari tidak terkelompok. Penelitian ini  mengelompokkan berita berbahasa Jawa Krama Alus dengan tujuan agar pembaca berita dapat mencari berita sesuai kategori dengan Algoritma Hierarchical dan K-Means. Data penelitian menggunakan dokumen berita dari portal berita online JOGJATV.
Dalam penelitian ini data diolah melalui text preprocessing. Text preprocessing terdiri dari lima proses salah satunya stemming. Stemming yang digunakan mengadaptasi dari algoritma Nazief dan Adriani yang disesuaikan dengan aturan dalam Bahasa Jawa. Metode yang digunakan untuk mengolah hasil text preprocessing yaitu hierarchical clustering dikombinasikan dengan k-means. Hierarchical clustering digunakan untuk menentukan jumlah cluster dan centroid setiap cluster.  
Hasil penelitian menunjukkan bahwa pada proses stemming diperlukan adanya penambahan kata dasar dan aturan stemming. Sedangkan untuk hasil clustering berjumlah 18 cluster. Hasil clustering selanjutnya dilakukan proses evaluasi struktur cluster secara keseluruhan dengan Average Silhouette Width (ASW) yang menunjukkan nilai 0,9142. Nilai tersebut menunjukkan bahwa suatu cluster memiliki karakteristik yang berbeda dengan cluster yang lain sehingga dokumen-dokumen berita sudah berada pada kelompok yang tepat. Hasil clustering juga divalidasi oleh Pakar dengan hasil yang baik yaitu 11 cluster dapat ditentukan labelnya sedangkan 7 cluster dengan label belum spesifik.


Kata kunci: Dokumen Berita, Stemming Bahasa Jawa, Hierarchical Clustering, K-Means Clustering, Average Silhouette Width (ASW).