×
ABSTRAK
Jumlah koleksi dokumen tugas akhir di Program Studi Informatika UNS semakin bertambah, tetapi koleksi dokumen tugas akhir tersebut belum dimanfaatkan secara maksimal. Padahal jika diolah dengan mengelompokkan dokumen tugas akhir berdasarkan kemiripan topik, koleksi dokumen tugas akhir tersebut dapat memberikan manfaat bagi dosen maupun mahasiswa. Pada penelitian ini, dilakukan clustering terhadap dokumen tugas akhir di Program Studi Informatika UNS menggunakan metode Group-Average dan Cosine Similarity. Bagian dokumen yang diolah adalah bab 2 yang berisi tinjauan pustaka. Jumlah koleksi dokumen yang digunakan adalah 110 dokumen. Hasil clustering menggunakan metode Group-Average menghasilkan 10 cluster dengan ketidaksesuaian dokumen sebanyak 8 dokumen. Analisis dilakukan secara subyektif dengan melihat kemiripan topik berdasarkan judul antara dokumen yang satu dengan dokumen yang lain dalam satu cluster. Hasil analisis menunjukkan bahwa kemiripan metode yang digunakan dan studi kasus yang diangkat di dalam penelitian tugas akhir mempengaruhi hasil pembentukan cluster.
Kata Kunci : Clustering, Cosine Similarity, Group-Average, Text Preprocessing