Penulis Utama : Arba Sasmoyo
NIM / NIP : M0511007
×

ABSTRAK
Universitas Sebelas Maret memiliki banyak repositori dokumenonline. Mengelola repositori dengan jumlah banyak tidaklah mudah. Dengan banyaknya jumlah repositori dokumen tersebut justru mempersulit pengguna dalam mencari dokumen. Selain itu, metode pencarian pada beberapa repositori dokumen kurang optimal karena hanya mempertimbangkan judul saja.
Oleh karena itu, pada penelitian ini diajukan sebuah metode untuk mengindeks dan mencari dokumen yang tersebar di beberapa repositori. Terdapat beberapa langkah untuk mengindeks dokumen yang berbeda antara dokumen berbahasa satu dengan bahasa lain. Naive Bayes Classifier digunakan untuk mengklasifikan sebuah dokumen berdasarkan bahasanya. Selanjutnya, pencarian dokumen dilakukan menggunakan algoritma Vector Space Model. Proses klasifikasi dan pencarian diuji menggunakan perhitungan accuracy, precision dan recall. Hasilnya, Naive Bayes Classifier memiliki accuracy 97,62%, precision dokumen Indonesia dan Inggris 98,30% dan 95,56%, dan recall dokumen Indonesia dan Inggris 95,28% dan 98,17%. Sedangkan Vector Space Model memiliki precision dan recall sebesar 26,59% dan 100%.
Kata kunci: Naive Bayes Classifier, Pengindeksan dokumen, Repositori dokumen, Vector Space Model.
ABSTRACT
Sebelas Maret University has many online document repositories. Managing many document repositories is not a simple task. As the number of document repository increases, users will have difficulty searching for a document across multiple repositories. Poor searching method on document repository also give users evenmore bad experiences.
This research propose a method to index and search document which are located accross multiple document repositories. There are some steps to index documents, and some of them are languange specific. Naive Bayes Classifier will be used to classify document according to its language. Document searching will use Vector Space Model algorithm. Document classification and searching will be tested using accuracy, precision and recall. The results showed that Naive Bayes Classifier has accuracy 97.62%, precision for Indonesia and English 98,30 and 95.56% and recall for Indonesia and English 95,28% and 98,17%. Meanwhile Vector Space model has precision and recall 26,59% and 100%.
Keywords: Document indexing,Document repository, Naive Bayes Classifier, Vector Space Model.

×
Penulis Utama : Arba Sasmoyo
Penulis Tambahan : -
NIM / NIP : M0511007
Tahun : 2016
Judul : Klasifikasi dan Pembangkitan Indeks Untuk Pencarian Koleksi Dokumen Online dengan Menggunakan Metode Naive Bayes Classifier dan Vector Space Model
Edisi :
Imprint : Surakarta - FMIPA - 2016
Program Studi : S-1 Informatika
Kolasi :
Sumber : UNS-FMIPA Jur. Informatika-M0511007-2016
Kata Kunci :
Jenis Dokumen : Skripsi
ISSN :
ISBN :
Link DOI / Jurnal : -
Status : Public
Pembimbing : 1. Ristu Saptono, S.Si., M.T.
2. Dr. Wiranto M.Kom., M.Cs.
Penguji :
Catatan Umum :
Fakultas : Fak. MIPA
×
File : Harus menjadi member dan login terlebih dahulu untuk bisa download.