Abstrak
Pengembangan graph-based summarization dengan fitur tag html dan metadata
Oleh :
Yuni Susanti - M0507054 - Fak. MIPA
Tugas akhir ini berfokus pada automatic text summarization ekstraktif untuk konten dalam web (single-document) menggunakan pendekatan berbasis graf yang dilakukan modifikasi dengan penambahan fitur – fitur khusus yang hanya dimiliki objek data teks dari halaman web : tag HTML dan metadata.
Pemberian style yang berbeda dalam teks seperti pemberian bold, underline, ataupun italic dalam tipografi akan memberikan emphasis yang bertujuan untuk memberi tekanan / penegasan pada bagian teks tersebut. Emphasis tersebut dapat mengindikasikan tingkat kepetingan tertentu pada bagian teks tersebut. Sementara itu, merujuk pada definisinya, metadata adalah “data about data”, sehingga penggunaan metadata sebagai query / keyword untuk mendukung penelitian cukup tepat karena pada umumnya metadata dibuat langsung oleh manusia.
Studi eksperimen menunjukkan bahwa metode yang diajukan memberikan hasil yang lebih baik (dilihat dari skor precision, recall serta f-measure) dibandingkan dengan metode yang digunakan oleh sistem lain (GreatSum dan SweSum) dengan berbagai jenis variasi pengujian dan data.