Abstrak


Ekstraksi Entity Lokasi Tindak Kriminal pada Surat Kabar Online Berbahasa Indonesia


Oleh :
Neno Sulistiyawan - M0509048 - Fak. MIPA

ABSTRACT
Almost every day we can obtain information about crime news such as theft,
murder, assault, drug, or rape through online news. Crime news can be used as a
good data source to make map of crime distribution in an area if we can extract the
location of a crime. This study aimed to extract entity location on crime news online
in Indonesian newspapers. In this study we used rule-based algorithm combined
with morphology token, contextual component and database of administration area
to identify and extract the entity location of a crime, as well as using the algorithm
SVM (Support Vector Machine) to classify the sentence which is a sentence that
contains the location of a crime.For each sentence which is contains criminals
location will passing geocoding process so that location can be mapped on digital
map. Benefits from this research is we can know the point of crime distribution in
an area using crime new from the internet.
The results of this experiment shows that accuracy of rule based algorithm to
identitfy location entity is 96.2%, while the best accuracy of SVM model to
classifying crime location sentence is 95.77% using radial kernel.
Keywords :Information Extraction, Named Entity, Support Vector Machine, Crime.
ABSTRAK
Hampir setiap hari kita dapat memperoleh informasi berita kriminal seperti
pencurian, pembunuhan, penganiayaan, narkoba, ataupun pemerkosaan melalui
berita online. Sehingga berita kriminal dapat dijadikan sebagai sumber data yang
bagus untuk membuat data persebaran tindak kriminal pada suatu daerah jika kita
dapat mengekstrak lokasi tindak kriminal. Penelitian ini bertujuan untuk
mengekstrak entity lokasi pada berita kriminal online pada surat kabar berbahasa
Indonesia. Pada penelitian ini digunakan rule-based algorithm yang digabungkan
dengan morphology token, contextual component dan database wilayah
administrasi untuk mengidentifikasi dan mengekstrak entity lokasi tindak kriminal,
serta menggunakan algoritma SVM (Support Vector Machine) untuk
mengklasifikasikan kalimat mana yang merupakan kalimat yang mengandung
lokasi tindak kriminal. Untuk setiap kalimat yang merupakan kalimat lokasi
kriminal mengalami proses geocoding agar dapat dipetakan pada peta digital.
Manfaat yang dapat diperoleh dari penelitian ini adalah kita dapat mengetahui titik
persebaran tindak kriminal pada suatu daerah menggunakan berita kriminal dari
internet.
Hasil penelitian menunjukkan akurasi dari rule based algorithm untuk
mengidentifikasi entity lokasi adalah 96.2%, sedangkan akurasi terbaik dari model
SVM untuk mengklasifikasikan kalimat yang mengandung entity lokasi terjadinya
tindak kriminal sebesar 95.77% dengan menggunakan kernel radial.
Kata Kunci : Ekstraksi Entity, Entity Lokasi, Support Vector Machine, Kriminal