Abstrak


Sistem Pendeteksi Ujaran Kebencian Bahasa Indonesia


Oleh :
Umu Amanah Nur Rohmawati - M0514050 - Fak. MIPA

ABSTRAK


Ujaran kebencian telah menjadi perhatian baik oleh masyarakat maupun pemerintah sejak meningkatnya propaganda ujaran kebencian di media sosial dalam beberapa tahun terakhir. Deteksi ujaran kebencian bahasa Indonesia menjadi sangat krusial dikarenakan tingginya jumlah kasus ujaran kebencian yang terjadi di Indonesia. Dalam penelitian ini, dibangun sebuah sistem deteksi ujaran kebencian bahasa Indoneisa bernama SITUBENCI. Antar muka SITUBENCI yang dikembangan yaitu Application Programming Interface (API) dan plugin wordpress. API SITUBENCI dibangun dengan mengimplementasikan model klasifikasi Support Vector Machine dengan Term Frequency Inverse Document Frequency (SVM + TF-IDF). SVM + TF-IDF dipilih karena berdasarkan hasil percobaan yang dilakukan, model ini mempunyai nilai rata-rata akurasi dan presisi paling tinggi dibandingkan model yang lain yaitu masing-masing (0.857046041) dan (0.861465433). API dibangun dengan tujuan agar model klasifikasi ujaran kebencian yang telah dibangun dapat diakses dengan mudah oleh orang lain dan tidak perlu melatih modelnya setiap kali akan menggunakannya. Wordpress dipilih karena merupakan Content management system (CMS) dengan pengguna tebanyak didunia (31,7%). SITUBENCI dapat mendeteksi ujaran kebencian secara otomatis dan memungkinkan data latih terus berkembang. Sistem dirancang agar pengguna dapat memberikan umpan balik terhadap prediksi yang diberikan oleh API, umpan balik tersebut akan dijadikan data training baru dan disimpan dalam database. Sistem melakukan self-training setiap hariĀ  menggunakan keseluruhan data latih baik yang baru maupun yang lama sehingga kinerja model akan terus meningkat seiring waktu.


Kata kunci: API, Plugin Wordpress, SITUBENCI, Ujaran Kebencian