×
Saat ini konten porno banyak bertebaran di sebuah website baik dalam bentuk konten utama maupun iklan. Salah satu cara untuk mencegah konten yang tidak diinginkan tersebut adalah dengan pendeteksian konten. Pendeteksian konten dilakukan dengan proses text mining. Setiap website diprediksi dengan mempertimbangkan karakteristik text yang ada didalamnya.Metode yang digunakan untuk mempredeksi web porno dalam penelitian ini adalah bayesian filtering, Bayesian filtering berrfungsi memperhitungkan probabilitas kemiripan suatu website dengan membandingkan munculnya tiap keyword pada data latih.Namun, banyaknya keyword atau variable mempengaruhi efisiensi dan keakuratan deteksi.Untuk mengatasi hal tersebut, peneilitan ini menggunakan Principal component analysis untuk mengurangi dan mencari variable yang memiliki pengaruh penting terhadap deteksi. Dari penelitian ini diperoleh tingkat akurasi tertinggi deteksi web berkonten porno dengan metode bayesian filtering sebesar 89.22%, hasil deteksi tersebut menggunakan 51 variable hasil ekstraksi Principal component analysis.
Kata kunci :Bayesian Filtering, Text mining, Deteksi, PCA, Porno