×
ABSTRAK
Dalam penggunaan layanan e-mail, keamanan adalah hal paling utama. Berbagai
jenis e-mail masuk ke kotak masuk setiap waktunya. Spam adalah hal yang tidak
diinginkan pengguna layanan karena lebih banyak merugikan. Untuk
meminimalisir hal tersebut maka dibuatlah filterisasi untuk spam. Pada penelitian
ini metode filterisasi yang diterapkan adalah Naïve Bayesian dan ID3. Kedua
algoritma akan dijalankan di lingkungan server POP3. Secara garis beras kinerja
kedua algoritma ini sama, yaitu dengan cara mengenali identitas berdasarkan ciriciri
kata kunci dengan menghitung probabilitas tiap kata, apakah termasuk ke
dalam ciri spam atau pun non-spam. Hasil dari penelitian ini adalah dari 10 kali
percobaan seluruhnya menyatakan bahwa nilai akurasi, presisi, recall metode
Naïve Bayesian lebih baik dibandingkan ID3 dan error rate dari metode Naïve
Bayesian lebih kecil.
Kata Kunci : E-mail,Spam,Naïve Bayesian, ID3, POP3.
ABSTRACT
In the use of e-mail services, security is the most important thing. Various types of
e-mail enter the inbox every time. Spam is an unwanted thing by the user because
of its harmful nature. To minimize this, many programs was developed to filter
spam. In this study, Naïve Bayesian and ID3 will be used as the methods. Both
algorithms will run on POP3 server environments. In general, the performance of
both algorithm is similar which is recognizing identity based on the characteristics
of keywords and then calculate the probability of each word, whether belonging to
the characteristic of spam or non-spam. The Results from this study are from 10
attempts, all state that the Naïve Bayesian methods value of accuracy, precision
and recall is better than ID3 and error rate of Naïve Bayesian method is smaller
than ID3.
Key Words : E-mail,Spam,Naïve Bayesian, ID3, POP3.