Abstrak


Perbandingan Algoritma Support Vector Machine dan Random Forest untuk Klasifikasi Tweet Cyberbullying


Oleh :
Ega Yastira - M0516017 - Fak. MIPA

Cyberbullying adalah suatu aktivitas perundungan yang dilakukan di media online. Media sosial yang paling sering untuk dijadikan cyberbullying salah satunya yaitu twitter. Pada survey tahun 2021 dari 6000 orang (usia antara 10-18tahun) ditemukan bahwa 50% anak-anak sudah pernah mengalami cyberbullying. 47?ri responden mendapatkan intimidasi, pengancaman serta pesan yang kurang sopan pada media sosial. Permasalahan cyberbullying tersebut dapat diklasifikasi menggunakan machine learning. Dalam penelitian ini bertujuan membandingkan algoritma Support Vector Machine dan Random Forest untuk klasifikasi tweet cyberbullying.
Untuk membandingkan kedua algoritma tersebut digunakan 2 skenario pembagian data training dan testing, yaitu 70:30 dan 80:20. Selanjutnya dari hasil evaluasi menggunakan confusion matrix akan didapat hasil akurasi, macro average precision, macro average recall dan macro average F-1 Score.
Hasil yang didapat pada penelitian ini, skenario 80:20 menghasilkan nilai akurasi, macro average precision, macro average recall dan macro average F-1 Score  yang lebih baik. Sedangkan untuk kedua algoritma menunjukkan bahwa metode Random Forest lebih baik daripada Support Vector Machine yaitu dengan angka akurasi masing-masing sebesar 84,98?n 84,24%.