Abstrak


Implementasi Algoritme Adaptive Boosting Dengan Parameter Tuning Pada Klasifikasi Artikel Berita Cable News Network (CNN)


Oleh :
Krisna Sidiq - M0119051 - Fak. MIPA

Perkembangan zaman mendorong kemajuan teknologi komunikasi dan informasi. Hal tersebut mengakibatkan pertukaran informasi menjadi lebih cepat karena terhubung dengan internet. Artikel berita online merupakan bentuk informasi yang tersedia di internet dan dapat diakses dengan mudah. Salah satu platform penyedia artikel berita online adalah Cabel News Network (CNN) yang telah menyiarkan berita di website sejak tahun 1995. Jumlah artikel berita Cabel News Network terus mengalami penambahan sehingga dilakukan pengkategorian artikel berita untuk memudahkan pembaca memeroleh artikel sesuai dengan kategori yang diinginkan.

Klasifikasi merupakan teknik untuk menentukan kelas dari suatu objek berdasarkan karakteristiknya, di mana label kelas diketahui sebelumnya. Salah satu algoritme untuk klasifikasi adalah adaptive boosting (AdaBoost). Algoritme AdaBoost melakukan klasifikasi dengan cara membangun beberapa pohon keputusan (stumps) yang diberi bobot, kemudian penentuan kelas didasarkan pada jumlah stumps dengan bobot terbesar. Algoritme AdaBoost dapat dikombinasikan dengan parameter tuning agar terhindar dari overfitting atau underfitting akibat dari kumpulan stumps yang lemah. Algoritme AdaBoost dapat melakukan klasifikasi binary maupun multi-class, salah satu data teks yang tergolong multi-class adalah artikel berita CNN. Oleh karena itu, dalam penelitian ini dilakukan implementasi algoritme AdaBoost dengan parameter tuning pada klasifikasi artikel berita CNN. Data yang digunakan pada penelitian ini merupakan data artikel berita CNN tahun 2011 hingga 2022 yang bersumber dari laman Kaggle. Data dikategorikan kedalam enam kelas yakni business, entertainment, health, news, politics, dan sport.

Pada penelitian ini, algoritme AdaBoost melakukan klasifikasi dengan parameter default, kemudian kinerja algoritme ditingkatkan menggunakan metode Grid Search Cross-Validation untuk menentukan kombinasi parameter terbaik. Penelitian ini menggunakan dua metrik evaluasi yakni nilai akurasi dan confusion matix untuk mengukur kinerja algoritme AdaBoost. Nilai akurasi yang diperoleh adalah 0,78763 dan hasil confusion matix menunjukkan algoritme AdaBoost dapat mengklasifikasikan sebagian besar kelas dengan tepat. Berdasarkan hasil penelitian, disimpulkan bahwa algoritme AdaBoost dengan parameter tuning mampu mengklasifikasikan artikel berita CNN ke dalam enam kategori Implementasi Algoritme Adaptive Boosting Dengan Parameter Tuning Pada Klasifikasi Artikel Berita Cable News Network (CNN)