Abstrak


Undersampling Majority Class pada Kasus Imbalanced Dataset dan Aplikasinya Pada Deteksi Anomali Transaksi Kartu Kredit


Oleh :
Muhsin Ahadi - M0515026 - Fak. MIPA

ABSTRAK

Kartu kredit adalah salah satu sistem pembayaran yang banyak digunakan di seluruh dunia. Tetapi sistem keamanan kartu kredit masih rentan terjadi fraud. Salah satu cara untuk mengatasi fraud adalah menggunakan machine learning dengan metode anomaly detection. Anomaly detection adalah metode pencarian pola yang janggal pada suatu keadaan. Metode tersebut dapat dilakukan dengan menggunakan algoritma klasifikasi. Masalah yang sering terjadi dalam klasifikasi adalah terjadinya imbalanced dataset, yaitu keadaan class tujuan yang diklasifikasi tidak seimbang rasionya. Masalah ini dapat menyebabkan hasil klasifikasi menjadi bias karena classifier lebih sering mendeteksi kelas mayoritas dibanding kelas minoritas. Imbalanced dataset dapat diatasi dengan menggunakan metode undersampling. Penelitian ini bertujuan untuk menangani imbalanced dataset dengan metode undersampling K Nearest Neighbors-Undersampling pada deteksi anomali transaksi kartu kredit dengan classifier Support Vector Machine dan K-Nearest Neighbors agar menghasilkan performa prediksi yang optimal. K Nearest Neighbors-Undersampling mengurangi kelas mayoritas dari 199013 menjadi 367, 661, 949, 1244, dan 1574 dengan variasi nilai K 4, 8, 12, 16, dan 20 secara berturut-turut. Metode K Nearest Neighbors mampu meningkatkan nilai true positive dan mengurangi nilai false negative. Hasil penelitian menunjukkan performa terbaik dihasilkan 20NN-Und + Support Vector Machine parameter C = 1 bekerja paling optimal dengan nilai precision 0.95 dan recall 0.75 dalam waktu 4.51 detik.

Kata kunci : anomaly detection, undersampling, imbalanced dataset, fraud