Abstrak


Fuzzy Decision Tree dengan Algoritme ID3 pada Data Corona Virus Disease (COVID-19) di Turki


Oleh :
Amaranti Sekar Imani - M0117010 - Fak. MIPA

Fuzzy ID3 pada awalnya hanya merupakan perpanjangan dari algoritme ID3 yang dicapai dengan menerapkan himpunan fuzzy. Ini menghasilkan fuzzy decision tree menggunakan himpunan fuzzy yang ditentukan oleh pengguna untuk semua atribut dan menggunakan information gain terbesar untuk memilih atribut yang diperluas. Namun, hasil dari fuzzy ID3 ini kurang akurat dalam beberapa kasus. Untuk meningkatkan akurasinya, maka digunakan 2 parameter, yaitu parameter threshold fuzziness control ?r dan leaf decision ?n.
Coronavirus (CoV) adalah jenis baru dari virus korona yang pertama kali diidentifikasi di Wuhan, China dan dinamai coronavirus disease 2019 (Covid-19). Terdapat beberapa indikator untuk menentukan seberapa banyak virus yang terkandung di dalam tubuh pasien, yaitu usia, Control Threshold Value (CT Value), komorbiditas, dan isolasi. CT value adalah nilai minimal yang dapat diinterpretasikan sebagai hasil positif untuk Covid-19. Semakin rendah CT value, semakin banyak virus yang terkandung dalam tubuh pasien. Sedangkan komorbiditas adalah penyakit penyerta atau penyakit bawaan. Usia, CT value, dan komorbiditas terbagi ke dalam tiga kelas dan isolasi terbagi menjadi dua kelas yang
memungkinkan untuk diolah menggunakan metode Fuzzy ID3.
Penelitian ini bertujuan untuk menentukan aturan klasifikasi atribut usia, CT value, komorbiditas, dan isolasi yang digunakan untuk memprediksi faktor terbesar seberapa banyak virus yang terkandung oleh penderita Covid-19. Dari 4 atribut yang digunakan terdapat 3 diantaranya atribut yang berbentuk numeric. Metode yang digunakan untuk menentukan klasifikasi adalah Fuzzy ID3 dengan menentukan fuzzifikasi. Selanjutnya dilakukan perluasan decision tree menggunakan k-fold cross validation menjadi Fuzzy Decision Tree (FDT). Jika perluasan FDT dihentikan sampai semua data contoh pada masing-masing leaf node menjadi anggota sebuah kelas, akan dihasilkan akurasi yang rendah. Untuk
meningkatkan akurasinya, proses perluasan harus dihentikan lebih awal atau melakukan pemotongan tree secara umum. Untuk itu diberikan 2 (dua) threshold yang harus terpenuhi jika mengekspansi tree, yaitu Fuzziness Control Threshold (FCT)/?r dan Leaf Decision Threshold (LDT)/?n.
Berdasarkan hasil penelitian, diperoleh 10-fold cross validation dengan fold ke-1 menghasilkan akurasi yang tertinggi. Jumlah aturan klasifikasi yang dihasilkan adalah sebanyak 6 aturan (rules) pada saat nilai ?r sebesar 80?n ?n sebesar 20?ngan tingkat akurasi sebesar 92.9%.