PERBANDINGAN ALGORITMA NAIVE BAYES DAN DECISION TREE ID3 DALAM MENGKLASIFIKASIKAN PENYAKIT DIABETES
Kata Kunci:
Data Mining, Diabetes, ID3, Klasifikasi, Naive BayesAbstrak
Diabetes adalah suatu penyakit metabolik yang diakibatkan oleh meningkatnya kadar glukosa atau gula darah, yang seiring waktu dapat menyebabkan terjadinya berbagai komplikasi, seperti penyakit jantung koroner, stroke, obesitas, serta gangguan pada mata, ginjal, dan saraf, pembuluh darah. Berdasarkan data yang didapatkan dari The International Diabetes Federation (IDF), jumlah penderita diabetes pada tahun 2021 di seluruh dunia mencapai 537 juta dan diperkirakan akan terus meningkat menjadi 643 juta di tahun 2030 dan 783 juta pada tahun 2045 dengan peningkatan sebesar 46%. Data mining adalah teknik dalam ilmu komputer yang sering digunakan untuk memprediksi kejadian di masa depan, dan menjadi salah satu metode yang banyak diterapkan dalam memprediksi apakah seseorang didiagnosis positif atau negatif diabetes. Penelitian ini bertujuan untuk menentukan metode yang paling baik dalam mengklasifikasikan penyakit diabetes. Metode digunakan untuk prediksi ini adalah algoritma naïve bayes dan ID3. Data untuk penelitian ini diperoleh dari website kaggle dengan 9 atribut dan 768 data. Setelah proses pembersihan data, data dikurangi menjadi 420 data yang digunakan dalam analisis. Hasil pengolahan data mining menunjukkan bahwa algoritma ID3 menghasilkan akurasi sebesar 79.1% dan naïve bayes menghasilkan akurasi sebesar 76.5% dengan menggunakan metode evaluasi 10-fold cross validation. Dari penjelasan di atas, dapat disimpulkan bahwa algoritma naïve bayes dan ID3 terbukti andal dalam memprediksi penyakit diabetes.