The COMPARISON OF DATA MINING ALGORITHM IN CLASSIFICING DIABETES USING MODEL C4.5 AND NAVE BAYES

Authors

  • Hansen Hansen Universitas Buddhi Dharma
  • Susanto Hariyanto

DOI:

https://doi.org/10.31253/algor.v4i2.1503

Keywords:

C4.5, Naive Bayes, Klasifikasi, Data Mining

Abstract

Diabetes adalah penyakit metabolic kronis yang ditandai dengan peningkatan kadar gula atau glukosa darah, yang dari waktu ke waktu menyebabkan kerusakan serius pada jantung, pembuluh darah, mata, ginjal dan saraf. Menurut International Diabetes Federation (IDF) Indonesia menjadi negara urutan kelima dengan jumlah penderita diabetes terbanyak didunia dan diabetes menjadi penyebab kematian atas 6,7 juta kematian yang terjadi pada tahun 2021 setiap 5 detik. Data mining adalah teknik dalam dunia komputer yang sering digunakan dalam memprediksi apa yang akan terjadi pada masa depan, ini menjadi salah satu metode yang banyak digunakan dalam memprediksi apakah suatu individu terdiagnosa positif atau negatif diabetes. Salah satu metode yang paling popular adalah C4.5 dan Naïve Bayes. Data sendiri didapatkan dari website kaggle yang diberikan oleh UCI Machine Learning dengan 9 atribut dan 769 records yang nantikan akan di cleaning menjadi 220 data. Hasil pemrosesan data mining membuktikan algoritma Naïve Bayes menghasilkan akurasi yang lebih besar dibandingkan C4.5 dengan nilai 85.00% dibandingkan C4.5 dengan nilai akurasi  78.86%. Naïve Bayes juga menghasilkan nilai AUC 0.936 dari 1 yang membuktikan bahwa klasifikasi ini termasuk kedalam excellent classification dan terbukti algoritma naïve bayes lebih baik dibanding C4.5.

Downloads

Download data is not yet available.

Published

2023-03-24

How to Cite

Hansen, H., & Hariyanto, S. (2023). The COMPARISON OF DATA MINING ALGORITHM IN CLASSIFICING DIABETES USING MODEL C4.5 AND NAVE BAYES. ALGOR, 4(2), 1–10. https://doi.org/10.31253/algor.v4i2.1503

Most read articles by the same author(s)