Main Article Content

Abstract

Diabetes mellitus is a common chronic disease with significant global impact. Early identification of individuals at high risk of developing diabetes is critical for the prevention and management of the disease. This study explores the use of Recursive Feature Elimination (RFE) in decision tree-based classifiers to improve the accuracy of diabetes risk prediction. The Pima Indians Diabetes Database (PIDD) dataset was used as the database, and algorithms such as Decision Tree, Random Forest, Gradient Boosting, and Xtreme Gradient Boosting were tested. The results showed that the application of RFE improved the model accuracy, with Random Forest and Gradient Boosting achieving the highest accuracy of 77.27%. RFE also successfully identified the most relevant features, reduced the risk of overfitting, and improved model interpretability. This study provides a strong foundation for the development of more effective predictive tools in diabetes management and prevention. Future studies are recommended to test the generalizability of this approach to a wider dataset and in various clinical contexts.

Keywords

diabetes recursive feature selection tree-based classifier

Article Details

References

  1. Ajitomo, W., & Pratama, I. (2024). Jurnal Informatika dan Rekayasa Perangkat Lunak Penerapan Metode Dbscan untuk Identifikasi Kluster Gempa Bumi di Daerah Yogyakarta. Jurnal Informatika Dan Rekayasa Perangkat Lunak, 6(1), 40–46.
  2. Antika, R., Rifa, A., Dikananda, F., Indriya Efendi, D., & Narasati, R. (2023). PENERAPAN ALGORITMA DECISION TREE BERBASIS POHON KEPUTUSAN DALAM KLASIFIKASI PENYAKIT JANTUNG. In Jurnal Mahasiswa Teknik Informatika (Vol. 7, Issue 6).
  3. Budianto, R. E., Linawati, N. M., Arijana, I. G. K. N., Wahyuniari, I. A. I., & Wiryawan, I. G. N. S. (2022). Potensi Senyawa Fitokimia pada Tumbuhan dalam Menurunkan Kadar Glukosa Darah pada Diabetes Melitus. Jurnal Sains Dan Kesehatan, 4(5), 548–556. https://doi.org/10.25026/jsk.v4i5.1259
  4. Gunawan, A., Munir, Wibisono, Y., & Furqon, C. (2023). Sistem Informasi Manajemen Terkini: Meningkatkan Efisiensi dengan Kecerdasan Buatan (I). PT. Literasi Nusantara Abadi Grup. www.penerbitlitnus.co.id
  5. Suryana, S. E., Warsito, B., & Suparti. (2021). PENERAPAN GRADIENT BOOSTING DENGAN HYPEROPT UNTUK MEMPREDIKSI KEBERHASILAN TELEMARKETING BANK. JURNAL GAUSSIAN, 10(4), 617–623. https://ejournal3.undip.ac.id/index.php/gaussian/
  6. Edwar, Semadi, I. G. A. N. R., Samsudin, M., & Dharmendra, I. K. (2023). Perbandingan Metode Seleksi Fitur Pada Analisis Sentimen (Studi Kasus Opini PILKADA DKI 2017). Informatics for Educators And Professionals : Journal of Informatics, 8(1), 11–18.
  7. Khoeruddin, A., Andriansyah Sudrajat, F., Purnama, G., Kuwangid, I., & Firmansyah, R. (2023). Optimasi Fitur Seleksi Random Forest Menggunakan GA Dalam Klasifikasi Data Penyakit Gagal Jantung. 1(2), 1–09. https://doi.org/10.54066/jptis.v1i2.323
  8. Mulyo, H., & Maori, N. A. (2024). PENINGKATAN AKURASI PREDIKSI PEMILIHAN PROGRAM STUDI CALON MAHASISWA BARU MELALUI OPTIMASI ALGORITMA DECISION TREE DENGAN TEKNIK PRUNING DAN ENSEMBLE ENHACING PREDICTION ACCURACY OF NEW STUDENT PROGRAM SELECTION THROUGH DECISION TREE ALGORITHM OPTIMIZATION WITH PRUNING TECHNIQUE AND ENSEMBLE. 15(1), 15–25. https://doi.org/10.34001/jdpt
  9. Nasrullah, A. H. (2021). IMPLEMENTASI ALGORITMA DECISION TREE UNTUK KLASIFIKASI PRODUK LARIS. 7(2). http://ejournal.fikom-unasman.ac.id
  10. Nurussakinah, N., & Faisal, M. (2023). Klasifikasi Penyakit Diabetes Menggunakan Algoritma Decision Tree. Jurnal Informatika, 10(2), 143–149. https://doi.org/10.31294/inf.v10i2.15989
  11. Pratama, A. R. I., Latipah, S. A., & Sari, B. N. (2022). OPTIMASI KLASIFIKASI CURAH HUJAN MENGGUNAKAN SUPPORT VECTOR MACHINE (SVM) DAN RECURSIVE FEATURE ELIMINATION (RFE).
  12. Rizky, P. S., Hirzi, R. H., & Hidayaturrohman, U. (2022). Perbandingan Metode LightGBM dan XGBoost dalam Menangani Data dengan Kelas Tidak Seimbang. In J Statistika (Vol. 15, Issue 2). www.unipasby.ac.id
  13. Siswa, T. A. Y., & Wibowo, R. P. (2023). Komparasi Metode Seleksi Fitur Dalam Prediksi Keterlambatan Pembayaran Biaya Kuliah. Teknika, 12(1), 73–82. https://doi.org/10.34148/teknika.v12i1.601
  14. Wahyuni, E. S. (2016). PENERAPAN METODE SELEKSI FITUR UNTUK MENINGKATKAN HASIL DIAGNOSIS KANKER PAYUDARA. Jurnal SIMETRIS, 7(1).