Sistem Deteksi Dini Penyakit Diabetes Menggunakan Algoritma Random Forest

Authors

  • Viona Leny Anjani STMIK Amikom Surakarta Author
  • Shanny Novalina Turnip STMIK Amikom Surakarta Author
  • Ulfah Nur Uzlifah STMIK Amikom Surakarta Author
  • Rajnaparamitha Kusumastuti Author

Keywords:

Deteksi Dini, Diabetes, Random Forest, SMOTE, Machine Learning.

Abstract

Dengan menggunakan algoritma "Random Forest" dan metode "Synthetic Minority Over-sampling Technique" (SMOTE), penelitian ini bertujuan untuk membangun sistem deteksi dini diabetes. Tujuan dari metode ini adalah untuk mengatasi masalah ketidakseimbangan kelas dalam data. Data yang digunakan adalah dari Pima Indian Diabetes, yang terdiri dari berbagai fitur klinis pasien, termasuk kadar glukosa, indeks massa tubuh (BMI), usia, dan lainnya. Pengembangan model melibatkan tahap pra-pemrosesan data, penerapan SMOTE, pelatihan model dengan Random Forest, dan pengaturan parameter dengan GridSearchCV untuk mendapatkan konfigurasi terbaik. Hasil evaluasi menunjukkan bahwa model berhasil mencapai akurasi sebesar 82,80%, dengan glukosa, BMI, dan usia menjadi fitur yang paling berpengaruh dalam prediksi. Hasilnya menunjukkan bahwa algoritma pembelajaran mesin dapat digunakan secara efektif untuk membantu proses diagnosis awal diabetes berbasis data secara otomatis. Metode ini diharapkan dapat membantu pengambilan keputusan medis, terutama tentang pencegahan dan penanganan diabetes tipe 2 dini

References

[1] D. C. P. Buani, “Deteksi Dini Penyakit Diabetes dengan Menggunakan Algoritma Random Forest,” EVOLUSI J. Sains dan Manaj., vol. 12, no. 1, pp. 1–8, 2024, doi: 10.31294/evolusi.v12i1.21005.

[2] A. Syahri, U. Fariha, R. Afandi, and I. Nurliyana, “Comparison of Logistic Regression, Random Forest and Adaboost Algorithms for Diabetes Mellitus Classification,” IJATIS Indones. J. Appl. Technol. Innov. Sci., vol. 1, no. 1, pp. 41–46, 2024, doi: 10.57152/ijatis.v1i1.1116.

[3] A. Aji Septa, Amar Al Farizi, Anas Nur Khafid, Didi Prasetyo, Nur Cholis Romadhon, and Fandy Setyo Utomo, “Diabetes Detection Optimisation with Hyperparameter Tuning in Random Forest Algorithm,” J. Informatics Interact. Technol., vol. 1, no. 3, pp. 165–177, 2024, doi: 10.63547/jiite.v1i3.42.

[4] I. Nurzari, E. Sari, D. I. Harris, A. M. Priyatno, and H. Rusnedy, “Inter-Cluster Distance-Based Smote Modification for Enhanced Diabetes Classification,” J. Eng. Technol. Ind. Appl., vol. 11, no. 51, pp. 190–196, 2025, doi: 10.5935/jetia.v11i51.1453.

[5] N. Nurussakinah, M. Faisal, and I. B. Santoso, “Algoritma Random Forest dan Synthetic Minority Oversampling Technique (SMOTE) untuk Deteksi Diabetes,” JISKA (Jurnal Inform. Sunan Kalijaga), vol. 10, no. 2, pp. 221–234, 2025, doi: 10.14421/jiska.2025.10.2.221-234.

[6] H. Aulia, A. Wibowo, and S. Sutrisno, “Integration of Random Forest, ADASYN, and SHAP for Diabetes Prediction and Interpretation,” Sci. J. Informatics, vol. 12, no. 2, pp. 211–222, 2025, doi: 10.15294/sji.v12i2.24314.

[7] R. Irfannandhy, L. B. Handoko, and N. Ariyanto, “Analisis Performa Model Random Forest dan CatBoost dengan Teknik SMOTE dalam Prediksi Risiko Diabetes,” Edumatic J. Pendidik. Inform., vol. 8, no. 2, pp. 714–723, 2024, doi: 10.29408/edumatic.v8i2.27990.

[8] Y. Jang, “Feature-based ensemble modeling for addressing diabetes data imbalance using the SMOTE, RUS, and random forest methods: a prediction study,” Ewha Med. J., vol. 48, no. 2, p. e32, 2025, doi: 10.12771/emj.2025.00353.

[9] A. Alsyar et al., “Jurnal Computer Science and Information Technology ( CoSciTech ) Pemodelan Prediktif Diabetes Menggunakan Pendekatan Multimodel Machine Learning dan Deep Predictive Modeling of Diabetes Using Multimodel Machine learning and Deep learning Approaches,” vol. 6, no. 2, pp. 158–165, 2025.

[10] K. Poorani, S. P. Balakannan, and M. Karuppasamy, “Mitigating Data Imbalance for Robust Diabetes Diagnosis Using Machine Learning and Explainable Artificial Intelligence,” J. Curr. Sci. Technol., vol. 15, no. 3, pp. 1–10, 2025, doi: 10.59796/jcst.V15N3.2025.111.

[11] A. A. Ali, G. R. Galal, and H. S. Hassan, “Diabetes Prediction on Pima Indian Dataset Using Machine Learning Techniques,” vol. 11, no. 7, 2025.

[12] F. O. Aghware et al., “Effects of Data Balancing in Diabetes Mellitus Detection: A Comparative XGBoost and Random Forest Learning Approach,” NIPES - J. Sci. Technol. Res., vol. 7, no. 1, pp. 1–11, 2025, doi: 10.37933/nipes/7.1.2025.1.

[13] H. Hairani, A. Anggrawan, and D. Priyanto, “Improvement Performance of the Random Forest Method on Unbalanced Diabetes Data Classification Using Smote-Tomek Link,” Int. J. Informatics Vis., vol. 7, no. 1, pp. 258–264, 2023, doi: 10.30630/joiv.7.1.1069.

[14] M. F. Zamil, D. H. Hameed, and U. S. Mahmoud, “A Comprehensive Data Enhancement Method for the Pima Dataset to Improve Diabetes Prediction Performance,” J. Port Sci. Res., vol. 8, no. 4, pp. 314–320, 2025, doi: 10.36371/port.2025.4.1.

[15] M. Teresa García-Ordás, C. Benavides, J. Alberto Benítez-Andrades, H. Alaiz-Moretón, and I. García-Rodríguez, “Computer Methods and Programs in Biomedicine Diabetes detection using deep learning techniques with oversampling and feature augmentation,” 2024.

Published

2025-11-12