Penerapan Metode K-Nearest Neighbor untuk Mengklasifikasikan Penyakit Cardiovascular

  • Nina Kurnia Rahayu Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Islam Bandung
  • Nur Azizah Komara Rifai Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Islam Bandung
Keywords: K-NN, Euclidean Distance, Cardiovascular

Abstract

Abstract. Cardiovascular is one of the organs of the human body that plays a role in the circulatory system. Cardiovascular disease is a condition in which the heart is unable to function properly. It is the leading cause of death worldwide each year. At least three-quarters of the world's deaths from cardiovascular disease occur in low- and middle-income countries. These communities often do not benefit from health care programs. Most cardiovascular diseases can be prevented by addressing behavioral risk factors such as smoking, unhealthy diets and obesity, physical inactivity and harmful use of alcohol. Public health policies that create an environment that supports healthy, affordable, and accessible food choices should encourage people to adopt and maintain healthy behaviors. Therefore, this study aims to classify which factors cause cardiovascular disease by applying the K-Nearest Neighbor (K-NN) method. K-NN is one of the machine learning algorithms that is relatively easy to implement and produce estimates that can be used for better decision making in the future. The data used in this study consists of 12 variables with a total of 70000 data for each variable. By dividing the data with a proportion of 70% for training data and 30% for test data, the best K is obtained, namely K = 5. The model evaluation shows an accuracy value of 60.03%, which illustrates the success rate of the model in predicting cardiovascular disease categories based on observed parameters. These results illustrate that the K-Nearest Neighbor method is able to provide predictions with fairly good accuracy in identifying cardiovascular disease.

Abstrak. Cardiovascular merupakan salah satu organ tubuh manusia yang berperan dalam sistem peredaran darah. Penyakit cardiovascular adalah suatu kondisi di mana jantung tidak mampu menjalankan fungsinya dengan baik. Secara global, penyakit ini merupakan penyebab kematian paling umum setiap tahunnya. Setidaknya tiga perempat kematian akibat penyakit cardiovascular di seluruh dunia terjadi di negara-negara berpenghasilan rendah dan menengah. Masyarakat ini seringkali tidak mendapatkan manfaat dari program layanan kesehatan. Sebagian besar penyakit cardiovascular dapat dicegah dengan mengatasi faktor risiko perilaku seperti merokok, pola makan tidak sehat dan obesitas, kurang aktivitas fisik, dan konsumsi alkohol yang berbahaya. Kebijakan kesehatan yang menciptakan lingkungan yang mendukung pilihan makanan yang sehat, terjangkau dan mudah diakses harus mendorong masyarakat untuk mengadopsi dan mempertahankan perilaku sehat. Oleh karena itu, penelitian ini bertujuan untuk mengklasifikasi faktor apa saja yang menjadi penyebab penyakit cardiovascular dengan menerapkan metode K-Nearest Neighbor (K-NN). K-NN adalah salah satu algoritma machine learning yang relatif mudah dan dapat di implementasikan serta dapat menghasilkan estimasi yang dapat digunakan untung pengambilan keputusan yang lebih baik di masa mendatang. Data yang di gunakan pada penelitian ini terdiri dari 12 variabel dengan jumlah data sebanyak 70000 pada setiap variabel. Melalui pembagian data dengan proporsi 70% untuk data train dan 30% untuk data test, diperoleh K terbaik yaitu K = 5. Evaluasi model menunjukkan nilai akurasi sebesar 60,03% yang menggambarkan tingkat keberhasilan model dalam memprediksi kategori penyakit cardiovascular berdasarkan parameter-parameter yang diamati. Hasil ini memberikan gambaran bahwa metode K-NN mampu memberikan prediksi dengan akurasi yang cukup baik dalam mengidentifikasi penyakit cardiovascular.

References

Salma, G., & Yanti, T. S. (2024). Pemodelan Intervensi untuk Meramalkan Jumlah Penumpang Pesawat Domestik Bandara Internasional Sultan Hasanuddin Makassar. Jurnal Riset Statistika, 67–74. https://doi.org/10.29313/jrs.v4i1.3892

Asha Gowda Karegowda, M.A. Jayaram, & A.S. Manjunath. (2012). Cascading kmeans clustering and k-nearest neighbor classifier for categorization of diabetic patients. International Journal of Engineering and Advanced Technology, 1(3), 147–151. http://www.galaxy.gmu.edu/interface/I01/I2001Proceedings/Jbreault.

Esesiawati, O. (2017). Peramalan Arus Lalu Lintas Jangka Pendek Menggunakan Metode K-Nearest Neighbor ( Studi Kasus : Jalan Basuki Rahmat Surabaya).

Islami, A. U. (2008). Faktor-faktor risiko penyakit kardiovaskular, 13-33.

Lall, U., & Sharma, A. (1996). A nearest neighbor bootstrap for resampling hydrologic time series. Water Resources Research, 32(3), 679–693. https://doi.org/10.1029/95WR02966.

Meade, N. (2002). A comparison of the accuracy of short term foreign exchange forecasting methods. International Journal of Forecasting, 18(1), 67–83. https://doi.org/10.1016/S0169-2070(01)00111-X.

Putri, I. P. (2021). Analisis Performa Metode K-Nearest Neighbor (KNN) dan Crossvalidation pada Data Penyakit Cardiovascular. Indonesian Journal of Data and Science, 2(1), 21- 28.

Rachma, C. A. (2022). Implementasi Algoritma K-Neraest Neighbor dalam penentuan Klasifikasi Tingkat Kedalaman Kemiskinan Provinsi Jawa Timur (Doctoral dissertation, Universitas Islam Negeri Maulana Malik Ibrahim).

Sreemathy, J., & Balamurugan, P. S. (2012). An efficient text classification using knn and naive bayesian. International Journal on Computer Science and Engineering, 4(3), 392.

Wang, H., Xu, P., & Zhao, J. (2021). Improved KNN algorithms of spherical regions based on clustering and region division. Alexandria Engineering Journal, 1–15. https://doi.org/10.1016/j.aej.2021.09.004.

WHO, 2021. Cardiovascular Diseases (CVDs) (Online), (https://www.who.int/news-room/fact-sheets/detail/cardiovascular-dis.

Published
2025-02-03