Metode Weighted Random Forest dalam Klasifikasi Prediksi Kelangsungan Hidup Pasien Gagal Jantung

  • Laila Budianti Prodi Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam
  • Suliadi Prodi Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam
Keywords: Gagal Jantung, Klasifikasi, Weigthed Random Forest, Imbalanced Data

Abstract

Abstract. Random forest classification is an analysis of a data class model in predicting the class of an unknown object through the majority vote. It has high performance in classifying object with balanced classes, but it does not so good in the case of imbalanced data, where the resulting predictions tend to be biased to the majority class. Recent approach for imbalanced data classification is Weighted Random Forest introduced by Chen and Breiman (2004). This method can solve the minority class prediction problem and improve accuracy by giving specific weight to each classes. This method can also be applied to medical data. In the survival of the heart failure patient belongs to the imbalanced data, where the data on heart failure patients that survived are much more than heart failure patients that died. In this research, we use Weighted Random Forest to classify heart failure patients in RSUP Dr. Wahidin sudirohusodo Makassar. The data used in this research are obtained from Nugraha (2017) the result showed that Weighted Random Forest classification methods are better than random forest because they can increase the accuracy by 1.61%, f-measure by 0.92%, and the AUC (area under the curve) by 0.89%. The result of the evaluation Weighted Random Forest classification for accuracy is 90.32%, precision is 93.22%, recall is 96.49%, f-measure is 94.82%, and AUC score is 0.5825.

Abstrak. Klasifikasi random forest merupakan analisis untuk menemukan model kelas data dalam memprediksi kelas dari objek yang belum diketahui datanya melalui suara mayoritas. Metode ini memiliki kinerja yang baik dalam mengklasifikasikan data dengan kelas seimbang, tetapi tidak baik dalam kasus imbalanced data, di mana prediksi yang dihasilkan cenderung bias terhadap kelas mayoritas. Pendekatan terbaru untuk klasifikasi imbalanced data adalah Weighted Random Forest yang diperkenalkan oleh Chen dan Breiman (2004). Metode ini dapat menyelesaikan masalah prediksi kelas minoritas dan meningkatkan akurasi dengan memberikan bobot pada setiap kelas. Metode ini juga dapat diterapkan pada data medis. Dalam kelangsungan hidup pasien gagal jantung tergolong imbalanced data, dimana data pasien gagal jantung yang selamat jauh lebih banyak dibandingkan pasien gagal jantung yang meninggal. Dalam penelitian ini, kami menggunakan Weighted Random Forest untuk mengklasifikasikan pasien gagal jantung di RSUP Dr. Wahidin Sudirohusodo Makassar. Data yang digunakan dalam penelitian ini diperoleh dari Nugraha (2017) hasil penelitian menunjukkan bahwa metode klasifikasi Weighted Random Forest lebih baik daripada random forest karena dapat meningkatkan accuracy sebesar 1,61%, F-Measure sebesar 0,92%, dan nilai AUC (area under the curve) sebesar 0,89%. Hasil evaluasi untuk klasifikasi Weighted Random Forest untuk accuracy sebesar 90,32%, precision sebesar 93,22%, recall sebesar 96,49%, F-Measure sebesar 94,82%, dan nilai AUC sebesar 0,5825.

Published
2022-07-29