Analisis Diskriminan Menggunakan Stratified K-Fold Cross Validation pada Klasifikasi Gestational Diabetes Mellitus (GDM) Ibu Hamil di Rumah Sakit XYZ
Abstract
Abstract: Discriminant analysis is used for the purpose of classifying an object based on certain criteria and predicting groups for new objects. This study will classify pregnant women affected by GDM and not who are evaluated using stratified k-fold cross validation. In the analysis, several assumptions are needed that must be met, including independent variables must be multivariate normal distributed, homogeneous covariance matrices, and there are average vector differences. The stages of analysis are data exploration, testing discriminant analysis assumptions, determining the number of k-folds, randomizing into training data and testing data gradually (stratified), conducting experiments as many as k times, estimating the discriminant model of each experiment, testing the accuracy of classification and determining the best model. The results of this study the best model was found in the first experiment with the model with a cut off value of 0.0001739. That is, if there is a new object with a value of ≥ 0.0001739 then the pregnant woman falls into the category of not affected by GDM, and vice versa if < 0.0001739 then pregnant women fall into the category affected by GDM.
Abstrak: Analisis diskriminan digunakan untuk tujuan mengklasifikasikan sebuah objek berdasarkan kriteria tertentu dan memprediksi kelompok untuk objek baru. Penelitian ini akan mengklasifikasikan ibu hamil yang terkena GDM dan tidak yang dievaluasi menggunakan stratified k-fold cross validation. Dalam analisisnya, diperlukan beberapa asumsi yang harus dipenuhi diantaranya variabel independen harus berdistribusi normal multivariat, matriks varians kovarian yang homogen, dan ada perbedaan vektor rata-rata. Tahapan analisisnya yaitu eksplorasi data, menguji asumsi analisis diskriminan, menentukan banyaknya k-fold, melakukan pengacakan menjadi data latih dan data uji secara bertahap (stratified), melakukan eksperimen sebanyak k kali, mengestimasi model diskriminan dari masing-masing eksperimen, menguji ketepatan klasifikasi dan menentukan model terbaiknya. Hasil dari penelitian ini model terbaik terdapat pada eksperimen pertama dengan model dengan nilai cut off sebesar 0.0001739. Artinya, jika ada objek baru dengan nilai 0.0001739 maka ibu hamil tersebut masuk ke dalam kategori tidak terkena GDM, dan sebaliknya apabila 0.0001739 maka ibu hamil masuk ke dalam kategori terkena GDM.
References
Adnan, Miftahul., Mulyati, Tatik., Isworo, Joko Teguh. (2013). Hubungan Indeks Massa Tubuh (IMT) dengan Kadar Gula Darah Penderita Diabetes Mellitus (DM) Tipe 2 Rawat Jalan di RS Tugurejo Semarang, 2 (1),18-24.
Fatmawati., Rifai, Nur Azizah Komara. 2023. Klasifikasi Penyakit Diabetes Retinopati menggunakan Support Vector Machine dengan Algoritma Grid Search Cross-Validation, 3 (1), 79-86.
Johnson, RA., Winchern, DW. (1998). Applied to Multivariate Analysis Sixth Edition. New York: John willey & Sons.
Kementerian Kesehatan. (2022). Mengenal Diabetes pada Kehamilan, (Online), (https://yankes.kemkes.go.id/view_artikel/1135/mengenal-diabetes-pada-kehamilan, diakses 9 Juni 2023).
Kementerian Kesehatan. (2023). IMT (Indeks Massa Tubuh = BMI (Body Mass Index)), (Online), (https://www.kemkes.go.id/index.php?txtKeyword=status+gizi&act=search-by-map&pgnumber=0&charindex=&strucid=1280&fullcontent=1&C-ALL=1#:~:text=Salah%20satu%20cara%20untuk%20menentukan,)%2FTB2%20(dalam%20meter, diakses 26 Juni 2023).
Mardiana, Linda., Kusnandar, D., Satyahadewi, Neva. (2022). Analisis Diskriminan dengan K-FoldCross Validation untuk Klasifikasi Kualitas Air di Kota Pontianak, 11, 97-102.
Maulidya., Susanto, H.T., Oktaviarina, Affiati. (2013). Perbandingan Analisis Diskriminan dan Regresi Logistik.
Muller, Andreas C. (2020). Applied Machine Learning in Python, (Onlien), (https://amueller.github.io/aml/04-model-evaluation/1-data-splitting-strategies.html, diakses 1 Juni 2023).
Pane, Rosmadewi Ayuningtyas. (2015). Analisis Diskriminan untuk Memprediksi Kebangkrutan Perusahaan (Studi pada Perusahaan Manufaktur yang Terdaftar di Bursa Efek Indonesia Tahun 2011-2013), 27 (2), 1-8.
Paputungan, Tiara V., Wagey, Freddy W., Lengkong, Rudy A. (2016). Profil Penderita Mola Hidatidosa di RSUP Prof. Dr. R. D. Kandou Manado. 4 (1), 215-222.
Rahayu, Anita., Rodiani. (2016). Efek Diabetes Melitus Gestasional terhadap Kelahiran Bayi Makrosomia, 5 (4), 17-22.
Rahmania, Puja. (2022). Hubungan Persentase Visceral Fat dengan Kejadian Diabetes Melitus Tipe 2 di Rumah Sakit Umum Haji Medan. Medan: Fakultas Kedokteran, Universitas Muhammadiyah Sumatera Utara.
Rosyid, Harun Al. (2017). Analisis Regresi dan Diskriminan untuk Menentukan Rapor serta Klasifikasi Penyelenggaraan Usaha Jasa Pengiriman. Surabaya: Program Magister, Departemen Teknik Elektro, Fakultas Teknologi Elektro, Insitut Teknologi Sepuluh September.
Supartini, I.A.M., Sukarsa, I K.M., Srinadi, I G.A.M. (2017). Analisis Diskriminan pada Klasifikasi Desa di Kabupaten Tabanan menggunakan Metode K-FoldCross Validation, 6, 106-115.
Syahputra, Ismadi. (2020). Klasifikasi Penyakit Diabetes Melitus Tipe I dan Diabetes Melitus Tipe II dengan Menggunakan Metode Analisis Diskriminan. Medan: Program Studi Matematika, Fakultas Sains dan Teknologi, Universitas Islam Negeri Sumatera Utara.
Ting, Kai Ming. (2011). Precision and Recall. In: Sammut, C., Webb, G.I. (eds) Encyclopedia of Machine Learning. Springer, Boston, MA.
Widodo, Slamet., Brawijaya, Herlambang., Samudi. (2022). Stratified K-FoldCross Validation Optimation on Machine Learning for Prediction, 7, 2407-2414.