Penerapan Regresi Nonparametrik Smooting Spline untuk Data Tersensor dalam Memodelkan Hubungan Antara Lamanya Waktu Kesembuhan Rawat Inap Pada Pasien Diabetes Melitus Tipe-2 dengan Usia Pasien
Abstract
Abstract. The aim of study is to explain the case. Regression analysis is used to model or look for patterns of relationship between one or more independent variables and one or more response variables. Since the data often does not follow a specific formulation pattern, a more flevible model is required, namely nonparametric regression model approach is an approachused when the shape of the shape of the relationship between the response variable and the independent variable is unknown or information about the shape of the regression function is not available. The nonparametric spline regression model with optimal noodes was applied to patient age and time to recovery after hospitalization in patients with type 2 diabetes mellitus containing right-censored data in a variable containing the right sensor. In this study, the generalized cross-validation (GCV) method was applied to nonparametric smoothing spline regression to determine the optimal smoothing parameter. In order to obtain the GCV value, parameter estimasi must be available to form a hat matriz formed form . Parameter estimation for the smoothing spline from the function f(.) by minimized PRSS (Penalized Residual Sum of Square). Once the optimal GCV value has been determined, it froms the best estimate of the regression function. Optimal Smoothing parameter by choosing with a minimum GCV value. According to the research result, the minimum GCV value is 0.0378 at and the GCV value with Kaplan Meier weights is 30.4773.
Abstrak. Penelitian ini bertujuan untuk menjelaskan mengenai kasus Analisis regresi digunakan untuk memodelkan atau mencari pola hubungan antara satu atau lebih variabel bebas dengan satu atau lebih variabel respons. Seringkali data tidak mengikuti pola rumusan tertentu, sehingga diperlukan model yang lebih fleksibel, yaitu regresi nonparametrik. Pendekatan model regresi nonparametrik yaitu merupakan suatu pendekatan yang digunakan apabila bentuk hubungan antara variabel respon dan variabel bebasnya tidak diketahui atau tidak adanya informasi mengenai bentuk fungsi regresinya. Model regresi nonparametrik spline dengan titik knot optimal diaplikasikan pada usia pasien terhadap lamanya waktu kesembuhan rawat inap pada pasien yang menyandang penyakit diabetes melitus tipe-2 yang di dalamnya mengandung data tersensor kanan menjadi variabel yang berisi sensor kanan. Dalam penelitian ini diterapkannya metode GCV (Generalized Cross-Validation) pada regresi nonparametrik smoothing spline untuk menentukan parameter smoothing yang optimal. Untuk mendapatkan nilai GCV, Maka perlu adanya nilai estimasi parameter untuk membentuk hat matrix yang dibentuk dari . Estimasi parameter untuk smoothing spline dari fungsi f(.) dengan meminimumkan PRSS (Penalized Residual Sum of Square). Ketika nilai GCV yang optimal sudah didapatkan maka akan membentuk estimasi fungsi regresi yang terbaik. Parameter penghalus optimal dengan cara memilih yang memiliki nilai GCV minimum. Dari hasil penelitian, nilai GCV paling minimum bernilai 0.0378 pada saat dan untuk nilai GCV dengan pembobot Kaplan-Meier bernilai 30.4773.
References
Etikan. (2017). The Kaplan Meier Estimate in Survival Analysis. Department of Biostatistic, Near East University Faculty of Medicine
Budiantara, N. I. (2009). Spline dalam Regresi Nonparametrik : Sebuah Pemodelan Statistika Masa Kini dan Masa Mendatang.
Eubank, R. L. (1999). NonParametric Regression and Spline Smoothing. New York: Mercel Dekker Inc
Departemen Kesehatan RI. (2009). Klasifikasi Umur menurut Kategori. Jakarta: Ditjen Yankes.
Dursun Aydın, E. Y. (2016). Right-Censored Nonparametric Regression: A Comparative Simulation Study.
Engle, R. F., Granger, C. W., Rice, J., & Andrew, W. (1986). Semi Parametric Estimasi of the Relation Between Weater and Electrycity Sales.
Klein, J. P., & Moeschberger, M. L. (2005). Survival Analysis Techniques for Censored and Truncated Data. Springer-Verlag New York.
Wati, L. (2014). Penentuan Parameter Penghalus Smoothing Spline dalam Regresi Semiparametrik dengan CGV.
WHO ( World Health Organization). (2016). Tentang Populasi Lansia.
Witten, D., Tibshieani, R., James, G., & Hastie, T. (2021). An Introduction to Statistical Learning.
Wu, H., & Zhang, J. T. (2006). Nonparametric Regression Methods for Longitudinal Data Analysis. Rochester,New York: A John Wiley & Sons, INC.
Fatmawati and N. A. K. Rifai, “Klasifikasi Penyakit Diabetes Retinopati Menggunakan Support Vector Machine dengan Algoritma Grid Search Cross-validation,” Jurnal Riset Statistika, pp. 79–86, Jul. 2023, doi: 10.29313/jrs.v3i1.1945.