Penerapan Generalized Poisson Regression (GPR) dalam Memodelkan Kasus Campak pada Balita di Kabupaten Bandung Tahun 2020
Abstract
Abstract. Poisson regression is a regression method used to analyze count data with Poisson distributed response variables. In Poisson regression, there is an assumption that the mean value of the response variable must be equal to the variance value. If that assumption is not met, for example there is an overdispersion case where the variance value is greater than the average value and that is left unaddressed, making the standard error value of the estimated regression parameter tend to be lower than the supposed value (underestimate) resulting in a less accurate test conclusion. In this study, overdispersion cases can be solved using Generalized Poisson (GP) regression models. The GP regression model contains Generalized Poisson I regression and Generalized Poisson II regression. Generalized Poisson II regression can control a higher degree of variance in discrete data so that it can provide a more accurate parameter estimation compared to Generalized Poisson I regression in handling overdispersion cases. The purpose of this study is to model measles cases in infants in Bandung Regency in 2020. Measles cases are a form of data count. The Maximum Likhelood Estimation (MLE) method is used to estimate parameters. Calculation results show that the overdispersion case occurs in the response variable data (Y), so the study is continued using Generalized Poisson II regression method and the regression model is . From the results of the hypothesis test, the factor that has a significant effect on the number of measles cases in Bandung Regency in 2020 is the percentage of measles immunization in infants with a Pseudo R 2 value of 0,3936.
Abstrak. Regresi Poisson merupakan metode regresi yang digunakan untuk menganalisa data count (jumlah) dengan variabel respon berdistribusi Poisson. Pada regresi Poisson, terdapat asumsi yang harus dipenuhi yaitu nilai rata-rata pada variabel respon harus sama dengan nilai varians (equidispersi). Jika asumsi tersebut tidak dipenuhi, misalnya terjadi kasus overdispersi di mana nilai varians lebih besar dari nilai rata-rata dan hal tersebut dibiarkan tanpa diatasi maka akan membuat nilai standard error dari dugaan parameter regresi cenderung lebih rendah dari nilai seharusnya (underestimate) sehingga menghasilkan kesimpulan pengujian yang kurang akurat. Dalam penelitian ini, kasus overdispersi dapat diatasi dengan model regresi Generalized Poisson (GP). Model regresi GP memuat regresi Generalized Poisson I dan regresi Generalized Poisson II. Pada regresi Generalized Poisson II dapat mengendalikan tingkat varians yang lebih tinggi dalam data diskrit sehingga mampu memberikan estimasi parameter yang lebih akurat dibandingkan dengan regresi Generalized Poisson I dalam menangani kasus overdispersi. Tujuan dari penelitian ini adalah untuk memodelkan kasus campak pada balita di Kabupaten Bandung tahun 2020. Kasus campak merupakan salah satu bentuk dari data count. Metode Maximum Likelihood Estimation (MLE) digunakan untuk mengestimasi parameter. Berdasarkan hasil perhitungan menunjukkan bahwa terjadinya kasus overdispersi pada data variabel respon , sehingga penelitian dilanjutkan menggunakan metode regresi Generalized Poisson II dan diperoleh model regresinya yaitu . Dari hasil pengujian hipotesis menyatakan bahwa faktor yang berpengaruh signifikan terhadap jumlah kasus campak pada di Kabupaten Bandung tahun 2020 adalah persentase imunisasi campak pada bayi dengan nilai Pseudo R2 sebesar 0,3936.
References
Casella, G., Berger, R. Statistical Inference. California: Wadsworth. Inc; 1990.
Consul, P.C., Famoye, F., "Generealized Poisson Regression Model," Comn. Statist, vol. 21, no. 1, pp. 89-109, 1992.
Dinas Kesehatan Kabupaten Bandung. Profil Kesehatan Kabupaten Bandung. 2020.
Hilbe, J.M., Hardin. J.W. Generalized Linear Models and Extensions. New York: Stata Press Company; 2003.
Ismail, N., Jemain, A.A. "An Alternative for Risk Classification," Jurnal Teknologi University Teknologi Malaysia, vol. 43, no. C, pp. 39-54, 2005.
Kementerian Kesehatan RI. Riset Kesehatan Dasar. Jakarta: Badan Penelitian dan Pengembangan Kesehatan Kementerian Kesehatan RI; 2015.
Kutner, M.H., Nachshelm, C.J., Li, W. Applied Linear Statistical Models. 5th ed. New York: McGraw-Hill Companies Inc; 2005.
McFadden, D. Conditional Logit Analysis of Qualitative Choice Behavior. California: University of California at Berkeley; 1974.
Rifai, N.A.K. "Pendekatan Regresi Nonparametrik dengan Fungsi Kernel untuk Indeks Harga Saham Gabungan," E-Jurnal Statistika, vol. 19, no. 1, pp. 53-61, 2019.
Rodirgez, G. Model for Count Data with Overdispertion. 2th ed. Cambridge: University Press; 2013.
Walpole, E.R., Myers, H.R. Ilmu Peluang dan Statistik untuk Insinyur dan Ilmuwan. Bandung: ITB; 1955.
Yang, Z., Hardin, J.W., Addy, C.L. "A Score Test for Overdispertion in Poisson Regression based on The Generalized Poisson-2 Model," JSPI, vol. 139, pp. 1514-1521, 2009.
Muhammad Rizq Nafisyah Alam, Aceng Komarudin Mutaqin. Pemodelan Distribusi Poisson-Sujatha pada Data Frekuensi Klaim Asuransi Kendaraan Bermotor di Indonesia. Jurnal Riset Statistika [Internet]. 2023 Jul 19;71–8. Available from: https://journals.unisba.ac.id/index.php/JRS/article/view/1944