Deteksi Pencilan pada Model Regresi Beta dalam Kasus Kemiskinan Perdesaan di Indonesia Tahun 2022

  • Neng Marlina Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Islam Bandung
  • Nusar Hajarisman Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Islam Bandung
Keywords: Distribusi Beta, Regresi Beta, Pencilan

Abstract

Abstract. In a certain dataset, there may be one or a group of data points that are far from the rest of the data in a regression model, which should be suspected as outliers. These outliers have the potential to influence the significance of regression coefficients. Furthermore, the presence of outliers in the data can cause the regression model to fail to meet its assumptions. Outliers can be detected using Pearson residuals, deviance residuals, and leverage values, among others. In this thesis, outlier detection will be conducted in the case of rural poverty in Indonesia in 2022. The rural poverty data used is in percentage form, making it suitable for beta regression, which is useful for modeling data with response variables in the standard unit interval (0,1). Moreover, beta regression is also very useful when the dependent variable's distribution does not follow a normal distribution and when traditional linear models cannot be used due to unmet classical assumptions. Parameter estimation for the model uses the Maximum Likelihood Estimator. Based on the available data, using a 5% significance level, it can be concluded that in Indonesia in 2022, rural poverty is only influenced by the rural Gini ratio. Subsequently, outlier detection was conducted through the calculation of Pearson residuals, deviance residuals, and leverage values, which indicated that the provinces of Aceh, Riau, Bengkulu, Maluku, West Papua, and Papua are considered outliers. Therefore, an appropriate analysis method is needed when there are outliers in the data.

Abstrak. Dalam set data tertentu, mungkin akan terdapat satu buah atau sekelompok data yang jauh dari sekumpulan data pada model regresi dan data tersebut perlu dicurigai sebagai pencilan. Pencilan ini berpotensi sebagai penentu signifikansi koefisien regresi. Selain itu, kehadiran pencilan dalam data dapat menyebabkan model regresi tidak memenuhi asumsinya. Pencilan dapat dideteksi diantaranya menggunakan residu pearson, residu devians, dan nilai leverage. Dalam skripsi ini, akan dilakukan deteksi pencilan pada kasus kemiskinan perdesaan di Indonesia tahun 2022. Data kemiskinan perdesaan yang digunakan berbentuk persentase, sehingga akan cocok dengan regresi beta yang berguna untuk memodelkan data dengan variabel respon yang berupa interval satuan standar (0,1). Selain itu, regresi beta sangat berguna pula ketika distribusi variabel dependen tidak mengikuti distribusi normal serta ketika model linier tradisional tidak bisa digunakan karena asumsi klasik tidak terpenuhi. Penaksiran parameter model menggunakan Maximum Likelihood Estimator. Berdasarkan data yang ada dengan menggunakan taraf signifikan 5% dapat disimpukan bahwa di Indonesia tahun 2022, kemiskinan perdesaan hanya dipengaruhi oleh gini rasio perdesaan. Kemudian, dilanjutkan deteksi pencilan melalui perhitungan residu pearson, residu devians, dan nilai leverage yang menunjukkan Provinsi Aceh, Riau, Bengkulu, Maluku, Papua Barat, dan Papua dianggap sebagai pencilan. Sehingga, diperlukan metode analisis yang cocok ketika terdapat adanya data pencilan.

References

Espinheira, P. Í. L., Ferrari, S. L. P., & Cribari-Neto, F. (2008). On beta regression residuals. Journal of Applied Statistics, 35(4), 407–419. https://doi.org/10.1080/02664760701834931

Hajarisman, N. (2012). Penaksiran Parameter Model Regresi Beta untuk Memodelkan Data Proporsi. Statistika, 12(1)

Dewi, E. T. K., Agoestanto, A., & Sunarmi, S. (2016). Metode Least Trimmed Square (LTS) dan MM-Estimation untuk Mengestimasi Parameter Regresi Ketika Terdapat Outlier. Unnes Journal of Mathematics, 5(1), 47–54.

Fajar Yusuf Permana. (2021, October 28). Analisis Pengaruh Dana Desa, Nilai Tukar Petani dan Upah Buruh Tani terhadap Kemiskinan Perdesaan di Kawasan Timur Indonesia Tahun 2015-2019.

Indra, I. (2023). Pengaruh Tenaga Kerja Sektor Pertanian Dan Pdrb Sektor Pertanian Terhadap Pertumbuhan Ekonomi Dan Kemiskinan Di Indonesia. Jurnal Ekonomi Integra, 13(1), 116–125.

Ferrari, S., & Cribari-Neto, F. (2004). Beta regression for modelling rates and proportions. Journal of Applied Statistics, 31(7), 799–815.

Fathurahman, M. (2017). Regresi logistik untuk pemodelan indeks pembangunan kesehatan masyarakat kabupaten/kota di Pulau Kalimantan. Seminar Nasional Matematika Dan Aplikasinya.

Hosmer, D. W., Lemeshow, S., & Sturdivant, R. X. (2013). Applied Logistic Regression (3rd ed). 2013.

Sa’adah, U. (2018). Penerapan Cochrane-Orcutt Iterative Procedure untuk Mengatasi Pelanggaran Asumsi Non Autokorelasi pada Analisis Regresi Linier Berganda Menggunakan Software R. Prosiding Seminar Nasional Matematika Dan Pendidikan Matematika, 1(2), 325–333.

Nurdin, N. N., Raupong, R., & Islamiyati, A. (2014). Penggunaan regresi robust pada data yang mengandung pencilan dengan metode momen. Jurnal Matematika, Statistika Dan Komputasi, 10(2), 114–123.

Published
2024-08-13