Kekuatan Hubungan Rata-Rata Lama Sekolah dan Indeks Keparahan Kemiskinan dari Kabupaten/Kota di Indonesia Tahun 2022 Menggunakan Metode Taba (T)

  • Khalda Farah Kamila 10060119007 Statistika
  • Suliadi Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Islam Bandung
Keywords: Korelasi Pearson, Taba(T), Outlier

Abstract

Abstract. Correlation analysis is a technique used to determine the strength of relationship between two quantitative variables (numerical values). A common correlation used for numerical data is Pearson's Product Moment correlation. It is suitable for data from bivariate normal distribution without outlier. Tabatabai, et al (2021) proposed a new correlation method that is robust to outliers, namely Taba (T), TabWil (TW), and TabWil rank (TWR). Taba (T) and Tabwill (TW) correlations measure the linear association between two continuous or ordinal variables, while the TabWil rank (TWR) measures the monotonic association. The new correlation method is very competitive compared to Pearson and Spearman, and Quadrant, Median, and Minimum Coavariance Determinant (MCD) measures. Spearman, Quadrant, Median, and MCD correlations have limitations in dealing with outliers and normality deviations in the data. This study applied Taba correlation (T) to masure the strength of the relationship between the average years of schooling variable and the poverty severity index in districts / cities in Indonesia in 2022, since there were outliers on the data. It was found that the strength of the relationship between both variables was negative and very low, with a value of rTaba(X,Y) = -0.2584861.

Abstrak. Analisis korelasi adalah teknik yang digunakan untuk menentukan kekuatan hubungan antara dua variabel kuantitatif (nilai numerik). Korelasi yang umum digunakan untuk data numerik adalah korelasi Product Moment Pearson. Korelasi ini cocok untuk data yang berdistribusi normal bivariat tanpa pencilan. Tabatabai, dkk (2021) mengusulkan metode korelasi baru yang robust terhadap pencilan, yaitu Taba (T), TabWil (TW), dan TabWil rank (TWR). Korelasi Taba (T) dan TabWil (TW) mengukur hubungan linier antara dua variabel kontinu atau ordinal, sedangkan peringkat TabWil (TWR) mengukur hubungan monotonik. Metode korelasi baru ini sangat kompetitif dibandingkan dengan Pearson dan Spearman, serta ukuran Kuadran, Median, dan Minimum Coavariance Determinant (MCD). Korelasi Spearman, Kuadran, Median, dan MCD memiliki keterbatasan dalam menangani pencilan dan penyimpangan normalitas pada data. Penelitian ini menggunakan korelasi Taba (T) untuk mengukur kekuatan hubungan antara variabel rata-rata lama sekolah dengan indeks keparahan kemiskinan di kabupaten/kota di Indonesia pada tahun 2022, karena terdapat pencilan pada data. Ditemukan bahwa kekuatan hubungan antara kedua variabel tersebut adalah negatif dan sangat rendah, dengan nilai rTaba(X,Y) = -0,2584861.

References

Barnett, V., & Lewis, T. (1980). Outliers in Statistical Data.

Cousineau, D., & Chartier, S. (2010). Outliers detection and treatment: a review. International journal of psychological research, 58-67.

Croux, C., & Roousseeuw, P. J. (n.d.). Time-efficient algorithms for two highly robust estimators of scale.

Daniel, W. W. (1989). Statistik Nonparametrik Terapan. Jakarta: PT. Gramedia.

HD, K., A, V., J, B., I, B., N, L., E, B., & RL, G. (2011). Data Analysis, exploratory. American Journal of Political Science, 705-722.

Hodge, V. J., & Austin, J. (2004). A Survey of Outlier Detection Methodologies.

Hubert, M., & Veeken, S. V. (2008). Outlier detection for skewed data. Journal of Chemometrics: A Journal of the Chemometrics Society.

III, W., & Lonzo, D. (2005). The interquartile range: Theory and estimation.

Indeks Pembangunan Manusia. (2023). Retrieved from Badan Pusat Statistik: https://www.bps.go.id/subject/26/indeks-pembangunan-manusia.html

Keim, D. A., Hao, M. C., Dayal, U., Janetzko, H., & Bak, P. (2010). Generalized scatter plots. Information Visualization.

Kemiskinan dan Ketimpangan. (2023). Retrieved from Badan Pusat Statistik: https://www.bps.go.id/subject/23/kemiskinan-dan-ketimpangan.html#subjekViewTab1

Linear, nonlinear, and monotonic relationships. (2023). Retrieved from Minitab 20 Support: https://support.minitab.com/en-us/minitab/20/help-and-how-to/statistics/basic-statistics/supporting-topics/basics/linear-nonlinear-and-monotonic-relationships/#:~:text=In%20a%20monotonic%20relationship%2C%20the,not%20at%20the%20same%20rate

Suliadi. (2015). Analisis Regresi.

Tabatabai, M., Bailey, S., Bursac, Z., Tabatabai, H., Wilus, D., & Singh, K. P. (2021). An introduce to. BMC Bioinformatics.

Anggi Priliani Yulianto, & Darwis, S. (2021). Penerapan Metode K-Nearest Neighbors (kNN) pada Bearing. Jurnal Riset Statistika, 1(1), 10–18. https://doi.org/10.29313/jrs.v1i1.16

Febyanti, F. (2022). Pemodelan Faktor-Faktor yang Mempengaruhi Harga Rumah di Jabodetabek Menggunakan Metode Regresi Probit. Jurnal Riset Statistika, 50–56. https://doi.org/10.29313/jrs.vi.905

Nur, F., 1, A., & Achmad, A. I. (2023). Perbandingan Fuzzy C-Means Clustering dan Fuzzy Possibilistic C-Means Clustering dalam Pengelompokan Kabupaten/Kota di Jawa Barat Berdasarkan Akses terhadap Sumber Air dan Sanitasi Layak Pada Tahun 2020. 1(1), 27–34. https://doi.org/10.29313/datamath.v1i1.16

Published
2024-02-06