Regresi Nonparametrik Spline untuk Memodelkan Faktor-faktor yang Memengaruhi Indeks Pembangunan Gender (IPG) di Jawa Barat Tahun 2020

  • Nisrina Fajriati Rahayu Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam
  • Lisnur Wachidah Statistika, Universitas Islam Bandung
Keywords: Generalized Cross Validiation (GCV), Regresi Nonparametrik Spline, Indeks Pembangunan Gender (IPG), Titik Knot

Abstract

Abstract. Regression analysis is a statistical method used to determine the pattern of the relationship between the independent variable and the dependent variable. There are three kinds of regression analysis, namely parametric regression analysis, semiparametric regression analysis and nonparametric regression analysis. Parametric regression analysis can be used when the assumptions are met but not all data can meet the parametric assumptions, an alternative to parametric regression is nonparametric regression because its use does not require strict assumptions. Spline nonparametric regression is a method used to get the estimated regression curve through the estimation of the data pattern according to the movement. The selection of the best model for Spline regression is seen from the Generalized Cross Validiation (GCV) value using the minimum knot point. In this study, the dependent variable used is the Gender Development Index (GDI) in West Java Province in 2020 which consists of 18 districts and 9 cities with the independent variables consisting of the average length of schooling for women, the expected length of schooling for women, the open unemployment rate for women, female labor force participation rate, women with health complaints and sex ratio. The results of the analysis obtained that the best nonparametric Spline regression model was using the order of one and three knot points with the minimum GCV value of 0.2471, and the coefficient of determination was 99.98%. The six independent variables used have a significant influence on GPA in West Java in 2020.

Abstrak. Analisis regresi adalah metode statistika yang digunakan untuk menentukan pola hubungan antara variabel bebas dengan variabel terikat. Terdapat tiga macam analisis regresi, yaitu analisis regresi parametrik, analisis regresi semiparametrik dan analisis regesi nonparametrik. Analisis regresi parametrik dapat digunakan ketika asumsi terpenuhi akan tetapi tidak semua data dapat memenuhi asumsi parametrik, alternatif dari regresi parametrik adalah regresi nonparametrik karena penggunaanya tidak memerlukan asumsi yang ketat. Regresi nonparametrik Spline merupakan metode yang digunakan untuk mendapatkan dugaan kurva regresi melalui pendekatan estimasi pola data sesuai pergerakannya. Pemilihan model terbaik pada regesi Spline dilihat dari nilai Generalized Cross Validiation (GCV) dengan menggunakan titik knot yang paling minimum. Pada penelitian ini variabel terikat yang digunakan adalah Indeks Pembangunan Gender (IPG) di Provinsi Jawa Barat Tahun 2020 yang terdiri dari 18 kabupaten dan 9 kota dengan variabel bebas yang terdiri dari rata-rata lama sekolah perempuan, harapan lama sekolah perempuan, tingkat pengangguran terbuka perempuan, tingkat partisipasi angkatan kerja perempuan, perempuan yang memiliki keluhan kesehatan dan rasio jenis kelamin. Hasil dari analisis diperoleh model regresi nonparametrik Spline yang terbaik adalah dengan menggunakan orde satu dan tiga titik knot dengan nilai GCV yang paling minimum 0,2471, serta didapatkan nilai koefisien determinasi sebesar 99,98%. Dengan ke enam variabel bebas yang digunakan memiliki pengaruh yang signifikan terhadap IPG di Jawa Barat tahun 2020.

Published
2022-07-29