Model Quasi-likelihood untuk Mengatasi Masalah Overdispersi pada Data yang Berdistribusi Multinomial

Uli Silma; Nusar Hajarisman

doi:10.29313/bcss.v2i1.2125

Uli Silma Statistika, Universitas Islam Bandung
Nusar Hajarisman Statistika, Universitas Islam Bandung

DOI: https://doi.org/10.29313/bcss.v2i1.2125

Keywords: Data polikotomus, Distribusi Multinomial, Overdisperdi, Model Quasi-likelihood

Abstract

Abstract. Discrete data is data in the form of numbers (numbers) obtained by counting. As stated by McCullagh and Nelder (1989), overdispersion problems will often be encountered in discrete data analysis, both response variables in the form of binary (dichotomous), counts, and structures of more than two categories (polychotomous) such as in this multinomial distributed model. The number of events with more than two categories can be expressed by following a multinomial distribution. Several basic assumptions must be met when applying a multinomial distributed model to a particular data set, one of which is that the response variable is an independent random variable, and the probability of success of an event is constant. However, in practice, it is not uncommon for assumptions to be violated, in which random variables are independent. The independence between random variables is interpreted as a correlation between the response variables, this is an indication that there is a problem called overdispersion. Data can be said to have overdispersion problems when the Pearson deviance or chi-squared value is more than 1 (McCullagh & Nelder, 1989). The multinomial distribution is one method that can be used to overcome the problem of overdispersion in data that follows a normal distribution. The quasi-likelihood model discussed in this thesis is one model that can be used to overcome the problem of overdispersion in data that follows a multinomial distribution. The data used by the author for the application of the quasi-likelihood model is data on the satisfaction level of PDAM users in Antapani Wetan village in October 2019.

Abstrak. Data diskrit adalah data yang berbentuk angka (bilangan) yang diperoleh dengan cara membilang. Sebagaimana yang diungkapkan oleh McCullagh dan Nelder (1989), masalah overdispersi akan sering dijumpai dalam analisis data diskrit, baik variabel respons yang berbentuk biner (dikotomus), cacahan, maupun struktur lebih dari dua kategori (polikotomus) seperti dalam model yang berdistribusi multinomial ini. Banyaknya kejadian dengan lebih dari dua kategorik dapat dinyatakan dengan mengikuti distribusi multinomial. Ada beberapa asumsi dasar yang harus dipenuhi pada saat mengaplikasikan model yang berdistribusi multinomial pada gugus data tertentu, salah satunya adalah bahwa variabel respon merupakan variabel acak yang saling bebas, dan peluang sukses dari suatu kejadian adalah konstan. Namun pada praktiknya tak jarang terjadi pelanggaran asumsi, di mana terdapat ketidakbebasan antar variabel acak. Ketidakbebasan antar variabel acak dimaknai sebagai adanya korelasi diantara variabel respon, hal tersebut merupakan suatu bukti indikasi bahwa terdapat masalah yang disebut overdispersi. Data dapat dinyatakan mengalami masalah overdispersi ketika nilai devians atau chi kuadrat Pearson yang lebih dari 1 (McCullagh & Nelder, 1989). Distribusi multinomial merupakan salah satu metode yang dapat digunakan untuk mengatasi masalah overdispersi pada data yang mengikuti distribusi normal. Model quasi-likelihood yang dibahas dalam skripsi ini merupakan salah satu model yang dapat digunakan untuk mengatasi masalah overdispersi pada data yang mengikuti distribusi multinomial. Data yang digunakan penulis untuk penerapan model quasi-likelihood adalah data tingkat kepuasan pengguna PDAM di kelurahan Antapani Wetan Bulan Oktober Tahun 2019.