ESTIMASI MISSING DATA DENGAN METODE MULTIVARIATE IMPUTATION BY CHAINED EQUATIONS (MICE) UNTUK MEMBENTUK PERSAMAAN REGRESI LINEAR BERGANDA

Irma Eldiyana, Elah Nurlaelah, Nar Herrhyanto

Abstract


ESTIMASI MISSING DATA DENGAN METODE MULTIVARIATE IMPUTATION BY CHAINED EQUATIONS (MICE) UNTUK MEMBENTUK PERSAMAAN REGRESI LINEAR BERGANDA

ABSTRAK Penelitian ini bertujuan untuk menentukan mengestimasi data yang kosong atau data yang hilang (Mising data). Missing data adalah hilangnya sebagian informasi atau sebagian data pada suatu penelitian. Metode yang digunakan untuk mengatasi missing data pada artikel ini Multivariate Imputation by Chained Equation (MICE). Penerapan MICE terdiri dari tiga langkah utama, yaitu imputasi, analisis, dan pooling. Hasil analisis terhadap data sekunder menghasilkan diperlukan lima kali imputasi untuk mengisi missing data. Langkah analisis menggunakan analisis regresi linear berganda, dengan lima model fit. Kemudian pada langkah pooling, ke-lima model fit regresi linear berganda yang dihasilkan digabungkan menjadi model pool. Selanjutnya model pool yang diperoleh dibandingkan dengan model regresi berganda data awal. Hasil perbandingan menunjukkan bahwa persamaan linear berganda dengan missing data yang diestimasi metode MICE mendekati persamaan liner berganda yang disusun dari data awal, dengan demikian estimasi missing data dengan metode MICE dapat dikatakan baik untuk digunakan.

Kata Kunci: Missing data, Multivariate Imputation by Chained Equation (MICE), persamaan regresi linear berganda

 

ESTIMATION OF MISSING DATA USING MULTIVARIATE IMPUTATION BY CHAINED EQUATIONS METHOD TO FORM MULTIPLE LINEAR REGRESSION EQUATIONS

ABSTRACT This research aims to determine the value of missing data. Missing data is the loss of some information or data in a research. The method was used to overcome this missing data was the Multivariate Imputation by Chained Equation (MICE). Implementation of MICE in this article contained three main steps, there were imputation, analysis and pooling. Based on analysis to data, it need five steps of the imputation to fill in the missing data. The analysis steps used the multiple regression analysis with five fit models. And then in the pooling step, the five fit models were combined into one to obtain a pool model. The pool model which resulted will be compared with the regression model with the initial data using Root Mean Square Error (RMSE). By looking at the results of the RMSE, so the MICE method is considered to be appropriate to use for estimating missing data.

Keywords: Missing data, Multivariate Imputation by Chained Equation (MICE), multiple linear regression equations


Full Text:

PDF

References


Rubin, D. B. (1987). Multiple Imputation for Nonresponse in Surveys. Canada: Library of Congress Cataloging in Publication.

Azur, M. J., Stuart, E. A., Frangakis, C., & Leaf, P. J. (2011). Multiple

Imputation by Chained Equation: What is it and how does it work?

International Journal of Methods in Psychiatric Research, 40-49.

Buuren, S. v., & Groothuis-Oudshoorn, K. (2011). MICE: Multivariate

Imputation by Chained Equation in R. Journal of Statistical Software.


Refbacks

  • There are currently no refbacks.