Estimasi Missing Data dengan Metode Multivariate Imputation by Chained Equations (MICE) untuk Membentuk Persamaan Regresi Linier Berganda

Irma Eldiyana, Elah Nurlaelah, Nar Herrhyanto

Abstract


Penelitian ini bertujuan untuk menentukan mengestimasi data yang kosong atau data yang hilang (Mising data). Missing data adalah hilangnya sebagian informasi atau sebagian data pada suatu penelitian. Metode yang digunakan untuk mengatasi missing data pada artikel ini Multivariate Imputation by Chained Equation (MICE). Penerapan MICE terdiri dari tiga langkah utama, yaitu imputasi, analisis, dan pooling. Hasil analisis terhadap data sekunder menghasilkan diperlukan lima kali imputasi untuk mengisi missing data. Langkah analisis menggunakan analisis regresi linear berganda, dengan lima model fit. Kemudian pada langkah pooling, ke-lima model fit regresi linear berganda yang dihasilkan digabungkan menjadi model pool. Selanjutnya model pool yang diperoleh dibandingkan dengan model regresi berganda data awal. Hasil perbandingan menunjukkan bahwa persamaan linear berganda dengan missing data yang diestimasi metode MICE mendekati persamaan liner berganda yang disusun dari data awal, dengan demikian estimasi missing data dengan metode MICE dapat dikatakan baik untuk digunakan.

 


Keywords


Missing data, Multivariate Imputation by Chained Equation (MICE), Persamaan Regresi Linear Berganda

Full Text:

PDF

References


Azur, M. J., Stuart, E. A., Frangakis, C., & Leaf, P. J. (2011). Multiple imputation by chained equations: what is it and how does it work?. International journal of methods in psychiatric research, 20(1), 40-49.

Bouhlila, D. S., & Sellaouti, F. (2013). Multiple imputation using chained equations for missing data in TIMSS: a case study. Large-scale Assessments in Education, 1(1), 1-33.

Ferguson, K. K., Yu, Y., Cantonwine, D. E., McElrath, T. F., Meeker, J. D., & Mukherjee, B. (2018). Foetal ultrasound measurement imputations based on growth curves versus multiple imputation chained equation (MICE). Paediatric and perinatal epidemiology, 32(5), 469-473.

Resche-Rigon, M., & White, I. R. (2018). Multiple imputation by chained equations for systematically and sporadically missing multilevel data. Statistical methods in medical research, 27(6), 1634-1649.

Royston, P., & White, I. R. (2011). Multiple imputation by chained equations (MICE): implementation in Stata. Journal of statistical software, 45, 1-20.

Rubin, D. B. (1987). Multiple Imputation for Nonresponse in Surveys. Canada: Library of Congress Cataloging in Publication.

Shah, A. D., Bartlett, J. W., Carpenter, J., Nicholas, O., & Hemingway, H. (2014). Comparison of random forest and parametric imputation models for imputing missing data using MICE: a CALIBER study. American journal of epidemiology, 179(6), 764-774.

Van Buuren, S., & Groothuis-Oudshoorn, K. (2011). mice: Multivariate imputation by chained equations in R. Journal of statistical software, 45, 1-67.

Wulff, J. N., & Jeppesen, L. E. (2017). Multiple imputation by chained equations in praxis: guidelines and review. Electronic Journal of Business Research Methods, 15(1), 41-56.

Zhang, Z. (2016). Multiple imputation with multivariate imputation by chained equation (MICE) package. Annals of translational medicine, 4(2).




DOI: https://doi.org/10.17509/jem.v8i1.25750

Refbacks

  • There are currently no refbacks.


Copyright (c) 2020 Irma Eldiyana, Elah Nurlaelah, Nar Herrhyanto

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

  

 Google Scholar Logo PNG vector in SVG, PDF, AI, CDR format