A Comparison of Six Methods for Missing Data Imputation

Peter  Schmitt; Jonas  M; el; Mickael  Guedj

A Comparison of Six Methods for Missing Data Imputation

Abstract

Peter Schmitt, Jonas Mandel and Mickael Guedj

Missing data are part of almost all research and introduce an element of ambiguity into data analysis. It follows that we need to consider them appropriately in order to provide an efficient and valid analysis. In the present study, we compare 6 different imputation methods: Mean, K-nearest neighbors (KNN), fuzzy K-means (FKM), singular value decomposition (SVD), bayesian principal component analysis (bPCA) and multiple imputations by chained equations (MICE). Comparison was performed on four real datasets of various sizes (from 4 to 65 variables), under a missing completely at random (MCAR) assumption, and based on four evaluation criteria: Root mean squared error (RMSE), unsupervised classification error (UCE), supervised classification error (SCE) and execution time. Our results suggest that bPCA and FKM are two imputation methods of interest which deserve further consideration in practice.

Descargo de responsabilidad: este resumen se tradujo utilizando herramientas de inteligencia artificial y aún no ha sido revisado ni verificado

Comparte este artículo

Aspectos destacados de la revista

Indexado en

Índice Copérnico
Google Académico
sherpa romeo
Base de datos de revistas académicas
Abrir puerta J
Revista GenámicaBuscar
Claves Académicas
TOC de revistas
InvestigaciónBiblia
Infraestructura Nacional del Conocimiento de China (CNKI)
Directorio de publicaciones periódicas de Ulrich
Acceso a la Investigación Global en Línea en Agricultura (AGORA)
Biblioteca de revistas electrónicas
Búsqueda de referencia
Universidad Hamdard
EBSCO AZ
Directorio de indexación de resúmenes para revistas
OCLC-WorldCat
Catálogo en línea SWB
Biblioteca Virtual de Biología (vifabio)
publones
Pub Europeo

Revista de biometría y bioestadística