Como regla general, si faltan menos del 5% de las observaciones, los datos faltantes simplemente se pueden eliminar sin ramificaciones significativas (3).
- ¿Qué porcentaje de datos faltantes es aceptable??
- ¿Cuántos datos faltantes son aceptables para la imputación única??
- ¿Cómo se ocupa del 50% de datos faltantes??
¿Qué porcentaje de datos faltantes es aceptable??
¿Cuántos datos faltan?? El porcentaje general de datos que faltan es importante. En general, si faltan menos del 5% de los valores, entonces es aceptable ignorarlos (Ref).
¿Cuántos datos faltantes son aceptables para la imputación única??
Scheffer (2002) sugiere que los casos completos pueden usarse si no faltan más del 6% de los datos, la imputación única si no hay más del 10% de los datos y los procedimientos más complejos, como la imputación múltiple, si entre el 10% y el 25% de los datos faltan.
¿Cómo se ocupa del 50% de datos faltantes??
Ejecute modelos predictivos que imputen los datos faltantes. Esto debe hacerse junto con algún tipo de esquema de validación cruzada para evitar fugas. Esto puede ser muy efectivo y puede ayudar con el modelo final. Use el número de valores faltantes en una fila dada para crear una nueva función de ingeniería.