SABER UCV >
1) Investigación >
Trabajos no publicados >

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10872/9094

Título : RESOLVIENDO EL PROBLEMA DE IMPUTACIÓN USANDO SAS.
Autor : Reyes Polanco, Andrés E.
Palabras clave : datos faltantes
imputación
imputación simple con SAS
imputación múltiple con SAS
proc mi
proc mianalyze
Fecha de publicación : 4-May-2015
Resumen : La siguiente monografía tiene como finalidad abordar el problema de datos faltantes en un archivo de datos, usando como herramienta computacional el software SAS. Un problema común en la recolección de datos primarios es la presencia de datos perdidos que puede explicarse por varios motivos, por ejemplo, en una encuesta sobre el ingreso familiar pueden darse casos en donde la persona se niegue a dar la información o simplemente no se encuentre la persona adecuada que pueda suministrarla. Otro caso es aquel donde se encuentran valores atípicos. Hay dos formas de ver la presencia de valores atípicos: uno desde el punto de vista probabilístico y el otro como consecuencia de errores humanos. Desde el punto de vista probabilístico, se puede definir como valor atípico, aquel que según la población en estudio, la probabilidad de ocurrencia de ese valor es casi nula y sin embargo ocurrió. Pero cuando ese no es el caso sino por motivos distintos a la ley de probabilidad, entonces debe eliminarse convirtiéndose en un valor perdido. Por tanto en un archivo de datos debe detectarse los valores perdidos y aquellos atípicos productos de errores humanos que deben considerarse como valores faltantes cuando no es posible corregirlos. Las soluciones dadas a este problema son muy variadas, una de ellas es desechar en el análisis estadístico aquellas variables que para al menos una observación no existe el dato correspondiente. Esto ocurre cuando se está aplicando técnicas de análisis de datos tales como regresión múltiple, componentes principales, análisis de correspondencia entre otros, en el caso de regresión múltiple se requiere que todas las variables explicativas contengan todos los datos de las observaciones, en los casos de reducción de dimensionalidad como componentes principales todas las observaciones de todas las variables deben tener sus datos presentes. La otra solución, en el caso de análisis univariante, es trabajar con los datos existentes y hacer las estimaciones de los parámetros con los datos disponibles en cada variable, obviando la presencia de valores faltantes.
URI : http://hdl.handle.net/10872/9094
Aparece en las colecciones: Trabajos no publicados

Ficheros en este ítem:

Fichero Descripción Tamaño Formato
PROBLEMA DE IMPUTACIÓN USANDO SAS.pdf1.7 MBAdobe PDFVisualizar/Abrir

Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.

 

Valid XHTML 1.0! DSpace Software Copyright © 2002-2008 MIT and Hewlett-Packard - Comentarios