Evaluación de la multicolinealidad en modelos de regresión lineal múltiple con presencia de valores atípicos
Palabras clave:
Variables, colinealidad, valores atípicosResumen
Se evaluó la multicolinealidad en modelos de regresión lineal múltiple con presencia de valores atípicos, para lo cual
se utilizó un estudio de simulación con un modelo lineal con tres variables regresoras (X
1, X2 y X3) y una respuesta
(Y) para cuatro tamaños de muestra (10, 20, 30 y 50), en donde las variables X
1 y X2 fueron generadas partiendo
de tres distribuciones teóricas continuas (uniforme, normal, y exponencial) y X
3 fue establecida como una combinación
lineal (X
3 = X1 + 2*X2 + e), utilizando un modelo contaminado con un porcentaje dado de valores atípicos. Para
evaluar la multicolinealidad se utilizó el índice de colinealidad (K). En ese sentido, se evidenció un potencial efecto del
tamaño de muestra y del tipo de distribución teórica de los regresores del modelo sobre el índice de condición K, con
el subsecuente efecto sobre el grado de multicolinealidad, lo que demuestra como la presencia de valores atípicos en la
muestra no afecta la estructura del modelo, sino más bien a los parámetros del mismo. Finalmente, se sugiere un estudio
más exhaustivo del error cuadrático medio del estimador de mínimos cuadrados ordinarios del modelo de regresión lineal
múltiple en presencia de regresores colineales, toda vez que se observó como el error cuadrático medio tiende a cero para
el estimador de la variable colineal, lo que pudiera sugerir el posible uso del error cuadrático medio del estimador de
mínimos cuadrados ordinarios como una alternativa para identificar regresores colineales en un modelo lineal.