SABER UCV >
2) Tesis >
Doctoral >

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10872/18412

Título : Una contribución al estudio de la multicolinealidad en modelos de regresión lineal múltiple usando distribuciones de contorno elíptico
Otros títulos : A contribution to multicollinearity study in multiple linear regression models by using elliptical contour distributions
Autor : Villegas Rivas, Danny Alberto
Palabras clave : Multicolinealidad
contorno
distribución
elíptico
regresión
Fecha de publicación : 2017
Citación : Villegas Rivas, D. A. (2017). Una contribución al estudio de la multicolinealidad en modelos de regresión lineal múltiple usando distribuciones de contorno elíptico. Maracay, Venezuela.
Citación : 2018;1387-001
Resumen : En el presente trabajo se propone una metodología para el estudio de la multicolinealidad en modelos lineales, la cual está constituida por dos estadísticos basados en distribuciones de contornos elípticos; el primero , el cual sigue una distribución t de Student generalizada no centrada, y , cuya distribución se aproxima a la normal N(0,1). Así mismo, se plantea e uso del estadístico , basado en el error cuadrático medio del estimador de mínimos cuadrados ordinarios del modelo, el cual sigue una distribución Chi-cuadrado y permite identificar el origen de la multicolinealidad. Las metodologías se validaron mediante un estudio de simulación, a través de un modelo lineal con tres variables independientes ( ), donde es un número real conocido. Se consideraron cinco tamaños de muestra (n=7, n=10, n=20, n=30, n=50 y n=100) y cinco distribuciones teóricas (uniforme, exponencial, normal, log-normal y gamma), así como errores heterocedasticos y homocedasticos. Las frecuencias relativas de los estadísticos de prueba se confrontaron con los cuantiles de la distribución. Las metodologías fueron aplicadas a un conjunto de datos reales provenientes de dos ensayos agrícolas, el primero de un experimento con el cultivo de maíz y el segundo a un experimento con el pasto Brachiaria brizantha cv. Toledo. Los resultados evidenciaron que ambas metodologías están condicionadas por la distribución de las variables independientes y por el tamaño de muestra, en particular, la distribución t generalizada no centrada y la normal. La distribución del estadístico se aproximó bien para tamaños de muestra n ≤ 20 y distribuciones exponencial, gamma y uniforme, así como para n < 10 y una distribución normal y log-normal, mientras que el estadístico se aproximó bien para tamaños de muestra n > 20 y una distribución normal y log-normal. Para la distribución uniforme este estadístico se aproximó bien para tamaños de muestra n ≥ 30, mientras que para la distribución exponencial y gamma se requieren tamaños de muestra n ≥ 50. Se verificó la propiedad que tienen las distribuciones t generalizada no centrada y normal de ser invariantes bajo leyes elípticas. El estadístico de prueba verificó la propiedad de consistencia cuando las variables independientes siguen una distribución log-normal, y se demostró que este procedimiento de prueba se hace más robusto conforme se incrementan tanto el tamaño de muestra como el grado de multicolinealidad en el modelo. Finalmente, las metodologías propuestas en este trabajo se muestran como poderosas herramientas para el estudio de la multicolinealidad, si se comparan con las comúnmente utilizadas, ya que no solo permiten verificar la presencia de multicolinealidad, sino también el origen de la misma. Así mismo, se evidenció las ventajas del uso de transformaciones logarítmicas como alternativa de tratamiento de la multicolinealidad.
Descripción : In this paper we propose a methodology for the study of multicollinearity in linear models, which is constituted by the statistics based on distributions of elliptic contours; The first , the first, which remains a t student generalized non-centered distribution, and , whose distribution approaches the normal N (0,1). In the same way, the statistical , based on the mean squared error of the ordinary least squares estimator of the model, is proposed and used, which remains a Chi-square distribution and allows the identification of the origin of multicollinearity . The methodologies are validated through a simulation study and a linear model with three independent variables ( ), where is a known real number. Five sample sizes (n=7, n=10, n=20, n=30, n=50 and n=100) and five theoretical distributions (uniform, exponential, normal, lognormal and gamma) as well as homocedastic and heterocedastic errors. The relative frequencies of the test statistic are compared with the quantiles of the distribution. The methodologies were applied to a real data set of two agricultural trials, the first of an experiment with the maize crop and the second to an experiment with the grass Brachiaria brizantha cv. Toledo. The results showed that both methodologies are conditioned by the distribution of the independent variables and by the sample size, in particular the t student generalized non-centered and normal distribution. The distribution of the statistic approximated well for sample sizes n ≤ 20 and an exponential, gamma and uniform distributions, as well as for n<10 and a normal and log-normal distributions, whereas the statistic approached well for sample sizes n>20 and a normal and log-normal distribution. For the uniform distribution this statistic was approached well for sample sizes n ≥ 30, while for an exponential and gamma distribution a sample size n ≥ 50 it is required. The property that has the t generalized distributions non central and normal to be invariant under elliptical laws was verified. The test statistic verifies the consistency property when the independent variables follows a log-normal distribution, and it proves that this test procedure becomes more robust as both the sample size as the degree of multicollinearity in the model. Finally, the methodologies proposed in this work are powerful tools for the study of multicollinearity, when compared to those commonly used, since there is not only a verification of the presence of multicollinearity, but also the origin of the multicollinearity. Likewise, the advantages of the use of logarithmic transformations as an alternative for the treatment of multicollinearity were evidenced.
URI : http://hdl.handle.net/10872/18412
Aparece en las colecciones: Doctoral

Ficheros en este ítem:

Fichero Descripción Tamaño Formato
Tesis_Doctorado_Danny_Villegas-Publicacion.pdf1.78 MBAdobe PDFVisualizar/Abrir

Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.

 

Valid XHTML 1.0! DSpace Software Copyright © 2002-2008 MIT and Hewlett-Packard - Comentarios