Não-normalidade multivariada e multicolinearidade em análise de trilha na cultura de milho
Autor(a) principal: | |
---|---|
Data de Publicação: | 2012 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Manancial - Repositório Digital da UFSM |
Texto Completo: | http://repositorio.ufsm.br/handle/1/5057 |
Resumo: | The path analysis allows evaluation of the direct and indirect effects of the explicative variables on variable of interest, through the breakdown of the correlation coefficients. In order to make the results obtained through the path analysis reliable, some assumptions must be met. Thus, the objectives of this study were to verify the normality and the multicollinearity interference in the corn path analysis and compare alternative methods for estimating the path coefficients. Data from 44 trials of corn cultivars was used, carried out in the state of Rio Grande do Sul, between the crop years 2002/03 and 2004/05. In each cultivar, of each trial, were measured (number of days until the male flowering, plant height, ear insertion height, relative position of the ear, number of plants, number of ears and prolificacy) and the main variable (grain yield). For each trial, descriptive statistics were calculated and univariate and multivariate normality diagnoses were conducted using the Shapiro-Wilk test and the Shapiro-Wilk multivariate generalized by Royston test, respectively. Thereupon, in the trials data that did not present a normal distribution, a transformation of the data by the Box-Cox family of transformations was carried out. The correlation coefficients between the seven explicative variables (correlation matrix X'X) and the correlation coefficients of each explicative variable with the grain yield (correlation matrix X'Y) were calculated for the original and transformed data. Then, the multicollinearity was diagnosed in the correlation matrix X'X, using four methods: variance inflation factor, tolerance, the condition number and the matrix determinant. Finally, the path analysis was performed, using the normal equations system X X �� = X Y, in three forms: traditional path analysis, path analysis under multicollinearity and traditional path analysis, with elimination of variables. The data transformation, to obtain multivariate normality, contributes to the degree of multicollinearity decrease and in the stabilization of the direct effects in path analysis with high degree of multicollinearity. The high degrees of multicollinearity adverse effects in the estimation of the direct effects in path analysis are larger than the multivariate non-normality. The traditional path analysis, with elimination of variables, is more appropriate than the path analysis under multicollinearity. |
id |
UFSM_6cd2f3ca110a5b9db0d003ad0b4a0c61 |
---|---|
oai_identifier_str |
oai:repositorio.ufsm.br:1/5057 |
network_acronym_str |
UFSM |
network_name_str |
Manancial - Repositório Digital da UFSM |
repository_id_str |
|
spelling |
Não-normalidade multivariada e multicolinearidade em análise de trilha na cultura de milhoNon-normality multivariate and multicollinearity in path analysis in cornZea mays L. PressupostosTransformações Box-CoxAnálise de trilha sob multicolinearidadeEliminação de variáveisZea mays L. AssumptionsBox-Cox transformationsPath analysis under multicollinearityElimination of variablesCNPQ::CIENCIAS AGRARIAS::AGRONOMIAThe path analysis allows evaluation of the direct and indirect effects of the explicative variables on variable of interest, through the breakdown of the correlation coefficients. In order to make the results obtained through the path analysis reliable, some assumptions must be met. Thus, the objectives of this study were to verify the normality and the multicollinearity interference in the corn path analysis and compare alternative methods for estimating the path coefficients. Data from 44 trials of corn cultivars was used, carried out in the state of Rio Grande do Sul, between the crop years 2002/03 and 2004/05. In each cultivar, of each trial, were measured (number of days until the male flowering, plant height, ear insertion height, relative position of the ear, number of plants, number of ears and prolificacy) and the main variable (grain yield). For each trial, descriptive statistics were calculated and univariate and multivariate normality diagnoses were conducted using the Shapiro-Wilk test and the Shapiro-Wilk multivariate generalized by Royston test, respectively. Thereupon, in the trials data that did not present a normal distribution, a transformation of the data by the Box-Cox family of transformations was carried out. The correlation coefficients between the seven explicative variables (correlation matrix X'X) and the correlation coefficients of each explicative variable with the grain yield (correlation matrix X'Y) were calculated for the original and transformed data. Then, the multicollinearity was diagnosed in the correlation matrix X'X, using four methods: variance inflation factor, tolerance, the condition number and the matrix determinant. Finally, the path analysis was performed, using the normal equations system X X �� = X Y, in three forms: traditional path analysis, path analysis under multicollinearity and traditional path analysis, with elimination of variables. The data transformation, to obtain multivariate normality, contributes to the degree of multicollinearity decrease and in the stabilization of the direct effects in path analysis with high degree of multicollinearity. The high degrees of multicollinearity adverse effects in the estimation of the direct effects in path analysis are larger than the multivariate non-normality. The traditional path analysis, with elimination of variables, is more appropriate than the path analysis under multicollinearity.Conselho Nacional de Desenvolvimento Científico e TecnológicoA análise de trilha permite avaliar os efeitos diretos e indiretos de variáveis explicativas sobre a variável de interesse, por meio do desdobramento dos coeficientes de correlação. Para que os resultados gerados pela análise de trilha apresentem confiabilidade adequada, alguns pressupostos devem ser atendidos. Assim, os objetivos deste trabalho foram: verificar a interferência da não-normalidade multivariada e da multicolinearidade em análise de trilha na cultura de milho e, comparar métodos alternativos de estimação dos coeficientes de trilha. Foram utilizados dados de 44 ensaios de competição de cultivares de milho, conduzidos no estado do Rio Grande do Sul, entre os anos agrícolas de 2002/03 e 2004/05. Em cada cultivar, de cada ensaio, foram mensuradas sete variáveis explicativas (número de dias até o florescimento masculino, estatura de plantas, altura de inserção da espiga, posição relativa da espiga, número de plantas, número de espigas e prolificidade) e a variável principal (produtividade de grãos). Para cada ensaio, foram calculadas estatísticas descritivas e realizado o diagnóstico de normalidade uni e multivariada, por meio dos testes de Shapiro-Wilk e de Shapiro-Wilk multivariado generalizado por Royston, respectivamente. A seguir, nos dados dos ensaios que não apresentaram distribuição normal, foi realizada a transformação dos dados com a utilização da família de transformações Box-Cox. Para os dados originais e os dados transformados, foram calculados os coeficientes de correlação entre as sete variáveis explicativas (matriz de correlação X X) e os coeficientes de correlação de cada variável explicativa com a produtividade de grãos (matriz de correlação X Y). A seguir, foi realizado o diagnóstico de multicolinearidade na matriz de correlação X X, por meio de quatro métodos: fator de inflação de variância, tolerância, número de condição e determinante da matriz. Por fim, foi realizada a análise de trilha, com a utilização do sistema de equações normais X X �� = X Y, por três formas: análise de trilha tradicional, análise de trilha sob multicolinearidade e análise de trilha tradicional, com eliminação de variáveis. A transformação de dados, a fim de obter a normalidade multivariada, contribui para a redução do grau de multicolinearidade e na estabilização das estimativas dos efeitos diretos em análise de trilha com alto grau de multicolinearidade. Os efeitos adversos do alto grau de multicolinearidade na estimativa dos efeitos diretos de análises de trilha são maiores que a não-normalidade multivariada. A análise de trilha tradicional, com eliminação de variáveis, é mais adequada que a análise de trilha sob multicolinearidade.Universidade Federal de Santa MariaBRAgronomiaUFSMPrograma de Pós-Graduação em AgronomiaCargnelutti Filho, Albertohttp://lattes.cnpq.br/0233728865094243Lopes, Sidinei Joséhttp://lattes.cnpq.br/7533347017859354Nascimento Junior, Alfredo dohttp://lattes.cnpq.br/9864484325583630Toebe, Marcos2017-05-122017-05-122012-02-16info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfapplication/pdfTOEBE, Marcos. Non-normality multivariate and multicollinearity in path analysis in corn. 2012. 108 f. Dissertação (Mestrado em Agronomia) - Universidade Federal de Santa Maria, Santa Maria, 2012.http://repositorio.ufsm.br/handle/1/5057porinfo:eu-repo/semantics/openAccessreponame:Manancial - Repositório Digital da UFSMinstname:Universidade Federal de Santa Maria (UFSM)instacron:UFSM2023-06-28T13:30:36Zoai:repositorio.ufsm.br:1/5057Biblioteca Digital de Teses e Dissertaçõeshttps://repositorio.ufsm.br/ONGhttps://repositorio.ufsm.br/oai/requestatendimento.sib@ufsm.br||tedebc@gmail.comopendoar:2023-06-28T13:30:36Manancial - Repositório Digital da UFSM - Universidade Federal de Santa Maria (UFSM)false |
dc.title.none.fl_str_mv |
Não-normalidade multivariada e multicolinearidade em análise de trilha na cultura de milho Non-normality multivariate and multicollinearity in path analysis in corn |
title |
Não-normalidade multivariada e multicolinearidade em análise de trilha na cultura de milho |
spellingShingle |
Não-normalidade multivariada e multicolinearidade em análise de trilha na cultura de milho Toebe, Marcos Zea mays L. Pressupostos Transformações Box-Cox Análise de trilha sob multicolinearidade Eliminação de variáveis Zea mays L. Assumptions Box-Cox transformations Path analysis under multicollinearity Elimination of variables CNPQ::CIENCIAS AGRARIAS::AGRONOMIA |
title_short |
Não-normalidade multivariada e multicolinearidade em análise de trilha na cultura de milho |
title_full |
Não-normalidade multivariada e multicolinearidade em análise de trilha na cultura de milho |
title_fullStr |
Não-normalidade multivariada e multicolinearidade em análise de trilha na cultura de milho |
title_full_unstemmed |
Não-normalidade multivariada e multicolinearidade em análise de trilha na cultura de milho |
title_sort |
Não-normalidade multivariada e multicolinearidade em análise de trilha na cultura de milho |
author |
Toebe, Marcos |
author_facet |
Toebe, Marcos |
author_role |
author |
dc.contributor.none.fl_str_mv |
Cargnelutti Filho, Alberto http://lattes.cnpq.br/0233728865094243 Lopes, Sidinei José http://lattes.cnpq.br/7533347017859354 Nascimento Junior, Alfredo do http://lattes.cnpq.br/9864484325583630 |
dc.contributor.author.fl_str_mv |
Toebe, Marcos |
dc.subject.por.fl_str_mv |
Zea mays L. Pressupostos Transformações Box-Cox Análise de trilha sob multicolinearidade Eliminação de variáveis Zea mays L. Assumptions Box-Cox transformations Path analysis under multicollinearity Elimination of variables CNPQ::CIENCIAS AGRARIAS::AGRONOMIA |
topic |
Zea mays L. Pressupostos Transformações Box-Cox Análise de trilha sob multicolinearidade Eliminação de variáveis Zea mays L. Assumptions Box-Cox transformations Path analysis under multicollinearity Elimination of variables CNPQ::CIENCIAS AGRARIAS::AGRONOMIA |
description |
The path analysis allows evaluation of the direct and indirect effects of the explicative variables on variable of interest, through the breakdown of the correlation coefficients. In order to make the results obtained through the path analysis reliable, some assumptions must be met. Thus, the objectives of this study were to verify the normality and the multicollinearity interference in the corn path analysis and compare alternative methods for estimating the path coefficients. Data from 44 trials of corn cultivars was used, carried out in the state of Rio Grande do Sul, between the crop years 2002/03 and 2004/05. In each cultivar, of each trial, were measured (number of days until the male flowering, plant height, ear insertion height, relative position of the ear, number of plants, number of ears and prolificacy) and the main variable (grain yield). For each trial, descriptive statistics were calculated and univariate and multivariate normality diagnoses were conducted using the Shapiro-Wilk test and the Shapiro-Wilk multivariate generalized by Royston test, respectively. Thereupon, in the trials data that did not present a normal distribution, a transformation of the data by the Box-Cox family of transformations was carried out. The correlation coefficients between the seven explicative variables (correlation matrix X'X) and the correlation coefficients of each explicative variable with the grain yield (correlation matrix X'Y) were calculated for the original and transformed data. Then, the multicollinearity was diagnosed in the correlation matrix X'X, using four methods: variance inflation factor, tolerance, the condition number and the matrix determinant. Finally, the path analysis was performed, using the normal equations system X X �� = X Y, in three forms: traditional path analysis, path analysis under multicollinearity and traditional path analysis, with elimination of variables. The data transformation, to obtain multivariate normality, contributes to the degree of multicollinearity decrease and in the stabilization of the direct effects in path analysis with high degree of multicollinearity. The high degrees of multicollinearity adverse effects in the estimation of the direct effects in path analysis are larger than the multivariate non-normality. The traditional path analysis, with elimination of variables, is more appropriate than the path analysis under multicollinearity. |
publishDate |
2012 |
dc.date.none.fl_str_mv |
2012-02-16 2017-05-12 2017-05-12 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
TOEBE, Marcos. Non-normality multivariate and multicollinearity in path analysis in corn. 2012. 108 f. Dissertação (Mestrado em Agronomia) - Universidade Federal de Santa Maria, Santa Maria, 2012. http://repositorio.ufsm.br/handle/1/5057 |
identifier_str_mv |
TOEBE, Marcos. Non-normality multivariate and multicollinearity in path analysis in corn. 2012. 108 f. Dissertação (Mestrado em Agronomia) - Universidade Federal de Santa Maria, Santa Maria, 2012. |
url |
http://repositorio.ufsm.br/handle/1/5057 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de Santa Maria BR Agronomia UFSM Programa de Pós-Graduação em Agronomia |
publisher.none.fl_str_mv |
Universidade Federal de Santa Maria BR Agronomia UFSM Programa de Pós-Graduação em Agronomia |
dc.source.none.fl_str_mv |
reponame:Manancial - Repositório Digital da UFSM instname:Universidade Federal de Santa Maria (UFSM) instacron:UFSM |
instname_str |
Universidade Federal de Santa Maria (UFSM) |
instacron_str |
UFSM |
institution |
UFSM |
reponame_str |
Manancial - Repositório Digital da UFSM |
collection |
Manancial - Repositório Digital da UFSM |
repository.name.fl_str_mv |
Manancial - Repositório Digital da UFSM - Universidade Federal de Santa Maria (UFSM) |
repository.mail.fl_str_mv |
atendimento.sib@ufsm.br||tedebc@gmail.com |
_version_ |
1805922080867221504 |