Aspectos Computacionais da Estimação e Predição em Modelos Lineares Mistos para Seleção de Híbridos de Milho em Ensaios Premilinares
Autor(a) principal: | |
---|---|
Data de Publicação: | 2016 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) |
Texto Completo: | http://repositorio.ufes.br/handle/10/7836 |
Resumo: | Maize (Zea mays L.), is a specie from the Poaceae family, diploid and allogamous. In this culture, there is an increase with the accumulation of heterozygous loci, thus justifying hybrids productions. Due to drastic predictions of climate change and population growth in the coming years, it is necessary to adopt, develop and enhance methods that allow a greater efficiency in the selection and achieve greater genetic progress in crop improvement programs of agriculture importance that can help mitigation of challenges to sustain the food security of this century. Therefore, the objective of this study was to implement the algorithms of first and second derivatives for the REML (restricted maximum likelihood) method in R, generalizable for different mixed linear models and enable incorporate arrays of relationship. Moreover, to evaluate the impact of mathematical simplifications, sparse matrices and different convergence error rates in computational efficiency of these algorithms aiming to minimize the computational cost to enable REML in studies with a great number of maize hybrids and complex models, in computers with simple setup. The experimental data used in this study was obtained from harvest 2013/14 conducted in a randomized block design with five controls and 3352 simple maize hybrids in Embrapa (Empresa Brasileira de Pesquisa Agropecuária) Maize and Sorghum in the city of Sete Lagoas- MG. The analyzed variable was grain yield, which is subjected to analysis using mixed models with and without pedigree of incorporation using different REML algorithms, in R. Computation response evaluated the convergence criteria, error rates convergence, sparse matrices, computers with different processing capabilities, different initial estimates of variance components and increasing number of EM (Expectation Maximization) steps in combined algorithms. The proposed algorithms were equivalent for the tested software (ASReml, Selegen and Ime4) and the estimates of variance components indicating their coherence. Furthermore, the use of sparse matrices in association with the proposed optimizations, reduced the computational cost of the algorithms using coefficients of determination as a convergence criteria and convergence error rate equal to 10-5. The hybrid combination of EM algorithm, in ten steps, with NR (Newton Raphson) reduced the computational cost and increased the average convergence percentage. Although, it was observed that uniform weights for the initial estimates of the variance components should be avoided. |
id |
UFES_b6f15b1c72c799cc249f72232772f4df |
---|---|
oai_identifier_str |
oai:repositorio.ufes.br:10/7836 |
network_acronym_str |
UFES |
network_name_str |
Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) |
repository_id_str |
2108 |
spelling |
Pastina, Maria MartaGuimarães, Lauro José MoreiraFerreira, AdésioMarçal, Tiago de SouzaSantos, Pedro Henrique Araújo DinizSouza, Tércio da Silva de2018-08-01T22:57:26Z2018-08-012018-08-01T22:57:26Z2016-06-30Maize (Zea mays L.), is a specie from the Poaceae family, diploid and allogamous. In this culture, there is an increase with the accumulation of heterozygous loci, thus justifying hybrids productions. Due to drastic predictions of climate change and population growth in the coming years, it is necessary to adopt, develop and enhance methods that allow a greater efficiency in the selection and achieve greater genetic progress in crop improvement programs of agriculture importance that can help mitigation of challenges to sustain the food security of this century. Therefore, the objective of this study was to implement the algorithms of first and second derivatives for the REML (restricted maximum likelihood) method in R, generalizable for different mixed linear models and enable incorporate arrays of relationship. Moreover, to evaluate the impact of mathematical simplifications, sparse matrices and different convergence error rates in computational efficiency of these algorithms aiming to minimize the computational cost to enable REML in studies with a great number of maize hybrids and complex models, in computers with simple setup. The experimental data used in this study was obtained from harvest 2013/14 conducted in a randomized block design with five controls and 3352 simple maize hybrids in Embrapa (Empresa Brasileira de Pesquisa Agropecuária) Maize and Sorghum in the city of Sete Lagoas- MG. The analyzed variable was grain yield, which is subjected to analysis using mixed models with and without pedigree of incorporation using different REML algorithms, in R. Computation response evaluated the convergence criteria, error rates convergence, sparse matrices, computers with different processing capabilities, different initial estimates of variance components and increasing number of EM (Expectation Maximization) steps in combined algorithms. The proposed algorithms were equivalent for the tested software (ASReml, Selegen and Ime4) and the estimates of variance components indicating their coherence. Furthermore, the use of sparse matrices in association with the proposed optimizations, reduced the computational cost of the algorithms using coefficients of determination as a convergence criteria and convergence error rate equal to 10-5. The hybrid combination of EM algorithm, in ten steps, with NR (Newton Raphson) reduced the computational cost and increased the average convergence percentage. Although, it was observed that uniform weights for the initial estimates of the variance components should be avoided.O milho (Zea mays L.) é uma espécie da família Poaceae, diplóide e alógama. Para esta cultura verifica-se o aumento do vigor com o acúmulo de loci heterozigotos, justificando assim a produção dos híbridos. Com o advento das drásticas previsões de mudanças climáticas e aumento populacional para os próximos anos é necessária à adoção, desenvolvimento e aprimoração de métodos que permitam maior eficiência na seleção e alcance de maior progresso genético em programas de melhoramento de culturas de importância agrícola poderão auxiliar na mitigação dos desafios para sustentar a segurança alimentar ainda neste século. Diante do exposto, este trabalho teve por objetivo implementar os algoritmos de primeira e segunda derivadas para o método REML (máxima verossimilhança restrita) em R, generalizáveis para diferentes modelos lineares mistos e capazes de incorporar matrizes de parentesco. Além de avaliar o impacto de simplificações matemáticas, matrizes esparsas, e diferentes taxas de erro de convergência na eficiência computacional destes algoritmos, visando a minimização do custo computacional para viabilizar o REML, em estudos com grande número de híbridos de milho e modelos complexos, em computadores de configuração simples. Os dados experimentais utilizados neste trabalho foram obtidos na safra 2013/14 em ensaio conduzido no delineamento de blocos aumentados com cinco testemunhas e 3352 híbridos simples de milho na Embrapa (Empresa Brasileira de Pesquisa Agropecuária) Milho e Sorgo situada em Sete Lagoas - MG. A variável analisada foi o rendimento de grãos, sendo esta submetida a análise através de modelos mistos com e sem a incorporação do pedigree utilizando-se diferentes algoritmos REML, em R, e a resposta computacional foi avaliada quanto aos critérios de convergência, taxas de erro de convergência, matrizes esparsas, computadores com diferentes capacidades de processamento, diferentes estimativas iniciais dos componentes de variância e número crescente de passos EM (Expectation Maximization) nos algoritmos combinados. Os algoritmos propostos foram equivalentes aos softwares testados (ASReml, Selegen e lme4) quanto as estimativas dos componentes de variância, indicando a coerência dos mesmos. Além disso, o uso de matrizes esparsas em associação com as otimizações propostas diminuíram o custo computacional dos algoritmos utilizando os coeficientes de determinação como critério de convergência e taxa de erro de convergência igual a 10-5. A combinação híbrida do algoritmo EM, em dez passos, com o NR (Newton Raphson) reduziu o custo computacional e aumentou o percentual de convergência médio. Ainda observou-se que pesos uniformes para as estimativas iniciais dos componentes de variância devem ser evitados.Texthttp://repositorio.ufes.br/handle/10/7836porUniversidade Federal do Espírito SantoMestrado em Genética e MelhoramentoPrograma de Pós-Graduação em Genética e MelhoramentoUFESBRTopcrossAlgorithmsZea maysAlgoritmosREMLBLUPZea maysMilhoAlgorítmos computacionaisMelhoramento vegetalMelhoramento Vegetal631.523Aspectos Computacionais da Estimação e Predição em Modelos Lineares Mistos para Seleção de Híbridos de Milho em Ensaios Premilinaresinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)instname:Universidade Federal do Espírito Santo (UFES)instacron:UFESORIGINALtese_10029_Dissertação Final Tiago de Souza Marçal.pdfapplication/pdf1829947http://repositorio.ufes.br/bitstreams/115fcc07-b12f-4ec6-86de-d825a315edee/download97df059fea5ce8331745b5840ac8d15cMD5110/78362024-06-24 10:17:35.399oai:repositorio.ufes.br:10/7836http://repositorio.ufes.brRepositório InstitucionalPUBhttp://repositorio.ufes.br/oai/requestopendoar:21082024-07-11T14:35:25.491306Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) - Universidade Federal do Espírito Santo (UFES)false |
dc.title.none.fl_str_mv |
Aspectos Computacionais da Estimação e Predição em Modelos Lineares Mistos para Seleção de Híbridos de Milho em Ensaios Premilinares |
title |
Aspectos Computacionais da Estimação e Predição em Modelos Lineares Mistos para Seleção de Híbridos de Milho em Ensaios Premilinares |
spellingShingle |
Aspectos Computacionais da Estimação e Predição em Modelos Lineares Mistos para Seleção de Híbridos de Milho em Ensaios Premilinares Marçal, Tiago de Souza Topcross Algorithms Zea mays Algoritmos REML BLUP Zea mays Melhoramento Vegetal Milho Algorítmos computacionais Melhoramento vegetal 631.523 |
title_short |
Aspectos Computacionais da Estimação e Predição em Modelos Lineares Mistos para Seleção de Híbridos de Milho em Ensaios Premilinares |
title_full |
Aspectos Computacionais da Estimação e Predição em Modelos Lineares Mistos para Seleção de Híbridos de Milho em Ensaios Premilinares |
title_fullStr |
Aspectos Computacionais da Estimação e Predição em Modelos Lineares Mistos para Seleção de Híbridos de Milho em Ensaios Premilinares |
title_full_unstemmed |
Aspectos Computacionais da Estimação e Predição em Modelos Lineares Mistos para Seleção de Híbridos de Milho em Ensaios Premilinares |
title_sort |
Aspectos Computacionais da Estimação e Predição em Modelos Lineares Mistos para Seleção de Híbridos de Milho em Ensaios Premilinares |
author |
Marçal, Tiago de Souza |
author_facet |
Marçal, Tiago de Souza |
author_role |
author |
dc.contributor.advisor-co1.fl_str_mv |
Pastina, Maria Marta |
dc.contributor.advisor-co2.fl_str_mv |
Guimarães, Lauro José Moreira |
dc.contributor.advisor1.fl_str_mv |
Ferreira, Adésio |
dc.contributor.author.fl_str_mv |
Marçal, Tiago de Souza |
dc.contributor.referee1.fl_str_mv |
Santos, Pedro Henrique Araújo Diniz |
dc.contributor.referee2.fl_str_mv |
Souza, Tércio da Silva de |
contributor_str_mv |
Pastina, Maria Marta Guimarães, Lauro José Moreira Ferreira, Adésio Santos, Pedro Henrique Araújo Diniz Souza, Tércio da Silva de |
dc.subject.eng.fl_str_mv |
Topcross Algorithms Zea mays |
topic |
Topcross Algorithms Zea mays Algoritmos REML BLUP Zea mays Melhoramento Vegetal Milho Algorítmos computacionais Melhoramento vegetal 631.523 |
dc.subject.por.fl_str_mv |
Algoritmos REML BLUP Zea mays |
dc.subject.cnpq.fl_str_mv |
Melhoramento Vegetal |
dc.subject.br-rjbn.none.fl_str_mv |
Milho Algorítmos computacionais Melhoramento vegetal |
dc.subject.udc.none.fl_str_mv |
631.523 |
description |
Maize (Zea mays L.), is a specie from the Poaceae family, diploid and allogamous. In this culture, there is an increase with the accumulation of heterozygous loci, thus justifying hybrids productions. Due to drastic predictions of climate change and population growth in the coming years, it is necessary to adopt, develop and enhance methods that allow a greater efficiency in the selection and achieve greater genetic progress in crop improvement programs of agriculture importance that can help mitigation of challenges to sustain the food security of this century. Therefore, the objective of this study was to implement the algorithms of first and second derivatives for the REML (restricted maximum likelihood) method in R, generalizable for different mixed linear models and enable incorporate arrays of relationship. Moreover, to evaluate the impact of mathematical simplifications, sparse matrices and different convergence error rates in computational efficiency of these algorithms aiming to minimize the computational cost to enable REML in studies with a great number of maize hybrids and complex models, in computers with simple setup. The experimental data used in this study was obtained from harvest 2013/14 conducted in a randomized block design with five controls and 3352 simple maize hybrids in Embrapa (Empresa Brasileira de Pesquisa Agropecuária) Maize and Sorghum in the city of Sete Lagoas- MG. The analyzed variable was grain yield, which is subjected to analysis using mixed models with and without pedigree of incorporation using different REML algorithms, in R. Computation response evaluated the convergence criteria, error rates convergence, sparse matrices, computers with different processing capabilities, different initial estimates of variance components and increasing number of EM (Expectation Maximization) steps in combined algorithms. The proposed algorithms were equivalent for the tested software (ASReml, Selegen and Ime4) and the estimates of variance components indicating their coherence. Furthermore, the use of sparse matrices in association with the proposed optimizations, reduced the computational cost of the algorithms using coefficients of determination as a convergence criteria and convergence error rate equal to 10-5. The hybrid combination of EM algorithm, in ten steps, with NR (Newton Raphson) reduced the computational cost and increased the average convergence percentage. Although, it was observed that uniform weights for the initial estimates of the variance components should be avoided. |
publishDate |
2016 |
dc.date.issued.fl_str_mv |
2016-06-30 |
dc.date.accessioned.fl_str_mv |
2018-08-01T22:57:26Z |
dc.date.available.fl_str_mv |
2018-08-01 2018-08-01T22:57:26Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://repositorio.ufes.br/handle/10/7836 |
url |
http://repositorio.ufes.br/handle/10/7836 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
Text |
dc.publisher.none.fl_str_mv |
Universidade Federal do Espírito Santo Mestrado em Genética e Melhoramento |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Genética e Melhoramento |
dc.publisher.initials.fl_str_mv |
UFES |
dc.publisher.country.fl_str_mv |
BR |
publisher.none.fl_str_mv |
Universidade Federal do Espírito Santo Mestrado em Genética e Melhoramento |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) instname:Universidade Federal do Espírito Santo (UFES) instacron:UFES |
instname_str |
Universidade Federal do Espírito Santo (UFES) |
instacron_str |
UFES |
institution |
UFES |
reponame_str |
Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) |
collection |
Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) |
bitstream.url.fl_str_mv |
http://repositorio.ufes.br/bitstreams/115fcc07-b12f-4ec6-86de-d825a315edee/download |
bitstream.checksum.fl_str_mv |
97df059fea5ce8331745b5840ac8d15c |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 |
repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) - Universidade Federal do Espírito Santo (UFES) |
repository.mail.fl_str_mv |
|
_version_ |
1813022615692902400 |