Aspectos Computacionais da Estimação e Predição em Modelos Lineares Mistos para Seleção de Híbridos de Milho em Ensaios Premilinares

Detalhes bibliográficos
Autor(a) principal: Marçal, Tiago de Souza
Data de Publicação: 2016
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
Texto Completo: http://repositorio.ufes.br/handle/10/7836
Resumo: Maize (Zea mays L.), is a specie from the Poaceae family, diploid and allogamous. In this culture, there is an increase with the accumulation of heterozygous loci, thus justifying hybrids productions. Due to drastic predictions of climate change and population growth in the coming years, it is necessary to adopt, develop and enhance methods that allow a greater efficiency in the selection and achieve greater genetic progress in crop improvement programs of agriculture importance that can help mitigation of challenges to sustain the food security of this century. Therefore, the objective of this study was to implement the algorithms of first and second derivatives for the REML (restricted maximum likelihood) method in R, generalizable for different mixed linear models and enable incorporate arrays of relationship. Moreover, to evaluate the impact of mathematical simplifications, sparse matrices and different convergence error rates in computational efficiency of these algorithms aiming to minimize the computational cost to enable REML in studies with a great number of maize hybrids and complex models, in computers with simple setup. The experimental data used in this study was obtained from harvest 2013/14 conducted in a randomized block design with five controls and 3352 simple maize hybrids in Embrapa (Empresa Brasileira de Pesquisa Agropecuária) Maize and Sorghum in the city of Sete Lagoas- MG. The analyzed variable was grain yield, which is subjected to analysis using mixed models with and without pedigree of incorporation using different REML algorithms, in R. Computation response evaluated the convergence criteria, error rates convergence, sparse matrices, computers with different processing capabilities, different initial estimates of variance components and increasing number of EM (Expectation Maximization) steps in combined algorithms. The proposed algorithms were equivalent for the tested software (ASReml, Selegen and Ime4) and the estimates of variance components indicating their coherence. Furthermore, the use of sparse matrices in association with the proposed optimizations, reduced the computational cost of the algorithms using coefficients of determination as a convergence criteria and convergence error rate equal to 10-5. The hybrid combination of EM algorithm, in ten steps, with NR (Newton Raphson) reduced the computational cost and increased the average convergence percentage. Although, it was observed that uniform weights for the initial estimates of the variance components should be avoided.
id UFES_b6f15b1c72c799cc249f72232772f4df
oai_identifier_str oai:repositorio.ufes.br:10/7836
network_acronym_str UFES
network_name_str Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
repository_id_str 2108
spelling Pastina, Maria MartaGuimarães, Lauro José MoreiraFerreira, AdésioMarçal, Tiago de SouzaSantos, Pedro Henrique Araújo DinizSouza, Tércio da Silva de2018-08-01T22:57:26Z2018-08-012018-08-01T22:57:26Z2016-06-30Maize (Zea mays L.), is a specie from the Poaceae family, diploid and allogamous. In this culture, there is an increase with the accumulation of heterozygous loci, thus justifying hybrids productions. Due to drastic predictions of climate change and population growth in the coming years, it is necessary to adopt, develop and enhance methods that allow a greater efficiency in the selection and achieve greater genetic progress in crop improvement programs of agriculture importance that can help mitigation of challenges to sustain the food security of this century. Therefore, the objective of this study was to implement the algorithms of first and second derivatives for the REML (restricted maximum likelihood) method in R, generalizable for different mixed linear models and enable incorporate arrays of relationship. Moreover, to evaluate the impact of mathematical simplifications, sparse matrices and different convergence error rates in computational efficiency of these algorithms aiming to minimize the computational cost to enable REML in studies with a great number of maize hybrids and complex models, in computers with simple setup. The experimental data used in this study was obtained from harvest 2013/14 conducted in a randomized block design with five controls and 3352 simple maize hybrids in Embrapa (Empresa Brasileira de Pesquisa Agropecuária) Maize and Sorghum in the city of Sete Lagoas- MG. The analyzed variable was grain yield, which is subjected to analysis using mixed models with and without pedigree of incorporation using different REML algorithms, in R. Computation response evaluated the convergence criteria, error rates convergence, sparse matrices, computers with different processing capabilities, different initial estimates of variance components and increasing number of EM (Expectation Maximization) steps in combined algorithms. The proposed algorithms were equivalent for the tested software (ASReml, Selegen and Ime4) and the estimates of variance components indicating their coherence. Furthermore, the use of sparse matrices in association with the proposed optimizations, reduced the computational cost of the algorithms using coefficients of determination as a convergence criteria and convergence error rate equal to 10-5. The hybrid combination of EM algorithm, in ten steps, with NR (Newton Raphson) reduced the computational cost and increased the average convergence percentage. Although, it was observed that uniform weights for the initial estimates of the variance components should be avoided.O milho (Zea mays L.) é uma espécie da família Poaceae, diplóide e alógama. Para esta cultura verifica-se o aumento do vigor com o acúmulo de loci heterozigotos, justificando assim a produção dos híbridos. Com o advento das drásticas previsões de mudanças climáticas e aumento populacional para os próximos anos é necessária à adoção, desenvolvimento e aprimoração de métodos que permitam maior eficiência na seleção e alcance de maior progresso genético em programas de melhoramento de culturas de importância agrícola poderão auxiliar na mitigação dos desafios para sustentar a segurança alimentar ainda neste século. Diante do exposto, este trabalho teve por objetivo implementar os algoritmos de primeira e segunda derivadas para o método REML (máxima verossimilhança restrita) em R, generalizáveis para diferentes modelos lineares mistos e capazes de incorporar matrizes de parentesco. Além de avaliar o impacto de simplificações matemáticas, matrizes esparsas, e diferentes taxas de erro de convergência na eficiência computacional destes algoritmos, visando a minimização do custo computacional para viabilizar o REML, em estudos com grande número de híbridos de milho e modelos complexos, em computadores de configuração simples. Os dados experimentais utilizados neste trabalho foram obtidos na safra 2013/14 em ensaio conduzido no delineamento de blocos aumentados com cinco testemunhas e 3352 híbridos simples de milho na Embrapa (Empresa Brasileira de Pesquisa Agropecuária) Milho e Sorgo situada em Sete Lagoas - MG. A variável analisada foi o rendimento de grãos, sendo esta submetida a análise através de modelos mistos com e sem a incorporação do pedigree utilizando-se diferentes algoritmos REML, em R, e a resposta computacional foi avaliada quanto aos critérios de convergência, taxas de erro de convergência, matrizes esparsas, computadores com diferentes capacidades de processamento, diferentes estimativas iniciais dos componentes de variância e número crescente de passos EM (Expectation Maximization) nos algoritmos combinados. Os algoritmos propostos foram equivalentes aos softwares testados (ASReml, Selegen e lme4) quanto as estimativas dos componentes de variância, indicando a coerência dos mesmos. Além disso, o uso de matrizes esparsas em associação com as otimizações propostas diminuíram o custo computacional dos algoritmos utilizando os coeficientes de determinação como critério de convergência e taxa de erro de convergência igual a 10-5. A combinação híbrida do algoritmo EM, em dez passos, com o NR (Newton Raphson) reduziu o custo computacional e aumentou o percentual de convergência médio. Ainda observou-se que pesos uniformes para as estimativas iniciais dos componentes de variância devem ser evitados.Texthttp://repositorio.ufes.br/handle/10/7836porUniversidade Federal do Espírito SantoMestrado em Genética e MelhoramentoPrograma de Pós-Graduação em Genética e MelhoramentoUFESBRTopcrossAlgorithmsZea maysAlgoritmosREMLBLUPZea maysMilhoAlgorítmos computacionaisMelhoramento vegetalMelhoramento Vegetal631.523Aspectos Computacionais da Estimação e Predição em Modelos Lineares Mistos para Seleção de Híbridos de Milho em Ensaios Premilinaresinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)instname:Universidade Federal do Espírito Santo (UFES)instacron:UFESORIGINALtese_10029_Dissertação Final Tiago de Souza Marçal.pdfapplication/pdf1829947http://repositorio.ufes.br/bitstreams/115fcc07-b12f-4ec6-86de-d825a315edee/download97df059fea5ce8331745b5840ac8d15cMD5110/78362024-06-24 10:17:35.399oai:repositorio.ufes.br:10/7836http://repositorio.ufes.brRepositório InstitucionalPUBhttp://repositorio.ufes.br/oai/requestopendoar:21082024-07-11T14:35:25.491306Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) - Universidade Federal do Espírito Santo (UFES)false
dc.title.none.fl_str_mv Aspectos Computacionais da Estimação e Predição em Modelos Lineares Mistos para Seleção de Híbridos de Milho em Ensaios Premilinares
title Aspectos Computacionais da Estimação e Predição em Modelos Lineares Mistos para Seleção de Híbridos de Milho em Ensaios Premilinares
spellingShingle Aspectos Computacionais da Estimação e Predição em Modelos Lineares Mistos para Seleção de Híbridos de Milho em Ensaios Premilinares
Marçal, Tiago de Souza
Topcross
Algorithms
Zea mays
Algoritmos
REML
BLUP
Zea mays
Melhoramento Vegetal
Milho
Algorítmos computacionais
Melhoramento vegetal
631.523
title_short Aspectos Computacionais da Estimação e Predição em Modelos Lineares Mistos para Seleção de Híbridos de Milho em Ensaios Premilinares
title_full Aspectos Computacionais da Estimação e Predição em Modelos Lineares Mistos para Seleção de Híbridos de Milho em Ensaios Premilinares
title_fullStr Aspectos Computacionais da Estimação e Predição em Modelos Lineares Mistos para Seleção de Híbridos de Milho em Ensaios Premilinares
title_full_unstemmed Aspectos Computacionais da Estimação e Predição em Modelos Lineares Mistos para Seleção de Híbridos de Milho em Ensaios Premilinares
title_sort Aspectos Computacionais da Estimação e Predição em Modelos Lineares Mistos para Seleção de Híbridos de Milho em Ensaios Premilinares
author Marçal, Tiago de Souza
author_facet Marçal, Tiago de Souza
author_role author
dc.contributor.advisor-co1.fl_str_mv Pastina, Maria Marta
dc.contributor.advisor-co2.fl_str_mv Guimarães, Lauro José Moreira
dc.contributor.advisor1.fl_str_mv Ferreira, Adésio
dc.contributor.author.fl_str_mv Marçal, Tiago de Souza
dc.contributor.referee1.fl_str_mv Santos, Pedro Henrique Araújo Diniz
dc.contributor.referee2.fl_str_mv Souza, Tércio da Silva de
contributor_str_mv Pastina, Maria Marta
Guimarães, Lauro José Moreira
Ferreira, Adésio
Santos, Pedro Henrique Araújo Diniz
Souza, Tércio da Silva de
dc.subject.eng.fl_str_mv Topcross
Algorithms
Zea mays
topic Topcross
Algorithms
Zea mays
Algoritmos
REML
BLUP
Zea mays
Melhoramento Vegetal
Milho
Algorítmos computacionais
Melhoramento vegetal
631.523
dc.subject.por.fl_str_mv Algoritmos
REML
BLUP
Zea mays
dc.subject.cnpq.fl_str_mv Melhoramento Vegetal
dc.subject.br-rjbn.none.fl_str_mv Milho
Algorítmos computacionais
Melhoramento vegetal
dc.subject.udc.none.fl_str_mv 631.523
description Maize (Zea mays L.), is a specie from the Poaceae family, diploid and allogamous. In this culture, there is an increase with the accumulation of heterozygous loci, thus justifying hybrids productions. Due to drastic predictions of climate change and population growth in the coming years, it is necessary to adopt, develop and enhance methods that allow a greater efficiency in the selection and achieve greater genetic progress in crop improvement programs of agriculture importance that can help mitigation of challenges to sustain the food security of this century. Therefore, the objective of this study was to implement the algorithms of first and second derivatives for the REML (restricted maximum likelihood) method in R, generalizable for different mixed linear models and enable incorporate arrays of relationship. Moreover, to evaluate the impact of mathematical simplifications, sparse matrices and different convergence error rates in computational efficiency of these algorithms aiming to minimize the computational cost to enable REML in studies with a great number of maize hybrids and complex models, in computers with simple setup. The experimental data used in this study was obtained from harvest 2013/14 conducted in a randomized block design with five controls and 3352 simple maize hybrids in Embrapa (Empresa Brasileira de Pesquisa Agropecuária) Maize and Sorghum in the city of Sete Lagoas- MG. The analyzed variable was grain yield, which is subjected to analysis using mixed models with and without pedigree of incorporation using different REML algorithms, in R. Computation response evaluated the convergence criteria, error rates convergence, sparse matrices, computers with different processing capabilities, different initial estimates of variance components and increasing number of EM (Expectation Maximization) steps in combined algorithms. The proposed algorithms were equivalent for the tested software (ASReml, Selegen and Ime4) and the estimates of variance components indicating their coherence. Furthermore, the use of sparse matrices in association with the proposed optimizations, reduced the computational cost of the algorithms using coefficients of determination as a convergence criteria and convergence error rate equal to 10-5. The hybrid combination of EM algorithm, in ten steps, with NR (Newton Raphson) reduced the computational cost and increased the average convergence percentage. Although, it was observed that uniform weights for the initial estimates of the variance components should be avoided.
publishDate 2016
dc.date.issued.fl_str_mv 2016-06-30
dc.date.accessioned.fl_str_mv 2018-08-01T22:57:26Z
dc.date.available.fl_str_mv 2018-08-01
2018-08-01T22:57:26Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://repositorio.ufes.br/handle/10/7836
url http://repositorio.ufes.br/handle/10/7836
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv Text
dc.publisher.none.fl_str_mv Universidade Federal do Espírito Santo
Mestrado em Genética e Melhoramento
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Genética e Melhoramento
dc.publisher.initials.fl_str_mv UFES
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv Universidade Federal do Espírito Santo
Mestrado em Genética e Melhoramento
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
instname:Universidade Federal do Espírito Santo (UFES)
instacron:UFES
instname_str Universidade Federal do Espírito Santo (UFES)
instacron_str UFES
institution UFES
reponame_str Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
collection Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
bitstream.url.fl_str_mv http://repositorio.ufes.br/bitstreams/115fcc07-b12f-4ec6-86de-d825a315edee/download
bitstream.checksum.fl_str_mv 97df059fea5ce8331745b5840ac8d15c
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) - Universidade Federal do Espírito Santo (UFES)
repository.mail.fl_str_mv
_version_ 1813022615692902400