Tópicos em regularização com uma aplicação em Seleção Genômica

Detalhes bibliográficos
Autor(a) principal: Sousa, Pedro Henrique Toledo de Oliveira
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UnB
Texto Completo: http://repositorio.unb.br/handle/10482/35437
Resumo: Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2019.
id UNB_2e9f2f722a852d40631c513971c31871
oai_identifier_str oai:repositorio2.unb.br:10482/35437
network_acronym_str UNB
network_name_str Repositório Institucional da UnB
repository_id_str
spelling Sousa, Pedro Henrique Toledo de OliveiraAndrade, Bernardo Borba deAndrade, Joanlise Marco de Leon2019-09-16T11:36:07Z2019-09-16T11:36:07Z2019-09-162019-03-21SOUSA, Pedro Henrique Toledo de Oliveira. Tópicos em regularização com uma aplicação em Seleção Genômica. 2019. 95 f., il. Dissertação (Mestrado em Estatística)—Universidade de Brasília, Brasília, 2019.http://repositorio.unb.br/handle/10482/35437Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2019.Os métodos de regularização foram desenvolvidos para contornar problemas de overfitting e são amplamente utilizados em modelagens preditivas. Neste trabalho realiza-se uma breve introdução sobre a álgebra de matrizes relacionada a tais métodos, com ênfase nas inversas generalizadas, no posto e nas possíveis dimensões dessas matrizes, bem como apresentar uma solução geral, para sistemas lineares consistentes e inconsistentes. Em seguida, as decomposições de matrizes SVD (Singular Value Decomposition) e GSVD (Generalized Singular Value Decomposition) são utilizadas para a implementação dos modelos de regularização Tikhonov e TSVD e, posteriormente, analisa-se outros dois métodos de regularização (LASSO e LASSO Bayesiano), que estimam os coeficientes e simultaneamente realizam a seleção de variáveis. Como aplicação, realiza-se uma avaliação da qualidade preditiva dos modelos de regularização no contexto de Seleção Genômica em dados genéticos superdimensionados e de alta complexidade. Os referidos dados caracterizam-se por conter informações do DNA (genótipos) de plantas de eucalipto e a finalidade da análise é desenvolver uma abordagem alternativa aos programas de melhoramento genético tradicionais. Em resumo, os resultados mostram que os modelos para fenótipos com maior herdabilidade apresentam medidas de previsão superiores. Por fim, os métodos que conduzem a seleção de variáveis se mostraram superioridade nas tarefas preditivas em todos os casos avaliados.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES).Regularization methods have been developed to overcome overfitting and are widely used in predictive modeling. This study introduces the matrix algebra related to such methods, with emphasis on the generalized inverse, the rank and the possible dimensions of those matrices, while presenting a general solution for consistent and inconsistent linear systems. Next, it employs the SVD (Singular Value Decomposition) and GSVD (Generalized Singular Value Decomposition) matrix decompositions to implement the Tikhonov and TSVD regularization models, and then analyzes two other regularization methods – namely, LASSO and Bayesian LASSO – that estimate the coefficients and simultaneously perform the variable selection. In addition, the study conducts an evaluation of the predictive accuracy of the models applied to complex high-dimensional data in the context of Genomic Selection. The data contains DNA information (genotypes) from eucalyptus plants, and the purpose of the analysis is to develop an alternative approach to the traditional programs for genetic improvement of species. In summary, the results show that models which were applied using phenotypes with higher heritability have better predictive ability. The methods that conduct variable selection were superior in the predictive tasks for all evaluated cases.Instituto de Ciências Exatas (IE)Departamento de Estatística (IE EST)Programa de Pós-Graduação em EstatísticaA concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.info:eu-repo/semantics/openAccessTópicos em regularização com uma aplicação em Seleção Genômicainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisModelagem matemáticaSeleção de variáveisValidação cruzadaEucalipto - melhoramento genéticoporreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNBORIGINAL2019_PedroHenriqueToledodeOliveiraSousa.pdf2019_PedroHenriqueToledodeOliveiraSousa.pdfapplication/pdf1263627http://repositorio2.unb.br/jspui/bitstream/10482/35437/1/2019_PedroHenriqueToledodeOliveiraSousa.pdf40932ba3d1b87c57116fc6eb0666c137MD51open accessLICENSElicense.txtlicense.txttext/plain671http://repositorio2.unb.br/jspui/bitstream/10482/35437/2/license.txtbacfee268cc5d4f6aaa2e6e0066d38f5MD52open access10482/354372024-03-01 13:22:36.893open accessoai:repositorio2.unb.br:10482/35437QSBjb25jZXNzw6NvIGRhIGxpY2Vuw6dhIGRlc3RlIGl0ZW0gcmVmZXJlLXNlIGFvIHRlcm1vIGRlIGF1dG9yaXphw6fDo28gaW1wcmVzc28gYXNzaW5hZG8gDQpwZWxvIGF1dG9yIGNvbSBhcyBzZWd1aW50ZXMgY29uZGnDp8O1ZXM6DQoNCk5hIHF1YWxpZGFkZSBkZSB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBkYSBwdWJsaWNhw6fDo28sIGF1dG9yaXpvIGEgVW5pdmVyc2lkYWRlIGRlIEJyYXPDrWxpYQ0KIGUgbyBJQklDVCBhIGRpc3BvbmliaWxpemFyIHBvciBtZWlvIGRvcyBzaXRlcyB3d3cuYmNlLnVuYi5iciwgd3d3LmliaWN0LmJyLA0KIGh0dHA6Ly9oZXJjdWxlcy52dGxzLmNvbS9jZ2ktYmluL25kbHRkL2NoYW1lbGVvbj9sbmc9cHQmc2tpbj1uZGx0ZCBzZW0gcmVzc2FyY2ltZW50byBkb3MgDQpkaXJlaXRvcyBhdXRvcmFpcywgZGUgYWNvcmRvIGNvbSBhIExlaSBuwrogOTYxMC85OCwgbyB0ZXh0byBpbnRlZ3JhbCBkYSBvYnJhIGRpc3BvbmliaWxpemFkYSwNCiBjb25mb3JtZSBwZXJtaXNzw7VlcyBhc3NpbmFsYWRhcywgcGFyYSBmaW5zIGRlIGxlaXR1cmEsIGltcHJlc3PDo28gZS9vdSBkb3dubG9hZCwgYSB0w610dWxvIGRlIA0KZGl2dWxnYcOnw6NvIGRhIHByb2R1w6fDo28gY2llbnTDrWZpY2EgYnJhc2lsZWlyYSwgYSBwYXJ0aXIgZGVzdGEgZGF0YS4=Biblioteca Digital de Teses e DissertaçõesPUBhttps://repositorio.unb.br/oai/requestopendoar:2024-03-01T16:22:36Repositório Institucional da UnB - Universidade de Brasília (UnB)false
dc.title.pt_BR.fl_str_mv Tópicos em regularização com uma aplicação em Seleção Genômica
title Tópicos em regularização com uma aplicação em Seleção Genômica
spellingShingle Tópicos em regularização com uma aplicação em Seleção Genômica
Sousa, Pedro Henrique Toledo de Oliveira
Modelagem matemática
Seleção de variáveis
Validação cruzada
Eucalipto - melhoramento genético
title_short Tópicos em regularização com uma aplicação em Seleção Genômica
title_full Tópicos em regularização com uma aplicação em Seleção Genômica
title_fullStr Tópicos em regularização com uma aplicação em Seleção Genômica
title_full_unstemmed Tópicos em regularização com uma aplicação em Seleção Genômica
title_sort Tópicos em regularização com uma aplicação em Seleção Genômica
author Sousa, Pedro Henrique Toledo de Oliveira
author_facet Sousa, Pedro Henrique Toledo de Oliveira
author_role author
dc.contributor.advisorco.none.fl_str_mv Andrade, Bernardo Borba de
dc.contributor.author.fl_str_mv Sousa, Pedro Henrique Toledo de Oliveira
dc.contributor.advisor1.fl_str_mv Andrade, Joanlise Marco de Leon
contributor_str_mv Andrade, Joanlise Marco de Leon
dc.subject.keyword.pt_BR.fl_str_mv Modelagem matemática
Seleção de variáveis
Validação cruzada
Eucalipto - melhoramento genético
topic Modelagem matemática
Seleção de variáveis
Validação cruzada
Eucalipto - melhoramento genético
description Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2019.
publishDate 2019
dc.date.submitted.none.fl_str_mv 2019-03-21
dc.date.accessioned.fl_str_mv 2019-09-16T11:36:07Z
dc.date.available.fl_str_mv 2019-09-16T11:36:07Z
dc.date.issued.fl_str_mv 2019-09-16
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SOUSA, Pedro Henrique Toledo de Oliveira. Tópicos em regularização com uma aplicação em Seleção Genômica. 2019. 95 f., il. Dissertação (Mestrado em Estatística)—Universidade de Brasília, Brasília, 2019.
dc.identifier.uri.fl_str_mv http://repositorio.unb.br/handle/10482/35437
identifier_str_mv SOUSA, Pedro Henrique Toledo de Oliveira. Tópicos em regularização com uma aplicação em Seleção Genômica. 2019. 95 f., il. Dissertação (Mestrado em Estatística)—Universidade de Brasília, Brasília, 2019.
url http://repositorio.unb.br/handle/10482/35437
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Repositório Institucional da UnB
collection Repositório Institucional da UnB
bitstream.url.fl_str_mv http://repositorio2.unb.br/jspui/bitstream/10482/35437/1/2019_PedroHenriqueToledodeOliveiraSousa.pdf
http://repositorio2.unb.br/jspui/bitstream/10482/35437/2/license.txt
bitstream.checksum.fl_str_mv 40932ba3d1b87c57116fc6eb0666c137
bacfee268cc5d4f6aaa2e6e0066d38f5
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv
_version_ 1801864222557077504