Aplicação de métodos de previsão e classificação em seleção genômica

Detalhes bibliográficos
Autor(a) principal: Vasconcelos, Ana Gabriela P. de
Data de Publicação: 2018
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Biblioteca Digital de Monografias da UnB
Texto Completo: https://bdm.unb.br/handle/10483/25012
Resumo: Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2018.
id UNB-2_ae4ffbe0d762090e0879f25a7df7c917
oai_identifier_str oai:bdm.unb.br:10483/25012
network_acronym_str UNB-2
network_name_str Biblioteca Digital de Monografias da UnB
repository_id_str 11571
spelling Vasconcelos, Ana Gabriela P. deAndrade, Joanlise Marco de LeonVASCONCELOS, Ana Gabriela P. de. Aplicação de métodos de previsão e classificação em seleção genômica. 2018. 62 f., il. Trabalho de Conclusão de Curso (Bacharelado em Estatística)—Universidade de Brasília, Brasília, 2018.https://bdm.unb.br/handle/10483/25012Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2018.Programas de melhoramento genético de árvores de floresta visam aumentar a qualidade e ganho econômico de suas plantações por meio de manipulação genética, porém essa tarefa envolve desafios como longos ciclos de cruzamento e altos custos de coleta de diversos fenótipos para largas populações. Nesse sentido, abordagens que avaliam valores genéticos de árvores jovens, sem a necessidade de fenotipagem, possuem o potencial de superar estes desafios. Uma delas é a Seleção Genômica, que consiste em utilizar informações moleculares para estimar efeitos de marcadores genéticos simultaneamente em todo o genoma da população de melhoramento, com base em um modelo de predição. O modelo, desenvolvido em uma população de treinamento com informações genotípicas e fenotípicas, é utilizado para obter os Genomic Estimated Breeding Values (GEBVs) baseados em informações apenas genotípicas de plantas candidatas. A análise destes GEBVs pode auxiliar os pesquisadores no processo de tomada de decisões. Portanto, a escolha do modelo é uma etapa essencial para melhorar o ganho genético e a habilidade preditiva. O presente estudo buscou comparar os modelos mistos de regressão e de máquinas de suporte vetoriais (SVMs) em dados de eucaliptos. Além disso estudou-se também fatores que influenciam as métricas obtidas por tais modelos, como características genéticas, qualidade dos fenótipos e efeitos de parentesco. Notou-se que os modelos para os fenótipos com maiores herdabilidades apresentaram medidas de previsão também superiores. Verificou-se que, de maneira geral, utilizar EBVs em vez de fenótipos como resposta do SVM pode acrescentar informações mais confiáveis, levando até, em alguns casos, a métricas superiores. Ainda foi possível verificar a importância de controlar os efeitos de parentesco por meio da validação cruzada para a obtenção de métricas menos otimistas, uma vez que os modelos serão utilizados com dados de novos indivíduos que não estavam presentes na população de treinamento. Por fim, observou-se que os modelos de regressão e de SVM apresentaram resultados consistentes, os quais evidenciaram que sua escolha deve depender do estudo em questão.Submitted by Jaedna Lins (jaednalins@bce.unb.br) on 2020-06-08T00:52:44Z No. of bitstreams: 1 2018_AnaGabrielaPVasconcelos_tcc.pdf: 3465172 bytes, checksum: 8bcdf43e8628ef3d7a342bd2436282de (MD5)Approved for entry into archive by Biblioteca Digital de Monografias Gerência (bdm@bce.unb.br) on 2020-07-28T22:19:50Z (GMT) No. of bitstreams: 1 2018_AnaGabrielaPVasconcelos_tcc.pdf: 3465172 bytes, checksum: 8bcdf43e8628ef3d7a342bd2436282de (MD5)Made available in DSpace on 2020-07-28T22:19:50Z (GMT). No. of bitstreams: 1 2018_AnaGabrielaPVasconcelos_tcc.pdf: 3465172 bytes, checksum: 8bcdf43e8628ef3d7a342bd2436282de (MD5)Tree improvement programs aim to economically increase forest productivity and quality through genetic manipulation. However, this task involves challenges such as lengthy breeding cycles and high costs of phenotyping large progeny trials for several traits. Thus, approaches that evaluate breeding values of trees early in life, without the need to phenotype, have the potential to help overcome these challenges. One of them is Genomic Selection (GS), which consists in using molecular genetic information to estimate marker effects simultaneously across the whole genome of the breeding population, based on a prediction model. The prediction model, developed in a training sample with both genotype and phenotype data, is then used to calculate Genomic Estimated Breeding Values (GEBV) of selection candidates (based only on genotypes in the testing sample), which can guide the breeders during the decision-making process. Therefore, developing GS models is an essential step to improve the genetic gain and the predictive ability. In this study, Ridge Regression models and Support Vector Machines algorithms were compared using data from 999 Eucalyptus trees sampled from a progeny trial in an elite breeding population. Also, factors that can influence metrics obtained by these models were studied, such as quality of measurements of phenotypes and relationship effects. Models for phenotypes with higher heritability showed better prediction ability. In general, using EBVs instead of deregressed phenotypes as SVM’s response variable can add more reliable information, leading, in some cases, to higher metrics. Also, was verified the importance of controlling family effects through cross validation to obtain less optimistic predictive measures, since the models will be used to predict data from new individuals, not present in the training population. Finally, both SVM and regression models showed consistent and similar results, which demonstrated that their choice depends on the study.A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.info:eu-repo/semantics/openAccessSeleção genômicaEucaliptoMelhoramento genéticoAprendizado de máquinaRegressão ridgeValidação cruzadaSVM (Support Vector Machines)Aplicação de métodos de previsão e classificação em seleção genômicainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis2020-07-28T22:19:50Z2020-07-28T22:19:50Z2018-06-20porreponame:Biblioteca Digital de Monografias da UnBinstname:Universidade de Brasília (UnB)instacron:UNBLICENSElicense.txtlicense.txttext/plain1817http://bdm.unb.br/xmlui/bitstream/10483/25012/2/license.txt21554873e56ad8ddc69c092699b98f95MD52ORIGINAL2018_AnaGabrielaPVasconcelos_tcc.pdf2018_AnaGabrielaPVasconcelos_tcc.pdfapplication/pdf3465172http://bdm.unb.br/xmlui/bitstream/10483/25012/1/2018_AnaGabrielaPVasconcelos_tcc.pdf8bcdf43e8628ef3d7a342bd2436282deMD5110483/250122022-03-22 10:36:19.872oai:bdm.unb.br:10483/25012w4kgbmVjZXNzw6FyaW8gY29uY29yZGFyIGNvbSBhIGxpY2Vuw6dhIGRlIGRpc3RyaWJ1acOnw6NvIG7Do28tZXhjbHVzaXZhLAphbnRlcyBxdWUgbyBkb2N1bWVudG8gcG9zc2EgYXBhcmVjZXIgbmEgQmlibGlvdGVjYSBEaWdpdGFsIGRhIFByb2R1w6fDo28gCkRpc2NlbnRlIGRhIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEuIFBvciBmYXZvciwgbGVpYSBhCmxpY2Vuw6dhIGF0ZW50YW1lbnRlLiBDYXNvIG5lY2Vzc2l0ZSBkZSBhbGd1bSBlc2NsYXJlY2ltZW50byBlbnRyZSBlbQpjb250YXRvIGF0cmF2w6lzIGRlOiBiZG1AYmNlLnVuYi5iciBvdSAzMTA3LTI2ODcuCgpMSUNFTsOHQSBERSBESVNUUklCVUnDh8ODTyBOw4NPLUVYQ0xVU0lWQQoKQW8gYXNzaW5hciBlIGVudHJlZ2FyIGVzdGEgbGljZW7Dp2EsIG8vYSBTci4vU3JhLiAoYXV0b3Igb3UgZGV0ZW50b3IgZG9zCmRpcmVpdG9zIGRlIGF1dG9yKToKCmEpIENvbmNlZGUgw6AgVW5pdmVyc2lkYWRlIGRlIEJyYXPDrWxpYSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUKcmVwcm9kdXppciwgY29udmVydGVyIChjb21vIGRlZmluaWRvIGFiYWl4byksIGNvbXVuaWNhciBlL291CmRpc3RyaWJ1aXIgbyBkb2N1bWVudG8gZW50cmVndWUgKGluY2x1aW5kbyBvIHJlc3Vtby9hYnN0cmFjdCkgZW0KZm9ybWF0byBkaWdpdGFsIG91IGltcHJlc3NvIGUgZW0gcXVhbHF1ZXIgbWVpby4KCmIpIERlY2xhcmEgcXVlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUKZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYQp0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50byBsaGUgw6kKcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBvdXRyYSBwZXNzb2Egb3UgZW50aWRhZGUuCgpjKSBTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSBjb250w6ltIG1hdGVyaWFsIGRvIHF1YWwgbsOjbyBkZXTDqW0gb3MKZGlyZWl0b3MgZGUgYXV0b3IsIGRlY2xhcmEgcXVlIG9idGV2ZSBhdXRvcml6YcOnw6NvIGRvIGRldGVudG9yIGRvcwpkaXJlaXRvcyBkZSBhdXRvciBwYXJhIGNvbmNlZGVyIMOgIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEgb3MgZGlyZWl0b3MKcmVxdWVyaWRvcyBwb3IgZXN0YSBsaWNlbsOnYSwgZSBxdWUgZXNzZSBtYXRlcmlhbCBjdWpvcyBkaXJlaXRvcyBzw6NvIGRlCnRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIG91CmNvbnRlw7pkbyBkbyBkb2N1bWVudG8gZW50cmVndWUuCgpTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBiYXNlYWRvIGVtIHRyYWJhbGhvIGZpbmFuY2lhZG8gb3UgYXBvaWFkbwpwb3Igb3V0cmEgaW5zdGl0dWnDp8OjbyBxdWUgbsOjbyBhIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEsIGRlY2xhcmEgcXVlCmN1bXByaXUgcXVhaXNxdWVyIG9icmlnYcOnw7VlcyBleGlnaWRhcyBwZWxvIHJlc3BlY3Rpdm8gY29udHJhdG8gb3UKYWNvcmRvLgoKQSBVbml2ZXJzaWRhZGUgZGUgQnJhc8OtbGlhIGlkZW50aWZpY2Fyw6EgY2xhcmFtZW50ZSBvKHMpIHNldSAocykgbm9tZSAocykKY29tbyBvIChzKSBhdXRvciAoZXMpIG91IGRldGVudG9yIChlcykgZG9zIGRpcmVpdG9zIGRvIGRvY3VtZW50bwplbnRyZWd1ZSwgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBwYXJhIGFsw6ltIGRhcyBwZXJtaXRpZGFzIHBvcgplc3RhIGxpY2Vuw6dhLgo=Biblioteca Digital de Monografiahttps://bdm.unb.br/PUBhttp://bdm.unb.br/oai/requestbdm@bce.unb.br||patricia@bce.unb.bropendoar:115712022-03-22T13:36:19Biblioteca Digital de Monografias da UnB - Universidade de Brasília (UnB)false
dc.title.pt_BR.fl_str_mv Aplicação de métodos de previsão e classificação em seleção genômica
title Aplicação de métodos de previsão e classificação em seleção genômica
spellingShingle Aplicação de métodos de previsão e classificação em seleção genômica
Vasconcelos, Ana Gabriela P. de
Seleção genômica
Eucalipto
Melhoramento genético
Aprendizado de máquina
Regressão ridge
Validação cruzada
SVM (Support Vector Machines)
title_short Aplicação de métodos de previsão e classificação em seleção genômica
title_full Aplicação de métodos de previsão e classificação em seleção genômica
title_fullStr Aplicação de métodos de previsão e classificação em seleção genômica
title_full_unstemmed Aplicação de métodos de previsão e classificação em seleção genômica
title_sort Aplicação de métodos de previsão e classificação em seleção genômica
author Vasconcelos, Ana Gabriela P. de
author_facet Vasconcelos, Ana Gabriela P. de
author_role author
dc.contributor.author.fl_str_mv Vasconcelos, Ana Gabriela P. de
dc.contributor.advisor1.fl_str_mv Andrade, Joanlise Marco de Leon
contributor_str_mv Andrade, Joanlise Marco de Leon
dc.subject.keyword.pt_BR.fl_str_mv Seleção genômica
Eucalipto
Melhoramento genético
Aprendizado de máquina
Regressão ridge
Validação cruzada
SVM (Support Vector Machines)
topic Seleção genômica
Eucalipto
Melhoramento genético
Aprendizado de máquina
Regressão ridge
Validação cruzada
SVM (Support Vector Machines)
description Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2018.
publishDate 2018
dc.date.submitted.none.fl_str_mv 2018-06-20
dc.date.accessioned.fl_str_mv 2020-07-28T22:19:50Z
dc.date.available.fl_str_mv 2020-07-28T22:19:50Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv VASCONCELOS, Ana Gabriela P. de. Aplicação de métodos de previsão e classificação em seleção genômica. 2018. 62 f., il. Trabalho de Conclusão de Curso (Bacharelado em Estatística)—Universidade de Brasília, Brasília, 2018.
dc.identifier.uri.fl_str_mv https://bdm.unb.br/handle/10483/25012
identifier_str_mv VASCONCELOS, Ana Gabriela P. de. Aplicação de métodos de previsão e classificação em seleção genômica. 2018. 62 f., il. Trabalho de Conclusão de Curso (Bacharelado em Estatística)—Universidade de Brasília, Brasília, 2018.
url https://bdm.unb.br/handle/10483/25012
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Monografias da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Biblioteca Digital de Monografias da UnB
collection Biblioteca Digital de Monografias da UnB
bitstream.url.fl_str_mv http://bdm.unb.br/xmlui/bitstream/10483/25012/2/license.txt
http://bdm.unb.br/xmlui/bitstream/10483/25012/1/2018_AnaGabrielaPVasconcelos_tcc.pdf
bitstream.checksum.fl_str_mv 21554873e56ad8ddc69c092699b98f95
8bcdf43e8628ef3d7a342bd2436282de
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Monografias da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv bdm@bce.unb.br||patricia@bce.unb.br
_version_ 1801493116911353856