Aplicação de métodos de previsão e classificação em seleção genômica
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Monografias da UnB |
Texto Completo: | https://bdm.unb.br/handle/10483/25012 |
Resumo: | Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2018. |
id |
UNB-2_ae4ffbe0d762090e0879f25a7df7c917 |
---|---|
oai_identifier_str |
oai:bdm.unb.br:10483/25012 |
network_acronym_str |
UNB-2 |
network_name_str |
Biblioteca Digital de Monografias da UnB |
repository_id_str |
11571 |
spelling |
Vasconcelos, Ana Gabriela P. deAndrade, Joanlise Marco de LeonVASCONCELOS, Ana Gabriela P. de. Aplicação de métodos de previsão e classificação em seleção genômica. 2018. 62 f., il. Trabalho de Conclusão de Curso (Bacharelado em Estatística)—Universidade de Brasília, Brasília, 2018.https://bdm.unb.br/handle/10483/25012Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2018.Programas de melhoramento genético de árvores de floresta visam aumentar a qualidade e ganho econômico de suas plantações por meio de manipulação genética, porém essa tarefa envolve desafios como longos ciclos de cruzamento e altos custos de coleta de diversos fenótipos para largas populações. Nesse sentido, abordagens que avaliam valores genéticos de árvores jovens, sem a necessidade de fenotipagem, possuem o potencial de superar estes desafios. Uma delas é a Seleção Genômica, que consiste em utilizar informações moleculares para estimar efeitos de marcadores genéticos simultaneamente em todo o genoma da população de melhoramento, com base em um modelo de predição. O modelo, desenvolvido em uma população de treinamento com informações genotípicas e fenotípicas, é utilizado para obter os Genomic Estimated Breeding Values (GEBVs) baseados em informações apenas genotípicas de plantas candidatas. A análise destes GEBVs pode auxiliar os pesquisadores no processo de tomada de decisões. Portanto, a escolha do modelo é uma etapa essencial para melhorar o ganho genético e a habilidade preditiva. O presente estudo buscou comparar os modelos mistos de regressão e de máquinas de suporte vetoriais (SVMs) em dados de eucaliptos. Além disso estudou-se também fatores que influenciam as métricas obtidas por tais modelos, como características genéticas, qualidade dos fenótipos e efeitos de parentesco. Notou-se que os modelos para os fenótipos com maiores herdabilidades apresentaram medidas de previsão também superiores. Verificou-se que, de maneira geral, utilizar EBVs em vez de fenótipos como resposta do SVM pode acrescentar informações mais confiáveis, levando até, em alguns casos, a métricas superiores. Ainda foi possível verificar a importância de controlar os efeitos de parentesco por meio da validação cruzada para a obtenção de métricas menos otimistas, uma vez que os modelos serão utilizados com dados de novos indivíduos que não estavam presentes na população de treinamento. Por fim, observou-se que os modelos de regressão e de SVM apresentaram resultados consistentes, os quais evidenciaram que sua escolha deve depender do estudo em questão.Submitted by Jaedna Lins (jaednalins@bce.unb.br) on 2020-06-08T00:52:44Z No. of bitstreams: 1 2018_AnaGabrielaPVasconcelos_tcc.pdf: 3465172 bytes, checksum: 8bcdf43e8628ef3d7a342bd2436282de (MD5)Approved for entry into archive by Biblioteca Digital de Monografias Gerência (bdm@bce.unb.br) on 2020-07-28T22:19:50Z (GMT) No. of bitstreams: 1 2018_AnaGabrielaPVasconcelos_tcc.pdf: 3465172 bytes, checksum: 8bcdf43e8628ef3d7a342bd2436282de (MD5)Made available in DSpace on 2020-07-28T22:19:50Z (GMT). No. of bitstreams: 1 2018_AnaGabrielaPVasconcelos_tcc.pdf: 3465172 bytes, checksum: 8bcdf43e8628ef3d7a342bd2436282de (MD5)Tree improvement programs aim to economically increase forest productivity and quality through genetic manipulation. However, this task involves challenges such as lengthy breeding cycles and high costs of phenotyping large progeny trials for several traits. Thus, approaches that evaluate breeding values of trees early in life, without the need to phenotype, have the potential to help overcome these challenges. One of them is Genomic Selection (GS), which consists in using molecular genetic information to estimate marker effects simultaneously across the whole genome of the breeding population, based on a prediction model. The prediction model, developed in a training sample with both genotype and phenotype data, is then used to calculate Genomic Estimated Breeding Values (GEBV) of selection candidates (based only on genotypes in the testing sample), which can guide the breeders during the decision-making process. Therefore, developing GS models is an essential step to improve the genetic gain and the predictive ability. In this study, Ridge Regression models and Support Vector Machines algorithms were compared using data from 999 Eucalyptus trees sampled from a progeny trial in an elite breeding population. Also, factors that can influence metrics obtained by these models were studied, such as quality of measurements of phenotypes and relationship effects. Models for phenotypes with higher heritability showed better prediction ability. In general, using EBVs instead of deregressed phenotypes as SVM’s response variable can add more reliable information, leading, in some cases, to higher metrics. Also, was verified the importance of controlling family effects through cross validation to obtain less optimistic predictive measures, since the models will be used to predict data from new individuals, not present in the training population. Finally, both SVM and regression models showed consistent and similar results, which demonstrated that their choice depends on the study.A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.info:eu-repo/semantics/openAccessSeleção genômicaEucaliptoMelhoramento genéticoAprendizado de máquinaRegressão ridgeValidação cruzadaSVM (Support Vector Machines)Aplicação de métodos de previsão e classificação em seleção genômicainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis2020-07-28T22:19:50Z2020-07-28T22:19:50Z2018-06-20porreponame:Biblioteca Digital de Monografias da UnBinstname:Universidade de Brasília (UnB)instacron:UNBLICENSElicense.txtlicense.txttext/plain1817http://bdm.unb.br/xmlui/bitstream/10483/25012/2/license.txt21554873e56ad8ddc69c092699b98f95MD52ORIGINAL2018_AnaGabrielaPVasconcelos_tcc.pdf2018_AnaGabrielaPVasconcelos_tcc.pdfapplication/pdf3465172http://bdm.unb.br/xmlui/bitstream/10483/25012/1/2018_AnaGabrielaPVasconcelos_tcc.pdf8bcdf43e8628ef3d7a342bd2436282deMD5110483/250122022-03-22 10:36:19.872oai:bdm.unb.br:10483/25012w4kgbmVjZXNzw6FyaW8gY29uY29yZGFyIGNvbSBhIGxpY2Vuw6dhIGRlIGRpc3RyaWJ1acOnw6NvIG7Do28tZXhjbHVzaXZhLAphbnRlcyBxdWUgbyBkb2N1bWVudG8gcG9zc2EgYXBhcmVjZXIgbmEgQmlibGlvdGVjYSBEaWdpdGFsIGRhIFByb2R1w6fDo28gCkRpc2NlbnRlIGRhIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEuIFBvciBmYXZvciwgbGVpYSBhCmxpY2Vuw6dhIGF0ZW50YW1lbnRlLiBDYXNvIG5lY2Vzc2l0ZSBkZSBhbGd1bSBlc2NsYXJlY2ltZW50byBlbnRyZSBlbQpjb250YXRvIGF0cmF2w6lzIGRlOiBiZG1AYmNlLnVuYi5iciBvdSAzMTA3LTI2ODcuCgpMSUNFTsOHQSBERSBESVNUUklCVUnDh8ODTyBOw4NPLUVYQ0xVU0lWQQoKQW8gYXNzaW5hciBlIGVudHJlZ2FyIGVzdGEgbGljZW7Dp2EsIG8vYSBTci4vU3JhLiAoYXV0b3Igb3UgZGV0ZW50b3IgZG9zCmRpcmVpdG9zIGRlIGF1dG9yKToKCmEpIENvbmNlZGUgw6AgVW5pdmVyc2lkYWRlIGRlIEJyYXPDrWxpYSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUKcmVwcm9kdXppciwgY29udmVydGVyIChjb21vIGRlZmluaWRvIGFiYWl4byksIGNvbXVuaWNhciBlL291CmRpc3RyaWJ1aXIgbyBkb2N1bWVudG8gZW50cmVndWUgKGluY2x1aW5kbyBvIHJlc3Vtby9hYnN0cmFjdCkgZW0KZm9ybWF0byBkaWdpdGFsIG91IGltcHJlc3NvIGUgZW0gcXVhbHF1ZXIgbWVpby4KCmIpIERlY2xhcmEgcXVlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUKZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYQp0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50byBsaGUgw6kKcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBvdXRyYSBwZXNzb2Egb3UgZW50aWRhZGUuCgpjKSBTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSBjb250w6ltIG1hdGVyaWFsIGRvIHF1YWwgbsOjbyBkZXTDqW0gb3MKZGlyZWl0b3MgZGUgYXV0b3IsIGRlY2xhcmEgcXVlIG9idGV2ZSBhdXRvcml6YcOnw6NvIGRvIGRldGVudG9yIGRvcwpkaXJlaXRvcyBkZSBhdXRvciBwYXJhIGNvbmNlZGVyIMOgIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEgb3MgZGlyZWl0b3MKcmVxdWVyaWRvcyBwb3IgZXN0YSBsaWNlbsOnYSwgZSBxdWUgZXNzZSBtYXRlcmlhbCBjdWpvcyBkaXJlaXRvcyBzw6NvIGRlCnRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIG91CmNvbnRlw7pkbyBkbyBkb2N1bWVudG8gZW50cmVndWUuCgpTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBiYXNlYWRvIGVtIHRyYWJhbGhvIGZpbmFuY2lhZG8gb3UgYXBvaWFkbwpwb3Igb3V0cmEgaW5zdGl0dWnDp8OjbyBxdWUgbsOjbyBhIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEsIGRlY2xhcmEgcXVlCmN1bXByaXUgcXVhaXNxdWVyIG9icmlnYcOnw7VlcyBleGlnaWRhcyBwZWxvIHJlc3BlY3Rpdm8gY29udHJhdG8gb3UKYWNvcmRvLgoKQSBVbml2ZXJzaWRhZGUgZGUgQnJhc8OtbGlhIGlkZW50aWZpY2Fyw6EgY2xhcmFtZW50ZSBvKHMpIHNldSAocykgbm9tZSAocykKY29tbyBvIChzKSBhdXRvciAoZXMpIG91IGRldGVudG9yIChlcykgZG9zIGRpcmVpdG9zIGRvIGRvY3VtZW50bwplbnRyZWd1ZSwgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBwYXJhIGFsw6ltIGRhcyBwZXJtaXRpZGFzIHBvcgplc3RhIGxpY2Vuw6dhLgo=Biblioteca Digital de Monografiahttps://bdm.unb.br/PUBhttp://bdm.unb.br/oai/requestbdm@bce.unb.br||patricia@bce.unb.bropendoar:115712022-03-22T13:36:19Biblioteca Digital de Monografias da UnB - Universidade de Brasília (UnB)false |
dc.title.pt_BR.fl_str_mv |
Aplicação de métodos de previsão e classificação em seleção genômica |
title |
Aplicação de métodos de previsão e classificação em seleção genômica |
spellingShingle |
Aplicação de métodos de previsão e classificação em seleção genômica Vasconcelos, Ana Gabriela P. de Seleção genômica Eucalipto Melhoramento genético Aprendizado de máquina Regressão ridge Validação cruzada SVM (Support Vector Machines) |
title_short |
Aplicação de métodos de previsão e classificação em seleção genômica |
title_full |
Aplicação de métodos de previsão e classificação em seleção genômica |
title_fullStr |
Aplicação de métodos de previsão e classificação em seleção genômica |
title_full_unstemmed |
Aplicação de métodos de previsão e classificação em seleção genômica |
title_sort |
Aplicação de métodos de previsão e classificação em seleção genômica |
author |
Vasconcelos, Ana Gabriela P. de |
author_facet |
Vasconcelos, Ana Gabriela P. de |
author_role |
author |
dc.contributor.author.fl_str_mv |
Vasconcelos, Ana Gabriela P. de |
dc.contributor.advisor1.fl_str_mv |
Andrade, Joanlise Marco de Leon |
contributor_str_mv |
Andrade, Joanlise Marco de Leon |
dc.subject.keyword.pt_BR.fl_str_mv |
Seleção genômica Eucalipto Melhoramento genético Aprendizado de máquina Regressão ridge Validação cruzada SVM (Support Vector Machines) |
topic |
Seleção genômica Eucalipto Melhoramento genético Aprendizado de máquina Regressão ridge Validação cruzada SVM (Support Vector Machines) |
description |
Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2018. |
publishDate |
2018 |
dc.date.submitted.none.fl_str_mv |
2018-06-20 |
dc.date.accessioned.fl_str_mv |
2020-07-28T22:19:50Z |
dc.date.available.fl_str_mv |
2020-07-28T22:19:50Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
VASCONCELOS, Ana Gabriela P. de. Aplicação de métodos de previsão e classificação em seleção genômica. 2018. 62 f., il. Trabalho de Conclusão de Curso (Bacharelado em Estatística)—Universidade de Brasília, Brasília, 2018. |
dc.identifier.uri.fl_str_mv |
https://bdm.unb.br/handle/10483/25012 |
identifier_str_mv |
VASCONCELOS, Ana Gabriela P. de. Aplicação de métodos de previsão e classificação em seleção genômica. 2018. 62 f., il. Trabalho de Conclusão de Curso (Bacharelado em Estatística)—Universidade de Brasília, Brasília, 2018. |
url |
https://bdm.unb.br/handle/10483/25012 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Monografias da UnB instname:Universidade de Brasília (UnB) instacron:UNB |
instname_str |
Universidade de Brasília (UnB) |
instacron_str |
UNB |
institution |
UNB |
reponame_str |
Biblioteca Digital de Monografias da UnB |
collection |
Biblioteca Digital de Monografias da UnB |
bitstream.url.fl_str_mv |
http://bdm.unb.br/xmlui/bitstream/10483/25012/2/license.txt http://bdm.unb.br/xmlui/bitstream/10483/25012/1/2018_AnaGabrielaPVasconcelos_tcc.pdf |
bitstream.checksum.fl_str_mv |
21554873e56ad8ddc69c092699b98f95 8bcdf43e8628ef3d7a342bd2436282de |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Monografias da UnB - Universidade de Brasília (UnB) |
repository.mail.fl_str_mv |
bdm@bce.unb.br||patricia@bce.unb.br |
_version_ |
1801493116911353856 |