Splines de regressão adaptativa multivariada na predição genômica
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | LOCUS Repositório Institucional da UFV |
Texto Completo: | https://locus.ufv.br//handle/123456789/28157 |
Resumo: | A Seleção Genômica Ampla (SGA), proposta em 2001, é uma variação da Seleção Assistida por Marcadores (SAM) que prediz o valor genético genômico com base em marcadores distribuídos ao longo de todo o genoma. Desde sua proposição vários métodos estatísticos vêm sendo propostos para SGA, dentre os quais podemos destacar o Melhor Preditor Linear não Viesado Genômico (G-BLUP), uma das abordagens mais amplamente difundida devido a sua simplicidade e por permitir considerar efeitos não aditivos em seu ajuste. Uma metodologia ainda não explorada em SGA é a Splines de Regressão Adaptativa Multivariada (MARS). A MARS modela efeitos individuais e possíveis interações entre variáveis preditoras, podendo ser particularmente útil para SGA considerando efeitos não aditivos. Diante disso o objetivo deste trabalho é avaliar a utilização da MARS em SGA, considerando características quantitativas com efeitos não aditivos. Para isso, fez-se uso de um conjunto de dados simulados de 1000 indivíduos com 4010 marcadores SNPs e 12 cenários considerando efeitos não aditivos, definidos pela combinação de oito, 40, 80 ou 120 locus controladores e herdabilidade 0,3, 0,5 ou 0,8. Confrontou-se os resultados da MARS contra os resultados obtidos com o modelo ajustado G-BLUP considerando efeitos aditivos, aditivos e devido a dominância e aditivos e devido a epistasia aditiva-aditiva no que se refere à capacidade preditiva e ao coeficiente kappa de Cohen para seleção de indivíduos superiores. MARS apresentou resultados de capacidade preditiva superior a todos os modelos G-BLUP ajustado para os cenários de herdabilidade 0,3 e resultados semelhantes nos demais casos. Quanto ao coeficiente kappa de Cohen, MARS foi superior aos métodos G-BLUP em 11 dos 12 cenários avaliados. Portanto, MARS é uma metodologia que apresenta potencial para estudos em SGA. Palavras-chave: Regressão. Aprendizado estatístico. Seleção genômica ampla. Efeitos não aditivos. |
id |
UFV_42c40d6127b980233a5bf6bb32ce4609 |
---|---|
oai_identifier_str |
oai:locus.ufv.br:123456789/28157 |
network_acronym_str |
UFV |
network_name_str |
LOCUS Repositório Institucional da UFV |
repository_id_str |
2145 |
spelling |
Nascimento, Ana Carolina C.Azevedo, Camila FerreiraCeleri, Maurício de Oliveirahttp://lattes.cnpq.br/2569243563413784Nascimento, Moysés2021-08-31T18:45:19Z2021-08-31T18:45:19Z2020-10-27CELERI, Maurício de Oliveira. Splines de regressão adaptativa multivariada na predição genômica. 2020. 32 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa. 2020.https://locus.ufv.br//handle/123456789/28157A Seleção Genômica Ampla (SGA), proposta em 2001, é uma variação da Seleção Assistida por Marcadores (SAM) que prediz o valor genético genômico com base em marcadores distribuídos ao longo de todo o genoma. Desde sua proposição vários métodos estatísticos vêm sendo propostos para SGA, dentre os quais podemos destacar o Melhor Preditor Linear não Viesado Genômico (G-BLUP), uma das abordagens mais amplamente difundida devido a sua simplicidade e por permitir considerar efeitos não aditivos em seu ajuste. Uma metodologia ainda não explorada em SGA é a Splines de Regressão Adaptativa Multivariada (MARS). A MARS modela efeitos individuais e possíveis interações entre variáveis preditoras, podendo ser particularmente útil para SGA considerando efeitos não aditivos. Diante disso o objetivo deste trabalho é avaliar a utilização da MARS em SGA, considerando características quantitativas com efeitos não aditivos. Para isso, fez-se uso de um conjunto de dados simulados de 1000 indivíduos com 4010 marcadores SNPs e 12 cenários considerando efeitos não aditivos, definidos pela combinação de oito, 40, 80 ou 120 locus controladores e herdabilidade 0,3, 0,5 ou 0,8. Confrontou-se os resultados da MARS contra os resultados obtidos com o modelo ajustado G-BLUP considerando efeitos aditivos, aditivos e devido a dominância e aditivos e devido a epistasia aditiva-aditiva no que se refere à capacidade preditiva e ao coeficiente kappa de Cohen para seleção de indivíduos superiores. MARS apresentou resultados de capacidade preditiva superior a todos os modelos G-BLUP ajustado para os cenários de herdabilidade 0,3 e resultados semelhantes nos demais casos. Quanto ao coeficiente kappa de Cohen, MARS foi superior aos métodos G-BLUP em 11 dos 12 cenários avaliados. Portanto, MARS é uma metodologia que apresenta potencial para estudos em SGA. Palavras-chave: Regressão. Aprendizado estatístico. Seleção genômica ampla. Efeitos não aditivos.Proposed in 2001 the Genomic Wide Selection (GWS) is a variation of the Marker Assisted Selection (MAS) that predicts the genomic breeding values based on markers distributed throughout the wide genome. Since its proposition, several statistical methods have been proposed for GWS, among which we can cite the Genomic Best Linear Unbiased Prediction (G-BLUP), one of the most widespread approaches due to its simplicity and because it allows considering non-additive effects in its adjustment . A methodology not yet explored in GWS is the Multivariate Adaptive Regression Splines (MARS). The MARS modeling individual effects and possible interactions between predictor variables and can be particularly useful for GWS considering non-additive effects. Therefore, the aim of this work is to evaluate the use of MARS in GWS, considering quantitative characteristics with non-additive effects. We used a simulated data set of 1000 individuals with 4010 SNPs markers and 12 scenarios considering non-additive effects, defined by the combination of 08, 40, 80 or 120 QTLs and heritability 0.3, 0.5 or 0.8. The results of MARS were compared with the results obtained with the adjusted model G- BLUP considering additive effects, additive and dominance and additives and additive-additive epistasis regarding the predictive capacity and Cohen's kappa coefficient for selection of superior individuals. The MARS presented results of predictive capacity superior to all the G- BLUP models adjusted for the heritability scenarios 0.3 and similar results in the other cases. For Cohen's kappa coefficient, MARS was superior to the G-BLUP methods in 11 of the 12 scenarios evaluated. Therefore, MARS is a methodology that presents potential for studies on GWS. Keywords: Regression. Statistical learning. Genome Wild Selection. Non-additives effects.Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorporUniversidade Federal de ViçosaMelhoramento genético - Métodos estatíticosAprendizado do computador - Métodos estatísticosAnálise de regressãoEstatística Aplicada e BiometriaSplines de regressão adaptativa multivariada na predição genômicaMultivariate adaptive regression splines in genome predictioninfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal de ViçosaDepartamento de EstatísticaMestre em Estatística Aplicada e BiometriaViçosa - MG2020-10-27Mestradoinfo:eu-repo/semantics/openAccessreponame:LOCUS Repositório Institucional da UFVinstname:Universidade Federal de Viçosa (UFV)instacron:UFVORIGINALtexto completo.pdftexto completo.pdfapplication/pdf1265458https://locus.ufv.br//bitstream/123456789/28157/1/texto%20completo.pdfd896b6a9ec663e8110bc5202f02238c6MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://locus.ufv.br//bitstream/123456789/28157/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52123456789/281572021-08-31 15:45:20.121oai:locus.ufv.br:123456789/28157Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://www.locus.ufv.br/oai/requestfabiojreis@ufv.bropendoar:21452021-08-31T18:45:20LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)false |
dc.title.pt-BR.fl_str_mv |
Splines de regressão adaptativa multivariada na predição genômica Multivariate adaptive regression splines in genome prediction |
title |
Splines de regressão adaptativa multivariada na predição genômica |
spellingShingle |
Splines de regressão adaptativa multivariada na predição genômica Celeri, Maurício de Oliveira Melhoramento genético - Métodos estatíticos Aprendizado do computador - Métodos estatísticos Análise de regressão Estatística Aplicada e Biometria |
title_short |
Splines de regressão adaptativa multivariada na predição genômica |
title_full |
Splines de regressão adaptativa multivariada na predição genômica |
title_fullStr |
Splines de regressão adaptativa multivariada na predição genômica |
title_full_unstemmed |
Splines de regressão adaptativa multivariada na predição genômica |
title_sort |
Splines de regressão adaptativa multivariada na predição genômica |
author |
Celeri, Maurício de Oliveira |
author_facet |
Celeri, Maurício de Oliveira |
author_role |
author |
dc.contributor.authorLattes.pt-BR.fl_str_mv |
http://lattes.cnpq.br/2569243563413784 |
dc.contributor.none.fl_str_mv |
Nascimento, Ana Carolina C. Azevedo, Camila Ferreira |
dc.contributor.author.fl_str_mv |
Celeri, Maurício de Oliveira |
dc.contributor.advisor1.fl_str_mv |
Nascimento, Moysés |
contributor_str_mv |
Nascimento, Moysés |
dc.subject.pt-BR.fl_str_mv |
Melhoramento genético - Métodos estatíticos Aprendizado do computador - Métodos estatísticos Análise de regressão |
topic |
Melhoramento genético - Métodos estatíticos Aprendizado do computador - Métodos estatísticos Análise de regressão Estatística Aplicada e Biometria |
dc.subject.cnpq.fl_str_mv |
Estatística Aplicada e Biometria |
description |
A Seleção Genômica Ampla (SGA), proposta em 2001, é uma variação da Seleção Assistida por Marcadores (SAM) que prediz o valor genético genômico com base em marcadores distribuídos ao longo de todo o genoma. Desde sua proposição vários métodos estatísticos vêm sendo propostos para SGA, dentre os quais podemos destacar o Melhor Preditor Linear não Viesado Genômico (G-BLUP), uma das abordagens mais amplamente difundida devido a sua simplicidade e por permitir considerar efeitos não aditivos em seu ajuste. Uma metodologia ainda não explorada em SGA é a Splines de Regressão Adaptativa Multivariada (MARS). A MARS modela efeitos individuais e possíveis interações entre variáveis preditoras, podendo ser particularmente útil para SGA considerando efeitos não aditivos. Diante disso o objetivo deste trabalho é avaliar a utilização da MARS em SGA, considerando características quantitativas com efeitos não aditivos. Para isso, fez-se uso de um conjunto de dados simulados de 1000 indivíduos com 4010 marcadores SNPs e 12 cenários considerando efeitos não aditivos, definidos pela combinação de oito, 40, 80 ou 120 locus controladores e herdabilidade 0,3, 0,5 ou 0,8. Confrontou-se os resultados da MARS contra os resultados obtidos com o modelo ajustado G-BLUP considerando efeitos aditivos, aditivos e devido a dominância e aditivos e devido a epistasia aditiva-aditiva no que se refere à capacidade preditiva e ao coeficiente kappa de Cohen para seleção de indivíduos superiores. MARS apresentou resultados de capacidade preditiva superior a todos os modelos G-BLUP ajustado para os cenários de herdabilidade 0,3 e resultados semelhantes nos demais casos. Quanto ao coeficiente kappa de Cohen, MARS foi superior aos métodos G-BLUP em 11 dos 12 cenários avaliados. Portanto, MARS é uma metodologia que apresenta potencial para estudos em SGA. Palavras-chave: Regressão. Aprendizado estatístico. Seleção genômica ampla. Efeitos não aditivos. |
publishDate |
2020 |
dc.date.issued.fl_str_mv |
2020-10-27 |
dc.date.accessioned.fl_str_mv |
2021-08-31T18:45:19Z |
dc.date.available.fl_str_mv |
2021-08-31T18:45:19Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
CELERI, Maurício de Oliveira. Splines de regressão adaptativa multivariada na predição genômica. 2020. 32 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa. 2020. |
dc.identifier.uri.fl_str_mv |
https://locus.ufv.br//handle/123456789/28157 |
identifier_str_mv |
CELERI, Maurício de Oliveira. Splines de regressão adaptativa multivariada na predição genômica. 2020. 32 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa. 2020. |
url |
https://locus.ufv.br//handle/123456789/28157 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Viçosa |
publisher.none.fl_str_mv |
Universidade Federal de Viçosa |
dc.source.none.fl_str_mv |
reponame:LOCUS Repositório Institucional da UFV instname:Universidade Federal de Viçosa (UFV) instacron:UFV |
instname_str |
Universidade Federal de Viçosa (UFV) |
instacron_str |
UFV |
institution |
UFV |
reponame_str |
LOCUS Repositório Institucional da UFV |
collection |
LOCUS Repositório Institucional da UFV |
bitstream.url.fl_str_mv |
https://locus.ufv.br//bitstream/123456789/28157/1/texto%20completo.pdf https://locus.ufv.br//bitstream/123456789/28157/2/license.txt |
bitstream.checksum.fl_str_mv |
d896b6a9ec663e8110bc5202f02238c6 8a4605be74aa9ea9d79846c1fba20a33 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV) |
repository.mail.fl_str_mv |
fabiojreis@ufv.br |
_version_ |
1801212842633854976 |