Machine learning approaches in genome-wide association studies: SNP2Net: a tool for gene-based predictive modeling
Autor(a) principal: | |
---|---|
Data de Publicação: | 2009 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10316/11377 |
Resumo: | As redes Bayesianas são instrumentos poderosos para aprender modelos genéticos de dados de estudos de associação, uma vez que a correlação entre marcadores genéticos e traços fenotípicos pode ser derivada, bem como as relações entre os próprios. No entanto, o aprendimento das redes Bayesianas é muitas vezes não-trivial, devido ao elevado número de variáveis que devem ser tidas em conta no modelo. Desta forma, desenvolvemos uma aplicação de software em ambiente Matlab, SNP2Net, que implementa uma abordagem baseada em árvores decisionais para criar uma abstracção do espaço de variáveis que reduz a sua dimensão de forma adequada, sem perder informação. Especificamente, os SNPs (variáveis genéticas do modelo) pertencentes ao mesmo gene são mapeados para uma meta-variável. A aplicação desenvolvida permitiu testar a abordagem inovadora em vários conjuntos de dados e, além disso, permitiu também avaliar o desempenho do método no que diz respeito à previsão fenotípica. Os resultados mostraram que a abordagem apresentada é capaz de extrair um modelo predictivo baseado em informação sobre genes a partir de dados de SNPs, obtendo desempenhos predictivos superiores aos obtidos pelo modelo baseado num único SNP. Este modelo é mais parcimonioso do que um modelo baseado em conjuntos de um único SNP, preservando simultaneamente a capacidade de destacar configurações de SNPs predictivas. A ferramenta pode então ser aplicada na análise de dados provenientes de estudos de associação, usando genes como factores predictivos do fenótipo, e sendo uma alternativa adequada aos haplotipos, que muitas vezes são também utilizados como elementos de previsão. |
id |
RCAP_b27d2aaab4725c1a627c7aa05639d59b |
---|---|
oai_identifier_str |
oai:estudogeral.uc.pt:10316/11377 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Machine learning approaches in genome-wide association studies: SNP2Net: a tool for gene-based predictive modelingGenotipo-fenotipo - correlaçãoInformática biomédicaModelos genéticosModelos genéticos - desenvolvimento de softwareRedes BayesianasSNP2NetAs redes Bayesianas são instrumentos poderosos para aprender modelos genéticos de dados de estudos de associação, uma vez que a correlação entre marcadores genéticos e traços fenotípicos pode ser derivada, bem como as relações entre os próprios. No entanto, o aprendimento das redes Bayesianas é muitas vezes não-trivial, devido ao elevado número de variáveis que devem ser tidas em conta no modelo. Desta forma, desenvolvemos uma aplicação de software em ambiente Matlab, SNP2Net, que implementa uma abordagem baseada em árvores decisionais para criar uma abstracção do espaço de variáveis que reduz a sua dimensão de forma adequada, sem perder informação. Especificamente, os SNPs (variáveis genéticas do modelo) pertencentes ao mesmo gene são mapeados para uma meta-variável. A aplicação desenvolvida permitiu testar a abordagem inovadora em vários conjuntos de dados e, além disso, permitiu também avaliar o desempenho do método no que diz respeito à previsão fenotípica. Os resultados mostraram que a abordagem apresentada é capaz de extrair um modelo predictivo baseado em informação sobre genes a partir de dados de SNPs, obtendo desempenhos predictivos superiores aos obtidos pelo modelo baseado num único SNP. Este modelo é mais parcimonioso do que um modelo baseado em conjuntos de um único SNP, preservando simultaneamente a capacidade de destacar configurações de SNPs predictivas. A ferramenta pode então ser aplicada na análise de dados provenientes de estudos de associação, usando genes como factores predictivos do fenótipo, e sendo uma alternativa adequada aos haplotipos, que muitas vezes são também utilizados como elementos de previsão.2009info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/10316/11377http://hdl.handle.net/10316/11377engDuarte, João Valente - Machine learning approaches in genome-wide association studies :|bSNP2Net: a tool for gene-based predictive modeling. Coimbra, 2009Duarte, João Valenteinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2022-01-20T17:49:12Zoai:estudogeral.uc.pt:10316/11377Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:00:20.684675Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Machine learning approaches in genome-wide association studies: SNP2Net: a tool for gene-based predictive modeling |
title |
Machine learning approaches in genome-wide association studies: SNP2Net: a tool for gene-based predictive modeling |
spellingShingle |
Machine learning approaches in genome-wide association studies: SNP2Net: a tool for gene-based predictive modeling Duarte, João Valente Genotipo-fenotipo - correlação Informática biomédica Modelos genéticos Modelos genéticos - desenvolvimento de software Redes Bayesianas SNP2Net |
title_short |
Machine learning approaches in genome-wide association studies: SNP2Net: a tool for gene-based predictive modeling |
title_full |
Machine learning approaches in genome-wide association studies: SNP2Net: a tool for gene-based predictive modeling |
title_fullStr |
Machine learning approaches in genome-wide association studies: SNP2Net: a tool for gene-based predictive modeling |
title_full_unstemmed |
Machine learning approaches in genome-wide association studies: SNP2Net: a tool for gene-based predictive modeling |
title_sort |
Machine learning approaches in genome-wide association studies: SNP2Net: a tool for gene-based predictive modeling |
author |
Duarte, João Valente |
author_facet |
Duarte, João Valente |
author_role |
author |
dc.contributor.author.fl_str_mv |
Duarte, João Valente |
dc.subject.por.fl_str_mv |
Genotipo-fenotipo - correlação Informática biomédica Modelos genéticos Modelos genéticos - desenvolvimento de software Redes Bayesianas SNP2Net |
topic |
Genotipo-fenotipo - correlação Informática biomédica Modelos genéticos Modelos genéticos - desenvolvimento de software Redes Bayesianas SNP2Net |
description |
As redes Bayesianas são instrumentos poderosos para aprender modelos genéticos de dados de estudos de associação, uma vez que a correlação entre marcadores genéticos e traços fenotípicos pode ser derivada, bem como as relações entre os próprios. No entanto, o aprendimento das redes Bayesianas é muitas vezes não-trivial, devido ao elevado número de variáveis que devem ser tidas em conta no modelo. Desta forma, desenvolvemos uma aplicação de software em ambiente Matlab, SNP2Net, que implementa uma abordagem baseada em árvores decisionais para criar uma abstracção do espaço de variáveis que reduz a sua dimensão de forma adequada, sem perder informação. Especificamente, os SNPs (variáveis genéticas do modelo) pertencentes ao mesmo gene são mapeados para uma meta-variável. A aplicação desenvolvida permitiu testar a abordagem inovadora em vários conjuntos de dados e, além disso, permitiu também avaliar o desempenho do método no que diz respeito à previsão fenotípica. Os resultados mostraram que a abordagem apresentada é capaz de extrair um modelo predictivo baseado em informação sobre genes a partir de dados de SNPs, obtendo desempenhos predictivos superiores aos obtidos pelo modelo baseado num único SNP. Este modelo é mais parcimonioso do que um modelo baseado em conjuntos de um único SNP, preservando simultaneamente a capacidade de destacar configurações de SNPs predictivas. A ferramenta pode então ser aplicada na análise de dados provenientes de estudos de associação, usando genes como factores predictivos do fenótipo, e sendo uma alternativa adequada aos haplotipos, que muitas vezes são também utilizados como elementos de previsão. |
publishDate |
2009 |
dc.date.none.fl_str_mv |
2009 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10316/11377 http://hdl.handle.net/10316/11377 |
url |
http://hdl.handle.net/10316/11377 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.relation.none.fl_str_mv |
Duarte, João Valente - Machine learning approaches in genome-wide association studies :|bSNP2Net: a tool for gene-based predictive modeling. Coimbra, 2009 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799133894371442688 |