Machine learning approaches in genome-wide association studies: SNP2Net: a tool for gene-based predictive modeling

Detalhes bibliográficos
Autor(a) principal: Duarte, João Valente
Data de Publicação: 2009
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10316/11377
Resumo: As redes Bayesianas são instrumentos poderosos para aprender modelos genéticos de dados de estudos de associação, uma vez que a correlação entre marcadores genéticos e traços fenotípicos pode ser derivada, bem como as relações entre os próprios. No entanto, o aprendimento das redes Bayesianas é muitas vezes não-trivial, devido ao elevado número de variáveis que devem ser tidas em conta no modelo. Desta forma, desenvolvemos uma aplicação de software em ambiente Matlab, SNP2Net, que implementa uma abordagem baseada em árvores decisionais para criar uma abstracção do espaço de variáveis que reduz a sua dimensão de forma adequada, sem perder informação. Especificamente, os SNPs (variáveis genéticas do modelo) pertencentes ao mesmo gene são mapeados para uma meta-variável. A aplicação desenvolvida permitiu testar a abordagem inovadora em vários conjuntos de dados e, além disso, permitiu também avaliar o desempenho do método no que diz respeito à previsão fenotípica. Os resultados mostraram que a abordagem apresentada é capaz de extrair um modelo predictivo baseado em informação sobre genes a partir de dados de SNPs, obtendo desempenhos predictivos superiores aos obtidos pelo modelo baseado num único SNP. Este modelo é mais parcimonioso do que um modelo baseado em conjuntos de um único SNP, preservando simultaneamente a capacidade de destacar configurações de SNPs predictivas. A ferramenta pode então ser aplicada na análise de dados provenientes de estudos de associação, usando genes como factores predictivos do fenótipo, e sendo uma alternativa adequada aos haplotipos, que muitas vezes são também utilizados como elementos de previsão.
id RCAP_b27d2aaab4725c1a627c7aa05639d59b
oai_identifier_str oai:estudogeral.uc.pt:10316/11377
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Machine learning approaches in genome-wide association studies: SNP2Net: a tool for gene-based predictive modelingGenotipo-fenotipo - correlaçãoInformática biomédicaModelos genéticosModelos genéticos - desenvolvimento de softwareRedes BayesianasSNP2NetAs redes Bayesianas são instrumentos poderosos para aprender modelos genéticos de dados de estudos de associação, uma vez que a correlação entre marcadores genéticos e traços fenotípicos pode ser derivada, bem como as relações entre os próprios. No entanto, o aprendimento das redes Bayesianas é muitas vezes não-trivial, devido ao elevado número de variáveis que devem ser tidas em conta no modelo. Desta forma, desenvolvemos uma aplicação de software em ambiente Matlab, SNP2Net, que implementa uma abordagem baseada em árvores decisionais para criar uma abstracção do espaço de variáveis que reduz a sua dimensão de forma adequada, sem perder informação. Especificamente, os SNPs (variáveis genéticas do modelo) pertencentes ao mesmo gene são mapeados para uma meta-variável. A aplicação desenvolvida permitiu testar a abordagem inovadora em vários conjuntos de dados e, além disso, permitiu também avaliar o desempenho do método no que diz respeito à previsão fenotípica. Os resultados mostraram que a abordagem apresentada é capaz de extrair um modelo predictivo baseado em informação sobre genes a partir de dados de SNPs, obtendo desempenhos predictivos superiores aos obtidos pelo modelo baseado num único SNP. Este modelo é mais parcimonioso do que um modelo baseado em conjuntos de um único SNP, preservando simultaneamente a capacidade de destacar configurações de SNPs predictivas. A ferramenta pode então ser aplicada na análise de dados provenientes de estudos de associação, usando genes como factores predictivos do fenótipo, e sendo uma alternativa adequada aos haplotipos, que muitas vezes são também utilizados como elementos de previsão.2009info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/10316/11377http://hdl.handle.net/10316/11377engDuarte, João Valente - Machine learning approaches in genome-wide association studies :|bSNP2Net: a tool for gene-based predictive modeling. Coimbra, 2009Duarte, João Valenteinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2022-01-20T17:49:12Zoai:estudogeral.uc.pt:10316/11377Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:00:20.684675Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Machine learning approaches in genome-wide association studies: SNP2Net: a tool for gene-based predictive modeling
title Machine learning approaches in genome-wide association studies: SNP2Net: a tool for gene-based predictive modeling
spellingShingle Machine learning approaches in genome-wide association studies: SNP2Net: a tool for gene-based predictive modeling
Duarte, João Valente
Genotipo-fenotipo - correlação
Informática biomédica
Modelos genéticos
Modelos genéticos - desenvolvimento de software
Redes Bayesianas
SNP2Net
title_short Machine learning approaches in genome-wide association studies: SNP2Net: a tool for gene-based predictive modeling
title_full Machine learning approaches in genome-wide association studies: SNP2Net: a tool for gene-based predictive modeling
title_fullStr Machine learning approaches in genome-wide association studies: SNP2Net: a tool for gene-based predictive modeling
title_full_unstemmed Machine learning approaches in genome-wide association studies: SNP2Net: a tool for gene-based predictive modeling
title_sort Machine learning approaches in genome-wide association studies: SNP2Net: a tool for gene-based predictive modeling
author Duarte, João Valente
author_facet Duarte, João Valente
author_role author
dc.contributor.author.fl_str_mv Duarte, João Valente
dc.subject.por.fl_str_mv Genotipo-fenotipo - correlação
Informática biomédica
Modelos genéticos
Modelos genéticos - desenvolvimento de software
Redes Bayesianas
SNP2Net
topic Genotipo-fenotipo - correlação
Informática biomédica
Modelos genéticos
Modelos genéticos - desenvolvimento de software
Redes Bayesianas
SNP2Net
description As redes Bayesianas são instrumentos poderosos para aprender modelos genéticos de dados de estudos de associação, uma vez que a correlação entre marcadores genéticos e traços fenotípicos pode ser derivada, bem como as relações entre os próprios. No entanto, o aprendimento das redes Bayesianas é muitas vezes não-trivial, devido ao elevado número de variáveis que devem ser tidas em conta no modelo. Desta forma, desenvolvemos uma aplicação de software em ambiente Matlab, SNP2Net, que implementa uma abordagem baseada em árvores decisionais para criar uma abstracção do espaço de variáveis que reduz a sua dimensão de forma adequada, sem perder informação. Especificamente, os SNPs (variáveis genéticas do modelo) pertencentes ao mesmo gene são mapeados para uma meta-variável. A aplicação desenvolvida permitiu testar a abordagem inovadora em vários conjuntos de dados e, além disso, permitiu também avaliar o desempenho do método no que diz respeito à previsão fenotípica. Os resultados mostraram que a abordagem apresentada é capaz de extrair um modelo predictivo baseado em informação sobre genes a partir de dados de SNPs, obtendo desempenhos predictivos superiores aos obtidos pelo modelo baseado num único SNP. Este modelo é mais parcimonioso do que um modelo baseado em conjuntos de um único SNP, preservando simultaneamente a capacidade de destacar configurações de SNPs predictivas. A ferramenta pode então ser aplicada na análise de dados provenientes de estudos de associação, usando genes como factores predictivos do fenótipo, e sendo uma alternativa adequada aos haplotipos, que muitas vezes são também utilizados como elementos de previsão.
publishDate 2009
dc.date.none.fl_str_mv 2009
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10316/11377
http://hdl.handle.net/10316/11377
url http://hdl.handle.net/10316/11377
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv Duarte, João Valente - Machine learning approaches in genome-wide association studies :|bSNP2Net: a tool for gene-based predictive modeling. Coimbra, 2009
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799133894371442688