Computational discovery of Genetic Markers for Type 2 diabetes
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10316/86135 |
Resumo: | Trabalho de Projeto do Mestrado Integrado em Engenharia Biomédica apresentado à Faculdade de Ciências e Tecnologia |
id |
RCAP_ee5ba365387ba138c5efe5c78c32465c |
---|---|
oai_identifier_str |
oai:estudogeral.uc.pt:10316/86135 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Computational discovery of Genetic Markers for Type 2 diabetesDescoberta computacional de marcadores genéticos para diabetes tipo 2Aprendizagem MáquinaDiabetes Tipo 2Estudos de Associação GenéticaBioinformáticaGenéticaMachine LearningType 2 DiabetesGenome Wide Association StudyBioinformaticsGeneticsTrabalho de Projeto do Mestrado Integrado em Engenharia Biomédica apresentado à Faculdade de Ciências e TecnologiaA Diabetes Tipo 2 é uma doença metabólica causada por resistência à insulina nos órgãos, deficiência relativa de insulina, e níveis altos de açucar no sangue. Esta é uma das doenças mais comuns no mundo, e é a quinta maior causa de morte global. Os custos estimados globais de tratamento tanto directo como indirecto, chegam a atingir os US$1.31 triliões (95\% IC 1.28 - 1.36). Como tal, torna-se cada vez mais important descobrir métodos que possam prever o risco da DT2 desde uma idade jovem, e sem que até nenhuns padrões de risco fisiológicos se verifiquem. Com isto, será possível tanto para médicos como para pacientes estar mais conscientes do risco da doença e poderem empregar medidas preventivas o mais cedo possível.Existem indícios claros que apontam a Diabetes Tipo 2 como uma patologia influenciada não só por factores ambientais, mas também genéticos. Por isso, este estudo pretende desenvolver novas abordagens a Genome Wide Association Studies, mais especificamente no que trata a análises Multi-Locus em doenças complexas, que sejam não só computacionalmente praticáveis mas que estudem também a não-linearidade nestes tipos de dados. Para o fazer, foi desenvolvida uma nova linha inovadora de transformações que permite identificar regiões de interesse no genoma, extrair novas características sem perder o contexto biológico do problema, e utilizá-las em modelos de Machine Learning que acontam com a epistasia.Estes novos métodos são demonstrados numa análise de um dataset de Polimorfismos de Nucleótidos Únicos, onde novos possíveis marcadores genéticos para a Diabetes Tipo 2 são apontados. Para além disso, também é realizada uma classificação do risco de DT2, com F1-Scores a atingir os 0.97 com alta confiança. Este projecto pretende sobretudo mostrar como podem ser minados os dados de datasets de genótipos de uma maneira que permita o uso de modelos de Machine Learning com a sua capacidade total.Type 2 Diabetes is a metabolic disorder caused by insulin resistance in organs, relative insulin deficiency and high blood sugar levels. It is one of the most common diseases in the world, and the fifth leading cause of death worldwide, with an estimate global cost of indirect and direct treating reaching US$1.31 trillion (95\% CI 1.28 - 1.36). As such, it becomes increasingly important to discover methods of predicting T2D risk from a young age and before the onset of any physiological risk patterns, so that both patients and doctors are aware of it, and can monitor the disease and employ preventive measures.There is clear evidence that supports Type 2 Diabetes risk as being influenced not only by environmental factors, but also genetic ones. In light of this, the following study aims to develop new ways to approach Multi-Locus Genome Wide Association Studies in complex diseases, that are not only computationally feasible, but can also study the non-linearity in a dataset. It aims to do so through the inclusion of an innovative pipeline of transformations that can identify regions of interest in the genome, extract new features without losing biological context of the problem and use them in Machine Learning models that can account for epistasis. This process is further demonstrated in an analysis of a Single Nucleotide Polymorphisms dataset, and provides several identifications of possible novel genetic markers for Type 2 Diabetes. Furthermore, classification of T2D's risk is also performed, reaching F1-scores as high as 0.97 with high confidence. This project aims mostly to exhibit how can a genotypes dataset be data mined in a way that can be fully taken advantage of by Machine Learning models.2018-07-23info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/10316/86135http://hdl.handle.net/10316/86135TID:202206505engAlmeida, João Miguel Roqueinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2021-05-07T09:43:24Zoai:estudogeral.uc.pt:10316/86135Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:07:21.303314Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Computational discovery of Genetic Markers for Type 2 diabetes Descoberta computacional de marcadores genéticos para diabetes tipo 2 |
title |
Computational discovery of Genetic Markers for Type 2 diabetes |
spellingShingle |
Computational discovery of Genetic Markers for Type 2 diabetes Almeida, João Miguel Roque Aprendizagem Máquina Diabetes Tipo 2 Estudos de Associação Genética Bioinformática Genética Machine Learning Type 2 Diabetes Genome Wide Association Study Bioinformatics Genetics |
title_short |
Computational discovery of Genetic Markers for Type 2 diabetes |
title_full |
Computational discovery of Genetic Markers for Type 2 diabetes |
title_fullStr |
Computational discovery of Genetic Markers for Type 2 diabetes |
title_full_unstemmed |
Computational discovery of Genetic Markers for Type 2 diabetes |
title_sort |
Computational discovery of Genetic Markers for Type 2 diabetes |
author |
Almeida, João Miguel Roque |
author_facet |
Almeida, João Miguel Roque |
author_role |
author |
dc.contributor.author.fl_str_mv |
Almeida, João Miguel Roque |
dc.subject.por.fl_str_mv |
Aprendizagem Máquina Diabetes Tipo 2 Estudos de Associação Genética Bioinformática Genética Machine Learning Type 2 Diabetes Genome Wide Association Study Bioinformatics Genetics |
topic |
Aprendizagem Máquina Diabetes Tipo 2 Estudos de Associação Genética Bioinformática Genética Machine Learning Type 2 Diabetes Genome Wide Association Study Bioinformatics Genetics |
description |
Trabalho de Projeto do Mestrado Integrado em Engenharia Biomédica apresentado à Faculdade de Ciências e Tecnologia |
publishDate |
2018 |
dc.date.none.fl_str_mv |
2018-07-23 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10316/86135 http://hdl.handle.net/10316/86135 TID:202206505 |
url |
http://hdl.handle.net/10316/86135 |
identifier_str_mv |
TID:202206505 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799133964869304320 |