A model validation pipeline for healthy tissue genome-scale metabolic models

Detalhes bibliográficos
Autor(a) principal: Monteiro, Maria Adília Balacó Chócha Pessoa
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: https://hdl.handle.net/1822/82451
Resumo: Dissertação de mestrado em Bioinformática
id RCAP_4ca807ae7f8e85785ed0f94529aade90
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/82451
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling A model validation pipeline for healthy tissue genome-scale metabolic modelsModelação baseada em restriçõesModelos metabólicos contextualizadosPackage troppoTarefas metabólicasTecido humano saudávelConstraint-based modellingContext-specific modelsHealthy human tissueMetabolic tasksTroppo packageDissertação de mestrado em BioinformáticaNos últimos anos, os métodos de alto rendimento disponibilizaram dados ómicos referentes a várias camadas da organização biológica, permitindo a integração do conhecimento de componentes individuais em modelos complexos, como modelos metabólicos à escala genómica (GSMMs). Estes podem ser analisados por métodos de modelação baseada em restrições(CBM), que facilitam abordagens preditivas in silico. Os modelos metabólicos humanos têm sido usados para estudar tecidos saudáveis e as suas doenças metabólicas associadas, como obesidade, diabetes e cancro. Modelos humanos genéricos podem ser integrados com dados contextuais por meio de algoritmos de reconstrução, com vista a produzir modelos metabólicos contextualizados (CSMs), que são normalmente melhores a capturar a variação entre diferentes tecidos e tipos de células. Como o corpo humano contém uma grande variedade de tecidos e tipos de células, os CSMs são frequentemente adotados como um meio de obter modelos metabólicos mais precisos de tecido humano saudável. No entanto, ao contrário de modelos de microrganismos e cancro, que acomodam vários métodos de validação, como a comparação de fluxos in silico ou de previsões de genes essenciais com dados experimentais, os métodos de validação facilmente aplicáveis a CSMs de tecido humano saudável podem ser mais limitados. Consequentemente, apesar de esforços continuados para atualizar os modelos humanos genéricos e algoritmos de reconstrução para extrair CSMs de alta qualidade, a sua validação continua a ser uma preocupação. Este trabalho apresenta uma pipeline para a extração e validação básica de CSMs de tecidos humanos normais derivados da integração de dados transcriptómicos com um modelo humano genérico. Todos os CSMs foram extraídos do modelo genérico Human-GEM publicado recentemente por Robinson et al. (2020), usando o package Troppo em Python e nos algoritmos de reconstrução fastCORE e tINIT nele implementados. Os CSMs extraídos correspondem a 11 tecidos saudáveis disponíveis no conjunto de dados GTEx v8. Antes da extração, métodos de aprendizagem máquina foram aplicados à seleção de um limiar para conversão em gene scores. Os modelos de maior qualidade foram obtidos com um limite mínimo global aplicado diretamente aos dados ómicos. A estratégia de validação focou-se no número de tarefas metabólicas passadas como um indicador de desempenho. Por último, este trabalho é acompanhado por Jupyter Notebooks, que incluem um guia de extração de modelos para novos utilizadores.n the past few years, high-throughput experimental methods have made omics data available for several layers of biological organization, enabling the integration of knowledge from individual components into complex modelssuch as genome-scale metabolic models (GSMMs). These can be analysed by constraint based modelling (CBM) methods, which facilitate in silico predictive approaches. Human metabolic models have been used to study healthy human tissues and their associated metabolic diseases, such as obesity, diabetes, and cancer. Generic human models can be integrated with contextual data through reconstruction algorithms to produce context-specific models (CSMs), which are typically better at capturing the variation between different tissues and cell types. As the human body contains a multitude of tissues and cell types, CSMs are frequently adopted as a means to obtain accurate metabolic models of healthy human tissues. However, unlike microorganisms’ or cancer models, which allow several methods of validation such as the comparison of in silico fluxes or gene essentiality predictions to experimental data, the validation methods easily applicable to CSMs of healthy human tissue are more limited. Consequently, despite continued efforts to update generic human models and reconstruction algorithms to extract high quality CSMs, their validation remains a concern. This work presents a pipeline for the extraction and basic validation of CSMs of normal human tissues derived from the integration of transcriptomics data with a generic human model. All CSMs were extracted from the Human-GEM generic model recently published by Robinson et al. (2020), relied on the open-source Troppo Python package and in the fastCORE and tINIT reconstruction algorithms implemented therein. CSMs were extracted for 11 healthy tissues available in the GTEx v8 dataset. Prior to extraction, machine learning methods were applied to threshold selection for gene scores conversion. The highest quality models were obtained with a global threshold applied to the omics data directly. The CSM validation strategy focused on the total number of metabolic tasks passed as a performance indicator. Lastly, this work is accompanied by Jupyter Notebooks, which include a beginner friendly model extraction guide.Rocha, MiguelFerreira, Pedro G.Universidade do MinhoMonteiro, Maria Adília Balacó Chócha Pessoa2021-12-222021-12-22T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/82451eng203127145info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T12:50:51Zoai:repositorium.sdum.uminho.pt:1822/82451Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T19:49:36.656127Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv A model validation pipeline for healthy tissue genome-scale metabolic models
title A model validation pipeline for healthy tissue genome-scale metabolic models
spellingShingle A model validation pipeline for healthy tissue genome-scale metabolic models
Monteiro, Maria Adília Balacó Chócha Pessoa
Modelação baseada em restrições
Modelos metabólicos contextualizados
Package troppo
Tarefas metabólicas
Tecido humano saudável
Constraint-based modelling
Context-specific models
Healthy human tissue
Metabolic tasks
Troppo package
title_short A model validation pipeline for healthy tissue genome-scale metabolic models
title_full A model validation pipeline for healthy tissue genome-scale metabolic models
title_fullStr A model validation pipeline for healthy tissue genome-scale metabolic models
title_full_unstemmed A model validation pipeline for healthy tissue genome-scale metabolic models
title_sort A model validation pipeline for healthy tissue genome-scale metabolic models
author Monteiro, Maria Adília Balacó Chócha Pessoa
author_facet Monteiro, Maria Adília Balacó Chócha Pessoa
author_role author
dc.contributor.none.fl_str_mv Rocha, Miguel
Ferreira, Pedro G.
Universidade do Minho
dc.contributor.author.fl_str_mv Monteiro, Maria Adília Balacó Chócha Pessoa
dc.subject.por.fl_str_mv Modelação baseada em restrições
Modelos metabólicos contextualizados
Package troppo
Tarefas metabólicas
Tecido humano saudável
Constraint-based modelling
Context-specific models
Healthy human tissue
Metabolic tasks
Troppo package
topic Modelação baseada em restrições
Modelos metabólicos contextualizados
Package troppo
Tarefas metabólicas
Tecido humano saudável
Constraint-based modelling
Context-specific models
Healthy human tissue
Metabolic tasks
Troppo package
description Dissertação de mestrado em Bioinformática
publishDate 2021
dc.date.none.fl_str_mv 2021-12-22
2021-12-22T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1822/82451
url https://hdl.handle.net/1822/82451
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv 203127145
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799133078691512320