Redes de meta-modelagem e suas aplicações no estudo de anotações de proteínas
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://www.teses.usp.br/teses/disponiveis/76/76133/tde-06092023-100207/ |
Resumo: | A crescente disponibilidade de dados tem motivado o desenvolvimento de novas abordagens de modelagem para sua análise e interpretação, incluindo métodos estatísticos, mineração de dados e aprendizado de máquina. Apesar de serem particularmente eficazes, os modelos baseados em dados tendem a ter interpretabilidade limitada, o que pode dificultar a compreensão de suas previsões. Para lidar com essas questões, este trabalho foca na extensão e aplicação de uma abordagem formal de meta-modelagem que possa fornecer subsídios para caracterizar, melhorar e integrar modelos baseados em dados. O procedimento proposto consiste na aplicação de ciência de redes na construção de uma rede de meta-modelagem que conecta conjuntos de dados a modelos científicos. Primeiro, a meta-modelagem envolve a delimitação de três domínios: um domínio de universo que contém todos os dados acessíveis para modelagem, um ambiente de dados com conjuntos de dados organizados, e uma estrutura de modelagem capaz de explicar esse ambiente de dados. Depois disso, a rede é construída com base em duas operações: a associação bijetiva entre conjuntos de dados e modelos (resumida no conceito de cartucho) e a conexão entre os elementos de cada conjunto de dados e cada modelo. Com essas propriedades, a rede permite avaliar quantitativamente a interação entre modelos na mesma estrutura de modelagem, além de facilitar a criação de novos modelos por meio da correspondência entre operações lógicas de modelos e operações entre conjuntos de dados. Esta abordagem foi aplicada a dois problemas de modelagem. No primeiro caso, o foco estava no reconhecimento de padrões em sequências binárias. Nele, descrevemos detalhadamente a interação entre seis modelos de padrões, além de derivar um modelo preciso para um conjunto de dados usando uma composição lógica de modelos pré-existentes, o que mostra o potencial dessa abordagem para estudar a detecção de padrões em sequências de símbolos. No segundo caso, o método foi aplicado para auxiliar a análise exploratória da anotação de domínios de proteínas em enzimas ativas em carboidratos, presente no banco de dados CAZy. O estudo desse meta-modelo revelou informações sobre a modularidade das classes funcionais e suas relações evolutivas e funcionais. Coletivamente, esses resultados indicam que a rede de meta-modelagem desenvolvida tem potencial para auxiliar na caracterização e aprimoramento da modelagem científica em múltiplas áreas, com aplicações promissoras para a análise de anotação de proteínas. |
id |
USP_3ef24983672e8bbb856a7062a0b814db |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-06092023-100207 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Redes de meta-modelagem e suas aplicações no estudo de anotações de proteínasMeta-modeling networks and their applications in the study of protein annotationsAnotação de proteínasCarbohydrate-active enzymesCiência de redesEnzimas ativas em carboidratosMeta-modelagemMeta-modelingNetwork sciencePattern recognitionProtein annotationReconhecimento de padrõesA crescente disponibilidade de dados tem motivado o desenvolvimento de novas abordagens de modelagem para sua análise e interpretação, incluindo métodos estatísticos, mineração de dados e aprendizado de máquina. Apesar de serem particularmente eficazes, os modelos baseados em dados tendem a ter interpretabilidade limitada, o que pode dificultar a compreensão de suas previsões. Para lidar com essas questões, este trabalho foca na extensão e aplicação de uma abordagem formal de meta-modelagem que possa fornecer subsídios para caracterizar, melhorar e integrar modelos baseados em dados. O procedimento proposto consiste na aplicação de ciência de redes na construção de uma rede de meta-modelagem que conecta conjuntos de dados a modelos científicos. Primeiro, a meta-modelagem envolve a delimitação de três domínios: um domínio de universo que contém todos os dados acessíveis para modelagem, um ambiente de dados com conjuntos de dados organizados, e uma estrutura de modelagem capaz de explicar esse ambiente de dados. Depois disso, a rede é construída com base em duas operações: a associação bijetiva entre conjuntos de dados e modelos (resumida no conceito de cartucho) e a conexão entre os elementos de cada conjunto de dados e cada modelo. Com essas propriedades, a rede permite avaliar quantitativamente a interação entre modelos na mesma estrutura de modelagem, além de facilitar a criação de novos modelos por meio da correspondência entre operações lógicas de modelos e operações entre conjuntos de dados. Esta abordagem foi aplicada a dois problemas de modelagem. No primeiro caso, o foco estava no reconhecimento de padrões em sequências binárias. Nele, descrevemos detalhadamente a interação entre seis modelos de padrões, além de derivar um modelo preciso para um conjunto de dados usando uma composição lógica de modelos pré-existentes, o que mostra o potencial dessa abordagem para estudar a detecção de padrões em sequências de símbolos. No segundo caso, o método foi aplicado para auxiliar a análise exploratória da anotação de domínios de proteínas em enzimas ativas em carboidratos, presente no banco de dados CAZy. O estudo desse meta-modelo revelou informações sobre a modularidade das classes funcionais e suas relações evolutivas e funcionais. Coletivamente, esses resultados indicam que a rede de meta-modelagem desenvolvida tem potencial para auxiliar na caracterização e aprimoramento da modelagem científica em múltiplas áreas, com aplicações promissoras para a análise de anotação de proteínas.The growing availability of data has motivated the development of new modeling approaches for its analysis and interpretation, including statistical methods, data mining, and machine learning. Despite being particularly effective, data-driven models tend to have limited interpretability, which can make their predictions difficult to understand. To deal with these issues, this work focuses on the extension and application of a meta-modeling formal approach that can provide subsidies to characterize, improve and integrate data-based models. The proposed procedure consists of applying network science in the construction of a meta-modeling network that connects datasets to scientific models. First, the metamodeling involves delimiting three domains: a universe domain that contains all data accessible for modeling, a data environment with organized datasets, and a modeling framework capable of explaining this data environment. After that, the network is built based on two operations: the bijective association between datasets and models (summarized in the concept of cartouche) and the connection between the elements of each dataset and each model. With these properties, the network enables to quantitatively evaluate the interaction between models in the same modeling structure, in addition to facilitating the creation of new models through the correspondence between logical operations between models and set operations between datasets. This approach was applied to two modeling problems. In the first case, the focus was on pattern recognition in binary sequences. In this problem, we describe in detail the interaction between six models of patterns, in addition to deriving an accurate model for a dataset using a logical composition of pre-existing models, which shows the potential of this approach to study pattern detection in sequences of symbols. In the second case, the method was applied to aid the exploratory analysis of a protein domain annotation in carbohydrate-active enzymes, available in the CAZy database. The study of this meta-model revealed information about the modularity of functional classes and their evolutionary and functional relationships. Collectively, these results indicate that the developed meta-modeling network has the potential to aid in the characterization and improvement of scientific modeling in multiple areas, with promising applications for protein annotation analysis.Biblioteca Digitais de Teses e Dissertações da USPCosta, Luciano da FontouraReis, Renan dos2023-08-18info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/76/76133/tde-06092023-100207/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-08-22T22:00:03Zoai:teses.usp.br:tde-06092023-100207Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-08-22T22:00:03Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Redes de meta-modelagem e suas aplicações no estudo de anotações de proteínas Meta-modeling networks and their applications in the study of protein annotations |
title |
Redes de meta-modelagem e suas aplicações no estudo de anotações de proteínas |
spellingShingle |
Redes de meta-modelagem e suas aplicações no estudo de anotações de proteínas Reis, Renan dos Anotação de proteínas Carbohydrate-active enzymes Ciência de redes Enzimas ativas em carboidratos Meta-modelagem Meta-modeling Network science Pattern recognition Protein annotation Reconhecimento de padrões |
title_short |
Redes de meta-modelagem e suas aplicações no estudo de anotações de proteínas |
title_full |
Redes de meta-modelagem e suas aplicações no estudo de anotações de proteínas |
title_fullStr |
Redes de meta-modelagem e suas aplicações no estudo de anotações de proteínas |
title_full_unstemmed |
Redes de meta-modelagem e suas aplicações no estudo de anotações de proteínas |
title_sort |
Redes de meta-modelagem e suas aplicações no estudo de anotações de proteínas |
author |
Reis, Renan dos |
author_facet |
Reis, Renan dos |
author_role |
author |
dc.contributor.none.fl_str_mv |
Costa, Luciano da Fontoura |
dc.contributor.author.fl_str_mv |
Reis, Renan dos |
dc.subject.por.fl_str_mv |
Anotação de proteínas Carbohydrate-active enzymes Ciência de redes Enzimas ativas em carboidratos Meta-modelagem Meta-modeling Network science Pattern recognition Protein annotation Reconhecimento de padrões |
topic |
Anotação de proteínas Carbohydrate-active enzymes Ciência de redes Enzimas ativas em carboidratos Meta-modelagem Meta-modeling Network science Pattern recognition Protein annotation Reconhecimento de padrões |
description |
A crescente disponibilidade de dados tem motivado o desenvolvimento de novas abordagens de modelagem para sua análise e interpretação, incluindo métodos estatísticos, mineração de dados e aprendizado de máquina. Apesar de serem particularmente eficazes, os modelos baseados em dados tendem a ter interpretabilidade limitada, o que pode dificultar a compreensão de suas previsões. Para lidar com essas questões, este trabalho foca na extensão e aplicação de uma abordagem formal de meta-modelagem que possa fornecer subsídios para caracterizar, melhorar e integrar modelos baseados em dados. O procedimento proposto consiste na aplicação de ciência de redes na construção de uma rede de meta-modelagem que conecta conjuntos de dados a modelos científicos. Primeiro, a meta-modelagem envolve a delimitação de três domínios: um domínio de universo que contém todos os dados acessíveis para modelagem, um ambiente de dados com conjuntos de dados organizados, e uma estrutura de modelagem capaz de explicar esse ambiente de dados. Depois disso, a rede é construída com base em duas operações: a associação bijetiva entre conjuntos de dados e modelos (resumida no conceito de cartucho) e a conexão entre os elementos de cada conjunto de dados e cada modelo. Com essas propriedades, a rede permite avaliar quantitativamente a interação entre modelos na mesma estrutura de modelagem, além de facilitar a criação de novos modelos por meio da correspondência entre operações lógicas de modelos e operações entre conjuntos de dados. Esta abordagem foi aplicada a dois problemas de modelagem. No primeiro caso, o foco estava no reconhecimento de padrões em sequências binárias. Nele, descrevemos detalhadamente a interação entre seis modelos de padrões, além de derivar um modelo preciso para um conjunto de dados usando uma composição lógica de modelos pré-existentes, o que mostra o potencial dessa abordagem para estudar a detecção de padrões em sequências de símbolos. No segundo caso, o método foi aplicado para auxiliar a análise exploratória da anotação de domínios de proteínas em enzimas ativas em carboidratos, presente no banco de dados CAZy. O estudo desse meta-modelo revelou informações sobre a modularidade das classes funcionais e suas relações evolutivas e funcionais. Coletivamente, esses resultados indicam que a rede de meta-modelagem desenvolvida tem potencial para auxiliar na caracterização e aprimoramento da modelagem científica em múltiplas áreas, com aplicações promissoras para a análise de anotação de proteínas. |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-08-18 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/76/76133/tde-06092023-100207/ |
url |
https://www.teses.usp.br/teses/disponiveis/76/76133/tde-06092023-100207/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1809090455200071680 |