Redes de meta-modelagem e suas aplicações no estudo de anotações de proteínas

Detalhes bibliográficos
Autor(a) principal: Reis, Renan dos
Data de Publicação: 2023
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/76/76133/tde-06092023-100207/
Resumo: A crescente disponibilidade de dados tem motivado o desenvolvimento de novas abordagens de modelagem para sua análise e interpretação, incluindo métodos estatísticos, mineração de dados e aprendizado de máquina. Apesar de serem particularmente eficazes, os modelos baseados em dados tendem a ter interpretabilidade limitada, o que pode dificultar a compreensão de suas previsões. Para lidar com essas questões, este trabalho foca na extensão e aplicação de uma abordagem formal de meta-modelagem que possa fornecer subsídios para caracterizar, melhorar e integrar modelos baseados em dados. O procedimento proposto consiste na aplicação de ciência de redes na construção de uma rede de meta-modelagem que conecta conjuntos de dados a modelos científicos. Primeiro, a meta-modelagem envolve a delimitação de três domínios: um domínio de universo que contém todos os dados acessíveis para modelagem, um ambiente de dados com conjuntos de dados organizados, e uma estrutura de modelagem capaz de explicar esse ambiente de dados. Depois disso, a rede é construída com base em duas operações: a associação bijetiva entre conjuntos de dados e modelos (resumida no conceito de cartucho) e a conexão entre os elementos de cada conjunto de dados e cada modelo. Com essas propriedades, a rede permite avaliar quantitativamente a interação entre modelos na mesma estrutura de modelagem, além de facilitar a criação de novos modelos por meio da correspondência entre operações lógicas de modelos e operações entre conjuntos de dados. Esta abordagem foi aplicada a dois problemas de modelagem. No primeiro caso, o foco estava no reconhecimento de padrões em sequências binárias. Nele, descrevemos detalhadamente a interação entre seis modelos de padrões, além de derivar um modelo preciso para um conjunto de dados usando uma composição lógica de modelos pré-existentes, o que mostra o potencial dessa abordagem para estudar a detecção de padrões em sequências de símbolos. No segundo caso, o método foi aplicado para auxiliar a análise exploratória da anotação de domínios de proteínas em enzimas ativas em carboidratos, presente no banco de dados CAZy. O estudo desse meta-modelo revelou informações sobre a modularidade das classes funcionais e suas relações evolutivas e funcionais. Coletivamente, esses resultados indicam que a rede de meta-modelagem desenvolvida tem potencial para auxiliar na caracterização e aprimoramento da modelagem científica em múltiplas áreas, com aplicações promissoras para a análise de anotação de proteínas.
id USP_3ef24983672e8bbb856a7062a0b814db
oai_identifier_str oai:teses.usp.br:tde-06092023-100207
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Redes de meta-modelagem e suas aplicações no estudo de anotações de proteínasMeta-modeling networks and their applications in the study of protein annotationsAnotação de proteínasCarbohydrate-active enzymesCiência de redesEnzimas ativas em carboidratosMeta-modelagemMeta-modelingNetwork sciencePattern recognitionProtein annotationReconhecimento de padrõesA crescente disponibilidade de dados tem motivado o desenvolvimento de novas abordagens de modelagem para sua análise e interpretação, incluindo métodos estatísticos, mineração de dados e aprendizado de máquina. Apesar de serem particularmente eficazes, os modelos baseados em dados tendem a ter interpretabilidade limitada, o que pode dificultar a compreensão de suas previsões. Para lidar com essas questões, este trabalho foca na extensão e aplicação de uma abordagem formal de meta-modelagem que possa fornecer subsídios para caracterizar, melhorar e integrar modelos baseados em dados. O procedimento proposto consiste na aplicação de ciência de redes na construção de uma rede de meta-modelagem que conecta conjuntos de dados a modelos científicos. Primeiro, a meta-modelagem envolve a delimitação de três domínios: um domínio de universo que contém todos os dados acessíveis para modelagem, um ambiente de dados com conjuntos de dados organizados, e uma estrutura de modelagem capaz de explicar esse ambiente de dados. Depois disso, a rede é construída com base em duas operações: a associação bijetiva entre conjuntos de dados e modelos (resumida no conceito de cartucho) e a conexão entre os elementos de cada conjunto de dados e cada modelo. Com essas propriedades, a rede permite avaliar quantitativamente a interação entre modelos na mesma estrutura de modelagem, além de facilitar a criação de novos modelos por meio da correspondência entre operações lógicas de modelos e operações entre conjuntos de dados. Esta abordagem foi aplicada a dois problemas de modelagem. No primeiro caso, o foco estava no reconhecimento de padrões em sequências binárias. Nele, descrevemos detalhadamente a interação entre seis modelos de padrões, além de derivar um modelo preciso para um conjunto de dados usando uma composição lógica de modelos pré-existentes, o que mostra o potencial dessa abordagem para estudar a detecção de padrões em sequências de símbolos. No segundo caso, o método foi aplicado para auxiliar a análise exploratória da anotação de domínios de proteínas em enzimas ativas em carboidratos, presente no banco de dados CAZy. O estudo desse meta-modelo revelou informações sobre a modularidade das classes funcionais e suas relações evolutivas e funcionais. Coletivamente, esses resultados indicam que a rede de meta-modelagem desenvolvida tem potencial para auxiliar na caracterização e aprimoramento da modelagem científica em múltiplas áreas, com aplicações promissoras para a análise de anotação de proteínas.The growing availability of data has motivated the development of new modeling approaches for its analysis and interpretation, including statistical methods, data mining, and machine learning. Despite being particularly effective, data-driven models tend to have limited interpretability, which can make their predictions difficult to understand. To deal with these issues, this work focuses on the extension and application of a meta-modeling formal approach that can provide subsidies to characterize, improve and integrate data-based models. The proposed procedure consists of applying network science in the construction of a meta-modeling network that connects datasets to scientific models. First, the metamodeling involves delimiting three domains: a universe domain that contains all data accessible for modeling, a data environment with organized datasets, and a modeling framework capable of explaining this data environment. After that, the network is built based on two operations: the bijective association between datasets and models (summarized in the concept of cartouche) and the connection between the elements of each dataset and each model. With these properties, the network enables to quantitatively evaluate the interaction between models in the same modeling structure, in addition to facilitating the creation of new models through the correspondence between logical operations between models and set operations between datasets. This approach was applied to two modeling problems. In the first case, the focus was on pattern recognition in binary sequences. In this problem, we describe in detail the interaction between six models of patterns, in addition to deriving an accurate model for a dataset using a logical composition of pre-existing models, which shows the potential of this approach to study pattern detection in sequences of symbols. In the second case, the method was applied to aid the exploratory analysis of a protein domain annotation in carbohydrate-active enzymes, available in the CAZy database. The study of this meta-model revealed information about the modularity of functional classes and their evolutionary and functional relationships. Collectively, these results indicate that the developed meta-modeling network has the potential to aid in the characterization and improvement of scientific modeling in multiple areas, with promising applications for protein annotation analysis.Biblioteca Digitais de Teses e Dissertações da USPCosta, Luciano da FontouraReis, Renan dos2023-08-18info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/76/76133/tde-06092023-100207/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-08-22T22:00:03Zoai:teses.usp.br:tde-06092023-100207Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-08-22T22:00:03Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Redes de meta-modelagem e suas aplicações no estudo de anotações de proteínas
Meta-modeling networks and their applications in the study of protein annotations
title Redes de meta-modelagem e suas aplicações no estudo de anotações de proteínas
spellingShingle Redes de meta-modelagem e suas aplicações no estudo de anotações de proteínas
Reis, Renan dos
Anotação de proteínas
Carbohydrate-active enzymes
Ciência de redes
Enzimas ativas em carboidratos
Meta-modelagem
Meta-modeling
Network science
Pattern recognition
Protein annotation
Reconhecimento de padrões
title_short Redes de meta-modelagem e suas aplicações no estudo de anotações de proteínas
title_full Redes de meta-modelagem e suas aplicações no estudo de anotações de proteínas
title_fullStr Redes de meta-modelagem e suas aplicações no estudo de anotações de proteínas
title_full_unstemmed Redes de meta-modelagem e suas aplicações no estudo de anotações de proteínas
title_sort Redes de meta-modelagem e suas aplicações no estudo de anotações de proteínas
author Reis, Renan dos
author_facet Reis, Renan dos
author_role author
dc.contributor.none.fl_str_mv Costa, Luciano da Fontoura
dc.contributor.author.fl_str_mv Reis, Renan dos
dc.subject.por.fl_str_mv Anotação de proteínas
Carbohydrate-active enzymes
Ciência de redes
Enzimas ativas em carboidratos
Meta-modelagem
Meta-modeling
Network science
Pattern recognition
Protein annotation
Reconhecimento de padrões
topic Anotação de proteínas
Carbohydrate-active enzymes
Ciência de redes
Enzimas ativas em carboidratos
Meta-modelagem
Meta-modeling
Network science
Pattern recognition
Protein annotation
Reconhecimento de padrões
description A crescente disponibilidade de dados tem motivado o desenvolvimento de novas abordagens de modelagem para sua análise e interpretação, incluindo métodos estatísticos, mineração de dados e aprendizado de máquina. Apesar de serem particularmente eficazes, os modelos baseados em dados tendem a ter interpretabilidade limitada, o que pode dificultar a compreensão de suas previsões. Para lidar com essas questões, este trabalho foca na extensão e aplicação de uma abordagem formal de meta-modelagem que possa fornecer subsídios para caracterizar, melhorar e integrar modelos baseados em dados. O procedimento proposto consiste na aplicação de ciência de redes na construção de uma rede de meta-modelagem que conecta conjuntos de dados a modelos científicos. Primeiro, a meta-modelagem envolve a delimitação de três domínios: um domínio de universo que contém todos os dados acessíveis para modelagem, um ambiente de dados com conjuntos de dados organizados, e uma estrutura de modelagem capaz de explicar esse ambiente de dados. Depois disso, a rede é construída com base em duas operações: a associação bijetiva entre conjuntos de dados e modelos (resumida no conceito de cartucho) e a conexão entre os elementos de cada conjunto de dados e cada modelo. Com essas propriedades, a rede permite avaliar quantitativamente a interação entre modelos na mesma estrutura de modelagem, além de facilitar a criação de novos modelos por meio da correspondência entre operações lógicas de modelos e operações entre conjuntos de dados. Esta abordagem foi aplicada a dois problemas de modelagem. No primeiro caso, o foco estava no reconhecimento de padrões em sequências binárias. Nele, descrevemos detalhadamente a interação entre seis modelos de padrões, além de derivar um modelo preciso para um conjunto de dados usando uma composição lógica de modelos pré-existentes, o que mostra o potencial dessa abordagem para estudar a detecção de padrões em sequências de símbolos. No segundo caso, o método foi aplicado para auxiliar a análise exploratória da anotação de domínios de proteínas em enzimas ativas em carboidratos, presente no banco de dados CAZy. O estudo desse meta-modelo revelou informações sobre a modularidade das classes funcionais e suas relações evolutivas e funcionais. Coletivamente, esses resultados indicam que a rede de meta-modelagem desenvolvida tem potencial para auxiliar na caracterização e aprimoramento da modelagem científica em múltiplas áreas, com aplicações promissoras para a análise de anotação de proteínas.
publishDate 2023
dc.date.none.fl_str_mv 2023-08-18
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/76/76133/tde-06092023-100207/
url https://www.teses.usp.br/teses/disponiveis/76/76133/tde-06092023-100207/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1809090455200071680