Agrupamento de instâncias em classes de equivalência para lidar com o problema da dimensionalidade em inferência de redes gênicas

Detalhes bibliográficos
Autor(a) principal: Montoya Cubas, Carlos Fernando
Data de Publicação: 2020
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFABC
Texto Completo: http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=121989
Resumo: Orientador: Prof. Dr. David Corrêa Martins Junior
id UFBC_2508c2bfbeb5834b4c699c3b1a460fa0
oai_identifier_str oai:BDTD:121989
network_acronym_str UFBC
network_name_str Repositório Institucional da UFABC
repository_id_str
spelling Agrupamento de instâncias em classes de equivalência para lidar com o problema da dimensionalidade em inferência de redes gênicasREDES DE REGULAÇÃO GÊNICAREDES BOOLEANASINFERÊNCIA DE REDES GÊNICASPROBLEMA DA DIMENSIONALIDADERETICULADOS BOOLEANOSSELEÇÃO DE CARACTERÍSTICASGENE REGULATORY NETWORKSBOOLEAN NETWORKSNETWORK INFERENCEDIMENSIONALITY PROBLEMBOOLEAN LATTICEFEATURE SELECTIONPROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABCOrientador: Prof. Dr. David Corrêa Martins JuniorTese (doutorado) - Universidade Federal do ABC, Programa de Pós-Graduação em Ciência da Computação, Santo André, 2020.A inferência de redes de interação gênica a partir de perfis de expressão é um dos problemas importantes pesquisados em biologia sistêmica, sendo considerado um problema em aberto. Diversas técnicas matemáticas, estatísticas e computacionais têm sido desenvolvidas para modelar, inferir e simular mecanismos de regulação gênica, sendo o problema de inferência o foco desta proposta. Tal proposta tem por objetivo continuar as pesquisas realizadas no mestrado, as quais envolveram o estudo de métodos de inferência de redes gênicas baseados em seleção de características (seleção do melhor conjunto de genes preditores do comportamento de um dado gene alvo em termos de suas expressões temporais de mRNA), propondo alternativas para aumentar o poder de estimação estatística em situações típicas nas quais o conjunto de amostras com perfis de expressão gênica é bem limitado e possuem elevada dimensionalidade (número de genes). Mais concretamente, no mestrado foram propostos m'métodos para aliviar o problema da dimensionalidade na inferência de redes Booleanas, através de partições no reticulado Booleano induzidas por combinações lineares dos valores dos genes preditores (instâncias dos preditores). Cada valor de combinação linear determina uma classe de equivalência entre as instâncias dos genes preditores. Neste trabalho de doutorado, o problema de agrupamento de instâncias foi reformulado como um problema de busca no reticulado de partições, além de formular estratégias de busca nesse reticulado com base em informações a priori (por exemplo: que uma rede gênica tende a ser composta majoritariamente por funções lineares e de canalização) para examinar um subespaço de partições potencialmente relevantes sem abrir mão da eficiência computacional. Adicionalmente desenvolvemos um método de transferência de aprendizado supervisionado obtido da inferência de redes geradas aleatoriamente (sintéticas) que busca estimar as dimensões corretas (graus) dos conjuntos de genes preditores para os respectivos genes alvos. Resultados experimentais através de dados simulados e dados reais de microarray do Plasmodium falciparum, um agente causador da malária, indicam que os métodos desenvolvidos, especialmente o método que busca por funções de canalização, obtêm redes competitivas tanto do ponto de vista topológico, como do ponto de vista da dinâmica da expressão gênica gerada pelas redes inferidas. A principal vantagem desses m'métodos de agrupamento 'e a superior capacidade de generalização para gerar o próximo estado do sistema com base em estados iniciais sorteados e que não estejam no conjunto de amostras de treinamento. Além disso, a adoção da estratégia de transferência de aprendizado dos graus se mostrou efetiva, conferindo uma vantagem a todos os m'métodos de inferência de redes gênicas considerados, incluindo o m'todo original sem agrupamento de instâncias.The inference of gene interaction networks from expression profiles is one of the relevant problems in systems biology, being considered an open problem. Several mathematical, statistical and computational techniques have been developed to model, infer and simulate gene regulation mechanisms, whereas the inference problem is the focus of this work. Our proposal is a continuation of the research conducted during the masters, which involved the study of gene networks inference based on feature selection (selection of the best subset of genes for predicting the behavior of a given target in terms of their temporal mRNA expressions), proposing alternatives to increase the statistical estimation power in typical situations where the set of samples with gene expression profiles is very limited and presents high dimensionality (number of genes). More concretely, during the masters we proposed methods to alleviate the curse of dimensionality in Boolean Networks inference, through Boolean lattice partitions induced by a linear combination of the predictor genes values (predictor instances). Each linear combination value determines an equivalence class between the predictor instances. In this work, the problem of instances grouping was reformulated as a partition lattice search problem, besides idealizing search strategies in this lattice based on prior information (eg. gene networks tend to be mostly composed by linear and canalizing functions) to examine a partition subspace potentially relevant without forgetting computational efficiency. In addition, we developed a method which transfers the supervised learning achieved from randomly generated (synthetic) networks inference aiming to estimate the correct dimension (degree) of the predictor gene sets for the corresponding target genes. Experimental results through simulated data and real microarray data from Plasmodium falciparum, a malaria agent, indicate that the developed methods, especially the method which searches for canalizing functions, achieves competitive networks considering both topology and gene expression dynamics generated by the inferred networks. The main advantage of these methods is the superior capacity of generalization to predict the next system state based on randomly chosen initial states which are not in the training set. Besides, the adoption of the strategy for transfer learning of the degrees sounds effective, benefitting all gene network inference methods considered, even the original method which does not group instances.Martins Junior, David CorrêaBarrera, JúniorBraga Neto, Ulisses de MendonçaHashimoto, Ronaldo FumioSantos, Carlos da Silva dosMontoya Cubas, Carlos Fernando2020info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdf129 f. : il.http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=121989http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=121989&midiaext=78928http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=121989&midiaext=78929Cover: http://biblioteca.ufabc.edu.br/php/capa.php?obra=121989porreponame:Repositório Institucional da UFABCinstname:Universidade Federal do ABC (UFABC)instacron:UFABCinfo:eu-repo/semantics/openAccess2021-11-18T15:39:24Zoai:BDTD:121989Repositório InstitucionalPUBhttp://www.biblioteca.ufabc.edu.br/oai/oai.phpopendoar:2021-11-18T15:39:24Repositório Institucional da UFABC - Universidade Federal do ABC (UFABC)false
dc.title.none.fl_str_mv Agrupamento de instâncias em classes de equivalência para lidar com o problema da dimensionalidade em inferência de redes gênicas
title Agrupamento de instâncias em classes de equivalência para lidar com o problema da dimensionalidade em inferência de redes gênicas
spellingShingle Agrupamento de instâncias em classes de equivalência para lidar com o problema da dimensionalidade em inferência de redes gênicas
Montoya Cubas, Carlos Fernando
REDES DE REGULAÇÃO GÊNICA
REDES BOOLEANAS
INFERÊNCIA DE REDES GÊNICAS
PROBLEMA DA DIMENSIONALIDADE
RETICULADOS BOOLEANOS
SELEÇÃO DE CARACTERÍSTICAS
GENE REGULATORY NETWORKS
BOOLEAN NETWORKS
NETWORK INFERENCE
DIMENSIONALITY PROBLEM
BOOLEAN LATTICE
FEATURE SELECTION
PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABC
title_short Agrupamento de instâncias em classes de equivalência para lidar com o problema da dimensionalidade em inferência de redes gênicas
title_full Agrupamento de instâncias em classes de equivalência para lidar com o problema da dimensionalidade em inferência de redes gênicas
title_fullStr Agrupamento de instâncias em classes de equivalência para lidar com o problema da dimensionalidade em inferência de redes gênicas
title_full_unstemmed Agrupamento de instâncias em classes de equivalência para lidar com o problema da dimensionalidade em inferência de redes gênicas
title_sort Agrupamento de instâncias em classes de equivalência para lidar com o problema da dimensionalidade em inferência de redes gênicas
author Montoya Cubas, Carlos Fernando
author_facet Montoya Cubas, Carlos Fernando
author_role author
dc.contributor.none.fl_str_mv Martins Junior, David Corrêa
Barrera, Júnior
Braga Neto, Ulisses de Mendonça
Hashimoto, Ronaldo Fumio
Santos, Carlos da Silva dos
dc.contributor.author.fl_str_mv Montoya Cubas, Carlos Fernando
dc.subject.por.fl_str_mv REDES DE REGULAÇÃO GÊNICA
REDES BOOLEANAS
INFERÊNCIA DE REDES GÊNICAS
PROBLEMA DA DIMENSIONALIDADE
RETICULADOS BOOLEANOS
SELEÇÃO DE CARACTERÍSTICAS
GENE REGULATORY NETWORKS
BOOLEAN NETWORKS
NETWORK INFERENCE
DIMENSIONALITY PROBLEM
BOOLEAN LATTICE
FEATURE SELECTION
PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABC
topic REDES DE REGULAÇÃO GÊNICA
REDES BOOLEANAS
INFERÊNCIA DE REDES GÊNICAS
PROBLEMA DA DIMENSIONALIDADE
RETICULADOS BOOLEANOS
SELEÇÃO DE CARACTERÍSTICAS
GENE REGULATORY NETWORKS
BOOLEAN NETWORKS
NETWORK INFERENCE
DIMENSIONALITY PROBLEM
BOOLEAN LATTICE
FEATURE SELECTION
PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABC
description Orientador: Prof. Dr. David Corrêa Martins Junior
publishDate 2020
dc.date.none.fl_str_mv 2020
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=121989
url http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=121989
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=121989&midiaext=78928
http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=121989&midiaext=78929
Cover: http://biblioteca.ufabc.edu.br/php/capa.php?obra=121989
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
129 f. : il.
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFABC
instname:Universidade Federal do ABC (UFABC)
instacron:UFABC
instname_str Universidade Federal do ABC (UFABC)
instacron_str UFABC
institution UFABC
reponame_str Repositório Institucional da UFABC
collection Repositório Institucional da UFABC
repository.name.fl_str_mv Repositório Institucional da UFABC - Universidade Federal do ABC (UFABC)
repository.mail.fl_str_mv
_version_ 1801502106266370048