Inferência de redes de regulação gênica a partir de séries temporais via meta-heurísticas
Autor(a) principal: | |
---|---|
Data de Publicação: | 2024 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFJF |
Texto Completo: | https://repositorio.ufjf.br/jspui/handle/ufjf/16915 |
Resumo: | A inferência de redes de regulação gênica (GRNs - do inglês Gene Regulatory Networks) é um problema difícil e importante, com desafios amplamente endereçados na área denominada Biologia Sistêmica. Suas aplicações incluem biotecnologia e saúde, auxiliando no desenvolvimento de fármacos, uma vez que a compreensão de padrões nas interações gênicas pode levar a descobertas importantes relacionadas a doenças nos organismos. O sequencimento de RNA de célula única (scRNA-Seq - do inglês single-cell RNA Sequencing) proveu uma resolução sem precedentes para o campo da transcriptômica. Experimentos que utilizam scRNA-Seq são atrativos para a inferência de GRNs devido à geração de milhares de medidas independentes e à possibilidade de se obter uma visão pseudotemporal mais precisa da dinâmica da expressão gênica. Entretanto, nem todos os genes são expressos o tempo todo. A seleção de conjuntos de genes que modelam o fenômeno biológico desejado também constitui um desafio para a inferência de GRNs. As redes Booleanas e as modeladas por meio de sistemas de equações diferenciais ordinárias (EDOs) são comumente utilizadas para representar as GRNs. Contudo, não existe método padrão para discretização dos dados que são fornecidos às redes Booleanas. Redes Booleanas podem ser modeladas na forma de circuitos digitais. Dentre as técnicas de computação evolucionista, Programação Genética Cartesiana (CGP - do inglês Cartesian Genetic Programming) é apontada como a técnica mais eficiente para a evolução e otimização de circuitos lógicos combinacionais. Entretanto, técnicas de computação evolucionista não aparecem dentre os algoritmos destacados como estado da arte para a reconstrução de GRNs, motivado principalmente por problemas de escalabilidade. Além disso, o desconhecimento das redes ground-truth e não padronização da forma de atribuir qualidade à uma rede inferida aumentam o desafio ao resolver o problema. Neste trabalho propõese um framework que utiliza CGP para a inferência de GRNs Booleanas e a obtenção de um modelo contínuo a partir de dados na forma de séries temporais. Cada etapa do framework proposto é explorada, abrangendo (i) o pré-processamento dos dados de expressão gênica, (ii) a seleção de subconjuntos de genes via técnicas de agrupamento como forma de direcionar o processo de busca, (iii) as maneiras pelas quais os dados devem ser discretizados a fim de se obter um modelo Booleano, (iv) o comportamento dos operadores de variação genética na CGP, (v) a forma pela qual um modelo Booleano pode ser convertido em um sistema de EDOs e (vi) a determinação dos coeficientes numéricos deste sistema de EDOs via Estratégias Evolutivas. Propõe-se, também, um novo procedimento para discretização de dados de expressão gênica na forma de séries temporais. Por fim, uma revisão do processo metodológico adotado no contexto de inferência de redes de regulação gênica a partir de dados scRNA-Seq, abrangendo as características intrínsecas à tecnologia de sequenciamento, a seleção de genes de interesse, os motifs de rede, as redes de referência e as métricas e forma de avaliar as redes inferidas é apresentada. Como resultado, propõe-se um novo processo metodológico. Todas as propostas são avaliadas em problemas benchmark, que consideram dados sintéticos e reais obtidos por meio de microarrays e scRNA-Seq, dados oriundos de simulação estocástica, além de dados de organismos amplamente conhecidos e explorados na literatura, como Saccharomyces cerevisiae e Escherichia coli, e dados da competição DREAM4. Os resultados mostram que as propostas são superiores ou competitivas com os métodos estado da arte para a inferência de GRNs e fornecem uma solução interpretável que pode auxiliar os especialistas do domínio no campo de Biologia Sistêmica. Além disso, o processo metodológico proposto torna mais justa a comparação de diferentes algoritmos de inferência de GRNs. |
id |
UFJF_b9418e8939694f2f587dc1fd84082f9b |
---|---|
oai_identifier_str |
oai:hermes.cpd.ufjf.br:ufjf/16915 |
network_acronym_str |
UFJF |
network_name_str |
Repositório Institucional da UFJF |
repository_id_str |
|
spelling |
Bernardino, Heder Soareshttp://lattes.cnpq.br/7733681743453751Oliveira, Itamar Leite dehttp://lattes.cnpq.br/1732432475089669Camata, José Jerônimohttp://lattes.cnpq.br/7065024769982205Goliatt, Priscila Vanessa Zabala Caprileshttp://lattes.cnpq.br/3074561832181610Vieira, Alex Borgeshttp://lattes.cnpq.br/9037224811267705Augusto, Douglas Adrianohttp://lattes.cnpq.br/5364984237364336Goldschmidt, Ronaldo Ribeirohttp://lattes.cnpq.br/9602002760041175http://lattes.cnpq.br/3305201288921237Silva, José Eduardo Henriques da2024-07-19T10:55:19Z2024-07-182024-07-19T10:55:19Z2024-04-09https://repositorio.ufjf.br/jspui/handle/ufjf/16915A inferência de redes de regulação gênica (GRNs - do inglês Gene Regulatory Networks) é um problema difícil e importante, com desafios amplamente endereçados na área denominada Biologia Sistêmica. Suas aplicações incluem biotecnologia e saúde, auxiliando no desenvolvimento de fármacos, uma vez que a compreensão de padrões nas interações gênicas pode levar a descobertas importantes relacionadas a doenças nos organismos. O sequencimento de RNA de célula única (scRNA-Seq - do inglês single-cell RNA Sequencing) proveu uma resolução sem precedentes para o campo da transcriptômica. Experimentos que utilizam scRNA-Seq são atrativos para a inferência de GRNs devido à geração de milhares de medidas independentes e à possibilidade de se obter uma visão pseudotemporal mais precisa da dinâmica da expressão gênica. Entretanto, nem todos os genes são expressos o tempo todo. A seleção de conjuntos de genes que modelam o fenômeno biológico desejado também constitui um desafio para a inferência de GRNs. As redes Booleanas e as modeladas por meio de sistemas de equações diferenciais ordinárias (EDOs) são comumente utilizadas para representar as GRNs. Contudo, não existe método padrão para discretização dos dados que são fornecidos às redes Booleanas. Redes Booleanas podem ser modeladas na forma de circuitos digitais. Dentre as técnicas de computação evolucionista, Programação Genética Cartesiana (CGP - do inglês Cartesian Genetic Programming) é apontada como a técnica mais eficiente para a evolução e otimização de circuitos lógicos combinacionais. Entretanto, técnicas de computação evolucionista não aparecem dentre os algoritmos destacados como estado da arte para a reconstrução de GRNs, motivado principalmente por problemas de escalabilidade. Além disso, o desconhecimento das redes ground-truth e não padronização da forma de atribuir qualidade à uma rede inferida aumentam o desafio ao resolver o problema. Neste trabalho propõese um framework que utiliza CGP para a inferência de GRNs Booleanas e a obtenção de um modelo contínuo a partir de dados na forma de séries temporais. Cada etapa do framework proposto é explorada, abrangendo (i) o pré-processamento dos dados de expressão gênica, (ii) a seleção de subconjuntos de genes via técnicas de agrupamento como forma de direcionar o processo de busca, (iii) as maneiras pelas quais os dados devem ser discretizados a fim de se obter um modelo Booleano, (iv) o comportamento dos operadores de variação genética na CGP, (v) a forma pela qual um modelo Booleano pode ser convertido em um sistema de EDOs e (vi) a determinação dos coeficientes numéricos deste sistema de EDOs via Estratégias Evolutivas. Propõe-se, também, um novo procedimento para discretização de dados de expressão gênica na forma de séries temporais. Por fim, uma revisão do processo metodológico adotado no contexto de inferência de redes de regulação gênica a partir de dados scRNA-Seq, abrangendo as características intrínsecas à tecnologia de sequenciamento, a seleção de genes de interesse, os motifs de rede, as redes de referência e as métricas e forma de avaliar as redes inferidas é apresentada. Como resultado, propõe-se um novo processo metodológico. Todas as propostas são avaliadas em problemas benchmark, que consideram dados sintéticos e reais obtidos por meio de microarrays e scRNA-Seq, dados oriundos de simulação estocástica, além de dados de organismos amplamente conhecidos e explorados na literatura, como Saccharomyces cerevisiae e Escherichia coli, e dados da competição DREAM4. Os resultados mostram que as propostas são superiores ou competitivas com os métodos estado da arte para a inferência de GRNs e fornecem uma solução interpretável que pode auxiliar os especialistas do domínio no campo de Biologia Sistêmica. Além disso, o processo metodológico proposto torna mais justa a comparação de diferentes algoritmos de inferência de GRNs.The inference of gene regulatory networks (GRNs) is a difficult and important problem, with challenges largely addressed in the area called Systems Biology. Its applications include biotechnology and health, assisting in the development of drugs, since understanding patterns in gene interactions can lead to important discoveries related to diseases in organisms. Single-cell RNA sequencing (scRNA-Seq) has provided unprecedented resolution to the field of transcriptomics. Experiments using scRNA-Seq are attractive for the inference of GRNs due to the generation of thousands of independent measurements and the possibility of obtaining a more accurate pseudotemporal view of the dynamics of gene expression. However, not all genes are expressed all the time. The selection of gene subsets that model the desired biological phenomenon also constitutes a challenge for the inference of GRNs. Boolean networks and those modeled through systems of ordinary differential equations (ODEs) are commonly used to represent GRNs. Nevertheless, there is no standard method for discretizing the data that is provided to Boolean networks. Boolean networks can be modeled in the form of digital circuits. Among evolutionary computing techniques, Cartesian Genetic Programming (CGP) is considered the most efficient technique for the evolution and optimization of combinational logic circuits. However, evolutionary computing techniques do not appear among the algorithms highlighted as state of the art for reconstructing GRNs, mainly motivated by scalability problems. Furthermore, the lack of knowledge about ground-truth networks and the non-standardization of the way to attribute quality to an inferred network increase the challenge when solving the problem. In this work, we propose a framework that uses CGP to infer Boolean GRNs and obtain a continuous model from data in the form of time series. Each step of the proposed framework is explored, covering the pre-processing of gene expression data, the selection of subsets of genes via clustering techniques as a way of directing the search process, the ways in which the data should be discretized in order to obtain a Boolean model, the behavior of the genetic variation operators in the CGP, the way in which a Boolean model can be converted into a system of ODEs and the determination of the numerical coefficients of this system of ODEs via Evolutionary Strategies. A new procedure for discretizing gene expression data in the form of time series is also proposed. Finally, a review of the methodological process adopted in the context of inferring gene regulation networks from scRNA-Seq data, covering the intrinsic characteristics of sequencing technology, the selection of genes of interest, the network motifs , the reference networks and the metrics and way to evaluate the inferred networks are presented. As a result, a new methodological process is proposed. All proposals are evaluated in benchmark problems, which consider synthetic and real data obtained through microarrays and scRNA-Seq, data from stochastic simulation, in addition to data from organisms widely known and explored in the literature , such as Saccharomyces cerevisiae and Escherichia coli, and data from the DREAM4 competition. The results show that the proposals are superior or competitive with state-of-the-art methods for the inference of GRNs and provide an interpretable solution that can assist domain experts in the field of Systemic Biology. Furthermore, the proposed methodological process makes the comparison of different GRN inference algorithms fairer.CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorporUniversidade Federal de Juiz de Fora (UFJF)Programa de Pós-graduação em Modelagem ComputacionalUFJFBrasilICE – Instituto de Ciências ExatasAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessCNPQ::CIENCIAS EXATAS E DA TERRARede de regulação gênicaMetaheurísticasProgramação genética cartesianaGene regulatory networkMetaheuristicsCartesian genetic programmingInferência de redes de regulação gênica a partir de séries temporais via meta-heurísticasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisreponame:Repositório Institucional da UFJFinstname:Universidade Federal de Juiz de Fora (UFJF)instacron:UFJFORIGINALjoseeduardohenriquesdasilva.pdfjoseeduardohenriquesdasilva.pdfapplication/pdf9969945https://repositorio.ufjf.br/jspui/bitstream/ufjf/16915/1/joseeduardohenriquesdasilva.pdf921616643ee3495cdeed3d936f1d8f0fMD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufjf.br/jspui/bitstream/ufjf/16915/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ufjf.br/jspui/bitstream/ufjf/16915/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD53TEXTjoseeduardohenriquesdasilva.pdf.txtjoseeduardohenriquesdasilva.pdf.txtExtracted texttext/plain490976https://repositorio.ufjf.br/jspui/bitstream/ufjf/16915/4/joseeduardohenriquesdasilva.pdf.txt87ae618cb1effd1b29f5aee6d26fb9e5MD54THUMBNAILjoseeduardohenriquesdasilva.pdf.jpgjoseeduardohenriquesdasilva.pdf.jpgGenerated Thumbnailimage/jpeg1175https://repositorio.ufjf.br/jspui/bitstream/ufjf/16915/5/joseeduardohenriquesdasilva.pdf.jpg88a508da45247a26d9ef450ccabefdd2MD55ufjf/169152024-07-20 03:04:42.618oai:hermes.cpd.ufjf.br:ufjf/16915Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.ufjf.br/oai/requestopendoar:2024-07-20T06:04:42Repositório Institucional da UFJF - Universidade Federal de Juiz de Fora (UFJF)false |
dc.title.pt_BR.fl_str_mv |
Inferência de redes de regulação gênica a partir de séries temporais via meta-heurísticas |
title |
Inferência de redes de regulação gênica a partir de séries temporais via meta-heurísticas |
spellingShingle |
Inferência de redes de regulação gênica a partir de séries temporais via meta-heurísticas Silva, José Eduardo Henriques da CNPQ::CIENCIAS EXATAS E DA TERRA Rede de regulação gênica Metaheurísticas Programação genética cartesiana Gene regulatory network Metaheuristics Cartesian genetic programming |
title_short |
Inferência de redes de regulação gênica a partir de séries temporais via meta-heurísticas |
title_full |
Inferência de redes de regulação gênica a partir de séries temporais via meta-heurísticas |
title_fullStr |
Inferência de redes de regulação gênica a partir de séries temporais via meta-heurísticas |
title_full_unstemmed |
Inferência de redes de regulação gênica a partir de séries temporais via meta-heurísticas |
title_sort |
Inferência de redes de regulação gênica a partir de séries temporais via meta-heurísticas |
author |
Silva, José Eduardo Henriques da |
author_facet |
Silva, José Eduardo Henriques da |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Bernardino, Heder Soares |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/7733681743453751 |
dc.contributor.advisor-co1.fl_str_mv |
Oliveira, Itamar Leite de |
dc.contributor.advisor-co1Lattes.fl_str_mv |
http://lattes.cnpq.br/1732432475089669 |
dc.contributor.advisor-co2.fl_str_mv |
Camata, José Jerônimo |
dc.contributor.advisor-co2Lattes.fl_str_mv |
http://lattes.cnpq.br/7065024769982205 |
dc.contributor.referee1.fl_str_mv |
Goliatt, Priscila Vanessa Zabala Capriles |
dc.contributor.referee1Lattes.fl_str_mv |
http://lattes.cnpq.br/3074561832181610 |
dc.contributor.referee2.fl_str_mv |
Vieira, Alex Borges |
dc.contributor.referee2Lattes.fl_str_mv |
http://lattes.cnpq.br/9037224811267705 |
dc.contributor.referee3.fl_str_mv |
Augusto, Douglas Adriano |
dc.contributor.referee3Lattes.fl_str_mv |
http://lattes.cnpq.br/5364984237364336 |
dc.contributor.referee4.fl_str_mv |
Goldschmidt, Ronaldo Ribeiro |
dc.contributor.referee4Lattes.fl_str_mv |
http://lattes.cnpq.br/9602002760041175 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/3305201288921237 |
dc.contributor.author.fl_str_mv |
Silva, José Eduardo Henriques da |
contributor_str_mv |
Bernardino, Heder Soares Oliveira, Itamar Leite de Camata, José Jerônimo Goliatt, Priscila Vanessa Zabala Capriles Vieira, Alex Borges Augusto, Douglas Adriano Goldschmidt, Ronaldo Ribeiro |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA Rede de regulação gênica Metaheurísticas Programação genética cartesiana Gene regulatory network Metaheuristics Cartesian genetic programming |
dc.subject.por.fl_str_mv |
Rede de regulação gênica Metaheurísticas Programação genética cartesiana Gene regulatory network Metaheuristics Cartesian genetic programming |
description |
A inferência de redes de regulação gênica (GRNs - do inglês Gene Regulatory Networks) é um problema difícil e importante, com desafios amplamente endereçados na área denominada Biologia Sistêmica. Suas aplicações incluem biotecnologia e saúde, auxiliando no desenvolvimento de fármacos, uma vez que a compreensão de padrões nas interações gênicas pode levar a descobertas importantes relacionadas a doenças nos organismos. O sequencimento de RNA de célula única (scRNA-Seq - do inglês single-cell RNA Sequencing) proveu uma resolução sem precedentes para o campo da transcriptômica. Experimentos que utilizam scRNA-Seq são atrativos para a inferência de GRNs devido à geração de milhares de medidas independentes e à possibilidade de se obter uma visão pseudotemporal mais precisa da dinâmica da expressão gênica. Entretanto, nem todos os genes são expressos o tempo todo. A seleção de conjuntos de genes que modelam o fenômeno biológico desejado também constitui um desafio para a inferência de GRNs. As redes Booleanas e as modeladas por meio de sistemas de equações diferenciais ordinárias (EDOs) são comumente utilizadas para representar as GRNs. Contudo, não existe método padrão para discretização dos dados que são fornecidos às redes Booleanas. Redes Booleanas podem ser modeladas na forma de circuitos digitais. Dentre as técnicas de computação evolucionista, Programação Genética Cartesiana (CGP - do inglês Cartesian Genetic Programming) é apontada como a técnica mais eficiente para a evolução e otimização de circuitos lógicos combinacionais. Entretanto, técnicas de computação evolucionista não aparecem dentre os algoritmos destacados como estado da arte para a reconstrução de GRNs, motivado principalmente por problemas de escalabilidade. Além disso, o desconhecimento das redes ground-truth e não padronização da forma de atribuir qualidade à uma rede inferida aumentam o desafio ao resolver o problema. Neste trabalho propõese um framework que utiliza CGP para a inferência de GRNs Booleanas e a obtenção de um modelo contínuo a partir de dados na forma de séries temporais. Cada etapa do framework proposto é explorada, abrangendo (i) o pré-processamento dos dados de expressão gênica, (ii) a seleção de subconjuntos de genes via técnicas de agrupamento como forma de direcionar o processo de busca, (iii) as maneiras pelas quais os dados devem ser discretizados a fim de se obter um modelo Booleano, (iv) o comportamento dos operadores de variação genética na CGP, (v) a forma pela qual um modelo Booleano pode ser convertido em um sistema de EDOs e (vi) a determinação dos coeficientes numéricos deste sistema de EDOs via Estratégias Evolutivas. Propõe-se, também, um novo procedimento para discretização de dados de expressão gênica na forma de séries temporais. Por fim, uma revisão do processo metodológico adotado no contexto de inferência de redes de regulação gênica a partir de dados scRNA-Seq, abrangendo as características intrínsecas à tecnologia de sequenciamento, a seleção de genes de interesse, os motifs de rede, as redes de referência e as métricas e forma de avaliar as redes inferidas é apresentada. Como resultado, propõe-se um novo processo metodológico. Todas as propostas são avaliadas em problemas benchmark, que consideram dados sintéticos e reais obtidos por meio de microarrays e scRNA-Seq, dados oriundos de simulação estocástica, além de dados de organismos amplamente conhecidos e explorados na literatura, como Saccharomyces cerevisiae e Escherichia coli, e dados da competição DREAM4. Os resultados mostram que as propostas são superiores ou competitivas com os métodos estado da arte para a inferência de GRNs e fornecem uma solução interpretável que pode auxiliar os especialistas do domínio no campo de Biologia Sistêmica. Além disso, o processo metodológico proposto torna mais justa a comparação de diferentes algoritmos de inferência de GRNs. |
publishDate |
2024 |
dc.date.accessioned.fl_str_mv |
2024-07-19T10:55:19Z |
dc.date.available.fl_str_mv |
2024-07-18 2024-07-19T10:55:19Z |
dc.date.issued.fl_str_mv |
2024-04-09 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufjf.br/jspui/handle/ufjf/16915 |
url |
https://repositorio.ufjf.br/jspui/handle/ufjf/16915 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Juiz de Fora (UFJF) |
dc.publisher.program.fl_str_mv |
Programa de Pós-graduação em Modelagem Computacional |
dc.publisher.initials.fl_str_mv |
UFJF |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
ICE – Instituto de Ciências Exatas |
publisher.none.fl_str_mv |
Universidade Federal de Juiz de Fora (UFJF) |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFJF instname:Universidade Federal de Juiz de Fora (UFJF) instacron:UFJF |
instname_str |
Universidade Federal de Juiz de Fora (UFJF) |
instacron_str |
UFJF |
institution |
UFJF |
reponame_str |
Repositório Institucional da UFJF |
collection |
Repositório Institucional da UFJF |
bitstream.url.fl_str_mv |
https://repositorio.ufjf.br/jspui/bitstream/ufjf/16915/1/joseeduardohenriquesdasilva.pdf https://repositorio.ufjf.br/jspui/bitstream/ufjf/16915/2/license_rdf https://repositorio.ufjf.br/jspui/bitstream/ufjf/16915/3/license.txt https://repositorio.ufjf.br/jspui/bitstream/ufjf/16915/4/joseeduardohenriquesdasilva.pdf.txt https://repositorio.ufjf.br/jspui/bitstream/ufjf/16915/5/joseeduardohenriquesdasilva.pdf.jpg |
bitstream.checksum.fl_str_mv |
921616643ee3495cdeed3d936f1d8f0f e39d27027a6cc9cb039ad269a5db8e34 8a4605be74aa9ea9d79846c1fba20a33 87ae618cb1effd1b29f5aee6d26fb9e5 88a508da45247a26d9ef450ccabefdd2 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFJF - Universidade Federal de Juiz de Fora (UFJF) |
repository.mail.fl_str_mv |
|
_version_ |
1813193948335702016 |