Explorando redes neurais de grafos para predição de interações miRNA–alvo associadas a câncer em grafos heterogêneos

Detalhes bibliográficos
Autor(a) principal: Fabiano, Emanoel Aurelio Vianna
Data de Publicação: 2023
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/261776
Resumo: MicroRNAs (miRNAs) são pequenos RNAs não codificantes que desempenham um papel fundamental na regulação da expressão gênica através da ligação com RNAs mensageiros (mRNAs) alvos. Estudos recentes mostram que os miRNAs estão envolvidos na regulação de mecanismos fisiológicos e de processos patológicos associados a doenças como câncer, sendo portanto importante identificar interações miRNA–alvo. Devido ao grande número de mRNAs alvos que podem existir para um único miRNA, as análises experimentais são bastante demoradas e dispendiosas. Assim, a predição computacional de alvos de miRNAs usando métodos de aprendizado de máquina (AM) tornou-se uma alternativa bastante interessante. Contudo, esta abordagem ainda apresenta limitações, como a complexidade em desenvolver os modelos com dados desbalanceados em razão do pouco número de exemplos negativos disponíveis, assim como o grande número de resultados falsos positivos. Em face destes desafios, este trabalho tem como objetivo desenvolver um modelo baseado em redes neurais de grafos para inferir padrões de interações miRNAs– alvos a partir de grafos heterogêneos, integrando dados de expressão gênica em câncer para introduzir o contexto de alterações moleculares presentes na doença. Exploramos o algoritmo HinSAGE, o qual é uma adaptação do algoritmo GraphSAGE para grafos hete rogêneos disponibilizado pela biblioteca StellarGraph, com um grafo contendo interações miRNA–mRNA e mRNA–mRNA obtidas da base de dados RNAInter, e dados de ex pressão diferencial para 15 tipos de câncer obtidos do projeto The Cancer Genome Atlas (TCGA). Nossos resultados indicam que o algoritmo HinSAGE foi capaz de aprender padrões de interações miRNA–alvo a partir da própria estrutura do grafo e dos atributos dos nós, apresentando precisão média de 77%, sensibilidade de 80%, F1-score de 78% e ROC AUC de 86% nos dados de teste. Nosso modelo também mostrou-se competitivo em relação a abordagens relacionadas, destacando-se com acurácia e F1-score sempre próxi mos aos 90% para interações de teste comuns. Por fim, o aprendizado baseado em grafo apresentou resultados superiores a um modelo treinado com uma rede neural tradicional utilizando somente os padrões de expressão gênica. Assim, acredita-se que o uso de redes neurais de grafos se estabelece como um novo horizonte de estudo na descoberta de inte rações miRNAs–alvos, possibilitando poder preditivo alto e balanceado, e a amostragem de interações negativas a partir do grafo base.
id URGS_839acc06c4d1b3c2ad7b6af116ddeb6d
oai_identifier_str oai:www.lume.ufrgs.br:10183/261776
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Fabiano, Emanoel Aurelio ViannaRecamonde-Mendoza, Mariana2023-07-05T03:47:37Z2023http://hdl.handle.net/10183/261776001172470MicroRNAs (miRNAs) são pequenos RNAs não codificantes que desempenham um papel fundamental na regulação da expressão gênica através da ligação com RNAs mensageiros (mRNAs) alvos. Estudos recentes mostram que os miRNAs estão envolvidos na regulação de mecanismos fisiológicos e de processos patológicos associados a doenças como câncer, sendo portanto importante identificar interações miRNA–alvo. Devido ao grande número de mRNAs alvos que podem existir para um único miRNA, as análises experimentais são bastante demoradas e dispendiosas. Assim, a predição computacional de alvos de miRNAs usando métodos de aprendizado de máquina (AM) tornou-se uma alternativa bastante interessante. Contudo, esta abordagem ainda apresenta limitações, como a complexidade em desenvolver os modelos com dados desbalanceados em razão do pouco número de exemplos negativos disponíveis, assim como o grande número de resultados falsos positivos. Em face destes desafios, este trabalho tem como objetivo desenvolver um modelo baseado em redes neurais de grafos para inferir padrões de interações miRNAs– alvos a partir de grafos heterogêneos, integrando dados de expressão gênica em câncer para introduzir o contexto de alterações moleculares presentes na doença. Exploramos o algoritmo HinSAGE, o qual é uma adaptação do algoritmo GraphSAGE para grafos hete rogêneos disponibilizado pela biblioteca StellarGraph, com um grafo contendo interações miRNA–mRNA e mRNA–mRNA obtidas da base de dados RNAInter, e dados de ex pressão diferencial para 15 tipos de câncer obtidos do projeto The Cancer Genome Atlas (TCGA). Nossos resultados indicam que o algoritmo HinSAGE foi capaz de aprender padrões de interações miRNA–alvo a partir da própria estrutura do grafo e dos atributos dos nós, apresentando precisão média de 77%, sensibilidade de 80%, F1-score de 78% e ROC AUC de 86% nos dados de teste. Nosso modelo também mostrou-se competitivo em relação a abordagens relacionadas, destacando-se com acurácia e F1-score sempre próxi mos aos 90% para interações de teste comuns. Por fim, o aprendizado baseado em grafo apresentou resultados superiores a um modelo treinado com uma rede neural tradicional utilizando somente os padrões de expressão gênica. Assim, acredita-se que o uso de redes neurais de grafos se estabelece como um novo horizonte de estudo na descoberta de inte rações miRNAs–alvos, possibilitando poder preditivo alto e balanceado, e a amostragem de interações negativas a partir do grafo base.MicroRNAs (miRNAs) are small non-coding RNAs that are crucial in regulating gene expression by binding to messenger RNAs (mRNAs) targets. Recent studies show that miRNAs regulate physiological mechanisms and pathological processes associated with diseases such as cancer. Therefore, it is essential to identify miRNA-target interactions. Due to the large number of target mRNAs that can exist for a single miRNA, experimen tal analyzes are pretty time-consuming and expensive. Thus, computational prediction of miRNA targets using machine learning (ML) methods has become an exciting alternative. However, this approach still has limitations, such as the complexity of developing models with imbalanced data due to the small number of negative examples available and many false positive results. Motivated by these challenges, this work aims to develop a model based on graph neural networks (GNNs) to infer patterns of miRNA-target interactions from heterogeneous graphs, integrating cancer gene expression data to introduce the con text of molecular alterations present in the disease We explored the HinSAGE algorithm, which is an adaptation of the GraphSAGE algorithm for heterogeneous graphs provided by the StellarGraph library, with a graph containing miRNA–mRNA and mRNA–mRNA interactions obtained from the RNAInter database, and differential expression data for 15 cancer types from the The Cancer Genome Atlas (TCGA) project. Our results indi cate that the HinSAGE algorithm was able to learn patterns of miRNA-target interactions from the graph structure itself and the node attributes, with an average precision of 77%, sensitivity of 80%, F1-score of 78 %, and ROC AUC of 86% on test data. Our model also proved competitive concerning related approaches, standing out with accuracy and F1-score close to 90% for common test interactions. Finally, graph-based learning pre sented better results than a model trained with a traditional neural network using only gene expression patterns. Thus, we believe that the use of GNNs establishes itself as a new horizon of study in the discovery of miRNA-target interactions, allowing high and balanced predictive power, and the sampling of interactions negatives from the base graph.application/pdfengAprendizado de máquinaRedes neuraisGrafosMiRNA target predictionGraphSAGEExplorando redes neurais de grafos para predição de interações miRNA–alvo associadas a câncer em grafos heterogêneosExploring graph neural networks to predict cancer-associated miRNA-target interactions in heterogeneous graphs info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2023mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001172470.pdf.txt001172470.pdf.txtExtracted Texttext/plain213635http://www.lume.ufrgs.br/bitstream/10183/261776/2/001172470.pdf.txtb5db293ced2530a83602b931b2650345MD52ORIGINAL001172470.pdfTexto completoapplication/pdf2574467http://www.lume.ufrgs.br/bitstream/10183/261776/1/001172470.pdf9fc23c23f8ecb165c170bc30e37fecaaMD5110183/2617762023-07-06 03:53:01.294343oai:www.lume.ufrgs.br:10183/261776Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532023-07-06T06:53:01Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Explorando redes neurais de grafos para predição de interações miRNA–alvo associadas a câncer em grafos heterogêneos
dc.title.alternative.pt.fl_str_mv Exploring graph neural networks to predict cancer-associated miRNA-target interactions in heterogeneous graphs
title Explorando redes neurais de grafos para predição de interações miRNA–alvo associadas a câncer em grafos heterogêneos
spellingShingle Explorando redes neurais de grafos para predição de interações miRNA–alvo associadas a câncer em grafos heterogêneos
Fabiano, Emanoel Aurelio Vianna
Aprendizado de máquina
Redes neurais
Grafos
MiRNA target prediction
GraphSAGE
title_short Explorando redes neurais de grafos para predição de interações miRNA–alvo associadas a câncer em grafos heterogêneos
title_full Explorando redes neurais de grafos para predição de interações miRNA–alvo associadas a câncer em grafos heterogêneos
title_fullStr Explorando redes neurais de grafos para predição de interações miRNA–alvo associadas a câncer em grafos heterogêneos
title_full_unstemmed Explorando redes neurais de grafos para predição de interações miRNA–alvo associadas a câncer em grafos heterogêneos
title_sort Explorando redes neurais de grafos para predição de interações miRNA–alvo associadas a câncer em grafos heterogêneos
author Fabiano, Emanoel Aurelio Vianna
author_facet Fabiano, Emanoel Aurelio Vianna
author_role author
dc.contributor.author.fl_str_mv Fabiano, Emanoel Aurelio Vianna
dc.contributor.advisor1.fl_str_mv Recamonde-Mendoza, Mariana
contributor_str_mv Recamonde-Mendoza, Mariana
dc.subject.por.fl_str_mv Aprendizado de máquina
Redes neurais
Grafos
topic Aprendizado de máquina
Redes neurais
Grafos
MiRNA target prediction
GraphSAGE
dc.subject.eng.fl_str_mv MiRNA target prediction
GraphSAGE
description MicroRNAs (miRNAs) são pequenos RNAs não codificantes que desempenham um papel fundamental na regulação da expressão gênica através da ligação com RNAs mensageiros (mRNAs) alvos. Estudos recentes mostram que os miRNAs estão envolvidos na regulação de mecanismos fisiológicos e de processos patológicos associados a doenças como câncer, sendo portanto importante identificar interações miRNA–alvo. Devido ao grande número de mRNAs alvos que podem existir para um único miRNA, as análises experimentais são bastante demoradas e dispendiosas. Assim, a predição computacional de alvos de miRNAs usando métodos de aprendizado de máquina (AM) tornou-se uma alternativa bastante interessante. Contudo, esta abordagem ainda apresenta limitações, como a complexidade em desenvolver os modelos com dados desbalanceados em razão do pouco número de exemplos negativos disponíveis, assim como o grande número de resultados falsos positivos. Em face destes desafios, este trabalho tem como objetivo desenvolver um modelo baseado em redes neurais de grafos para inferir padrões de interações miRNAs– alvos a partir de grafos heterogêneos, integrando dados de expressão gênica em câncer para introduzir o contexto de alterações moleculares presentes na doença. Exploramos o algoritmo HinSAGE, o qual é uma adaptação do algoritmo GraphSAGE para grafos hete rogêneos disponibilizado pela biblioteca StellarGraph, com um grafo contendo interações miRNA–mRNA e mRNA–mRNA obtidas da base de dados RNAInter, e dados de ex pressão diferencial para 15 tipos de câncer obtidos do projeto The Cancer Genome Atlas (TCGA). Nossos resultados indicam que o algoritmo HinSAGE foi capaz de aprender padrões de interações miRNA–alvo a partir da própria estrutura do grafo e dos atributos dos nós, apresentando precisão média de 77%, sensibilidade de 80%, F1-score de 78% e ROC AUC de 86% nos dados de teste. Nosso modelo também mostrou-se competitivo em relação a abordagens relacionadas, destacando-se com acurácia e F1-score sempre próxi mos aos 90% para interações de teste comuns. Por fim, o aprendizado baseado em grafo apresentou resultados superiores a um modelo treinado com uma rede neural tradicional utilizando somente os padrões de expressão gênica. Assim, acredita-se que o uso de redes neurais de grafos se estabelece como um novo horizonte de estudo na descoberta de inte rações miRNAs–alvos, possibilitando poder preditivo alto e balanceado, e a amostragem de interações negativas a partir do grafo base.
publishDate 2023
dc.date.accessioned.fl_str_mv 2023-07-05T03:47:37Z
dc.date.issued.fl_str_mv 2023
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/261776
dc.identifier.nrb.pt_BR.fl_str_mv 001172470
url http://hdl.handle.net/10183/261776
identifier_str_mv 001172470
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/261776/2/001172470.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/261776/1/001172470.pdf
bitstream.checksum.fl_str_mv b5db293ced2530a83602b931b2650345
9fc23c23f8ecb165c170bc30e37fecaa
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1810085622421913600