RNA-Gatherer: uma ferramenta computacional para anotação de RNAs não-codificantes

Detalhes bibliográficos
Autor(a) principal: Alves Sobrinho, Pitágoras de Azevedo
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFRN
Texto Completo: https://repositorio.ufrn.br/handle/123456789/32426
Resumo: RNAs não-codificantes são moléculas que desempenham papéis decisivos na regulação de genes, então identificá-los é essencial para entender a genética de uma espécie. Diversos fatores, como: baixo nível de expressão, amplo espectro de subtipos, atributos diversos, funções heterogêneas e ausência de homologia entre espécies; fazem a detecção de ncRNAs um desafio. Recentemente, novas estratégias de bioinformática vem tentando vencer esses desafios usando modelos de covariância e inteligência artificial. A co-expressão desses genes também vem sendo analisada computacionalmente para revelar quais são suas funções. No entanto, não há consenso sobre quais métricas e parâmetros usar no processo de prever funções. Em organismos pouco conhecidos, como Arapaima gigas, a falta de informações de referência aumenta essa dificuldade. Além disso, principalmente para RNAs longos não-codificantes, há poucas funções conhecidas, o que torna difícil explicar os papéis desses genes e avaliar a qualidade das predições. Neste trabalho, é descrito um software para descobrir os genes não-codificantes, de diversos tipos, e suas funções em espécies de eucariotos. Este foi validado com uma espécie modelo, o camundongo, e utilizado para explorar o panorama de ncRNAs numa espécie pouco estudada, o Arapaima gigas. A comparação da semelhança entre funções de genes co-expressos nos permitiu definir níveis de confiança para as métricas de calcular co-expressão, e assim, desenvolver uma pipeline de predição funções para lncRNA, a qual inclui métricas para calcular correlações não-lineares. O pacote de software descrito aqui fez 63307 anotações não-codificantes em A. gigas, incluindo 11 tipos de ncRNA e 4 de regiões cis-regulatórias. Dessas anotações, apenas 706 eram similares a ncRNAs já conhecidos em outras espécies e os restantes não haviam sido descritos anteriormente. A análise exploratória dos lncRNAs também revelou 19854 lncRNAs de tecido específico e 256 lncRNAs expressos de forma onipresente. Prever as funções dessas moléculas também revelou que elas estão envolvidas na pigmentação da pele, diferenciação sexual, crescimento e defesa contra tumores.
id UFRN_62bd7116b36a71382d7588198b0ebdb9
oai_identifier_str oai:https://repositorio.ufrn.br:123456789/32426
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling Alves Sobrinho, Pitágoras de Azevedohttp://lattes.cnpq.br/0435510237375618Souza, Jorge Estefano Santana deSantos, Ândrea Kely Campos Ribeiro dosFiguerola, Wilfredo Blanco2021-05-06T18:36:57Z2021-05-06T18:36:57Z2021-01-29ALVES SOBRINHO, Pitágoras de Azevedo. RNA-Gatherer: uma ferramenta computacional para anotação de RNAs não-codificantes. 2021. 75f. Dissertação (Mestrado em Bioinformática) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2021.https://repositorio.ufrn.br/handle/123456789/32426RNAs não-codificantes são moléculas que desempenham papéis decisivos na regulação de genes, então identificá-los é essencial para entender a genética de uma espécie. Diversos fatores, como: baixo nível de expressão, amplo espectro de subtipos, atributos diversos, funções heterogêneas e ausência de homologia entre espécies; fazem a detecção de ncRNAs um desafio. Recentemente, novas estratégias de bioinformática vem tentando vencer esses desafios usando modelos de covariância e inteligência artificial. A co-expressão desses genes também vem sendo analisada computacionalmente para revelar quais são suas funções. No entanto, não há consenso sobre quais métricas e parâmetros usar no processo de prever funções. Em organismos pouco conhecidos, como Arapaima gigas, a falta de informações de referência aumenta essa dificuldade. Além disso, principalmente para RNAs longos não-codificantes, há poucas funções conhecidas, o que torna difícil explicar os papéis desses genes e avaliar a qualidade das predições. Neste trabalho, é descrito um software para descobrir os genes não-codificantes, de diversos tipos, e suas funções em espécies de eucariotos. Este foi validado com uma espécie modelo, o camundongo, e utilizado para explorar o panorama de ncRNAs numa espécie pouco estudada, o Arapaima gigas. A comparação da semelhança entre funções de genes co-expressos nos permitiu definir níveis de confiança para as métricas de calcular co-expressão, e assim, desenvolver uma pipeline de predição funções para lncRNA, a qual inclui métricas para calcular correlações não-lineares. O pacote de software descrito aqui fez 63307 anotações não-codificantes em A. gigas, incluindo 11 tipos de ncRNA e 4 de regiões cis-regulatórias. Dessas anotações, apenas 706 eram similares a ncRNAs já conhecidos em outras espécies e os restantes não haviam sido descritos anteriormente. A análise exploratória dos lncRNAs também revelou 19854 lncRNAs de tecido específico e 256 lncRNAs expressos de forma onipresente. Prever as funções dessas moléculas também revelou que elas estão envolvidas na pigmentação da pele, diferenciação sexual, crescimento e defesa contra tumores.Non-coding RNAs are molecules that play decisive roles in several types of gene regulation. Identifying them is necessary for understanding the genetics of a species. Several factors, such as: low level of expression, the broad spectrum of subtypes, diverse attributes, heterogeneous functions and absence of homology between species; make the detection of ncRNAs genes a challenge. The latest bioinformatics strategies for detecting ncRNA genes have tried to identify their locations in the genomes and their secondary structures, using covariance models and artificial intelligence. The co-expression of these genes has been computationally analyzed in order to reveal their functional annotations. However, there is no consensus on which metrics and parameters to use in the process of predicting the functions of these molecules. In organisms little known, such as Arapaima gigas, the lack of reference information increases the difficulty. Additionally, even for known long non-coding RNAs, there is little functional information, which makes it difficult to explain the roles of these genes. In this work, we describe a software for discovering the non-coding genes, including their diverse types, and their functions in eukaryotic genomes. It was validated by annotating a model species (Mus musculus) and then used to explore the landscape of ncRNA in Arapaima gigas. Comparing the similarity between the functions of co-expressed genes allowed us to define confidence levels for the metrics that measure co-expression, and thus, develop a pipeline for predicting lncRNA functions, which includes metrics for non-linear correlations. The described software suite made 63307 non-coding annotations in A. gigas, including 11 types of ncRNA and 4 types of cis-regulatory regions. Of these annotations, only 706 are similar to ncRNAs already known in other species and the remaining were never described before. The exploratory analysis of lncRNA also revealed 19854 tissue specific lncRNAs and 256 lncRNAs ubiquitously expressed. Predicting the functions of these molecules revealed RNAs involved in skin pigmentation, sex differentiation, growth and defense against tumors.Universidade Federal do Rio Grande do NortePROGRAMA DE PÓS-GRADUAÇÃO EM BIOINFORMÁTICAUFRNBrasilncRNAArapaima GigasAnotação de genesPredição de funçõesRNA-Gatherer: uma ferramenta computacional para anotação de RNAs não-codificantesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNORIGINALRNAGathererferramenta_AlvesSobrinho_2021.pdfapplication/pdf6896534https://repositorio.ufrn.br/bitstream/123456789/32426/1/RNAGathererferramenta_AlvesSobrinho_2021.pdfb7692786dd7d32bb47e1ee691b90b0e0MD51123456789/324262021-05-11 20:52:41.608oai:https://repositorio.ufrn.br:123456789/32426Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2021-05-11T23:52:41Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.pt_BR.fl_str_mv RNA-Gatherer: uma ferramenta computacional para anotação de RNAs não-codificantes
title RNA-Gatherer: uma ferramenta computacional para anotação de RNAs não-codificantes
spellingShingle RNA-Gatherer: uma ferramenta computacional para anotação de RNAs não-codificantes
Alves Sobrinho, Pitágoras de Azevedo
ncRNA
Arapaima Gigas
Anotação de genes
Predição de funções
title_short RNA-Gatherer: uma ferramenta computacional para anotação de RNAs não-codificantes
title_full RNA-Gatherer: uma ferramenta computacional para anotação de RNAs não-codificantes
title_fullStr RNA-Gatherer: uma ferramenta computacional para anotação de RNAs não-codificantes
title_full_unstemmed RNA-Gatherer: uma ferramenta computacional para anotação de RNAs não-codificantes
title_sort RNA-Gatherer: uma ferramenta computacional para anotação de RNAs não-codificantes
author Alves Sobrinho, Pitágoras de Azevedo
author_facet Alves Sobrinho, Pitágoras de Azevedo
author_role author
dc.contributor.authorID.pt_BR.fl_str_mv
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/0435510237375618
dc.contributor.advisorID.pt_BR.fl_str_mv
dc.contributor.advisor-co1ID.pt_BR.fl_str_mv
dc.contributor.referees1.none.fl_str_mv Santos, Ândrea Kely Campos Ribeiro dos
dc.contributor.referees1ID.pt_BR.fl_str_mv
dc.contributor.author.fl_str_mv Alves Sobrinho, Pitágoras de Azevedo
dc.contributor.advisor-co1.fl_str_mv Souza, Jorge Estefano Santana de
dc.contributor.advisor1.fl_str_mv Figuerola, Wilfredo Blanco
contributor_str_mv Souza, Jorge Estefano Santana de
Figuerola, Wilfredo Blanco
dc.subject.por.fl_str_mv ncRNA
Arapaima Gigas
Anotação de genes
Predição de funções
topic ncRNA
Arapaima Gigas
Anotação de genes
Predição de funções
description RNAs não-codificantes são moléculas que desempenham papéis decisivos na regulação de genes, então identificá-los é essencial para entender a genética de uma espécie. Diversos fatores, como: baixo nível de expressão, amplo espectro de subtipos, atributos diversos, funções heterogêneas e ausência de homologia entre espécies; fazem a detecção de ncRNAs um desafio. Recentemente, novas estratégias de bioinformática vem tentando vencer esses desafios usando modelos de covariância e inteligência artificial. A co-expressão desses genes também vem sendo analisada computacionalmente para revelar quais são suas funções. No entanto, não há consenso sobre quais métricas e parâmetros usar no processo de prever funções. Em organismos pouco conhecidos, como Arapaima gigas, a falta de informações de referência aumenta essa dificuldade. Além disso, principalmente para RNAs longos não-codificantes, há poucas funções conhecidas, o que torna difícil explicar os papéis desses genes e avaliar a qualidade das predições. Neste trabalho, é descrito um software para descobrir os genes não-codificantes, de diversos tipos, e suas funções em espécies de eucariotos. Este foi validado com uma espécie modelo, o camundongo, e utilizado para explorar o panorama de ncRNAs numa espécie pouco estudada, o Arapaima gigas. A comparação da semelhança entre funções de genes co-expressos nos permitiu definir níveis de confiança para as métricas de calcular co-expressão, e assim, desenvolver uma pipeline de predição funções para lncRNA, a qual inclui métricas para calcular correlações não-lineares. O pacote de software descrito aqui fez 63307 anotações não-codificantes em A. gigas, incluindo 11 tipos de ncRNA e 4 de regiões cis-regulatórias. Dessas anotações, apenas 706 eram similares a ncRNAs já conhecidos em outras espécies e os restantes não haviam sido descritos anteriormente. A análise exploratória dos lncRNAs também revelou 19854 lncRNAs de tecido específico e 256 lncRNAs expressos de forma onipresente. Prever as funções dessas moléculas também revelou que elas estão envolvidas na pigmentação da pele, diferenciação sexual, crescimento e defesa contra tumores.
publishDate 2021
dc.date.accessioned.fl_str_mv 2021-05-06T18:36:57Z
dc.date.available.fl_str_mv 2021-05-06T18:36:57Z
dc.date.issued.fl_str_mv 2021-01-29
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv ALVES SOBRINHO, Pitágoras de Azevedo. RNA-Gatherer: uma ferramenta computacional para anotação de RNAs não-codificantes. 2021. 75f. Dissertação (Mestrado em Bioinformática) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2021.
dc.identifier.uri.fl_str_mv https://repositorio.ufrn.br/handle/123456789/32426
identifier_str_mv ALVES SOBRINHO, Pitágoras de Azevedo. RNA-Gatherer: uma ferramenta computacional para anotação de RNAs não-codificantes. 2021. 75f. Dissertação (Mestrado em Bioinformática) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2021.
url https://repositorio.ufrn.br/handle/123456789/32426
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.publisher.program.fl_str_mv PROGRAMA DE PÓS-GRADUAÇÃO EM BIOINFORMÁTICA
dc.publisher.initials.fl_str_mv UFRN
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
bitstream.url.fl_str_mv https://repositorio.ufrn.br/bitstream/123456789/32426/1/RNAGathererferramenta_AlvesSobrinho_2021.pdf
bitstream.checksum.fl_str_mv b7692786dd7d32bb47e1ee691b90b0e0
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv
_version_ 1814833057227603968