Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq data

Detalhes bibliográficos
Autor(a) principal: Viegas, Inês Correia
Data de Publicação: 2017
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10451/32636
Resumo: Tese de mestrado em Bioinformática e Biologia Computacional, apresentada à Universidade de Lisboa, através da Faculdade de Ciências, em 2017
id RCAP_0bc9631cd021c67d6f60cddae634b241
oai_identifier_str oai:repositorio.ul.pt:10451/32636
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq datamiRNAisomiRsmall-RNA-seqBioinformáticaPipelineTeses de mestrado - 2017Domínio/Área Científica::Ciências Naturais::Ciências BiológicasTese de mestrado em Bioinformática e Biologia Computacional, apresentada à Universidade de Lisboa, através da Faculdade de Ciências, em 2017A sequenciação de nova geração tornou-se, nos últimos anos, a tecnologia de eleição para o estudo do transcriptoma. Esta metodologia permite a sequenciação de pequenos RNAs não codificantes (small-RNA-seq) a serem expressos numa amostra, tendo contribuído para o aumento, a um ritmo nunca antes visto, da descrição de novos microRNAs (miRNAs) nos genomas de várias espécies. Principalmente, permite caracterizar a complexidade existente numa amostra de RNA, o que acabou por revelar a existência de pequenas variações no que toca ao comprimento e/ou à sequência de miRNAs quando comparados ao respectivo miRNA canónico. Os miRNAs que apresentam estas variações são denominados de isomiRs, sendo que as variações podem incluir a adição ou remoção de um ou mais nucleótidos nas extremidades da sequência ou podem resultar de eventos de editing no interior da sequência. Os miRNAs são conhecidos por actuarem como reguladores de expressão génica em várias espécies, sendo considerados essenciais para manter um bom funcionamento de inúmeras vias biológicas. No entanto, estudos recentes sugerem que as variações na sequência dos isomiRs têm como consequência uma alteração nos alvos destes (miRNAs), resultando em alterações ao nível da programação genética da célula. Apesar de vários estudos apontarem para este cenário, o impacto biológico dos isomiRs ainda não é extensivamente conhecido. Várias ferramentas têm sido desenvolvidas para a análise de dados de small-RNA-seq com o intuito de identificar isomiRs, no entanto, a maioria das ferramentas, não permite identificar todos os tipos possíveis de isomiRs. Adicionalmente, muitas das ferramentas disponibilizadas não realizam de um modo automatizado a inferência sobre o impacto da expressão destes isomiRs ao nível funcional, ou seja, estudar o impacto destas sequências ao nível dos pathways e de redes de regulação génica da célula. Por este motivo, o presente projecto teve como finalidade o desenvolvimento de um pipeline que integra a ferramenta IsomiR Window. A ferramenta em questão permite obter a anotação, quantificação e análise funcional de miRNAs/isomiRs provenientes de dados de small-RNA-seq. O pipeline desenvolvido tem a capacidade de receber múltiplos ficheiros de input para um total de duas condições experimentais, permitindo a identificação e quantificação dos diferentes tipos de pequenos RNAs não codificantes presentes em cada dataset. Posteriormente, é capaz de detectar e categorizar todos os tipos de isomiRs: modificações nas extremidades 3’ e 5’ relativamente ao miRNA canónico, eventos de editing internos, adição de tailings na extremidade 3’ relativamente ao miRNA canónico e possíveis combinações entre os diferentes tipos de isomiRs. Adicionalmente, o pipeline inclui uma etapa de análise de expressão diferencial e análise funcional, fornecendo informação relacionada com os targets de isomiRs específicos e com o seu impacto funcional em diversas vias biológicas. O pipeline integra ainda a funcionalidade de previsão de novos miRNAs. Finalmente, embora não de forma automatizada, é possível adicionar os novos miRNAs previstos à correspondente base de dados das espécies em estudo, permitindo, numa análise subsequente, a identificação de isomiRs derivados de potenciais novos pre-miRNAs. De modo a validar o pipeline desenvolvido, analisaram-se seis datasets que incluíram amostras de indivíduos saudáveis e amostras de indivíduos infectados com hepatite B. Esta análise incluiu a identificação, quantificação, análise de expressão diferencial e por fim, a previsão de alvos para os isomiRs de interesse. Como resultado, identificámos alterações significativas na expressão de alguns isomiRs que não tinham sido anteriormente reportados. Adicionalmente, a análise funcional permitiu identificar genes, que de acordo com a literatura, não têm sido associados a lesões no fígado.Since the development of deep sequencing for small non-coding RNAs (small-RNA-seq), several novel microRNAs (miRNAs) have been identified, which led to the observation that miRNAs can vary in length and/or sequence when comparing to their canonical form. These variants, named isomiRs, appear due to an addition or deletion of one or more nucleotides at the 5' or 3' ends or both. Additionally they can also result from internal editings in their sequence. Nowadays, it is already well-established that microRNAs play an important role as regulators of gene expression across multiple species, being critical for maintaining normal physiology and considered candidate biomarkers, regulators, and therapeutic targets for a wide spectrum of diseases. However, numerous recent studies suggest that isomiRs might regulate the expression of different targets in comparison to their respective canonical. Reports indicating differential functionality for isomiRs are still limited to particular variants, and although isomiRs are common, their biological impact is not yet fully understood. The growing number of available tools to perform small-RNA-seq data analyses shows that the interest in obtaining accurate miRNA annotation and quantification is rapidly increasing. However, several tools fail to provide an accurate identification of all forms of isomiRs and to allow a comprehensive analysis of their function. Here we present the development of the analysis pipeline embedded within the IsomiR Window tool, a bioinformatics tool for accurate annotation, quantification and functional analysis of microRNAs and their isoforms (isomiRs) from small-RNA-sequencing data. The developed pipeline enables the simultaneous processing of multiple data files for two experimental conditions, identifying all types of small non-coding RNAs present in each dataset. It further detects and categorizes all types of isomiRs, such as 5′ and 3′ miRNA modifications, internal editings and 3’ tailings. In addition, the pipeline includes a functional analysis module, providing information related to the targets of selected isomiRs and their functional impact in the cell genetic program in comparison with its canonical form. Additionally, the pipeline offers the possibility to perform novel miRNA prediction, and to add the novel predicted miRNAs to the database file of the species in question, in order to allow the identification of isomiRs derived from these predicted miRNAs, in a subsequent analysis. We applied this pipeline to analyze simultaneously six small-RNA-seq datasets from either healthy individuals or individuals with hepatitis B. The investigation led to the rapid and accurate identification, quantification and differential expression of several miRNAs and isomiRs. Our analysis allowed to identify significant changes at isomiR level, which were not previously investigated, as well as to identify genes that have not been previously associated with liver damage.Fonseca, Andreia de Jesus Amaral Gomes BarbosaCarmo, Maria Beatriz Duarte Pereira do,1960-Repositório da Universidade de LisboaViegas, Inês Correia2018-04-05T14:48:36Z201720172017-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10451/32636TID:201910993enginfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-08T16:27:00Zoai:repositorio.ul.pt:10451/32636Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:47:52.477186Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq data
title Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq data
spellingShingle Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq data
Viegas, Inês Correia
miRNA
isomiR
small-RNA-seq
Bioinformática
Pipeline
Teses de mestrado - 2017
Domínio/Área Científica::Ciências Naturais::Ciências Biológicas
title_short Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq data
title_full Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq data
title_fullStr Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq data
title_full_unstemmed Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq data
title_sort Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq data
author Viegas, Inês Correia
author_facet Viegas, Inês Correia
author_role author
dc.contributor.none.fl_str_mv Fonseca, Andreia de Jesus Amaral Gomes Barbosa
Carmo, Maria Beatriz Duarte Pereira do,1960-
Repositório da Universidade de Lisboa
dc.contributor.author.fl_str_mv Viegas, Inês Correia
dc.subject.por.fl_str_mv miRNA
isomiR
small-RNA-seq
Bioinformática
Pipeline
Teses de mestrado - 2017
Domínio/Área Científica::Ciências Naturais::Ciências Biológicas
topic miRNA
isomiR
small-RNA-seq
Bioinformática
Pipeline
Teses de mestrado - 2017
Domínio/Área Científica::Ciências Naturais::Ciências Biológicas
description Tese de mestrado em Bioinformática e Biologia Computacional, apresentada à Universidade de Lisboa, através da Faculdade de Ciências, em 2017
publishDate 2017
dc.date.none.fl_str_mv 2017
2017
2017-01-01T00:00:00Z
2018-04-05T14:48:36Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10451/32636
TID:201910993
url http://hdl.handle.net/10451/32636
identifier_str_mv TID:201910993
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134405976915968