Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq data
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10451/32636 |
Resumo: | Tese de mestrado em Bioinformática e Biologia Computacional, apresentada à Universidade de Lisboa, através da Faculdade de Ciências, em 2017 |
id |
RCAP_0bc9631cd021c67d6f60cddae634b241 |
---|---|
oai_identifier_str |
oai:repositorio.ul.pt:10451/32636 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq datamiRNAisomiRsmall-RNA-seqBioinformáticaPipelineTeses de mestrado - 2017Domínio/Área Científica::Ciências Naturais::Ciências BiológicasTese de mestrado em Bioinformática e Biologia Computacional, apresentada à Universidade de Lisboa, através da Faculdade de Ciências, em 2017A sequenciação de nova geração tornou-se, nos últimos anos, a tecnologia de eleição para o estudo do transcriptoma. Esta metodologia permite a sequenciação de pequenos RNAs não codificantes (small-RNA-seq) a serem expressos numa amostra, tendo contribuído para o aumento, a um ritmo nunca antes visto, da descrição de novos microRNAs (miRNAs) nos genomas de várias espécies. Principalmente, permite caracterizar a complexidade existente numa amostra de RNA, o que acabou por revelar a existência de pequenas variações no que toca ao comprimento e/ou à sequência de miRNAs quando comparados ao respectivo miRNA canónico. Os miRNAs que apresentam estas variações são denominados de isomiRs, sendo que as variações podem incluir a adição ou remoção de um ou mais nucleótidos nas extremidades da sequência ou podem resultar de eventos de editing no interior da sequência. Os miRNAs são conhecidos por actuarem como reguladores de expressão génica em várias espécies, sendo considerados essenciais para manter um bom funcionamento de inúmeras vias biológicas. No entanto, estudos recentes sugerem que as variações na sequência dos isomiRs têm como consequência uma alteração nos alvos destes (miRNAs), resultando em alterações ao nível da programação genética da célula. Apesar de vários estudos apontarem para este cenário, o impacto biológico dos isomiRs ainda não é extensivamente conhecido. Várias ferramentas têm sido desenvolvidas para a análise de dados de small-RNA-seq com o intuito de identificar isomiRs, no entanto, a maioria das ferramentas, não permite identificar todos os tipos possíveis de isomiRs. Adicionalmente, muitas das ferramentas disponibilizadas não realizam de um modo automatizado a inferência sobre o impacto da expressão destes isomiRs ao nível funcional, ou seja, estudar o impacto destas sequências ao nível dos pathways e de redes de regulação génica da célula. Por este motivo, o presente projecto teve como finalidade o desenvolvimento de um pipeline que integra a ferramenta IsomiR Window. A ferramenta em questão permite obter a anotação, quantificação e análise funcional de miRNAs/isomiRs provenientes de dados de small-RNA-seq. O pipeline desenvolvido tem a capacidade de receber múltiplos ficheiros de input para um total de duas condições experimentais, permitindo a identificação e quantificação dos diferentes tipos de pequenos RNAs não codificantes presentes em cada dataset. Posteriormente, é capaz de detectar e categorizar todos os tipos de isomiRs: modificações nas extremidades 3’ e 5’ relativamente ao miRNA canónico, eventos de editing internos, adição de tailings na extremidade 3’ relativamente ao miRNA canónico e possíveis combinações entre os diferentes tipos de isomiRs. Adicionalmente, o pipeline inclui uma etapa de análise de expressão diferencial e análise funcional, fornecendo informação relacionada com os targets de isomiRs específicos e com o seu impacto funcional em diversas vias biológicas. O pipeline integra ainda a funcionalidade de previsão de novos miRNAs. Finalmente, embora não de forma automatizada, é possível adicionar os novos miRNAs previstos à correspondente base de dados das espécies em estudo, permitindo, numa análise subsequente, a identificação de isomiRs derivados de potenciais novos pre-miRNAs. De modo a validar o pipeline desenvolvido, analisaram-se seis datasets que incluíram amostras de indivíduos saudáveis e amostras de indivíduos infectados com hepatite B. Esta análise incluiu a identificação, quantificação, análise de expressão diferencial e por fim, a previsão de alvos para os isomiRs de interesse. Como resultado, identificámos alterações significativas na expressão de alguns isomiRs que não tinham sido anteriormente reportados. Adicionalmente, a análise funcional permitiu identificar genes, que de acordo com a literatura, não têm sido associados a lesões no fígado.Since the development of deep sequencing for small non-coding RNAs (small-RNA-seq), several novel microRNAs (miRNAs) have been identified, which led to the observation that miRNAs can vary in length and/or sequence when comparing to their canonical form. These variants, named isomiRs, appear due to an addition or deletion of one or more nucleotides at the 5' or 3' ends or both. Additionally they can also result from internal editings in their sequence. Nowadays, it is already well-established that microRNAs play an important role as regulators of gene expression across multiple species, being critical for maintaining normal physiology and considered candidate biomarkers, regulators, and therapeutic targets for a wide spectrum of diseases. However, numerous recent studies suggest that isomiRs might regulate the expression of different targets in comparison to their respective canonical. Reports indicating differential functionality for isomiRs are still limited to particular variants, and although isomiRs are common, their biological impact is not yet fully understood. The growing number of available tools to perform small-RNA-seq data analyses shows that the interest in obtaining accurate miRNA annotation and quantification is rapidly increasing. However, several tools fail to provide an accurate identification of all forms of isomiRs and to allow a comprehensive analysis of their function. Here we present the development of the analysis pipeline embedded within the IsomiR Window tool, a bioinformatics tool for accurate annotation, quantification and functional analysis of microRNAs and their isoforms (isomiRs) from small-RNA-sequencing data. The developed pipeline enables the simultaneous processing of multiple data files for two experimental conditions, identifying all types of small non-coding RNAs present in each dataset. It further detects and categorizes all types of isomiRs, such as 5′ and 3′ miRNA modifications, internal editings and 3’ tailings. In addition, the pipeline includes a functional analysis module, providing information related to the targets of selected isomiRs and their functional impact in the cell genetic program in comparison with its canonical form. Additionally, the pipeline offers the possibility to perform novel miRNA prediction, and to add the novel predicted miRNAs to the database file of the species in question, in order to allow the identification of isomiRs derived from these predicted miRNAs, in a subsequent analysis. We applied this pipeline to analyze simultaneously six small-RNA-seq datasets from either healthy individuals or individuals with hepatitis B. The investigation led to the rapid and accurate identification, quantification and differential expression of several miRNAs and isomiRs. Our analysis allowed to identify significant changes at isomiR level, which were not previously investigated, as well as to identify genes that have not been previously associated with liver damage.Fonseca, Andreia de Jesus Amaral Gomes BarbosaCarmo, Maria Beatriz Duarte Pereira do,1960-Repositório da Universidade de LisboaViegas, Inês Correia2018-04-05T14:48:36Z201720172017-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10451/32636TID:201910993enginfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-08T16:27:00Zoai:repositorio.ul.pt:10451/32636Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:47:52.477186Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq data |
title |
Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq data |
spellingShingle |
Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq data Viegas, Inês Correia miRNA isomiR small-RNA-seq Bioinformática Pipeline Teses de mestrado - 2017 Domínio/Área Científica::Ciências Naturais::Ciências Biológicas |
title_short |
Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq data |
title_full |
Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq data |
title_fullStr |
Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq data |
title_full_unstemmed |
Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq data |
title_sort |
Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq data |
author |
Viegas, Inês Correia |
author_facet |
Viegas, Inês Correia |
author_role |
author |
dc.contributor.none.fl_str_mv |
Fonseca, Andreia de Jesus Amaral Gomes Barbosa Carmo, Maria Beatriz Duarte Pereira do,1960- Repositório da Universidade de Lisboa |
dc.contributor.author.fl_str_mv |
Viegas, Inês Correia |
dc.subject.por.fl_str_mv |
miRNA isomiR small-RNA-seq Bioinformática Pipeline Teses de mestrado - 2017 Domínio/Área Científica::Ciências Naturais::Ciências Biológicas |
topic |
miRNA isomiR small-RNA-seq Bioinformática Pipeline Teses de mestrado - 2017 Domínio/Área Científica::Ciências Naturais::Ciências Biológicas |
description |
Tese de mestrado em Bioinformática e Biologia Computacional, apresentada à Universidade de Lisboa, através da Faculdade de Ciências, em 2017 |
publishDate |
2017 |
dc.date.none.fl_str_mv |
2017 2017 2017-01-01T00:00:00Z 2018-04-05T14:48:36Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10451/32636 TID:201910993 |
url |
http://hdl.handle.net/10451/32636 |
identifier_str_mv |
TID:201910993 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799134405976915968 |