Desenvolvimento de um sistema integrado para o tratamento de dados de sequenciação de próxima geração

Detalhes bibliográficos
Autor(a) principal: Reis, Marco André Ferreira
Data de Publicação: 2013
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/1822/27893
Resumo: Dissertação de mestrado em Bioinformática
id RCAP_001e587898399605ca3df78f248dfcd1
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/27893
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str
spelling Desenvolvimento de um sistema integrado para o tratamento de dados de sequenciação de próxima geração577.2:681.3681.3:577.261:681.3681.3:61Dissertação de mestrado em BioinformáticaA sequenciação de próxima geração veio permitir a sequenciação em paralelo de milhões de pares de bases de DNA / RNA, tendo tido desde o início um grande impacto, ao ponto de se tornar o método escolhido em projetos de grande escala, em detrimento do método de Sanger. Entre as principais aplicações desta tecnologia encontram-se a análise em larga escala da metilação de DNA, o Chip-Seq para análise da interação entre proteínas e DNA ou RNA, e o mapeamento de rearranjos estruturais. Destacam-se, especialmente, a sequenciação de novos organismos ou indivíduos, o estudo de polimorfismos de nucleótido único (DNA-Seq) e a análise de expressão genética (RNA-Seq). Neste trabalho, foi desenvolvido um sistema onde foram integradas ferramentas necessárias para estudos de DNA-Seq e RNA-Seq. Inicialmente, foi efetuado um estudo das aplicações existentes, tendo de seguida sido selecionadas as que se destacaram em parâmetros como a facilidade de utilização, documentação e possibilidade de integração com as restantes ferramentas do sistema. O sistema foi desenvolvido utilizando-se as linguagens de programação Ruby, Java e R, sendo as principais funcionalidades o estudo de polimorfismos, a assemblagem de novo e a análise de expressão genética a partir de dados de RNA-Seq. Este permite uma utilização simplificada e semiautomática dos vários programas, sendo acessível a utilizadores com poucos conhecimentos informáticos. O sistema foi testado em três casos de estudo: caracterização de duas estirpes de Mycobacterium Tuberculosis, assemblagem de novo da Pseudomonas str. M1 e o estudo da expressão genética em amostras de Saccharomyces cerevisiae.Next-generation sequencing has enabled the sequencing of millions of base pairs of DNA and RNA, in parallel. This technology had, from the beginning a great impact to the point of becoming the method of choice for large-scale projects, replacing the Sanger method. Among the many applications of this technology we can include the analysis of DNA methylation, the analysis of the interaction between proteins (Chip-Seq) and DNA or RNA, and the mapping of structural rearrangements. However, the sequencing of new organisms or individuals, the study of single nucleotide polymorphisms (DNA-Seq) and gene expression analysis (RNA-Seq) are the main fields of study with this technology. In this work, a system integrating tools to study DNA-Seq and RNA-Seq data has been developed, starting by studying existing applications. Then, taking into account parameters such as ease of use, documentation and possibility of integration with other system tools, an optimal set of tools has been selected. The system was developed using the Ruby, Java and R programming languages, and its main features are the study of polymorphisms, de novo genomes assemblies and gene expression analysis. The developed system allows a simplified and semiautomatic use of the implemented tools making them accessible to users with limited computer knowledge. The system was tested on three case studies: characterization of two strains of Mycobacterium tuberculosis, de novo assembly of Pseudomonas str. M1 and a study of gene expression in Saccharomyces cerevisiae samples.Rocha, MiguelSoares, Simão Pedro de PinhoUniversidade do MinhoReis, Marco André Ferreira20132013-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/1822/27893por201193795info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T12:27:14ZPortal AgregadorONG
dc.title.none.fl_str_mv Desenvolvimento de um sistema integrado para o tratamento de dados de sequenciação de próxima geração
title Desenvolvimento de um sistema integrado para o tratamento de dados de sequenciação de próxima geração
spellingShingle Desenvolvimento de um sistema integrado para o tratamento de dados de sequenciação de próxima geração
Reis, Marco André Ferreira
577.2:681.3
681.3:577.2
61:681.3
681.3:61
title_short Desenvolvimento de um sistema integrado para o tratamento de dados de sequenciação de próxima geração
title_full Desenvolvimento de um sistema integrado para o tratamento de dados de sequenciação de próxima geração
title_fullStr Desenvolvimento de um sistema integrado para o tratamento de dados de sequenciação de próxima geração
title_full_unstemmed Desenvolvimento de um sistema integrado para o tratamento de dados de sequenciação de próxima geração
title_sort Desenvolvimento de um sistema integrado para o tratamento de dados de sequenciação de próxima geração
author Reis, Marco André Ferreira
author_facet Reis, Marco André Ferreira
author_role author
dc.contributor.none.fl_str_mv Rocha, Miguel
Soares, Simão Pedro de Pinho
Universidade do Minho
dc.contributor.author.fl_str_mv Reis, Marco André Ferreira
dc.subject.por.fl_str_mv 577.2:681.3
681.3:577.2
61:681.3
681.3:61
topic 577.2:681.3
681.3:577.2
61:681.3
681.3:61
description Dissertação de mestrado em Bioinformática
publishDate 2013
dc.date.none.fl_str_mv 2013
2013-01-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1822/27893
url http://hdl.handle.net/1822/27893
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv 201193795
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv
repository.mail.fl_str_mv
_version_ 1777303761055645696