Alinhamento múltiplo de genomas e sequências de proteínas com repetições e rearranjos

Detalhes bibliográficos
Autor(a) principal: Chaves, Laécio Freitas
Data de Publicação: 2016
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://teses.usp.br/teses/disponiveis/45/45134/tde-20230727-113328/
Resumo: Neste trabalho, foram abordados o problema de alinhamento de sequências menores, correspon- dentes a genes ou proteínas individuais, como para sequências grandes do tamanho de cromossomos. Assim, uma proposta desse trabalho foi implementar um alinhador de sequências de granularidade variável, chamado de Multigran. Nesse alinhador, implementamos o algoritmo de alinhamento ancorado e baseando em segmentos, para possibilitar o alinhamento de sequências grandes. Apresentamos duas modificações nesse algoritmo: utilização do algoritmo de sequence annealing para manter a consistência entre os segmentos ou âncoras alinhadas e o algoritmo de refinamento dos segmen- tos para evitar que ocorra intersecção ou sobreposição entre os segmentos. Para o alinhamento de sequências com multidomínios, implementamos o algoritmo de alinhamento baseado em repetições e rearranjos. Esse algoritmo é utilizado para alinhar sequências de proteínas com domínios recombinantes, embaralhados ou repetidos. As modificações nesse algoritmo visam manter a consistência dos alinhamentos locais dos domínios e filtrar as partes conservadas do alinhamento. Em particular, implementamos uma versão modificada da técnica de refinamento iterativo discriminativo para melhorar a qualidade dos alinhamentos construídos pelo Multigran. Mostramos que as modificações citadas acima melhoram estatisticamente os resultados dos alinhamentos em relação as técnicas originais. Para evidenciar as melhorias, utilizamos benchmarks para avaliar as ferramentas de alinhamento múltiplo. Finalmente, por nossa ferramenta permitir o alinhamento de sequências com granularidade variável e os erros que podem ser gerados na construção dos alinhamentos, o Multigran foi integrado com uma ferramenta de edição, visualização e análise de alinhamentos de sequências conhecida como Jalview.
id USP_0dbf089f0e5a0d83a06dc893169374dc
oai_identifier_str oai:teses.usp.br:tde-20230727-113328
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Alinhamento múltiplo de genomas e sequências de proteínas com repetições e rearranjosMultiple alignment of genomes and protein sequences with repetition and rearrangementAlgoritmosBioinformáticaGenomasNeste trabalho, foram abordados o problema de alinhamento de sequências menores, correspon- dentes a genes ou proteínas individuais, como para sequências grandes do tamanho de cromossomos. Assim, uma proposta desse trabalho foi implementar um alinhador de sequências de granularidade variável, chamado de Multigran. Nesse alinhador, implementamos o algoritmo de alinhamento ancorado e baseando em segmentos, para possibilitar o alinhamento de sequências grandes. Apresentamos duas modificações nesse algoritmo: utilização do algoritmo de sequence annealing para manter a consistência entre os segmentos ou âncoras alinhadas e o algoritmo de refinamento dos segmen- tos para evitar que ocorra intersecção ou sobreposição entre os segmentos. Para o alinhamento de sequências com multidomínios, implementamos o algoritmo de alinhamento baseado em repetições e rearranjos. Esse algoritmo é utilizado para alinhar sequências de proteínas com domínios recombinantes, embaralhados ou repetidos. As modificações nesse algoritmo visam manter a consistência dos alinhamentos locais dos domínios e filtrar as partes conservadas do alinhamento. Em particular, implementamos uma versão modificada da técnica de refinamento iterativo discriminativo para melhorar a qualidade dos alinhamentos construídos pelo Multigran. Mostramos que as modificações citadas acima melhoram estatisticamente os resultados dos alinhamentos em relação as técnicas originais. Para evidenciar as melhorias, utilizamos benchmarks para avaliar as ferramentas de alinhamento múltiplo. Finalmente, por nossa ferramenta permitir o alinhamento de sequências com granularidade variável e os erros que podem ser gerados na construção dos alinhamentos, o Multigran foi integrado com uma ferramenta de edição, visualização e análise de alinhamentos de sequências conhecida como Jalview.This study has addressed the alignment problem smaller sequences corresponding to individual genes or proteins, such as for large size sequences of the chromosomes. Thus, a proposal of this study was to implement a variable granularity sequences aligner, called Multigran. In this aligner, imple- ment the alignment algorithm based on segments and anchored to enable the alignment of large sequences. Here two changes in this algorithm: using the sequence annealing algorithm to maintain consistency between the line segments or anchors and refinement algorithm of segments to avoid the occurrence intersection or overlapping between segments. For sequence alignment with multi- domain implement alignment algorithm based on repetition and rearrangement. This algorithm is used to align sequences with recombinant protein, shuffled or repeated domains. The changes in this algorithm are intended to maintain the consistency of local alignments of fields and filter parts preserved alignment. In particular, we implemented a modified version of discriminative iterative refinement technique to improve the quality of alignments built by Multigran. We show that the changes mentioned above statistically improve the results of alignments regarding the original tech- niques. To demonstrate the improvements, we use benchmarks to evaluate the multiple alignment tools. Finally, our tool allows you to align sequences with variable granularity and errors that can be generated in the construction of alignments, the Multigran has been integrated with an editing tool, visualization and analysis of sequence alignments known as jalview.Biblioteca Digitais de Teses e Dissertações da USPDurham, Alan MitchellChaves, Laécio Freitas2016-05-12info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://teses.usp.br/teses/disponiveis/45/45134/tde-20230727-113328/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2023-07-27T19:24:06Zoai:teses.usp.br:tde-20230727-113328Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-07-27T19:24:06Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Alinhamento múltiplo de genomas e sequências de proteínas com repetições e rearranjos
Multiple alignment of genomes and protein sequences with repetition and rearrangement
title Alinhamento múltiplo de genomas e sequências de proteínas com repetições e rearranjos
spellingShingle Alinhamento múltiplo de genomas e sequências de proteínas com repetições e rearranjos
Chaves, Laécio Freitas
Algoritmos
Bioinformática
Genomas
title_short Alinhamento múltiplo de genomas e sequências de proteínas com repetições e rearranjos
title_full Alinhamento múltiplo de genomas e sequências de proteínas com repetições e rearranjos
title_fullStr Alinhamento múltiplo de genomas e sequências de proteínas com repetições e rearranjos
title_full_unstemmed Alinhamento múltiplo de genomas e sequências de proteínas com repetições e rearranjos
title_sort Alinhamento múltiplo de genomas e sequências de proteínas com repetições e rearranjos
author Chaves, Laécio Freitas
author_facet Chaves, Laécio Freitas
author_role author
dc.contributor.none.fl_str_mv Durham, Alan Mitchell
dc.contributor.author.fl_str_mv Chaves, Laécio Freitas
dc.subject.por.fl_str_mv Algoritmos
Bioinformática
Genomas
topic Algoritmos
Bioinformática
Genomas
description Neste trabalho, foram abordados o problema de alinhamento de sequências menores, correspon- dentes a genes ou proteínas individuais, como para sequências grandes do tamanho de cromossomos. Assim, uma proposta desse trabalho foi implementar um alinhador de sequências de granularidade variável, chamado de Multigran. Nesse alinhador, implementamos o algoritmo de alinhamento ancorado e baseando em segmentos, para possibilitar o alinhamento de sequências grandes. Apresentamos duas modificações nesse algoritmo: utilização do algoritmo de sequence annealing para manter a consistência entre os segmentos ou âncoras alinhadas e o algoritmo de refinamento dos segmen- tos para evitar que ocorra intersecção ou sobreposição entre os segmentos. Para o alinhamento de sequências com multidomínios, implementamos o algoritmo de alinhamento baseado em repetições e rearranjos. Esse algoritmo é utilizado para alinhar sequências de proteínas com domínios recombinantes, embaralhados ou repetidos. As modificações nesse algoritmo visam manter a consistência dos alinhamentos locais dos domínios e filtrar as partes conservadas do alinhamento. Em particular, implementamos uma versão modificada da técnica de refinamento iterativo discriminativo para melhorar a qualidade dos alinhamentos construídos pelo Multigran. Mostramos que as modificações citadas acima melhoram estatisticamente os resultados dos alinhamentos em relação as técnicas originais. Para evidenciar as melhorias, utilizamos benchmarks para avaliar as ferramentas de alinhamento múltiplo. Finalmente, por nossa ferramenta permitir o alinhamento de sequências com granularidade variável e os erros que podem ser gerados na construção dos alinhamentos, o Multigran foi integrado com uma ferramenta de edição, visualização e análise de alinhamentos de sequências conhecida como Jalview.
publishDate 2016
dc.date.none.fl_str_mv 2016-05-12
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://teses.usp.br/teses/disponiveis/45/45134/tde-20230727-113328/
url https://teses.usp.br/teses/disponiveis/45/45134/tde-20230727-113328/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815257218929393664