Alinhamento múltiplo de genomas e sequências de proteínas com repetições e rearranjos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2016 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://teses.usp.br/teses/disponiveis/45/45134/tde-20230727-113328/ |
Resumo: | Neste trabalho, foram abordados o problema de alinhamento de sequências menores, correspon- dentes a genes ou proteínas individuais, como para sequências grandes do tamanho de cromossomos. Assim, uma proposta desse trabalho foi implementar um alinhador de sequências de granularidade variável, chamado de Multigran. Nesse alinhador, implementamos o algoritmo de alinhamento ancorado e baseando em segmentos, para possibilitar o alinhamento de sequências grandes. Apresentamos duas modificações nesse algoritmo: utilização do algoritmo de sequence annealing para manter a consistência entre os segmentos ou âncoras alinhadas e o algoritmo de refinamento dos segmen- tos para evitar que ocorra intersecção ou sobreposição entre os segmentos. Para o alinhamento de sequências com multidomínios, implementamos o algoritmo de alinhamento baseado em repetições e rearranjos. Esse algoritmo é utilizado para alinhar sequências de proteínas com domínios recombinantes, embaralhados ou repetidos. As modificações nesse algoritmo visam manter a consistência dos alinhamentos locais dos domínios e filtrar as partes conservadas do alinhamento. Em particular, implementamos uma versão modificada da técnica de refinamento iterativo discriminativo para melhorar a qualidade dos alinhamentos construídos pelo Multigran. Mostramos que as modificações citadas acima melhoram estatisticamente os resultados dos alinhamentos em relação as técnicas originais. Para evidenciar as melhorias, utilizamos benchmarks para avaliar as ferramentas de alinhamento múltiplo. Finalmente, por nossa ferramenta permitir o alinhamento de sequências com granularidade variável e os erros que podem ser gerados na construção dos alinhamentos, o Multigran foi integrado com uma ferramenta de edição, visualização e análise de alinhamentos de sequências conhecida como Jalview. |
id |
USP_0dbf089f0e5a0d83a06dc893169374dc |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-20230727-113328 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Alinhamento múltiplo de genomas e sequências de proteínas com repetições e rearranjosMultiple alignment of genomes and protein sequences with repetition and rearrangementAlgoritmosBioinformáticaGenomasNeste trabalho, foram abordados o problema de alinhamento de sequências menores, correspon- dentes a genes ou proteínas individuais, como para sequências grandes do tamanho de cromossomos. Assim, uma proposta desse trabalho foi implementar um alinhador de sequências de granularidade variável, chamado de Multigran. Nesse alinhador, implementamos o algoritmo de alinhamento ancorado e baseando em segmentos, para possibilitar o alinhamento de sequências grandes. Apresentamos duas modificações nesse algoritmo: utilização do algoritmo de sequence annealing para manter a consistência entre os segmentos ou âncoras alinhadas e o algoritmo de refinamento dos segmen- tos para evitar que ocorra intersecção ou sobreposição entre os segmentos. Para o alinhamento de sequências com multidomínios, implementamos o algoritmo de alinhamento baseado em repetições e rearranjos. Esse algoritmo é utilizado para alinhar sequências de proteínas com domínios recombinantes, embaralhados ou repetidos. As modificações nesse algoritmo visam manter a consistência dos alinhamentos locais dos domínios e filtrar as partes conservadas do alinhamento. Em particular, implementamos uma versão modificada da técnica de refinamento iterativo discriminativo para melhorar a qualidade dos alinhamentos construídos pelo Multigran. Mostramos que as modificações citadas acima melhoram estatisticamente os resultados dos alinhamentos em relação as técnicas originais. Para evidenciar as melhorias, utilizamos benchmarks para avaliar as ferramentas de alinhamento múltiplo. Finalmente, por nossa ferramenta permitir o alinhamento de sequências com granularidade variável e os erros que podem ser gerados na construção dos alinhamentos, o Multigran foi integrado com uma ferramenta de edição, visualização e análise de alinhamentos de sequências conhecida como Jalview.This study has addressed the alignment problem smaller sequences corresponding to individual genes or proteins, such as for large size sequences of the chromosomes. Thus, a proposal of this study was to implement a variable granularity sequences aligner, called Multigran. In this aligner, imple- ment the alignment algorithm based on segments and anchored to enable the alignment of large sequences. Here two changes in this algorithm: using the sequence annealing algorithm to maintain consistency between the line segments or anchors and refinement algorithm of segments to avoid the occurrence intersection or overlapping between segments. For sequence alignment with multi- domain implement alignment algorithm based on repetition and rearrangement. This algorithm is used to align sequences with recombinant protein, shuffled or repeated domains. The changes in this algorithm are intended to maintain the consistency of local alignments of fields and filter parts preserved alignment. In particular, we implemented a modified version of discriminative iterative refinement technique to improve the quality of alignments built by Multigran. We show that the changes mentioned above statistically improve the results of alignments regarding the original tech- niques. To demonstrate the improvements, we use benchmarks to evaluate the multiple alignment tools. Finally, our tool allows you to align sequences with variable granularity and errors that can be generated in the construction of alignments, the Multigran has been integrated with an editing tool, visualization and analysis of sequence alignments known as jalview.Biblioteca Digitais de Teses e Dissertações da USPDurham, Alan MitchellChaves, Laécio Freitas2016-05-12info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://teses.usp.br/teses/disponiveis/45/45134/tde-20230727-113328/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2023-07-27T19:24:06Zoai:teses.usp.br:tde-20230727-113328Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-07-27T19:24:06Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Alinhamento múltiplo de genomas e sequências de proteínas com repetições e rearranjos Multiple alignment of genomes and protein sequences with repetition and rearrangement |
title |
Alinhamento múltiplo de genomas e sequências de proteínas com repetições e rearranjos |
spellingShingle |
Alinhamento múltiplo de genomas e sequências de proteínas com repetições e rearranjos Chaves, Laécio Freitas Algoritmos Bioinformática Genomas |
title_short |
Alinhamento múltiplo de genomas e sequências de proteínas com repetições e rearranjos |
title_full |
Alinhamento múltiplo de genomas e sequências de proteínas com repetições e rearranjos |
title_fullStr |
Alinhamento múltiplo de genomas e sequências de proteínas com repetições e rearranjos |
title_full_unstemmed |
Alinhamento múltiplo de genomas e sequências de proteínas com repetições e rearranjos |
title_sort |
Alinhamento múltiplo de genomas e sequências de proteínas com repetições e rearranjos |
author |
Chaves, Laécio Freitas |
author_facet |
Chaves, Laécio Freitas |
author_role |
author |
dc.contributor.none.fl_str_mv |
Durham, Alan Mitchell |
dc.contributor.author.fl_str_mv |
Chaves, Laécio Freitas |
dc.subject.por.fl_str_mv |
Algoritmos Bioinformática Genomas |
topic |
Algoritmos Bioinformática Genomas |
description |
Neste trabalho, foram abordados o problema de alinhamento de sequências menores, correspon- dentes a genes ou proteínas individuais, como para sequências grandes do tamanho de cromossomos. Assim, uma proposta desse trabalho foi implementar um alinhador de sequências de granularidade variável, chamado de Multigran. Nesse alinhador, implementamos o algoritmo de alinhamento ancorado e baseando em segmentos, para possibilitar o alinhamento de sequências grandes. Apresentamos duas modificações nesse algoritmo: utilização do algoritmo de sequence annealing para manter a consistência entre os segmentos ou âncoras alinhadas e o algoritmo de refinamento dos segmen- tos para evitar que ocorra intersecção ou sobreposição entre os segmentos. Para o alinhamento de sequências com multidomínios, implementamos o algoritmo de alinhamento baseado em repetições e rearranjos. Esse algoritmo é utilizado para alinhar sequências de proteínas com domínios recombinantes, embaralhados ou repetidos. As modificações nesse algoritmo visam manter a consistência dos alinhamentos locais dos domínios e filtrar as partes conservadas do alinhamento. Em particular, implementamos uma versão modificada da técnica de refinamento iterativo discriminativo para melhorar a qualidade dos alinhamentos construídos pelo Multigran. Mostramos que as modificações citadas acima melhoram estatisticamente os resultados dos alinhamentos em relação as técnicas originais. Para evidenciar as melhorias, utilizamos benchmarks para avaliar as ferramentas de alinhamento múltiplo. Finalmente, por nossa ferramenta permitir o alinhamento de sequências com granularidade variável e os erros que podem ser gerados na construção dos alinhamentos, o Multigran foi integrado com uma ferramenta de edição, visualização e análise de alinhamentos de sequências conhecida como Jalview. |
publishDate |
2016 |
dc.date.none.fl_str_mv |
2016-05-12 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://teses.usp.br/teses/disponiveis/45/45134/tde-20230727-113328/ |
url |
https://teses.usp.br/teses/disponiveis/45/45134/tde-20230727-113328/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815257218929393664 |