Alinhamentos globais de duas sequências genéticas: resultados ótimos em espaço linear

Detalhes bibliográficos
Autor(a) principal: Costacurta, Matheus
Data de Publicação: 2019
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
Texto Completo: http://repositorio.utfpr.edu.br/jspui/handle/1/15987
Resumo: A Bioinformática é a aplicação de técnicas computacionais, matemáticas e estatísticas para analisar, interpretar e processar dados biológicos, principalmente dados relacionados a genética. Uma tarefa frequente nessa área é o alinhamento de sequências, que utiliza uma função de custo para apresentar o alinhamento ótimo entre sequências relacionadas. Esta tarefa é frequente por ser utilizada para comparação de material genético e construção da taxonomia de seres vivos. A complexidade de espaço dos algoritmos exatos conhecidos que apresentam mais que um alinhamento ótimo entre duas sequências genéticas é (), sendo e os tamanhos das duas sequências em pares de bases. Essa complexidade de espaço pode ser indesejada, visto que o tamanho das sequências pode chegar a milhões de bases. Por isso, muitos autores utilizam heurísticas, mais eficientes no uso do espaço, porém sem a garantia de uma solução ótima. O presente trabalho, contudo, tem como objetivo desenvolver um algoritmo exato com complexidade de espaço linear para encontrar mais que um alinhamento ótimo entre duas sequências genéticas.
id UTFPR-12_095cb0edd8c909a3922dff5f9979107f
oai_identifier_str oai:repositorio.utfpr.edu.br:1/15987
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling 2020-11-19T18:24:53Z2020-11-19T18:24:53Z2019-11-25COSTACURTA, Matheus. Alinhamentos globais de duas sequências genéticas: resultados ótimos em espaço linear. 2019. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2019.http://repositorio.utfpr.edu.br/jspui/handle/1/15987A Bioinformática é a aplicação de técnicas computacionais, matemáticas e estatísticas para analisar, interpretar e processar dados biológicos, principalmente dados relacionados a genética. Uma tarefa frequente nessa área é o alinhamento de sequências, que utiliza uma função de custo para apresentar o alinhamento ótimo entre sequências relacionadas. Esta tarefa é frequente por ser utilizada para comparação de material genético e construção da taxonomia de seres vivos. A complexidade de espaço dos algoritmos exatos conhecidos que apresentam mais que um alinhamento ótimo entre duas sequências genéticas é (), sendo e os tamanhos das duas sequências em pares de bases. Essa complexidade de espaço pode ser indesejada, visto que o tamanho das sequências pode chegar a milhões de bases. Por isso, muitos autores utilizam heurísticas, mais eficientes no uso do espaço, porém sem a garantia de uma solução ótima. O presente trabalho, contudo, tem como objetivo desenvolver um algoritmo exato com complexidade de espaço linear para encontrar mais que um alinhamento ótimo entre duas sequências genéticas.Bioinformatics is an application of computational, statistical and mathematical techniques for the analysis, interpretation and control of biological data, mainly related to genetics. A frequent tasks in this area is the sequence alignment, which uses a cost function to present an optimum alignment between related sequences. This task is frequent since it is used to compare genetic material and to construct the taxonomy of living beings. The space complexity of the known exact algorithms to present more than one optimum alignment between two genetic sequences is (), where and are the sizes of the two sequences given by the number of base pairs. This space complexity may be unwanted, since the size of the sequences can reach millions of bases. Hence, many authors use heuristics, more efficient in the use of space, but without the certainty of optimality. This work, however, aims to develop a linear space complexity exact algorithm to find more than one optimum alignment between two genetic sequences.porUniversidade Tecnológica Federal do ParanáPonta GrossaCiência da ComputaçãoUTFPRBrasilDepartamento Acadêmico de InformáticaCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOBioinformáticaComplexidade computacionalAlgorítmosBioinformaticsComputational complexityAlgorithmsAlinhamentos globais de duas sequências genéticas: resultados ótimos em espaço linearGlobal alignments of two genetic sequences: optimal results in linear spaceinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisPonta GrossaZatesko, Leandro MirandaAlmeida, Sheila Morais deZatesko, Leandro MirandaCarmo, Renato José da SilvaMaciel, Denise do RocioCostacurta, Matheusinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRORIGINALPG_COCIC_2019_2_13.pdfapplication/pdf524261http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/15987/1/PG_COCIC_2019_2_13.pdffa9704fe4174b1fb1abfa7cce7b890a2MD51LICENSElicense.txttext/plain1290http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/15987/2/license.txtb9d82215ab23456fa2d8b49c5df1b95bMD52TEXTPG_COCIC_2019_2_13.pdf.txtExtracted texttext/plain82391http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/15987/3/PG_COCIC_2019_2_13.pdf.txtd89148ca5362cd3a5ff18553351bf230MD53THUMBNAILPG_COCIC_2019_2_13.pdf.jpgGenerated Thumbnailimage/jpeg1298http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/15987/4/PG_COCIC_2019_2_13.pdf.jpg89d8b3d3660da5bf5edd4db31ca05e12MD541/159872020-11-19 16:24:53.711oai:repositorio.utfpr.edu.br:1/15987TmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbywgYXV0b3Jpem8gYSBVVEZQUiBhIHZlaWN1bGFyLCAKYXRyYXbDqXMgZG8gUG9ydGFsIGRlIEluZm9ybWHDp8OjbyBlbSBBY2Vzc28gQWJlcnRvIChQSUFBKSBlIGRvcyBDYXTDoWxvZ29zIGRhcyBCaWJsaW90ZWNhcyAKZGVzdGEgSW5zdGl0dWnDp8Ojbywgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBkZSBhY29yZG8gY29tIGEgTGVpIG5vIDkuNjEwLzk4LCAKbyB0ZXh0byBkZXN0YSBvYnJhLCBvYnNlcnZhbmRvIGFzIGNvbmRpw6fDtWVzIGRlIGRpc3BvbmliaWxpemHDp8OjbyByZWdpc3RyYWRhcyBubyBpdGVtIDQgZG8gCuKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgVHJhYmFsaG9zIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28gZGUgR3JhZHVhw6fDo28gZSAKRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgZGUgSW5mb3JtYcOnw6NvIGUgbm9zIENhdMOhbG9nb3MgRWxldHLDtG5pY29zIGRvIApTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkLCB2aXNhbmRvIGEgCmRpdnVsZ2HDp8OjbyBkYSBwcm9kdcOnw6NvIGNpZW50w61maWNhIGJyYXNpbGVpcmEuCgogIEFzIHZpYXMgb3JpZ2luYWlzIGUgYXNzaW5hZGFzIHBlbG8ocykgYXV0b3IoZXMpIGRvIOKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgClRyYWJhbGhvcyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvIGRlIEdyYWR1YcOnw6NvIGUgRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgCmRlIEluZm9ybWHDp8OjbyBlIG5vcyBDYXTDoWxvZ29zIEVsZXRyw7RuaWNvcyBkbyBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdIGUgZGEg4oCcRGVjbGFyYcOnw6NvIApkZSBBdXRvcmlh4oCdIGVuY29udHJhbS1zZSBhcnF1aXZhZGFzIG5hIEJpYmxpb3RlY2EgZG8gQ8OibXB1cyBubyBxdWFsIG8gdHJhYmFsaG8gZm9pIGRlZmVuZGlkby4gCk5vIGNhc28gZGUgcHVibGljYcOnw7VlcyBkZSBhdXRvcmlhIGNvbGV0aXZhIGUgbXVsdGljw6JtcHVzLCBvcyBkb2N1bWVudG9zIGZpY2Fyw6NvIHNvYiBndWFyZGEgZGEgCkJpYmxpb3RlY2EgY29tIGEgcXVhbCBvIOKAnHByaW1laXJvIGF1dG9y4oCdIHBvc3N1YSB2w61uY3Vsby4KRepositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2020-11-19T18:24:53Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.pt_BR.fl_str_mv Alinhamentos globais de duas sequências genéticas: resultados ótimos em espaço linear
dc.title.alternative.pt_BR.fl_str_mv Global alignments of two genetic sequences: optimal results in linear space
title Alinhamentos globais de duas sequências genéticas: resultados ótimos em espaço linear
spellingShingle Alinhamentos globais de duas sequências genéticas: resultados ótimos em espaço linear
Costacurta, Matheus
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Bioinformática
Complexidade computacional
Algorítmos
Bioinformatics
Computational complexity
Algorithms
title_short Alinhamentos globais de duas sequências genéticas: resultados ótimos em espaço linear
title_full Alinhamentos globais de duas sequências genéticas: resultados ótimos em espaço linear
title_fullStr Alinhamentos globais de duas sequências genéticas: resultados ótimos em espaço linear
title_full_unstemmed Alinhamentos globais de duas sequências genéticas: resultados ótimos em espaço linear
title_sort Alinhamentos globais de duas sequências genéticas: resultados ótimos em espaço linear
author Costacurta, Matheus
author_facet Costacurta, Matheus
author_role author
dc.contributor.advisor1.fl_str_mv Zatesko, Leandro Miranda
dc.contributor.advisor-co1.fl_str_mv Almeida, Sheila Morais de
dc.contributor.referee1.fl_str_mv Zatesko, Leandro Miranda
dc.contributor.referee2.fl_str_mv Carmo, Renato José da Silva
dc.contributor.referee3.fl_str_mv Maciel, Denise do Rocio
dc.contributor.author.fl_str_mv Costacurta, Matheus
contributor_str_mv Zatesko, Leandro Miranda
Almeida, Sheila Morais de
Zatesko, Leandro Miranda
Carmo, Renato José da Silva
Maciel, Denise do Rocio
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Bioinformática
Complexidade computacional
Algorítmos
Bioinformatics
Computational complexity
Algorithms
dc.subject.por.fl_str_mv Bioinformática
Complexidade computacional
Algorítmos
Bioinformatics
Computational complexity
Algorithms
description A Bioinformática é a aplicação de técnicas computacionais, matemáticas e estatísticas para analisar, interpretar e processar dados biológicos, principalmente dados relacionados a genética. Uma tarefa frequente nessa área é o alinhamento de sequências, que utiliza uma função de custo para apresentar o alinhamento ótimo entre sequências relacionadas. Esta tarefa é frequente por ser utilizada para comparação de material genético e construção da taxonomia de seres vivos. A complexidade de espaço dos algoritmos exatos conhecidos que apresentam mais que um alinhamento ótimo entre duas sequências genéticas é (), sendo e os tamanhos das duas sequências em pares de bases. Essa complexidade de espaço pode ser indesejada, visto que o tamanho das sequências pode chegar a milhões de bases. Por isso, muitos autores utilizam heurísticas, mais eficientes no uso do espaço, porém sem a garantia de uma solução ótima. O presente trabalho, contudo, tem como objetivo desenvolver um algoritmo exato com complexidade de espaço linear para encontrar mais que um alinhamento ótimo entre duas sequências genéticas.
publishDate 2019
dc.date.issued.fl_str_mv 2019-11-25
dc.date.accessioned.fl_str_mv 2020-11-19T18:24:53Z
dc.date.available.fl_str_mv 2020-11-19T18:24:53Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv COSTACURTA, Matheus. Alinhamentos globais de duas sequências genéticas: resultados ótimos em espaço linear. 2019. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2019.
dc.identifier.uri.fl_str_mv http://repositorio.utfpr.edu.br/jspui/handle/1/15987
identifier_str_mv COSTACURTA, Matheus. Alinhamentos globais de duas sequências genéticas: resultados ótimos em espaço linear. 2019. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2019.
url http://repositorio.utfpr.edu.br/jspui/handle/1/15987
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Ponta Grossa
dc.publisher.program.fl_str_mv Ciência da Computação
dc.publisher.initials.fl_str_mv UTFPR
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Departamento Acadêmico de Informática
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Ponta Grossa
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
bitstream.url.fl_str_mv http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/15987/1/PG_COCIC_2019_2_13.pdf
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/15987/2/license.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/15987/3/PG_COCIC_2019_2_13.pdf.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/15987/4/PG_COCIC_2019_2_13.pdf.jpg
bitstream.checksum.fl_str_mv fa9704fe4174b1fb1abfa7cce7b890a2
b9d82215ab23456fa2d8b49c5df1b95b
d89148ca5362cd3a5ff18553351bf230
89d8b3d3660da5bf5edd4db31ca05e12
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv
_version_ 1805922974265507840