Alinhamentos globais de duas sequências genéticas: resultados ótimos em espaço linear
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
Texto Completo: | http://repositorio.utfpr.edu.br/jspui/handle/1/15987 |
Resumo: | A Bioinformática é a aplicação de técnicas computacionais, matemáticas e estatísticas para analisar, interpretar e processar dados biológicos, principalmente dados relacionados a genética. Uma tarefa frequente nessa área é o alinhamento de sequências, que utiliza uma função de custo para apresentar o alinhamento ótimo entre sequências relacionadas. Esta tarefa é frequente por ser utilizada para comparação de material genético e construção da taxonomia de seres vivos. A complexidade de espaço dos algoritmos exatos conhecidos que apresentam mais que um alinhamento ótimo entre duas sequências genéticas é (), sendo e os tamanhos das duas sequências em pares de bases. Essa complexidade de espaço pode ser indesejada, visto que o tamanho das sequências pode chegar a milhões de bases. Por isso, muitos autores utilizam heurísticas, mais eficientes no uso do espaço, porém sem a garantia de uma solução ótima. O presente trabalho, contudo, tem como objetivo desenvolver um algoritmo exato com complexidade de espaço linear para encontrar mais que um alinhamento ótimo entre duas sequências genéticas. |
id |
UTFPR-12_095cb0edd8c909a3922dff5f9979107f |
---|---|
oai_identifier_str |
oai:repositorio.utfpr.edu.br:1/15987 |
network_acronym_str |
UTFPR-12 |
network_name_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
repository_id_str |
|
spelling |
2020-11-19T18:24:53Z2020-11-19T18:24:53Z2019-11-25COSTACURTA, Matheus. Alinhamentos globais de duas sequências genéticas: resultados ótimos em espaço linear. 2019. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2019.http://repositorio.utfpr.edu.br/jspui/handle/1/15987A Bioinformática é a aplicação de técnicas computacionais, matemáticas e estatísticas para analisar, interpretar e processar dados biológicos, principalmente dados relacionados a genética. Uma tarefa frequente nessa área é o alinhamento de sequências, que utiliza uma função de custo para apresentar o alinhamento ótimo entre sequências relacionadas. Esta tarefa é frequente por ser utilizada para comparação de material genético e construção da taxonomia de seres vivos. A complexidade de espaço dos algoritmos exatos conhecidos que apresentam mais que um alinhamento ótimo entre duas sequências genéticas é (), sendo e os tamanhos das duas sequências em pares de bases. Essa complexidade de espaço pode ser indesejada, visto que o tamanho das sequências pode chegar a milhões de bases. Por isso, muitos autores utilizam heurísticas, mais eficientes no uso do espaço, porém sem a garantia de uma solução ótima. O presente trabalho, contudo, tem como objetivo desenvolver um algoritmo exato com complexidade de espaço linear para encontrar mais que um alinhamento ótimo entre duas sequências genéticas.Bioinformatics is an application of computational, statistical and mathematical techniques for the analysis, interpretation and control of biological data, mainly related to genetics. A frequent tasks in this area is the sequence alignment, which uses a cost function to present an optimum alignment between related sequences. This task is frequent since it is used to compare genetic material and to construct the taxonomy of living beings. The space complexity of the known exact algorithms to present more than one optimum alignment between two genetic sequences is (), where and are the sizes of the two sequences given by the number of base pairs. This space complexity may be unwanted, since the size of the sequences can reach millions of bases. Hence, many authors use heuristics, more efficient in the use of space, but without the certainty of optimality. This work, however, aims to develop a linear space complexity exact algorithm to find more than one optimum alignment between two genetic sequences.porUniversidade Tecnológica Federal do ParanáPonta GrossaCiência da ComputaçãoUTFPRBrasilDepartamento Acadêmico de InformáticaCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOBioinformáticaComplexidade computacionalAlgorítmosBioinformaticsComputational complexityAlgorithmsAlinhamentos globais de duas sequências genéticas: resultados ótimos em espaço linearGlobal alignments of two genetic sequences: optimal results in linear spaceinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisPonta GrossaZatesko, Leandro MirandaAlmeida, Sheila Morais deZatesko, Leandro MirandaCarmo, Renato José da SilvaMaciel, Denise do RocioCostacurta, Matheusinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRORIGINALPG_COCIC_2019_2_13.pdfapplication/pdf524261http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/15987/1/PG_COCIC_2019_2_13.pdffa9704fe4174b1fb1abfa7cce7b890a2MD51LICENSElicense.txttext/plain1290http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/15987/2/license.txtb9d82215ab23456fa2d8b49c5df1b95bMD52TEXTPG_COCIC_2019_2_13.pdf.txtExtracted texttext/plain82391http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/15987/3/PG_COCIC_2019_2_13.pdf.txtd89148ca5362cd3a5ff18553351bf230MD53THUMBNAILPG_COCIC_2019_2_13.pdf.jpgGenerated Thumbnailimage/jpeg1298http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/15987/4/PG_COCIC_2019_2_13.pdf.jpg89d8b3d3660da5bf5edd4db31ca05e12MD541/159872020-11-19 16:24:53.711oai:repositorio.utfpr.edu.br:1/15987TmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbywgYXV0b3Jpem8gYSBVVEZQUiBhIHZlaWN1bGFyLCAKYXRyYXbDqXMgZG8gUG9ydGFsIGRlIEluZm9ybWHDp8OjbyBlbSBBY2Vzc28gQWJlcnRvIChQSUFBKSBlIGRvcyBDYXTDoWxvZ29zIGRhcyBCaWJsaW90ZWNhcyAKZGVzdGEgSW5zdGl0dWnDp8Ojbywgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBkZSBhY29yZG8gY29tIGEgTGVpIG5vIDkuNjEwLzk4LCAKbyB0ZXh0byBkZXN0YSBvYnJhLCBvYnNlcnZhbmRvIGFzIGNvbmRpw6fDtWVzIGRlIGRpc3BvbmliaWxpemHDp8OjbyByZWdpc3RyYWRhcyBubyBpdGVtIDQgZG8gCuKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgVHJhYmFsaG9zIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28gZGUgR3JhZHVhw6fDo28gZSAKRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgZGUgSW5mb3JtYcOnw6NvIGUgbm9zIENhdMOhbG9nb3MgRWxldHLDtG5pY29zIGRvIApTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkLCB2aXNhbmRvIGEgCmRpdnVsZ2HDp8OjbyBkYSBwcm9kdcOnw6NvIGNpZW50w61maWNhIGJyYXNpbGVpcmEuCgogIEFzIHZpYXMgb3JpZ2luYWlzIGUgYXNzaW5hZGFzIHBlbG8ocykgYXV0b3IoZXMpIGRvIOKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgClRyYWJhbGhvcyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvIGRlIEdyYWR1YcOnw6NvIGUgRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgCmRlIEluZm9ybWHDp8OjbyBlIG5vcyBDYXTDoWxvZ29zIEVsZXRyw7RuaWNvcyBkbyBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdIGUgZGEg4oCcRGVjbGFyYcOnw6NvIApkZSBBdXRvcmlh4oCdIGVuY29udHJhbS1zZSBhcnF1aXZhZGFzIG5hIEJpYmxpb3RlY2EgZG8gQ8OibXB1cyBubyBxdWFsIG8gdHJhYmFsaG8gZm9pIGRlZmVuZGlkby4gCk5vIGNhc28gZGUgcHVibGljYcOnw7VlcyBkZSBhdXRvcmlhIGNvbGV0aXZhIGUgbXVsdGljw6JtcHVzLCBvcyBkb2N1bWVudG9zIGZpY2Fyw6NvIHNvYiBndWFyZGEgZGEgCkJpYmxpb3RlY2EgY29tIGEgcXVhbCBvIOKAnHByaW1laXJvIGF1dG9y4oCdIHBvc3N1YSB2w61uY3Vsby4KRepositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2020-11-19T18:24:53Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false |
dc.title.pt_BR.fl_str_mv |
Alinhamentos globais de duas sequências genéticas: resultados ótimos em espaço linear |
dc.title.alternative.pt_BR.fl_str_mv |
Global alignments of two genetic sequences: optimal results in linear space |
title |
Alinhamentos globais de duas sequências genéticas: resultados ótimos em espaço linear |
spellingShingle |
Alinhamentos globais de duas sequências genéticas: resultados ótimos em espaço linear Costacurta, Matheus CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Bioinformática Complexidade computacional Algorítmos Bioinformatics Computational complexity Algorithms |
title_short |
Alinhamentos globais de duas sequências genéticas: resultados ótimos em espaço linear |
title_full |
Alinhamentos globais de duas sequências genéticas: resultados ótimos em espaço linear |
title_fullStr |
Alinhamentos globais de duas sequências genéticas: resultados ótimos em espaço linear |
title_full_unstemmed |
Alinhamentos globais de duas sequências genéticas: resultados ótimos em espaço linear |
title_sort |
Alinhamentos globais de duas sequências genéticas: resultados ótimos em espaço linear |
author |
Costacurta, Matheus |
author_facet |
Costacurta, Matheus |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Zatesko, Leandro Miranda |
dc.contributor.advisor-co1.fl_str_mv |
Almeida, Sheila Morais de |
dc.contributor.referee1.fl_str_mv |
Zatesko, Leandro Miranda |
dc.contributor.referee2.fl_str_mv |
Carmo, Renato José da Silva |
dc.contributor.referee3.fl_str_mv |
Maciel, Denise do Rocio |
dc.contributor.author.fl_str_mv |
Costacurta, Matheus |
contributor_str_mv |
Zatesko, Leandro Miranda Almeida, Sheila Morais de Zatesko, Leandro Miranda Carmo, Renato José da Silva Maciel, Denise do Rocio |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Bioinformática Complexidade computacional Algorítmos Bioinformatics Computational complexity Algorithms |
dc.subject.por.fl_str_mv |
Bioinformática Complexidade computacional Algorítmos Bioinformatics Computational complexity Algorithms |
description |
A Bioinformática é a aplicação de técnicas computacionais, matemáticas e estatísticas para analisar, interpretar e processar dados biológicos, principalmente dados relacionados a genética. Uma tarefa frequente nessa área é o alinhamento de sequências, que utiliza uma função de custo para apresentar o alinhamento ótimo entre sequências relacionadas. Esta tarefa é frequente por ser utilizada para comparação de material genético e construção da taxonomia de seres vivos. A complexidade de espaço dos algoritmos exatos conhecidos que apresentam mais que um alinhamento ótimo entre duas sequências genéticas é (), sendo e os tamanhos das duas sequências em pares de bases. Essa complexidade de espaço pode ser indesejada, visto que o tamanho das sequências pode chegar a milhões de bases. Por isso, muitos autores utilizam heurísticas, mais eficientes no uso do espaço, porém sem a garantia de uma solução ótima. O presente trabalho, contudo, tem como objetivo desenvolver um algoritmo exato com complexidade de espaço linear para encontrar mais que um alinhamento ótimo entre duas sequências genéticas. |
publishDate |
2019 |
dc.date.issued.fl_str_mv |
2019-11-25 |
dc.date.accessioned.fl_str_mv |
2020-11-19T18:24:53Z |
dc.date.available.fl_str_mv |
2020-11-19T18:24:53Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
COSTACURTA, Matheus. Alinhamentos globais de duas sequências genéticas: resultados ótimos em espaço linear. 2019. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2019. |
dc.identifier.uri.fl_str_mv |
http://repositorio.utfpr.edu.br/jspui/handle/1/15987 |
identifier_str_mv |
COSTACURTA, Matheus. Alinhamentos globais de duas sequências genéticas: resultados ótimos em espaço linear. 2019. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2019. |
url |
http://repositorio.utfpr.edu.br/jspui/handle/1/15987 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Ponta Grossa |
dc.publisher.program.fl_str_mv |
Ciência da Computação |
dc.publisher.initials.fl_str_mv |
UTFPR |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Departamento Acadêmico de Informática |
publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Ponta Grossa |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) instname:Universidade Tecnológica Federal do Paraná (UTFPR) instacron:UTFPR |
instname_str |
Universidade Tecnológica Federal do Paraná (UTFPR) |
instacron_str |
UTFPR |
institution |
UTFPR |
reponame_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
collection |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
bitstream.url.fl_str_mv |
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/15987/1/PG_COCIC_2019_2_13.pdf http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/15987/2/license.txt http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/15987/3/PG_COCIC_2019_2_13.pdf.txt http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/15987/4/PG_COCIC_2019_2_13.pdf.jpg |
bitstream.checksum.fl_str_mv |
fa9704fe4174b1fb1abfa7cce7b890a2 b9d82215ab23456fa2d8b49c5df1b95b d89148ca5362cd3a5ff18553351bf230 89d8b3d3660da5bf5edd4db31ca05e12 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR) |
repository.mail.fl_str_mv |
|
_version_ |
1805922974265507840 |