Identificação de genes e o problema do alinhamento Spliced Múltiplo

Detalhes bibliográficos
Autor(a) principal: Kishi, Rodrigo Mitsuo
Data de Publicação: 2010
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFMS
Texto Completo: https://repositorio.ufms.br/handle/123456789/510
Resumo: A identificação de genes em sequências de DNA de organismos eucariotos ainda pode ser considerado um problema em aberto na Bioinformática. Na busca por soluções deste problema, em muitos casos recorre-se à comparação de sequências. Várias combinações de sequências vêm sendo utilizadas pelas ferramentas de identificação de genes e neste trabalho propomos a comparação de diversas sequências de cDNA com uma sequência de DNA. Essa proposta foi abordada através da formulação e estudo de um problema de otimização combinatória denominado Problema do Alinhamento Spliced Múltiplo. Nessa dissertação descrevemos esse problema, demonstramos que ele é NP-completo para a distância de Levenshtein e propomos quatro heurísticas para resolvê-lo. Com base nessas heur´ısticas, desenvolvemos quatro ferramentas de identificação de genes por comparação de uma sequência de DNA com várias sequências de cDNA. Essas ferramentas foram avaliadas em instâncias de teste que construímos a partir de dados reais do genoma humano e os seus resultados mostraram-se melhores que os de outras ferramentas de identificação de genes disponíveis na literatura.
id UFMS_850fad1e06c6f6b95abf8533dd46bc40
oai_identifier_str oai:repositorio.ufms.br:123456789/510
network_acronym_str UFMS
network_name_str Repositório Institucional da UFMS
repository_id_str 2124
spelling 2011-09-15T14:45:36Z2021-09-30T19:55:17Z2010https://repositorio.ufms.br/handle/123456789/510A identificação de genes em sequências de DNA de organismos eucariotos ainda pode ser considerado um problema em aberto na Bioinformática. Na busca por soluções deste problema, em muitos casos recorre-se à comparação de sequências. Várias combinações de sequências vêm sendo utilizadas pelas ferramentas de identificação de genes e neste trabalho propomos a comparação de diversas sequências de cDNA com uma sequência de DNA. Essa proposta foi abordada através da formulação e estudo de um problema de otimização combinatória denominado Problema do Alinhamento Spliced Múltiplo. Nessa dissertação descrevemos esse problema, demonstramos que ele é NP-completo para a distância de Levenshtein e propomos quatro heurísticas para resolvê-lo. Com base nessas heur´ısticas, desenvolvemos quatro ferramentas de identificação de genes por comparação de uma sequência de DNA com várias sequências de cDNA. Essas ferramentas foram avaliadas em instâncias de teste que construímos a partir de dados reais do genoma humano e os seus resultados mostraram-se melhores que os de outras ferramentas de identificação de genes disponíveis na literatura.The gene prediction in DNA sequences of eukariotic organisms is still an open problem in Bioinformatics. The sequence comparison based approach is commonly used in the search of solutions for this problem. Several different combinations of sequences are being used by gene recognition tools and in this work we propose the comparison of many cDNA sequences with a DNA sequence. This proposal was addressed by the formulation and study of a combinatorial optimization problem, called Multiple Spliced Alignment Problem. In this work we describe this problem, show that it is NP-complete under the Levenshtein distance and propose four heuristics to solve it. Based on these heuristics, we developed four gene recognition tools based on the comparison of a DNA sequence with many cDNAs. These tools were evaluated with instances built from real human genome data and their results were better when compared to other gene recognition tools available in literature.porBiologia MolecularCiência da ComputaçãoSequenciamento GenéticoBioinformáticaIdentificação de genes e o problema do alinhamento Spliced Múltiploinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisAdi, Said SadiqueKishi, Rodrigo Mitsuoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFMSinstname:Universidade Federal de Mato Grosso do Sul (UFMS)instacron:UFMSTHUMBNAILRodrigo Mitsuo Kishi.pdf.jpgRodrigo Mitsuo Kishi.pdf.jpgGenerated Thumbnailimage/jpeg1296https://repositorio.ufms.br/bitstream/123456789/510/4/Rodrigo%20Mitsuo%20Kishi.pdf.jpga6f04cb672bc9092d48d267432c18638MD54TEXTRodrigo Mitsuo Kishi.pdf.txtRodrigo Mitsuo Kishi.pdf.txtExtracted texttext/plain233411https://repositorio.ufms.br/bitstream/123456789/510/3/Rodrigo%20Mitsuo%20Kishi.pdf.txte92a198de440723150522d3cea8a04f2MD53ORIGINALRodrigo Mitsuo Kishi.pdfRodrigo Mitsuo Kishi.pdfapplication/pdf844771https://repositorio.ufms.br/bitstream/123456789/510/1/Rodrigo%20Mitsuo%20Kishi.pdf37281196f3352c76991e58daca4970a1MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ufms.br/bitstream/123456789/510/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52123456789/5102021-09-30 15:55:17.902oai:repositorio.ufms.br:123456789/510Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.ufms.br/oai/requestri.prograd@ufms.bropendoar:21242021-09-30T19:55:17Repositório Institucional da UFMS - Universidade Federal de Mato Grosso do Sul (UFMS)false
dc.title.pt_BR.fl_str_mv Identificação de genes e o problema do alinhamento Spliced Múltiplo
title Identificação de genes e o problema do alinhamento Spliced Múltiplo
spellingShingle Identificação de genes e o problema do alinhamento Spliced Múltiplo
Kishi, Rodrigo Mitsuo
Biologia Molecular
Ciência da Computação
Sequenciamento Genético
Bioinformática
title_short Identificação de genes e o problema do alinhamento Spliced Múltiplo
title_full Identificação de genes e o problema do alinhamento Spliced Múltiplo
title_fullStr Identificação de genes e o problema do alinhamento Spliced Múltiplo
title_full_unstemmed Identificação de genes e o problema do alinhamento Spliced Múltiplo
title_sort Identificação de genes e o problema do alinhamento Spliced Múltiplo
author Kishi, Rodrigo Mitsuo
author_facet Kishi, Rodrigo Mitsuo
author_role author
dc.contributor.advisor1.fl_str_mv Adi, Said Sadique
dc.contributor.author.fl_str_mv Kishi, Rodrigo Mitsuo
contributor_str_mv Adi, Said Sadique
dc.subject.por.fl_str_mv Biologia Molecular
Ciência da Computação
Sequenciamento Genético
Bioinformática
topic Biologia Molecular
Ciência da Computação
Sequenciamento Genético
Bioinformática
description A identificação de genes em sequências de DNA de organismos eucariotos ainda pode ser considerado um problema em aberto na Bioinformática. Na busca por soluções deste problema, em muitos casos recorre-se à comparação de sequências. Várias combinações de sequências vêm sendo utilizadas pelas ferramentas de identificação de genes e neste trabalho propomos a comparação de diversas sequências de cDNA com uma sequência de DNA. Essa proposta foi abordada através da formulação e estudo de um problema de otimização combinatória denominado Problema do Alinhamento Spliced Múltiplo. Nessa dissertação descrevemos esse problema, demonstramos que ele é NP-completo para a distância de Levenshtein e propomos quatro heurísticas para resolvê-lo. Com base nessas heur´ısticas, desenvolvemos quatro ferramentas de identificação de genes por comparação de uma sequência de DNA com várias sequências de cDNA. Essas ferramentas foram avaliadas em instâncias de teste que construímos a partir de dados reais do genoma humano e os seus resultados mostraram-se melhores que os de outras ferramentas de identificação de genes disponíveis na literatura.
publishDate 2010
dc.date.issued.fl_str_mv 2010
dc.date.accessioned.fl_str_mv 2011-09-15T14:45:36Z
dc.date.available.fl_str_mv 2021-09-30T19:55:17Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufms.br/handle/123456789/510
url https://repositorio.ufms.br/handle/123456789/510
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMS
instname:Universidade Federal de Mato Grosso do Sul (UFMS)
instacron:UFMS
instname_str Universidade Federal de Mato Grosso do Sul (UFMS)
instacron_str UFMS
institution UFMS
reponame_str Repositório Institucional da UFMS
collection Repositório Institucional da UFMS
bitstream.url.fl_str_mv https://repositorio.ufms.br/bitstream/123456789/510/4/Rodrigo%20Mitsuo%20Kishi.pdf.jpg
https://repositorio.ufms.br/bitstream/123456789/510/3/Rodrigo%20Mitsuo%20Kishi.pdf.txt
https://repositorio.ufms.br/bitstream/123456789/510/1/Rodrigo%20Mitsuo%20Kishi.pdf
https://repositorio.ufms.br/bitstream/123456789/510/2/license.txt
bitstream.checksum.fl_str_mv a6f04cb672bc9092d48d267432c18638
e92a198de440723150522d3cea8a04f2
37281196f3352c76991e58daca4970a1
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMS - Universidade Federal de Mato Grosso do Sul (UFMS)
repository.mail.fl_str_mv ri.prograd@ufms.br
_version_ 1807552808718696448