Abordagem baseada em algoritmos meméticos para descoberta de motivos biológicos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
Texto Completo: | http://repositorio.utfpr.edu.br/jspui/handle/1/3107 |
Resumo: | A localização dos Sítios de Ligação dos Fatores de Transcrição (TFBS, do inglês Transcription Factor Binding Sites) é considerado um dos principais desafios da Bioinformática. A sua correta identificação desempenha um papel importante na compreensão dos mecanismos de regulação gênica e desenvolvimento de novas drogas. A descoberta de motivos de novo é uma tarefa difícil e a construção de programas computacionalmente eficazes é necessária para melhorar a compreensão e o estudo dos transcritos celulares. Isso permite apontar e eleger elementos recorrentes em um conjunto de sequências para posterior investigação biológica, tais como os resultados de experiências de expressão diferencial de elevado desempenho. Neste trabalho apresentamos o Arcabouço Memetico para Descoberta de Motivos (MFMD, do inglês Memetic Framework for Motif Discovery), um algoritmo cuja construção foi inspirada na teoria dos memes e utilizou como base duas heurísticas – uma construtiva semi-gulosa baseada no GRASP e outra baseada no VNS – bem como um otimizador global baseado nos algoritmos evolutivos. Quando avaliado em conjuntos de dados sintéticos e reais, o MFMD superou as principais ferramentas de detecção de motivos existentes. Essa nova abordagem foi comparada à outras técnicas bem conhecidas da literatura e os resultados sugerem uma melhora significativa nas medidas de desempenho alcançadas pelo MFMD em relação aos algoritmos confrontados. |
id |
UTFPR-12_1f4d636d4747e2f8b3e046c435cde337 |
---|---|
oai_identifier_str |
oai:repositorio.utfpr.edu.br:1/3107 |
network_acronym_str |
UTFPR-12 |
network_name_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
repository_id_str |
|
spelling |
2018-05-14T13:37:37Z2018-05-14T13:37:37Z2017-03-06GARBELINI, Jader Maikol Caldonazzo. Abordagem baseada em algoritmos meméticos para descoberta de motivos biológicos. 2017. 103 f. Dissertação (Mestrado em Bioinformática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2017.http://repositorio.utfpr.edu.br/jspui/handle/1/3107A localização dos Sítios de Ligação dos Fatores de Transcrição (TFBS, do inglês Transcription Factor Binding Sites) é considerado um dos principais desafios da Bioinformática. A sua correta identificação desempenha um papel importante na compreensão dos mecanismos de regulação gênica e desenvolvimento de novas drogas. A descoberta de motivos de novo é uma tarefa difícil e a construção de programas computacionalmente eficazes é necessária para melhorar a compreensão e o estudo dos transcritos celulares. Isso permite apontar e eleger elementos recorrentes em um conjunto de sequências para posterior investigação biológica, tais como os resultados de experiências de expressão diferencial de elevado desempenho. Neste trabalho apresentamos o Arcabouço Memetico para Descoberta de Motivos (MFMD, do inglês Memetic Framework for Motif Discovery), um algoritmo cuja construção foi inspirada na teoria dos memes e utilizou como base duas heurísticas – uma construtiva semi-gulosa baseada no GRASP e outra baseada no VNS – bem como um otimizador global baseado nos algoritmos evolutivos. Quando avaliado em conjuntos de dados sintéticos e reais, o MFMD superou as principais ferramentas de detecção de motivos existentes. Essa nova abordagem foi comparada à outras técnicas bem conhecidas da literatura e os resultados sugerem uma melhora significativa nas medidas de desempenho alcançadas pelo MFMD em relação aos algoritmos confrontados.The location of Transcription Factor Binding Sites (TFBS) is considered one of the main problems of Bioinformatics. Their correct identification plays an important role in understanding the mechanisms of genetic regulation and development of new drugs. The de novo motif discovery is a difficult task and the construction of computationally effective programs is necessary to improve the understanding and study of cell transcripts. This allowed to point and choose recurring elements in a set of sequences for further biological investigation, such as the results of high performance differential expression experiments. In this work we present the Memetic Framework for Motif Discovery (MFMD), an algorithm whose construction was inspired by the theory of memes and based on two heuristics - a semi-greedy construct based on GRASP and another based on VNS - as well as a global optimizer based on the evolutionary algorithms. When evaluated in synthetic and real datasets, MFMD has outperformed the main existing motif detection tools. This new approach was compared to other techniques well known in the literature and the results suggested a significant improvement in the performance measures achieved by MFMD in relation to the algorithms faced.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)Universidade Tecnológica Federal do Paraná (UTFPR)porUniversidade Tecnológica Federal do ParanáCornelio ProcopioPrograma de Pós-Graduação em BioinformáticaUTFPRBrasilCNPQ::CIENCIAS EXATAS E DA TERRAGenéticaComputação evolutivaHeurísticaMeméticaInteligência computacionalEvolutionary computationHeuristicMemeticsComputational intelligenceAbordagem baseada em algoritmos meméticos para descoberta de motivos biológicosApproach based on memetic algorithms for biological motif discoveryinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisCornélio ProcópioSanches, Danilo Sipolihttp://lattes.cnpq.br/6377657274398145Kashiwabara, Andre Yoshiakihttp://lattes.cnpq.br/3194328548975437Sanches, Danilo SipoliVilas-Boas, Laurival AntonioTinós, Renatohttp://lattes.cnpq.br/2960700899606501Garbelini, Jader Maikol Caldonazzoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRORIGINALCP_PPGBIOINFO_M_Garbelini, Jader Maikol Caldonazzo_2017.pdfCP_PPGBIOINFO_M_Garbelini, Jader Maikol Caldonazzo_2017.pdfapplication/pdf2190622http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/3107/1/CP_PPGBIOINFO_M_Garbelini%2c%20Jader%20Maikol%20Caldonazzo_2017.pdf4090c776dd0264f2a9842c2719dbcefbMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/3107/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52TEXTCP_PPGBIOINFO_M_Garbelini, Jader Maikol Caldonazzo_2017.pdf.txtCP_PPGBIOINFO_M_Garbelini, Jader Maikol Caldonazzo_2017.pdf.txtExtracted texttext/plain208492http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/3107/3/CP_PPGBIOINFO_M_Garbelini%2c%20Jader%20Maikol%20Caldonazzo_2017.pdf.txt30d9c66cc98d1aec0409df7c60c6bf54MD53THUMBNAILCP_PPGBIOINFO_M_Garbelini, Jader Maikol Caldonazzo_2017.pdf.jpgCP_PPGBIOINFO_M_Garbelini, Jader Maikol Caldonazzo_2017.pdf.jpgGenerated Thumbnailimage/jpeg1396http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/3107/4/CP_PPGBIOINFO_M_Garbelini%2c%20Jader%20Maikol%20Caldonazzo_2017.pdf.jpg79057f94284209669d6f118c1403db53MD541/31072018-05-14 10:37:38.322oai:repositorio.utfpr.edu.br:1/3107Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2018-05-14T13:37:38Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false |
dc.title.pt_BR.fl_str_mv |
Abordagem baseada em algoritmos meméticos para descoberta de motivos biológicos |
dc.title.alternative.pt_BR.fl_str_mv |
Approach based on memetic algorithms for biological motif discovery |
title |
Abordagem baseada em algoritmos meméticos para descoberta de motivos biológicos |
spellingShingle |
Abordagem baseada em algoritmos meméticos para descoberta de motivos biológicos Garbelini, Jader Maikol Caldonazzo CNPQ::CIENCIAS EXATAS E DA TERRA Computação evolutiva Heurística Memética Inteligência computacional Evolutionary computation Heuristic Memetics Computational intelligence Genética |
title_short |
Abordagem baseada em algoritmos meméticos para descoberta de motivos biológicos |
title_full |
Abordagem baseada em algoritmos meméticos para descoberta de motivos biológicos |
title_fullStr |
Abordagem baseada em algoritmos meméticos para descoberta de motivos biológicos |
title_full_unstemmed |
Abordagem baseada em algoritmos meméticos para descoberta de motivos biológicos |
title_sort |
Abordagem baseada em algoritmos meméticos para descoberta de motivos biológicos |
author |
Garbelini, Jader Maikol Caldonazzo |
author_facet |
Garbelini, Jader Maikol Caldonazzo |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Sanches, Danilo Sipoli |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/6377657274398145 |
dc.contributor.advisor-co1.fl_str_mv |
Kashiwabara, Andre Yoshiaki |
dc.contributor.advisor-co1Lattes.fl_str_mv |
http://lattes.cnpq.br/3194328548975437 |
dc.contributor.referee1.fl_str_mv |
Sanches, Danilo Sipoli |
dc.contributor.referee2.fl_str_mv |
Vilas-Boas, Laurival Antonio |
dc.contributor.referee3.fl_str_mv |
Tinós, Renato |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/2960700899606501 |
dc.contributor.author.fl_str_mv |
Garbelini, Jader Maikol Caldonazzo |
contributor_str_mv |
Sanches, Danilo Sipoli Kashiwabara, Andre Yoshiaki Sanches, Danilo Sipoli Vilas-Boas, Laurival Antonio Tinós, Renato |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA Computação evolutiva Heurística Memética Inteligência computacional Evolutionary computation Heuristic Memetics Computational intelligence Genética |
dc.subject.por.fl_str_mv |
Computação evolutiva Heurística Memética Inteligência computacional Evolutionary computation Heuristic Memetics Computational intelligence |
dc.subject.capes.pt_BR.fl_str_mv |
Genética |
description |
A localização dos Sítios de Ligação dos Fatores de Transcrição (TFBS, do inglês Transcription Factor Binding Sites) é considerado um dos principais desafios da Bioinformática. A sua correta identificação desempenha um papel importante na compreensão dos mecanismos de regulação gênica e desenvolvimento de novas drogas. A descoberta de motivos de novo é uma tarefa difícil e a construção de programas computacionalmente eficazes é necessária para melhorar a compreensão e o estudo dos transcritos celulares. Isso permite apontar e eleger elementos recorrentes em um conjunto de sequências para posterior investigação biológica, tais como os resultados de experiências de expressão diferencial de elevado desempenho. Neste trabalho apresentamos o Arcabouço Memetico para Descoberta de Motivos (MFMD, do inglês Memetic Framework for Motif Discovery), um algoritmo cuja construção foi inspirada na teoria dos memes e utilizou como base duas heurísticas – uma construtiva semi-gulosa baseada no GRASP e outra baseada no VNS – bem como um otimizador global baseado nos algoritmos evolutivos. Quando avaliado em conjuntos de dados sintéticos e reais, o MFMD superou as principais ferramentas de detecção de motivos existentes. Essa nova abordagem foi comparada à outras técnicas bem conhecidas da literatura e os resultados sugerem uma melhora significativa nas medidas de desempenho alcançadas pelo MFMD em relação aos algoritmos confrontados. |
publishDate |
2017 |
dc.date.issued.fl_str_mv |
2017-03-06 |
dc.date.accessioned.fl_str_mv |
2018-05-14T13:37:37Z |
dc.date.available.fl_str_mv |
2018-05-14T13:37:37Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
GARBELINI, Jader Maikol Caldonazzo. Abordagem baseada em algoritmos meméticos para descoberta de motivos biológicos. 2017. 103 f. Dissertação (Mestrado em Bioinformática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2017. |
dc.identifier.uri.fl_str_mv |
http://repositorio.utfpr.edu.br/jspui/handle/1/3107 |
identifier_str_mv |
GARBELINI, Jader Maikol Caldonazzo. Abordagem baseada em algoritmos meméticos para descoberta de motivos biológicos. 2017. 103 f. Dissertação (Mestrado em Bioinformática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2017. |
url |
http://repositorio.utfpr.edu.br/jspui/handle/1/3107 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Cornelio Procopio |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Bioinformática |
dc.publisher.initials.fl_str_mv |
UTFPR |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Cornelio Procopio |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) instname:Universidade Tecnológica Federal do Paraná (UTFPR) instacron:UTFPR |
instname_str |
Universidade Tecnológica Federal do Paraná (UTFPR) |
instacron_str |
UTFPR |
institution |
UTFPR |
reponame_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
collection |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
bitstream.url.fl_str_mv |
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/3107/1/CP_PPGBIOINFO_M_Garbelini%2c%20Jader%20Maikol%20Caldonazzo_2017.pdf http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/3107/2/license.txt http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/3107/3/CP_PPGBIOINFO_M_Garbelini%2c%20Jader%20Maikol%20Caldonazzo_2017.pdf.txt http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/3107/4/CP_PPGBIOINFO_M_Garbelini%2c%20Jader%20Maikol%20Caldonazzo_2017.pdf.jpg |
bitstream.checksum.fl_str_mv |
4090c776dd0264f2a9842c2719dbcefb 8a4605be74aa9ea9d79846c1fba20a33 30d9c66cc98d1aec0409df7c60c6bf54 79057f94284209669d6f118c1403db53 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR) |
repository.mail.fl_str_mv |
|
_version_ |
1805922912725630976 |