Abordagem baseada em algoritmos meméticos para descoberta de motivos biológicos

Detalhes bibliográficos
Autor(a) principal: Garbelini, Jader Maikol Caldonazzo
Data de Publicação: 2017
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
Texto Completo: http://repositorio.utfpr.edu.br/jspui/handle/1/3107
Resumo: A localização dos Sítios de Ligação dos Fatores de Transcrição (TFBS, do inglês Transcription Factor Binding Sites) é considerado um dos principais desafios da Bioinformática. A sua correta identificação desempenha um papel importante na compreensão dos mecanismos de regulação gênica e desenvolvimento de novas drogas. A descoberta de motivos de novo é uma tarefa difícil e a construção de programas computacionalmente eficazes é necessária para melhorar a compreensão e o estudo dos transcritos celulares. Isso permite apontar e eleger elementos recorrentes em um conjunto de sequências para posterior investigação biológica, tais como os resultados de experiências de expressão diferencial de elevado desempenho. Neste trabalho apresentamos o Arcabouço Memetico para Descoberta de Motivos (MFMD, do inglês Memetic Framework for Motif Discovery), um algoritmo cuja construção foi inspirada na teoria dos memes e utilizou como base duas heurísticas – uma construtiva semi-gulosa baseada no GRASP e outra baseada no VNS – bem como um otimizador global baseado nos algoritmos evolutivos. Quando avaliado em conjuntos de dados sintéticos e reais, o MFMD superou as principais ferramentas de detecção de motivos existentes. Essa nova abordagem foi comparada à outras técnicas bem conhecidas da literatura e os resultados sugerem uma melhora significativa nas medidas de desempenho alcançadas pelo MFMD em relação aos algoritmos confrontados.
id UTFPR-12_1f4d636d4747e2f8b3e046c435cde337
oai_identifier_str oai:repositorio.utfpr.edu.br:1/3107
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling 2018-05-14T13:37:37Z2018-05-14T13:37:37Z2017-03-06GARBELINI, Jader Maikol Caldonazzo. Abordagem baseada em algoritmos meméticos para descoberta de motivos biológicos. 2017. 103 f. Dissertação (Mestrado em Bioinformática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2017.http://repositorio.utfpr.edu.br/jspui/handle/1/3107A localização dos Sítios de Ligação dos Fatores de Transcrição (TFBS, do inglês Transcription Factor Binding Sites) é considerado um dos principais desafios da Bioinformática. A sua correta identificação desempenha um papel importante na compreensão dos mecanismos de regulação gênica e desenvolvimento de novas drogas. A descoberta de motivos de novo é uma tarefa difícil e a construção de programas computacionalmente eficazes é necessária para melhorar a compreensão e o estudo dos transcritos celulares. Isso permite apontar e eleger elementos recorrentes em um conjunto de sequências para posterior investigação biológica, tais como os resultados de experiências de expressão diferencial de elevado desempenho. Neste trabalho apresentamos o Arcabouço Memetico para Descoberta de Motivos (MFMD, do inglês Memetic Framework for Motif Discovery), um algoritmo cuja construção foi inspirada na teoria dos memes e utilizou como base duas heurísticas – uma construtiva semi-gulosa baseada no GRASP e outra baseada no VNS – bem como um otimizador global baseado nos algoritmos evolutivos. Quando avaliado em conjuntos de dados sintéticos e reais, o MFMD superou as principais ferramentas de detecção de motivos existentes. Essa nova abordagem foi comparada à outras técnicas bem conhecidas da literatura e os resultados sugerem uma melhora significativa nas medidas de desempenho alcançadas pelo MFMD em relação aos algoritmos confrontados.The location of Transcription Factor Binding Sites (TFBS) is considered one of the main problems of Bioinformatics. Their correct identification plays an important role in understanding the mechanisms of genetic regulation and development of new drugs. The de novo motif discovery is a difficult task and the construction of computationally effective programs is necessary to improve the understanding and study of cell transcripts. This allowed to point and choose recurring elements in a set of sequences for further biological investigation, such as the results of high performance differential expression experiments. In this work we present the Memetic Framework for Motif Discovery (MFMD), an algorithm whose construction was inspired by the theory of memes and based on two heuristics - a semi-greedy construct based on GRASP and another based on VNS - as well as a global optimizer based on the evolutionary algorithms. When evaluated in synthetic and real datasets, MFMD has outperformed the main existing motif detection tools. This new approach was compared to other techniques well known in the literature and the results suggested a significant improvement in the performance measures achieved by MFMD in relation to the algorithms faced.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)Universidade Tecnológica Federal do Paraná (UTFPR)porUniversidade Tecnológica Federal do ParanáCornelio ProcopioPrograma de Pós-Graduação em BioinformáticaUTFPRBrasilCNPQ::CIENCIAS EXATAS E DA TERRAGenéticaComputação evolutivaHeurísticaMeméticaInteligência computacionalEvolutionary computationHeuristicMemeticsComputational intelligenceAbordagem baseada em algoritmos meméticos para descoberta de motivos biológicosApproach based on memetic algorithms for biological motif discoveryinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisCornélio ProcópioSanches, Danilo Sipolihttp://lattes.cnpq.br/6377657274398145Kashiwabara, Andre Yoshiakihttp://lattes.cnpq.br/3194328548975437Sanches, Danilo SipoliVilas-Boas, Laurival AntonioTinós, Renatohttp://lattes.cnpq.br/2960700899606501Garbelini, Jader Maikol Caldonazzoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRORIGINALCP_PPGBIOINFO_M_Garbelini, Jader Maikol Caldonazzo_2017.pdfCP_PPGBIOINFO_M_Garbelini, Jader Maikol Caldonazzo_2017.pdfapplication/pdf2190622http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/3107/1/CP_PPGBIOINFO_M_Garbelini%2c%20Jader%20Maikol%20Caldonazzo_2017.pdf4090c776dd0264f2a9842c2719dbcefbMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/3107/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52TEXTCP_PPGBIOINFO_M_Garbelini, Jader Maikol Caldonazzo_2017.pdf.txtCP_PPGBIOINFO_M_Garbelini, Jader Maikol Caldonazzo_2017.pdf.txtExtracted texttext/plain208492http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/3107/3/CP_PPGBIOINFO_M_Garbelini%2c%20Jader%20Maikol%20Caldonazzo_2017.pdf.txt30d9c66cc98d1aec0409df7c60c6bf54MD53THUMBNAILCP_PPGBIOINFO_M_Garbelini, Jader Maikol Caldonazzo_2017.pdf.jpgCP_PPGBIOINFO_M_Garbelini, Jader Maikol Caldonazzo_2017.pdf.jpgGenerated Thumbnailimage/jpeg1396http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/3107/4/CP_PPGBIOINFO_M_Garbelini%2c%20Jader%20Maikol%20Caldonazzo_2017.pdf.jpg79057f94284209669d6f118c1403db53MD541/31072018-05-14 10:37:38.322oai:repositorio.utfpr.edu.br:1/3107Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2018-05-14T13:37:38Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.pt_BR.fl_str_mv Abordagem baseada em algoritmos meméticos para descoberta de motivos biológicos
dc.title.alternative.pt_BR.fl_str_mv Approach based on memetic algorithms for biological motif discovery
title Abordagem baseada em algoritmos meméticos para descoberta de motivos biológicos
spellingShingle Abordagem baseada em algoritmos meméticos para descoberta de motivos biológicos
Garbelini, Jader Maikol Caldonazzo
CNPQ::CIENCIAS EXATAS E DA TERRA
Computação evolutiva
Heurística
Memética
Inteligência computacional
Evolutionary computation
Heuristic
Memetics
Computational intelligence
Genética
title_short Abordagem baseada em algoritmos meméticos para descoberta de motivos biológicos
title_full Abordagem baseada em algoritmos meméticos para descoberta de motivos biológicos
title_fullStr Abordagem baseada em algoritmos meméticos para descoberta de motivos biológicos
title_full_unstemmed Abordagem baseada em algoritmos meméticos para descoberta de motivos biológicos
title_sort Abordagem baseada em algoritmos meméticos para descoberta de motivos biológicos
author Garbelini, Jader Maikol Caldonazzo
author_facet Garbelini, Jader Maikol Caldonazzo
author_role author
dc.contributor.advisor1.fl_str_mv Sanches, Danilo Sipoli
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/6377657274398145
dc.contributor.advisor-co1.fl_str_mv Kashiwabara, Andre Yoshiaki
dc.contributor.advisor-co1Lattes.fl_str_mv http://lattes.cnpq.br/3194328548975437
dc.contributor.referee1.fl_str_mv Sanches, Danilo Sipoli
dc.contributor.referee2.fl_str_mv Vilas-Boas, Laurival Antonio
dc.contributor.referee3.fl_str_mv Tinós, Renato
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/2960700899606501
dc.contributor.author.fl_str_mv Garbelini, Jader Maikol Caldonazzo
contributor_str_mv Sanches, Danilo Sipoli
Kashiwabara, Andre Yoshiaki
Sanches, Danilo Sipoli
Vilas-Boas, Laurival Antonio
Tinós, Renato
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA
topic CNPQ::CIENCIAS EXATAS E DA TERRA
Computação evolutiva
Heurística
Memética
Inteligência computacional
Evolutionary computation
Heuristic
Memetics
Computational intelligence
Genética
dc.subject.por.fl_str_mv Computação evolutiva
Heurística
Memética
Inteligência computacional
Evolutionary computation
Heuristic
Memetics
Computational intelligence
dc.subject.capes.pt_BR.fl_str_mv Genética
description A localização dos Sítios de Ligação dos Fatores de Transcrição (TFBS, do inglês Transcription Factor Binding Sites) é considerado um dos principais desafios da Bioinformática. A sua correta identificação desempenha um papel importante na compreensão dos mecanismos de regulação gênica e desenvolvimento de novas drogas. A descoberta de motivos de novo é uma tarefa difícil e a construção de programas computacionalmente eficazes é necessária para melhorar a compreensão e o estudo dos transcritos celulares. Isso permite apontar e eleger elementos recorrentes em um conjunto de sequências para posterior investigação biológica, tais como os resultados de experiências de expressão diferencial de elevado desempenho. Neste trabalho apresentamos o Arcabouço Memetico para Descoberta de Motivos (MFMD, do inglês Memetic Framework for Motif Discovery), um algoritmo cuja construção foi inspirada na teoria dos memes e utilizou como base duas heurísticas – uma construtiva semi-gulosa baseada no GRASP e outra baseada no VNS – bem como um otimizador global baseado nos algoritmos evolutivos. Quando avaliado em conjuntos de dados sintéticos e reais, o MFMD superou as principais ferramentas de detecção de motivos existentes. Essa nova abordagem foi comparada à outras técnicas bem conhecidas da literatura e os resultados sugerem uma melhora significativa nas medidas de desempenho alcançadas pelo MFMD em relação aos algoritmos confrontados.
publishDate 2017
dc.date.issued.fl_str_mv 2017-03-06
dc.date.accessioned.fl_str_mv 2018-05-14T13:37:37Z
dc.date.available.fl_str_mv 2018-05-14T13:37:37Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv GARBELINI, Jader Maikol Caldonazzo. Abordagem baseada em algoritmos meméticos para descoberta de motivos biológicos. 2017. 103 f. Dissertação (Mestrado em Bioinformática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2017.
dc.identifier.uri.fl_str_mv http://repositorio.utfpr.edu.br/jspui/handle/1/3107
identifier_str_mv GARBELINI, Jader Maikol Caldonazzo. Abordagem baseada em algoritmos meméticos para descoberta de motivos biológicos. 2017. 103 f. Dissertação (Mestrado em Bioinformática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2017.
url http://repositorio.utfpr.edu.br/jspui/handle/1/3107
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Cornelio Procopio
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Bioinformática
dc.publisher.initials.fl_str_mv UTFPR
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Cornelio Procopio
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
bitstream.url.fl_str_mv http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/3107/1/CP_PPGBIOINFO_M_Garbelini%2c%20Jader%20Maikol%20Caldonazzo_2017.pdf
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/3107/2/license.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/3107/3/CP_PPGBIOINFO_M_Garbelini%2c%20Jader%20Maikol%20Caldonazzo_2017.pdf.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/3107/4/CP_PPGBIOINFO_M_Garbelini%2c%20Jader%20Maikol%20Caldonazzo_2017.pdf.jpg
bitstream.checksum.fl_str_mv 4090c776dd0264f2a9842c2719dbcefb
8a4605be74aa9ea9d79846c1fba20a33
30d9c66cc98d1aec0409df7c60c6bf54
79057f94284209669d6f118c1403db53
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv
_version_ 1805922912725630976