Uma comparação entre classificadores para predição da classe de cor a partir de dados estruturais em proteínas fluorescentes

Bibliographic Details
Main Author: Silva, Roger Sá da
Publication Date: 2016
Format: Master thesis
Language: por
Source: Repositório Institucional da FURG (RI FURG)
Download full: http://repositorio.furg.br/handle/1/8421
Summary: Proteínas Fluorescentes são importantes ferramentas em pesquisas de Biologia Molecular e possuem grande valor comercial na produção de peixes transgênicos fluorescentes. De modo geral, a criação de variantes de cor destas proteínas ocorre por alterações estruturais na macromolécula, ocasionadas por mutações na sequência de aminoácidos. Porém, relacionar de forma exata dados estruturais e sequenciais com a definição de cor de emissão de proteínas fluorescentes ainda necessita de mais estudos. Neste contexto, a aplicação do processo de descoberta de conhecimento em bases de dados se apresenta como uma possibilidade de obtenção de conhecimento sobre essa relação da sequência/estrutura e a cor de emissão. Dessa forma, é realizado neste trabalho a comparação entre três classificadores (baseados em Árvore de Decisão, Redes Neurais Artificiais e Máquinas de Vetores de Suporte) com o intuito de investigar a performance deles na predição da classe de cor de proteínas fluorescentes a partir de seus dados estruturais no âmbito do projeto Peixes Transgênicos Fluorescentes. Para tanto, uma ferramenta web é desenvolvida para o armazenamento, organização e preparação dos dados estruturais utilizados no treinamento dos classificadores. Ao final, um processo de comparação quantitativa e qualitativa é realizado sobre métricas de desempenho e capacidades de cada classificador, culminando na escolha do classificador baseado em Árvore de Decisão como o mais adequado na tarefa de predição da classe de cor de proteínas fluorescentes.
id FURG_55d6efe997c98f8777c6e686d70f35eb
oai_identifier_str oai:repositorio.furg.br:1/8421
network_acronym_str FURG
network_name_str Repositório Institucional da FURG (RI FURG)
repository_id_str
spelling Silva, Roger Sá daWerhli, Adriano Velasque2020-03-10T15:47:08Z2020-03-10T15:47:08Z2016SILVA, Roger Sá da. Uma comparação entre classificadores para predição da classe de cor a partir de dados estruturais em proteínas fluorescentes. 2016. 120 f. Dissertação (Mestrado em Engenharia da Computação) – Centro de Ciências Computacionais, Universidade Federal do Rio Grande, Rio Grande, 2016.http://repositorio.furg.br/handle/1/8421Proteínas Fluorescentes são importantes ferramentas em pesquisas de Biologia Molecular e possuem grande valor comercial na produção de peixes transgênicos fluorescentes. De modo geral, a criação de variantes de cor destas proteínas ocorre por alterações estruturais na macromolécula, ocasionadas por mutações na sequência de aminoácidos. Porém, relacionar de forma exata dados estruturais e sequenciais com a definição de cor de emissão de proteínas fluorescentes ainda necessita de mais estudos. Neste contexto, a aplicação do processo de descoberta de conhecimento em bases de dados se apresenta como uma possibilidade de obtenção de conhecimento sobre essa relação da sequência/estrutura e a cor de emissão. Dessa forma, é realizado neste trabalho a comparação entre três classificadores (baseados em Árvore de Decisão, Redes Neurais Artificiais e Máquinas de Vetores de Suporte) com o intuito de investigar a performance deles na predição da classe de cor de proteínas fluorescentes a partir de seus dados estruturais no âmbito do projeto Peixes Transgênicos Fluorescentes. Para tanto, uma ferramenta web é desenvolvida para o armazenamento, organização e preparação dos dados estruturais utilizados no treinamento dos classificadores. Ao final, um processo de comparação quantitativa e qualitativa é realizado sobre métricas de desempenho e capacidades de cada classificador, culminando na escolha do classificador baseado em Árvore de Decisão como o mais adequado na tarefa de predição da classe de cor de proteínas fluorescentes.Fluorescent proteins are important tools in molecular biology research and have great commercial value in production of fluorescent transgenic fishes. In general, the creation of color variants of these proteins occurs by structural changes in the macromolecule caused by mutations in amino acid sequence. However, to relate accurately structural and sequence data of fluorescent proteins with its emission color still needs further study. In this context, the application of knowledge discovery in databases process presents a possibility of obtaining knowledge on this relationship of the sequence / structure and emission color. Thus, in this work it is carried out a comparison between classifiers (based on Decision Tree, Artificial Neural Networks and Support Vector Machines) in order to investigate their performance in predicting the class color of fluorescent proteins from their structural data, in the context of Fluorescent Transgenic Fishes project. Therefore, an web tool is designed for the storage, organization and preparation of structural data used in the classifiers training. At the end, a quantitative and qualitative comparison process is carried out on performance metrics and capabilities of each classifier, culminating in the selection of the classifier based on Decision Tree as the most appropriate for the task of predicting the fluorescent proteins color class.porBioinformáticaMineração de dadosProteínas FluorescentesBioinformaticsData miningFluorescent proteinsUma comparação entre classificadores para predição da classe de cor a partir de dados estruturais em proteínas fluorescentesA comparison of classifiers for predicting color class from structural data on fluorescent proteinsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da FURG (RI FURG)instname:Universidade Federal do Rio Grande (FURG)instacron:FURGORIGINAL40.pdf40.pdfapplication/pdf2091586https://repositorio.furg.br/bitstream/1/8421/1/40.pdff5078b5c26b3d3a6c0eae0b6225da9c7MD51open accessLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.furg.br/bitstream/1/8421/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52open access1/84212020-03-10 12:47:08.116open accessoai:repositorio.furg.br:1/8421Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.furg.br/oai/request || http://200.19.254.174/oai/requestopendoar:2020-03-10T15:47:08Repositório Institucional da FURG (RI FURG) - Universidade Federal do Rio Grande (FURG)false
dc.title.pt_BR.fl_str_mv Uma comparação entre classificadores para predição da classe de cor a partir de dados estruturais em proteínas fluorescentes
dc.title.alternative.pt_BR.fl_str_mv A comparison of classifiers for predicting color class from structural data on fluorescent proteins
title Uma comparação entre classificadores para predição da classe de cor a partir de dados estruturais em proteínas fluorescentes
spellingShingle Uma comparação entre classificadores para predição da classe de cor a partir de dados estruturais em proteínas fluorescentes
Silva, Roger Sá da
Bioinformática
Mineração de dados
Proteínas Fluorescentes
Bioinformatics
Data mining
Fluorescent proteins
title_short Uma comparação entre classificadores para predição da classe de cor a partir de dados estruturais em proteínas fluorescentes
title_full Uma comparação entre classificadores para predição da classe de cor a partir de dados estruturais em proteínas fluorescentes
title_fullStr Uma comparação entre classificadores para predição da classe de cor a partir de dados estruturais em proteínas fluorescentes
title_full_unstemmed Uma comparação entre classificadores para predição da classe de cor a partir de dados estruturais em proteínas fluorescentes
title_sort Uma comparação entre classificadores para predição da classe de cor a partir de dados estruturais em proteínas fluorescentes
author Silva, Roger Sá da
author_facet Silva, Roger Sá da
author_role author
dc.contributor.author.fl_str_mv Silva, Roger Sá da
dc.contributor.advisor1.fl_str_mv Werhli, Adriano Velasque
contributor_str_mv Werhli, Adriano Velasque
dc.subject.por.fl_str_mv Bioinformática
Mineração de dados
Proteínas Fluorescentes
Bioinformatics
Data mining
Fluorescent proteins
topic Bioinformática
Mineração de dados
Proteínas Fluorescentes
Bioinformatics
Data mining
Fluorescent proteins
description Proteínas Fluorescentes são importantes ferramentas em pesquisas de Biologia Molecular e possuem grande valor comercial na produção de peixes transgênicos fluorescentes. De modo geral, a criação de variantes de cor destas proteínas ocorre por alterações estruturais na macromolécula, ocasionadas por mutações na sequência de aminoácidos. Porém, relacionar de forma exata dados estruturais e sequenciais com a definição de cor de emissão de proteínas fluorescentes ainda necessita de mais estudos. Neste contexto, a aplicação do processo de descoberta de conhecimento em bases de dados se apresenta como uma possibilidade de obtenção de conhecimento sobre essa relação da sequência/estrutura e a cor de emissão. Dessa forma, é realizado neste trabalho a comparação entre três classificadores (baseados em Árvore de Decisão, Redes Neurais Artificiais e Máquinas de Vetores de Suporte) com o intuito de investigar a performance deles na predição da classe de cor de proteínas fluorescentes a partir de seus dados estruturais no âmbito do projeto Peixes Transgênicos Fluorescentes. Para tanto, uma ferramenta web é desenvolvida para o armazenamento, organização e preparação dos dados estruturais utilizados no treinamento dos classificadores. Ao final, um processo de comparação quantitativa e qualitativa é realizado sobre métricas de desempenho e capacidades de cada classificador, culminando na escolha do classificador baseado em Árvore de Decisão como o mais adequado na tarefa de predição da classe de cor de proteínas fluorescentes.
publishDate 2016
dc.date.issued.fl_str_mv 2016
dc.date.accessioned.fl_str_mv 2020-03-10T15:47:08Z
dc.date.available.fl_str_mv 2020-03-10T15:47:08Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SILVA, Roger Sá da. Uma comparação entre classificadores para predição da classe de cor a partir de dados estruturais em proteínas fluorescentes. 2016. 120 f. Dissertação (Mestrado em Engenharia da Computação) – Centro de Ciências Computacionais, Universidade Federal do Rio Grande, Rio Grande, 2016.
dc.identifier.uri.fl_str_mv http://repositorio.furg.br/handle/1/8421
identifier_str_mv SILVA, Roger Sá da. Uma comparação entre classificadores para predição da classe de cor a partir de dados estruturais em proteínas fluorescentes. 2016. 120 f. Dissertação (Mestrado em Engenharia da Computação) – Centro de Ciências Computacionais, Universidade Federal do Rio Grande, Rio Grande, 2016.
url http://repositorio.furg.br/handle/1/8421
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da FURG (RI FURG)
instname:Universidade Federal do Rio Grande (FURG)
instacron:FURG
instname_str Universidade Federal do Rio Grande (FURG)
instacron_str FURG
institution FURG
reponame_str Repositório Institucional da FURG (RI FURG)
collection Repositório Institucional da FURG (RI FURG)
bitstream.url.fl_str_mv https://repositorio.furg.br/bitstream/1/8421/1/40.pdf
https://repositorio.furg.br/bitstream/1/8421/2/license.txt
bitstream.checksum.fl_str_mv f5078b5c26b3d3a6c0eae0b6225da9c7
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da FURG (RI FURG) - Universidade Federal do Rio Grande (FURG)
repository.mail.fl_str_mv
_version_ 1798313627284930560