Uma comparação entre classificadores para predição da classe de cor a partir de dados estruturais em proteínas fluorescentes
Autor(a) principal: | |
---|---|
Data de Publicação: | 2016 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da FURG (RI FURG) |
Texto Completo: | http://repositorio.furg.br/handle/1/8421 |
Resumo: | Proteínas Fluorescentes são importantes ferramentas em pesquisas de Biologia Molecular e possuem grande valor comercial na produção de peixes transgênicos fluorescentes. De modo geral, a criação de variantes de cor destas proteínas ocorre por alterações estruturais na macromolécula, ocasionadas por mutações na sequência de aminoácidos. Porém, relacionar de forma exata dados estruturais e sequenciais com a definição de cor de emissão de proteínas fluorescentes ainda necessita de mais estudos. Neste contexto, a aplicação do processo de descoberta de conhecimento em bases de dados se apresenta como uma possibilidade de obtenção de conhecimento sobre essa relação da sequência/estrutura e a cor de emissão. Dessa forma, é realizado neste trabalho a comparação entre três classificadores (baseados em Árvore de Decisão, Redes Neurais Artificiais e Máquinas de Vetores de Suporte) com o intuito de investigar a performance deles na predição da classe de cor de proteínas fluorescentes a partir de seus dados estruturais no âmbito do projeto Peixes Transgênicos Fluorescentes. Para tanto, uma ferramenta web é desenvolvida para o armazenamento, organização e preparação dos dados estruturais utilizados no treinamento dos classificadores. Ao final, um processo de comparação quantitativa e qualitativa é realizado sobre métricas de desempenho e capacidades de cada classificador, culminando na escolha do classificador baseado em Árvore de Decisão como o mais adequado na tarefa de predição da classe de cor de proteínas fluorescentes. |
id |
FURG_55d6efe997c98f8777c6e686d70f35eb |
---|---|
oai_identifier_str |
oai:repositorio.furg.br:1/8421 |
network_acronym_str |
FURG |
network_name_str |
Repositório Institucional da FURG (RI FURG) |
repository_id_str |
|
spelling |
Silva, Roger Sá daWerhli, Adriano Velasque2020-03-10T15:47:08Z2020-03-10T15:47:08Z2016SILVA, Roger Sá da. Uma comparação entre classificadores para predição da classe de cor a partir de dados estruturais em proteínas fluorescentes. 2016. 120 f. Dissertação (Mestrado em Engenharia da Computação) – Centro de Ciências Computacionais, Universidade Federal do Rio Grande, Rio Grande, 2016.http://repositorio.furg.br/handle/1/8421Proteínas Fluorescentes são importantes ferramentas em pesquisas de Biologia Molecular e possuem grande valor comercial na produção de peixes transgênicos fluorescentes. De modo geral, a criação de variantes de cor destas proteínas ocorre por alterações estruturais na macromolécula, ocasionadas por mutações na sequência de aminoácidos. Porém, relacionar de forma exata dados estruturais e sequenciais com a definição de cor de emissão de proteínas fluorescentes ainda necessita de mais estudos. Neste contexto, a aplicação do processo de descoberta de conhecimento em bases de dados se apresenta como uma possibilidade de obtenção de conhecimento sobre essa relação da sequência/estrutura e a cor de emissão. Dessa forma, é realizado neste trabalho a comparação entre três classificadores (baseados em Árvore de Decisão, Redes Neurais Artificiais e Máquinas de Vetores de Suporte) com o intuito de investigar a performance deles na predição da classe de cor de proteínas fluorescentes a partir de seus dados estruturais no âmbito do projeto Peixes Transgênicos Fluorescentes. Para tanto, uma ferramenta web é desenvolvida para o armazenamento, organização e preparação dos dados estruturais utilizados no treinamento dos classificadores. Ao final, um processo de comparação quantitativa e qualitativa é realizado sobre métricas de desempenho e capacidades de cada classificador, culminando na escolha do classificador baseado em Árvore de Decisão como o mais adequado na tarefa de predição da classe de cor de proteínas fluorescentes.Fluorescent proteins are important tools in molecular biology research and have great commercial value in production of fluorescent transgenic fishes. In general, the creation of color variants of these proteins occurs by structural changes in the macromolecule caused by mutations in amino acid sequence. However, to relate accurately structural and sequence data of fluorescent proteins with its emission color still needs further study. In this context, the application of knowledge discovery in databases process presents a possibility of obtaining knowledge on this relationship of the sequence / structure and emission color. Thus, in this work it is carried out a comparison between classifiers (based on Decision Tree, Artificial Neural Networks and Support Vector Machines) in order to investigate their performance in predicting the class color of fluorescent proteins from their structural data, in the context of Fluorescent Transgenic Fishes project. Therefore, an web tool is designed for the storage, organization and preparation of structural data used in the classifiers training. At the end, a quantitative and qualitative comparison process is carried out on performance metrics and capabilities of each classifier, culminating in the selection of the classifier based on Decision Tree as the most appropriate for the task of predicting the fluorescent proteins color class.porBioinformáticaMineração de dadosProteínas FluorescentesBioinformaticsData miningFluorescent proteinsUma comparação entre classificadores para predição da classe de cor a partir de dados estruturais em proteínas fluorescentesA comparison of classifiers for predicting color class from structural data on fluorescent proteinsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da FURG (RI FURG)instname:Universidade Federal do Rio Grande (FURG)instacron:FURGORIGINAL40.pdf40.pdfapplication/pdf2091586https://repositorio.furg.br/bitstream/1/8421/1/40.pdff5078b5c26b3d3a6c0eae0b6225da9c7MD51open accessLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.furg.br/bitstream/1/8421/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52open access1/84212020-03-10 12:47:08.116open accessoai:repositorio.furg.br:1/8421Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.furg.br/oai/request || http://200.19.254.174/oai/requestopendoar:2020-03-10T15:47:08Repositório Institucional da FURG (RI FURG) - Universidade Federal do Rio Grande (FURG)false |
dc.title.pt_BR.fl_str_mv |
Uma comparação entre classificadores para predição da classe de cor a partir de dados estruturais em proteínas fluorescentes |
dc.title.alternative.pt_BR.fl_str_mv |
A comparison of classifiers for predicting color class from structural data on fluorescent proteins |
title |
Uma comparação entre classificadores para predição da classe de cor a partir de dados estruturais em proteínas fluorescentes |
spellingShingle |
Uma comparação entre classificadores para predição da classe de cor a partir de dados estruturais em proteínas fluorescentes Silva, Roger Sá da Bioinformática Mineração de dados Proteínas Fluorescentes Bioinformatics Data mining Fluorescent proteins |
title_short |
Uma comparação entre classificadores para predição da classe de cor a partir de dados estruturais em proteínas fluorescentes |
title_full |
Uma comparação entre classificadores para predição da classe de cor a partir de dados estruturais em proteínas fluorescentes |
title_fullStr |
Uma comparação entre classificadores para predição da classe de cor a partir de dados estruturais em proteínas fluorescentes |
title_full_unstemmed |
Uma comparação entre classificadores para predição da classe de cor a partir de dados estruturais em proteínas fluorescentes |
title_sort |
Uma comparação entre classificadores para predição da classe de cor a partir de dados estruturais em proteínas fluorescentes |
author |
Silva, Roger Sá da |
author_facet |
Silva, Roger Sá da |
author_role |
author |
dc.contributor.author.fl_str_mv |
Silva, Roger Sá da |
dc.contributor.advisor1.fl_str_mv |
Werhli, Adriano Velasque |
contributor_str_mv |
Werhli, Adriano Velasque |
dc.subject.por.fl_str_mv |
Bioinformática Mineração de dados Proteínas Fluorescentes Bioinformatics Data mining Fluorescent proteins |
topic |
Bioinformática Mineração de dados Proteínas Fluorescentes Bioinformatics Data mining Fluorescent proteins |
description |
Proteínas Fluorescentes são importantes ferramentas em pesquisas de Biologia Molecular e possuem grande valor comercial na produção de peixes transgênicos fluorescentes. De modo geral, a criação de variantes de cor destas proteínas ocorre por alterações estruturais na macromolécula, ocasionadas por mutações na sequência de aminoácidos. Porém, relacionar de forma exata dados estruturais e sequenciais com a definição de cor de emissão de proteínas fluorescentes ainda necessita de mais estudos. Neste contexto, a aplicação do processo de descoberta de conhecimento em bases de dados se apresenta como uma possibilidade de obtenção de conhecimento sobre essa relação da sequência/estrutura e a cor de emissão. Dessa forma, é realizado neste trabalho a comparação entre três classificadores (baseados em Árvore de Decisão, Redes Neurais Artificiais e Máquinas de Vetores de Suporte) com o intuito de investigar a performance deles na predição da classe de cor de proteínas fluorescentes a partir de seus dados estruturais no âmbito do projeto Peixes Transgênicos Fluorescentes. Para tanto, uma ferramenta web é desenvolvida para o armazenamento, organização e preparação dos dados estruturais utilizados no treinamento dos classificadores. Ao final, um processo de comparação quantitativa e qualitativa é realizado sobre métricas de desempenho e capacidades de cada classificador, culminando na escolha do classificador baseado em Árvore de Decisão como o mais adequado na tarefa de predição da classe de cor de proteínas fluorescentes. |
publishDate |
2016 |
dc.date.issued.fl_str_mv |
2016 |
dc.date.accessioned.fl_str_mv |
2020-03-10T15:47:08Z |
dc.date.available.fl_str_mv |
2020-03-10T15:47:08Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
SILVA, Roger Sá da. Uma comparação entre classificadores para predição da classe de cor a partir de dados estruturais em proteínas fluorescentes. 2016. 120 f. Dissertação (Mestrado em Engenharia da Computação) – Centro de Ciências Computacionais, Universidade Federal do Rio Grande, Rio Grande, 2016. |
dc.identifier.uri.fl_str_mv |
http://repositorio.furg.br/handle/1/8421 |
identifier_str_mv |
SILVA, Roger Sá da. Uma comparação entre classificadores para predição da classe de cor a partir de dados estruturais em proteínas fluorescentes. 2016. 120 f. Dissertação (Mestrado em Engenharia da Computação) – Centro de Ciências Computacionais, Universidade Federal do Rio Grande, Rio Grande, 2016. |
url |
http://repositorio.furg.br/handle/1/8421 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da FURG (RI FURG) instname:Universidade Federal do Rio Grande (FURG) instacron:FURG |
instname_str |
Universidade Federal do Rio Grande (FURG) |
instacron_str |
FURG |
institution |
FURG |
reponame_str |
Repositório Institucional da FURG (RI FURG) |
collection |
Repositório Institucional da FURG (RI FURG) |
bitstream.url.fl_str_mv |
https://repositorio.furg.br/bitstream/1/8421/1/40.pdf https://repositorio.furg.br/bitstream/1/8421/2/license.txt |
bitstream.checksum.fl_str_mv |
f5078b5c26b3d3a6c0eae0b6225da9c7 8a4605be74aa9ea9d79846c1fba20a33 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da FURG (RI FURG) - Universidade Federal do Rio Grande (FURG) |
repository.mail.fl_str_mv |
|
_version_ |
1798313627284930560 |