Avaliação quantitativa de sistemas preditores de função de proteinas

Detalhes bibliográficos
Autor(a) principal: Rodrigues, Bárbara Nobrega
Data de Publicação: 2013
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFPR
Texto Completo: http://hdl.handle.net/1884/30104
Resumo: Resumo: Este trabalho propõe aprofundar as avaliações dos sistemas preditores de função de proteína que utilizam como dado de entrada a sequência de uma proteína, podendo na sua conclusão determinar qual a melhor estratégia de predição. Foram selecionados os seguintes sistemas preditores Blast2GO, InterProScan, Panther Score, Pfam scan e ScanProsite. Os critérios utilizados para a seleção dos sistemas foram: 1- compor o conjunto de sistemas relatados em revisões literárias sobre predição de função de proteína, 2- possuir número de citações superior a 500, 3- ser sistema com a última atualização em menos de 3 anos e 4- análises automatizadas sem interação humana. Os 12 conjuntos de sequências selecionados foram: 690 sequências de proteínas enzimáticas, 487 sequências não enzimáticas, 85 sequências proteicas bifuncionais, 358 sequências proteicas de Aminergic GPCR, 412 sequências proteicas de NHR e 153 sequências proteicas de "Secretinlike", 927 sequências proteicas de enolase, 262 sequências proteicas de crotonase, 389 sequências proteicas de haloacid dehalogenase, 145 sequências proteicas de vicinal oxygen chelate, 145 sequências proteicas de radical SAM and 863 sequências proteicas de padrão-ouro. Os resultados obtidos mostram divergências entre os resultados dos sistemas avaliados. São observadas diferenças entre nível de descrição da função, grafias distintas para uma mesma anotação e divergência de classificação. Os programas que apresentaram maior semelhança foram o Panther Score e o ScanProsite, embora a semelhança média entre os diferentes conjuntos testados seja inferior a 40%. O com maior acurácia foi o Blast2GO, mas com a acurácia máxima de 34%. Não houve nenhuma sequência em a classificação foi unanime para os 5 programas testados.
id UFPR_790273b9469b2c4ab0d52fedeec889a8
oai_identifier_str oai:acervodigital.ufpr.br:1884/30104
network_acronym_str UFPR
network_name_str Repositório Institucional da UFPR
repository_id_str 308
spelling Rodrigues, Bárbara NobregaMarchaukoski, Jeroniza NunesSteffens, Maria Berenice ReynaudUniversidade Federal do Paraná. Setor de Educação Profissional e Tecnológica. Programa de Pós-Graduação em Bioinformática2013-05-21T18:05:58Z2013-05-21T18:05:58Z2013-05-21http://hdl.handle.net/1884/30104Resumo: Este trabalho propõe aprofundar as avaliações dos sistemas preditores de função de proteína que utilizam como dado de entrada a sequência de uma proteína, podendo na sua conclusão determinar qual a melhor estratégia de predição. Foram selecionados os seguintes sistemas preditores Blast2GO, InterProScan, Panther Score, Pfam scan e ScanProsite. Os critérios utilizados para a seleção dos sistemas foram: 1- compor o conjunto de sistemas relatados em revisões literárias sobre predição de função de proteína, 2- possuir número de citações superior a 500, 3- ser sistema com a última atualização em menos de 3 anos e 4- análises automatizadas sem interação humana. Os 12 conjuntos de sequências selecionados foram: 690 sequências de proteínas enzimáticas, 487 sequências não enzimáticas, 85 sequências proteicas bifuncionais, 358 sequências proteicas de Aminergic GPCR, 412 sequências proteicas de NHR e 153 sequências proteicas de "Secretinlike", 927 sequências proteicas de enolase, 262 sequências proteicas de crotonase, 389 sequências proteicas de haloacid dehalogenase, 145 sequências proteicas de vicinal oxygen chelate, 145 sequências proteicas de radical SAM and 863 sequências proteicas de padrão-ouro. Os resultados obtidos mostram divergências entre os resultados dos sistemas avaliados. São observadas diferenças entre nível de descrição da função, grafias distintas para uma mesma anotação e divergência de classificação. Os programas que apresentaram maior semelhança foram o Panther Score e o ScanProsite, embora a semelhança média entre os diferentes conjuntos testados seja inferior a 40%. O com maior acurácia foi o Blast2GO, mas com a acurácia máxima de 34%. Não houve nenhuma sequência em a classificação foi unanime para os 5 programas testados.application/pdfDissertaçõesSintese proteicaBioinformáticaSeqüencia de nucleotidiosAvaliação quantitativa de sistemas preditores de função de proteinasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALR - D - BARBARA NOBREGA RODRIGUES.pdfapplication/pdf19588856https://acervodigital.ufpr.br/bitstream/1884/30104/1/R%20-%20D%20-%20BARBARA%20NOBREGA%20RODRIGUES.pdfef72f7adad220e9e4837d9913661d789MD51open accessTEXTR - D - BARBARA NOBREGA RODRIGUES.pdf.txtR - D - BARBARA NOBREGA RODRIGUES.pdf.txtExtracted Texttext/plain152539https://acervodigital.ufpr.br/bitstream/1884/30104/2/R%20-%20D%20-%20BARBARA%20NOBREGA%20RODRIGUES.pdf.txt7f2515eac883613b74bd074f6a51b35eMD52open accessTHUMBNAILR - D - BARBARA NOBREGA RODRIGUES.pdf.jpgR - D - BARBARA NOBREGA RODRIGUES.pdf.jpgGenerated Thumbnailimage/jpeg1293https://acervodigital.ufpr.br/bitstream/1884/30104/3/R%20-%20D%20-%20BARBARA%20NOBREGA%20RODRIGUES.pdf.jpg577f8667d56f832176f4150748e431f7MD53open access1884/301042016-04-08 03:08:00.918open accessoai:acervodigital.ufpr.br:1884/30104Repositório de PublicaçõesPUBhttp://acervodigital.ufpr.br/oai/requestopendoar:3082016-04-08T06:08Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false
dc.title.pt_BR.fl_str_mv Avaliação quantitativa de sistemas preditores de função de proteinas
title Avaliação quantitativa de sistemas preditores de função de proteinas
spellingShingle Avaliação quantitativa de sistemas preditores de função de proteinas
Rodrigues, Bárbara Nobrega
Dissertações
Sintese proteica
Bioinformática
Seqüencia de nucleotidios
title_short Avaliação quantitativa de sistemas preditores de função de proteinas
title_full Avaliação quantitativa de sistemas preditores de função de proteinas
title_fullStr Avaliação quantitativa de sistemas preditores de função de proteinas
title_full_unstemmed Avaliação quantitativa de sistemas preditores de função de proteinas
title_sort Avaliação quantitativa de sistemas preditores de função de proteinas
author Rodrigues, Bárbara Nobrega
author_facet Rodrigues, Bárbara Nobrega
author_role author
dc.contributor.other.pt_BR.fl_str_mv Marchaukoski, Jeroniza Nunes
Steffens, Maria Berenice Reynaud
Universidade Federal do Paraná. Setor de Educação Profissional e Tecnológica. Programa de Pós-Graduação em Bioinformática
dc.contributor.author.fl_str_mv Rodrigues, Bárbara Nobrega
dc.subject.por.fl_str_mv Dissertações
Sintese proteica
Bioinformática
Seqüencia de nucleotidios
topic Dissertações
Sintese proteica
Bioinformática
Seqüencia de nucleotidios
description Resumo: Este trabalho propõe aprofundar as avaliações dos sistemas preditores de função de proteína que utilizam como dado de entrada a sequência de uma proteína, podendo na sua conclusão determinar qual a melhor estratégia de predição. Foram selecionados os seguintes sistemas preditores Blast2GO, InterProScan, Panther Score, Pfam scan e ScanProsite. Os critérios utilizados para a seleção dos sistemas foram: 1- compor o conjunto de sistemas relatados em revisões literárias sobre predição de função de proteína, 2- possuir número de citações superior a 500, 3- ser sistema com a última atualização em menos de 3 anos e 4- análises automatizadas sem interação humana. Os 12 conjuntos de sequências selecionados foram: 690 sequências de proteínas enzimáticas, 487 sequências não enzimáticas, 85 sequências proteicas bifuncionais, 358 sequências proteicas de Aminergic GPCR, 412 sequências proteicas de NHR e 153 sequências proteicas de "Secretinlike", 927 sequências proteicas de enolase, 262 sequências proteicas de crotonase, 389 sequências proteicas de haloacid dehalogenase, 145 sequências proteicas de vicinal oxygen chelate, 145 sequências proteicas de radical SAM and 863 sequências proteicas de padrão-ouro. Os resultados obtidos mostram divergências entre os resultados dos sistemas avaliados. São observadas diferenças entre nível de descrição da função, grafias distintas para uma mesma anotação e divergência de classificação. Os programas que apresentaram maior semelhança foram o Panther Score e o ScanProsite, embora a semelhança média entre os diferentes conjuntos testados seja inferior a 40%. O com maior acurácia foi o Blast2GO, mas com a acurácia máxima de 34%. Não houve nenhuma sequência em a classificação foi unanime para os 5 programas testados.
publishDate 2013
dc.date.accessioned.fl_str_mv 2013-05-21T18:05:58Z
dc.date.available.fl_str_mv 2013-05-21T18:05:58Z
dc.date.issued.fl_str_mv 2013-05-21
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1884/30104
url http://hdl.handle.net/1884/30104
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPR
instname:Universidade Federal do Paraná (UFPR)
instacron:UFPR
instname_str Universidade Federal do Paraná (UFPR)
instacron_str UFPR
institution UFPR
reponame_str Repositório Institucional da UFPR
collection Repositório Institucional da UFPR
bitstream.url.fl_str_mv https://acervodigital.ufpr.br/bitstream/1884/30104/1/R%20-%20D%20-%20BARBARA%20NOBREGA%20RODRIGUES.pdf
https://acervodigital.ufpr.br/bitstream/1884/30104/2/R%20-%20D%20-%20BARBARA%20NOBREGA%20RODRIGUES.pdf.txt
https://acervodigital.ufpr.br/bitstream/1884/30104/3/R%20-%20D%20-%20BARBARA%20NOBREGA%20RODRIGUES.pdf.jpg
bitstream.checksum.fl_str_mv ef72f7adad220e9e4837d9913661d789
7f2515eac883613b74bd074f6a51b35e
577f8667d56f832176f4150748e431f7
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)
repository.mail.fl_str_mv
_version_ 1801860339406471168