Avaliação quantitativa de sistemas preditores de função de proteinas
Autor(a) principal: | |
---|---|
Data de Publicação: | 2013 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPR |
Texto Completo: | http://hdl.handle.net/1884/30104 |
Resumo: | Resumo: Este trabalho propõe aprofundar as avaliações dos sistemas preditores de função de proteína que utilizam como dado de entrada a sequência de uma proteína, podendo na sua conclusão determinar qual a melhor estratégia de predição. Foram selecionados os seguintes sistemas preditores Blast2GO, InterProScan, Panther Score, Pfam scan e ScanProsite. Os critérios utilizados para a seleção dos sistemas foram: 1- compor o conjunto de sistemas relatados em revisões literárias sobre predição de função de proteína, 2- possuir número de citações superior a 500, 3- ser sistema com a última atualização em menos de 3 anos e 4- análises automatizadas sem interação humana. Os 12 conjuntos de sequências selecionados foram: 690 sequências de proteínas enzimáticas, 487 sequências não enzimáticas, 85 sequências proteicas bifuncionais, 358 sequências proteicas de Aminergic GPCR, 412 sequências proteicas de NHR e 153 sequências proteicas de "Secretinlike", 927 sequências proteicas de enolase, 262 sequências proteicas de crotonase, 389 sequências proteicas de haloacid dehalogenase, 145 sequências proteicas de vicinal oxygen chelate, 145 sequências proteicas de radical SAM and 863 sequências proteicas de padrão-ouro. Os resultados obtidos mostram divergências entre os resultados dos sistemas avaliados. São observadas diferenças entre nível de descrição da função, grafias distintas para uma mesma anotação e divergência de classificação. Os programas que apresentaram maior semelhança foram o Panther Score e o ScanProsite, embora a semelhança média entre os diferentes conjuntos testados seja inferior a 40%. O com maior acurácia foi o Blast2GO, mas com a acurácia máxima de 34%. Não houve nenhuma sequência em a classificação foi unanime para os 5 programas testados. |
id |
UFPR_790273b9469b2c4ab0d52fedeec889a8 |
---|---|
oai_identifier_str |
oai:acervodigital.ufpr.br:1884/30104 |
network_acronym_str |
UFPR |
network_name_str |
Repositório Institucional da UFPR |
repository_id_str |
308 |
spelling |
Rodrigues, Bárbara NobregaMarchaukoski, Jeroniza NunesSteffens, Maria Berenice ReynaudUniversidade Federal do Paraná. Setor de Educação Profissional e Tecnológica. Programa de Pós-Graduação em Bioinformática2013-05-21T18:05:58Z2013-05-21T18:05:58Z2013-05-21http://hdl.handle.net/1884/30104Resumo: Este trabalho propõe aprofundar as avaliações dos sistemas preditores de função de proteína que utilizam como dado de entrada a sequência de uma proteína, podendo na sua conclusão determinar qual a melhor estratégia de predição. Foram selecionados os seguintes sistemas preditores Blast2GO, InterProScan, Panther Score, Pfam scan e ScanProsite. Os critérios utilizados para a seleção dos sistemas foram: 1- compor o conjunto de sistemas relatados em revisões literárias sobre predição de função de proteína, 2- possuir número de citações superior a 500, 3- ser sistema com a última atualização em menos de 3 anos e 4- análises automatizadas sem interação humana. Os 12 conjuntos de sequências selecionados foram: 690 sequências de proteínas enzimáticas, 487 sequências não enzimáticas, 85 sequências proteicas bifuncionais, 358 sequências proteicas de Aminergic GPCR, 412 sequências proteicas de NHR e 153 sequências proteicas de "Secretinlike", 927 sequências proteicas de enolase, 262 sequências proteicas de crotonase, 389 sequências proteicas de haloacid dehalogenase, 145 sequências proteicas de vicinal oxygen chelate, 145 sequências proteicas de radical SAM and 863 sequências proteicas de padrão-ouro. Os resultados obtidos mostram divergências entre os resultados dos sistemas avaliados. São observadas diferenças entre nível de descrição da função, grafias distintas para uma mesma anotação e divergência de classificação. Os programas que apresentaram maior semelhança foram o Panther Score e o ScanProsite, embora a semelhança média entre os diferentes conjuntos testados seja inferior a 40%. O com maior acurácia foi o Blast2GO, mas com a acurácia máxima de 34%. Não houve nenhuma sequência em a classificação foi unanime para os 5 programas testados.application/pdfDissertaçõesSintese proteicaBioinformáticaSeqüencia de nucleotidiosAvaliação quantitativa de sistemas preditores de função de proteinasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALR - D - BARBARA NOBREGA RODRIGUES.pdfapplication/pdf19588856https://acervodigital.ufpr.br/bitstream/1884/30104/1/R%20-%20D%20-%20BARBARA%20NOBREGA%20RODRIGUES.pdfef72f7adad220e9e4837d9913661d789MD51open accessTEXTR - D - BARBARA NOBREGA RODRIGUES.pdf.txtR - D - BARBARA NOBREGA RODRIGUES.pdf.txtExtracted Texttext/plain152539https://acervodigital.ufpr.br/bitstream/1884/30104/2/R%20-%20D%20-%20BARBARA%20NOBREGA%20RODRIGUES.pdf.txt7f2515eac883613b74bd074f6a51b35eMD52open accessTHUMBNAILR - D - BARBARA NOBREGA RODRIGUES.pdf.jpgR - D - BARBARA NOBREGA RODRIGUES.pdf.jpgGenerated Thumbnailimage/jpeg1293https://acervodigital.ufpr.br/bitstream/1884/30104/3/R%20-%20D%20-%20BARBARA%20NOBREGA%20RODRIGUES.pdf.jpg577f8667d56f832176f4150748e431f7MD53open access1884/301042016-04-08 03:08:00.918open accessoai:acervodigital.ufpr.br:1884/30104Repositório de PublicaçõesPUBhttp://acervodigital.ufpr.br/oai/requestopendoar:3082016-04-08T06:08Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false |
dc.title.pt_BR.fl_str_mv |
Avaliação quantitativa de sistemas preditores de função de proteinas |
title |
Avaliação quantitativa de sistemas preditores de função de proteinas |
spellingShingle |
Avaliação quantitativa de sistemas preditores de função de proteinas Rodrigues, Bárbara Nobrega Dissertações Sintese proteica Bioinformática Seqüencia de nucleotidios |
title_short |
Avaliação quantitativa de sistemas preditores de função de proteinas |
title_full |
Avaliação quantitativa de sistemas preditores de função de proteinas |
title_fullStr |
Avaliação quantitativa de sistemas preditores de função de proteinas |
title_full_unstemmed |
Avaliação quantitativa de sistemas preditores de função de proteinas |
title_sort |
Avaliação quantitativa de sistemas preditores de função de proteinas |
author |
Rodrigues, Bárbara Nobrega |
author_facet |
Rodrigues, Bárbara Nobrega |
author_role |
author |
dc.contributor.other.pt_BR.fl_str_mv |
Marchaukoski, Jeroniza Nunes Steffens, Maria Berenice Reynaud Universidade Federal do Paraná. Setor de Educação Profissional e Tecnológica. Programa de Pós-Graduação em Bioinformática |
dc.contributor.author.fl_str_mv |
Rodrigues, Bárbara Nobrega |
dc.subject.por.fl_str_mv |
Dissertações Sintese proteica Bioinformática Seqüencia de nucleotidios |
topic |
Dissertações Sintese proteica Bioinformática Seqüencia de nucleotidios |
description |
Resumo: Este trabalho propõe aprofundar as avaliações dos sistemas preditores de função de proteína que utilizam como dado de entrada a sequência de uma proteína, podendo na sua conclusão determinar qual a melhor estratégia de predição. Foram selecionados os seguintes sistemas preditores Blast2GO, InterProScan, Panther Score, Pfam scan e ScanProsite. Os critérios utilizados para a seleção dos sistemas foram: 1- compor o conjunto de sistemas relatados em revisões literárias sobre predição de função de proteína, 2- possuir número de citações superior a 500, 3- ser sistema com a última atualização em menos de 3 anos e 4- análises automatizadas sem interação humana. Os 12 conjuntos de sequências selecionados foram: 690 sequências de proteínas enzimáticas, 487 sequências não enzimáticas, 85 sequências proteicas bifuncionais, 358 sequências proteicas de Aminergic GPCR, 412 sequências proteicas de NHR e 153 sequências proteicas de "Secretinlike", 927 sequências proteicas de enolase, 262 sequências proteicas de crotonase, 389 sequências proteicas de haloacid dehalogenase, 145 sequências proteicas de vicinal oxygen chelate, 145 sequências proteicas de radical SAM and 863 sequências proteicas de padrão-ouro. Os resultados obtidos mostram divergências entre os resultados dos sistemas avaliados. São observadas diferenças entre nível de descrição da função, grafias distintas para uma mesma anotação e divergência de classificação. Os programas que apresentaram maior semelhança foram o Panther Score e o ScanProsite, embora a semelhança média entre os diferentes conjuntos testados seja inferior a 40%. O com maior acurácia foi o Blast2GO, mas com a acurácia máxima de 34%. Não houve nenhuma sequência em a classificação foi unanime para os 5 programas testados. |
publishDate |
2013 |
dc.date.accessioned.fl_str_mv |
2013-05-21T18:05:58Z |
dc.date.available.fl_str_mv |
2013-05-21T18:05:58Z |
dc.date.issued.fl_str_mv |
2013-05-21 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1884/30104 |
url |
http://hdl.handle.net/1884/30104 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPR instname:Universidade Federal do Paraná (UFPR) instacron:UFPR |
instname_str |
Universidade Federal do Paraná (UFPR) |
instacron_str |
UFPR |
institution |
UFPR |
reponame_str |
Repositório Institucional da UFPR |
collection |
Repositório Institucional da UFPR |
bitstream.url.fl_str_mv |
https://acervodigital.ufpr.br/bitstream/1884/30104/1/R%20-%20D%20-%20BARBARA%20NOBREGA%20RODRIGUES.pdf https://acervodigital.ufpr.br/bitstream/1884/30104/2/R%20-%20D%20-%20BARBARA%20NOBREGA%20RODRIGUES.pdf.txt https://acervodigital.ufpr.br/bitstream/1884/30104/3/R%20-%20D%20-%20BARBARA%20NOBREGA%20RODRIGUES.pdf.jpg |
bitstream.checksum.fl_str_mv |
ef72f7adad220e9e4837d9913661d789 7f2515eac883613b74bd074f6a51b35e 577f8667d56f832176f4150748e431f7 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR) |
repository.mail.fl_str_mv |
|
_version_ |
1801860339406471168 |