Classificação probabilística baseada em análise de padrões

Detalhes bibliográficos
Autor(a) principal: Merschmann, Luiz Henrique de Campos
Data de Publicação: 2007
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da Universidade Federal Fluminense (RIUFF)
Texto Completo: https://app.uff.br/riuff/handle/1/17300
Resumo: Classification is a data mining tast that has been useful in several application areas, particularly, in bioinformatics. The genomic revolution has resulted in an explosive growth of biological data generated by the scientific community. With the aim of storing all of these biological information, biological databases were created. The need for computational tools for analysing biological data becomes evident, resulting in the application of data mining methods in this field. The work developed in this thesis is related to classification task and, initially, to its application to bioinformatics. The initial goal is to present a computationally efficient method for protein classification capable of yielding highly accurate results, outperforming the results obtained by previous works. The good results in terms of accuracy and time performance obtained by the proposed method show its potential for the protein classification problem. In addition, aiming to construct a suitable classifier for several kinds of applications, the method proposed for the protein classification problem was extended, becoming appropriate and efficient for several databases associated with different applications.
id UFF-2_e285a7a38cac85bdd0955398b7d4efe5
oai_identifier_str oai:app.uff.br:1/17300
network_acronym_str UFF-2
network_name_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository_id_str 2120
spelling Classificação probabilística baseada em análise de padrõesComputação, Biologia computacional, Mineração de dados, Classifificação, Bioinformática, Otimização combinatóriaComputational biology, Data mining, Classifification, Bioinformatics, Combinatorial optimizationCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOClassification is a data mining tast that has been useful in several application areas, particularly, in bioinformatics. The genomic revolution has resulted in an explosive growth of biological data generated by the scientific community. With the aim of storing all of these biological information, biological databases were created. The need for computational tools for analysing biological data becomes evident, resulting in the application of data mining methods in this field. The work developed in this thesis is related to classification task and, initially, to its application to bioinformatics. The initial goal is to present a computationally efficient method for protein classification capable of yielding highly accurate results, outperforming the results obtained by previous works. The good results in terms of accuracy and time performance obtained by the proposed method show its potential for the protein classification problem. In addition, aiming to construct a suitable classifier for several kinds of applications, the method proposed for the protein classification problem was extended, becoming appropriate and efficient for several databases associated with different applications.Classificação é uma das tarefas de Mineração de Dados que tem se mostrado útil em diversas áreas de aplicação, em particular, na área de Bioinformática. A revolução genômica resultou em um crescimento exponencial da quantidade de dados biológicos gerados pela comunidade científica. Com a finalidade de armazenar toda essa informação biológica gerada, foram criados os bancos de dados biológicos. A necessidade por ferramentas computacionais capazes de realizar análises nesses dados tornou-se cada vez mais evidente, fazendo com que técnicas de mineração de dados começassem a ser empregadas. O trabalho desta tese concentra-se na tarefa de classificação e, inicialmente, na sua aplicação em bioinformática. O objetivo inicial é apresentar um método de classificação de proteínas computacionalmente eficiente e capaz de alcançar altas taxas de acurácia, superando resultados apresentados anteriormente na literatura. Os bons resultados, em termos de acurácia preditiva e tempo computacional, obtidos a partir do método proposto nesta tese, demonstram o seu potencial para o problema de classificação de proteínas. Além disso, visando a construção de um classificador adequado para diversos tipos de aplicação, o método proposto inicialmente para o problema de classificação de proteínas foi estendido e mostrou-se eficiente também quando utilizado com diferentes tipos de bases de dados pertencentes a aplicações distintas.Programa de Pós-Graduação em ComputaçãoComputaçãoCarvalho, Alexandre Plastino deCPF:30090875322http://lattes.cnpq.br/4985266524417261Ebeeken, Nelson Francisco FavillaCPF:85646474832Carvalho, Andre Carlos Ponce de Leon Ferreira deCPF:53215995122http://lattes.cnpq.br/9674541381385819Garcia, Ana Cristina BicharraCPF:31237899422http://lattes.cnpq.br/4879977915136752Zadrozny, BiancaCPF:33280712222http://lattes.cnpq.br/1058528453390010Merschmann, Luiz Henrique de Campos2021-03-10T19:10:46Z2010-04-222021-03-10T19:10:46Z2007-08-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfapplication/pdfhttps://app.uff.br/riuff/handle/1/17300porCC-BY-SAinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2021-03-10T19:10:46Zoai:app.uff.br:1/17300Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202021-03-10T19:10:46Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false
dc.title.none.fl_str_mv Classificação probabilística baseada em análise de padrões
title Classificação probabilística baseada em análise de padrões
spellingShingle Classificação probabilística baseada em análise de padrões
Merschmann, Luiz Henrique de Campos
Computação, Biologia computacional, Mineração de dados, Classifificação, Bioinformática, Otimização combinatória
Computational biology, Data mining, Classifification, Bioinformatics, Combinatorial optimization
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Classificação probabilística baseada em análise de padrões
title_full Classificação probabilística baseada em análise de padrões
title_fullStr Classificação probabilística baseada em análise de padrões
title_full_unstemmed Classificação probabilística baseada em análise de padrões
title_sort Classificação probabilística baseada em análise de padrões
author Merschmann, Luiz Henrique de Campos
author_facet Merschmann, Luiz Henrique de Campos
author_role author
dc.contributor.none.fl_str_mv Carvalho, Alexandre Plastino de
CPF:30090875322
http://lattes.cnpq.br/4985266524417261
Ebeeken, Nelson Francisco Favilla
CPF:85646474832
Carvalho, Andre Carlos Ponce de Leon Ferreira de
CPF:53215995122
http://lattes.cnpq.br/9674541381385819
Garcia, Ana Cristina Bicharra
CPF:31237899422
http://lattes.cnpq.br/4879977915136752
Zadrozny, Bianca
CPF:33280712222
http://lattes.cnpq.br/1058528453390010
dc.contributor.author.fl_str_mv Merschmann, Luiz Henrique de Campos
dc.subject.por.fl_str_mv Computação, Biologia computacional, Mineração de dados, Classifificação, Bioinformática, Otimização combinatória
Computational biology, Data mining, Classifification, Bioinformatics, Combinatorial optimization
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic Computação, Biologia computacional, Mineração de dados, Classifificação, Bioinformática, Otimização combinatória
Computational biology, Data mining, Classifification, Bioinformatics, Combinatorial optimization
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description Classification is a data mining tast that has been useful in several application areas, particularly, in bioinformatics. The genomic revolution has resulted in an explosive growth of biological data generated by the scientific community. With the aim of storing all of these biological information, biological databases were created. The need for computational tools for analysing biological data becomes evident, resulting in the application of data mining methods in this field. The work developed in this thesis is related to classification task and, initially, to its application to bioinformatics. The initial goal is to present a computationally efficient method for protein classification capable of yielding highly accurate results, outperforming the results obtained by previous works. The good results in terms of accuracy and time performance obtained by the proposed method show its potential for the protein classification problem. In addition, aiming to construct a suitable classifier for several kinds of applications, the method proposed for the protein classification problem was extended, becoming appropriate and efficient for several databases associated with different applications.
publishDate 2007
dc.date.none.fl_str_mv 2007-08-28
2010-04-22
2021-03-10T19:10:46Z
2021-03-10T19:10:46Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://app.uff.br/riuff/handle/1/17300
url https://app.uff.br/riuff/handle/1/17300
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv CC-BY-SA
info:eu-repo/semantics/openAccess
rights_invalid_str_mv CC-BY-SA
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
application/pdf
dc.publisher.none.fl_str_mv Programa de Pós-Graduação em Computação
Computação
publisher.none.fl_str_mv Programa de Pós-Graduação em Computação
Computação
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)
instname:Universidade Federal Fluminense (UFF)
instacron:UFF
instname_str Universidade Federal Fluminense (UFF)
instacron_str UFF
institution UFF
reponame_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
collection Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository.name.fl_str_mv Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)
repository.mail.fl_str_mv riuff@id.uff.br
_version_ 1802135485196271616