Novos algoritmos de aprendizado para classificação de padrões utilizando floresta de caminhos ótimos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2011 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
Texto Completo: | https://hdl.handle.net/20.500.12733/1615770 |
Resumo: | Orientadores: Pedro Jussieu de Rezende, Alexandre Xavier Falcão |
id |
UNICAMP-30_d819138beb8860a09c1362e484451bdb |
---|---|
oai_identifier_str |
oai::803009 |
network_acronym_str |
UNICAMP-30 |
network_name_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository_id_str |
|
spelling |
Novos algoritmos de aprendizado para classificação de padrões utilizando floresta de caminhos ótimosNew learning algorithms for pattern classification using optimum-path forestReconhecimento de padrõesAprendizado de máquinaTeoria dos grafosValores estranhos (Estatistica)Processamento de imagensVisão por computadorPattern recognitionMachine learningGraph theoryOutliers (Statistics)Image processingMachine visionOrientadores: Pedro Jussieu de Rezende, Alexandre Xavier FalcãoDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de ComputaçãoResumo: O Reconhecimento de Padrões pode ser definido como a capacidade de identificar a classe de algum objeto dentre um dado conjunto de classes, baseando-se na informação fornecida por amostras conhecidas (conjunto de treinamento). Nesta dissertação, o foco de estudo é o paradigma de classificação supervisionada, no qual se conhece a classe de todas as amostras utilizadas para o projeto do classificador. Especificamente, estuda-se o Classificador baseado em Floresta de Caminhos Ótimos (Optimum-Path Forest - OPF) e propõem três novos algoritmos de aprendizado, os quais representam melhorias em comparação com o Classificador OPF tradicional. Primeiramente, é desenvolvida uma metodologia simples, porém efetiva, para detecção de outliers no conjunto de treinamento. O método visa uma melhoria na acurácia do Classificador OPF tradicional através da troca desses outliers por novas amostras do conjunto de avaliação e sua exclusão do processo de aprendizagem. Os outliers são detectados computando uma penalidade para cada amostra baseada nos seus acertos e erros na classificação, o qual pode ser medido através do número de falsos positivos/negativos e verdadeiros positivos/negativos obtidos por cada amostra. O método obteve uma melhoria na acurácia em comparação com o OPF tradicional, com apenas um pequeno aumento no tempo de treinamento. Em seguida, é proposto um aprimoramento ao primeiro algoritmo, que permite detectar com maior precisão os outliers presentes na base de dados. Neste caso, utiliza-se a informação de falsos positivos/negativos e verdadeiros positivos/negativos de cada amostra para explorar intrinsecamente as relações de adjacência de cada amostra e determinar se é outlier. Uma inovação do método é que não existe necessidade de se computar explicitamente tal adjacência, como é feito nas técnicas tradicionais, o qual pode ser inviável para grandes bases de dados. O método obteve uma boa taxa de detecção de outliers e um tempo de treinamento muito baixo em vista do tamanho das bases de dados utilizadas. Finalmente, é abordado o problema de se selecionar um úmero tão pequeno quanto possível de amostras de treinamento e se obter a maior acurácia possível sobre o conjunto de teste. Propõe-se uma metodologia que se inicia com um pequeno conjunto de treinamento e, através da classificação de um conjunto bem maior de avaliação, aprende quais amostras são as mais representativas para o conjunto de treinamento. Os resultados mostram que é possível obter uma melhor acurácia que o Classificador OPF tradicional ao custo de um pequeno incremento no tempo de treinamento, mantendo, no entanto, o conjunto de treinamento menor que o conjunto inicial, o que significa um tempo de teste reduzidoAbstract: Pattern recognition can be defined as the capacity of identifying the class of an object among a given set of classes, based on the information provided by known samples (training set). In this dissertation, the focus is on the supervised classification approach, for which we are given the classes of all the samples used in the design of the classifier. Specifically, the Optimum-Path Forest Classifier (OPF) is studied and three new learning algorithms are proposed, which represent improvements to the traditional OPF classifier. First of all, a simple yet effective methodology is developed for the detection of outliers in a training set. This method aims at improving OPF's accuracy through the swapping of outliers for new samples from the evaluating set and their exclusion from the learning process itself. Outliers are detected by computing a penalty for each sample based on its classification-hits and -misses, which can be measured through the number of false positive/negatives and true positives/negatives obtained by each sample. The method achieved an accuracy improvement over the traditional OPF, with just a slight increment in the training time. An improvement to the first algorithm is proposed, allowing for a more precise detection of outliers present in the dataset. In this case, the information on the number of false positive/negatives and true positives/negatives of each sample is used to explore the adjacency relations of each sample and determine whether it is an outlier. The method's merit is that there is no need of explicitly computing an actual vicinity, as the traditional techniques do, which could be infeasible for large datasets. The method achieves a good outlier detection rate and a very low training time, considering the size of the datasets. Finally, the problem of choosing a small number of training samples while achieving a high accuracy in the testing set is addressed. We propose a methodology which starts with a small training set and, through the classification of a much larger evaluating set, it learns which are the most representative samples for the training set. The results show that it is possible to achieve higher accuracy than the traditional OPF's at the cost of a slight increment in the training time, preserving, however, a smaller training set than the original one, leading to a lower testing timeMestradoCiência da ComputaçãoMestre em Ciência da Computação[s.n.]Rezende, Pedro Jussieu de, 1955-Falcão, Alexandre Xavier, 1966-Hashimoto, Ronaldo FumioPedrini, HélioUniversidade Estadual de Campinas (UNICAMP). Instituto de ComputaçãoPrograma de Pós-Graduação em Ciência da ComputaçãoUNIVERSIDADE ESTADUAL DE CAMPINASCastelo Fernández, César Christian20112011-11-05T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf82 p. : il.https://hdl.handle.net/20.500.12733/1615770CASTELO FERNÁNDEZ, César Christian. Novos algoritmos de aprendizado para classificação de padrões utilizando floresta de caminhos ótimos. 2011. 82 p. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1615770. Acesso em: 3 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/803009porreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2017-02-18T06:19:58Zoai::803009Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2017-02-18T06:19:58Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false |
dc.title.none.fl_str_mv |
Novos algoritmos de aprendizado para classificação de padrões utilizando floresta de caminhos ótimos New learning algorithms for pattern classification using optimum-path forest |
title |
Novos algoritmos de aprendizado para classificação de padrões utilizando floresta de caminhos ótimos |
spellingShingle |
Novos algoritmos de aprendizado para classificação de padrões utilizando floresta de caminhos ótimos Castelo Fernández, César Christian Reconhecimento de padrões Aprendizado de máquina Teoria dos grafos Valores estranhos (Estatistica) Processamento de imagens Visão por computador Pattern recognition Machine learning Graph theory Outliers (Statistics) Image processing Machine vision |
title_short |
Novos algoritmos de aprendizado para classificação de padrões utilizando floresta de caminhos ótimos |
title_full |
Novos algoritmos de aprendizado para classificação de padrões utilizando floresta de caminhos ótimos |
title_fullStr |
Novos algoritmos de aprendizado para classificação de padrões utilizando floresta de caminhos ótimos |
title_full_unstemmed |
Novos algoritmos de aprendizado para classificação de padrões utilizando floresta de caminhos ótimos |
title_sort |
Novos algoritmos de aprendizado para classificação de padrões utilizando floresta de caminhos ótimos |
author |
Castelo Fernández, César Christian |
author_facet |
Castelo Fernández, César Christian |
author_role |
author |
dc.contributor.none.fl_str_mv |
Rezende, Pedro Jussieu de, 1955- Falcão, Alexandre Xavier, 1966- Hashimoto, Ronaldo Fumio Pedrini, Hélio Universidade Estadual de Campinas (UNICAMP). Instituto de Computação Programa de Pós-Graduação em Ciência da Computação UNIVERSIDADE ESTADUAL DE CAMPINAS |
dc.contributor.author.fl_str_mv |
Castelo Fernández, César Christian |
dc.subject.por.fl_str_mv |
Reconhecimento de padrões Aprendizado de máquina Teoria dos grafos Valores estranhos (Estatistica) Processamento de imagens Visão por computador Pattern recognition Machine learning Graph theory Outliers (Statistics) Image processing Machine vision |
topic |
Reconhecimento de padrões Aprendizado de máquina Teoria dos grafos Valores estranhos (Estatistica) Processamento de imagens Visão por computador Pattern recognition Machine learning Graph theory Outliers (Statistics) Image processing Machine vision |
description |
Orientadores: Pedro Jussieu de Rezende, Alexandre Xavier Falcão |
publishDate |
2011 |
dc.date.none.fl_str_mv |
2011 2011-11-05T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/20.500.12733/1615770 CASTELO FERNÁNDEZ, César Christian. Novos algoritmos de aprendizado para classificação de padrões utilizando floresta de caminhos ótimos. 2011. 82 p. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1615770. Acesso em: 3 set. 2024. |
url |
https://hdl.handle.net/20.500.12733/1615770 |
identifier_str_mv |
CASTELO FERNÁNDEZ, César Christian. Novos algoritmos de aprendizado para classificação de padrões utilizando floresta de caminhos ótimos. 2011. 82 p. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1615770. Acesso em: 3 set. 2024. |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://repositorio.unicamp.br/acervo/detalhe/803009 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf 82 p. : il. |
dc.publisher.none.fl_str_mv |
[s.n.] |
publisher.none.fl_str_mv |
[s.n.] |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) instname:Universidade Estadual de Campinas (UNICAMP) instacron:UNICAMP |
instname_str |
Universidade Estadual de Campinas (UNICAMP) |
instacron_str |
UNICAMP |
institution |
UNICAMP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
collection |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP) |
repository.mail.fl_str_mv |
sbubd@unicamp.br |
_version_ |
1809189058194178048 |