Explorando caminhos de mínima informação em grafos para problemas de classificação supervisionada

Detalhes bibliográficos
Autor(a) principal: Hiraga, Alan Kazuo
Data de Publicação: 2014
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFSCAR
Texto Completo: https://repositorio.ufscar.br/handle/ufscar/562
Resumo: Classification is a very important step in pattern recognition, as it aims to categorize objects from a set of inherent features, through its labeling. This process can be supervised, when there is a sample set of labeled training classes, semi-supervised, when the number of labeled samples is limited or nearly inexistent, or unsupervised, where there are no labeled samples. This project proposes to explore minimum information paths in graphs for classification problems, through the definition of a supervised, non-parametric, graph-based classification method, by means of a contextual approach. This method proposes to construct a graph from a set of training samples, where the samples are represented by vertices and the edges are links between samples that belongs to a neighborhood system. From the graph construction, the method calculates the local observed Fisher information, a measurement based on the Potts model, for all vertices, identifying the amount of information that each sample has. Generally, different class vertices when connected by an edge, have a high information level. After that, it is necessary to weight the edges by means of a function that penalizes connecting vertices with high information. During this process, it is possible to identify and select high information vertices, which will be chosen to be prototype vertices, namely, the nodes that define the classes boundaries. After the definition, the method proposes that each prototype sample conquer the remaining samples by offering the shortest path in terms of information, so that when a sample is conquered it receives the label of the winning prototype, occurring the classification. To evaluate the proposed method, statistical methods to estimate the error rates, such as Hold-out, K-fold and Leave-One- Out Cross-Validation will be considered. The obtained results indicate that the method can be a viable alternative to the existing classification techniques.
id SCAR_faac5194ea884af268a6cffccc232c82
oai_identifier_str oai:repositorio.ufscar.br:ufscar/562
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str 4322
spelling Hiraga, Alan KazuoLevada, Alexandre Luís Magalhãeshttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=H311648http://lattes.cnpq.br/04207362589909394f87ebb7-ca30-45f9-8a18-b94bb8d84c6e2016-06-02T19:06:12Z2014-07-182016-06-02T19:06:12Z2014-05-05HIRAGA, Alan Kazuo. Explorando caminhos de mínima informação em grafos para problemas de classificação supervisionada. 2014. 79 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2014.https://repositorio.ufscar.br/handle/ufscar/562Classification is a very important step in pattern recognition, as it aims to categorize objects from a set of inherent features, through its labeling. This process can be supervised, when there is a sample set of labeled training classes, semi-supervised, when the number of labeled samples is limited or nearly inexistent, or unsupervised, where there are no labeled samples. This project proposes to explore minimum information paths in graphs for classification problems, through the definition of a supervised, non-parametric, graph-based classification method, by means of a contextual approach. This method proposes to construct a graph from a set of training samples, where the samples are represented by vertices and the edges are links between samples that belongs to a neighborhood system. From the graph construction, the method calculates the local observed Fisher information, a measurement based on the Potts model, for all vertices, identifying the amount of information that each sample has. Generally, different class vertices when connected by an edge, have a high information level. After that, it is necessary to weight the edges by means of a function that penalizes connecting vertices with high information. During this process, it is possible to identify and select high information vertices, which will be chosen to be prototype vertices, namely, the nodes that define the classes boundaries. After the definition, the method proposes that each prototype sample conquer the remaining samples by offering the shortest path in terms of information, so that when a sample is conquered it receives the label of the winning prototype, occurring the classification. To evaluate the proposed method, statistical methods to estimate the error rates, such as Hold-out, K-fold and Leave-One- Out Cross-Validation will be considered. The obtained results indicate that the method can be a viable alternative to the existing classification techniques.A classificação é uma etapa muito importante em reconhecimento de padrões, pois ela tem o objetivo de categorizar objetos a partir de um conjunto de características inerentes a ele, atribuindo-lhe um rótulo. Esse processo de classificação pode ser supervisionado, quando existe um conjunto de amostras de treinamento rotuladas que representam satisfatoriamente as classes, semi-supervisionado, quando o conjunto de amostras é limitado ou quase inexistente, ou não-supervisionado, quando não existem amostras rotuladas. Este trabalho propõe explorar caminhos de mínima informação em grafos para problemas de classificação, por meio da criação de um método de classificação supervisionado, não paramétrico, baseado em grafos, seguindo uma abordagem contextual. Esse método propõe a construção de um grafo a partir do conjunto de amostras de treinamento, onde as amostras serão representadas pelos vértices e as arestas serão as ligações entre amostras pertencentes a uma relação de adjacência. A partir da construção do grafo o método faz o calculo da informação de Fisher Local Observada, uma medida baseada no modelo de Potts, para todos os vértices, identificando o grau de informação que cada um possui. Geralmente vértices de classes distintas quando conectados por uma aresta possuem alta informação (bordas). Feito o calculo da informação, é necessário ponderar as arestas por meio de uma função que penaliza a ligação de vértices com alta informação. Enquanto as arestas são ponderadas é possível identificar e selecionar vértices altamente informativos os quais serão escolhidos para serem vértices protótipos, ou seja, os vértices que definem a região de borda. Depois de ponderadas as arestas e definidos os protótipos, o método propõe que cada protótipo conquiste as amostras oferecendo o menor caminho até ele, de modo que quando uma amostra é conquistada ela receba o rótulo do protótipo que a conquistou, ocorrendo a classificação. Para avaliar o método serão utilizados métodos estatísticos para estimar as taxas de acertos, como K-fold, Hold-out e Leave-one-out Cross- Validation. Os resultados obtidos indicam que o método pode ser um uma alternativa viável as técnicas de classificação existentes.Financiadora de Estudos e Projetosapplication/pdfporUniversidade Federal de São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarBRReconhecimento de padrõesTeoria dos grafosCampos aleatóriosInformação de fisherValidação cruzadaClassificação de padrõesPattern classificationGraph theoryMarkov random fieldFisher information and cross-validationCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOExplorando caminhos de mínima informação em grafos para problemas de classificação supervisionadainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis-1-1fec0c75b-1b4b-43d8-bc3e-1e011fe2653ainfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINAL5931.pdfapplication/pdf2655791https://repositorio.ufscar.br/bitstream/ufscar/562/1/5931.pdf6eafe016c175143a8d55692b4681adfeMD51TEXT5931.pdf.txt5931.pdf.txtExtracted texttext/plain0https://repositorio.ufscar.br/bitstream/ufscar/562/2/5931.pdf.txtd41d8cd98f00b204e9800998ecf8427eMD52THUMBNAIL5931.pdf.jpg5931.pdf.jpgIM Thumbnailimage/jpeg8551https://repositorio.ufscar.br/bitstream/ufscar/562/3/5931.pdf.jpg7d1b032f4dda64e19a4964756dc890afMD53ufscar/5622023-09-18 18:31:27.439oai:repositorio.ufscar.br:ufscar/562Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:31:27Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Explorando caminhos de mínima informação em grafos para problemas de classificação supervisionada
title Explorando caminhos de mínima informação em grafos para problemas de classificação supervisionada
spellingShingle Explorando caminhos de mínima informação em grafos para problemas de classificação supervisionada
Hiraga, Alan Kazuo
Reconhecimento de padrões
Teoria dos grafos
Campos aleatórios
Informação de fisher
Validação cruzada
Classificação de padrões
Pattern classification
Graph theory
Markov random field
Fisher information and cross-validation
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Explorando caminhos de mínima informação em grafos para problemas de classificação supervisionada
title_full Explorando caminhos de mínima informação em grafos para problemas de classificação supervisionada
title_fullStr Explorando caminhos de mínima informação em grafos para problemas de classificação supervisionada
title_full_unstemmed Explorando caminhos de mínima informação em grafos para problemas de classificação supervisionada
title_sort Explorando caminhos de mínima informação em grafos para problemas de classificação supervisionada
author Hiraga, Alan Kazuo
author_facet Hiraga, Alan Kazuo
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://lattes.cnpq.br/0420736258990939
dc.contributor.author.fl_str_mv Hiraga, Alan Kazuo
dc.contributor.advisor1.fl_str_mv Levada, Alexandre Luís Magalhães
dc.contributor.advisor1Lattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=H311648
dc.contributor.authorID.fl_str_mv 4f87ebb7-ca30-45f9-8a18-b94bb8d84c6e
contributor_str_mv Levada, Alexandre Luís Magalhães
dc.subject.por.fl_str_mv Reconhecimento de padrões
Teoria dos grafos
Campos aleatórios
Informação de fisher
Validação cruzada
Classificação de padrões
topic Reconhecimento de padrões
Teoria dos grafos
Campos aleatórios
Informação de fisher
Validação cruzada
Classificação de padrões
Pattern classification
Graph theory
Markov random field
Fisher information and cross-validation
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.eng.fl_str_mv Pattern classification
Graph theory
Markov random field
Fisher information and cross-validation
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description Classification is a very important step in pattern recognition, as it aims to categorize objects from a set of inherent features, through its labeling. This process can be supervised, when there is a sample set of labeled training classes, semi-supervised, when the number of labeled samples is limited or nearly inexistent, or unsupervised, where there are no labeled samples. This project proposes to explore minimum information paths in graphs for classification problems, through the definition of a supervised, non-parametric, graph-based classification method, by means of a contextual approach. This method proposes to construct a graph from a set of training samples, where the samples are represented by vertices and the edges are links between samples that belongs to a neighborhood system. From the graph construction, the method calculates the local observed Fisher information, a measurement based on the Potts model, for all vertices, identifying the amount of information that each sample has. Generally, different class vertices when connected by an edge, have a high information level. After that, it is necessary to weight the edges by means of a function that penalizes connecting vertices with high information. During this process, it is possible to identify and select high information vertices, which will be chosen to be prototype vertices, namely, the nodes that define the classes boundaries. After the definition, the method proposes that each prototype sample conquer the remaining samples by offering the shortest path in terms of information, so that when a sample is conquered it receives the label of the winning prototype, occurring the classification. To evaluate the proposed method, statistical methods to estimate the error rates, such as Hold-out, K-fold and Leave-One- Out Cross-Validation will be considered. The obtained results indicate that the method can be a viable alternative to the existing classification techniques.
publishDate 2014
dc.date.available.fl_str_mv 2014-07-18
2016-06-02T19:06:12Z
dc.date.issued.fl_str_mv 2014-05-05
dc.date.accessioned.fl_str_mv 2016-06-02T19:06:12Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv HIRAGA, Alan Kazuo. Explorando caminhos de mínima informação em grafos para problemas de classificação supervisionada. 2014. 79 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2014.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/ufscar/562
identifier_str_mv HIRAGA, Alan Kazuo. Explorando caminhos de mínima informação em grafos para problemas de classificação supervisionada. 2014. 79 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2014.
url https://repositorio.ufscar.br/handle/ufscar/562
dc.language.iso.fl_str_mv por
language por
dc.relation.confidence.fl_str_mv -1
-1
dc.relation.authority.fl_str_mv fec0c75b-1b4b-43d8-bc3e-1e011fe2653a
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação - PPGCC
dc.publisher.initials.fl_str_mv UFSCar
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstream/ufscar/562/1/5931.pdf
https://repositorio.ufscar.br/bitstream/ufscar/562/2/5931.pdf.txt
https://repositorio.ufscar.br/bitstream/ufscar/562/3/5931.pdf.jpg
bitstream.checksum.fl_str_mv 6eafe016c175143a8d55692b4681adfe
d41d8cd98f00b204e9800998ecf8427e
7d1b032f4dda64e19a4964756dc890af
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv
_version_ 1813715504061218816