Explorando caminhos de mínima informação em grafos para problemas de classificação supervisionada
Autor(a) principal: | |
---|---|
Data de Publicação: | 2014 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSCAR |
Texto Completo: | https://repositorio.ufscar.br/handle/ufscar/562 |
Resumo: | Classification is a very important step in pattern recognition, as it aims to categorize objects from a set of inherent features, through its labeling. This process can be supervised, when there is a sample set of labeled training classes, semi-supervised, when the number of labeled samples is limited or nearly inexistent, or unsupervised, where there are no labeled samples. This project proposes to explore minimum information paths in graphs for classification problems, through the definition of a supervised, non-parametric, graph-based classification method, by means of a contextual approach. This method proposes to construct a graph from a set of training samples, where the samples are represented by vertices and the edges are links between samples that belongs to a neighborhood system. From the graph construction, the method calculates the local observed Fisher information, a measurement based on the Potts model, for all vertices, identifying the amount of information that each sample has. Generally, different class vertices when connected by an edge, have a high information level. After that, it is necessary to weight the edges by means of a function that penalizes connecting vertices with high information. During this process, it is possible to identify and select high information vertices, which will be chosen to be prototype vertices, namely, the nodes that define the classes boundaries. After the definition, the method proposes that each prototype sample conquer the remaining samples by offering the shortest path in terms of information, so that when a sample is conquered it receives the label of the winning prototype, occurring the classification. To evaluate the proposed method, statistical methods to estimate the error rates, such as Hold-out, K-fold and Leave-One- Out Cross-Validation will be considered. The obtained results indicate that the method can be a viable alternative to the existing classification techniques. |
id |
SCAR_faac5194ea884af268a6cffccc232c82 |
---|---|
oai_identifier_str |
oai:repositorio.ufscar.br:ufscar/562 |
network_acronym_str |
SCAR |
network_name_str |
Repositório Institucional da UFSCAR |
repository_id_str |
4322 |
spelling |
Hiraga, Alan KazuoLevada, Alexandre Luís Magalhãeshttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=H311648http://lattes.cnpq.br/04207362589909394f87ebb7-ca30-45f9-8a18-b94bb8d84c6e2016-06-02T19:06:12Z2014-07-182016-06-02T19:06:12Z2014-05-05HIRAGA, Alan Kazuo. Explorando caminhos de mínima informação em grafos para problemas de classificação supervisionada. 2014. 79 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2014.https://repositorio.ufscar.br/handle/ufscar/562Classification is a very important step in pattern recognition, as it aims to categorize objects from a set of inherent features, through its labeling. This process can be supervised, when there is a sample set of labeled training classes, semi-supervised, when the number of labeled samples is limited or nearly inexistent, or unsupervised, where there are no labeled samples. This project proposes to explore minimum information paths in graphs for classification problems, through the definition of a supervised, non-parametric, graph-based classification method, by means of a contextual approach. This method proposes to construct a graph from a set of training samples, where the samples are represented by vertices and the edges are links between samples that belongs to a neighborhood system. From the graph construction, the method calculates the local observed Fisher information, a measurement based on the Potts model, for all vertices, identifying the amount of information that each sample has. Generally, different class vertices when connected by an edge, have a high information level. After that, it is necessary to weight the edges by means of a function that penalizes connecting vertices with high information. During this process, it is possible to identify and select high information vertices, which will be chosen to be prototype vertices, namely, the nodes that define the classes boundaries. After the definition, the method proposes that each prototype sample conquer the remaining samples by offering the shortest path in terms of information, so that when a sample is conquered it receives the label of the winning prototype, occurring the classification. To evaluate the proposed method, statistical methods to estimate the error rates, such as Hold-out, K-fold and Leave-One- Out Cross-Validation will be considered. The obtained results indicate that the method can be a viable alternative to the existing classification techniques.A classificação é uma etapa muito importante em reconhecimento de padrões, pois ela tem o objetivo de categorizar objetos a partir de um conjunto de características inerentes a ele, atribuindo-lhe um rótulo. Esse processo de classificação pode ser supervisionado, quando existe um conjunto de amostras de treinamento rotuladas que representam satisfatoriamente as classes, semi-supervisionado, quando o conjunto de amostras é limitado ou quase inexistente, ou não-supervisionado, quando não existem amostras rotuladas. Este trabalho propõe explorar caminhos de mínima informação em grafos para problemas de classificação, por meio da criação de um método de classificação supervisionado, não paramétrico, baseado em grafos, seguindo uma abordagem contextual. Esse método propõe a construção de um grafo a partir do conjunto de amostras de treinamento, onde as amostras serão representadas pelos vértices e as arestas serão as ligações entre amostras pertencentes a uma relação de adjacência. A partir da construção do grafo o método faz o calculo da informação de Fisher Local Observada, uma medida baseada no modelo de Potts, para todos os vértices, identificando o grau de informação que cada um possui. Geralmente vértices de classes distintas quando conectados por uma aresta possuem alta informação (bordas). Feito o calculo da informação, é necessário ponderar as arestas por meio de uma função que penaliza a ligação de vértices com alta informação. Enquanto as arestas são ponderadas é possível identificar e selecionar vértices altamente informativos os quais serão escolhidos para serem vértices protótipos, ou seja, os vértices que definem a região de borda. Depois de ponderadas as arestas e definidos os protótipos, o método propõe que cada protótipo conquiste as amostras oferecendo o menor caminho até ele, de modo que quando uma amostra é conquistada ela receba o rótulo do protótipo que a conquistou, ocorrendo a classificação. Para avaliar o método serão utilizados métodos estatísticos para estimar as taxas de acertos, como K-fold, Hold-out e Leave-one-out Cross- Validation. Os resultados obtidos indicam que o método pode ser um uma alternativa viável as técnicas de classificação existentes.Financiadora de Estudos e Projetosapplication/pdfporUniversidade Federal de São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarBRReconhecimento de padrõesTeoria dos grafosCampos aleatóriosInformação de fisherValidação cruzadaClassificação de padrõesPattern classificationGraph theoryMarkov random fieldFisher information and cross-validationCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOExplorando caminhos de mínima informação em grafos para problemas de classificação supervisionadainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis-1-1fec0c75b-1b4b-43d8-bc3e-1e011fe2653ainfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINAL5931.pdfapplication/pdf2655791https://repositorio.ufscar.br/bitstream/ufscar/562/1/5931.pdf6eafe016c175143a8d55692b4681adfeMD51TEXT5931.pdf.txt5931.pdf.txtExtracted texttext/plain0https://repositorio.ufscar.br/bitstream/ufscar/562/2/5931.pdf.txtd41d8cd98f00b204e9800998ecf8427eMD52THUMBNAIL5931.pdf.jpg5931.pdf.jpgIM Thumbnailimage/jpeg8551https://repositorio.ufscar.br/bitstream/ufscar/562/3/5931.pdf.jpg7d1b032f4dda64e19a4964756dc890afMD53ufscar/5622023-09-18 18:31:27.439oai:repositorio.ufscar.br:ufscar/562Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:31:27Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
dc.title.por.fl_str_mv |
Explorando caminhos de mínima informação em grafos para problemas de classificação supervisionada |
title |
Explorando caminhos de mínima informação em grafos para problemas de classificação supervisionada |
spellingShingle |
Explorando caminhos de mínima informação em grafos para problemas de classificação supervisionada Hiraga, Alan Kazuo Reconhecimento de padrões Teoria dos grafos Campos aleatórios Informação de fisher Validação cruzada Classificação de padrões Pattern classification Graph theory Markov random field Fisher information and cross-validation CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
title_short |
Explorando caminhos de mínima informação em grafos para problemas de classificação supervisionada |
title_full |
Explorando caminhos de mínima informação em grafos para problemas de classificação supervisionada |
title_fullStr |
Explorando caminhos de mínima informação em grafos para problemas de classificação supervisionada |
title_full_unstemmed |
Explorando caminhos de mínima informação em grafos para problemas de classificação supervisionada |
title_sort |
Explorando caminhos de mínima informação em grafos para problemas de classificação supervisionada |
author |
Hiraga, Alan Kazuo |
author_facet |
Hiraga, Alan Kazuo |
author_role |
author |
dc.contributor.authorlattes.por.fl_str_mv |
http://lattes.cnpq.br/0420736258990939 |
dc.contributor.author.fl_str_mv |
Hiraga, Alan Kazuo |
dc.contributor.advisor1.fl_str_mv |
Levada, Alexandre Luís Magalhães |
dc.contributor.advisor1Lattes.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=H311648 |
dc.contributor.authorID.fl_str_mv |
4f87ebb7-ca30-45f9-8a18-b94bb8d84c6e |
contributor_str_mv |
Levada, Alexandre Luís Magalhães |
dc.subject.por.fl_str_mv |
Reconhecimento de padrões Teoria dos grafos Campos aleatórios Informação de fisher Validação cruzada Classificação de padrões |
topic |
Reconhecimento de padrões Teoria dos grafos Campos aleatórios Informação de fisher Validação cruzada Classificação de padrões Pattern classification Graph theory Markov random field Fisher information and cross-validation CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
dc.subject.eng.fl_str_mv |
Pattern classification Graph theory Markov random field Fisher information and cross-validation |
dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
description |
Classification is a very important step in pattern recognition, as it aims to categorize objects from a set of inherent features, through its labeling. This process can be supervised, when there is a sample set of labeled training classes, semi-supervised, when the number of labeled samples is limited or nearly inexistent, or unsupervised, where there are no labeled samples. This project proposes to explore minimum information paths in graphs for classification problems, through the definition of a supervised, non-parametric, graph-based classification method, by means of a contextual approach. This method proposes to construct a graph from a set of training samples, where the samples are represented by vertices and the edges are links between samples that belongs to a neighborhood system. From the graph construction, the method calculates the local observed Fisher information, a measurement based on the Potts model, for all vertices, identifying the amount of information that each sample has. Generally, different class vertices when connected by an edge, have a high information level. After that, it is necessary to weight the edges by means of a function that penalizes connecting vertices with high information. During this process, it is possible to identify and select high information vertices, which will be chosen to be prototype vertices, namely, the nodes that define the classes boundaries. After the definition, the method proposes that each prototype sample conquer the remaining samples by offering the shortest path in terms of information, so that when a sample is conquered it receives the label of the winning prototype, occurring the classification. To evaluate the proposed method, statistical methods to estimate the error rates, such as Hold-out, K-fold and Leave-One- Out Cross-Validation will be considered. The obtained results indicate that the method can be a viable alternative to the existing classification techniques. |
publishDate |
2014 |
dc.date.available.fl_str_mv |
2014-07-18 2016-06-02T19:06:12Z |
dc.date.issued.fl_str_mv |
2014-05-05 |
dc.date.accessioned.fl_str_mv |
2016-06-02T19:06:12Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
HIRAGA, Alan Kazuo. Explorando caminhos de mínima informação em grafos para problemas de classificação supervisionada. 2014. 79 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2014. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufscar.br/handle/ufscar/562 |
identifier_str_mv |
HIRAGA, Alan Kazuo. Explorando caminhos de mínima informação em grafos para problemas de classificação supervisionada. 2014. 79 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2014. |
url |
https://repositorio.ufscar.br/handle/ufscar/562 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.confidence.fl_str_mv |
-1 -1 |
dc.relation.authority.fl_str_mv |
fec0c75b-1b4b-43d8-bc3e-1e011fe2653a |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação - PPGCC |
dc.publisher.initials.fl_str_mv |
UFSCar |
dc.publisher.country.fl_str_mv |
BR |
publisher.none.fl_str_mv |
Universidade Federal de São Carlos |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
instname_str |
Universidade Federal de São Carlos (UFSCAR) |
instacron_str |
UFSCAR |
institution |
UFSCAR |
reponame_str |
Repositório Institucional da UFSCAR |
collection |
Repositório Institucional da UFSCAR |
bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstream/ufscar/562/1/5931.pdf https://repositorio.ufscar.br/bitstream/ufscar/562/2/5931.pdf.txt https://repositorio.ufscar.br/bitstream/ufscar/562/3/5931.pdf.jpg |
bitstream.checksum.fl_str_mv |
6eafe016c175143a8d55692b4681adfe d41d8cd98f00b204e9800998ecf8427e 7d1b032f4dda64e19a4964756dc890af |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
repository.mail.fl_str_mv |
|
_version_ |
1813715504061218816 |