Método não supervisionado baseado em curvas principais para reconhecimento de padrões
Autor(a) principal: | |
---|---|
Data de Publicação: | 2015 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFLA |
Texto Completo: | http://repositorio.ufla.br/jspui/handle/1/10839 |
Resumo: | In this work a new method of data clustering and pattern classification based on principal curves is presented. Principal curves consist of a nonlinear generalization of Principal Component Analysis and are smooth curves, onedimensional, which model a multidimensional dataset, providing a onedimensional summary of it. In the proposed method, the principal curves are extracted by the k-segments algorithm. The method divides the principal curves originally obtained by the k-segments algorithm into two or more curves, according to the number of clusters previously defined by the user. Then, the distances from the data to the curves generated by the method are calculated and thereafter it is made sorting the data according to the criterion of the smallest distance from data to the new curves. The square of the Euclidian distance is used. The method was applied to five databases, two two-dimensional and three multidimensional. The results were compared with the methods k-means and Self Organized Maps, where the proposed method outperformed the other methods in two bases (two-dimensional ones) and obtained the second best result in the other databases. The method shown to be suitable for elongated and circular clusters. Despite its high performance, the method shown to be very sensitive to the input parameters (the segment length and the number of segments). The author intend to exploit the problem of the sensitivity of the method in future works. |
id |
UFLA_abba9306db3f58bc26b96e9c5a2acd15 |
---|---|
oai_identifier_str |
oai:localhost:1/10839 |
network_acronym_str |
UFLA |
network_name_str |
Repositório Institucional da UFLA |
repository_id_str |
|
spelling |
Método não supervisionado baseado em curvas principais para reconhecimento de padrõesCurvas principaisk-segmentosAgrupamentoReconhecimento de padrõesPrincipal curvesk-segmentsClusteringPattern recognitionAutomação Eletrônica de Processos Elétricos e IndustriaisIn this work a new method of data clustering and pattern classification based on principal curves is presented. Principal curves consist of a nonlinear generalization of Principal Component Analysis and are smooth curves, onedimensional, which model a multidimensional dataset, providing a onedimensional summary of it. In the proposed method, the principal curves are extracted by the k-segments algorithm. The method divides the principal curves originally obtained by the k-segments algorithm into two or more curves, according to the number of clusters previously defined by the user. Then, the distances from the data to the curves generated by the method are calculated and thereafter it is made sorting the data according to the criterion of the smallest distance from data to the new curves. The square of the Euclidian distance is used. The method was applied to five databases, two two-dimensional and three multidimensional. The results were compared with the methods k-means and Self Organized Maps, where the proposed method outperformed the other methods in two bases (two-dimensional ones) and obtained the second best result in the other databases. The method shown to be suitable for elongated and circular clusters. Despite its high performance, the method shown to be very sensitive to the input parameters (the segment length and the number of segments). The author intend to exploit the problem of the sensitivity of the method in future works.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)No presente trabalho é proposto um novo método de agrupamento e classificação de padrões baseado em Curvas Principais. As Curvas Principais consistem numa generalização não linear da Análise de Componentes Principais e são definidas como curvas suaves, unidimensionais, que modelam um conjunto multidimensional de dados, fornecendo um resumo unidimensional destes. O algoritmo de extração de curvas principais que o método proposto se baseou é o k-segmentos não suave. O método divide a curva principal originalmente obtida pelo algoritmo k-segmentos não suave em duas ou mais curvas, de acordo com o número de agrupamentos definido pelo usuário. Em seguida é calculada a distância dos dados às curvas geradas pelo método e, posteriormente, é feita a classificação dos dados de acordo com o critério da menor distância dos dados às novas curvas. Utilizou-se como métrica para o cálculo da distância o quadrado da distância Euclidiana. O método foi aplicado a cinco bases de dados, duas bidimensionais e três multidimensionais. Os resultados foram comparados com os métodos k-means e Self Organized Maps, em que o método proposto superou os demais métodos nas duas bases bidimensionais, com 100% de acerto, e obteve o segundo melhor resultado para as outras bases de dados. O método proposto é mais indicado para agrupamentos com distribuições alongadas e circulares no espaço de parâmetros. Apesar do desempenho alcançado, o método proposto apresentou forte sensibilidade aos parâmetros de entrada como comprimento do segmento e número de segmentos. O problema da sensibilidade aos parâmetros do método será investigado em trabalhos futuros.Universidade Federal de LavrasPrograma de Pós-Graduação em Engenharia de Sistemas e AutomaçãoUFLAbrasilDepartamento de EngenhariaFerreira, Danton DiegoBarbosa, Bruno Henrique GroennerMagalhães, Ricardo RodriguesVitor, Giovani BernardesMoraes, Elson Claudio Correa2016-02-19T11:06:06Z2016-02-19T11:06:06Z2016-02-192015-12-21info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfMORAES, E. C. C. Método não supervisionado baseado em curvas principais para reconhecimento de padrões. 2016. 132 p. Dissertação (Mestrado em Engenharia de Sistemas e Automação)-Universidade Federal de Lavras, Lavras, 2015.http://repositorio.ufla.br/jspui/handle/1/10839porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFLAinstname:Universidade Federal de Lavras (UFLA)instacron:UFLA2023-05-02T12:40:49Zoai:localhost:1/10839Repositório InstitucionalPUBhttp://repositorio.ufla.br/oai/requestnivaldo@ufla.br || repositorio.biblioteca@ufla.bropendoar:2023-05-02T12:40:49Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)false |
dc.title.none.fl_str_mv |
Método não supervisionado baseado em curvas principais para reconhecimento de padrões |
title |
Método não supervisionado baseado em curvas principais para reconhecimento de padrões |
spellingShingle |
Método não supervisionado baseado em curvas principais para reconhecimento de padrões Moraes, Elson Claudio Correa Curvas principais k-segmentos Agrupamento Reconhecimento de padrões Principal curves k-segments Clustering Pattern recognition Automação Eletrônica de Processos Elétricos e Industriais |
title_short |
Método não supervisionado baseado em curvas principais para reconhecimento de padrões |
title_full |
Método não supervisionado baseado em curvas principais para reconhecimento de padrões |
title_fullStr |
Método não supervisionado baseado em curvas principais para reconhecimento de padrões |
title_full_unstemmed |
Método não supervisionado baseado em curvas principais para reconhecimento de padrões |
title_sort |
Método não supervisionado baseado em curvas principais para reconhecimento de padrões |
author |
Moraes, Elson Claudio Correa |
author_facet |
Moraes, Elson Claudio Correa |
author_role |
author |
dc.contributor.none.fl_str_mv |
Ferreira, Danton Diego Barbosa, Bruno Henrique Groenner Magalhães, Ricardo Rodrigues Vitor, Giovani Bernardes |
dc.contributor.author.fl_str_mv |
Moraes, Elson Claudio Correa |
dc.subject.por.fl_str_mv |
Curvas principais k-segmentos Agrupamento Reconhecimento de padrões Principal curves k-segments Clustering Pattern recognition Automação Eletrônica de Processos Elétricos e Industriais |
topic |
Curvas principais k-segmentos Agrupamento Reconhecimento de padrões Principal curves k-segments Clustering Pattern recognition Automação Eletrônica de Processos Elétricos e Industriais |
description |
In this work a new method of data clustering and pattern classification based on principal curves is presented. Principal curves consist of a nonlinear generalization of Principal Component Analysis and are smooth curves, onedimensional, which model a multidimensional dataset, providing a onedimensional summary of it. In the proposed method, the principal curves are extracted by the k-segments algorithm. The method divides the principal curves originally obtained by the k-segments algorithm into two or more curves, according to the number of clusters previously defined by the user. Then, the distances from the data to the curves generated by the method are calculated and thereafter it is made sorting the data according to the criterion of the smallest distance from data to the new curves. The square of the Euclidian distance is used. The method was applied to five databases, two two-dimensional and three multidimensional. The results were compared with the methods k-means and Self Organized Maps, where the proposed method outperformed the other methods in two bases (two-dimensional ones) and obtained the second best result in the other databases. The method shown to be suitable for elongated and circular clusters. Despite its high performance, the method shown to be very sensitive to the input parameters (the segment length and the number of segments). The author intend to exploit the problem of the sensitivity of the method in future works. |
publishDate |
2015 |
dc.date.none.fl_str_mv |
2015-12-21 2016-02-19T11:06:06Z 2016-02-19T11:06:06Z 2016-02-19 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
MORAES, E. C. C. Método não supervisionado baseado em curvas principais para reconhecimento de padrões. 2016. 132 p. Dissertação (Mestrado em Engenharia de Sistemas e Automação)-Universidade Federal de Lavras, Lavras, 2015. http://repositorio.ufla.br/jspui/handle/1/10839 |
identifier_str_mv |
MORAES, E. C. C. Método não supervisionado baseado em curvas principais para reconhecimento de padrões. 2016. 132 p. Dissertação (Mestrado em Engenharia de Sistemas e Automação)-Universidade Federal de Lavras, Lavras, 2015. |
url |
http://repositorio.ufla.br/jspui/handle/1/10839 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de Lavras Programa de Pós-Graduação em Engenharia de Sistemas e Automação UFLA brasil Departamento de Engenharia |
publisher.none.fl_str_mv |
Universidade Federal de Lavras Programa de Pós-Graduação em Engenharia de Sistemas e Automação UFLA brasil Departamento de Engenharia |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFLA instname:Universidade Federal de Lavras (UFLA) instacron:UFLA |
instname_str |
Universidade Federal de Lavras (UFLA) |
instacron_str |
UFLA |
institution |
UFLA |
reponame_str |
Repositório Institucional da UFLA |
collection |
Repositório Institucional da UFLA |
repository.name.fl_str_mv |
Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA) |
repository.mail.fl_str_mv |
nivaldo@ufla.br || repositorio.biblioteca@ufla.br |
_version_ |
1807835198016978944 |