Modelo de segmentação Clusterwise com protótipos híbridos

Detalhes bibliográficos
Autor(a) principal: Dias, Wilter da Silva
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFPB
Texto Completo: https://repositorio.ufpb.br/jspui/handle/123456789/20747
Resumo: This dissertation presents a methodology that combines prediction and grouping techniques called the Clusterwise Segmentation Model with Hybrid Prototypes (CSMoH), which aims to segment the data in clusters so that each cluster is represented by a predictive model, such as a regression model or machine learning algorithm (prototype), among a list of predefined methods. The choice of the best prototype for each cluster is intended to minimize an objective function. In addition to the implementation of the CSMoH method estimation algorithm, we consider different allocation techniques for new observations in order to assess the predictive performance of the algorithm. A proof of convergence is presented, as well as the application of the proposed method in synthetic data and in real databases. A new allocation method based on KNN, called KNN-combining clusters, is proposed, presenting interesting results. In the experiment with synthetic data, the CSMoH algorithm is compared with another algorithm in 6 different scenarios, with an satisfactory performance. In the validation of the CSMoH algorithm with real data, the proposed method presents a relevant performance when compared to 3 other algorithms (Linear K-means, Hybrid K-means and Clusterwise Linear Regression), as well as the evaluation of 5 different allocation methods.
id UFPB_7fc97b5187ca2b194c12044a5b389f7a
oai_identifier_str oai:repositorio.ufpb.br:123456789/20747
network_acronym_str UFPB
network_name_str Biblioteca Digital de Teses e Dissertações da UFPB
repository_id_str
spelling Modelo de segmentação Clusterwise com protótipos híbridosClusterwiseRegressãoAprendizagem de máquinaAlocaçãoProtótipos híbridosClusterwiseRegressionMachine learningAllocationHybrid prototypesCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOThis dissertation presents a methodology that combines prediction and grouping techniques called the Clusterwise Segmentation Model with Hybrid Prototypes (CSMoH), which aims to segment the data in clusters so that each cluster is represented by a predictive model, such as a regression model or machine learning algorithm (prototype), among a list of predefined methods. The choice of the best prototype for each cluster is intended to minimize an objective function. In addition to the implementation of the CSMoH method estimation algorithm, we consider different allocation techniques for new observations in order to assess the predictive performance of the algorithm. A proof of convergence is presented, as well as the application of the proposed method in synthetic data and in real databases. A new allocation method based on KNN, called KNN-combining clusters, is proposed, presenting interesting results. In the experiment with synthetic data, the CSMoH algorithm is compared with another algorithm in 6 different scenarios, with an satisfactory performance. In the validation of the CSMoH algorithm with real data, the proposed method presents a relevant performance when compared to 3 other algorithms (Linear K-means, Hybrid K-means and Clusterwise Linear Regression), as well as the evaluation of 5 different allocation methods.NenhumaApresenta-se, nesta Dissertação, uma metodologia que combina técnicas de predição e agrupamento denominada Modelo de Segmentação Clusterwise com Protótipos Híbridos (MoSCH), o qual objetiva segmentar os dados em clusters de modo que cada cluster seja representado por um modelo preditivo, como, por exemplo, um modelo de regressão ou algoritmo de aprendizagem de máquina (protótipo), dentre uma lista de métodos pré-definidos. A escolha do melhor protótipo para cada cluster tem o intuito de minimizar uma função objetivo. Além da implementação do algoritmo de estimação do método MoSCH, consideramos diferentes técnicas de alocação para novas observações de modo a avaliar o poder preditivo do algoritmo. Uma prova de convergência é apresentada, bem como a aplicação do método proposto em dados sintéticos e a bases de dados reais. Um novo método de alocação baseado no KNN, chamado alocação com KNN dos clusters combinados, é proposto, apresentando resultados interessantes. Já no experimento com dados sintéticos o algoritmo MoSCH é comparado com outro algoritmo em 6 cenários diferentes, tendo um desempenho satisfatório. Na validação do algoritmo MoSCH com dados reais, o método proposto apresenta uma relevante performance quando comparado a outros 3 algoritmos (K-means Linear, K-means Híbrido e Regressão Linear Clusterwise), bem como a avaliação de 5 diferentes métodos de alocação.Universidade Federal da ParaíbaBrasilInformáticaPrograma de Pós-Graduação em Modelagem Matemática e computacionalUFPBLima Neto, Eufrásio de Andradehttp://lattes.cnpq.br/5580004940091667Ferreira, Marcelo Rodrigo Portelahttp://lattes.cnpq.br/2620157217100077Dias, Wilter da Silva2021-08-16T15:38:54Z2021-02-222021-08-16T15:38:54Z2021-01-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttps://repositorio.ufpb.br/jspui/handle/123456789/20747porhttp://creativecommons.org/licenses/by-nd/3.0/br/info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFPBinstname:Universidade Federal da Paraíba (UFPB)instacron:UFPB2022-08-10T10:48:30Zoai:repositorio.ufpb.br:123456789/20747Biblioteca Digital de Teses e Dissertaçõeshttps://repositorio.ufpb.br/PUBhttp://tede.biblioteca.ufpb.br:8080/oai/requestdiretoria@ufpb.br|| diretoria@ufpb.bropendoar:2022-08-10T10:48:30Biblioteca Digital de Teses e Dissertações da UFPB - Universidade Federal da Paraíba (UFPB)false
dc.title.none.fl_str_mv Modelo de segmentação Clusterwise com protótipos híbridos
title Modelo de segmentação Clusterwise com protótipos híbridos
spellingShingle Modelo de segmentação Clusterwise com protótipos híbridos
Dias, Wilter da Silva
Clusterwise
Regressão
Aprendizagem de máquina
Alocação
Protótipos híbridos
Clusterwise
Regression
Machine learning
Allocation
Hybrid prototypes
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Modelo de segmentação Clusterwise com protótipos híbridos
title_full Modelo de segmentação Clusterwise com protótipos híbridos
title_fullStr Modelo de segmentação Clusterwise com protótipos híbridos
title_full_unstemmed Modelo de segmentação Clusterwise com protótipos híbridos
title_sort Modelo de segmentação Clusterwise com protótipos híbridos
author Dias, Wilter da Silva
author_facet Dias, Wilter da Silva
author_role author
dc.contributor.none.fl_str_mv Lima Neto, Eufrásio de Andrade
http://lattes.cnpq.br/5580004940091667
Ferreira, Marcelo Rodrigo Portela
http://lattes.cnpq.br/2620157217100077
dc.contributor.author.fl_str_mv Dias, Wilter da Silva
dc.subject.por.fl_str_mv Clusterwise
Regressão
Aprendizagem de máquina
Alocação
Protótipos híbridos
Clusterwise
Regression
Machine learning
Allocation
Hybrid prototypes
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic Clusterwise
Regressão
Aprendizagem de máquina
Alocação
Protótipos híbridos
Clusterwise
Regression
Machine learning
Allocation
Hybrid prototypes
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description This dissertation presents a methodology that combines prediction and grouping techniques called the Clusterwise Segmentation Model with Hybrid Prototypes (CSMoH), which aims to segment the data in clusters so that each cluster is represented by a predictive model, such as a regression model or machine learning algorithm (prototype), among a list of predefined methods. The choice of the best prototype for each cluster is intended to minimize an objective function. In addition to the implementation of the CSMoH method estimation algorithm, we consider different allocation techniques for new observations in order to assess the predictive performance of the algorithm. A proof of convergence is presented, as well as the application of the proposed method in synthetic data and in real databases. A new allocation method based on KNN, called KNN-combining clusters, is proposed, presenting interesting results. In the experiment with synthetic data, the CSMoH algorithm is compared with another algorithm in 6 different scenarios, with an satisfactory performance. In the validation of the CSMoH algorithm with real data, the proposed method presents a relevant performance when compared to 3 other algorithms (Linear K-means, Hybrid K-means and Clusterwise Linear Regression), as well as the evaluation of 5 different allocation methods.
publishDate 2021
dc.date.none.fl_str_mv 2021-08-16T15:38:54Z
2021-02-22
2021-08-16T15:38:54Z
2021-01-28
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufpb.br/jspui/handle/123456789/20747
url https://repositorio.ufpb.br/jspui/handle/123456789/20747
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal da Paraíba
Brasil
Informática
Programa de Pós-Graduação em Modelagem Matemática e computacional
UFPB
publisher.none.fl_str_mv Universidade Federal da Paraíba
Brasil
Informática
Programa de Pós-Graduação em Modelagem Matemática e computacional
UFPB
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFPB
instname:Universidade Federal da Paraíba (UFPB)
instacron:UFPB
instname_str Universidade Federal da Paraíba (UFPB)
instacron_str UFPB
institution UFPB
reponame_str Biblioteca Digital de Teses e Dissertações da UFPB
collection Biblioteca Digital de Teses e Dissertações da UFPB
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFPB - Universidade Federal da Paraíba (UFPB)
repository.mail.fl_str_mv diretoria@ufpb.br|| diretoria@ufpb.br
_version_ 1823126983564853248