Modelo de segmentação Clusterwise com protótipos híbridos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFPB |
Texto Completo: | https://repositorio.ufpb.br/jspui/handle/123456789/20747 |
Resumo: | This dissertation presents a methodology that combines prediction and grouping techniques called the Clusterwise Segmentation Model with Hybrid Prototypes (CSMoH), which aims to segment the data in clusters so that each cluster is represented by a predictive model, such as a regression model or machine learning algorithm (prototype), among a list of predefined methods. The choice of the best prototype for each cluster is intended to minimize an objective function. In addition to the implementation of the CSMoH method estimation algorithm, we consider different allocation techniques for new observations in order to assess the predictive performance of the algorithm. A proof of convergence is presented, as well as the application of the proposed method in synthetic data and in real databases. A new allocation method based on KNN, called KNN-combining clusters, is proposed, presenting interesting results. In the experiment with synthetic data, the CSMoH algorithm is compared with another algorithm in 6 different scenarios, with an satisfactory performance. In the validation of the CSMoH algorithm with real data, the proposed method presents a relevant performance when compared to 3 other algorithms (Linear K-means, Hybrid K-means and Clusterwise Linear Regression), as well as the evaluation of 5 different allocation methods. |
id |
UFPB_7fc97b5187ca2b194c12044a5b389f7a |
---|---|
oai_identifier_str |
oai:repositorio.ufpb.br:123456789/20747 |
network_acronym_str |
UFPB |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFPB |
repository_id_str |
|
spelling |
Modelo de segmentação Clusterwise com protótipos híbridosClusterwiseRegressãoAprendizagem de máquinaAlocaçãoProtótipos híbridosClusterwiseRegressionMachine learningAllocationHybrid prototypesCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOThis dissertation presents a methodology that combines prediction and grouping techniques called the Clusterwise Segmentation Model with Hybrid Prototypes (CSMoH), which aims to segment the data in clusters so that each cluster is represented by a predictive model, such as a regression model or machine learning algorithm (prototype), among a list of predefined methods. The choice of the best prototype for each cluster is intended to minimize an objective function. In addition to the implementation of the CSMoH method estimation algorithm, we consider different allocation techniques for new observations in order to assess the predictive performance of the algorithm. A proof of convergence is presented, as well as the application of the proposed method in synthetic data and in real databases. A new allocation method based on KNN, called KNN-combining clusters, is proposed, presenting interesting results. In the experiment with synthetic data, the CSMoH algorithm is compared with another algorithm in 6 different scenarios, with an satisfactory performance. In the validation of the CSMoH algorithm with real data, the proposed method presents a relevant performance when compared to 3 other algorithms (Linear K-means, Hybrid K-means and Clusterwise Linear Regression), as well as the evaluation of 5 different allocation methods.NenhumaApresenta-se, nesta Dissertação, uma metodologia que combina técnicas de predição e agrupamento denominada Modelo de Segmentação Clusterwise com Protótipos Híbridos (MoSCH), o qual objetiva segmentar os dados em clusters de modo que cada cluster seja representado por um modelo preditivo, como, por exemplo, um modelo de regressão ou algoritmo de aprendizagem de máquina (protótipo), dentre uma lista de métodos pré-definidos. A escolha do melhor protótipo para cada cluster tem o intuito de minimizar uma função objetivo. Além da implementação do algoritmo de estimação do método MoSCH, consideramos diferentes técnicas de alocação para novas observações de modo a avaliar o poder preditivo do algoritmo. Uma prova de convergência é apresentada, bem como a aplicação do método proposto em dados sintéticos e a bases de dados reais. Um novo método de alocação baseado no KNN, chamado alocação com KNN dos clusters combinados, é proposto, apresentando resultados interessantes. Já no experimento com dados sintéticos o algoritmo MoSCH é comparado com outro algoritmo em 6 cenários diferentes, tendo um desempenho satisfatório. Na validação do algoritmo MoSCH com dados reais, o método proposto apresenta uma relevante performance quando comparado a outros 3 algoritmos (K-means Linear, K-means Híbrido e Regressão Linear Clusterwise), bem como a avaliação de 5 diferentes métodos de alocação.Universidade Federal da ParaíbaBrasilInformáticaPrograma de Pós-Graduação em Modelagem Matemática e computacionalUFPBLima Neto, Eufrásio de Andradehttp://lattes.cnpq.br/5580004940091667Ferreira, Marcelo Rodrigo Portelahttp://lattes.cnpq.br/2620157217100077Dias, Wilter da Silva2021-08-16T15:38:54Z2021-02-222021-08-16T15:38:54Z2021-01-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttps://repositorio.ufpb.br/jspui/handle/123456789/20747porhttp://creativecommons.org/licenses/by-nd/3.0/br/info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFPBinstname:Universidade Federal da Paraíba (UFPB)instacron:UFPB2022-08-10T10:48:30Zoai:repositorio.ufpb.br:123456789/20747Biblioteca Digital de Teses e Dissertaçõeshttps://repositorio.ufpb.br/PUBhttp://tede.biblioteca.ufpb.br:8080/oai/requestdiretoria@ufpb.br|| diretoria@ufpb.bropendoar:2022-08-10T10:48:30Biblioteca Digital de Teses e Dissertações da UFPB - Universidade Federal da Paraíba (UFPB)false |
dc.title.none.fl_str_mv |
Modelo de segmentação Clusterwise com protótipos híbridos |
title |
Modelo de segmentação Clusterwise com protótipos híbridos |
spellingShingle |
Modelo de segmentação Clusterwise com protótipos híbridos Dias, Wilter da Silva Clusterwise Regressão Aprendizagem de máquina Alocação Protótipos híbridos Clusterwise Regression Machine learning Allocation Hybrid prototypes CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
title_short |
Modelo de segmentação Clusterwise com protótipos híbridos |
title_full |
Modelo de segmentação Clusterwise com protótipos híbridos |
title_fullStr |
Modelo de segmentação Clusterwise com protótipos híbridos |
title_full_unstemmed |
Modelo de segmentação Clusterwise com protótipos híbridos |
title_sort |
Modelo de segmentação Clusterwise com protótipos híbridos |
author |
Dias, Wilter da Silva |
author_facet |
Dias, Wilter da Silva |
author_role |
author |
dc.contributor.none.fl_str_mv |
Lima Neto, Eufrásio de Andrade http://lattes.cnpq.br/5580004940091667 Ferreira, Marcelo Rodrigo Portela http://lattes.cnpq.br/2620157217100077 |
dc.contributor.author.fl_str_mv |
Dias, Wilter da Silva |
dc.subject.por.fl_str_mv |
Clusterwise Regressão Aprendizagem de máquina Alocação Protótipos híbridos Clusterwise Regression Machine learning Allocation Hybrid prototypes CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
topic |
Clusterwise Regressão Aprendizagem de máquina Alocação Protótipos híbridos Clusterwise Regression Machine learning Allocation Hybrid prototypes CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
description |
This dissertation presents a methodology that combines prediction and grouping techniques called the Clusterwise Segmentation Model with Hybrid Prototypes (CSMoH), which aims to segment the data in clusters so that each cluster is represented by a predictive model, such as a regression model or machine learning algorithm (prototype), among a list of predefined methods. The choice of the best prototype for each cluster is intended to minimize an objective function. In addition to the implementation of the CSMoH method estimation algorithm, we consider different allocation techniques for new observations in order to assess the predictive performance of the algorithm. A proof of convergence is presented, as well as the application of the proposed method in synthetic data and in real databases. A new allocation method based on KNN, called KNN-combining clusters, is proposed, presenting interesting results. In the experiment with synthetic data, the CSMoH algorithm is compared with another algorithm in 6 different scenarios, with an satisfactory performance. In the validation of the CSMoH algorithm with real data, the proposed method presents a relevant performance when compared to 3 other algorithms (Linear K-means, Hybrid K-means and Clusterwise Linear Regression), as well as the evaluation of 5 different allocation methods. |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021-08-16T15:38:54Z 2021-02-22 2021-08-16T15:38:54Z 2021-01-28 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufpb.br/jspui/handle/123456789/20747 |
url |
https://repositorio.ufpb.br/jspui/handle/123456789/20747 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
http://creativecommons.org/licenses/by-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal da Paraíba Brasil Informática Programa de Pós-Graduação em Modelagem Matemática e computacional UFPB |
publisher.none.fl_str_mv |
Universidade Federal da Paraíba Brasil Informática Programa de Pós-Graduação em Modelagem Matemática e computacional UFPB |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFPB instname:Universidade Federal da Paraíba (UFPB) instacron:UFPB |
instname_str |
Universidade Federal da Paraíba (UFPB) |
instacron_str |
UFPB |
institution |
UFPB |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFPB |
collection |
Biblioteca Digital de Teses e Dissertações da UFPB |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFPB - Universidade Federal da Paraíba (UFPB) |
repository.mail.fl_str_mv |
diretoria@ufpb.br|| diretoria@ufpb.br |
_version_ |
1823126983564853248 |