An incremental gaussian mixture network for data stream classification in non-stationary environments

Detalhes bibliográficos
Autor(a) principal: Diaz, Jorge Cristhian Chamby
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/174484
Resumo: Classificação de fluxos contínuos de dados possui muitos desafios para a comunidade de mineração de dados quando o ambiente não é estacionário. Um dos maiores desafios para a aprendizagem em fluxos contínuos de dados está relacionado com a adaptação às mudanças de conceito, as quais ocorrem como resultado da evolução dos dados ao longo do tempo. Duas formas principais de desenvolver abordagens adaptativas são os métodos baseados em conjunto de classificadores e os algoritmos incrementais. Métodos baseados em conjunto de classificadores desempenham um papel importante devido à sua modularidade, o que proporciona uma maneira natural de se adaptar a mudanças de conceito. Os algoritmos incrementais são mais rápidos e possuem uma melhor capacidade anti-ruído do que os conjuntos de classificadores, mas têm mais restrições sobre os fluxos de dados. Assim, é um desafio combinar a flexibilidade e a adaptação de um conjunto de classificadores na presença de mudança de conceito, com a simplicidade de uso encontrada em um único classificador com aprendizado incremental. Com essa motivação, nesta dissertação, propomos um algoritmo incremental, online e probabilístico para a classificação em problemas que envolvem mudança de conceito. O algoritmo é chamado IGMN-NSE e é uma adaptação do algoritmo IGMN. As duas principais contribuições da IGMN-NSE em relação à IGMN são: melhoria de poder preditivo para tarefas de classificação e a adaptação para alcançar um bom desempenho em cenários não estacionários. Estudos extensivos em bases de dados sintéticas e do mundo real demonstram que o algoritmo proposto pode rastrear os ambientes em mudança de forma muito próxima, independentemente do tipo de mudança de conceito.
id URGS_6b37848c7e71da501ea13a05ae64b2ea
oai_identifier_str oai:www.lume.ufrgs.br:10183/174484
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Diaz, Jorge Cristhian ChambyBazzan, Ana Lucia CetertichRecamonde-Mendoza, Mariana2018-04-10T02:31:03Z2018http://hdl.handle.net/10183/174484001063120Classificação de fluxos contínuos de dados possui muitos desafios para a comunidade de mineração de dados quando o ambiente não é estacionário. Um dos maiores desafios para a aprendizagem em fluxos contínuos de dados está relacionado com a adaptação às mudanças de conceito, as quais ocorrem como resultado da evolução dos dados ao longo do tempo. Duas formas principais de desenvolver abordagens adaptativas são os métodos baseados em conjunto de classificadores e os algoritmos incrementais. Métodos baseados em conjunto de classificadores desempenham um papel importante devido à sua modularidade, o que proporciona uma maneira natural de se adaptar a mudanças de conceito. Os algoritmos incrementais são mais rápidos e possuem uma melhor capacidade anti-ruído do que os conjuntos de classificadores, mas têm mais restrições sobre os fluxos de dados. Assim, é um desafio combinar a flexibilidade e a adaptação de um conjunto de classificadores na presença de mudança de conceito, com a simplicidade de uso encontrada em um único classificador com aprendizado incremental. Com essa motivação, nesta dissertação, propomos um algoritmo incremental, online e probabilístico para a classificação em problemas que envolvem mudança de conceito. O algoritmo é chamado IGMN-NSE e é uma adaptação do algoritmo IGMN. As duas principais contribuições da IGMN-NSE em relação à IGMN são: melhoria de poder preditivo para tarefas de classificação e a adaptação para alcançar um bom desempenho em cenários não estacionários. Estudos extensivos em bases de dados sintéticas e do mundo real demonstram que o algoritmo proposto pode rastrear os ambientes em mudança de forma muito próxima, independentemente do tipo de mudança de conceito.Data stream classification poses many challenges for the data mining community when the environment is non-stationary. The greatest challenge in learning classifiers from data stream relates to adaptation to the concept drifts, which occur as a result of changes in the underlying concepts. Two main ways to develop adaptive approaches are ensemble methods and incremental algorithms. Ensemble method plays an important role due to its modularity, which provides a natural way of adapting to change. Incremental algorithms are faster and have better anti-noise capacity than ensemble algorithms, but have more restrictions on concept drifting data streams. Thus, it is a challenge to combine the flexibility and adaptation of an ensemble classifier in the presence of concept drift, with the simplicity of use found in a single classifier with incremental learning. With this motivation, in this dissertation we propose an incremental, online and probabilistic algorithm for classification as an effort of tackling concept drifting. The algorithm is called IGMN-NSE and is an adaptation of the IGMN algorithm. The two main contributions of IGMN-NSE in relation to the IGMN are: predictive power improvement for classification tasks and adaptation to achieve a good performance in non-stationary environments. Extensive studies on both synthetic and real-world data demonstrate that the proposed algorithm can track the changing environments very closely, regardless of the type of concept drift.application/pdfengBanco : DadosAlgoritmosIncremental learningGaussian mixture modelsConcept driftData streams classificationAn incremental gaussian mixture network for data stream classification in non-stationary environmentsUma rede de mistura de gaussianas incrementais para classificação de fluxos contínuos de dados em cenários não estacionários info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2018mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL001063120.pdf001063120.pdfTexto completo (inglês)application/pdf1578574http://www.lume.ufrgs.br/bitstream/10183/174484/1/001063120.pdf411f628e0269dfb22fd71eb1456c43b9MD51TEXT001063120.pdf.txt001063120.pdf.txtExtracted Texttext/plain204298http://www.lume.ufrgs.br/bitstream/10183/174484/2/001063120.pdf.txt1fad41953c33918a24f873aeac20e5afMD52THUMBNAIL001063120.pdf.jpg001063120.pdf.jpgGenerated Thumbnailimage/jpeg1066http://www.lume.ufrgs.br/bitstream/10183/174484/3/001063120.pdf.jpgdd475e161902a24b7e48e0052a3ba63dMD5310183/1744842021-05-26 04:33:44.074464oai:www.lume.ufrgs.br:10183/174484Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532021-05-26T07:33:44Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv An incremental gaussian mixture network for data stream classification in non-stationary environments
dc.title.alternative.pt.fl_str_mv Uma rede de mistura de gaussianas incrementais para classificação de fluxos contínuos de dados em cenários não estacionários
title An incremental gaussian mixture network for data stream classification in non-stationary environments
spellingShingle An incremental gaussian mixture network for data stream classification in non-stationary environments
Diaz, Jorge Cristhian Chamby
Banco : Dados
Algoritmos
Incremental learning
Gaussian mixture models
Concept drift
Data streams classification
title_short An incremental gaussian mixture network for data stream classification in non-stationary environments
title_full An incremental gaussian mixture network for data stream classification in non-stationary environments
title_fullStr An incremental gaussian mixture network for data stream classification in non-stationary environments
title_full_unstemmed An incremental gaussian mixture network for data stream classification in non-stationary environments
title_sort An incremental gaussian mixture network for data stream classification in non-stationary environments
author Diaz, Jorge Cristhian Chamby
author_facet Diaz, Jorge Cristhian Chamby
author_role author
dc.contributor.author.fl_str_mv Diaz, Jorge Cristhian Chamby
dc.contributor.advisor1.fl_str_mv Bazzan, Ana Lucia Cetertich
dc.contributor.advisor-co1.fl_str_mv Recamonde-Mendoza, Mariana
contributor_str_mv Bazzan, Ana Lucia Cetertich
Recamonde-Mendoza, Mariana
dc.subject.por.fl_str_mv Banco : Dados
Algoritmos
topic Banco : Dados
Algoritmos
Incremental learning
Gaussian mixture models
Concept drift
Data streams classification
dc.subject.eng.fl_str_mv Incremental learning
Gaussian mixture models
Concept drift
Data streams classification
description Classificação de fluxos contínuos de dados possui muitos desafios para a comunidade de mineração de dados quando o ambiente não é estacionário. Um dos maiores desafios para a aprendizagem em fluxos contínuos de dados está relacionado com a adaptação às mudanças de conceito, as quais ocorrem como resultado da evolução dos dados ao longo do tempo. Duas formas principais de desenvolver abordagens adaptativas são os métodos baseados em conjunto de classificadores e os algoritmos incrementais. Métodos baseados em conjunto de classificadores desempenham um papel importante devido à sua modularidade, o que proporciona uma maneira natural de se adaptar a mudanças de conceito. Os algoritmos incrementais são mais rápidos e possuem uma melhor capacidade anti-ruído do que os conjuntos de classificadores, mas têm mais restrições sobre os fluxos de dados. Assim, é um desafio combinar a flexibilidade e a adaptação de um conjunto de classificadores na presença de mudança de conceito, com a simplicidade de uso encontrada em um único classificador com aprendizado incremental. Com essa motivação, nesta dissertação, propomos um algoritmo incremental, online e probabilístico para a classificação em problemas que envolvem mudança de conceito. O algoritmo é chamado IGMN-NSE e é uma adaptação do algoritmo IGMN. As duas principais contribuições da IGMN-NSE em relação à IGMN são: melhoria de poder preditivo para tarefas de classificação e a adaptação para alcançar um bom desempenho em cenários não estacionários. Estudos extensivos em bases de dados sintéticas e do mundo real demonstram que o algoritmo proposto pode rastrear os ambientes em mudança de forma muito próxima, independentemente do tipo de mudança de conceito.
publishDate 2018
dc.date.accessioned.fl_str_mv 2018-04-10T02:31:03Z
dc.date.issued.fl_str_mv 2018
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/174484
dc.identifier.nrb.pt_BR.fl_str_mv 001063120
url http://hdl.handle.net/10183/174484
identifier_str_mv 001063120
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/174484/1/001063120.pdf
http://www.lume.ufrgs.br/bitstream/10183/174484/2/001063120.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/174484/3/001063120.pdf.jpg
bitstream.checksum.fl_str_mv 411f628e0269dfb22fd71eb1456c43b9
1fad41953c33918a24f873aeac20e5af
dd475e161902a24b7e48e0052a3ba63d
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1810085436468494336