An incremental gaussian mixture network for data stream classification in non-stationary environments
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/174484 |
Resumo: | Classificação de fluxos contínuos de dados possui muitos desafios para a comunidade de mineração de dados quando o ambiente não é estacionário. Um dos maiores desafios para a aprendizagem em fluxos contínuos de dados está relacionado com a adaptação às mudanças de conceito, as quais ocorrem como resultado da evolução dos dados ao longo do tempo. Duas formas principais de desenvolver abordagens adaptativas são os métodos baseados em conjunto de classificadores e os algoritmos incrementais. Métodos baseados em conjunto de classificadores desempenham um papel importante devido à sua modularidade, o que proporciona uma maneira natural de se adaptar a mudanças de conceito. Os algoritmos incrementais são mais rápidos e possuem uma melhor capacidade anti-ruído do que os conjuntos de classificadores, mas têm mais restrições sobre os fluxos de dados. Assim, é um desafio combinar a flexibilidade e a adaptação de um conjunto de classificadores na presença de mudança de conceito, com a simplicidade de uso encontrada em um único classificador com aprendizado incremental. Com essa motivação, nesta dissertação, propomos um algoritmo incremental, online e probabilístico para a classificação em problemas que envolvem mudança de conceito. O algoritmo é chamado IGMN-NSE e é uma adaptação do algoritmo IGMN. As duas principais contribuições da IGMN-NSE em relação à IGMN são: melhoria de poder preditivo para tarefas de classificação e a adaptação para alcançar um bom desempenho em cenários não estacionários. Estudos extensivos em bases de dados sintéticas e do mundo real demonstram que o algoritmo proposto pode rastrear os ambientes em mudança de forma muito próxima, independentemente do tipo de mudança de conceito. |
id |
URGS_6b37848c7e71da501ea13a05ae64b2ea |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/174484 |
network_acronym_str |
URGS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
repository_id_str |
1853 |
spelling |
Diaz, Jorge Cristhian ChambyBazzan, Ana Lucia CetertichRecamonde-Mendoza, Mariana2018-04-10T02:31:03Z2018http://hdl.handle.net/10183/174484001063120Classificação de fluxos contínuos de dados possui muitos desafios para a comunidade de mineração de dados quando o ambiente não é estacionário. Um dos maiores desafios para a aprendizagem em fluxos contínuos de dados está relacionado com a adaptação às mudanças de conceito, as quais ocorrem como resultado da evolução dos dados ao longo do tempo. Duas formas principais de desenvolver abordagens adaptativas são os métodos baseados em conjunto de classificadores e os algoritmos incrementais. Métodos baseados em conjunto de classificadores desempenham um papel importante devido à sua modularidade, o que proporciona uma maneira natural de se adaptar a mudanças de conceito. Os algoritmos incrementais são mais rápidos e possuem uma melhor capacidade anti-ruído do que os conjuntos de classificadores, mas têm mais restrições sobre os fluxos de dados. Assim, é um desafio combinar a flexibilidade e a adaptação de um conjunto de classificadores na presença de mudança de conceito, com a simplicidade de uso encontrada em um único classificador com aprendizado incremental. Com essa motivação, nesta dissertação, propomos um algoritmo incremental, online e probabilístico para a classificação em problemas que envolvem mudança de conceito. O algoritmo é chamado IGMN-NSE e é uma adaptação do algoritmo IGMN. As duas principais contribuições da IGMN-NSE em relação à IGMN são: melhoria de poder preditivo para tarefas de classificação e a adaptação para alcançar um bom desempenho em cenários não estacionários. Estudos extensivos em bases de dados sintéticas e do mundo real demonstram que o algoritmo proposto pode rastrear os ambientes em mudança de forma muito próxima, independentemente do tipo de mudança de conceito.Data stream classification poses many challenges for the data mining community when the environment is non-stationary. The greatest challenge in learning classifiers from data stream relates to adaptation to the concept drifts, which occur as a result of changes in the underlying concepts. Two main ways to develop adaptive approaches are ensemble methods and incremental algorithms. Ensemble method plays an important role due to its modularity, which provides a natural way of adapting to change. Incremental algorithms are faster and have better anti-noise capacity than ensemble algorithms, but have more restrictions on concept drifting data streams. Thus, it is a challenge to combine the flexibility and adaptation of an ensemble classifier in the presence of concept drift, with the simplicity of use found in a single classifier with incremental learning. With this motivation, in this dissertation we propose an incremental, online and probabilistic algorithm for classification as an effort of tackling concept drifting. The algorithm is called IGMN-NSE and is an adaptation of the IGMN algorithm. The two main contributions of IGMN-NSE in relation to the IGMN are: predictive power improvement for classification tasks and adaptation to achieve a good performance in non-stationary environments. Extensive studies on both synthetic and real-world data demonstrate that the proposed algorithm can track the changing environments very closely, regardless of the type of concept drift.application/pdfengBanco : DadosAlgoritmosIncremental learningGaussian mixture modelsConcept driftData streams classificationAn incremental gaussian mixture network for data stream classification in non-stationary environmentsUma rede de mistura de gaussianas incrementais para classificação de fluxos contínuos de dados em cenários não estacionários info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2018mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL001063120.pdf001063120.pdfTexto completo (inglês)application/pdf1578574http://www.lume.ufrgs.br/bitstream/10183/174484/1/001063120.pdf411f628e0269dfb22fd71eb1456c43b9MD51TEXT001063120.pdf.txt001063120.pdf.txtExtracted Texttext/plain204298http://www.lume.ufrgs.br/bitstream/10183/174484/2/001063120.pdf.txt1fad41953c33918a24f873aeac20e5afMD52THUMBNAIL001063120.pdf.jpg001063120.pdf.jpgGenerated Thumbnailimage/jpeg1066http://www.lume.ufrgs.br/bitstream/10183/174484/3/001063120.pdf.jpgdd475e161902a24b7e48e0052a3ba63dMD5310183/1744842021-05-26 04:33:44.074464oai:www.lume.ufrgs.br:10183/174484Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532021-05-26T07:33:44Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
An incremental gaussian mixture network for data stream classification in non-stationary environments |
dc.title.alternative.pt.fl_str_mv |
Uma rede de mistura de gaussianas incrementais para classificação de fluxos contínuos de dados em cenários não estacionários |
title |
An incremental gaussian mixture network for data stream classification in non-stationary environments |
spellingShingle |
An incremental gaussian mixture network for data stream classification in non-stationary environments Diaz, Jorge Cristhian Chamby Banco : Dados Algoritmos Incremental learning Gaussian mixture models Concept drift Data streams classification |
title_short |
An incremental gaussian mixture network for data stream classification in non-stationary environments |
title_full |
An incremental gaussian mixture network for data stream classification in non-stationary environments |
title_fullStr |
An incremental gaussian mixture network for data stream classification in non-stationary environments |
title_full_unstemmed |
An incremental gaussian mixture network for data stream classification in non-stationary environments |
title_sort |
An incremental gaussian mixture network for data stream classification in non-stationary environments |
author |
Diaz, Jorge Cristhian Chamby |
author_facet |
Diaz, Jorge Cristhian Chamby |
author_role |
author |
dc.contributor.author.fl_str_mv |
Diaz, Jorge Cristhian Chamby |
dc.contributor.advisor1.fl_str_mv |
Bazzan, Ana Lucia Cetertich |
dc.contributor.advisor-co1.fl_str_mv |
Recamonde-Mendoza, Mariana |
contributor_str_mv |
Bazzan, Ana Lucia Cetertich Recamonde-Mendoza, Mariana |
dc.subject.por.fl_str_mv |
Banco : Dados Algoritmos |
topic |
Banco : Dados Algoritmos Incremental learning Gaussian mixture models Concept drift Data streams classification |
dc.subject.eng.fl_str_mv |
Incremental learning Gaussian mixture models Concept drift Data streams classification |
description |
Classificação de fluxos contínuos de dados possui muitos desafios para a comunidade de mineração de dados quando o ambiente não é estacionário. Um dos maiores desafios para a aprendizagem em fluxos contínuos de dados está relacionado com a adaptação às mudanças de conceito, as quais ocorrem como resultado da evolução dos dados ao longo do tempo. Duas formas principais de desenvolver abordagens adaptativas são os métodos baseados em conjunto de classificadores e os algoritmos incrementais. Métodos baseados em conjunto de classificadores desempenham um papel importante devido à sua modularidade, o que proporciona uma maneira natural de se adaptar a mudanças de conceito. Os algoritmos incrementais são mais rápidos e possuem uma melhor capacidade anti-ruído do que os conjuntos de classificadores, mas têm mais restrições sobre os fluxos de dados. Assim, é um desafio combinar a flexibilidade e a adaptação de um conjunto de classificadores na presença de mudança de conceito, com a simplicidade de uso encontrada em um único classificador com aprendizado incremental. Com essa motivação, nesta dissertação, propomos um algoritmo incremental, online e probabilístico para a classificação em problemas que envolvem mudança de conceito. O algoritmo é chamado IGMN-NSE e é uma adaptação do algoritmo IGMN. As duas principais contribuições da IGMN-NSE em relação à IGMN são: melhoria de poder preditivo para tarefas de classificação e a adaptação para alcançar um bom desempenho em cenários não estacionários. Estudos extensivos em bases de dados sintéticas e do mundo real demonstram que o algoritmo proposto pode rastrear os ambientes em mudança de forma muito próxima, independentemente do tipo de mudança de conceito. |
publishDate |
2018 |
dc.date.accessioned.fl_str_mv |
2018-04-10T02:31:03Z |
dc.date.issued.fl_str_mv |
2018 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/174484 |
dc.identifier.nrb.pt_BR.fl_str_mv |
001063120 |
url |
http://hdl.handle.net/10183/174484 |
identifier_str_mv |
001063120 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
collection |
Biblioteca Digital de Teses e Dissertações da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/174484/1/001063120.pdf http://www.lume.ufrgs.br/bitstream/10183/174484/2/001063120.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/174484/3/001063120.pdf.jpg |
bitstream.checksum.fl_str_mv |
411f628e0269dfb22fd71eb1456c43b9 1fad41953c33918a24f873aeac20e5af dd475e161902a24b7e48e0052a3ba63d |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
lume@ufrgs.br||lume@ufrgs.br |
_version_ |
1810085436468494336 |