Metodologia baseada em aprendizado profundo para agrupamento de séries temporais univariadas

Detalhes bibliográficos
Autor(a) principal: ARAÚJO, Alexandre de Carvalho
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFMA
Texto Completo: https://tedebc.ufma.br/jspui/handle/tede/tede/3354
Resumo: Electrical energy companies have a need to plan energy distribution to fulfill the needs of it’s costumers. They also need to analyze energy consumption to detect irregularities. To perform these tasks, consumption patterns discovery is an essential tool. Discovery of these patterns is a clustering task. There is a great number of approachs to cluster data, but a relatively new research subject for this task is the usage of deep learning. Great effort in this area is allocated to static data. However, applications that use time series data have been growing in the last years and not as much research effort is being made in this area. In this work, we propose a new methodology based in the Deep Embedded Clustering architecture, a popular deep clustering algorithm, to cluster electric consumption time series data while also approaching one of the flaws present on DEC, the need to inform number of clusters a priori, which isn’t generally known in real problems. To evaluate our methodology, we conducted tests regarding cluster number estimation in 66 time series datasets with known cluster numbers and to evaluate the consumption pattern discovery, we use 2 real electrical consumption datasets provided by a energy consumption company. Our results show superior performance when compared to approaches found in the literature for both cluster number estimation and clustering, indicating that the proposed methodology may be a effective tool for electrical energy companies.
id UFMA_2ec4c3716574863354fe96e85620ed42
oai_identifier_str oai:tede2:tede/3354
network_acronym_str UFMA
network_name_str Biblioteca Digital de Teses e Dissertações da UFMA
repository_id_str 2131
spelling PAIVA, Anselmo Cardoso dehttp://lattes.cnpq.br/6446831084215512SOUSA, João Dallyson Almeida dehttp://lattes.cnpq.br/6047330108382641PAIVA, Anselmo Cardoso dehttp://lattes.cnpq.br/6446831084215512SOUSA, João Dallyson Sousa de Almeida dehttp://lattes.cnpq.br/6047330108382641GOMES JÚNIOR, Daniel Limahttp://lattes.cnpq.br/4754106250302979SERRA, Ginalber Luiz de Oliveirahttp://lattes.cnpq.br/0831092299374520http://lattes.cnpq.br/1687621059962455ARAÚJO, Alexandre de Carvalho2021-09-23T14:32:22Z2021-05-13ARAÚJO, Alexandre de Carvalho. Metodologia baseada em aprendizado profundo para agrupamento de séries temporais univariadas. 2021. 63 f. Dissertação (Programa de Pós-Graduação em Ciência da Computação/CCET) - Universidade Federal do Maranhão, São Luís, 2021.https://tedebc.ufma.br/jspui/handle/tede/tede/3354Electrical energy companies have a need to plan energy distribution to fulfill the needs of it’s costumers. They also need to analyze energy consumption to detect irregularities. To perform these tasks, consumption patterns discovery is an essential tool. Discovery of these patterns is a clustering task. There is a great number of approachs to cluster data, but a relatively new research subject for this task is the usage of deep learning. Great effort in this area is allocated to static data. However, applications that use time series data have been growing in the last years and not as much research effort is being made in this area. In this work, we propose a new methodology based in the Deep Embedded Clustering architecture, a popular deep clustering algorithm, to cluster electric consumption time series data while also approaching one of the flaws present on DEC, the need to inform number of clusters a priori, which isn’t generally known in real problems. To evaluate our methodology, we conducted tests regarding cluster number estimation in 66 time series datasets with known cluster numbers and to evaluate the consumption pattern discovery, we use 2 real electrical consumption datasets provided by a energy consumption company. Our results show superior performance when compared to approaches found in the literature for both cluster number estimation and clustering, indicating that the proposed methodology may be a effective tool for electrical energy companies.Concessionárias de energia elétrica têm a necessidade de planejar a distribuição de energia de tal maneira a atender a necessidade de seus clientes. Além disso, analisar o consumo dos clientes para detectar irregularidades é uma outra tarefa importante para essas empresas. Para tais tarefas, a descoberta de padrões de consumo é essencial. A descoberta destes padrões se trata de uma tarefa de agrupamento. Existe uma grande quantidade de abordagens para agrupar dados, mas uma área de pesquisa relativamente nova neste campo é o uso de aprendizado profundo. Grande parte do esforço realizado nessa área se direciona a dados estáticos. No entanto aplicações que utilizam dados temporais, como consumo de energia elétrica, se tornam cada dia mais populares e relativamente pouco esforço de pesquisa é realizado nesta área. Este trabalho apresenta uma metodologia baseada na arquitetura Deep Embedded Clustering (DEC), uma abordagem para agrupamento utilizando aprendizado profundo, que foca em dados temporais além de abordar uma das deficiências originais do DEC, a necessidade de definir a priori a quantidade de grupos a serem criados, o que geralmente não é conhecido em problemas reais. Para avaliar a metodologia proposta, foram conduzidos experimentos sobre a estimação do número de grupos em 66 conjunto de dados cujo número de grupos é conhecido e para avaliar a capacidade de descoberta de padrões de consumo, foram realizados experimentos em 2 conjunto de dados de séries de consumo elétricos reais fornecidos por uma concessionária de energia elétrica. Os resultados encontrados apontam que tanto a estimação do número de grupos quanto o agrupamento em si da metodologia proposta são superiores à abordagens encontradas na literatura, indicando que a metodologia pode ser uma ferramenta efetiva para as concessionárias de energia elétrica.Submitted by Sheila MONTEIRO (sheila.monteiro@ufma.br) on 2021-09-23T14:32:22Z No. of bitstreams: 1 ALEXANDRE-ARAÚJO.pdf: 1221236 bytes, checksum: a1af8c4ad2f3a8f9a94d9dd60e356637 (MD5)Made available in DSpace on 2021-09-23T14:32:22Z (GMT). No. of bitstreams: 1 ALEXANDRE-ARAÚJO.pdf: 1221236 bytes, checksum: a1af8c4ad2f3a8f9a94d9dd60e356637 (MD5) Previous issue date: 2021-05-13application/pdfporUniversidade Federal do MaranhãoPROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO/CCETUFMABrasilDEPARTAMENTO DE INFORMÁTICA/CCETAgrupamento de séries temporaisAprendizado profundoEstimação de número de gruposTime series clusteringDeep ClusteringCluster number estimationElectrical energy consumptionCiência da ComputaçãoMetodologia baseada em aprendizado profundo para agrupamento de séries temporais univariadasDeep learning-based methodology for grouping univariate time seriesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFMAinstname:Universidade Federal do Maranhão (UFMA)instacron:UFMAORIGINALALEXANDRE-ARAÚJO.pdfALEXANDRE-ARAÚJO.pdfapplication/pdf1221236http://tedebc.ufma.br:8080/bitstream/tede/3354/2/ALEXANDRE-ARA%C3%9AJO.pdfa1af8c4ad2f3a8f9a94d9dd60e356637MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82255http://tedebc.ufma.br:8080/bitstream/tede/3354/1/license.txt97eeade1fce43278e63fe063657f8083MD51tede/33542021-09-23 11:32:22.542oai:tede2:tede/3354IExJQ0VOw4dBIERFIERJU1RSSUJVScOHw4NPIE7Dg08tRVhDTFVTSVZBCgpDb20gYSBhcHJlc2VudGHDp8OjbyBkZXN0YSBsaWNlbsOnYSxvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBjb25jZWRlIMOgIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRvIE1hcmFuaMOjbyAoVUZNQSkgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pLCBlL291IGRpc3RyaWJ1aXIgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zIMOhdWRpbyBvdSB2w61kZW8uCgpWb2PDqiBjb25jb3JkYSBxdWUgYSBVRk1BIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBhIFVGTUEgcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIGRlIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gcGFyYSBmaW5zIGRlIHNlZ3VyYW7Dp2EsIGJhY2stdXAgZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogZGVjbGFyYSBxdWUgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIHZvY8OqIHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgw6AgVUZNQSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBURVNFIE9VIERJU1NFUlRBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UgQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBVRk1BLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgRVhJR0lEQVMgUE9SIENPTlRSQVRPIE9VIEFDT1JETy4KCkEgVUZNQSBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lIG91IG8ocykgbm9tZShzKSBkbyhzKSBkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbywgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBhbMOpbSBkYXF1ZWxhcyBjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgoKRGVjbGFyYSB0YW1iw6ltIHF1ZSB0b2RhcyBhcyBhZmlsaWHDp8O1ZXMgY29ycG9yYXRpdmFzIG91IGluc3RpdHVjaW9uYWlzIGUgdG9kYXMgYXMgZm9udGVzIGRlIGFwb2lvIGZpbmFuY2Vpcm8gYW8gdHJhYmFsaG8gZXN0w6NvIGRldmlkYW1lbnRlIGNpdGFkYXMgb3UgbWVuY2lvbmFkYXMgZSBjZXJ0aWZpY2EgcXVlIG7Do28gaMOhIG5lbmh1bSBpbnRlcmVzc2UgY29tZXJjaWFsIG91IGFzc29jaWF0aXZvIHF1ZSByZXByZXNlbnRlIGNvbmZsaXRvIGRlIGludGVyZXNzZSBlbSBjb25leMOjbyBjb20gbyB0cmFiYWxobyBzdWJtZXRpZG8uCgoKCgoKCgo=Biblioteca Digital de Teses e Dissertaçõeshttps://tedebc.ufma.br/jspui/PUBhttp://tedebc.ufma.br:8080/oai/requestrepositorio@ufma.br||repositorio@ufma.bropendoar:21312021-09-23T14:32:22Biblioteca Digital de Teses e Dissertações da UFMA - Universidade Federal do Maranhão (UFMA)false
dc.title.por.fl_str_mv Metodologia baseada em aprendizado profundo para agrupamento de séries temporais univariadas
dc.title.alternative.eng.fl_str_mv Deep learning-based methodology for grouping univariate time series
title Metodologia baseada em aprendizado profundo para agrupamento de séries temporais univariadas
spellingShingle Metodologia baseada em aprendizado profundo para agrupamento de séries temporais univariadas
ARAÚJO, Alexandre de Carvalho
Agrupamento de séries temporais
Aprendizado profundo
Estimação de número de grupos
Time series clustering
Deep Clustering
Cluster number estimation
Electrical energy consumption
Ciência da Computação
title_short Metodologia baseada em aprendizado profundo para agrupamento de séries temporais univariadas
title_full Metodologia baseada em aprendizado profundo para agrupamento de séries temporais univariadas
title_fullStr Metodologia baseada em aprendizado profundo para agrupamento de séries temporais univariadas
title_full_unstemmed Metodologia baseada em aprendizado profundo para agrupamento de séries temporais univariadas
title_sort Metodologia baseada em aprendizado profundo para agrupamento de séries temporais univariadas
author ARAÚJO, Alexandre de Carvalho
author_facet ARAÚJO, Alexandre de Carvalho
author_role author
dc.contributor.advisor1.fl_str_mv PAIVA, Anselmo Cardoso de
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/6446831084215512
dc.contributor.advisor-co1.fl_str_mv SOUSA, João Dallyson Almeida de
dc.contributor.advisor-co1Lattes.fl_str_mv http://lattes.cnpq.br/6047330108382641
dc.contributor.referee1.fl_str_mv PAIVA, Anselmo Cardoso de
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/6446831084215512
dc.contributor.referee2.fl_str_mv SOUSA, João Dallyson Sousa de Almeida de
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/6047330108382641
dc.contributor.referee3.fl_str_mv GOMES JÚNIOR, Daniel Lima
dc.contributor.referee3Lattes.fl_str_mv http://lattes.cnpq.br/4754106250302979
dc.contributor.referee4.fl_str_mv SERRA, Ginalber Luiz de Oliveira
dc.contributor.referee4Lattes.fl_str_mv http://lattes.cnpq.br/0831092299374520
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/1687621059962455
dc.contributor.author.fl_str_mv ARAÚJO, Alexandre de Carvalho
contributor_str_mv PAIVA, Anselmo Cardoso de
SOUSA, João Dallyson Almeida de
PAIVA, Anselmo Cardoso de
SOUSA, João Dallyson Sousa de Almeida de
GOMES JÚNIOR, Daniel Lima
SERRA, Ginalber Luiz de Oliveira
dc.subject.por.fl_str_mv Agrupamento de séries temporais
Aprendizado profundo
Estimação de número de grupos
topic Agrupamento de séries temporais
Aprendizado profundo
Estimação de número de grupos
Time series clustering
Deep Clustering
Cluster number estimation
Electrical energy consumption
Ciência da Computação
dc.subject.eng.fl_str_mv Time series clustering
Deep Clustering
Cluster number estimation
Electrical energy consumption
dc.subject.cnpq.fl_str_mv Ciência da Computação
description Electrical energy companies have a need to plan energy distribution to fulfill the needs of it’s costumers. They also need to analyze energy consumption to detect irregularities. To perform these tasks, consumption patterns discovery is an essential tool. Discovery of these patterns is a clustering task. There is a great number of approachs to cluster data, but a relatively new research subject for this task is the usage of deep learning. Great effort in this area is allocated to static data. However, applications that use time series data have been growing in the last years and not as much research effort is being made in this area. In this work, we propose a new methodology based in the Deep Embedded Clustering architecture, a popular deep clustering algorithm, to cluster electric consumption time series data while also approaching one of the flaws present on DEC, the need to inform number of clusters a priori, which isn’t generally known in real problems. To evaluate our methodology, we conducted tests regarding cluster number estimation in 66 time series datasets with known cluster numbers and to evaluate the consumption pattern discovery, we use 2 real electrical consumption datasets provided by a energy consumption company. Our results show superior performance when compared to approaches found in the literature for both cluster number estimation and clustering, indicating that the proposed methodology may be a effective tool for electrical energy companies.
publishDate 2021
dc.date.accessioned.fl_str_mv 2021-09-23T14:32:22Z
dc.date.issued.fl_str_mv 2021-05-13
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv ARAÚJO, Alexandre de Carvalho. Metodologia baseada em aprendizado profundo para agrupamento de séries temporais univariadas. 2021. 63 f. Dissertação (Programa de Pós-Graduação em Ciência da Computação/CCET) - Universidade Federal do Maranhão, São Luís, 2021.
dc.identifier.uri.fl_str_mv https://tedebc.ufma.br/jspui/handle/tede/tede/3354
identifier_str_mv ARAÚJO, Alexandre de Carvalho. Metodologia baseada em aprendizado profundo para agrupamento de séries temporais univariadas. 2021. 63 f. Dissertação (Programa de Pós-Graduação em Ciência da Computação/CCET) - Universidade Federal do Maranhão, São Luís, 2021.
url https://tedebc.ufma.br/jspui/handle/tede/tede/3354
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do Maranhão
dc.publisher.program.fl_str_mv PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO/CCET
dc.publisher.initials.fl_str_mv UFMA
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv DEPARTAMENTO DE INFORMÁTICA/CCET
publisher.none.fl_str_mv Universidade Federal do Maranhão
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFMA
instname:Universidade Federal do Maranhão (UFMA)
instacron:UFMA
instname_str Universidade Federal do Maranhão (UFMA)
instacron_str UFMA
institution UFMA
reponame_str Biblioteca Digital de Teses e Dissertações da UFMA
collection Biblioteca Digital de Teses e Dissertações da UFMA
bitstream.url.fl_str_mv http://tedebc.ufma.br:8080/bitstream/tede/3354/2/ALEXANDRE-ARA%C3%9AJO.pdf
http://tedebc.ufma.br:8080/bitstream/tede/3354/1/license.txt
bitstream.checksum.fl_str_mv a1af8c4ad2f3a8f9a94d9dd60e356637
97eeade1fce43278e63fe063657f8083
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFMA - Universidade Federal do Maranhão (UFMA)
repository.mail.fl_str_mv repositorio@ufma.br||repositorio@ufma.br
_version_ 1800303802648100864