Metodologia baseada em aprendizado profundo para agrupamento de séries temporais univariadas
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFMA |
Texto Completo: | https://tedebc.ufma.br/jspui/handle/tede/tede/3354 |
Resumo: | Electrical energy companies have a need to plan energy distribution to fulfill the needs of it’s costumers. They also need to analyze energy consumption to detect irregularities. To perform these tasks, consumption patterns discovery is an essential tool. Discovery of these patterns is a clustering task. There is a great number of approachs to cluster data, but a relatively new research subject for this task is the usage of deep learning. Great effort in this area is allocated to static data. However, applications that use time series data have been growing in the last years and not as much research effort is being made in this area. In this work, we propose a new methodology based in the Deep Embedded Clustering architecture, a popular deep clustering algorithm, to cluster electric consumption time series data while also approaching one of the flaws present on DEC, the need to inform number of clusters a priori, which isn’t generally known in real problems. To evaluate our methodology, we conducted tests regarding cluster number estimation in 66 time series datasets with known cluster numbers and to evaluate the consumption pattern discovery, we use 2 real electrical consumption datasets provided by a energy consumption company. Our results show superior performance when compared to approaches found in the literature for both cluster number estimation and clustering, indicating that the proposed methodology may be a effective tool for electrical energy companies. |
id |
UFMA_2ec4c3716574863354fe96e85620ed42 |
---|---|
oai_identifier_str |
oai:tede2:tede/3354 |
network_acronym_str |
UFMA |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFMA |
repository_id_str |
2131 |
spelling |
PAIVA, Anselmo Cardoso dehttp://lattes.cnpq.br/6446831084215512SOUSA, João Dallyson Almeida dehttp://lattes.cnpq.br/6047330108382641PAIVA, Anselmo Cardoso dehttp://lattes.cnpq.br/6446831084215512SOUSA, João Dallyson Sousa de Almeida dehttp://lattes.cnpq.br/6047330108382641GOMES JÚNIOR, Daniel Limahttp://lattes.cnpq.br/4754106250302979SERRA, Ginalber Luiz de Oliveirahttp://lattes.cnpq.br/0831092299374520http://lattes.cnpq.br/1687621059962455ARAÚJO, Alexandre de Carvalho2021-09-23T14:32:22Z2021-05-13ARAÚJO, Alexandre de Carvalho. Metodologia baseada em aprendizado profundo para agrupamento de séries temporais univariadas. 2021. 63 f. Dissertação (Programa de Pós-Graduação em Ciência da Computação/CCET) - Universidade Federal do Maranhão, São Luís, 2021.https://tedebc.ufma.br/jspui/handle/tede/tede/3354Electrical energy companies have a need to plan energy distribution to fulfill the needs of it’s costumers. They also need to analyze energy consumption to detect irregularities. To perform these tasks, consumption patterns discovery is an essential tool. Discovery of these patterns is a clustering task. There is a great number of approachs to cluster data, but a relatively new research subject for this task is the usage of deep learning. Great effort in this area is allocated to static data. However, applications that use time series data have been growing in the last years and not as much research effort is being made in this area. In this work, we propose a new methodology based in the Deep Embedded Clustering architecture, a popular deep clustering algorithm, to cluster electric consumption time series data while also approaching one of the flaws present on DEC, the need to inform number of clusters a priori, which isn’t generally known in real problems. To evaluate our methodology, we conducted tests regarding cluster number estimation in 66 time series datasets with known cluster numbers and to evaluate the consumption pattern discovery, we use 2 real electrical consumption datasets provided by a energy consumption company. Our results show superior performance when compared to approaches found in the literature for both cluster number estimation and clustering, indicating that the proposed methodology may be a effective tool for electrical energy companies.Concessionárias de energia elétrica têm a necessidade de planejar a distribuição de energia de tal maneira a atender a necessidade de seus clientes. Além disso, analisar o consumo dos clientes para detectar irregularidades é uma outra tarefa importante para essas empresas. Para tais tarefas, a descoberta de padrões de consumo é essencial. A descoberta destes padrões se trata de uma tarefa de agrupamento. Existe uma grande quantidade de abordagens para agrupar dados, mas uma área de pesquisa relativamente nova neste campo é o uso de aprendizado profundo. Grande parte do esforço realizado nessa área se direciona a dados estáticos. No entanto aplicações que utilizam dados temporais, como consumo de energia elétrica, se tornam cada dia mais populares e relativamente pouco esforço de pesquisa é realizado nesta área. Este trabalho apresenta uma metodologia baseada na arquitetura Deep Embedded Clustering (DEC), uma abordagem para agrupamento utilizando aprendizado profundo, que foca em dados temporais além de abordar uma das deficiências originais do DEC, a necessidade de definir a priori a quantidade de grupos a serem criados, o que geralmente não é conhecido em problemas reais. Para avaliar a metodologia proposta, foram conduzidos experimentos sobre a estimação do número de grupos em 66 conjunto de dados cujo número de grupos é conhecido e para avaliar a capacidade de descoberta de padrões de consumo, foram realizados experimentos em 2 conjunto de dados de séries de consumo elétricos reais fornecidos por uma concessionária de energia elétrica. Os resultados encontrados apontam que tanto a estimação do número de grupos quanto o agrupamento em si da metodologia proposta são superiores à abordagens encontradas na literatura, indicando que a metodologia pode ser uma ferramenta efetiva para as concessionárias de energia elétrica.Submitted by Sheila MONTEIRO (sheila.monteiro@ufma.br) on 2021-09-23T14:32:22Z No. of bitstreams: 1 ALEXANDRE-ARAÚJO.pdf: 1221236 bytes, checksum: a1af8c4ad2f3a8f9a94d9dd60e356637 (MD5)Made available in DSpace on 2021-09-23T14:32:22Z (GMT). No. of bitstreams: 1 ALEXANDRE-ARAÚJO.pdf: 1221236 bytes, checksum: a1af8c4ad2f3a8f9a94d9dd60e356637 (MD5) Previous issue date: 2021-05-13application/pdfporUniversidade Federal do MaranhãoPROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO/CCETUFMABrasilDEPARTAMENTO DE INFORMÁTICA/CCETAgrupamento de séries temporaisAprendizado profundoEstimação de número de gruposTime series clusteringDeep ClusteringCluster number estimationElectrical energy consumptionCiência da ComputaçãoMetodologia baseada em aprendizado profundo para agrupamento de séries temporais univariadasDeep learning-based methodology for grouping univariate time seriesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFMAinstname:Universidade Federal do Maranhão (UFMA)instacron:UFMAORIGINALALEXANDRE-ARAÚJO.pdfALEXANDRE-ARAÚJO.pdfapplication/pdf1221236http://tedebc.ufma.br:8080/bitstream/tede/3354/2/ALEXANDRE-ARA%C3%9AJO.pdfa1af8c4ad2f3a8f9a94d9dd60e356637MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82255http://tedebc.ufma.br:8080/bitstream/tede/3354/1/license.txt97eeade1fce43278e63fe063657f8083MD51tede/33542021-09-23 11:32:22.542oai:tede2:tede/3354IExJQ0VOw4dBIERFIERJU1RSSUJVScOHw4NPIE7Dg08tRVhDTFVTSVZBCgpDb20gYSBhcHJlc2VudGHDp8OjbyBkZXN0YSBsaWNlbsOnYSxvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBjb25jZWRlIMOgIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRvIE1hcmFuaMOjbyAoVUZNQSkgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pLCBlL291IGRpc3RyaWJ1aXIgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zIMOhdWRpbyBvdSB2w61kZW8uCgpWb2PDqiBjb25jb3JkYSBxdWUgYSBVRk1BIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBhIFVGTUEgcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIGRlIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gcGFyYSBmaW5zIGRlIHNlZ3VyYW7Dp2EsIGJhY2stdXAgZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogZGVjbGFyYSBxdWUgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIHZvY8OqIHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgw6AgVUZNQSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBURVNFIE9VIERJU1NFUlRBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UgQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBVRk1BLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgRVhJR0lEQVMgUE9SIENPTlRSQVRPIE9VIEFDT1JETy4KCkEgVUZNQSBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lIG91IG8ocykgbm9tZShzKSBkbyhzKSBkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbywgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBhbMOpbSBkYXF1ZWxhcyBjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgoKRGVjbGFyYSB0YW1iw6ltIHF1ZSB0b2RhcyBhcyBhZmlsaWHDp8O1ZXMgY29ycG9yYXRpdmFzIG91IGluc3RpdHVjaW9uYWlzIGUgdG9kYXMgYXMgZm9udGVzIGRlIGFwb2lvIGZpbmFuY2Vpcm8gYW8gdHJhYmFsaG8gZXN0w6NvIGRldmlkYW1lbnRlIGNpdGFkYXMgb3UgbWVuY2lvbmFkYXMgZSBjZXJ0aWZpY2EgcXVlIG7Do28gaMOhIG5lbmh1bSBpbnRlcmVzc2UgY29tZXJjaWFsIG91IGFzc29jaWF0aXZvIHF1ZSByZXByZXNlbnRlIGNvbmZsaXRvIGRlIGludGVyZXNzZSBlbSBjb25leMOjbyBjb20gbyB0cmFiYWxobyBzdWJtZXRpZG8uCgoKCgoKCgo=Biblioteca Digital de Teses e Dissertaçõeshttps://tedebc.ufma.br/jspui/PUBhttp://tedebc.ufma.br:8080/oai/requestrepositorio@ufma.br||repositorio@ufma.bropendoar:21312021-09-23T14:32:22Biblioteca Digital de Teses e Dissertações da UFMA - Universidade Federal do Maranhão (UFMA)false |
dc.title.por.fl_str_mv |
Metodologia baseada em aprendizado profundo para agrupamento de séries temporais univariadas |
dc.title.alternative.eng.fl_str_mv |
Deep learning-based methodology for grouping univariate time series |
title |
Metodologia baseada em aprendizado profundo para agrupamento de séries temporais univariadas |
spellingShingle |
Metodologia baseada em aprendizado profundo para agrupamento de séries temporais univariadas ARAÚJO, Alexandre de Carvalho Agrupamento de séries temporais Aprendizado profundo Estimação de número de grupos Time series clustering Deep Clustering Cluster number estimation Electrical energy consumption Ciência da Computação |
title_short |
Metodologia baseada em aprendizado profundo para agrupamento de séries temporais univariadas |
title_full |
Metodologia baseada em aprendizado profundo para agrupamento de séries temporais univariadas |
title_fullStr |
Metodologia baseada em aprendizado profundo para agrupamento de séries temporais univariadas |
title_full_unstemmed |
Metodologia baseada em aprendizado profundo para agrupamento de séries temporais univariadas |
title_sort |
Metodologia baseada em aprendizado profundo para agrupamento de séries temporais univariadas |
author |
ARAÚJO, Alexandre de Carvalho |
author_facet |
ARAÚJO, Alexandre de Carvalho |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
PAIVA, Anselmo Cardoso de |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/6446831084215512 |
dc.contributor.advisor-co1.fl_str_mv |
SOUSA, João Dallyson Almeida de |
dc.contributor.advisor-co1Lattes.fl_str_mv |
http://lattes.cnpq.br/6047330108382641 |
dc.contributor.referee1.fl_str_mv |
PAIVA, Anselmo Cardoso de |
dc.contributor.referee1Lattes.fl_str_mv |
http://lattes.cnpq.br/6446831084215512 |
dc.contributor.referee2.fl_str_mv |
SOUSA, João Dallyson Sousa de Almeida de |
dc.contributor.referee2Lattes.fl_str_mv |
http://lattes.cnpq.br/6047330108382641 |
dc.contributor.referee3.fl_str_mv |
GOMES JÚNIOR, Daniel Lima |
dc.contributor.referee3Lattes.fl_str_mv |
http://lattes.cnpq.br/4754106250302979 |
dc.contributor.referee4.fl_str_mv |
SERRA, Ginalber Luiz de Oliveira |
dc.contributor.referee4Lattes.fl_str_mv |
http://lattes.cnpq.br/0831092299374520 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/1687621059962455 |
dc.contributor.author.fl_str_mv |
ARAÚJO, Alexandre de Carvalho |
contributor_str_mv |
PAIVA, Anselmo Cardoso de SOUSA, João Dallyson Almeida de PAIVA, Anselmo Cardoso de SOUSA, João Dallyson Sousa de Almeida de GOMES JÚNIOR, Daniel Lima SERRA, Ginalber Luiz de Oliveira |
dc.subject.por.fl_str_mv |
Agrupamento de séries temporais Aprendizado profundo Estimação de número de grupos |
topic |
Agrupamento de séries temporais Aprendizado profundo Estimação de número de grupos Time series clustering Deep Clustering Cluster number estimation Electrical energy consumption Ciência da Computação |
dc.subject.eng.fl_str_mv |
Time series clustering Deep Clustering Cluster number estimation Electrical energy consumption |
dc.subject.cnpq.fl_str_mv |
Ciência da Computação |
description |
Electrical energy companies have a need to plan energy distribution to fulfill the needs of it’s costumers. They also need to analyze energy consumption to detect irregularities. To perform these tasks, consumption patterns discovery is an essential tool. Discovery of these patterns is a clustering task. There is a great number of approachs to cluster data, but a relatively new research subject for this task is the usage of deep learning. Great effort in this area is allocated to static data. However, applications that use time series data have been growing in the last years and not as much research effort is being made in this area. In this work, we propose a new methodology based in the Deep Embedded Clustering architecture, a popular deep clustering algorithm, to cluster electric consumption time series data while also approaching one of the flaws present on DEC, the need to inform number of clusters a priori, which isn’t generally known in real problems. To evaluate our methodology, we conducted tests regarding cluster number estimation in 66 time series datasets with known cluster numbers and to evaluate the consumption pattern discovery, we use 2 real electrical consumption datasets provided by a energy consumption company. Our results show superior performance when compared to approaches found in the literature for both cluster number estimation and clustering, indicating that the proposed methodology may be a effective tool for electrical energy companies. |
publishDate |
2021 |
dc.date.accessioned.fl_str_mv |
2021-09-23T14:32:22Z |
dc.date.issued.fl_str_mv |
2021-05-13 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
ARAÚJO, Alexandre de Carvalho. Metodologia baseada em aprendizado profundo para agrupamento de séries temporais univariadas. 2021. 63 f. Dissertação (Programa de Pós-Graduação em Ciência da Computação/CCET) - Universidade Federal do Maranhão, São Luís, 2021. |
dc.identifier.uri.fl_str_mv |
https://tedebc.ufma.br/jspui/handle/tede/tede/3354 |
identifier_str_mv |
ARAÚJO, Alexandre de Carvalho. Metodologia baseada em aprendizado profundo para agrupamento de séries temporais univariadas. 2021. 63 f. Dissertação (Programa de Pós-Graduação em Ciência da Computação/CCET) - Universidade Federal do Maranhão, São Luís, 2021. |
url |
https://tedebc.ufma.br/jspui/handle/tede/tede/3354 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal do Maranhão |
dc.publisher.program.fl_str_mv |
PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO/CCET |
dc.publisher.initials.fl_str_mv |
UFMA |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
DEPARTAMENTO DE INFORMÁTICA/CCET |
publisher.none.fl_str_mv |
Universidade Federal do Maranhão |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFMA instname:Universidade Federal do Maranhão (UFMA) instacron:UFMA |
instname_str |
Universidade Federal do Maranhão (UFMA) |
instacron_str |
UFMA |
institution |
UFMA |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFMA |
collection |
Biblioteca Digital de Teses e Dissertações da UFMA |
bitstream.url.fl_str_mv |
http://tedebc.ufma.br:8080/bitstream/tede/3354/2/ALEXANDRE-ARA%C3%9AJO.pdf http://tedebc.ufma.br:8080/bitstream/tede/3354/1/license.txt |
bitstream.checksum.fl_str_mv |
a1af8c4ad2f3a8f9a94d9dd60e356637 97eeade1fce43278e63fe063657f8083 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFMA - Universidade Federal do Maranhão (UFMA) |
repository.mail.fl_str_mv |
repositorio@ufma.br||repositorio@ufma.br |
_version_ |
1809926198302605312 |