Extração e seleção de características para a classificação eficiente de séries temporais
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFU |
Texto Completo: | https://repositorio.ufu.br/handle/123456789/35084 https://doi.org/10.14393/ufu.di.2022.53 |
Resumo: | As the production of time series increases, so does the need to mine them. Currently one of the most prominent mining tasks has been the time series classification. This task received many publications and solutions mainly focused on classification accuracy. This led to a state of the art specialized in high accuracy results, but also with a high processing time. This characteristic makes the solution usability infeasible for large scale problems. Aiming to obtain both accurate and fast results, this work proposes 4T. It is a dictionary-based algorithm of feature extraction and selection focused on the efficiency of time series classification. The efficiency was proposed in this dissertation as an evaluation metric and was defined as the fraction between score and fitting time of a classification. The results obtained by 4T show an average efficiency higher than the efficiency of the available state-of-the-art results. These results include two scores: accuracy and AUROC. Along with fitting time the scores were calculated by classifying 71 datasets of the UEA & UCR archive. |
id |
UFU_05c8370d9a82eb7c97bf2f9418d1ed16 |
---|---|
oai_identifier_str |
oai:repositorio.ufu.br:123456789/35084 |
network_acronym_str |
UFU |
network_name_str |
Repositório Institucional da UFU |
repository_id_str |
|
spelling |
Extração e seleção de características para a classificação eficiente de séries temporaisFeature extraction and selection for efficient time series classification4TBaseado em dicionárioDictionary-basedClassificação eficienteEfficient classificationEficiênciaEfficiencySéries temporaisTime SeriesTSCComputaçãoComputingCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAOComputaçãoAnálise de séries temporaisAlgorítmos computacionaisAs the production of time series increases, so does the need to mine them. Currently one of the most prominent mining tasks has been the time series classification. This task received many publications and solutions mainly focused on classification accuracy. This led to a state of the art specialized in high accuracy results, but also with a high processing time. This characteristic makes the solution usability infeasible for large scale problems. Aiming to obtain both accurate and fast results, this work proposes 4T. It is a dictionary-based algorithm of feature extraction and selection focused on the efficiency of time series classification. The efficiency was proposed in this dissertation as an evaluation metric and was defined as the fraction between score and fitting time of a classification. The results obtained by 4T show an average efficiency higher than the efficiency of the available state-of-the-art results. These results include two scores: accuracy and AUROC. Along with fitting time the scores were calculated by classifying 71 datasets of the UEA & UCR archive.CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorDissertação (Mestrado)Com o aumento da produção de séries temporais, houve também o aumento da necessidade de minerá-las. Uma das tarefas de mineração que mais ganhou destaque nos últimos anos foi a classificação de séries temporais. Essa tarefa recebeu muitas publicações e soluções que focaram principalmente na acurácia das classificações. Isso levou a um estado da arte especializado em resultados de alta acurácia, mas também com um alto tempo de processamento. Essa particularidade inviabiliza o uso das soluções em problemas reais de maior escala. Com o objetivo de obter resultados tão acurados quanto rápidos, este trabalho propõe o 4T que é um algoritmo de extração e seleção de características baseado em dicionário com foco na eficiência da classificação de séries temporais. A eficiência, proposta nesta dissertação como uma métrica de avaliação, foi definida como a razão entre o score e o tempo de treinamento de uma classificação. Os resultados obtidos pelo 4T mostram uma eficiência média maior que a eficiência dos resultados disponíveis de todo o estado da arte. Esses resultados incluem os scores de acurácia e AUROC e o tempo de treinamento na classificação de 71 datasets do repositório UEA & UCR.Universidade Federal de UberlândiaBrasilPrograma de Pós-graduação em Ciência da ComputaçãoAlbertini, Marcelo Keesehttp://lattes.cnpq.br/1404596833493304Backes, André Ricardohttp://lattes.cnpq.br/8590140337571249Rios, Ricardo Araújohttp://lattes.cnpq.br/0427387583450747Freitas Júnior, Márcio Antônio2022-05-24T18:43:53Z2022-05-24T18:43:53Z2022-01-24info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfFREITAS JÚNIOR, Márcio Antônio. Extração e seleção de características para a classificação eficiente de séries temporais. 2022. 72 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2022. DOI http://doi.org/10.14393/ufu.di.2022.53.https://repositorio.ufu.br/handle/123456789/35084https://doi.org/10.14393/ufu.di.2022.53porhttp://creativecommons.org/licenses/by-nc/3.0/us/info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFUinstname:Universidade Federal de Uberlândia (UFU)instacron:UFU2022-05-25T06:17:40Zoai:repositorio.ufu.br:123456789/35084Repositório InstitucionalONGhttp://repositorio.ufu.br/oai/requestdiinf@dirbi.ufu.bropendoar:2022-05-25T06:17:40Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU)false |
dc.title.none.fl_str_mv |
Extração e seleção de características para a classificação eficiente de séries temporais Feature extraction and selection for efficient time series classification |
title |
Extração e seleção de características para a classificação eficiente de séries temporais |
spellingShingle |
Extração e seleção de características para a classificação eficiente de séries temporais Freitas Júnior, Márcio Antônio 4T Baseado em dicionário Dictionary-based Classificação eficiente Efficient classification Eficiência Efficiency Séries temporais Time Series TSC Computação Computing CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO Computação Análise de séries temporais Algorítmos computacionais |
title_short |
Extração e seleção de características para a classificação eficiente de séries temporais |
title_full |
Extração e seleção de características para a classificação eficiente de séries temporais |
title_fullStr |
Extração e seleção de características para a classificação eficiente de séries temporais |
title_full_unstemmed |
Extração e seleção de características para a classificação eficiente de séries temporais |
title_sort |
Extração e seleção de características para a classificação eficiente de séries temporais |
author |
Freitas Júnior, Márcio Antônio |
author_facet |
Freitas Júnior, Márcio Antônio |
author_role |
author |
dc.contributor.none.fl_str_mv |
Albertini, Marcelo Keese http://lattes.cnpq.br/1404596833493304 Backes, André Ricardo http://lattes.cnpq.br/8590140337571249 Rios, Ricardo Araújo http://lattes.cnpq.br/0427387583450747 |
dc.contributor.author.fl_str_mv |
Freitas Júnior, Márcio Antônio |
dc.subject.por.fl_str_mv |
4T Baseado em dicionário Dictionary-based Classificação eficiente Efficient classification Eficiência Efficiency Séries temporais Time Series TSC Computação Computing CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO Computação Análise de séries temporais Algorítmos computacionais |
topic |
4T Baseado em dicionário Dictionary-based Classificação eficiente Efficient classification Eficiência Efficiency Séries temporais Time Series TSC Computação Computing CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO Computação Análise de séries temporais Algorítmos computacionais |
description |
As the production of time series increases, so does the need to mine them. Currently one of the most prominent mining tasks has been the time series classification. This task received many publications and solutions mainly focused on classification accuracy. This led to a state of the art specialized in high accuracy results, but also with a high processing time. This characteristic makes the solution usability infeasible for large scale problems. Aiming to obtain both accurate and fast results, this work proposes 4T. It is a dictionary-based algorithm of feature extraction and selection focused on the efficiency of time series classification. The efficiency was proposed in this dissertation as an evaluation metric and was defined as the fraction between score and fitting time of a classification. The results obtained by 4T show an average efficiency higher than the efficiency of the available state-of-the-art results. These results include two scores: accuracy and AUROC. Along with fitting time the scores were calculated by classifying 71 datasets of the UEA & UCR archive. |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-05-24T18:43:53Z 2022-05-24T18:43:53Z 2022-01-24 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
FREITAS JÚNIOR, Márcio Antônio. Extração e seleção de características para a classificação eficiente de séries temporais. 2022. 72 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2022. DOI http://doi.org/10.14393/ufu.di.2022.53. https://repositorio.ufu.br/handle/123456789/35084 https://doi.org/10.14393/ufu.di.2022.53 |
identifier_str_mv |
FREITAS JÚNIOR, Márcio Antônio. Extração e seleção de características para a classificação eficiente de séries temporais. 2022. 72 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2022. DOI http://doi.org/10.14393/ufu.di.2022.53. |
url |
https://repositorio.ufu.br/handle/123456789/35084 https://doi.org/10.14393/ufu.di.2022.53 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
http://creativecommons.org/licenses/by-nc/3.0/us/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc/3.0/us/ |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de Uberlândia Brasil Programa de Pós-graduação em Ciência da Computação |
publisher.none.fl_str_mv |
Universidade Federal de Uberlândia Brasil Programa de Pós-graduação em Ciência da Computação |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFU instname:Universidade Federal de Uberlândia (UFU) instacron:UFU |
instname_str |
Universidade Federal de Uberlândia (UFU) |
instacron_str |
UFU |
institution |
UFU |
reponame_str |
Repositório Institucional da UFU |
collection |
Repositório Institucional da UFU |
repository.name.fl_str_mv |
Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU) |
repository.mail.fl_str_mv |
diinf@dirbi.ufu.br |
_version_ |
1805569676850233344 |