Ensembles de alto desempenho do algoritmo Online Sequential Extreme Learning Machine para regressão e previsão de séries temporais

Detalhes bibliográficos
Autor(a) principal: Grim, Luís Fernando Lopes, 1987-
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
Texto Completo: https://hdl.handle.net/20.500.12733/1634538
Resumo: Orientador: André Leon Sampaio Gradvohl
id UNICAMP-30_ebd684ac4ad4b52716f569135331ae48
oai_identifier_str oai::1060255
network_acronym_str UNICAMP-30
network_name_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository_id_str
spelling Ensembles de alto desempenho do algoritmo Online Sequential Extreme Learning Machine para regressão e previsão de séries temporaisHigh-performance ensembles of the Online Sequential Extreme Learning Machine algorithm for regression and time series forecastingComputação de alto desempenhoAprendizado de máquinaAnálise de séries temporaisHigh-performance computingMachine learningTime-series analysisOrientador: André Leon Sampaio GradvohlDissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de TecnologiaResumo: As ferramentas baseadas em aprendizado de máquina têm sido utilizadas para previsão em séries temporais, devido à sua capacidade de identificar relações nos conjuntos de dados sem serem programadas explicitamente para isto. Algumas séries temporais podem ser caracterizadas como fluxos de dados, e consequentemente podem apresentar desvios de conceito, o que traz alguns desafios a mais para as técnicas tradicionais de aprendizado de máquina. A utilização de técnicas de aprendizado online, como os algoritmos e ensembles derivados do Online Sequential Extreme Learning Machine são adequados para previsão em fluxo de dados com desvios de conceito. No entanto, as previsões baseadas em fluxos de dados frequentemente possuem uma séria restrição relacionada ao tempo de execução dos algoritmos, devido à alta taxa de entrada das amostras. O objetivo deste trabalho foi verificar as acelerações no tempo de execução, proporcionadas pela aplicação de técnicas de computação de alto desempenho no algoritmo Online Sequential Extreme Learning Machine e em três ensembles que o utilizam como base, quando comparadas às respectivas abordagens convencionais. Para tanto, neste trabalho são propostas versões de alto desempenho implementadas em Linguagem C com a biblioteca Intel MKL e com o padrão MPI. A Intel MKL fornece funções que exploram os recursos multithread em processadores com vários núcleos, o que também expande o paralelismo para arquiteturas de multiprocessadores. O MPI permite paralelizar as tarefas com memória distribuída em vários processos, que podem ser alocados em um único nó computacional ou distribuídos por vários nós. Em resumo, a proposta deste trabalho consiste em uma paralelização de dois níveis, onde cada modelo do ensemble é alocado em um processo MPI e as funções internas de cada modelo são paralelizadas em um conjunto de threads por meio da biblioteca Intel MKL. Para os experimentos, foi utilizado um conjunto de dados sintético e outro real com desvios de conceito. Cada conjunto possui em torno de 175.000 instâncias contendo entre 6 e 10 atributos, e um fluxo online foi simulado com cerca de 170.000 instâncias. Os resultados experimentais mostraram que, em geral, os ensembles de alto desempenho melhoraram o tempo de execução, quando comparados com sua versão serial, com desempenho até 10 vezes mais rápido, mantendo a acurácia das previsões. Os testes foram realizados em três ambientes de alto desempenho distintos e também num ambiente convencional simulando um desktop ou um notebookAbstract: Tools based on machine learning have been used for time series forecasting because of their ability to identify relationships in data sets without being explicitly programmed for it. Some time series can be characterized as data streams, and consequently can present concept drifts, which brings some additional challenges to the traditional techniques of machine learning. The use of online learning techniques, such as algorithms and ensembles derived from the Online Sequential Extreme Learning Machine, are suitable for forecasting data streams with concept drifts. Nevertheless, data streams forecasting often have a serious constraint related to the execution time of the algorithms due to the high incoming samples rate. The objective of this work was to verify the accelerations in the execution time, provided by the adoption of high-performance computing techniques in the Online Sequential Extreme Learning Machine algorithm and in three ensembles that use it as a base, when compared to the respective conventional approaches. For this purpose, we proposed high-performance versions implemented in C programming language with the Intel MKL library and the MPI standard. Intel MKL provides functions that explore the multithread features in multicore CPUs, which expands the parallelism to multiprocessors architectures. MPI allows us to parallelize tasks with distributed memory on several processes, which can be allocated within a single computational node, or distributed over several nodes. In summary, our proposal consists of a two-level parallelization, where we allocated each ensemble model into an MPI process, and we parallelized the internal functions of each model in a set of threads through Intel MKL library. For the experiments, we used a synthetic and a real dataset with concept drifts. Each dataset has around 175,000 instances containing between 6 and 10 attributes, and an online data stream has been simulated with about 170,000 instances. Experimental results showed that, in general, high-performance ensembles improved execution time when compared with its serial version, performing up to 10-fold faster, maintaining the predictions' accuracy. The tests were performed in three distinct high-performance environments and also in a conventional environment simulating a desktop or a notebookMestradoSistemas de Informação e ComunicaçãoMestre em Tecnologia[s.n.]Gradvohl, André Leon Sampaio, 1973-Ricarte, Ivan Luiz MarquesSousa, Elaine Parros Machado deUniversidade Estadual de Campinas (UNICAMP). Faculdade de TecnologiaPrograma de Pós-Graduação em TecnologiaUNIVERSIDADE ESTADUAL DE CAMPINASGrim, Luís Fernando Lopes, 1987-20182018-08-22T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf1 recurso online (76 p.) : il., digital, arquivo PDF.https://hdl.handle.net/20.500.12733/1634538GRIM, Luís Fernando Lopes. Ensembles de alto desempenho do algoritmo Online Sequential Extreme Learning Machine para regressão e previsão de séries temporais. 2018. 1 recurso online (76 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Tecnologia, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1634538. Acesso em: 3 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/1060255Requisitos do sistema: Software para leitura de arquivo em PDFporreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2018-10-19T16:20:22Zoai::1060255Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2018-10-19T16:20:22Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv Ensembles de alto desempenho do algoritmo Online Sequential Extreme Learning Machine para regressão e previsão de séries temporais
High-performance ensembles of the Online Sequential Extreme Learning Machine algorithm for regression and time series forecasting
title Ensembles de alto desempenho do algoritmo Online Sequential Extreme Learning Machine para regressão e previsão de séries temporais
spellingShingle Ensembles de alto desempenho do algoritmo Online Sequential Extreme Learning Machine para regressão e previsão de séries temporais
Grim, Luís Fernando Lopes, 1987-
Computação de alto desempenho
Aprendizado de máquina
Análise de séries temporais
High-performance computing
Machine learning
Time-series analysis
title_short Ensembles de alto desempenho do algoritmo Online Sequential Extreme Learning Machine para regressão e previsão de séries temporais
title_full Ensembles de alto desempenho do algoritmo Online Sequential Extreme Learning Machine para regressão e previsão de séries temporais
title_fullStr Ensembles de alto desempenho do algoritmo Online Sequential Extreme Learning Machine para regressão e previsão de séries temporais
title_full_unstemmed Ensembles de alto desempenho do algoritmo Online Sequential Extreme Learning Machine para regressão e previsão de séries temporais
title_sort Ensembles de alto desempenho do algoritmo Online Sequential Extreme Learning Machine para regressão e previsão de séries temporais
author Grim, Luís Fernando Lopes, 1987-
author_facet Grim, Luís Fernando Lopes, 1987-
author_role author
dc.contributor.none.fl_str_mv Gradvohl, André Leon Sampaio, 1973-
Ricarte, Ivan Luiz Marques
Sousa, Elaine Parros Machado de
Universidade Estadual de Campinas (UNICAMP). Faculdade de Tecnologia
Programa de Pós-Graduação em Tecnologia
UNIVERSIDADE ESTADUAL DE CAMPINAS
dc.contributor.author.fl_str_mv Grim, Luís Fernando Lopes, 1987-
dc.subject.por.fl_str_mv Computação de alto desempenho
Aprendizado de máquina
Análise de séries temporais
High-performance computing
Machine learning
Time-series analysis
topic Computação de alto desempenho
Aprendizado de máquina
Análise de séries temporais
High-performance computing
Machine learning
Time-series analysis
description Orientador: André Leon Sampaio Gradvohl
publishDate 2018
dc.date.none.fl_str_mv 2018
2018-08-22T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/20.500.12733/1634538
GRIM, Luís Fernando Lopes. Ensembles de alto desempenho do algoritmo Online Sequential Extreme Learning Machine para regressão e previsão de séries temporais. 2018. 1 recurso online (76 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Tecnologia, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1634538. Acesso em: 3 set. 2024.
url https://hdl.handle.net/20.500.12733/1634538
identifier_str_mv GRIM, Luís Fernando Lopes. Ensembles de alto desempenho do algoritmo Online Sequential Extreme Learning Machine para regressão e previsão de séries temporais. 2018. 1 recurso online (76 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Tecnologia, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1634538. Acesso em: 3 set. 2024.
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://repositorio.unicamp.br/acervo/detalhe/1060255
Requisitos do sistema: Software para leitura de arquivo em PDF
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
1 recurso online (76 p.) : il., digital, arquivo PDF.
dc.publisher.none.fl_str_mv [s.n.]
publisher.none.fl_str_mv [s.n.]
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
instname:Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
instname_str Universidade Estadual de Campinas (UNICAMP)
instacron_str UNICAMP
institution UNICAMP
reponame_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
collection Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv sbubd@unicamp.br
_version_ 1809189131347034112