Processamento distribuído de grande volume de dados ambientais
Autor(a) principal: | |
---|---|
Data de Publicação: | 2016 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFMT |
Texto Completo: | http://ri.ufmt.br/handle/1/5210 |
Resumo: | The environmental research involves a wide variety of data from different sources that when manipulated require the use of high computational complexity functi- ons. A function that fits on these characteristics is the wavelet transform, which is the transformation of a series of data in different temporal ranges of frequency and time. This calculation generates a high volume of data and requires high processing performance and storage. These characteristics are present in the con- text of Big Data. The objective of this work is to apply parallel and distributed processing technologies in the context of calculation of environmental data using the Apache Hadoop and Apache Spark frameworks. As a methodology, it was applied the wavelet transform into a large volume of rainfall data of about 15 years generated by TRMM mission - Tropical Rainfall Measuring Mission. Tests were done at different settings and environments, comparing the results with the sequential processing and other distributed approach. |
id |
UFMT_5fbb017ea994a91017b61c3ef76c59e9 |
---|---|
oai_identifier_str |
oai:localhost:1/5210 |
network_acronym_str |
UFMT |
network_name_str |
Repositório Institucional da UFMT |
repository_id_str |
|
spelling |
Processamento distribuído de grande volume de dados ambientaisHadoopSparkParalelismoBig dataSatéliteWaveletsPrecipitaçãoCNPQ::CIENCIAS EXATAS E DA TERRA::FISICAHadoopSparkParallelismBig dataSatelliteWaveletsPrecipitationThe environmental research involves a wide variety of data from different sources that when manipulated require the use of high computational complexity functi- ons. A function that fits on these characteristics is the wavelet transform, which is the transformation of a series of data in different temporal ranges of frequency and time. This calculation generates a high volume of data and requires high processing performance and storage. These characteristics are present in the con- text of Big Data. The objective of this work is to apply parallel and distributed processing technologies in the context of calculation of environmental data using the Apache Hadoop and Apache Spark frameworks. As a methodology, it was applied the wavelet transform into a large volume of rainfall data of about 15 years generated by TRMM mission - Tropical Rainfall Measuring Mission. Tests were done at different settings and environments, comparing the results with the sequential processing and other distributed approach.CAPESA pesquisa ambiental envolve uma grande diversidade de dados de diferentes origens que quando manipulados demandam a utilização de funções de alta com- plexidade computacional. Uma função que se enquadra nessas características é a transformada de wavelets, que é a transformação de uma série de dados temporais em diferentes escalas de frequência e tempo. Esse cálculo gera um alto volume de dados e requer elevado poder de processamento e armazenamento, características estas presentes no contexto de Big Data. O objetivo deste trabalho é aplicar técnicas de processamento paralelo e distribuído no contexto do cálculo de da- dos ambientais utilizando os frameworks Apache Hadoop e Apache Spark. Como metodologia, foi aplicada a transformada de wavelets em um grande volume de dados de precipitação de aproximadamente 15 anos gerados pela missão TRMM - Tropical Rainfall Measuring Mission. Foram feitos testes em diferentes configu- rações e ambientes, comparando os resultados com o processamento sequencial e outra abordagem distribuída.Universidade Federal de Mato GrossoBrasilInstituto de Física (IF)UFMT CUC - CuiabáPrograma de Pós-Graduação em Física AmbientalFigueiredo, Josiel Maimone dehttp://lattes.cnpq.br/1242386923227672Figueiredo, Josiel Maimone de568.019.391-49http://lattes.cnpq.br/1242386923227672Gomes, Raphael de Souza Rosa011.912.491-23http://lattes.cnpq.br/7352154839166198568.019.391-49Preti, João Paulo Delgado861.958.401-49http://lattes.cnpq.br/6493065488877740Salles, Ricardo Frederico Figueiredo e2024-02-23T16:56:44Z2016-08-302024-02-23T16:56:44Z2016-02-24info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisSALLES, Ricardo Frederico Figueiredo e. Processamento distribuído de grande volume de dados ambientais. 2016. 49 f. Dissertação (Mestrado em Física Ambiental) - Universidade Federal de Mato Grosso, Instituto de Física, Cuiabá, 2016.http://ri.ufmt.br/handle/1/5210porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFMTinstname:Universidade Federal de Mato Grosso (UFMT)instacron:UFMT2024-02-27T07:02:18Zoai:localhost:1/5210Repositório InstitucionalPUBhttp://ri.ufmt.br/oai/requestjordanbiblio@gmail.comopendoar:2024-02-27T07:02:18Repositório Institucional da UFMT - Universidade Federal de Mato Grosso (UFMT)false |
dc.title.none.fl_str_mv |
Processamento distribuído de grande volume de dados ambientais |
title |
Processamento distribuído de grande volume de dados ambientais |
spellingShingle |
Processamento distribuído de grande volume de dados ambientais Salles, Ricardo Frederico Figueiredo e Hadoop Spark Paralelismo Big data Satélite Wavelets Precipitação CNPQ::CIENCIAS EXATAS E DA TERRA::FISICA Hadoop Spark Parallelism Big data Satellite Wavelets Precipitation |
title_short |
Processamento distribuído de grande volume de dados ambientais |
title_full |
Processamento distribuído de grande volume de dados ambientais |
title_fullStr |
Processamento distribuído de grande volume de dados ambientais |
title_full_unstemmed |
Processamento distribuído de grande volume de dados ambientais |
title_sort |
Processamento distribuído de grande volume de dados ambientais |
author |
Salles, Ricardo Frederico Figueiredo e |
author_facet |
Salles, Ricardo Frederico Figueiredo e |
author_role |
author |
dc.contributor.none.fl_str_mv |
Figueiredo, Josiel Maimone de http://lattes.cnpq.br/1242386923227672 Figueiredo, Josiel Maimone de 568.019.391-49 http://lattes.cnpq.br/1242386923227672 Gomes, Raphael de Souza Rosa 011.912.491-23 http://lattes.cnpq.br/7352154839166198 568.019.391-49 Preti, João Paulo Delgado 861.958.401-49 http://lattes.cnpq.br/6493065488877740 |
dc.contributor.author.fl_str_mv |
Salles, Ricardo Frederico Figueiredo e |
dc.subject.por.fl_str_mv |
Hadoop Spark Paralelismo Big data Satélite Wavelets Precipitação CNPQ::CIENCIAS EXATAS E DA TERRA::FISICA Hadoop Spark Parallelism Big data Satellite Wavelets Precipitation |
topic |
Hadoop Spark Paralelismo Big data Satélite Wavelets Precipitação CNPQ::CIENCIAS EXATAS E DA TERRA::FISICA Hadoop Spark Parallelism Big data Satellite Wavelets Precipitation |
description |
The environmental research involves a wide variety of data from different sources that when manipulated require the use of high computational complexity functi- ons. A function that fits on these characteristics is the wavelet transform, which is the transformation of a series of data in different temporal ranges of frequency and time. This calculation generates a high volume of data and requires high processing performance and storage. These characteristics are present in the con- text of Big Data. The objective of this work is to apply parallel and distributed processing technologies in the context of calculation of environmental data using the Apache Hadoop and Apache Spark frameworks. As a methodology, it was applied the wavelet transform into a large volume of rainfall data of about 15 years generated by TRMM mission - Tropical Rainfall Measuring Mission. Tests were done at different settings and environments, comparing the results with the sequential processing and other distributed approach. |
publishDate |
2016 |
dc.date.none.fl_str_mv |
2016-08-30 2016-02-24 2024-02-23T16:56:44Z 2024-02-23T16:56:44Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
SALLES, Ricardo Frederico Figueiredo e. Processamento distribuído de grande volume de dados ambientais. 2016. 49 f. Dissertação (Mestrado em Física Ambiental) - Universidade Federal de Mato Grosso, Instituto de Física, Cuiabá, 2016. http://ri.ufmt.br/handle/1/5210 |
identifier_str_mv |
SALLES, Ricardo Frederico Figueiredo e. Processamento distribuído de grande volume de dados ambientais. 2016. 49 f. Dissertação (Mestrado em Física Ambiental) - Universidade Federal de Mato Grosso, Instituto de Física, Cuiabá, 2016. |
url |
http://ri.ufmt.br/handle/1/5210 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Mato Grosso Brasil Instituto de Física (IF) UFMT CUC - Cuiabá Programa de Pós-Graduação em Física Ambiental |
publisher.none.fl_str_mv |
Universidade Federal de Mato Grosso Brasil Instituto de Física (IF) UFMT CUC - Cuiabá Programa de Pós-Graduação em Física Ambiental |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMT instname:Universidade Federal de Mato Grosso (UFMT) instacron:UFMT |
instname_str |
Universidade Federal de Mato Grosso (UFMT) |
instacron_str |
UFMT |
institution |
UFMT |
reponame_str |
Repositório Institucional da UFMT |
collection |
Repositório Institucional da UFMT |
repository.name.fl_str_mv |
Repositório Institucional da UFMT - Universidade Federal de Mato Grosso (UFMT) |
repository.mail.fl_str_mv |
jordanbiblio@gmail.com |
_version_ |
1804648534255861760 |