Construção de um pipeline de dados para o Sistema Alerta Rio utilizando Knime Analytics Platform
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Outros Autores: | |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UERJ |
Texto Completo: | http://www.bdtd.uerj.br/handle/1/20703 |
Resumo: | The present work is framed within the Open Science paradigm, which, catalyzed by the development of digital technologies, advocates for scientific sharing and collaboration. In this context, open government data are recognized as relevant research inputs. The Sistema Alerta Rio provides meteorological and rainfall data for the municipality of Rio de Janeiro, albeit without proper data structuring. This study employed Data Engineering techniques using Knime software, with the goal of developing a pipeline for integration, cleaning and analysis of these data, following principles of reproducibility, rigor and transparency espoused by Open Science. The curated data were consolidated into a new database (Data Staging) and made available in the Mendeley Data repository. The developed database can be used as a source for future studies, for interpretation and discussion of results, as well as for new processing steps and integration with other data sources, enabling machine learning applications. |
id |
UERJ_55c65542589f51e0b8d8cda99f72b771 |
---|---|
oai_identifier_str |
oai:www.bdtd.uerj.br:1/20703 |
network_acronym_str |
UERJ |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UERJ |
repository_id_str |
2903 |
spelling |
Pereira, Ronaldo Figueiró Portellahttp://lattes.cnpq.br/5561603703829476Cardoso, Alexander MachadoAmoretty, Paulo Roberto dehttp://lattes.cnpq.br/5565290739655658Germano, Vinicius Tavares Martinsvinicius.tm.germano@gmail.com2023-11-29T15:31:24Z2023-10-31GERMANO, Vinicius Tavares Martins. Construção de um pipeline de dados para o Sistema Alerta Rio utilizando Knime Analytics Platform. 2023. 69 f. Dissertação (Mestrado Profissional em Ciência e Tecnologia Ambiental) - Faculdade de Ciências Biológicas e Saúde, Universidade do Estado do Rio de Janeiro, Rio de Janeiro, 2023.http://www.bdtd.uerj.br/handle/1/20703The present work is framed within the Open Science paradigm, which, catalyzed by the development of digital technologies, advocates for scientific sharing and collaboration. In this context, open government data are recognized as relevant research inputs. The Sistema Alerta Rio provides meteorological and rainfall data for the municipality of Rio de Janeiro, albeit without proper data structuring. This study employed Data Engineering techniques using Knime software, with the goal of developing a pipeline for integration, cleaning and analysis of these data, following principles of reproducibility, rigor and transparency espoused by Open Science. The curated data were consolidated into a new database (Data Staging) and made available in the Mendeley Data repository. The developed database can be used as a source for future studies, for interpretation and discussion of results, as well as for new processing steps and integration with other data sources, enabling machine learning applications.O presente trabalho está inserido no paradigma da Ciência Aberta, o qual, impulsionado pelo desenvolvimento de tecnologias digitais, preconiza o compartilhamento e a colaboração científica. Nesse contexto, dados governamentais abertos são reconhecidos como relevantes insumos para pesquisa. O Sistema Alerta Rio disponibiliza dados meteorológicos e pluviométricos do município do Rio de Janeiro, porém sem uma estruturação adequada. Este estudo empregou técnicas de Engenharia de Dados utilizando o software Knime, com o objetivo de desenvolver um pipeline para integração, limpeza e análise desses dados, seguindo princípios de reprodutibilidade, rigor e transparência preconizados pela Ciência Aberta. Os dados foram consolidados em um novo banco de dados (Data Staging) e disponibilizados no repositório Mendeley Data. O banco de dados desenvolvido poderá ser utilizado como fonte para estudos futuros, para interpretação e discussão de resultados, bem como para novas etapas de processamento e integração com outras fontes de dados, viabilizando aplicações de aprendizado de máquina (Machine Learning).Submitted by Joice CZO (joicetosky@yahoo.com.br) on 2023-11-29T15:31:24Z No. of bitstreams: 1 Dissertação Vinicius Tavares Martins Germano Completa.pdf: 4353730 bytes, checksum: 56922fefdc085f91957b141a0efdc023 (MD5)Made available in DSpace on 2023-11-29T15:31:24Z (GMT). No. of bitstreams: 1 Dissertação Vinicius Tavares Martins Germano Completa.pdf: 4353730 bytes, checksum: 56922fefdc085f91957b141a0efdc023 (MD5) Previous issue date: 2023-10-31application/pdfporUniversidade do Estado do Rio de JaneiroPrograma de Pós-Graduação em Ciência e Tecnologia AmbientalUERJBrasilCentro Biomédico::Faculdade de Ciências Biológicas e SaúdeRio Alert SystemBig DataPipelineOpen DataSistema Alerta RioDados AbertosBig DataPipelineCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOConstrução de um pipeline de dados para o Sistema Alerta Rio utilizando Knime Analytics PlatformBuilding a data pipeline for the Alerta Rio System using Knime Analytics Platforminfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UERJinstname:Universidade do Estado do Rio de Janeiro (UERJ)instacron:UERJORIGINALDissertação - Vinicius Tavares Martins Germano - 2023 - Completa.pdfDissertação - Vinicius Tavares Martins Germano - 2023 - Completa.pdfapplication/pdf4353730http://www.bdtd.uerj.br/bitstream/1/20703/2/Disserta%C3%A7%C3%A3o+-+Vinicius+Tavares+Martins+Germano+-+2023+-+Completa.pdf56922fefdc085f91957b141a0efdc023MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82123http://www.bdtd.uerj.br/bitstream/1/20703/1/license.txte5502652da718045d7fcd832b79fca29MD511/207032024-02-26 15:52:52.479oai:www.bdtd.uerj.br:1/20703Tk9UQTogTElDRU7Dh0EgUkVERSBTSVJJVVMKRXN0YSBsaWNlbsOnYSBkZSBleGVtcGxvIMOpIGZvcm5lY2lkYSBhcGVuYXMgcGFyYSBmaW5zIGluZm9ybWF0aXZvcy4KCkxJQ0VOw4dBIERFIERJU1RSSUJVScOHw4NPIE7Dg08tRVhDTFVTSVZBCgpDb20gYSBhcHJlc2VudGHDp8OjbyBkZXN0YSBsaWNlbsOnYSwgdm9jw6ogKG8gYXV0b3IgKGVzKSBvdSBvIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yKSBjb25jZWRlIMOgIFVuaXZlcnNpZGFkZSAKZG8gRXN0YWRvIGRvIFJpbyBkZSBKYW5laXJvIChVRVJKKSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUgcmVwcm9kdXppciwgIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pLCBlL291IApkaXN0cmlidWlyIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0csO0bmljbyBlIAplbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KClZvY8OqIGNvbmNvcmRhIHF1ZSBhIFVFUkogcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAKcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBhIFVFUkogcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIGEgc3VhIHRlc2Ugb3UgCmRpc3NlcnRhw6fDo28gcGFyYSBmaW5zIGRlIHNlZ3VyYW7Dp2EsIGJhY2stdXAgZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogZGVjbGFyYSBxdWUgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIHZvY8OqIHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIApuZXN0YSBsaWNlbsOnYS4gVm9jw6ogdGFtYsOpbSBkZWNsYXJhIHF1ZSBvIGRlcMOzc2l0byBkYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIG7Do28sIHF1ZSBzZWphIGRlIHNldSAKY29uaGVjaW1lbnRvLCBpbmZyaW5nZSBkaXJlaXRvcyBhdXRvcmFpcyBkZSBuaW5ndcOpbS4KCkNhc28gYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIGNvbnRlbmhhIG1hdGVyaWFsIHF1ZSB2b2PDqiBuw6NvIHBvc3N1aSBhIHRpdHVsYXJpZGFkZSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMsIHZvY8OqIApkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgw6AgVUVSSiBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgCmlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIG91IG5vIGNvbnRlw7pkbyBkYSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gb3JhIGRlcG9zaXRhZGEuCgpDQVNPIEEgVEVTRSBPVSBESVNTRVJUQcOHw4NPIE9SQSBERVBPU0lUQURBIFRFTkhBIFNJRE8gUkVTVUxUQURPIERFIFVNIFBBVFJPQ8ONTklPIE9VIApBUE9JTyBERSBVTUEgQUfDik5DSUEgREUgRk9NRU5UTyBPVSBPVVRSTyBPUkdBTklTTU8gUVVFIE7Dg08gU0VKQSBFU1RBClVOSVZFUlNJREFERSwgVk9Dw4ogREVDTEFSQSBRVUUgUkVTUEVJVE9VIFRPRE9TIEUgUVVBSVNRVUVSIERJUkVJVE9TIERFIFJFVklTw4NPIENPTU8gClRBTULDiU0gQVMgREVNQUlTIE9CUklHQcOHw5VFUyBFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKQSBVbml2ZXJzaWRhZGUgZG8gRXN0YWRvIGRvIFJpbyBkZSBKYW5laXJvIChVRVJKKSBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lIChzKSBvdSBvKHMpIG5vbWUocykgZG8ocykgCmRldGVudG9yKGVzKSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzIApjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgo=Biblioteca Digital de Teses e Dissertaçõeshttp://www.bdtd.uerj.br/PUBhttps://www.bdtd.uerj.br:8443/oai/requestbdtd.suporte@uerj.bropendoar:29032024-02-26T18:52:52Biblioteca Digital de Teses e Dissertações da UERJ - Universidade do Estado do Rio de Janeiro (UERJ)false |
dc.title.por.fl_str_mv |
Construção de um pipeline de dados para o Sistema Alerta Rio utilizando Knime Analytics Platform |
dc.title.alternative.eng.fl_str_mv |
Building a data pipeline for the Alerta Rio System using Knime Analytics Platform |
title |
Construção de um pipeline de dados para o Sistema Alerta Rio utilizando Knime Analytics Platform |
spellingShingle |
Construção de um pipeline de dados para o Sistema Alerta Rio utilizando Knime Analytics Platform Germano, Vinicius Tavares Martins Rio Alert System Big Data Pipeline Open Data Sistema Alerta Rio Dados Abertos Big Data Pipeline CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
title_short |
Construção de um pipeline de dados para o Sistema Alerta Rio utilizando Knime Analytics Platform |
title_full |
Construção de um pipeline de dados para o Sistema Alerta Rio utilizando Knime Analytics Platform |
title_fullStr |
Construção de um pipeline de dados para o Sistema Alerta Rio utilizando Knime Analytics Platform |
title_full_unstemmed |
Construção de um pipeline de dados para o Sistema Alerta Rio utilizando Knime Analytics Platform |
title_sort |
Construção de um pipeline de dados para o Sistema Alerta Rio utilizando Knime Analytics Platform |
author |
Germano, Vinicius Tavares Martins |
author_facet |
Germano, Vinicius Tavares Martins vinicius.tm.germano@gmail.com |
author_role |
author |
author2 |
vinicius.tm.germano@gmail.com |
author2_role |
author |
dc.contributor.advisor1.fl_str_mv |
Pereira, Ronaldo Figueiró Portella |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/5561603703829476 |
dc.contributor.referee1.fl_str_mv |
Cardoso, Alexander Machado |
dc.contributor.referee2.fl_str_mv |
Amoretty, Paulo Roberto de |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/5565290739655658 |
dc.contributor.author.fl_str_mv |
Germano, Vinicius Tavares Martins vinicius.tm.germano@gmail.com |
contributor_str_mv |
Pereira, Ronaldo Figueiró Portella Cardoso, Alexander Machado Amoretty, Paulo Roberto de |
dc.subject.eng.fl_str_mv |
Rio Alert System Big Data Pipeline Open Data |
topic |
Rio Alert System Big Data Pipeline Open Data Sistema Alerta Rio Dados Abertos Big Data Pipeline CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
dc.subject.por.fl_str_mv |
Sistema Alerta Rio Dados Abertos Big Data Pipeline |
dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
description |
The present work is framed within the Open Science paradigm, which, catalyzed by the development of digital technologies, advocates for scientific sharing and collaboration. In this context, open government data are recognized as relevant research inputs. The Sistema Alerta Rio provides meteorological and rainfall data for the municipality of Rio de Janeiro, albeit without proper data structuring. This study employed Data Engineering techniques using Knime software, with the goal of developing a pipeline for integration, cleaning and analysis of these data, following principles of reproducibility, rigor and transparency espoused by Open Science. The curated data were consolidated into a new database (Data Staging) and made available in the Mendeley Data repository. The developed database can be used as a source for future studies, for interpretation and discussion of results, as well as for new processing steps and integration with other data sources, enabling machine learning applications. |
publishDate |
2023 |
dc.date.accessioned.fl_str_mv |
2023-11-29T15:31:24Z |
dc.date.issued.fl_str_mv |
2023-10-31 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
GERMANO, Vinicius Tavares Martins. Construção de um pipeline de dados para o Sistema Alerta Rio utilizando Knime Analytics Platform. 2023. 69 f. Dissertação (Mestrado Profissional em Ciência e Tecnologia Ambiental) - Faculdade de Ciências Biológicas e Saúde, Universidade do Estado do Rio de Janeiro, Rio de Janeiro, 2023. |
dc.identifier.uri.fl_str_mv |
http://www.bdtd.uerj.br/handle/1/20703 |
identifier_str_mv |
GERMANO, Vinicius Tavares Martins. Construção de um pipeline de dados para o Sistema Alerta Rio utilizando Knime Analytics Platform. 2023. 69 f. Dissertação (Mestrado Profissional em Ciência e Tecnologia Ambiental) - Faculdade de Ciências Biológicas e Saúde, Universidade do Estado do Rio de Janeiro, Rio de Janeiro, 2023. |
url |
http://www.bdtd.uerj.br/handle/1/20703 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade do Estado do Rio de Janeiro |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência e Tecnologia Ambiental |
dc.publisher.initials.fl_str_mv |
UERJ |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Centro Biomédico::Faculdade de Ciências Biológicas e Saúde |
publisher.none.fl_str_mv |
Universidade do Estado do Rio de Janeiro |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UERJ instname:Universidade do Estado do Rio de Janeiro (UERJ) instacron:UERJ |
instname_str |
Universidade do Estado do Rio de Janeiro (UERJ) |
instacron_str |
UERJ |
institution |
UERJ |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UERJ |
collection |
Biblioteca Digital de Teses e Dissertações da UERJ |
bitstream.url.fl_str_mv |
http://www.bdtd.uerj.br/bitstream/1/20703/2/Disserta%C3%A7%C3%A3o+-+Vinicius+Tavares+Martins+Germano+-+2023+-+Completa.pdf http://www.bdtd.uerj.br/bitstream/1/20703/1/license.txt |
bitstream.checksum.fl_str_mv |
56922fefdc085f91957b141a0efdc023 e5502652da718045d7fcd832b79fca29 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UERJ - Universidade do Estado do Rio de Janeiro (UERJ) |
repository.mail.fl_str_mv |
bdtd.suporte@uerj.br |
_version_ |
1792352391552565248 |