Construção de um pipeline de dados para o Sistema Alerta Rio utilizando Knime Analytics Platform

Detalhes bibliográficos
Autor(a) principal: Germano, Vinicius Tavares Martins
Data de Publicação: 2023
Outros Autores: vinicius.tm.germano@gmail.com
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UERJ
Texto Completo: http://www.bdtd.uerj.br/handle/1/20703
Resumo: The present work is framed within the Open Science paradigm, which, catalyzed by the development of digital technologies, advocates for scientific sharing and collaboration. In this context, open government data are recognized as relevant research inputs. The Sistema Alerta Rio provides meteorological and rainfall data for the municipality of Rio de Janeiro, albeit without proper data structuring. This study employed Data Engineering techniques using Knime software, with the goal of developing a pipeline for integration, cleaning and analysis of these data, following principles of reproducibility, rigor and transparency espoused by Open Science. The curated data were consolidated into a new database (Data Staging) and made available in the Mendeley Data repository. The developed database can be used as a source for future studies, for interpretation and discussion of results, as well as for new processing steps and integration with other data sources, enabling machine learning applications.
id UERJ_55c65542589f51e0b8d8cda99f72b771
oai_identifier_str oai:www.bdtd.uerj.br:1/20703
network_acronym_str UERJ
network_name_str Biblioteca Digital de Teses e Dissertações da UERJ
repository_id_str 2903
spelling Pereira, Ronaldo Figueiró Portellahttp://lattes.cnpq.br/5561603703829476Cardoso, Alexander MachadoAmoretty, Paulo Roberto dehttp://lattes.cnpq.br/5565290739655658Germano, Vinicius Tavares Martinsvinicius.tm.germano@gmail.com2023-11-29T15:31:24Z2023-10-31GERMANO, Vinicius Tavares Martins. Construção de um pipeline de dados para o Sistema Alerta Rio utilizando Knime Analytics Platform. 2023. 69 f. Dissertação (Mestrado Profissional em Ciência e Tecnologia Ambiental) - Faculdade de Ciências Biológicas e Saúde, Universidade do Estado do Rio de Janeiro, Rio de Janeiro, 2023.http://www.bdtd.uerj.br/handle/1/20703The present work is framed within the Open Science paradigm, which, catalyzed by the development of digital technologies, advocates for scientific sharing and collaboration. In this context, open government data are recognized as relevant research inputs. The Sistema Alerta Rio provides meteorological and rainfall data for the municipality of Rio de Janeiro, albeit without proper data structuring. This study employed Data Engineering techniques using Knime software, with the goal of developing a pipeline for integration, cleaning and analysis of these data, following principles of reproducibility, rigor and transparency espoused by Open Science. The curated data were consolidated into a new database (Data Staging) and made available in the Mendeley Data repository. The developed database can be used as a source for future studies, for interpretation and discussion of results, as well as for new processing steps and integration with other data sources, enabling machine learning applications.O presente trabalho está inserido no paradigma da Ciência Aberta, o qual, impulsionado pelo desenvolvimento de tecnologias digitais, preconiza o compartilhamento e a colaboração científica. Nesse contexto, dados governamentais abertos são reconhecidos como relevantes insumos para pesquisa. O Sistema Alerta Rio disponibiliza dados meteorológicos e pluviométricos do município do Rio de Janeiro, porém sem uma estruturação adequada. Este estudo empregou técnicas de Engenharia de Dados utilizando o software Knime, com o objetivo de desenvolver um pipeline para integração, limpeza e análise desses dados, seguindo princípios de reprodutibilidade, rigor e transparência preconizados pela Ciência Aberta. Os dados foram consolidados em um novo banco de dados (Data Staging) e disponibilizados no repositório Mendeley Data. O banco de dados desenvolvido poderá ser utilizado como fonte para estudos futuros, para interpretação e discussão de resultados, bem como para novas etapas de processamento e integração com outras fontes de dados, viabilizando aplicações de aprendizado de máquina (Machine Learning).Submitted by Joice CZO (joicetosky@yahoo.com.br) on 2023-11-29T15:31:24Z No. of bitstreams: 1 Dissertação Vinicius Tavares Martins Germano Completa.pdf: 4353730 bytes, checksum: 56922fefdc085f91957b141a0efdc023 (MD5)Made available in DSpace on 2023-11-29T15:31:24Z (GMT). No. of bitstreams: 1 Dissertação Vinicius Tavares Martins Germano Completa.pdf: 4353730 bytes, checksum: 56922fefdc085f91957b141a0efdc023 (MD5) Previous issue date: 2023-10-31application/pdfporUniversidade do Estado do Rio de JaneiroPrograma de Pós-Graduação em Ciência e Tecnologia AmbientalUERJBrasilCentro Biomédico::Faculdade de Ciências Biológicas e SaúdeRio Alert SystemBig DataPipelineOpen DataSistema Alerta RioDados AbertosBig DataPipelineCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOConstrução de um pipeline de dados para o Sistema Alerta Rio utilizando Knime Analytics PlatformBuilding a data pipeline for the Alerta Rio System using Knime Analytics Platforminfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UERJinstname:Universidade do Estado do Rio de Janeiro (UERJ)instacron:UERJORIGINALDissertação - Vinicius Tavares Martins Germano - 2023 - Completa.pdfDissertação - Vinicius Tavares Martins Germano - 2023 - Completa.pdfapplication/pdf4353730http://www.bdtd.uerj.br/bitstream/1/20703/2/Disserta%C3%A7%C3%A3o+-+Vinicius+Tavares+Martins+Germano+-+2023+-+Completa.pdf56922fefdc085f91957b141a0efdc023MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82123http://www.bdtd.uerj.br/bitstream/1/20703/1/license.txte5502652da718045d7fcd832b79fca29MD511/207032024-02-26 15:52:52.479oai:www.bdtd.uerj.br:1/20703Tk9UQTogTElDRU7Dh0EgUkVERSBTSVJJVVMKRXN0YSBsaWNlbsOnYSBkZSBleGVtcGxvIMOpIGZvcm5lY2lkYSBhcGVuYXMgcGFyYSBmaW5zIGluZm9ybWF0aXZvcy4KCkxJQ0VOw4dBIERFIERJU1RSSUJVScOHw4NPIE7Dg08tRVhDTFVTSVZBCgpDb20gYSBhcHJlc2VudGHDp8OjbyBkZXN0YSBsaWNlbsOnYSwgdm9jw6ogKG8gYXV0b3IgKGVzKSBvdSBvIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yKSBjb25jZWRlIMOgIFVuaXZlcnNpZGFkZSAKZG8gRXN0YWRvIGRvIFJpbyBkZSBKYW5laXJvIChVRVJKKSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUgcmVwcm9kdXppciwgIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pLCBlL291IApkaXN0cmlidWlyIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0csO0bmljbyBlIAplbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KClZvY8OqIGNvbmNvcmRhIHF1ZSBhIFVFUkogcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAKcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBhIFVFUkogcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIGEgc3VhIHRlc2Ugb3UgCmRpc3NlcnRhw6fDo28gcGFyYSBmaW5zIGRlIHNlZ3VyYW7Dp2EsIGJhY2stdXAgZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogZGVjbGFyYSBxdWUgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIHZvY8OqIHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIApuZXN0YSBsaWNlbsOnYS4gVm9jw6ogdGFtYsOpbSBkZWNsYXJhIHF1ZSBvIGRlcMOzc2l0byBkYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIG7Do28sIHF1ZSBzZWphIGRlIHNldSAKY29uaGVjaW1lbnRvLCBpbmZyaW5nZSBkaXJlaXRvcyBhdXRvcmFpcyBkZSBuaW5ndcOpbS4KCkNhc28gYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIGNvbnRlbmhhIG1hdGVyaWFsIHF1ZSB2b2PDqiBuw6NvIHBvc3N1aSBhIHRpdHVsYXJpZGFkZSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMsIHZvY8OqIApkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgw6AgVUVSSiBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgCmlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIG91IG5vIGNvbnRlw7pkbyBkYSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gb3JhIGRlcG9zaXRhZGEuCgpDQVNPIEEgVEVTRSBPVSBESVNTRVJUQcOHw4NPIE9SQSBERVBPU0lUQURBIFRFTkhBIFNJRE8gUkVTVUxUQURPIERFIFVNIFBBVFJPQ8ONTklPIE9VIApBUE9JTyBERSBVTUEgQUfDik5DSUEgREUgRk9NRU5UTyBPVSBPVVRSTyBPUkdBTklTTU8gUVVFIE7Dg08gU0VKQSBFU1RBClVOSVZFUlNJREFERSwgVk9Dw4ogREVDTEFSQSBRVUUgUkVTUEVJVE9VIFRPRE9TIEUgUVVBSVNRVUVSIERJUkVJVE9TIERFIFJFVklTw4NPIENPTU8gClRBTULDiU0gQVMgREVNQUlTIE9CUklHQcOHw5VFUyBFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKQSBVbml2ZXJzaWRhZGUgZG8gRXN0YWRvIGRvIFJpbyBkZSBKYW5laXJvIChVRVJKKSBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lIChzKSBvdSBvKHMpIG5vbWUocykgZG8ocykgCmRldGVudG9yKGVzKSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzIApjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgo=Biblioteca Digital de Teses e Dissertaçõeshttp://www.bdtd.uerj.br/PUBhttps://www.bdtd.uerj.br:8443/oai/requestbdtd.suporte@uerj.bropendoar:29032024-02-26T18:52:52Biblioteca Digital de Teses e Dissertações da UERJ - Universidade do Estado do Rio de Janeiro (UERJ)false
dc.title.por.fl_str_mv Construção de um pipeline de dados para o Sistema Alerta Rio utilizando Knime Analytics Platform
dc.title.alternative.eng.fl_str_mv Building a data pipeline for the Alerta Rio System using Knime Analytics Platform
title Construção de um pipeline de dados para o Sistema Alerta Rio utilizando Knime Analytics Platform
spellingShingle Construção de um pipeline de dados para o Sistema Alerta Rio utilizando Knime Analytics Platform
Germano, Vinicius Tavares Martins
Rio Alert System
Big Data
Pipeline
Open Data
Sistema Alerta Rio
Dados Abertos
Big Data
Pipeline
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
title_short Construção de um pipeline de dados para o Sistema Alerta Rio utilizando Knime Analytics Platform
title_full Construção de um pipeline de dados para o Sistema Alerta Rio utilizando Knime Analytics Platform
title_fullStr Construção de um pipeline de dados para o Sistema Alerta Rio utilizando Knime Analytics Platform
title_full_unstemmed Construção de um pipeline de dados para o Sistema Alerta Rio utilizando Knime Analytics Platform
title_sort Construção de um pipeline de dados para o Sistema Alerta Rio utilizando Knime Analytics Platform
author Germano, Vinicius Tavares Martins
author_facet Germano, Vinicius Tavares Martins
vinicius.tm.germano@gmail.com
author_role author
author2 vinicius.tm.germano@gmail.com
author2_role author
dc.contributor.advisor1.fl_str_mv Pereira, Ronaldo Figueiró Portella
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/5561603703829476
dc.contributor.referee1.fl_str_mv Cardoso, Alexander Machado
dc.contributor.referee2.fl_str_mv Amoretty, Paulo Roberto de
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/5565290739655658
dc.contributor.author.fl_str_mv Germano, Vinicius Tavares Martins
vinicius.tm.germano@gmail.com
contributor_str_mv Pereira, Ronaldo Figueiró Portella
Cardoso, Alexander Machado
Amoretty, Paulo Roberto de
dc.subject.eng.fl_str_mv Rio Alert System
Big Data
Pipeline
Open Data
topic Rio Alert System
Big Data
Pipeline
Open Data
Sistema Alerta Rio
Dados Abertos
Big Data
Pipeline
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
dc.subject.por.fl_str_mv Sistema Alerta Rio
Dados Abertos
Big Data
Pipeline
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
description The present work is framed within the Open Science paradigm, which, catalyzed by the development of digital technologies, advocates for scientific sharing and collaboration. In this context, open government data are recognized as relevant research inputs. The Sistema Alerta Rio provides meteorological and rainfall data for the municipality of Rio de Janeiro, albeit without proper data structuring. This study employed Data Engineering techniques using Knime software, with the goal of developing a pipeline for integration, cleaning and analysis of these data, following principles of reproducibility, rigor and transparency espoused by Open Science. The curated data were consolidated into a new database (Data Staging) and made available in the Mendeley Data repository. The developed database can be used as a source for future studies, for interpretation and discussion of results, as well as for new processing steps and integration with other data sources, enabling machine learning applications.
publishDate 2023
dc.date.accessioned.fl_str_mv 2023-11-29T15:31:24Z
dc.date.issued.fl_str_mv 2023-10-31
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv GERMANO, Vinicius Tavares Martins. Construção de um pipeline de dados para o Sistema Alerta Rio utilizando Knime Analytics Platform. 2023. 69 f. Dissertação (Mestrado Profissional em Ciência e Tecnologia Ambiental) - Faculdade de Ciências Biológicas e Saúde, Universidade do Estado do Rio de Janeiro, Rio de Janeiro, 2023.
dc.identifier.uri.fl_str_mv http://www.bdtd.uerj.br/handle/1/20703
identifier_str_mv GERMANO, Vinicius Tavares Martins. Construção de um pipeline de dados para o Sistema Alerta Rio utilizando Knime Analytics Platform. 2023. 69 f. Dissertação (Mestrado Profissional em Ciência e Tecnologia Ambiental) - Faculdade de Ciências Biológicas e Saúde, Universidade do Estado do Rio de Janeiro, Rio de Janeiro, 2023.
url http://www.bdtd.uerj.br/handle/1/20703
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade do Estado do Rio de Janeiro
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência e Tecnologia Ambiental
dc.publisher.initials.fl_str_mv UERJ
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Centro Biomédico::Faculdade de Ciências Biológicas e Saúde
publisher.none.fl_str_mv Universidade do Estado do Rio de Janeiro
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UERJ
instname:Universidade do Estado do Rio de Janeiro (UERJ)
instacron:UERJ
instname_str Universidade do Estado do Rio de Janeiro (UERJ)
instacron_str UERJ
institution UERJ
reponame_str Biblioteca Digital de Teses e Dissertações da UERJ
collection Biblioteca Digital de Teses e Dissertações da UERJ
bitstream.url.fl_str_mv http://www.bdtd.uerj.br/bitstream/1/20703/2/Disserta%C3%A7%C3%A3o+-+Vinicius+Tavares+Martins+Germano+-+2023+-+Completa.pdf
http://www.bdtd.uerj.br/bitstream/1/20703/1/license.txt
bitstream.checksum.fl_str_mv 56922fefdc085f91957b141a0efdc023
e5502652da718045d7fcd832b79fca29
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UERJ - Universidade do Estado do Rio de Janeiro (UERJ)
repository.mail.fl_str_mv bdtd.suporte@uerj.br
_version_ 1792352391552565248