Enhancing citizens on science information quality through rating of data

Detalhes bibliográficos
Autor(a) principal: Nascimento, João António Pinto
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/11144/5297
Resumo: Com o objetivo de automatizar tarefas, muitos classificadores têm sido propostos, com diferentes compromissos entre performance e robustez. Quando se pretende classificar um stream de dados extraídos sobre um processo cujo estado está em constante evolução, o desconhecimento da dinâmica do sistema e informação incorreta dificultam a tarefa de identificar que subconjunto dos dados são confiáveis e devem ser utilizados. Este problema é central em aplicações como a deteção de fogos florestais, presença de lixo nas praias, medições de ruído e poluição nas cidades e outras para as quais os cidadãos sejam chamados a fornecer dados através de sistemas computacionais. Utilizadores mal-intencionados, dados corrompidos por ruído, sensores baratos, entre outros, podem conduzir a erros na deteção. Esta tese visa desenvolver um serviço capaz de detetar anomalias em dados e prever os valores seguintes, tendo em conta o historial. Partindo do pressuposto que os dados serão fornecidos através de uma aplicação mobile para alertas de incêndios florestais e deteção de lixo nas praias, foi criada uma aplicação de backend capaz de suportar o volume expectável de dados bem como executar o seu processamento. A infraestrutura desenvolvida para AWS (Amazon Web Services) contém várias ferramentas de deteção de anomalias e previsão, entre elas o AWS Sagemaker (Ferramenta de machine learning) e o AWS S3 (Amazon Simple Storage Service, armazenamento de objetos). Através das experiências efetuadas foi possível a deteção de anomalias, bem como a previsão de valores futuros, num dataset composto por 22695 entradas de medições de temperatura de um componente interno de uma grande máquina industrial provenientes do Numenta Anomaly Benchmark (NAB).
id RCAP_d33098b17b1d278aa93637050164149b
oai_identifier_str oai:repositorio.ual.pt:11144/5297
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Enhancing citizens on science information quality through rating of dataCitizen CienceCitizen ApplicationAWSAWS SagemakerAWS S3Com o objetivo de automatizar tarefas, muitos classificadores têm sido propostos, com diferentes compromissos entre performance e robustez. Quando se pretende classificar um stream de dados extraídos sobre um processo cujo estado está em constante evolução, o desconhecimento da dinâmica do sistema e informação incorreta dificultam a tarefa de identificar que subconjunto dos dados são confiáveis e devem ser utilizados. Este problema é central em aplicações como a deteção de fogos florestais, presença de lixo nas praias, medições de ruído e poluição nas cidades e outras para as quais os cidadãos sejam chamados a fornecer dados através de sistemas computacionais. Utilizadores mal-intencionados, dados corrompidos por ruído, sensores baratos, entre outros, podem conduzir a erros na deteção. Esta tese visa desenvolver um serviço capaz de detetar anomalias em dados e prever os valores seguintes, tendo em conta o historial. Partindo do pressuposto que os dados serão fornecidos através de uma aplicação mobile para alertas de incêndios florestais e deteção de lixo nas praias, foi criada uma aplicação de backend capaz de suportar o volume expectável de dados bem como executar o seu processamento. A infraestrutura desenvolvida para AWS (Amazon Web Services) contém várias ferramentas de deteção de anomalias e previsão, entre elas o AWS Sagemaker (Ferramenta de machine learning) e o AWS S3 (Amazon Simple Storage Service, armazenamento de objetos). Através das experiências efetuadas foi possível a deteção de anomalias, bem como a previsão de valores futuros, num dataset composto por 22695 entradas de medições de temperatura de um componente interno de uma grande máquina industrial provenientes do Numenta Anomaly Benchmark (NAB).2021-12-22T09:42:27Z2021-02-02T00:00:00Z2021-02-02info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/11144/5297TID:202670856porNascimento, João António Pintoinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-01-11T02:12:42Zoai:repositorio.ual.pt:11144/5297Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T01:32:26.808001Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Enhancing citizens on science information quality through rating of data
title Enhancing citizens on science information quality through rating of data
spellingShingle Enhancing citizens on science information quality through rating of data
Nascimento, João António Pinto
Citizen Cience
Citizen Application
AWS
AWS Sagemaker
AWS S3
title_short Enhancing citizens on science information quality through rating of data
title_full Enhancing citizens on science information quality through rating of data
title_fullStr Enhancing citizens on science information quality through rating of data
title_full_unstemmed Enhancing citizens on science information quality through rating of data
title_sort Enhancing citizens on science information quality through rating of data
author Nascimento, João António Pinto
author_facet Nascimento, João António Pinto
author_role author
dc.contributor.author.fl_str_mv Nascimento, João António Pinto
dc.subject.por.fl_str_mv Citizen Cience
Citizen Application
AWS
AWS Sagemaker
AWS S3
topic Citizen Cience
Citizen Application
AWS
AWS Sagemaker
AWS S3
description Com o objetivo de automatizar tarefas, muitos classificadores têm sido propostos, com diferentes compromissos entre performance e robustez. Quando se pretende classificar um stream de dados extraídos sobre um processo cujo estado está em constante evolução, o desconhecimento da dinâmica do sistema e informação incorreta dificultam a tarefa de identificar que subconjunto dos dados são confiáveis e devem ser utilizados. Este problema é central em aplicações como a deteção de fogos florestais, presença de lixo nas praias, medições de ruído e poluição nas cidades e outras para as quais os cidadãos sejam chamados a fornecer dados através de sistemas computacionais. Utilizadores mal-intencionados, dados corrompidos por ruído, sensores baratos, entre outros, podem conduzir a erros na deteção. Esta tese visa desenvolver um serviço capaz de detetar anomalias em dados e prever os valores seguintes, tendo em conta o historial. Partindo do pressuposto que os dados serão fornecidos através de uma aplicação mobile para alertas de incêndios florestais e deteção de lixo nas praias, foi criada uma aplicação de backend capaz de suportar o volume expectável de dados bem como executar o seu processamento. A infraestrutura desenvolvida para AWS (Amazon Web Services) contém várias ferramentas de deteção de anomalias e previsão, entre elas o AWS Sagemaker (Ferramenta de machine learning) e o AWS S3 (Amazon Simple Storage Service, armazenamento de objetos). Através das experiências efetuadas foi possível a deteção de anomalias, bem como a previsão de valores futuros, num dataset composto por 22695 entradas de medições de temperatura de um componente interno de uma grande máquina industrial provenientes do Numenta Anomaly Benchmark (NAB).
publishDate 2021
dc.date.none.fl_str_mv 2021-12-22T09:42:27Z
2021-02-02T00:00:00Z
2021-02-02
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/11144/5297
TID:202670856
url http://hdl.handle.net/11144/5297
identifier_str_mv TID:202670856
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799136804741316608