Enhancing citizens on science information quality through rating of data
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/11144/5297 |
Resumo: | Com o objetivo de automatizar tarefas, muitos classificadores têm sido propostos, com diferentes compromissos entre performance e robustez. Quando se pretende classificar um stream de dados extraídos sobre um processo cujo estado está em constante evolução, o desconhecimento da dinâmica do sistema e informação incorreta dificultam a tarefa de identificar que subconjunto dos dados são confiáveis e devem ser utilizados. Este problema é central em aplicações como a deteção de fogos florestais, presença de lixo nas praias, medições de ruído e poluição nas cidades e outras para as quais os cidadãos sejam chamados a fornecer dados através de sistemas computacionais. Utilizadores mal-intencionados, dados corrompidos por ruído, sensores baratos, entre outros, podem conduzir a erros na deteção. Esta tese visa desenvolver um serviço capaz de detetar anomalias em dados e prever os valores seguintes, tendo em conta o historial. Partindo do pressuposto que os dados serão fornecidos através de uma aplicação mobile para alertas de incêndios florestais e deteção de lixo nas praias, foi criada uma aplicação de backend capaz de suportar o volume expectável de dados bem como executar o seu processamento. A infraestrutura desenvolvida para AWS (Amazon Web Services) contém várias ferramentas de deteção de anomalias e previsão, entre elas o AWS Sagemaker (Ferramenta de machine learning) e o AWS S3 (Amazon Simple Storage Service, armazenamento de objetos). Através das experiências efetuadas foi possível a deteção de anomalias, bem como a previsão de valores futuros, num dataset composto por 22695 entradas de medições de temperatura de um componente interno de uma grande máquina industrial provenientes do Numenta Anomaly Benchmark (NAB). |
id |
RCAP_d33098b17b1d278aa93637050164149b |
---|---|
oai_identifier_str |
oai:repositorio.ual.pt:11144/5297 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Enhancing citizens on science information quality through rating of dataCitizen CienceCitizen ApplicationAWSAWS SagemakerAWS S3Com o objetivo de automatizar tarefas, muitos classificadores têm sido propostos, com diferentes compromissos entre performance e robustez. Quando se pretende classificar um stream de dados extraídos sobre um processo cujo estado está em constante evolução, o desconhecimento da dinâmica do sistema e informação incorreta dificultam a tarefa de identificar que subconjunto dos dados são confiáveis e devem ser utilizados. Este problema é central em aplicações como a deteção de fogos florestais, presença de lixo nas praias, medições de ruído e poluição nas cidades e outras para as quais os cidadãos sejam chamados a fornecer dados através de sistemas computacionais. Utilizadores mal-intencionados, dados corrompidos por ruído, sensores baratos, entre outros, podem conduzir a erros na deteção. Esta tese visa desenvolver um serviço capaz de detetar anomalias em dados e prever os valores seguintes, tendo em conta o historial. Partindo do pressuposto que os dados serão fornecidos através de uma aplicação mobile para alertas de incêndios florestais e deteção de lixo nas praias, foi criada uma aplicação de backend capaz de suportar o volume expectável de dados bem como executar o seu processamento. A infraestrutura desenvolvida para AWS (Amazon Web Services) contém várias ferramentas de deteção de anomalias e previsão, entre elas o AWS Sagemaker (Ferramenta de machine learning) e o AWS S3 (Amazon Simple Storage Service, armazenamento de objetos). Através das experiências efetuadas foi possível a deteção de anomalias, bem como a previsão de valores futuros, num dataset composto por 22695 entradas de medições de temperatura de um componente interno de uma grande máquina industrial provenientes do Numenta Anomaly Benchmark (NAB).2021-12-22T09:42:27Z2021-02-02T00:00:00Z2021-02-02info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/11144/5297TID:202670856porNascimento, João António Pintoinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-01-11T02:12:42Zoai:repositorio.ual.pt:11144/5297Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T01:32:26.808001Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Enhancing citizens on science information quality through rating of data |
title |
Enhancing citizens on science information quality through rating of data |
spellingShingle |
Enhancing citizens on science information quality through rating of data Nascimento, João António Pinto Citizen Cience Citizen Application AWS AWS Sagemaker AWS S3 |
title_short |
Enhancing citizens on science information quality through rating of data |
title_full |
Enhancing citizens on science information quality through rating of data |
title_fullStr |
Enhancing citizens on science information quality through rating of data |
title_full_unstemmed |
Enhancing citizens on science information quality through rating of data |
title_sort |
Enhancing citizens on science information quality through rating of data |
author |
Nascimento, João António Pinto |
author_facet |
Nascimento, João António Pinto |
author_role |
author |
dc.contributor.author.fl_str_mv |
Nascimento, João António Pinto |
dc.subject.por.fl_str_mv |
Citizen Cience Citizen Application AWS AWS Sagemaker AWS S3 |
topic |
Citizen Cience Citizen Application AWS AWS Sagemaker AWS S3 |
description |
Com o objetivo de automatizar tarefas, muitos classificadores têm sido propostos, com diferentes compromissos entre performance e robustez. Quando se pretende classificar um stream de dados extraídos sobre um processo cujo estado está em constante evolução, o desconhecimento da dinâmica do sistema e informação incorreta dificultam a tarefa de identificar que subconjunto dos dados são confiáveis e devem ser utilizados. Este problema é central em aplicações como a deteção de fogos florestais, presença de lixo nas praias, medições de ruído e poluição nas cidades e outras para as quais os cidadãos sejam chamados a fornecer dados através de sistemas computacionais. Utilizadores mal-intencionados, dados corrompidos por ruído, sensores baratos, entre outros, podem conduzir a erros na deteção. Esta tese visa desenvolver um serviço capaz de detetar anomalias em dados e prever os valores seguintes, tendo em conta o historial. Partindo do pressuposto que os dados serão fornecidos através de uma aplicação mobile para alertas de incêndios florestais e deteção de lixo nas praias, foi criada uma aplicação de backend capaz de suportar o volume expectável de dados bem como executar o seu processamento. A infraestrutura desenvolvida para AWS (Amazon Web Services) contém várias ferramentas de deteção de anomalias e previsão, entre elas o AWS Sagemaker (Ferramenta de machine learning) e o AWS S3 (Amazon Simple Storage Service, armazenamento de objetos). Através das experiências efetuadas foi possível a deteção de anomalias, bem como a previsão de valores futuros, num dataset composto por 22695 entradas de medições de temperatura de um componente interno de uma grande máquina industrial provenientes do Numenta Anomaly Benchmark (NAB). |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021-12-22T09:42:27Z 2021-02-02T00:00:00Z 2021-02-02 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/11144/5297 TID:202670856 |
url |
http://hdl.handle.net/11144/5297 |
identifier_str_mv |
TID:202670856 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799136804741316608 |