Arquitectura para Processamento Integrado no Repositório de Dados e Metadados de Observação Terrestre

Detalhes bibliográficos
Autor(a) principal: Silva, Rúben Filipe Coelho
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10362/144380
Resumo: A observação remota tem-se mostrado como uma área de grande interesse e importância para vários domínios da sociedade, como por exemplo a agricultura, a meteorologia, o planeamento urbano ou a biologia. Esta surge como uma alternativa a métodos de pesquisa e monitorização tradicionais, que tendem a ser mais demorados e dispendiosos. Hoje em dia, programas de agências espaciais disponibilizam dados para que os mesmos possam ser usados nas mais diversas aplicações. Assim, a comunidade científica enfrenta um novo problema, que não se prende com a obtenção de dados de deteção remota, mas em conseguir fazer a gestão dos mesmos e executar computação sobre estes de forma eficiente. Para resolver a primeira parte do problema, um repositório de dados e metadados de Observação Terrestre começou a ser desenvolvido, numa dissertação anterior. Este repositório tem como finalidade responder aos seguintes problemas: heterogeneidade dos dados e metadados, extensibilidade dos metamodelos, expressividades das interrogações e incorporação de cadeias de processamento local. A segunda parte do problema, que se prende com a execução eficiente de computações sobre estes dados, não foi, no entanto, ainda tratada. A capacidade de realizar computação de forma eficiente é extremamente importante por vários motivos. Uma típica computação é na verdade uma sequência de tarefas que, devido ao volume de dados de detecção remota, podem implicar tempos de execução bastante longos, sendo muitas vezes necessário reexecutar estas pipelines pelo que ausência de mecanismos para agilizar e melhorar a eficiência destas computações pode resultar em períodos de desenvolvimento penosamente longos. Desta forma, neste trabalho pretende-se construir uma arquitetura para processamento integrado no repositório de dados e metadados de observação terrestre, que permita construir pipelines das típicas operações realizadas (como processamento ou classificação de imagem), que suporte vários tipos de utilizadores com diferentes necessidades de computação. De forma a assegurar a eficiência das computações é necessário que a infra-estrutura resultante seja capaz de fazer a gestão, de forma automática, do workload num ambiente distribuído, para além de, permitir a definição de dependências entre os vários produtos resultantes das computações. Este último elemento é um dos componentes diferenciadores neste trabalho, que tem como finalidades facilitar o desenvolvimento de produtos que trabalham com séries temporais e ainda servir de base para a tomada de decisões entre reprocessar um subproduto ou armazená-lo em disco.
id RCAP_1d7bf8da5284f576bbe9646d2926fc8b
oai_identifier_str oai:run.unl.pt:10362/144380
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Arquitectura para Processamento Integrado no Repositório de Dados e Metadados de Observação TerrestreArquiteturas de ProcessamentoDeteção RemotaGISWorkflows CientíficosGestão de WorkflowsDomínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e InformáticaA observação remota tem-se mostrado como uma área de grande interesse e importância para vários domínios da sociedade, como por exemplo a agricultura, a meteorologia, o planeamento urbano ou a biologia. Esta surge como uma alternativa a métodos de pesquisa e monitorização tradicionais, que tendem a ser mais demorados e dispendiosos. Hoje em dia, programas de agências espaciais disponibilizam dados para que os mesmos possam ser usados nas mais diversas aplicações. Assim, a comunidade científica enfrenta um novo problema, que não se prende com a obtenção de dados de deteção remota, mas em conseguir fazer a gestão dos mesmos e executar computação sobre estes de forma eficiente. Para resolver a primeira parte do problema, um repositório de dados e metadados de Observação Terrestre começou a ser desenvolvido, numa dissertação anterior. Este repositório tem como finalidade responder aos seguintes problemas: heterogeneidade dos dados e metadados, extensibilidade dos metamodelos, expressividades das interrogações e incorporação de cadeias de processamento local. A segunda parte do problema, que se prende com a execução eficiente de computações sobre estes dados, não foi, no entanto, ainda tratada. A capacidade de realizar computação de forma eficiente é extremamente importante por vários motivos. Uma típica computação é na verdade uma sequência de tarefas que, devido ao volume de dados de detecção remota, podem implicar tempos de execução bastante longos, sendo muitas vezes necessário reexecutar estas pipelines pelo que ausência de mecanismos para agilizar e melhorar a eficiência destas computações pode resultar em períodos de desenvolvimento penosamente longos. Desta forma, neste trabalho pretende-se construir uma arquitetura para processamento integrado no repositório de dados e metadados de observação terrestre, que permita construir pipelines das típicas operações realizadas (como processamento ou classificação de imagem), que suporte vários tipos de utilizadores com diferentes necessidades de computação. De forma a assegurar a eficiência das computações é necessário que a infra-estrutura resultante seja capaz de fazer a gestão, de forma automática, do workload num ambiente distribuído, para além de, permitir a definição de dependências entre os vários produtos resultantes das computações. Este último elemento é um dos componentes diferenciadores neste trabalho, que tem como finalidades facilitar o desenvolvimento de produtos que trabalham com séries temporais e ainda servir de base para a tomada de decisões entre reprocessar um subproduto ou armazená-lo em disco.Remote Observation (RO) has emerged has high-interest research area with impacts in various societies domains, such as agriculture, meteorology, urban planning or biology. It has recently been used as a novel, cheaper and less time-consuming monitoring method when compared to traditional techniques. Nowadays, space agency programs provide the scientific community with remotely sensed data, which can be used in a variety of applications. Although getting access to remotely sensed data is a problem of the past, being able to effectively and efficiently manage and execute computations over that information is today’s problem. With that in mind, a repository of remote observation data and metadata started to be developed. This repository aims to solve the following problems: heterogeneity of data and metadata, extensibility of metamodels, expressiveness of interrogations and incorporation of local processing chains. At this moment, the second part of the problem - efficiently execution of computations on RO data - has not yet been tackled. When it comes to RO data processing, the ability to efficiently execute operations is a necessity. A typical computation in the RO environment is usually a sequence of operations, that due to the volume of data may take a significant amount of time to run. Furthermore, it is often required to reexecute some of these pipelines and the absence of mechanisms that improve the overall efficiency may result in painfully slow development times. In this work, we strive to develop an architecture for processing remote observa- tion data that is stored in the repository previously developed. This architecture allows building pipelines of the typical operations performed (such as image processing or clas- sification tasks), with support to various types of users, each with various necessities. To ensure the efficiency of the computations, the resulting infrastructure must be able to automatically manage the workload in a distributed environment, in addition to al- lowing the definition of dependencies between the various products resulting from the computations.Damásio, CarlosLeitão, JoãoPires, JoãoRUNSilva, Rúben Filipe Coelho2022-09-29T17:36:43Z2022-022022-02-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10362/144380porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-03-11T05:24:03Zoai:run.unl.pt:10362/144380Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T03:51:31.991840Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Arquitectura para Processamento Integrado no Repositório de Dados e Metadados de Observação Terrestre
title Arquitectura para Processamento Integrado no Repositório de Dados e Metadados de Observação Terrestre
spellingShingle Arquitectura para Processamento Integrado no Repositório de Dados e Metadados de Observação Terrestre
Silva, Rúben Filipe Coelho
Arquiteturas de Processamento
Deteção Remota
GIS
Workflows Científicos
Gestão de Workflows
Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
title_short Arquitectura para Processamento Integrado no Repositório de Dados e Metadados de Observação Terrestre
title_full Arquitectura para Processamento Integrado no Repositório de Dados e Metadados de Observação Terrestre
title_fullStr Arquitectura para Processamento Integrado no Repositório de Dados e Metadados de Observação Terrestre
title_full_unstemmed Arquitectura para Processamento Integrado no Repositório de Dados e Metadados de Observação Terrestre
title_sort Arquitectura para Processamento Integrado no Repositório de Dados e Metadados de Observação Terrestre
author Silva, Rúben Filipe Coelho
author_facet Silva, Rúben Filipe Coelho
author_role author
dc.contributor.none.fl_str_mv Damásio, Carlos
Leitão, João
Pires, João
RUN
dc.contributor.author.fl_str_mv Silva, Rúben Filipe Coelho
dc.subject.por.fl_str_mv Arquiteturas de Processamento
Deteção Remota
GIS
Workflows Científicos
Gestão de Workflows
Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
topic Arquiteturas de Processamento
Deteção Remota
GIS
Workflows Científicos
Gestão de Workflows
Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
description A observação remota tem-se mostrado como uma área de grande interesse e importância para vários domínios da sociedade, como por exemplo a agricultura, a meteorologia, o planeamento urbano ou a biologia. Esta surge como uma alternativa a métodos de pesquisa e monitorização tradicionais, que tendem a ser mais demorados e dispendiosos. Hoje em dia, programas de agências espaciais disponibilizam dados para que os mesmos possam ser usados nas mais diversas aplicações. Assim, a comunidade científica enfrenta um novo problema, que não se prende com a obtenção de dados de deteção remota, mas em conseguir fazer a gestão dos mesmos e executar computação sobre estes de forma eficiente. Para resolver a primeira parte do problema, um repositório de dados e metadados de Observação Terrestre começou a ser desenvolvido, numa dissertação anterior. Este repositório tem como finalidade responder aos seguintes problemas: heterogeneidade dos dados e metadados, extensibilidade dos metamodelos, expressividades das interrogações e incorporação de cadeias de processamento local. A segunda parte do problema, que se prende com a execução eficiente de computações sobre estes dados, não foi, no entanto, ainda tratada. A capacidade de realizar computação de forma eficiente é extremamente importante por vários motivos. Uma típica computação é na verdade uma sequência de tarefas que, devido ao volume de dados de detecção remota, podem implicar tempos de execução bastante longos, sendo muitas vezes necessário reexecutar estas pipelines pelo que ausência de mecanismos para agilizar e melhorar a eficiência destas computações pode resultar em períodos de desenvolvimento penosamente longos. Desta forma, neste trabalho pretende-se construir uma arquitetura para processamento integrado no repositório de dados e metadados de observação terrestre, que permita construir pipelines das típicas operações realizadas (como processamento ou classificação de imagem), que suporte vários tipos de utilizadores com diferentes necessidades de computação. De forma a assegurar a eficiência das computações é necessário que a infra-estrutura resultante seja capaz de fazer a gestão, de forma automática, do workload num ambiente distribuído, para além de, permitir a definição de dependências entre os vários produtos resultantes das computações. Este último elemento é um dos componentes diferenciadores neste trabalho, que tem como finalidades facilitar o desenvolvimento de produtos que trabalham com séries temporais e ainda servir de base para a tomada de decisões entre reprocessar um subproduto ou armazená-lo em disco.
publishDate 2022
dc.date.none.fl_str_mv 2022-09-29T17:36:43Z
2022-02
2022-02-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10362/144380
url http://hdl.handle.net/10362/144380
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799138108680175616