Arquitectura para Processamento Integrado no Repositório de Dados e Metadados de Observação Terrestre
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10362/144380 |
Resumo: | A observação remota tem-se mostrado como uma área de grande interesse e importância para vários domínios da sociedade, como por exemplo a agricultura, a meteorologia, o planeamento urbano ou a biologia. Esta surge como uma alternativa a métodos de pesquisa e monitorização tradicionais, que tendem a ser mais demorados e dispendiosos. Hoje em dia, programas de agências espaciais disponibilizam dados para que os mesmos possam ser usados nas mais diversas aplicações. Assim, a comunidade científica enfrenta um novo problema, que não se prende com a obtenção de dados de deteção remota, mas em conseguir fazer a gestão dos mesmos e executar computação sobre estes de forma eficiente. Para resolver a primeira parte do problema, um repositório de dados e metadados de Observação Terrestre começou a ser desenvolvido, numa dissertação anterior. Este repositório tem como finalidade responder aos seguintes problemas: heterogeneidade dos dados e metadados, extensibilidade dos metamodelos, expressividades das interrogações e incorporação de cadeias de processamento local. A segunda parte do problema, que se prende com a execução eficiente de computações sobre estes dados, não foi, no entanto, ainda tratada. A capacidade de realizar computação de forma eficiente é extremamente importante por vários motivos. Uma típica computação é na verdade uma sequência de tarefas que, devido ao volume de dados de detecção remota, podem implicar tempos de execução bastante longos, sendo muitas vezes necessário reexecutar estas pipelines pelo que ausência de mecanismos para agilizar e melhorar a eficiência destas computações pode resultar em períodos de desenvolvimento penosamente longos. Desta forma, neste trabalho pretende-se construir uma arquitetura para processamento integrado no repositório de dados e metadados de observação terrestre, que permita construir pipelines das típicas operações realizadas (como processamento ou classificação de imagem), que suporte vários tipos de utilizadores com diferentes necessidades de computação. De forma a assegurar a eficiência das computações é necessário que a infra-estrutura resultante seja capaz de fazer a gestão, de forma automática, do workload num ambiente distribuído, para além de, permitir a definição de dependências entre os vários produtos resultantes das computações. Este último elemento é um dos componentes diferenciadores neste trabalho, que tem como finalidades facilitar o desenvolvimento de produtos que trabalham com séries temporais e ainda servir de base para a tomada de decisões entre reprocessar um subproduto ou armazená-lo em disco. |
id |
RCAP_1d7bf8da5284f576bbe9646d2926fc8b |
---|---|
oai_identifier_str |
oai:run.unl.pt:10362/144380 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Arquitectura para Processamento Integrado no Repositório de Dados e Metadados de Observação TerrestreArquiteturas de ProcessamentoDeteção RemotaGISWorkflows CientíficosGestão de WorkflowsDomínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e InformáticaA observação remota tem-se mostrado como uma área de grande interesse e importância para vários domínios da sociedade, como por exemplo a agricultura, a meteorologia, o planeamento urbano ou a biologia. Esta surge como uma alternativa a métodos de pesquisa e monitorização tradicionais, que tendem a ser mais demorados e dispendiosos. Hoje em dia, programas de agências espaciais disponibilizam dados para que os mesmos possam ser usados nas mais diversas aplicações. Assim, a comunidade científica enfrenta um novo problema, que não se prende com a obtenção de dados de deteção remota, mas em conseguir fazer a gestão dos mesmos e executar computação sobre estes de forma eficiente. Para resolver a primeira parte do problema, um repositório de dados e metadados de Observação Terrestre começou a ser desenvolvido, numa dissertação anterior. Este repositório tem como finalidade responder aos seguintes problemas: heterogeneidade dos dados e metadados, extensibilidade dos metamodelos, expressividades das interrogações e incorporação de cadeias de processamento local. A segunda parte do problema, que se prende com a execução eficiente de computações sobre estes dados, não foi, no entanto, ainda tratada. A capacidade de realizar computação de forma eficiente é extremamente importante por vários motivos. Uma típica computação é na verdade uma sequência de tarefas que, devido ao volume de dados de detecção remota, podem implicar tempos de execução bastante longos, sendo muitas vezes necessário reexecutar estas pipelines pelo que ausência de mecanismos para agilizar e melhorar a eficiência destas computações pode resultar em períodos de desenvolvimento penosamente longos. Desta forma, neste trabalho pretende-se construir uma arquitetura para processamento integrado no repositório de dados e metadados de observação terrestre, que permita construir pipelines das típicas operações realizadas (como processamento ou classificação de imagem), que suporte vários tipos de utilizadores com diferentes necessidades de computação. De forma a assegurar a eficiência das computações é necessário que a infra-estrutura resultante seja capaz de fazer a gestão, de forma automática, do workload num ambiente distribuído, para além de, permitir a definição de dependências entre os vários produtos resultantes das computações. Este último elemento é um dos componentes diferenciadores neste trabalho, que tem como finalidades facilitar o desenvolvimento de produtos que trabalham com séries temporais e ainda servir de base para a tomada de decisões entre reprocessar um subproduto ou armazená-lo em disco.Remote Observation (RO) has emerged has high-interest research area with impacts in various societies domains, such as agriculture, meteorology, urban planning or biology. It has recently been used as a novel, cheaper and less time-consuming monitoring method when compared to traditional techniques. Nowadays, space agency programs provide the scientific community with remotely sensed data, which can be used in a variety of applications. Although getting access to remotely sensed data is a problem of the past, being able to effectively and efficiently manage and execute computations over that information is today’s problem. With that in mind, a repository of remote observation data and metadata started to be developed. This repository aims to solve the following problems: heterogeneity of data and metadata, extensibility of metamodels, expressiveness of interrogations and incorporation of local processing chains. At this moment, the second part of the problem - efficiently execution of computations on RO data - has not yet been tackled. When it comes to RO data processing, the ability to efficiently execute operations is a necessity. A typical computation in the RO environment is usually a sequence of operations, that due to the volume of data may take a significant amount of time to run. Furthermore, it is often required to reexecute some of these pipelines and the absence of mechanisms that improve the overall efficiency may result in painfully slow development times. In this work, we strive to develop an architecture for processing remote observa- tion data that is stored in the repository previously developed. This architecture allows building pipelines of the typical operations performed (such as image processing or clas- sification tasks), with support to various types of users, each with various necessities. To ensure the efficiency of the computations, the resulting infrastructure must be able to automatically manage the workload in a distributed environment, in addition to al- lowing the definition of dependencies between the various products resulting from the computations.Damásio, CarlosLeitão, JoãoPires, JoãoRUNSilva, Rúben Filipe Coelho2022-09-29T17:36:43Z2022-022022-02-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10362/144380porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-03-11T05:24:03Zoai:run.unl.pt:10362/144380Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T03:51:31.991840Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Arquitectura para Processamento Integrado no Repositório de Dados e Metadados de Observação Terrestre |
title |
Arquitectura para Processamento Integrado no Repositório de Dados e Metadados de Observação Terrestre |
spellingShingle |
Arquitectura para Processamento Integrado no Repositório de Dados e Metadados de Observação Terrestre Silva, Rúben Filipe Coelho Arquiteturas de Processamento Deteção Remota GIS Workflows Científicos Gestão de Workflows Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática |
title_short |
Arquitectura para Processamento Integrado no Repositório de Dados e Metadados de Observação Terrestre |
title_full |
Arquitectura para Processamento Integrado no Repositório de Dados e Metadados de Observação Terrestre |
title_fullStr |
Arquitectura para Processamento Integrado no Repositório de Dados e Metadados de Observação Terrestre |
title_full_unstemmed |
Arquitectura para Processamento Integrado no Repositório de Dados e Metadados de Observação Terrestre |
title_sort |
Arquitectura para Processamento Integrado no Repositório de Dados e Metadados de Observação Terrestre |
author |
Silva, Rúben Filipe Coelho |
author_facet |
Silva, Rúben Filipe Coelho |
author_role |
author |
dc.contributor.none.fl_str_mv |
Damásio, Carlos Leitão, João Pires, João RUN |
dc.contributor.author.fl_str_mv |
Silva, Rúben Filipe Coelho |
dc.subject.por.fl_str_mv |
Arquiteturas de Processamento Deteção Remota GIS Workflows Científicos Gestão de Workflows Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática |
topic |
Arquiteturas de Processamento Deteção Remota GIS Workflows Científicos Gestão de Workflows Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática |
description |
A observação remota tem-se mostrado como uma área de grande interesse e importância para vários domínios da sociedade, como por exemplo a agricultura, a meteorologia, o planeamento urbano ou a biologia. Esta surge como uma alternativa a métodos de pesquisa e monitorização tradicionais, que tendem a ser mais demorados e dispendiosos. Hoje em dia, programas de agências espaciais disponibilizam dados para que os mesmos possam ser usados nas mais diversas aplicações. Assim, a comunidade científica enfrenta um novo problema, que não se prende com a obtenção de dados de deteção remota, mas em conseguir fazer a gestão dos mesmos e executar computação sobre estes de forma eficiente. Para resolver a primeira parte do problema, um repositório de dados e metadados de Observação Terrestre começou a ser desenvolvido, numa dissertação anterior. Este repositório tem como finalidade responder aos seguintes problemas: heterogeneidade dos dados e metadados, extensibilidade dos metamodelos, expressividades das interrogações e incorporação de cadeias de processamento local. A segunda parte do problema, que se prende com a execução eficiente de computações sobre estes dados, não foi, no entanto, ainda tratada. A capacidade de realizar computação de forma eficiente é extremamente importante por vários motivos. Uma típica computação é na verdade uma sequência de tarefas que, devido ao volume de dados de detecção remota, podem implicar tempos de execução bastante longos, sendo muitas vezes necessário reexecutar estas pipelines pelo que ausência de mecanismos para agilizar e melhorar a eficiência destas computações pode resultar em períodos de desenvolvimento penosamente longos. Desta forma, neste trabalho pretende-se construir uma arquitetura para processamento integrado no repositório de dados e metadados de observação terrestre, que permita construir pipelines das típicas operações realizadas (como processamento ou classificação de imagem), que suporte vários tipos de utilizadores com diferentes necessidades de computação. De forma a assegurar a eficiência das computações é necessário que a infra-estrutura resultante seja capaz de fazer a gestão, de forma automática, do workload num ambiente distribuído, para além de, permitir a definição de dependências entre os vários produtos resultantes das computações. Este último elemento é um dos componentes diferenciadores neste trabalho, que tem como finalidades facilitar o desenvolvimento de produtos que trabalham com séries temporais e ainda servir de base para a tomada de decisões entre reprocessar um subproduto ou armazená-lo em disco. |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-09-29T17:36:43Z 2022-02 2022-02-01T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10362/144380 |
url |
http://hdl.handle.net/10362/144380 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799138108680175616 |