Data management in digital twins : a systematic literature review

Detalhes bibliográficos
Autor(a) principal: Correia, Jaqueline Bitencourt
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/255587
Resumo: A Internet das Coisas, dispositivos pessoais e vestíveis e avanços contínuos nas técnicas de coleta de dados aumentaram significativamente a quantidade de dados relevantes que podem ser aproveitados para aplicativos inovadores orientados a dados em tempo real. Os gêmeos digitais (GDs) são representações virtuais de objetos físicos, que são totalmente integrados e nos quais a troca automática de dados ocorre de maneira bidirecional. GDs e Big Data são tecnologias que se reforçam mutuamente, uma vez que grandes volumes de dados que representam os mundos físicos/virtuais são coletados, transformados e gerados por meio de modelos para agregar valor ao negócio. Os GDs modernos seguem uma ar quitetura de cinco componentes, que inclui um componente de gestão de dados que faz a ponte entre o sistema físico, o componente virtual espelhado, o componente dos serviços e as conexões. No entanto, não há clareza sobre a funcionalidade necessária para o com ponente de gestão de dados. Este trabalho apresenta uma revisão sistemática da literatura sobre questões de gestão de dados e soluções propostas no contexto do GD. Analisamos o componente de gestão de dados sob a perspectiva das atividades da cadeia de valor de Big Data, destacando os principais problemas a serem abordados: heterogeneidade de dados, interoperabilidade, integração, pesquisa/descoberta de dados e qualidade. Além de pesquisar soluções existentes para lidar com esses problemas, contextualizamos-os no domínio e na função para os quais o GD foi proposto, o tipo de dados tratados e a in fraestrutura tecnológica. A compilação dessas soluções lança luz sobre a funcionalidade do componente de gestão de dados em um GD, tendências e oportunidades. Nossas prin cipais descobertas revelaram que o nível de maturidade assumido para o componente de gestão de dados está em um estágio inicial. As soluções mais maduras foram propostas para o domínio da indústria, e muitas delas assumem os seres humanos como os consum idores finais das informações. A integração de dados é o problema de gestão de dados mais abordado devido à função de ponte do componente de gestão de dados, e a com putação em nuvem é a principal tecnologia de implementação. Entre as oportunidades de pesquisa estão as arquiteturas de gerenciamento de dados de referência, a adoção de padrões e ontologias do setor, a interoperabilidade entre GDs distintos, o desenvolvimento de implementações de padrão agnóstico e mecanismos de proveniência de dados.
id URGS_95e11dd9f5f58de98f6a22730d023b08
oai_identifier_str oai:www.lume.ufrgs.br:10183/255587
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Correia, Jaqueline BitencourtBecker, Karin2023-03-11T03:28:15Z2022http://hdl.handle.net/10183/255587001163946A Internet das Coisas, dispositivos pessoais e vestíveis e avanços contínuos nas técnicas de coleta de dados aumentaram significativamente a quantidade de dados relevantes que podem ser aproveitados para aplicativos inovadores orientados a dados em tempo real. Os gêmeos digitais (GDs) são representações virtuais de objetos físicos, que são totalmente integrados e nos quais a troca automática de dados ocorre de maneira bidirecional. GDs e Big Data são tecnologias que se reforçam mutuamente, uma vez que grandes volumes de dados que representam os mundos físicos/virtuais são coletados, transformados e gerados por meio de modelos para agregar valor ao negócio. Os GDs modernos seguem uma ar quitetura de cinco componentes, que inclui um componente de gestão de dados que faz a ponte entre o sistema físico, o componente virtual espelhado, o componente dos serviços e as conexões. No entanto, não há clareza sobre a funcionalidade necessária para o com ponente de gestão de dados. Este trabalho apresenta uma revisão sistemática da literatura sobre questões de gestão de dados e soluções propostas no contexto do GD. Analisamos o componente de gestão de dados sob a perspectiva das atividades da cadeia de valor de Big Data, destacando os principais problemas a serem abordados: heterogeneidade de dados, interoperabilidade, integração, pesquisa/descoberta de dados e qualidade. Além de pesquisar soluções existentes para lidar com esses problemas, contextualizamos-os no domínio e na função para os quais o GD foi proposto, o tipo de dados tratados e a in fraestrutura tecnológica. A compilação dessas soluções lança luz sobre a funcionalidade do componente de gestão de dados em um GD, tendências e oportunidades. Nossas prin cipais descobertas revelaram que o nível de maturidade assumido para o componente de gestão de dados está em um estágio inicial. As soluções mais maduras foram propostas para o domínio da indústria, e muitas delas assumem os seres humanos como os consum idores finais das informações. A integração de dados é o problema de gestão de dados mais abordado devido à função de ponte do componente de gestão de dados, e a com putação em nuvem é a principal tecnologia de implementação. Entre as oportunidades de pesquisa estão as arquiteturas de gerenciamento de dados de referência, a adoção de padrões e ontologias do setor, a interoperabilidade entre GDs distintos, o desenvolvimento de implementações de padrão agnóstico e mecanismos de proveniência de dados.The Internet of Things (IoT), personal and wearable devices, and continuous advances in data-gathering techniques have significantly increased the amount of relevant data that can be leveraged for innovative real-time, data-driven applications. Digital Twins (DTs) are virtual representations of physical objects which are fully integrated and in which the automatic data exchange occurs in a bidirectional way. DTs and big data are mutu ally reinforcing technologies since huge volumes of data representing the physical/virtual worlds are collected, transformed, and generated through models to aggregate value to the business. Modern DTs follow a five-component architecture, which includes a Data Management (DM) component that bridges a physical system, a mirrored virtual one, and services components. However, there is no clarity on the functionality required for the DM component. This work presents a Systematic Literature Review on DM issues and proposed solutions in the DT context. We analyzed DM under the big data value chain activities, highlighting key issues to be addressed: data heterogeneity, interoperability, integration, data search/discovery, and quality. In addition to surveying existing solutions for handling these issues, we contextualized them in the domain and function for which the DT was proposed, the type of data dealt with, and the technical infrastructure. The compilation of these solutions sheds light on the functionality of the DM component in a DT, trends, and opportunities. Our main findings revealed that the maturity level assumed for the DM component is at an early stage. The most mature solutions were proposed for the industry domain, and many of them assume humans as the ultimate information con sumers. Data integration is the prevalent DM issue addressed due to the bridging role of the DM component, and cloud computing is the key implementation technology. Among the research opportunities are reference data management architectures, adoption of in dustry standards and ontologies, interoperability among distinct DTs, the development of agnostic standard implementations, and data provenance mechanisms.application/pdfengGêmeo DigitalBig dataRevisão sistemáticaInternet das coisasData managementSystematic Literature ReviewData management in digital twins : a systematic literature reviewGestão de dados em gêmeos digitais: uma revisão sistemática da literatura info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2022mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001163946.pdf.txt001163946.pdf.txtExtracted Texttext/plain200601http://www.lume.ufrgs.br/bitstream/10183/255587/2/001163946.pdf.txt66ec9c4847796982588435262ab54135MD52ORIGINAL001163946.pdfTexto completo (inglês)application/pdf2150033http://www.lume.ufrgs.br/bitstream/10183/255587/1/001163946.pdf6c44c81ec4679a0edfe0fc5a77f1a9f7MD5110183/2555872023-03-12 03:23:39.581782oai:www.lume.ufrgs.br:10183/255587Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532023-03-12T06:23:39Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Data management in digital twins : a systematic literature review
dc.title.alternative.pt.fl_str_mv Gestão de dados em gêmeos digitais: uma revisão sistemática da literatura
title Data management in digital twins : a systematic literature review
spellingShingle Data management in digital twins : a systematic literature review
Correia, Jaqueline Bitencourt
Gêmeo Digital
Big data
Revisão sistemática
Internet das coisas
Data management
Systematic Literature Review
title_short Data management in digital twins : a systematic literature review
title_full Data management in digital twins : a systematic literature review
title_fullStr Data management in digital twins : a systematic literature review
title_full_unstemmed Data management in digital twins : a systematic literature review
title_sort Data management in digital twins : a systematic literature review
author Correia, Jaqueline Bitencourt
author_facet Correia, Jaqueline Bitencourt
author_role author
dc.contributor.author.fl_str_mv Correia, Jaqueline Bitencourt
dc.contributor.advisor1.fl_str_mv Becker, Karin
contributor_str_mv Becker, Karin
dc.subject.por.fl_str_mv Gêmeo Digital
Big data
Revisão sistemática
Internet das coisas
topic Gêmeo Digital
Big data
Revisão sistemática
Internet das coisas
Data management
Systematic Literature Review
dc.subject.eng.fl_str_mv Data management
Systematic Literature Review
description A Internet das Coisas, dispositivos pessoais e vestíveis e avanços contínuos nas técnicas de coleta de dados aumentaram significativamente a quantidade de dados relevantes que podem ser aproveitados para aplicativos inovadores orientados a dados em tempo real. Os gêmeos digitais (GDs) são representações virtuais de objetos físicos, que são totalmente integrados e nos quais a troca automática de dados ocorre de maneira bidirecional. GDs e Big Data são tecnologias que se reforçam mutuamente, uma vez que grandes volumes de dados que representam os mundos físicos/virtuais são coletados, transformados e gerados por meio de modelos para agregar valor ao negócio. Os GDs modernos seguem uma ar quitetura de cinco componentes, que inclui um componente de gestão de dados que faz a ponte entre o sistema físico, o componente virtual espelhado, o componente dos serviços e as conexões. No entanto, não há clareza sobre a funcionalidade necessária para o com ponente de gestão de dados. Este trabalho apresenta uma revisão sistemática da literatura sobre questões de gestão de dados e soluções propostas no contexto do GD. Analisamos o componente de gestão de dados sob a perspectiva das atividades da cadeia de valor de Big Data, destacando os principais problemas a serem abordados: heterogeneidade de dados, interoperabilidade, integração, pesquisa/descoberta de dados e qualidade. Além de pesquisar soluções existentes para lidar com esses problemas, contextualizamos-os no domínio e na função para os quais o GD foi proposto, o tipo de dados tratados e a in fraestrutura tecnológica. A compilação dessas soluções lança luz sobre a funcionalidade do componente de gestão de dados em um GD, tendências e oportunidades. Nossas prin cipais descobertas revelaram que o nível de maturidade assumido para o componente de gestão de dados está em um estágio inicial. As soluções mais maduras foram propostas para o domínio da indústria, e muitas delas assumem os seres humanos como os consum idores finais das informações. A integração de dados é o problema de gestão de dados mais abordado devido à função de ponte do componente de gestão de dados, e a com putação em nuvem é a principal tecnologia de implementação. Entre as oportunidades de pesquisa estão as arquiteturas de gerenciamento de dados de referência, a adoção de padrões e ontologias do setor, a interoperabilidade entre GDs distintos, o desenvolvimento de implementações de padrão agnóstico e mecanismos de proveniência de dados.
publishDate 2022
dc.date.issued.fl_str_mv 2022
dc.date.accessioned.fl_str_mv 2023-03-11T03:28:15Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/255587
dc.identifier.nrb.pt_BR.fl_str_mv 001163946
url http://hdl.handle.net/10183/255587
identifier_str_mv 001163946
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/255587/2/001163946.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/255587/1/001163946.pdf
bitstream.checksum.fl_str_mv 66ec9c4847796982588435262ab54135
6c44c81ec4679a0edfe0fc5a77f1a9f7
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1816737069017333760