Visualização de distribuições de dados complexos provenientes de fontes heterogêneas
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://www.teses.usp.br/teses/disponiveis/55/55134/tde-05062023-101705/ |
Resumo: | Os Sistemas de Gerenciamento de Bases de Dados (SGBD) baseados na Teoria Relacional foram desenvolvidos para atender às necessidades de armazenagem e recuperação de dados representados por valores numéricos, datas e pequenas cadeias de caracteres, chamados genericamente de dados escalares. Consultas sobre dados escalares são feitas por comparações baseadas em relações de identidade ou relações de ordem. Com a evolução da tecnologia da informação, se faz necessário organizar, armazenar e recuperar outros tipos de dados, tais como imagens, vídeos, séries temporais, sequências genômicas etc. A esses, nos referimos como dados complexos, porque eles não são comparados diretamente, mas por meio de funções de extração de características aplicadas sobre os dados. Portanto, uma vez extraídas, as características são utilizadas no lugar dos dados originais para executar as comparações. Considerando, ainda, a crescente e genuína necessidade de se analisar grandes volumes de dados de diferentes e diversas áreas do conhecimento, em destaque, a área médica, objeto deste trabalho e avaliando as inerentes limitações das técnicas mais frequentes, apresentamos, neste trabalho, uma abordagem alternativa, utilizando ferramentas de visualização (Tableau) para avaliar e gerar insights sobre objetos complexos (pacientes) através da modelagem de EHR (Eletronic Health Records) disponibilizados pelo Hospital do Coração (InCor). Estes, por sua vez, estão armazenados sobre o padrão OMOP, uma arquitetura de dados Entidade-valor-Atributo que também é desafiadora para analistas e outros profissionais da área de dados. O resultado deste trabalho é apresentar um caminho prático e aplicável que oferece benefícios potenciais tanto para técnicas de avaliação de objetos complexos quanto para descoberta de conhecimento na área médica. |
id |
USP_6a811eee26ebf93e23ea39c5604be16f |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-05062023-101705 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Visualização de distribuições de dados complexos provenientes de fontes heterogêneasVisualization of complex data distributions from heterogeneous sourcesDados heterogêneosData VisualizationEletronic health records EHRHeterogeneous dataOMOP CDMOMOP CDMRegistros médicos EHRSimilaridadeSimilarityVisualização de dadosOs Sistemas de Gerenciamento de Bases de Dados (SGBD) baseados na Teoria Relacional foram desenvolvidos para atender às necessidades de armazenagem e recuperação de dados representados por valores numéricos, datas e pequenas cadeias de caracteres, chamados genericamente de dados escalares. Consultas sobre dados escalares são feitas por comparações baseadas em relações de identidade ou relações de ordem. Com a evolução da tecnologia da informação, se faz necessário organizar, armazenar e recuperar outros tipos de dados, tais como imagens, vídeos, séries temporais, sequências genômicas etc. A esses, nos referimos como dados complexos, porque eles não são comparados diretamente, mas por meio de funções de extração de características aplicadas sobre os dados. Portanto, uma vez extraídas, as características são utilizadas no lugar dos dados originais para executar as comparações. Considerando, ainda, a crescente e genuína necessidade de se analisar grandes volumes de dados de diferentes e diversas áreas do conhecimento, em destaque, a área médica, objeto deste trabalho e avaliando as inerentes limitações das técnicas mais frequentes, apresentamos, neste trabalho, uma abordagem alternativa, utilizando ferramentas de visualização (Tableau) para avaliar e gerar insights sobre objetos complexos (pacientes) através da modelagem de EHR (Eletronic Health Records) disponibilizados pelo Hospital do Coração (InCor). Estes, por sua vez, estão armazenados sobre o padrão OMOP, uma arquitetura de dados Entidade-valor-Atributo que também é desafiadora para analistas e outros profissionais da área de dados. O resultado deste trabalho é apresentar um caminho prático e aplicável que oferece benefícios potenciais tanto para técnicas de avaliação de objetos complexos quanto para descoberta de conhecimento na área médica.Database Management Systems (DBMS) based on Relational Theory were developed to meet the needs of storing and retrieving data represented by numeric values, dates, and short strings of characters, generically called scalar data. Queries on scalar data are made by comparisons based on identity relations or order relations. With the evolution of information technology, it has become necessary to organize, store and retrieve other types of data, such as images, videos, time series, genomic sequences, etc. These we refer to as complex data, because they are not compared directly, but by means of feature extraction functions applied on the data. So once extracted, the features are used in place of the original data to perform the comparisons. the growing and genuine need to analyze large volumes of data from different and diverse areas of knowledge, in particular, the medical area, the object of this work Considering, furthermore, the growing and genuine need to analyze large volumes of data from different and diverse areas of knowledge, in particular, the medical area, object of this work and evaluating the inherent limitations of the most frequent techniques, we present in this paper an alternative approach, using visualization tools (Tableau) to evaluate and generate insights about complex objects (patients) through the modeling of EHR (Electronic Health Records) made available by the Hospital do Coração (InCor). These, in turn, are stored over the OMOP standard, an Entity-Value-Attribute data architecture that is also challenging for analysts and other data professionals. The result of this work is to present a practical and applicable way forward that offers potential benefits for both complex object evaluation techniques and knowledge discovery in the medical fieldBiblioteca Digitais de Teses e Dissertações da USPTraina Junior, CaetanoMartins, Natalia de Fatima2023-03-21info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55134/tde-05062023-101705/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2023-06-05T13:23:40Zoai:teses.usp.br:tde-05062023-101705Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-06-05T13:23:40Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Visualização de distribuições de dados complexos provenientes de fontes heterogêneas Visualization of complex data distributions from heterogeneous sources |
title |
Visualização de distribuições de dados complexos provenientes de fontes heterogêneas |
spellingShingle |
Visualização de distribuições de dados complexos provenientes de fontes heterogêneas Martins, Natalia de Fatima Dados heterogêneos Data Visualization Eletronic health records EHR Heterogeneous data OMOP CDM OMOP CDM Registros médicos EHR Similaridade Similarity Visualização de dados |
title_short |
Visualização de distribuições de dados complexos provenientes de fontes heterogêneas |
title_full |
Visualização de distribuições de dados complexos provenientes de fontes heterogêneas |
title_fullStr |
Visualização de distribuições de dados complexos provenientes de fontes heterogêneas |
title_full_unstemmed |
Visualização de distribuições de dados complexos provenientes de fontes heterogêneas |
title_sort |
Visualização de distribuições de dados complexos provenientes de fontes heterogêneas |
author |
Martins, Natalia de Fatima |
author_facet |
Martins, Natalia de Fatima |
author_role |
author |
dc.contributor.none.fl_str_mv |
Traina Junior, Caetano |
dc.contributor.author.fl_str_mv |
Martins, Natalia de Fatima |
dc.subject.por.fl_str_mv |
Dados heterogêneos Data Visualization Eletronic health records EHR Heterogeneous data OMOP CDM OMOP CDM Registros médicos EHR Similaridade Similarity Visualização de dados |
topic |
Dados heterogêneos Data Visualization Eletronic health records EHR Heterogeneous data OMOP CDM OMOP CDM Registros médicos EHR Similaridade Similarity Visualização de dados |
description |
Os Sistemas de Gerenciamento de Bases de Dados (SGBD) baseados na Teoria Relacional foram desenvolvidos para atender às necessidades de armazenagem e recuperação de dados representados por valores numéricos, datas e pequenas cadeias de caracteres, chamados genericamente de dados escalares. Consultas sobre dados escalares são feitas por comparações baseadas em relações de identidade ou relações de ordem. Com a evolução da tecnologia da informação, se faz necessário organizar, armazenar e recuperar outros tipos de dados, tais como imagens, vídeos, séries temporais, sequências genômicas etc. A esses, nos referimos como dados complexos, porque eles não são comparados diretamente, mas por meio de funções de extração de características aplicadas sobre os dados. Portanto, uma vez extraídas, as características são utilizadas no lugar dos dados originais para executar as comparações. Considerando, ainda, a crescente e genuína necessidade de se analisar grandes volumes de dados de diferentes e diversas áreas do conhecimento, em destaque, a área médica, objeto deste trabalho e avaliando as inerentes limitações das técnicas mais frequentes, apresentamos, neste trabalho, uma abordagem alternativa, utilizando ferramentas de visualização (Tableau) para avaliar e gerar insights sobre objetos complexos (pacientes) através da modelagem de EHR (Eletronic Health Records) disponibilizados pelo Hospital do Coração (InCor). Estes, por sua vez, estão armazenados sobre o padrão OMOP, uma arquitetura de dados Entidade-valor-Atributo que também é desafiadora para analistas e outros profissionais da área de dados. O resultado deste trabalho é apresentar um caminho prático e aplicável que oferece benefícios potenciais tanto para técnicas de avaliação de objetos complexos quanto para descoberta de conhecimento na área médica. |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-03-21 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/55/55134/tde-05062023-101705/ |
url |
https://www.teses.usp.br/teses/disponiveis/55/55134/tde-05062023-101705/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815256696120934400 |