Visualização de distribuições de dados complexos provenientes de fontes heterogêneas

Detalhes bibliográficos
Autor(a) principal: Martins, Natalia de Fatima
Data de Publicação: 2023
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-05062023-101705/
Resumo: Os Sistemas de Gerenciamento de Bases de Dados (SGBD) baseados na Teoria Relacional foram desenvolvidos para atender às necessidades de armazenagem e recuperação de dados representados por valores numéricos, datas e pequenas cadeias de caracteres, chamados genericamente de dados escalares. Consultas sobre dados escalares são feitas por comparações baseadas em relações de identidade ou relações de ordem. Com a evolução da tecnologia da informação, se faz necessário organizar, armazenar e recuperar outros tipos de dados, tais como imagens, vídeos, séries temporais, sequências genômicas etc. A esses, nos referimos como dados complexos, porque eles não são comparados diretamente, mas por meio de funções de extração de características aplicadas sobre os dados. Portanto, uma vez extraídas, as características são utilizadas no lugar dos dados originais para executar as comparações. Considerando, ainda, a crescente e genuína necessidade de se analisar grandes volumes de dados de diferentes e diversas áreas do conhecimento, em destaque, a área médica, objeto deste trabalho e avaliando as inerentes limitações das técnicas mais frequentes, apresentamos, neste trabalho, uma abordagem alternativa, utilizando ferramentas de visualização (Tableau) para avaliar e gerar insights sobre objetos complexos (pacientes) através da modelagem de EHR (Eletronic Health Records) disponibilizados pelo Hospital do Coração (InCor). Estes, por sua vez, estão armazenados sobre o padrão OMOP, uma arquitetura de dados Entidade-valor-Atributo que também é desafiadora para analistas e outros profissionais da área de dados. O resultado deste trabalho é apresentar um caminho prático e aplicável que oferece benefícios potenciais tanto para técnicas de avaliação de objetos complexos quanto para descoberta de conhecimento na área médica.
id USP_6a811eee26ebf93e23ea39c5604be16f
oai_identifier_str oai:teses.usp.br:tde-05062023-101705
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Visualização de distribuições de dados complexos provenientes de fontes heterogêneasVisualization of complex data distributions from heterogeneous sourcesDados heterogêneosData VisualizationEletronic health records EHRHeterogeneous dataOMOP CDMOMOP CDMRegistros médicos EHRSimilaridadeSimilarityVisualização de dadosOs Sistemas de Gerenciamento de Bases de Dados (SGBD) baseados na Teoria Relacional foram desenvolvidos para atender às necessidades de armazenagem e recuperação de dados representados por valores numéricos, datas e pequenas cadeias de caracteres, chamados genericamente de dados escalares. Consultas sobre dados escalares são feitas por comparações baseadas em relações de identidade ou relações de ordem. Com a evolução da tecnologia da informação, se faz necessário organizar, armazenar e recuperar outros tipos de dados, tais como imagens, vídeos, séries temporais, sequências genômicas etc. A esses, nos referimos como dados complexos, porque eles não são comparados diretamente, mas por meio de funções de extração de características aplicadas sobre os dados. Portanto, uma vez extraídas, as características são utilizadas no lugar dos dados originais para executar as comparações. Considerando, ainda, a crescente e genuína necessidade de se analisar grandes volumes de dados de diferentes e diversas áreas do conhecimento, em destaque, a área médica, objeto deste trabalho e avaliando as inerentes limitações das técnicas mais frequentes, apresentamos, neste trabalho, uma abordagem alternativa, utilizando ferramentas de visualização (Tableau) para avaliar e gerar insights sobre objetos complexos (pacientes) através da modelagem de EHR (Eletronic Health Records) disponibilizados pelo Hospital do Coração (InCor). Estes, por sua vez, estão armazenados sobre o padrão OMOP, uma arquitetura de dados Entidade-valor-Atributo que também é desafiadora para analistas e outros profissionais da área de dados. O resultado deste trabalho é apresentar um caminho prático e aplicável que oferece benefícios potenciais tanto para técnicas de avaliação de objetos complexos quanto para descoberta de conhecimento na área médica.Database Management Systems (DBMS) based on Relational Theory were developed to meet the needs of storing and retrieving data represented by numeric values, dates, and short strings of characters, generically called scalar data. Queries on scalar data are made by comparisons based on identity relations or order relations. With the evolution of information technology, it has become necessary to organize, store and retrieve other types of data, such as images, videos, time series, genomic sequences, etc. These we refer to as complex data, because they are not compared directly, but by means of feature extraction functions applied on the data. So once extracted, the features are used in place of the original data to perform the comparisons. the growing and genuine need to analyze large volumes of data from different and diverse areas of knowledge, in particular, the medical area, the object of this work Considering, furthermore, the growing and genuine need to analyze large volumes of data from different and diverse areas of knowledge, in particular, the medical area, object of this work and evaluating the inherent limitations of the most frequent techniques, we present in this paper an alternative approach, using visualization tools (Tableau) to evaluate and generate insights about complex objects (patients) through the modeling of EHR (Electronic Health Records) made available by the Hospital do Coração (InCor). These, in turn, are stored over the OMOP standard, an Entity-Value-Attribute data architecture that is also challenging for analysts and other data professionals. The result of this work is to present a practical and applicable way forward that offers potential benefits for both complex object evaluation techniques and knowledge discovery in the medical fieldBiblioteca Digitais de Teses e Dissertações da USPTraina Junior, CaetanoMartins, Natalia de Fatima2023-03-21info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55134/tde-05062023-101705/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2023-06-05T13:23:40Zoai:teses.usp.br:tde-05062023-101705Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-06-05T13:23:40Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Visualização de distribuições de dados complexos provenientes de fontes heterogêneas
Visualization of complex data distributions from heterogeneous sources
title Visualização de distribuições de dados complexos provenientes de fontes heterogêneas
spellingShingle Visualização de distribuições de dados complexos provenientes de fontes heterogêneas
Martins, Natalia de Fatima
Dados heterogêneos
Data Visualization
Eletronic health records EHR
Heterogeneous data
OMOP CDM
OMOP CDM
Registros médicos EHR
Similaridade
Similarity
Visualização de dados
title_short Visualização de distribuições de dados complexos provenientes de fontes heterogêneas
title_full Visualização de distribuições de dados complexos provenientes de fontes heterogêneas
title_fullStr Visualização de distribuições de dados complexos provenientes de fontes heterogêneas
title_full_unstemmed Visualização de distribuições de dados complexos provenientes de fontes heterogêneas
title_sort Visualização de distribuições de dados complexos provenientes de fontes heterogêneas
author Martins, Natalia de Fatima
author_facet Martins, Natalia de Fatima
author_role author
dc.contributor.none.fl_str_mv Traina Junior, Caetano
dc.contributor.author.fl_str_mv Martins, Natalia de Fatima
dc.subject.por.fl_str_mv Dados heterogêneos
Data Visualization
Eletronic health records EHR
Heterogeneous data
OMOP CDM
OMOP CDM
Registros médicos EHR
Similaridade
Similarity
Visualização de dados
topic Dados heterogêneos
Data Visualization
Eletronic health records EHR
Heterogeneous data
OMOP CDM
OMOP CDM
Registros médicos EHR
Similaridade
Similarity
Visualização de dados
description Os Sistemas de Gerenciamento de Bases de Dados (SGBD) baseados na Teoria Relacional foram desenvolvidos para atender às necessidades de armazenagem e recuperação de dados representados por valores numéricos, datas e pequenas cadeias de caracteres, chamados genericamente de dados escalares. Consultas sobre dados escalares são feitas por comparações baseadas em relações de identidade ou relações de ordem. Com a evolução da tecnologia da informação, se faz necessário organizar, armazenar e recuperar outros tipos de dados, tais como imagens, vídeos, séries temporais, sequências genômicas etc. A esses, nos referimos como dados complexos, porque eles não são comparados diretamente, mas por meio de funções de extração de características aplicadas sobre os dados. Portanto, uma vez extraídas, as características são utilizadas no lugar dos dados originais para executar as comparações. Considerando, ainda, a crescente e genuína necessidade de se analisar grandes volumes de dados de diferentes e diversas áreas do conhecimento, em destaque, a área médica, objeto deste trabalho e avaliando as inerentes limitações das técnicas mais frequentes, apresentamos, neste trabalho, uma abordagem alternativa, utilizando ferramentas de visualização (Tableau) para avaliar e gerar insights sobre objetos complexos (pacientes) através da modelagem de EHR (Eletronic Health Records) disponibilizados pelo Hospital do Coração (InCor). Estes, por sua vez, estão armazenados sobre o padrão OMOP, uma arquitetura de dados Entidade-valor-Atributo que também é desafiadora para analistas e outros profissionais da área de dados. O resultado deste trabalho é apresentar um caminho prático e aplicável que oferece benefícios potenciais tanto para técnicas de avaliação de objetos complexos quanto para descoberta de conhecimento na área médica.
publishDate 2023
dc.date.none.fl_str_mv 2023-03-21
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/55/55134/tde-05062023-101705/
url https://www.teses.usp.br/teses/disponiveis/55/55134/tde-05062023-101705/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815256696120934400