Arcabouço comparativo de ferramentas para integração semântica de dados tabulares

Detalhes bibliográficos
Autor(a) principal: Marcello Peixoto Bax
Data de Publicação: 2020
Outros Autores: Rafael Rocha
Tipo de documento: Artigo de conferência
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/50934
https://orcid.org/0000-0003-0503-3031
https://orcid.org/0000-0002-9719-1741
Resumo: O Comma-Separated Values (CSV) é utilizado pelo seu baixo custo computacional, em contrapartida é necessário integrá-lo a um repositório de alto nível para agregar valor aos dados. Neste sentido, o Linked Data (LD) trouxe uma nova abordagem para enriquecer dados e gerar conhecimento. Instituições das mais diversas áreas podem extrair mais conhecimento dos dados quando estes estiverem em um formato semântico. Cada ferramenta semântica apresenta diferentes recursos que impactam diretamente na integração do LD a partir do CSV. Neste contexto, é um problema recorrente saber se a ferramenta possui todos os recursos demandados de um projeto de integração. Este trabalho propõe uma avaliação objetiva dos recursos presentes nas ferramentas que realizam integração semântica de dados em CSV. A classificação construída utiliza os recursos previamente avaliados na literatura em uma nova estrutura com agrupamento dos mesmos. Os recursos salientados na classificação formam o arcabouço comparativo que utiliza uma reta numérica positiva facilitando a avaliação das ferramentas. A classificação e o arcabouço podem ser utilizados em todas as áreas que haja integração semântica de dados. O resultado deste trabalho é possível avaliar os recursos implementados nas ferramentas que geram integração semântica em uma análise comparativa ágil.
id UFMG_94c88b1f5e4a4e8737012e7866b6524b
oai_identifier_str oai:repositorio.ufmg.br:1843/50934
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling 2023-03-15T21:54:40Z2023-03-15T21:54:40Z2020-1113; 41613-0073http://hdl.handle.net/1843/50934https://orcid.org/0000-0003-0503-3031https://orcid.org/0000-0002-9719-1741O Comma-Separated Values (CSV) é utilizado pelo seu baixo custo computacional, em contrapartida é necessário integrá-lo a um repositório de alto nível para agregar valor aos dados. Neste sentido, o Linked Data (LD) trouxe uma nova abordagem para enriquecer dados e gerar conhecimento. Instituições das mais diversas áreas podem extrair mais conhecimento dos dados quando estes estiverem em um formato semântico. Cada ferramenta semântica apresenta diferentes recursos que impactam diretamente na integração do LD a partir do CSV. Neste contexto, é um problema recorrente saber se a ferramenta possui todos os recursos demandados de um projeto de integração. Este trabalho propõe uma avaliação objetiva dos recursos presentes nas ferramentas que realizam integração semântica de dados em CSV. A classificação construída utiliza os recursos previamente avaliados na literatura em uma nova estrutura com agrupamento dos mesmos. Os recursos salientados na classificação formam o arcabouço comparativo que utiliza uma reta numérica positiva facilitando a avaliação das ferramentas. A classificação e o arcabouço podem ser utilizados em todas as áreas que haja integração semântica de dados. O resultado deste trabalho é possível avaliar os recursos implementados nas ferramentas que geram integração semântica em uma análise comparativa ágil.Comma-Separated Values (CSV) is used due to its low computational cost, on the other hand it is necessary to integrate it with a high-level repository to aggregate value to the data. In addition, Linked Data (LD) brought a new approach to enrich data and generate knowledge. Institutions in the most diverse areas can extract more knowledge from the data when it is coated in a semantic format. Each semantic tool has different features that directly impact the integration of LD from CSV. Hence, it is a recurring problem to know if the tool has all the features required for an integration project. This work proposes an objective evaluation of the features present in the tools that perform the semantic integration of data in CSV. The classification uses the features created in the literature in a new structure with their grouping. The salient features in the classification form the comparative framework that uses a positive number line facilitating the evaluation of the tools. The classification and framework can be used in all areas where there is semantic integration of data. The result of this work is possible to evaluate the features implemented in the tools that generate semantic integration in an agile comparative analysis.porUniversidade Federal de Minas GeraisUFMGBrasilECI - DEPARTAMENTO DE TEORIA E GESTÃO INFORMAÇÃOSeminar on Ontology Research in Brazil ; Doctoral and Masters Consortium on OntologiesCiência da informaçãoWeb semânticaSemântica - Processamento de dadosCSVLinked DataIntegração semântica de dadosArcabouço comparativo de ferramentas para integração semântica de dados tabularesComparative framework of tools for semantic integration of tabular datainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/conferenceObjecthttps://ceur-ws.org/Vol-2728/Marcello Peixoto BaxRafael Rochaapplication/pdfinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGLICENSELicense.txtLicense.txttext/plain; charset=utf-82042https://repositorio.ufmg.br/bitstream/1843/50934/1/License.txtfa505098d172de0bc8864fc1287ffe22MD51ORIGINALArcabouço Comparativo de Ferramentas para Integração Semântica de Dados Tabulares.pdfArcabouço Comparativo de Ferramentas para Integração Semântica de Dados Tabulares.pdfapplication/pdf211591https://repositorio.ufmg.br/bitstream/1843/50934/2/Arcabou%c3%a7o%20Comparativo%20de%20Ferramentas%20para%20Integra%c3%a7%c3%a3o%20Sem%c3%a2ntica%20de%20Dados%20Tabulares.pdfd935865eb32abece6eed4757560b31ddMD521843/509342023-03-15 19:02:46.356oai:repositorio.ufmg.br:1843/50934TElDRU7vv71BIERFIERJU1RSSUJVSe+/ve+/vU8gTu+/vU8tRVhDTFVTSVZBIERPIFJFUE9TSVTvv71SSU8gSU5TVElUVUNJT05BTCBEQSBVRk1HCiAKCkNvbSBhIGFwcmVzZW50Ye+/ve+/vW8gZGVzdGEgbGljZW7vv71hLCB2b2Pvv70gKG8gYXV0b3IgKGVzKSBvdSBvIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yKSBjb25jZWRlIGFvIFJlcG9zaXTvv71yaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIChSSS1VRk1HKSBvIGRpcmVpdG8gbu+/vW8gZXhjbHVzaXZvIGUgaXJyZXZvZ++/vXZlbCBkZSByZXByb2R1emlyIGUvb3UgZGlzdHJpYnVpciBhIHN1YSBwdWJsaWNh77+977+9byAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0cu+/vW5pY28gZSBlbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mg77+9dWRpbyBvdSB277+9ZGVvLgoKVm9j77+9IGRlY2xhcmEgcXVlIGNvbmhlY2UgYSBwb2zvv710aWNhIGRlIGNvcHlyaWdodCBkYSBlZGl0b3JhIGRvIHNldSBkb2N1bWVudG8gZSBxdWUgY29uaGVjZSBlIGFjZWl0YSBhcyBEaXJldHJpemVzIGRvIFJJLVVGTUcuCgpWb2Pvv70gY29uY29yZGEgcXVlIG8gUmVwb3NpdO+/vXJpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGTUcgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250Ze+/vWRvLCB0cmFuc3BvciBhIHN1YSBwdWJsaWNh77+977+9byBwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHvv73vv71vLgoKVm9j77+9IHRhbWLvv71tIGNvbmNvcmRhIHF1ZSBvIFJlcG9zaXTvv71yaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPvv71waWEgZGUgc3VhIHB1YmxpY2Hvv73vv71vIHBhcmEgZmlucyBkZSBzZWd1cmFu77+9YSwgYmFjay11cCBlIHByZXNlcnZh77+977+9by4KClZvY++/vSBkZWNsYXJhIHF1ZSBhIHN1YSBwdWJsaWNh77+977+9byDvv70gb3JpZ2luYWwgZSBxdWUgdm9j77+9IHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vu77+9YS4gVm9j77+9IHRhbWLvv71tIGRlY2xhcmEgcXVlIG8gZGVw77+9c2l0byBkZSBzdWEgcHVibGljYe+/ve+/vW8gbu+/vW8sIHF1ZSBzZWphIGRlIHNldSBjb25oZWNpbWVudG8sIGluZnJpbmdlIGRpcmVpdG9zIGF1dG9yYWlzIGRlIG5pbmd177+9bS4KCkNhc28gYSBzdWEgcHVibGljYe+/ve+/vW8gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY++/vSBu77+9byBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2Pvv70gZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc++/vW8gaXJyZXN0cml0YSBkbyBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgcGFyYSBjb25jZWRlciBhbyBSZXBvc2l077+9cmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7vv71hLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3Tvv70gY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBubyBjb250Ze+/vWRvIGRhIHB1YmxpY2Hvv73vv71vIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFBVQkxJQ0Hvv73vv71PIE9SQSBERVBPU0lUQURBIFRFTkhBIFNJRE8gUkVTVUxUQURPIERFIFVNIFBBVFJPQ++/vU5JTyBPVSBBUE9JTyBERSBVTUEgQUfvv71OQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PLCBWT0Pvv70gREVDTEFSQSBRVUUgUkVTUEVJVE9VIFRPRE9TIEUgUVVBSVNRVUVSIERJUkVJVE9TIERFIFJFVklT77+9TyBDT01PIFRBTULvv71NIEFTIERFTUFJUyBPQlJJR0Hvv73vv71FUyBFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKTyBSZXBvc2l077+9cmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lKHMpIG91IG8ocykgbm9tZXMocykgZG8ocykgZGV0ZW50b3IoZXMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkYSBwdWJsaWNh77+977+9bywgZSBu77+9byBmYXLvv70gcXVhbHF1ZXIgYWx0ZXJh77+977+9bywgYWzvv71tIGRhcXVlbGFzIGNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7vv71hLgo=Repositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2023-03-15T22:02:46Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Arcabouço comparativo de ferramentas para integração semântica de dados tabulares
dc.title.alternative.pt_BR.fl_str_mv Comparative framework of tools for semantic integration of tabular data
title Arcabouço comparativo de ferramentas para integração semântica de dados tabulares
spellingShingle Arcabouço comparativo de ferramentas para integração semântica de dados tabulares
Marcello Peixoto Bax
CSV
Linked Data
Integração semântica de dados
Ciência da informação
Web semântica
Semântica - Processamento de dados
title_short Arcabouço comparativo de ferramentas para integração semântica de dados tabulares
title_full Arcabouço comparativo de ferramentas para integração semântica de dados tabulares
title_fullStr Arcabouço comparativo de ferramentas para integração semântica de dados tabulares
title_full_unstemmed Arcabouço comparativo de ferramentas para integração semântica de dados tabulares
title_sort Arcabouço comparativo de ferramentas para integração semântica de dados tabulares
author Marcello Peixoto Bax
author_facet Marcello Peixoto Bax
Rafael Rocha
author_role author
author2 Rafael Rocha
author2_role author
dc.contributor.author.fl_str_mv Marcello Peixoto Bax
Rafael Rocha
dc.subject.por.fl_str_mv CSV
Linked Data
Integração semântica de dados
topic CSV
Linked Data
Integração semântica de dados
Ciência da informação
Web semântica
Semântica - Processamento de dados
dc.subject.other.pt_BR.fl_str_mv Ciência da informação
Web semântica
Semântica - Processamento de dados
description O Comma-Separated Values (CSV) é utilizado pelo seu baixo custo computacional, em contrapartida é necessário integrá-lo a um repositório de alto nível para agregar valor aos dados. Neste sentido, o Linked Data (LD) trouxe uma nova abordagem para enriquecer dados e gerar conhecimento. Instituições das mais diversas áreas podem extrair mais conhecimento dos dados quando estes estiverem em um formato semântico. Cada ferramenta semântica apresenta diferentes recursos que impactam diretamente na integração do LD a partir do CSV. Neste contexto, é um problema recorrente saber se a ferramenta possui todos os recursos demandados de um projeto de integração. Este trabalho propõe uma avaliação objetiva dos recursos presentes nas ferramentas que realizam integração semântica de dados em CSV. A classificação construída utiliza os recursos previamente avaliados na literatura em uma nova estrutura com agrupamento dos mesmos. Os recursos salientados na classificação formam o arcabouço comparativo que utiliza uma reta numérica positiva facilitando a avaliação das ferramentas. A classificação e o arcabouço podem ser utilizados em todas as áreas que haja integração semântica de dados. O resultado deste trabalho é possível avaliar os recursos implementados nas ferramentas que geram integração semântica em uma análise comparativa ágil.
publishDate 2020
dc.date.issued.fl_str_mv 2020-11
dc.date.accessioned.fl_str_mv 2023-03-15T21:54:40Z
dc.date.available.fl_str_mv 2023-03-15T21:54:40Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/conferenceObject
format conferenceObject
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/50934
dc.identifier.issn.pt_BR.fl_str_mv 1613-0073
dc.identifier.orcid.pt_BR.fl_str_mv https://orcid.org/0000-0003-0503-3031
https://orcid.org/0000-0002-9719-1741
identifier_str_mv 1613-0073
url http://hdl.handle.net/1843/50934
https://orcid.org/0000-0003-0503-3031
https://orcid.org/0000-0002-9719-1741
dc.language.iso.fl_str_mv por
language por
dc.relation.ispartof.none.fl_str_mv Seminar on Ontology Research in Brazil ; Doctoral and Masters Consortium on Ontologies
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv ECI - DEPARTAMENTO DE TEORIA E GESTÃO INFORMAÇÃO
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/50934/1/License.txt
https://repositorio.ufmg.br/bitstream/1843/50934/2/Arcabou%c3%a7o%20Comparativo%20de%20Ferramentas%20para%20Integra%c3%a7%c3%a3o%20Sem%c3%a2ntica%20de%20Dados%20Tabulares.pdf
bitstream.checksum.fl_str_mv fa505098d172de0bc8864fc1287ffe22
d935865eb32abece6eed4757560b31dd
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1803589332234141696