Detalhes bibliográficos
Título da fonte: Repositório Institucional da UFMG
id UFMG_4e3334e03f24bea81adc7aa38e594a52
oai_identifier_str oai:repositorio.ufmg.br:1843/36618
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
reponame_str Repositório Institucional da UFMG
instacron_str UFMG
institution Universidade Federal de Minas Gerais (UFMG)
instname_str Universidade Federal de Minas Gerais (UFMG)
spelling Marcello Peixoto Baxhttp://lattes.cnpq.br/1864473087690223Frederico Cesar Mafra PereiraRenata Maria Abrantes Baracho PortoElisângela Cristina Aganettehttp://lattes.cnpq.br/8076034350765004Rafael Rocha2021-06-30T12:43:03Z2021-06-30T12:43:03Z2021-02-22http://hdl.handle.net/1843/36618https://orcid.org/0000-0002-9719-1741A web semântica representa o conhecimento de maneira legível para seres humanos e computadores. “Dados conectados” (linked data) semanticamente associam conceitos de diversas fontes, e o reúso de dados e vocabulários enriquece diversos sistemas de informação na web, sobretudo aqueles voltados para organizar dados de pesquisas científicas. Tais sistemas manipulam dados tabulares em grades bidimensionais (arquivos CSV - Comma Separated Values) com seus metadados localizados no cabeçalho do arquivo (primeira linha do arquivo). Em geral, os metadados do CSV são insuficientes para possibilitar integração e interoperabilidade semântica, i.e., a capacidade dos sistemas de se comunicar de forma transparente (ou o mais próximo disso) com outros sistemas (semelhantes ou não). Para contribuir nas pesquisas, os arquivos CSV devem ser integrados semanticamente e armazenados em repositórios de dados. Os dados tabulares precisam ter seus significados explicitados de modo que os conceitos tratados não se percam ou tenham seus significados distorcidos. O processo de integração semântica de dados é realizado por ferramentas que automatizam o processo, com o intuito de sistematizar e agilizar o trabalho, minimizando os erros humanos. Essas ferramentas possuem características e implementações distintas e os recursos (ou funcionalidades) disponíveis em cada uma delas impactam na sua capacidade de integrar os dados gerando dados conectados para a web semântica. Um determinado projeto de integração de dados pode fracassar caso a ferramenta escolhida para gerar dados conectados não possua os recursos necessários ao projeto. Diversos arcabouços comparativos foram propostos para avaliar ferramentas na geração de dados conectados, mas nenhum deles utiliza uma escala de valores que simplifique a avaliação e a sumarização dos resultados das análises. Propõe-se nesta pesquisa um arcabouço comparativo para ferramentas para integração semântica de dados tabulares em CSV. Os recursos do arcabouço são fundamentados na literatura científica com pontos dispostos em uma reta numérica positiva. No percurso metodológico utiliza-se um arquivo em CSV no processo de integração semântica, em seguida as ferramentas são avaliadas à luz do arcabouço comparativo. Assim, dispondo as ferramentas em uma reta numérica positiva é possível saber quais delas possuem os recursos mais adequados para um dado projeto de integração ou ainda os recursos mais bem avaliados. Os resultados deste trabalho são úteis para todos aqueles que necessitam avaliar ferramentas em seus projetos de integração semântica de dados, principalmente nas pesquisas científicas, uma vez que os dados conectados conceitualmente contribuem sobremaneira para as mesmas.The semantic web represents knowledge in a human-readable and machine-readable form. Linked data semantically associate concepts from different sources, and the reuse of data and vocabularies enriches information systems on the web, especially those aimed at organizing scientific research data. Such systems manipulate tabular data in two-dimensional degrees (CSV files - Comma Separated Values) with their associated metadata in the file header (first line of the file). In general, CSV metadata is insufficient to enable semantic integration and interoperability, that is, the ability of systems to communicate transparently (or as closely as possible) with other similar systems (or not). To contribute to research, CSV files must be integrated semantically and stored in data repositories. Tabular data must have its meanings made explicit so that the concepts treated are not lost or have their meanings distorted. The process of semantic data integration is performed by tools that automate the process, in order to systematize and streamline the work, minimizing human errors. These tools have different characteristics and implementations and the features (or functionalities) available in each of them impact on their ability to integrate data generating linked data for semantic web. A given data integration project can fail if the tool chosen to generate linked data does not have the features available to the project. Several comparison frameworks have been proposed to evaluate tools in the generation of linked data, but none of them uses a scale of values that simplifies the evaluation and summary of the results of the analyzes. This research proposes a comparison framework for semantic integration tools of tabular data in CSV. The features of the framework are based on the scientific literature with points arranged on a positive number line. In the methodological path, a CSV file is used in the semantic integration process, then the tools are evaluated in the light of the comparison framework. Thus, having the tools on a positive number line, it is possible to know which of them have the most adequate features for a given integration project or even the best evaluated features. The results of this work are useful for all those who need to evaluate tools in their semantic data integration projects, especially in scientific research, since the data connected conceptually contribute greatly to them.porUniversidade Federal de Minas GeraisPrograma de Pós-Graduação em Gestão e Organização do ConhecimentoUFMGBrasilECI - ESCOLA DE CIENCIA DA INFORMAÇÃOhttp://creativecommons.org/licenses/by-nd/3.0/pt/info:eu-repo/semantics/openAccessCiência da informaçãoIntegração semânticaDados tabularesFerramentas para integração semânticaArcabouço comparativoWeb semânticaDados conectadosIntegração semântica de dados tabulares em CSV: proposta de arcabouço comparativo de ferramentasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALDissertacaoRafaelRocha_A.pdfDissertacaoRafaelRocha_A.pdfapplication/pdf7614927https://repositorio.ufmg.br/bitstream/1843/36618/1/DissertacaoRafaelRocha_A.pdf6ba98cab0e54dccb6d8fb61ef135407aMD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8805https://repositorio.ufmg.br/bitstream/1843/36618/2/license_rdf00e5e6a57d5512d202d12cb48704dfd6MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82119https://repositorio.ufmg.br/bitstream/1843/36618/3/license.txt34badce4be7e31e3adb4575ae96af679MD531843/366182021-06-30 09:43:04.217oai:repositorio.ufmg.br:1843/36618TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEgRE8gUkVQT1NJVMOTUklPIElOU1RJVFVDSU9OQUwgREEgVUZNRwoKQ29tIGEgYXByZXNlbnRhw6fDo28gZGVzdGEgbGljZW7Dp2EsIHZvY8OqIChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSBhbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIChSSS1VRk1HKSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZSBpcnJldm9nw6F2ZWwgZGUgcmVwcm9kdXppciBlL291IGRpc3RyaWJ1aXIgYSBzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zIMOhdWRpbyBvdSB2w61kZW8uCgpWb2PDqiBkZWNsYXJhIHF1ZSBjb25oZWNlIGEgcG9sw610aWNhIGRlIGNvcHlyaWdodCBkYSBlZGl0b3JhIGRvIHNldSBkb2N1bWVudG8gZSBxdWUgY29uaGVjZSBlIGFjZWl0YSBhcyBEaXJldHJpemVzIGRvIFJJLVVGTUcuCgpWb2PDqiBjb25jb3JkYSBxdWUgbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGTUcgcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIGRlIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBmaW5zIGRlIHNlZ3VyYW7Dp2EsIGJhY2stdXAgZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogZGVjbGFyYSBxdWUgYSBzdWEgcHVibGljYcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIHZvY8OqIHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRlIHN1YSBwdWJsaWNhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHB1YmxpY2HDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHB1YmxpY2HDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBQVUJMSUNBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UgQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgRVhJR0lEQVMgUE9SIENPTlRSQVRPIE9VIEFDT1JETy4KCk8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lKHMpIG91IG8ocykgbm9tZXMocykgZG8ocykgZGV0ZW50b3IoZXMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4KCg==Repositório InstitucionalPUBhttps://repositorio.ufmg.br/oaiopendoar:2021-06-30T12:43:04Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
_version_ 1813548056604311552