Uma Estratégia para Publicação de um Linked Open Data Baseado em Data Warehouse

Detalhes bibliográficos
Autor(a) principal: Oliveira, Davison André Zangerolami de
Data de Publicação: 2012
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFMS
Texto Completo: https://repositorio.ufms.br/handle/123456789/1651
Resumo: O Minist erio da Educa c~ao (MEC) e o Instituto de Estudos e Pesquisas em Educa c~ao An sio Teixeira (INEP) v^em aplicando censos e avalia c~oes educacionais a m de auxiliar a tomada de decis~ao em rela c~ao as pol ticas educacionais no Brasil. Com isso, e preciso que os dados gerados sejam transformados em dados estat stico-educacionais de forma agil, auxiliando a visualiza c~ao da realidade socioeducacional do pa s. Nesse contexto, este projeto visa trabalhar com os microdados do ENEM (Exame Nacional do Ensino M edio), no per odo de 1998 at e 2008, disponibilizados no formato ASCII, e transform a-los em um Data Warehouse (DW), o qual deve dar suporte a consultas anal ticas que subsidiar~ao a tomada de decis~ao. Ap os a naliza c~ao do DW, e realizada a cria c~ao de um Linked Open Data (LOD) para o ENEM, que se destina a dar suporte a pesquisa de informa c~oes de forma automatizada e tamb em oferecer suporte a descoberta de novas liga c~oes/associa c~oes entre os dados. Al em disso, foram selecionados e analisados tr^es processos open sources para serem analisados: o primeiro utiliza as ferramentas Stdtrip, Triplify e Virtuoso; o segundo utiliza Ontowiki, Olap2DataCube e Virtuoso; e o terceiro processo utiliza as ferramentas Babel e Virtuoso, sendo que a ferramenta Olap2DataCube foi a escolhida para uso no projeto, pois foi a que apresentou melhor desempenho no processo de tripli ca c~ao. Dessa forma, a contribui c~ao pr atica deste projeto e o desenvolvimento de um modelo de processo de publica c~ao de Linked Data, consistindo na tripli ca c~ao dos dados do DWENEM e sua libera c~ao para consulta via SPARQL no banco Virtuoso.
id UFMS_2c3abc43665fe1817581ceaeedf7047c
oai_identifier_str oai:repositorio.ufms.br:123456789/1651
network_acronym_str UFMS
network_name_str Repositório Institucional da UFMS
repository_id_str 2124
spelling 2012-10-25T16:32:29Z2021-09-30T19:56:14Z2012https://repositorio.ufms.br/handle/123456789/1651O Minist erio da Educa c~ao (MEC) e o Instituto de Estudos e Pesquisas em Educa c~ao An sio Teixeira (INEP) v^em aplicando censos e avalia c~oes educacionais a m de auxiliar a tomada de decis~ao em rela c~ao as pol ticas educacionais no Brasil. Com isso, e preciso que os dados gerados sejam transformados em dados estat stico-educacionais de forma agil, auxiliando a visualiza c~ao da realidade socioeducacional do pa s. Nesse contexto, este projeto visa trabalhar com os microdados do ENEM (Exame Nacional do Ensino M edio), no per odo de 1998 at e 2008, disponibilizados no formato ASCII, e transform a-los em um Data Warehouse (DW), o qual deve dar suporte a consultas anal ticas que subsidiar~ao a tomada de decis~ao. Ap os a naliza c~ao do DW, e realizada a cria c~ao de um Linked Open Data (LOD) para o ENEM, que se destina a dar suporte a pesquisa de informa c~oes de forma automatizada e tamb em oferecer suporte a descoberta de novas liga c~oes/associa c~oes entre os dados. Al em disso, foram selecionados e analisados tr^es processos open sources para serem analisados: o primeiro utiliza as ferramentas Stdtrip, Triplify e Virtuoso; o segundo utiliza Ontowiki, Olap2DataCube e Virtuoso; e o terceiro processo utiliza as ferramentas Babel e Virtuoso, sendo que a ferramenta Olap2DataCube foi a escolhida para uso no projeto, pois foi a que apresentou melhor desempenho no processo de tripli ca c~ao. Dessa forma, a contribui c~ao pr atica deste projeto e o desenvolvimento de um modelo de processo de publica c~ao de Linked Data, consistindo na tripli ca c~ao dos dados do DWENEM e sua libera c~ao para consulta via SPARQL no banco Virtuoso.The Ministry of Education (MEC), together with An sio Teixeira Institute of Educational Studies and Research (INEP), has been making assessments through censuses and educational tests, whose purpose is to assist the decision making process regarding Brazilian education policies. To accomplish that, it is necessary that all the collected data be e ciently turned into statistic-educational data, which will help picturing Brazil's socio-educational reality. That being so, this project is going to work on micro data from ENEM, from 1998 to 2008, which were made available in ASCII format, and turn such micro data into a Data Warehouse (DW) that will assist analytical searches supporting the decision making process. After nishing the DW, a Linked Open Data (LOD) will be developed. The purpose of such technology is to help searching information in an automated way and also to promote the discovery of new connections among data. Furthermore, three processes were chosen to be analyzed, each one with its separate set of open source tools: the rst uses Stdtrip, Triplify and Virtuoso; the second uses Ontowiki, Olap2Data Cube and Virtuoso, and the third process uses Babel and Virtuoso. Due to a better performance in the triplifying process, the tool Olap2Data Cube was chosen as the best tool for this project. The nal result is the tripli cation of all the data on the DW and its resulting availability for searches on Virtuoso's database via SPARQL.porSoftware GratuitoOpen Source SoftwareAvaliação EducacionalEducational EvaluationArmazenamento de DadosData WarehousingProcessamento Eletrônico de DadosElectronic Data ProcessingUma Estratégia para Publicação de um Linked Open Data Baseado em Data Warehouseinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisTurine, Marcelo Augusto SantosOliveira, Davison André Zangerolami deinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFMSinstname:Universidade Federal de Mato Grosso do Sul (UFMS)instacron:UFMSTHUMBNAILDavison Andre Zangerolami de Oliveira.pdf.jpgDavison Andre Zangerolami de Oliveira.pdf.jpgGenerated Thumbnailimage/jpeg1289https://repositorio.ufms.br/bitstream/123456789/1651/4/Davison%20Andre%20Zangerolami%20de%20Oliveira.pdf.jpg0848353f9f90ab31416429171ff45d7cMD54TEXTDavison Andre Zangerolami de Oliveira.pdf.txtDavison Andre Zangerolami de Oliveira.pdf.txtExtracted texttext/plain192840https://repositorio.ufms.br/bitstream/123456789/1651/3/Davison%20Andre%20Zangerolami%20de%20Oliveira.pdf.txt613ea83dbb60b87f88bb0a243976b6a4MD53ORIGINALDavison Andre Zangerolami de Oliveira.pdfDavison Andre Zangerolami de Oliveira.pdfapplication/pdf8625421https://repositorio.ufms.br/bitstream/123456789/1651/1/Davison%20Andre%20Zangerolami%20de%20Oliveira.pdf8c11f7b877c50172045a4cab71410329MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ufms.br/bitstream/123456789/1651/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52123456789/16512021-09-30 15:56:14.675oai:repositorio.ufms.br:123456789/1651Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.ufms.br/oai/requestri.prograd@ufms.bropendoar:21242021-09-30T19:56:14Repositório Institucional da UFMS - Universidade Federal de Mato Grosso do Sul (UFMS)false
dc.title.pt_BR.fl_str_mv Uma Estratégia para Publicação de um Linked Open Data Baseado em Data Warehouse
title Uma Estratégia para Publicação de um Linked Open Data Baseado em Data Warehouse
spellingShingle Uma Estratégia para Publicação de um Linked Open Data Baseado em Data Warehouse
Oliveira, Davison André Zangerolami de
Software Gratuito
Open Source Software
Avaliação Educacional
Educational Evaluation
Armazenamento de Dados
Data Warehousing
Processamento Eletrônico de Dados
Electronic Data Processing
title_short Uma Estratégia para Publicação de um Linked Open Data Baseado em Data Warehouse
title_full Uma Estratégia para Publicação de um Linked Open Data Baseado em Data Warehouse
title_fullStr Uma Estratégia para Publicação de um Linked Open Data Baseado em Data Warehouse
title_full_unstemmed Uma Estratégia para Publicação de um Linked Open Data Baseado em Data Warehouse
title_sort Uma Estratégia para Publicação de um Linked Open Data Baseado em Data Warehouse
author Oliveira, Davison André Zangerolami de
author_facet Oliveira, Davison André Zangerolami de
author_role author
dc.contributor.advisor1.fl_str_mv Turine, Marcelo Augusto Santos
dc.contributor.author.fl_str_mv Oliveira, Davison André Zangerolami de
contributor_str_mv Turine, Marcelo Augusto Santos
dc.subject.por.fl_str_mv Software Gratuito
Open Source Software
Avaliação Educacional
Educational Evaluation
Armazenamento de Dados
Data Warehousing
Processamento Eletrônico de Dados
Electronic Data Processing
topic Software Gratuito
Open Source Software
Avaliação Educacional
Educational Evaluation
Armazenamento de Dados
Data Warehousing
Processamento Eletrônico de Dados
Electronic Data Processing
description O Minist erio da Educa c~ao (MEC) e o Instituto de Estudos e Pesquisas em Educa c~ao An sio Teixeira (INEP) v^em aplicando censos e avalia c~oes educacionais a m de auxiliar a tomada de decis~ao em rela c~ao as pol ticas educacionais no Brasil. Com isso, e preciso que os dados gerados sejam transformados em dados estat stico-educacionais de forma agil, auxiliando a visualiza c~ao da realidade socioeducacional do pa s. Nesse contexto, este projeto visa trabalhar com os microdados do ENEM (Exame Nacional do Ensino M edio), no per odo de 1998 at e 2008, disponibilizados no formato ASCII, e transform a-los em um Data Warehouse (DW), o qual deve dar suporte a consultas anal ticas que subsidiar~ao a tomada de decis~ao. Ap os a naliza c~ao do DW, e realizada a cria c~ao de um Linked Open Data (LOD) para o ENEM, que se destina a dar suporte a pesquisa de informa c~oes de forma automatizada e tamb em oferecer suporte a descoberta de novas liga c~oes/associa c~oes entre os dados. Al em disso, foram selecionados e analisados tr^es processos open sources para serem analisados: o primeiro utiliza as ferramentas Stdtrip, Triplify e Virtuoso; o segundo utiliza Ontowiki, Olap2DataCube e Virtuoso; e o terceiro processo utiliza as ferramentas Babel e Virtuoso, sendo que a ferramenta Olap2DataCube foi a escolhida para uso no projeto, pois foi a que apresentou melhor desempenho no processo de tripli ca c~ao. Dessa forma, a contribui c~ao pr atica deste projeto e o desenvolvimento de um modelo de processo de publica c~ao de Linked Data, consistindo na tripli ca c~ao dos dados do DWENEM e sua libera c~ao para consulta via SPARQL no banco Virtuoso.
publishDate 2012
dc.date.accessioned.fl_str_mv 2012-10-25T16:32:29Z
dc.date.issued.fl_str_mv 2012
dc.date.available.fl_str_mv 2021-09-30T19:56:14Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufms.br/handle/123456789/1651
url https://repositorio.ufms.br/handle/123456789/1651
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMS
instname:Universidade Federal de Mato Grosso do Sul (UFMS)
instacron:UFMS
instname_str Universidade Federal de Mato Grosso do Sul (UFMS)
instacron_str UFMS
institution UFMS
reponame_str Repositório Institucional da UFMS
collection Repositório Institucional da UFMS
bitstream.url.fl_str_mv https://repositorio.ufms.br/bitstream/123456789/1651/4/Davison%20Andre%20Zangerolami%20de%20Oliveira.pdf.jpg
https://repositorio.ufms.br/bitstream/123456789/1651/3/Davison%20Andre%20Zangerolami%20de%20Oliveira.pdf.txt
https://repositorio.ufms.br/bitstream/123456789/1651/1/Davison%20Andre%20Zangerolami%20de%20Oliveira.pdf
https://repositorio.ufms.br/bitstream/123456789/1651/2/license.txt
bitstream.checksum.fl_str_mv 0848353f9f90ab31416429171ff45d7c
613ea83dbb60b87f88bb0a243976b6a4
8c11f7b877c50172045a4cab71410329
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMS - Universidade Federal de Mato Grosso do Sul (UFMS)
repository.mail.fl_str_mv ri.prograd@ufms.br
_version_ 1815448011807916032