Uma Estratégia para Publicação de um Linked Open Data Baseado em Data Warehouse
Autor(a) principal: | |
---|---|
Data de Publicação: | 2012 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFMS |
Texto Completo: | https://repositorio.ufms.br/handle/123456789/1651 |
Resumo: | O Minist erio da Educa c~ao (MEC) e o Instituto de Estudos e Pesquisas em Educa c~ao An sio Teixeira (INEP) v^em aplicando censos e avalia c~oes educacionais a m de auxiliar a tomada de decis~ao em rela c~ao as pol ticas educacionais no Brasil. Com isso, e preciso que os dados gerados sejam transformados em dados estat stico-educacionais de forma agil, auxiliando a visualiza c~ao da realidade socioeducacional do pa s. Nesse contexto, este projeto visa trabalhar com os microdados do ENEM (Exame Nacional do Ensino M edio), no per odo de 1998 at e 2008, disponibilizados no formato ASCII, e transform a-los em um Data Warehouse (DW), o qual deve dar suporte a consultas anal ticas que subsidiar~ao a tomada de decis~ao. Ap os a naliza c~ao do DW, e realizada a cria c~ao de um Linked Open Data (LOD) para o ENEM, que se destina a dar suporte a pesquisa de informa c~oes de forma automatizada e tamb em oferecer suporte a descoberta de novas liga c~oes/associa c~oes entre os dados. Al em disso, foram selecionados e analisados tr^es processos open sources para serem analisados: o primeiro utiliza as ferramentas Stdtrip, Triplify e Virtuoso; o segundo utiliza Ontowiki, Olap2DataCube e Virtuoso; e o terceiro processo utiliza as ferramentas Babel e Virtuoso, sendo que a ferramenta Olap2DataCube foi a escolhida para uso no projeto, pois foi a que apresentou melhor desempenho no processo de tripli ca c~ao. Dessa forma, a contribui c~ao pr atica deste projeto e o desenvolvimento de um modelo de processo de publica c~ao de Linked Data, consistindo na tripli ca c~ao dos dados do DWENEM e sua libera c~ao para consulta via SPARQL no banco Virtuoso. |
id |
UFMS_2c3abc43665fe1817581ceaeedf7047c |
---|---|
oai_identifier_str |
oai:repositorio.ufms.br:123456789/1651 |
network_acronym_str |
UFMS |
network_name_str |
Repositório Institucional da UFMS |
repository_id_str |
2124 |
spelling |
2012-10-25T16:32:29Z2021-09-30T19:56:14Z2012https://repositorio.ufms.br/handle/123456789/1651O Minist erio da Educa c~ao (MEC) e o Instituto de Estudos e Pesquisas em Educa c~ao An sio Teixeira (INEP) v^em aplicando censos e avalia c~oes educacionais a m de auxiliar a tomada de decis~ao em rela c~ao as pol ticas educacionais no Brasil. Com isso, e preciso que os dados gerados sejam transformados em dados estat stico-educacionais de forma agil, auxiliando a visualiza c~ao da realidade socioeducacional do pa s. Nesse contexto, este projeto visa trabalhar com os microdados do ENEM (Exame Nacional do Ensino M edio), no per odo de 1998 at e 2008, disponibilizados no formato ASCII, e transform a-los em um Data Warehouse (DW), o qual deve dar suporte a consultas anal ticas que subsidiar~ao a tomada de decis~ao. Ap os a naliza c~ao do DW, e realizada a cria c~ao de um Linked Open Data (LOD) para o ENEM, que se destina a dar suporte a pesquisa de informa c~oes de forma automatizada e tamb em oferecer suporte a descoberta de novas liga c~oes/associa c~oes entre os dados. Al em disso, foram selecionados e analisados tr^es processos open sources para serem analisados: o primeiro utiliza as ferramentas Stdtrip, Triplify e Virtuoso; o segundo utiliza Ontowiki, Olap2DataCube e Virtuoso; e o terceiro processo utiliza as ferramentas Babel e Virtuoso, sendo que a ferramenta Olap2DataCube foi a escolhida para uso no projeto, pois foi a que apresentou melhor desempenho no processo de tripli ca c~ao. Dessa forma, a contribui c~ao pr atica deste projeto e o desenvolvimento de um modelo de processo de publica c~ao de Linked Data, consistindo na tripli ca c~ao dos dados do DWENEM e sua libera c~ao para consulta via SPARQL no banco Virtuoso.The Ministry of Education (MEC), together with An sio Teixeira Institute of Educational Studies and Research (INEP), has been making assessments through censuses and educational tests, whose purpose is to assist the decision making process regarding Brazilian education policies. To accomplish that, it is necessary that all the collected data be e ciently turned into statistic-educational data, which will help picturing Brazil's socio-educational reality. That being so, this project is going to work on micro data from ENEM, from 1998 to 2008, which were made available in ASCII format, and turn such micro data into a Data Warehouse (DW) that will assist analytical searches supporting the decision making process. After nishing the DW, a Linked Open Data (LOD) will be developed. The purpose of such technology is to help searching information in an automated way and also to promote the discovery of new connections among data. Furthermore, three processes were chosen to be analyzed, each one with its separate set of open source tools: the rst uses Stdtrip, Triplify and Virtuoso; the second uses Ontowiki, Olap2Data Cube and Virtuoso, and the third process uses Babel and Virtuoso. Due to a better performance in the triplifying process, the tool Olap2Data Cube was chosen as the best tool for this project. The nal result is the tripli cation of all the data on the DW and its resulting availability for searches on Virtuoso's database via SPARQL.porSoftware GratuitoOpen Source SoftwareAvaliação EducacionalEducational EvaluationArmazenamento de DadosData WarehousingProcessamento Eletrônico de DadosElectronic Data ProcessingUma Estratégia para Publicação de um Linked Open Data Baseado em Data Warehouseinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisTurine, Marcelo Augusto SantosOliveira, Davison André Zangerolami deinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFMSinstname:Universidade Federal de Mato Grosso do Sul (UFMS)instacron:UFMSTHUMBNAILDavison Andre Zangerolami de Oliveira.pdf.jpgDavison Andre Zangerolami de Oliveira.pdf.jpgGenerated Thumbnailimage/jpeg1289https://repositorio.ufms.br/bitstream/123456789/1651/4/Davison%20Andre%20Zangerolami%20de%20Oliveira.pdf.jpg0848353f9f90ab31416429171ff45d7cMD54TEXTDavison Andre Zangerolami de Oliveira.pdf.txtDavison Andre Zangerolami de Oliveira.pdf.txtExtracted texttext/plain192840https://repositorio.ufms.br/bitstream/123456789/1651/3/Davison%20Andre%20Zangerolami%20de%20Oliveira.pdf.txt613ea83dbb60b87f88bb0a243976b6a4MD53ORIGINALDavison Andre Zangerolami de Oliveira.pdfDavison Andre Zangerolami de Oliveira.pdfapplication/pdf8625421https://repositorio.ufms.br/bitstream/123456789/1651/1/Davison%20Andre%20Zangerolami%20de%20Oliveira.pdf8c11f7b877c50172045a4cab71410329MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ufms.br/bitstream/123456789/1651/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52123456789/16512021-09-30 15:56:14.675oai:repositorio.ufms.br:123456789/1651Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.ufms.br/oai/requestri.prograd@ufms.bropendoar:21242021-09-30T19:56:14Repositório Institucional da UFMS - Universidade Federal de Mato Grosso do Sul (UFMS)false |
dc.title.pt_BR.fl_str_mv |
Uma Estratégia para Publicação de um Linked Open Data Baseado em Data Warehouse |
title |
Uma Estratégia para Publicação de um Linked Open Data Baseado em Data Warehouse |
spellingShingle |
Uma Estratégia para Publicação de um Linked Open Data Baseado em Data Warehouse Oliveira, Davison André Zangerolami de Software Gratuito Open Source Software Avaliação Educacional Educational Evaluation Armazenamento de Dados Data Warehousing Processamento Eletrônico de Dados Electronic Data Processing |
title_short |
Uma Estratégia para Publicação de um Linked Open Data Baseado em Data Warehouse |
title_full |
Uma Estratégia para Publicação de um Linked Open Data Baseado em Data Warehouse |
title_fullStr |
Uma Estratégia para Publicação de um Linked Open Data Baseado em Data Warehouse |
title_full_unstemmed |
Uma Estratégia para Publicação de um Linked Open Data Baseado em Data Warehouse |
title_sort |
Uma Estratégia para Publicação de um Linked Open Data Baseado em Data Warehouse |
author |
Oliveira, Davison André Zangerolami de |
author_facet |
Oliveira, Davison André Zangerolami de |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Turine, Marcelo Augusto Santos |
dc.contributor.author.fl_str_mv |
Oliveira, Davison André Zangerolami de |
contributor_str_mv |
Turine, Marcelo Augusto Santos |
dc.subject.por.fl_str_mv |
Software Gratuito Open Source Software Avaliação Educacional Educational Evaluation Armazenamento de Dados Data Warehousing Processamento Eletrônico de Dados Electronic Data Processing |
topic |
Software Gratuito Open Source Software Avaliação Educacional Educational Evaluation Armazenamento de Dados Data Warehousing Processamento Eletrônico de Dados Electronic Data Processing |
description |
O Minist erio da Educa c~ao (MEC) e o Instituto de Estudos e Pesquisas em Educa c~ao An sio Teixeira (INEP) v^em aplicando censos e avalia c~oes educacionais a m de auxiliar a tomada de decis~ao em rela c~ao as pol ticas educacionais no Brasil. Com isso, e preciso que os dados gerados sejam transformados em dados estat stico-educacionais de forma agil, auxiliando a visualiza c~ao da realidade socioeducacional do pa s. Nesse contexto, este projeto visa trabalhar com os microdados do ENEM (Exame Nacional do Ensino M edio), no per odo de 1998 at e 2008, disponibilizados no formato ASCII, e transform a-los em um Data Warehouse (DW), o qual deve dar suporte a consultas anal ticas que subsidiar~ao a tomada de decis~ao. Ap os a naliza c~ao do DW, e realizada a cria c~ao de um Linked Open Data (LOD) para o ENEM, que se destina a dar suporte a pesquisa de informa c~oes de forma automatizada e tamb em oferecer suporte a descoberta de novas liga c~oes/associa c~oes entre os dados. Al em disso, foram selecionados e analisados tr^es processos open sources para serem analisados: o primeiro utiliza as ferramentas Stdtrip, Triplify e Virtuoso; o segundo utiliza Ontowiki, Olap2DataCube e Virtuoso; e o terceiro processo utiliza as ferramentas Babel e Virtuoso, sendo que a ferramenta Olap2DataCube foi a escolhida para uso no projeto, pois foi a que apresentou melhor desempenho no processo de tripli ca c~ao. Dessa forma, a contribui c~ao pr atica deste projeto e o desenvolvimento de um modelo de processo de publica c~ao de Linked Data, consistindo na tripli ca c~ao dos dados do DWENEM e sua libera c~ao para consulta via SPARQL no banco Virtuoso. |
publishDate |
2012 |
dc.date.accessioned.fl_str_mv |
2012-10-25T16:32:29Z |
dc.date.issued.fl_str_mv |
2012 |
dc.date.available.fl_str_mv |
2021-09-30T19:56:14Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufms.br/handle/123456789/1651 |
url |
https://repositorio.ufms.br/handle/123456789/1651 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMS instname:Universidade Federal de Mato Grosso do Sul (UFMS) instacron:UFMS |
instname_str |
Universidade Federal de Mato Grosso do Sul (UFMS) |
instacron_str |
UFMS |
institution |
UFMS |
reponame_str |
Repositório Institucional da UFMS |
collection |
Repositório Institucional da UFMS |
bitstream.url.fl_str_mv |
https://repositorio.ufms.br/bitstream/123456789/1651/4/Davison%20Andre%20Zangerolami%20de%20Oliveira.pdf.jpg https://repositorio.ufms.br/bitstream/123456789/1651/3/Davison%20Andre%20Zangerolami%20de%20Oliveira.pdf.txt https://repositorio.ufms.br/bitstream/123456789/1651/1/Davison%20Andre%20Zangerolami%20de%20Oliveira.pdf https://repositorio.ufms.br/bitstream/123456789/1651/2/license.txt |
bitstream.checksum.fl_str_mv |
0848353f9f90ab31416429171ff45d7c 613ea83dbb60b87f88bb0a243976b6a4 8c11f7b877c50172045a4cab71410329 8a4605be74aa9ea9d79846c1fba20a33 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFMS - Universidade Federal de Mato Grosso do Sul (UFMS) |
repository.mail.fl_str_mv |
ri.prograd@ufms.br |
_version_ |
1815448011807916032 |