Semantic web technologies for the information retrieval on wikidata
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Outros Autores: | , |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Revista Digital de Biblioteconomia e Ciência da Informação |
Texto Completo: | https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8651791 |
Resumo: | Information Retrieval is responsible for the storage and automatic retrieval of information, and these documents may consist of texts, web pages, audio, video, images, graphics and figures. Information Retrieval techniques have gained importance with the growth of the Web, because the unlimited amount of information can express the most diverse forms and levels of quality to what is expected. With this in mind, the present work studies methods and technologies capable of retrieving this information, focusing on searching structured databases called Linked Data, but specifically on the Wikidata project, a database structured using Semantic Web concepts, which brings together the knowledge from Wikipedia. Seeking to understand how this information retrieval is done in the Wikidata project, this research has the objective of presenting the media that Wikidata provides to RI and how they use the principles of the Semantic Web. The methodology used was an exploratory study based on the research and applied, since tests were done in the database of Wikidata. As a result, the characteristics of the various forms of data access and retrieval were identified, tracing the correlations between each of these forms, with the theoretical framework of the Semantic Web and Information Retrieval. It was concluded that Wikidata stands as a solid database, with a large volume of contents, quite current, that has a series of recovery mechanisms, capable of serving the most diverse applications on the Web, because these mechanisms are built with different technologies and configurations. |
id |
UNICAMP-4_43e5069c86c8b47c218a66c42c4cc245 |
---|---|
oai_identifier_str |
oai:ojs.periodicos.sbu.unicamp.br:article/8651791 |
network_acronym_str |
UNICAMP-4 |
network_name_str |
Revista Digital de Biblioteconomia e Ciência da Informação |
repository_id_str |
|
spelling |
Semantic web technologies for the information retrieval on wikidataTecnologias da web semântica para a recuperação da informação no wikidataWeb semânticaRecuperação da informaçãoLinked dataWikidata.Semantic webInformation retrievalLinked dataWikidata.Information Retrieval is responsible for the storage and automatic retrieval of information, and these documents may consist of texts, web pages, audio, video, images, graphics and figures. Information Retrieval techniques have gained importance with the growth of the Web, because the unlimited amount of information can express the most diverse forms and levels of quality to what is expected. With this in mind, the present work studies methods and technologies capable of retrieving this information, focusing on searching structured databases called Linked Data, but specifically on the Wikidata project, a database structured using Semantic Web concepts, which brings together the knowledge from Wikipedia. Seeking to understand how this information retrieval is done in the Wikidata project, this research has the objective of presenting the media that Wikidata provides to RI and how they use the principles of the Semantic Web. The methodology used was an exploratory study based on the research and applied, since tests were done in the database of Wikidata. As a result, the characteristics of the various forms of data access and retrieval were identified, tracing the correlations between each of these forms, with the theoretical framework of the Semantic Web and Information Retrieval. It was concluded that Wikidata stands as a solid database, with a large volume of contents, quite current, that has a series of recovery mechanisms, capable of serving the most diverse applications on the Web, because these mechanisms are built with different technologies and configurations.A Recuperação da Informação é responsável pelo armazenamento e pela recuperação automática de informação, podendo estes documentos ser constituídos por textos, páginas Web, áudio, vídeo, imagens, gráficos e figuras. Técnicas de Recuperação de Informação ganharam importância com o crescimento da Web, pois a quantidade ilimitada de informação pode expressar as mais diversas formas e níveis de qualidade ao que se espera. Pensando nisso o presente trabalho estuda métodos e tecnologias capazes de recuperar essas informações, dando enfoque a buscar em bases de dados estruturadas chamadas Linked Data, mas especificamente no Wikidata, uma base de dados estruturada utilizando conceitos da Web Semântica, que reúne conhecimentos da Wikipédia. Buscando compreender como é feita essa recuperação da informação no projeto Wikidata, esta pesquisa tem como objetivo apresentar os meios que o Wikidata fornece para a RI e como eles usam os princípios da Web Semântica. A metodologia utilizada foi um estudo exploratório com embasamento para a pesquisa e aplicada, uma vez que testes foram feitos na base de dados do Wikidata. Como resultados, identificou-se características das diversas formas de acesso e de recuperação dos dados, traçando correlações existentes entre cada uma destas formas, com o arcabouço teórico da Web Semântica e da Recuperação da Informação. Concluiu-se que o Wikidata se coloca como uma base de dados sólida, com um grande volume de conteúdo que possui uma série de mecanismos de recuperação, capazes de atender às mais diversas aplicações existentes na Web, devido a estes mecanismos serem construídos com distintas tecnologias e configurações.Universidade Estadual de Campinas2019-01-04info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionTextoinfo:eu-repo/semantics/otherapplication/pdfapplication/pdfapplication/pdfhttps://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/865179110.20396/rdbci.v17i0.8651791RDBCI: Digital Journal of Library and Information Science; Vol. 17 (2019): Continuous Publishing; e019003RDBCI: Revista Digital de Biblioteconomia e Ciência da Informação; v. 17 (2019): Publicação Contínua; e0190031678-765Xreponame:Revista Digital de Biblioteconomia e Ciência da Informaçãoinstname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPporhttps://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8651791/pdfhttps://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8651791/pdf_1https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8651791/20317Brazil; ContemporaryBrasil; ContemporâneoLuz, Larissa Pavarini daConeglian, Caio SaraivaSantarem Segundo, José Eduardoinfo:eu-repo/semantics/openAccess2019-12-18T11:31:13Zoai:ojs.periodicos.sbu.unicamp.br:article/8651791Revistahttps://periodicos.sbu.unicamp.br/ojs/index.php/rdbciPUBhttps://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/oaippec@unicamp.br||gilbfe@unicamp.br|| rdbci@unicamp.br|| danif@unicamp.br1678-765X1678-765Xopendoar:2023-05-22T10:16:24.582145Revista Digital de Biblioteconomia e Ciência da Informação - Universidade Estadual de Campinas (UNICAMP)false |
dc.title.none.fl_str_mv |
Semantic web technologies for the information retrieval on wikidata Tecnologias da web semântica para a recuperação da informação no wikidata |
title |
Semantic web technologies for the information retrieval on wikidata |
spellingShingle |
Semantic web technologies for the information retrieval on wikidata Luz, Larissa Pavarini da Web semântica Recuperação da informação Linked data Wikidata. Semantic web Information retrieval Linked data Wikidata. |
title_short |
Semantic web technologies for the information retrieval on wikidata |
title_full |
Semantic web technologies for the information retrieval on wikidata |
title_fullStr |
Semantic web technologies for the information retrieval on wikidata |
title_full_unstemmed |
Semantic web technologies for the information retrieval on wikidata |
title_sort |
Semantic web technologies for the information retrieval on wikidata |
author |
Luz, Larissa Pavarini da |
author_facet |
Luz, Larissa Pavarini da Coneglian, Caio Saraiva Santarem Segundo, José Eduardo |
author_role |
author |
author2 |
Coneglian, Caio Saraiva Santarem Segundo, José Eduardo |
author2_role |
author author |
dc.contributor.author.fl_str_mv |
Luz, Larissa Pavarini da Coneglian, Caio Saraiva Santarem Segundo, José Eduardo |
dc.subject.por.fl_str_mv |
Web semântica Recuperação da informação Linked data Wikidata. Semantic web Information retrieval Linked data Wikidata. |
topic |
Web semântica Recuperação da informação Linked data Wikidata. Semantic web Information retrieval Linked data Wikidata. |
description |
Information Retrieval is responsible for the storage and automatic retrieval of information, and these documents may consist of texts, web pages, audio, video, images, graphics and figures. Information Retrieval techniques have gained importance with the growth of the Web, because the unlimited amount of information can express the most diverse forms and levels of quality to what is expected. With this in mind, the present work studies methods and technologies capable of retrieving this information, focusing on searching structured databases called Linked Data, but specifically on the Wikidata project, a database structured using Semantic Web concepts, which brings together the knowledge from Wikipedia. Seeking to understand how this information retrieval is done in the Wikidata project, this research has the objective of presenting the media that Wikidata provides to RI and how they use the principles of the Semantic Web. The methodology used was an exploratory study based on the research and applied, since tests were done in the database of Wikidata. As a result, the characteristics of the various forms of data access and retrieval were identified, tracing the correlations between each of these forms, with the theoretical framework of the Semantic Web and Information Retrieval. It was concluded that Wikidata stands as a solid database, with a large volume of contents, quite current, that has a series of recovery mechanisms, capable of serving the most diverse applications on the Web, because these mechanisms are built with different technologies and configurations. |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019-01-04 |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion Texto info:eu-repo/semantics/other |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8651791 10.20396/rdbci.v17i0.8651791 |
url |
https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8651791 |
identifier_str_mv |
10.20396/rdbci.v17i0.8651791 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8651791/pdf https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8651791/pdf_1 https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8651791/20317 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf application/pdf application/pdf |
dc.coverage.none.fl_str_mv |
Brazil; Contemporary Brasil; Contemporâneo |
dc.publisher.none.fl_str_mv |
Universidade Estadual de Campinas |
publisher.none.fl_str_mv |
Universidade Estadual de Campinas |
dc.source.none.fl_str_mv |
RDBCI: Digital Journal of Library and Information Science; Vol. 17 (2019): Continuous Publishing; e019003 RDBCI: Revista Digital de Biblioteconomia e Ciência da Informação; v. 17 (2019): Publicação Contínua; e019003 1678-765X reponame:Revista Digital de Biblioteconomia e Ciência da Informação instname:Universidade Estadual de Campinas (UNICAMP) instacron:UNICAMP |
instname_str |
Universidade Estadual de Campinas (UNICAMP) |
instacron_str |
UNICAMP |
institution |
UNICAMP |
reponame_str |
Revista Digital de Biblioteconomia e Ciência da Informação |
collection |
Revista Digital de Biblioteconomia e Ciência da Informação |
repository.name.fl_str_mv |
Revista Digital de Biblioteconomia e Ciência da Informação - Universidade Estadual de Campinas (UNICAMP) |
repository.mail.fl_str_mv |
ppec@unicamp.br||gilbfe@unicamp.br|| rdbci@unicamp.br|| danif@unicamp.br |
_version_ |
1788167559498956800 |