Semantic web technologies for the information retrieval on wikidata

Detalhes bibliográficos
Autor(a) principal: Luz, Larissa Pavarini da
Data de Publicação: 2019
Outros Autores: Coneglian, Caio Saraiva, Santarem Segundo, José Eduardo
Tipo de documento: Artigo
Idioma: por
Título da fonte: Revista Digital de Biblioteconomia e Ciência da Informação
Texto Completo: https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8651791
Resumo: Information Retrieval is responsible for the storage and automatic retrieval of information, and these documents may consist of texts, web pages, audio, video, images, graphics and figures. Information Retrieval techniques have gained importance with the growth of the Web, because the unlimited amount of information can express the most diverse forms and levels of quality to what is expected. With this in mind, the present work studies methods and technologies capable of retrieving this information, focusing on searching structured databases called Linked Data, but specifically on the Wikidata project, a database structured using Semantic Web concepts, which brings together the knowledge from Wikipedia. Seeking to understand how this information retrieval is done in the Wikidata project, this research has the objective of presenting the media that Wikidata provides to RI and how they use the principles of the Semantic Web. The methodology used was an exploratory study based on the research and applied, since tests were done in the database of Wikidata. As a result, the characteristics of the various forms of data access and retrieval were identified, tracing the correlations between each of these forms, with the theoretical framework of the Semantic Web and Information Retrieval. It was concluded that Wikidata stands as a solid database, with a large volume of contents, quite current, that has a series of recovery mechanisms, capable of serving the most diverse applications on the Web, because these mechanisms are built with different technologies and configurations.
id UNICAMP-4_43e5069c86c8b47c218a66c42c4cc245
oai_identifier_str oai:ojs.periodicos.sbu.unicamp.br:article/8651791
network_acronym_str UNICAMP-4
network_name_str Revista Digital de Biblioteconomia e Ciência da Informação
repository_id_str
spelling Semantic web technologies for the information retrieval on wikidataTecnologias da web semântica para a recuperação da informação no wikidataWeb semânticaRecuperação da informaçãoLinked dataWikidata.Semantic webInformation retrievalLinked dataWikidata.Information Retrieval is responsible for the storage and automatic retrieval of information, and these documents may consist of texts, web pages, audio, video, images, graphics and figures. Information Retrieval techniques have gained importance with the growth of the Web, because the unlimited amount of information can express the most diverse forms and levels of quality to what is expected. With this in mind, the present work studies methods and technologies capable of retrieving this information, focusing on searching structured databases called Linked Data, but specifically on the Wikidata project, a database structured using Semantic Web concepts, which brings together the knowledge from Wikipedia. Seeking to understand how this information retrieval is done in the Wikidata project, this research has the objective of presenting the media that Wikidata provides to RI and how they use the principles of the Semantic Web. The methodology used was an exploratory study based on the research and applied, since tests were done in the database of Wikidata. As a result, the characteristics of the various forms of data access and retrieval were identified, tracing the correlations between each of these forms, with the theoretical framework of the Semantic Web and Information Retrieval. It was concluded that Wikidata stands as a solid database, with a large volume of contents, quite current, that has a series of recovery mechanisms, capable of serving the most diverse applications on the Web, because these mechanisms are built with different technologies and configurations.A Recuperação da Informação é responsável pelo armazenamento e pela recuperação automática de informação, podendo estes documentos ser constituídos por textos, páginas Web, áudio, vídeo, imagens, gráficos e figuras. Técnicas de Recuperação de Informação ganharam importância com o crescimento da Web, pois a quantidade ilimitada de informação pode expressar as mais diversas formas e níveis de qualidade ao que se espera. Pensando nisso o presente trabalho estuda métodos e tecnologias capazes de recuperar essas informações, dando enfoque a buscar em bases de dados estruturadas chamadas Linked Data, mas especificamente no Wikidata, uma base de dados estruturada utilizando conceitos da Web Semântica, que reúne conhecimentos da Wikipédia. Buscando compreender como é feita essa recuperação da informação no projeto Wikidata, esta pesquisa tem como objetivo apresentar os meios que o Wikidata fornece para a RI e como eles usam os princípios da Web Semântica. A metodologia utilizada foi um estudo exploratório com embasamento para a pesquisa e aplicada, uma vez que testes foram feitos na base de dados do Wikidata. Como resultados, identificou-se características das diversas formas de acesso e de recuperação dos dados, traçando correlações existentes entre cada uma destas formas, com o arcabouço teórico da Web Semântica e da Recuperação da Informação. Concluiu-se que o Wikidata se coloca como uma base de dados sólida, com um grande volume de conteúdo que possui uma série de mecanismos de recuperação, capazes de atender às mais diversas aplicações existentes na Web, devido a estes mecanismos serem construídos com distintas tecnologias e configurações.Universidade Estadual de Campinas2019-01-04info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionTextoinfo:eu-repo/semantics/otherapplication/pdfapplication/pdfapplication/pdfhttps://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/865179110.20396/rdbci.v17i0.8651791RDBCI: Digital Journal of Library and Information Science; Vol. 17 (2019): Continuous Publishing; e019003RDBCI: Revista Digital de Biblioteconomia e Ciência da Informação; v. 17 (2019): Publicação Contínua; e0190031678-765Xreponame:Revista Digital de Biblioteconomia e Ciência da Informaçãoinstname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPporhttps://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8651791/pdfhttps://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8651791/pdf_1https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8651791/20317Brazil; ContemporaryBrasil; ContemporâneoLuz, Larissa Pavarini daConeglian, Caio SaraivaSantarem Segundo, José Eduardoinfo:eu-repo/semantics/openAccess2019-12-18T11:31:13Zoai:ojs.periodicos.sbu.unicamp.br:article/8651791Revistahttps://periodicos.sbu.unicamp.br/ojs/index.php/rdbciPUBhttps://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/oaippec@unicamp.br||gilbfe@unicamp.br|| rdbci@unicamp.br|| danif@unicamp.br1678-765X1678-765Xopendoar:2023-05-22T10:16:24.582145Revista Digital de Biblioteconomia e Ciência da Informação - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv Semantic web technologies for the information retrieval on wikidata
Tecnologias da web semântica para a recuperação da informação no wikidata
title Semantic web technologies for the information retrieval on wikidata
spellingShingle Semantic web technologies for the information retrieval on wikidata
Luz, Larissa Pavarini da
Web semântica
Recuperação da informação
Linked data
Wikidata.
Semantic web
Information retrieval
Linked data
Wikidata.
title_short Semantic web technologies for the information retrieval on wikidata
title_full Semantic web technologies for the information retrieval on wikidata
title_fullStr Semantic web technologies for the information retrieval on wikidata
title_full_unstemmed Semantic web technologies for the information retrieval on wikidata
title_sort Semantic web technologies for the information retrieval on wikidata
author Luz, Larissa Pavarini da
author_facet Luz, Larissa Pavarini da
Coneglian, Caio Saraiva
Santarem Segundo, José Eduardo
author_role author
author2 Coneglian, Caio Saraiva
Santarem Segundo, José Eduardo
author2_role author
author
dc.contributor.author.fl_str_mv Luz, Larissa Pavarini da
Coneglian, Caio Saraiva
Santarem Segundo, José Eduardo
dc.subject.por.fl_str_mv Web semântica
Recuperação da informação
Linked data
Wikidata.
Semantic web
Information retrieval
Linked data
Wikidata.
topic Web semântica
Recuperação da informação
Linked data
Wikidata.
Semantic web
Information retrieval
Linked data
Wikidata.
description Information Retrieval is responsible for the storage and automatic retrieval of information, and these documents may consist of texts, web pages, audio, video, images, graphics and figures. Information Retrieval techniques have gained importance with the growth of the Web, because the unlimited amount of information can express the most diverse forms and levels of quality to what is expected. With this in mind, the present work studies methods and technologies capable of retrieving this information, focusing on searching structured databases called Linked Data, but specifically on the Wikidata project, a database structured using Semantic Web concepts, which brings together the knowledge from Wikipedia. Seeking to understand how this information retrieval is done in the Wikidata project, this research has the objective of presenting the media that Wikidata provides to RI and how they use the principles of the Semantic Web. The methodology used was an exploratory study based on the research and applied, since tests were done in the database of Wikidata. As a result, the characteristics of the various forms of data access and retrieval were identified, tracing the correlations between each of these forms, with the theoretical framework of the Semantic Web and Information Retrieval. It was concluded that Wikidata stands as a solid database, with a large volume of contents, quite current, that has a series of recovery mechanisms, capable of serving the most diverse applications on the Web, because these mechanisms are built with different technologies and configurations.
publishDate 2019
dc.date.none.fl_str_mv 2019-01-04
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
Texto
info:eu-repo/semantics/other
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8651791
10.20396/rdbci.v17i0.8651791
url https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8651791
identifier_str_mv 10.20396/rdbci.v17i0.8651791
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8651791/pdf
https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8651791/pdf_1
https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8651791/20317
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
application/pdf
application/pdf
dc.coverage.none.fl_str_mv Brazil; Contemporary
Brasil; Contemporâneo
dc.publisher.none.fl_str_mv Universidade Estadual de Campinas
publisher.none.fl_str_mv Universidade Estadual de Campinas
dc.source.none.fl_str_mv RDBCI: Digital Journal of Library and Information Science; Vol. 17 (2019): Continuous Publishing; e019003
RDBCI: Revista Digital de Biblioteconomia e Ciência da Informação; v. 17 (2019): Publicação Contínua; e019003
1678-765X
reponame:Revista Digital de Biblioteconomia e Ciência da Informação
instname:Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
instname_str Universidade Estadual de Campinas (UNICAMP)
instacron_str UNICAMP
institution UNICAMP
reponame_str Revista Digital de Biblioteconomia e Ciência da Informação
collection Revista Digital de Biblioteconomia e Ciência da Informação
repository.name.fl_str_mv Revista Digital de Biblioteconomia e Ciência da Informação - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv ppec@unicamp.br||gilbfe@unicamp.br|| rdbci@unicamp.br|| danif@unicamp.br
_version_ 1788167559498956800