Recuperação da informação em acervos digitais de jornais: proposta para uso de ontologia no domínio do futebol

Detalhes bibliográficos
Autor(a) principal: Santos, Luana Carla de Moura dos
Data de Publicação: 2016
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFSC
Texto Completo: https://repositorio.ufsc.br/xmlui/handle/123456789/169099
Resumo: Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro de Ciências da Educação, Programa de Pós-Graduação em Ciência da Informação, Florianópolis, 2016.
id UFSC_dd3e4d7adffa527bde9dc9b5bd75111d
oai_identifier_str oai:repositorio.ufsc.br:123456789/169099
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str 2373
spelling Recuperação da informação em acervos digitais de jornais: proposta para uso de ontologia no domínio do futebolBiblioteconomiaCiência da informaçãoRecuperação da informaçãoBibliotecas digitaisOntologias (Sistema de recuperação da informação)Jornais eletrônicosFutebolDissertação (mestrado) - Universidade Federal de Santa Catarina, Centro de Ciências da Educação, Programa de Pós-Graduação em Ciência da Informação, Florianópolis, 2016.Esta pesquisa visa a modelagem de uma ontologia do domínio do futebol para o tratamento de variações diacrônicas e sincrônicas da língua, com intuito de apoiar a recuperação da informação em acervos digitais de jornais. Com a oferta dos acervos de jornais em sítios na Internet é preciso que os acessos a essas informações sejam facilitados, pois esses ambientes reúnem documentos de diferentes épocas e culturas e também estão em constante atualização. Por essa razão, necessitam de uma organização que contemple a diversidade linguística e de conteúdo. Quando a organização da informação é conduzida para um domínio do conhecimento, as ambiguidades podem ser tratadas e entendidas conforme o contexto que se aplicam. Assim, o futebol tem o jornal como importante fonte de informação e também apresenta mudanças gramaticais e variações linguísticas que se mostraram pertinentes a este estudo. Trata-se de uma pesquisa aplicada, utilizando como base um acervo digital de jornal. Possui caracterização exploratória e descritiva e abordagem qualitativa. Utiliza a metodologia OntoForInfoScience, de Mendonça (2015) para desenvolver a ontologia do domínio do futebol. A coleta das informações foi realizada em materiais de referência do domínio e em notícias de jornais. Cronologicamente, o recorte estabelecido abrange terminologia utilizada entre 1900 a 2015, período que contempla a existência dos clubes de futebol no Brasil. A coleta foi realizada em jornais digitalizados e também nascidos digitais. A partir da amostra dos termos criou-se artefatos como Glossário de Conceitos, Dicionário de Conceitos, Glossário de Relações, Tabela de Conceitos e Valores e modelo de representação gráfica, em que foram tratados os aspectos linguísticos do domínio do futebol presentes nos acervos digitais. Com base do que foi modelado em linguagem natural foi formalizada a ontologia em linguagem lógica, com o auxílio do editor Protegé, etapa em que foram definidas classes, subclasses, propriedades de relação e equivalências. Como forma de avaliar a ontologia desenvolvida, elaborou-se questões de competência que foram executadas em linguagem SPARQL. Para atestar o uso da ontologia em ambientes compostos por jornais impressos e digitais foram realizadas buscas demonstrativas em um acervo real, analisando quais os resultados obtidos sem a ontologia e quais os prováveis resultados se ela fosse implementada. A análise dos resultados permitiu evidenciar que sem o uso da ontologia nos acervos digitais de jornais, a recuperação das informações é exaustiva e recupera documentos não relevantes, devido à ausência de relacionamentos entre os termos que formam o domínio. Dessa forma, com a inclusão da ontologia no sistema, a pesquisa por informações não exigiria tanto letramento do usuário, visto que as ontologias tornam mais inteligentes os sistemas, pois suas relações são feitas com base na realidade. Assim, as principais contribuições científicas deste trabalho para a Ciência da Informação envolvem a análise e tratamento de documentos históricos do domínio do futebol, a fim de apoiar a recuperação da informação de acervos digitais de jornais, utilizando como recurso uma ontologia de domínio.<br>Abstract : This research proposes the making of a domain-ontology on soccer, to deal with the synchronic and diachronic variances of the language, and to aid information retrieval on digital files of newspapers. With the supply of newspaper archives in websites, it is necessary for the access to this information to be improved, because these sites group documents from different times and cultures and also are constantly under update. For that reason, they need an arrangement that encompasses the diversity of language and content. When the arrangement of the information is placed in a domain knowledge, all ambiguity can be dealt with and understood according to the context to which they apply. Thus, soccer has the newspaper as an important source of information, and also presents grammar changes and linguistic variations that are shown to be pertinent to this study. This is an applied research, based on a digital newspaper archive. it is exploratory and descriptive and a qualitative approach to its subject matter. Uses Mendonça s OntoForInfoScience methodology (2015) to develop the domain-ontology on soccer. The gathering of information was done based on reference material from the domain and in newspaper articles. The chronological interval that was established encompasses the terminology used between 1900 and 2015, period that covers the spawn of soccer clubs in Brazil. The data collection was from digitized and originally digital newspapers. Artifacts were created from the sample of terms, which are: glossary of concepts, dictionary of concepts, glossary of relationships, table of concepts and values, and graphic representation model, in which we deal with the linguistic aspects of the soccer domain, in the digital files. Based on what was modeled in natural language we formalized the ontology in logic language, with the help of the Protegé editor. At this stage, we defined categories, subcategories, relationship properties and equivalences. As a means to evaluate the developed ontology, questions of competence were created and executed in SPARQL language. In order to attest the usage of the ontology in environments with digital and printed newspapers some demonstrative searches were carried out in a real archive, analyzing what were the results without the ontology and the probable results if it were implemented. The analysis of the results allowed us to show that without the use of the ontology in the digital archive of newspaper the information retrieval is exhaustive and retrieves irrelevant documents, due to the lack of relationships among the terms that compose the domain. In this fashion, having the ontology included in the system, the research would not require much specific knowledge of the user, since the ontologies make systems smarter because their relationships are based on reality. So the main scientific contributions of this work to the Information Science are about the analysis and management of historical documents on the soccer domain, in order to improve the information retrieval in digital archives of newspapers, using the domain ontology as a resource.Brascher, MarisaUniversidade Federal de Santa CatarinaSantos, Luana Carla de Moura dos2016-10-11T04:06:33Z2016-10-11T04:06:33Z2016info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf342214https://repositorio.ufsc.br/xmlui/handle/123456789/169099porreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccess2016-10-18T03:08:12Zoai:repositorio.ufsc.br:123456789/169099Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732016-10-18T03:08:12Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv Recuperação da informação em acervos digitais de jornais: proposta para uso de ontologia no domínio do futebol
title Recuperação da informação em acervos digitais de jornais: proposta para uso de ontologia no domínio do futebol
spellingShingle Recuperação da informação em acervos digitais de jornais: proposta para uso de ontologia no domínio do futebol
Santos, Luana Carla de Moura dos
Biblioteconomia
Ciência da informação
Recuperação da informação
Bibliotecas digitais
Ontologias (Sistema de recuperação da informação)
Jornais eletrônicos
Futebol
title_short Recuperação da informação em acervos digitais de jornais: proposta para uso de ontologia no domínio do futebol
title_full Recuperação da informação em acervos digitais de jornais: proposta para uso de ontologia no domínio do futebol
title_fullStr Recuperação da informação em acervos digitais de jornais: proposta para uso de ontologia no domínio do futebol
title_full_unstemmed Recuperação da informação em acervos digitais de jornais: proposta para uso de ontologia no domínio do futebol
title_sort Recuperação da informação em acervos digitais de jornais: proposta para uso de ontologia no domínio do futebol
author Santos, Luana Carla de Moura dos
author_facet Santos, Luana Carla de Moura dos
author_role author
dc.contributor.none.fl_str_mv Brascher, Marisa
Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv Santos, Luana Carla de Moura dos
dc.subject.por.fl_str_mv Biblioteconomia
Ciência da informação
Recuperação da informação
Bibliotecas digitais
Ontologias (Sistema de recuperação da informação)
Jornais eletrônicos
Futebol
topic Biblioteconomia
Ciência da informação
Recuperação da informação
Bibliotecas digitais
Ontologias (Sistema de recuperação da informação)
Jornais eletrônicos
Futebol
description Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro de Ciências da Educação, Programa de Pós-Graduação em Ciência da Informação, Florianópolis, 2016.
publishDate 2016
dc.date.none.fl_str_mv 2016-10-11T04:06:33Z
2016-10-11T04:06:33Z
2016
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv 342214
https://repositorio.ufsc.br/xmlui/handle/123456789/169099
identifier_str_mv 342214
url https://repositorio.ufsc.br/xmlui/handle/123456789/169099
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv
_version_ 1808652326020317184