Ontology lexicalization : relationship between content and meaning in the context of Information Retrieval

Detalhes bibliográficos
Autor(a) principal: Schiessl, Marcelo
Data de Publicação: 2017
Outros Autores: Bräscher, Marisa
Tipo de documento: Artigo
Idioma: eng
Título da fonte: Repositório Institucional da UnB
Texto Completo: http://repositorio.unb.br/handle/10482/30682
http://dx.doi.org/10.1590/2318-08892017000100006
Resumo: Esta proposta visa representar a linguagem natural na forma adequada às ontologias e vice-versa. Para tanto, propõe-se à criação semiautomática de base de léxicos em português brasileiro, contendo informações morfológicas, sintáticas e semânticas apropriadas para a leitura por máquinas, permitindo vincular dados estruturados e não estruturados, bem como integrar a leitura em modelo de recuperação da informação para aumentar a precisão. Os resultados alcançados demonstram a utilização da metodologia, no domínio de risco financeiro em português, para a elaboração da ontologia, da base léxico-semântica e da proposta do modelo de recuperação da informação semântica. Para avaliar a performance do modelo proposto, foram selecionados documentos contendo as principais definições do domínio de risco financeiro. Esses foram indexados com e sem anotação semântica. Para possibilitar a comparação entre as abordagens, foram criadas duas bases, a primeira representando a busca tradicional, e a segunda contendo o índice construído, a partir dos textos com as anotações semânticas para representar a busca semântica. A avaliação da proposta é baseada na revocação e na precisão. As consultas submetidas ao modelo mostram que a busca semântica supera o desempenho da tradicional e validam a metodologia empregada. O procedimento, embora adicione complexidade em sua elaboração, pode ser reproduzido em qualquer outro domínio.
id UNB_ad99ea0cf88dd7dd12c2eba432b068f2
oai_identifier_str oai:repositorio.unb.br:10482/30682
network_acronym_str UNB
network_name_str Repositório Institucional da UnB
repository_id_str
spelling Ontology lexicalization : relationship between content and meaning in the context of Information RetrievalLexicalização de ontologias : o relacionamento entre conteúdo e significado no contexto da Recuperação da InformaçãoCiência da informaçãoOntologiaRecuperação da informaçãoRepresentação da informaçãoWeb semânticaEsta proposta visa representar a linguagem natural na forma adequada às ontologias e vice-versa. Para tanto, propõe-se à criação semiautomática de base de léxicos em português brasileiro, contendo informações morfológicas, sintáticas e semânticas apropriadas para a leitura por máquinas, permitindo vincular dados estruturados e não estruturados, bem como integrar a leitura em modelo de recuperação da informação para aumentar a precisão. Os resultados alcançados demonstram a utilização da metodologia, no domínio de risco financeiro em português, para a elaboração da ontologia, da base léxico-semântica e da proposta do modelo de recuperação da informação semântica. Para avaliar a performance do modelo proposto, foram selecionados documentos contendo as principais definições do domínio de risco financeiro. Esses foram indexados com e sem anotação semântica. Para possibilitar a comparação entre as abordagens, foram criadas duas bases, a primeira representando a busca tradicional, e a segunda contendo o índice construído, a partir dos textos com as anotações semânticas para representar a busca semântica. A avaliação da proposta é baseada na revocação e na precisão. As consultas submetidas ao modelo mostram que a busca semântica supera o desempenho da tradicional e validam a metodologia empregada. O procedimento, embora adicione complexidade em sua elaboração, pode ser reproduzido em qualquer outro domínio.The proposal presented in this study seeks to properly represent natural language to ontologies and vice-versa. Therefore, the semi-automatic creation of a lexical database in Brazilian Portuguese containing morphological, syntactic, and semantic information that can be read by machines was proposed, allowing the link between structured and unstructured data and its integration into an information retrieval model to improve precision. The results obtained demonstrated that the methodology can be used in the risco financeiro (financial risk) domain in Portuguese for the construction of an ontology and the lexical-semantic database and the proposal of a semantic information retrieval model. In order to evaluate the performance of the proposed model, documents containing the main definitions of the financial risk domain were selected and indexed with and without semantic annotation. To enable the comparison between the approaches, two databases were created based on the texts with the semantic annotations to represent the semantic search. The first one represents the traditional search and the second contained the index built based on the texts with the semantic annotations to represent the semantic search. The evaluation of the proposal was based on recall and precision. The queries submitted to the model showed that the semantic search outperforms the traditional search and validates the methodology used. Although more complex, the procedure proposed can be used in all kinds of domains.Faculdade de Ciência da Informação (FCI)Pontifícia Universidade Católica de Campinas2018-01-04T19:14:39Z2018-01-04T19:14:39Z2017-01info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfSCHIESSL, Marcelo; BRÄSCHER, Marisa. Ontology lexicalization: relationship between content and meaning in the context of Information Retrieval. Transinformação, Campinas, v. 29, n. 1, p. 57-72, jan./abr. 2017. Disponível em: <http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0103-37862017000100057&lng=en&nrm=iso>. Acesso em: 7 fev. 2018. doi: http://dx.doi.org/10.1590/2318-08892017000100006.http://repositorio.unb.br/handle/10482/30682http://dx.doi.org/10.1590/2318-08892017000100006Transinformação - This is an open-access article distributed under the terms of the Creative Commons Attribution License (CC BY 4.0). Fonte: http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0103-37862017000100057&lng=en&nrm=iso. Acesso em: 7 fev. 2018.info:eu-repo/semantics/openAccessSchiessl, MarceloBräscher, Marisaengreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2023-07-04T14:41:56Zoai:repositorio.unb.br:10482/30682Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2023-07-04T14:41:56Repositório Institucional da UnB - Universidade de Brasília (UnB)false
dc.title.none.fl_str_mv Ontology lexicalization : relationship between content and meaning in the context of Information Retrieval
Lexicalização de ontologias : o relacionamento entre conteúdo e significado no contexto da Recuperação da Informação
title Ontology lexicalization : relationship between content and meaning in the context of Information Retrieval
spellingShingle Ontology lexicalization : relationship between content and meaning in the context of Information Retrieval
Schiessl, Marcelo
Ciência da informação
Ontologia
Recuperação da informação
Representação da informação
Web semântica
title_short Ontology lexicalization : relationship between content and meaning in the context of Information Retrieval
title_full Ontology lexicalization : relationship between content and meaning in the context of Information Retrieval
title_fullStr Ontology lexicalization : relationship between content and meaning in the context of Information Retrieval
title_full_unstemmed Ontology lexicalization : relationship between content and meaning in the context of Information Retrieval
title_sort Ontology lexicalization : relationship between content and meaning in the context of Information Retrieval
author Schiessl, Marcelo
author_facet Schiessl, Marcelo
Bräscher, Marisa
author_role author
author2 Bräscher, Marisa
author2_role author
dc.contributor.author.fl_str_mv Schiessl, Marcelo
Bräscher, Marisa
dc.subject.por.fl_str_mv Ciência da informação
Ontologia
Recuperação da informação
Representação da informação
Web semântica
topic Ciência da informação
Ontologia
Recuperação da informação
Representação da informação
Web semântica
description Esta proposta visa representar a linguagem natural na forma adequada às ontologias e vice-versa. Para tanto, propõe-se à criação semiautomática de base de léxicos em português brasileiro, contendo informações morfológicas, sintáticas e semânticas apropriadas para a leitura por máquinas, permitindo vincular dados estruturados e não estruturados, bem como integrar a leitura em modelo de recuperação da informação para aumentar a precisão. Os resultados alcançados demonstram a utilização da metodologia, no domínio de risco financeiro em português, para a elaboração da ontologia, da base léxico-semântica e da proposta do modelo de recuperação da informação semântica. Para avaliar a performance do modelo proposto, foram selecionados documentos contendo as principais definições do domínio de risco financeiro. Esses foram indexados com e sem anotação semântica. Para possibilitar a comparação entre as abordagens, foram criadas duas bases, a primeira representando a busca tradicional, e a segunda contendo o índice construído, a partir dos textos com as anotações semânticas para representar a busca semântica. A avaliação da proposta é baseada na revocação e na precisão. As consultas submetidas ao modelo mostram que a busca semântica supera o desempenho da tradicional e validam a metodologia empregada. O procedimento, embora adicione complexidade em sua elaboração, pode ser reproduzido em qualquer outro domínio.
publishDate 2017
dc.date.none.fl_str_mv 2017-01
2018-01-04T19:14:39Z
2018-01-04T19:14:39Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv SCHIESSL, Marcelo; BRÄSCHER, Marisa. Ontology lexicalization: relationship between content and meaning in the context of Information Retrieval. Transinformação, Campinas, v. 29, n. 1, p. 57-72, jan./abr. 2017. Disponível em: <http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0103-37862017000100057&lng=en&nrm=iso>. Acesso em: 7 fev. 2018. doi: http://dx.doi.org/10.1590/2318-08892017000100006.
http://repositorio.unb.br/handle/10482/30682
http://dx.doi.org/10.1590/2318-08892017000100006
identifier_str_mv SCHIESSL, Marcelo; BRÄSCHER, Marisa. Ontology lexicalization: relationship between content and meaning in the context of Information Retrieval. Transinformação, Campinas, v. 29, n. 1, p. 57-72, jan./abr. 2017. Disponível em: <http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0103-37862017000100057&lng=en&nrm=iso>. Acesso em: 7 fev. 2018. doi: http://dx.doi.org/10.1590/2318-08892017000100006.
url http://repositorio.unb.br/handle/10482/30682
http://dx.doi.org/10.1590/2318-08892017000100006
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pontifícia Universidade Católica de Campinas
publisher.none.fl_str_mv Pontifícia Universidade Católica de Campinas
dc.source.none.fl_str_mv reponame:Repositório Institucional da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Repositório Institucional da UnB
collection Repositório Institucional da UnB
repository.name.fl_str_mv Repositório Institucional da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv repositorio@unb.br
_version_ 1810580915220381696