Standardisation method of noun phrases for automatic indexing
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Outros Autores: | |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Em Questão (Online) |
Texto Completo: | https://seer.ufrgs.br/index.php/EmQuestao/article/view/81901 |
Resumo: | This work proposes and evaluates a method of standardisation ofnoun phrases in canonical terms. This procedure aims to contribute to thequalitative improvement of automatic indexing avoiding the terminologicaldispersion and preserving the keywords present within the noun phrases. Theresearch is exploratory and empirical, based on bibliographic research and anexperiment in a corpus composed of scientific articles in Information Science.The proposed standardisation method contains rules and criteria that follow theconstraints of preserving the valid structure of the noun phrase and thekeywords. The method evaluation consists of the analysis of the presence ofterms of the Brazilian Thesaurus in Information Science (TBCI) in the nounphrases resulting from the application of the proposed rules and criteria. Themethod consists of two stages: the first consists of 85 rules to reduce the size ofthe noun phrases, and the second stage contains seven criteria responsible foreliminating unnecessary grammatical elements from the noun phrases. Theresults of the evaluation indicate that the proposed method allows theachievement of positive results, even with two criteria of the second stage notpresenting results for the corpus. It concludes that the application of the methodin automatic indexing system is feasible and brings good results. |
id |
UFRGS-8_3298842984b8d2bbd557291dd8ff4e6d |
---|---|
oai_identifier_str |
oai:seer.ufrgs.br:article/81901 |
network_acronym_str |
UFRGS-8 |
network_name_str |
Em Questão (Online) |
repository_id_str |
|
spelling |
Standardisation method of noun phrases for automatic indexingMétodo de normalização de sintagmas nominais na indexação automáticaIndexação automática. Sintagmas nominais. Normalização de sintagmas nominais. Palavras-chave. Tesauro.Automatic indexing. Noun phrases. Standardisation of noun phrases. Keywords. Thesaurus.This work proposes and evaluates a method of standardisation ofnoun phrases in canonical terms. This procedure aims to contribute to thequalitative improvement of automatic indexing avoiding the terminologicaldispersion and preserving the keywords present within the noun phrases. Theresearch is exploratory and empirical, based on bibliographic research and anexperiment in a corpus composed of scientific articles in Information Science.The proposed standardisation method contains rules and criteria that follow theconstraints of preserving the valid structure of the noun phrase and thekeywords. The method evaluation consists of the analysis of the presence ofterms of the Brazilian Thesaurus in Information Science (TBCI) in the nounphrases resulting from the application of the proposed rules and criteria. Themethod consists of two stages: the first consists of 85 rules to reduce the size ofthe noun phrases, and the second stage contains seven criteria responsible foreliminating unnecessary grammatical elements from the noun phrases. Theresults of the evaluation indicate that the proposed method allows theachievement of positive results, even with two criteria of the second stage notpresenting results for the corpus. It concludes that the application of the methodin automatic indexing system is feasible and brings good results.Propõe e avalia um método de normalização de sintagmas nominais em termos canônicos, que visa contribuir para a melhora qualitativa da indexação automática, evitando a dispersão terminológica e preservando as palavras-chave dos autores, presentes no interior dos sintagmas nominais. A pesquisa é exploratória e empírica, pautada em pesquisa bibliográfica e realização de um experimento em um corpus de artigos científicos da área de Ciência da Informação. O método proposto é constituído por regras e critérios de normalização que obedecem às restrições de preservação da estrutura válida do sintagma nominal e das palavras-chave. O método proposto é avaliado através da presença de termos do Tesauro Brasileiro em Ciência da Informação (TBCI) nos sintagmas nominais resultantes da aplicação das regras e critérios. O método consiste em duas etapas: a primeira é composta por 85 regras para minimizar os sintagmas nominais extensos; a segunda etapa é composta por sete critérios responsáveis por eliminar dos sintagmas nominais elementos gramaticais desnecessários em sua estrutura. Os resultados da avaliação indicam que o método de normalização permite o alcance de resultados positivos, mesmo com dois critérios da segunda etapa não apresentando resultados para o corpus utilizado. Conclui-se que a aplicação do método de normalização em sistema de indexação automática é viável e traz bons resultados.Universidade Federal do Rio Grande do Sul, Faculdade de Biblioteconomia e Comunicação, Programa de Pós-Graduação em Ciência da Informação (Porto Alegre/RS)2019-01-01info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionAvaliado por Paresapplication/pdfhttps://seer.ufrgs.br/index.php/EmQuestao/article/view/8190110.19132/1808-5245251.321-344Em Questão; v. 25, n. 1, jan./abr. 2019; 321-344Em Questão; v. 25, n. 1, jan./abr. 2019; 321-344Em Questão; v. 25, n. 1, jan./abr. 2019; 321-3441808-52451807-8893reponame:Em Questão (Online)instname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSporhttps://seer.ufrgs.br/index.php/EmQuestao/article/view/81901/50838Copyright (c) 2018 Renato Fernandes Corrêa, Victor Galvão Celerinohttps://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessCorrêa, Renato FernandesCelerino, Victor Galvão2023-12-06T12:40:40Zoai:seer.ufrgs.br:article/81901Revistahttps://seer.ufrgs.br/emquestao/PUBhttps://seer.ufrgs.br/EmQuestao/oaiemquestao@ufrgs.br||emquestao@ufrgs.br1808-52451807-8893opendoar:2023-12-06T12:40:40Em Questão (Online) - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.none.fl_str_mv |
Standardisation method of noun phrases for automatic indexing Método de normalização de sintagmas nominais na indexação automática |
title |
Standardisation method of noun phrases for automatic indexing |
spellingShingle |
Standardisation method of noun phrases for automatic indexing Corrêa, Renato Fernandes Indexação automática. Sintagmas nominais. Normalização de sintagmas nominais. Palavras-chave. Tesauro. Automatic indexing. Noun phrases. Standardisation of noun phrases. Keywords. Thesaurus. |
title_short |
Standardisation method of noun phrases for automatic indexing |
title_full |
Standardisation method of noun phrases for automatic indexing |
title_fullStr |
Standardisation method of noun phrases for automatic indexing |
title_full_unstemmed |
Standardisation method of noun phrases for automatic indexing |
title_sort |
Standardisation method of noun phrases for automatic indexing |
author |
Corrêa, Renato Fernandes |
author_facet |
Corrêa, Renato Fernandes Celerino, Victor Galvão |
author_role |
author |
author2 |
Celerino, Victor Galvão |
author2_role |
author |
dc.contributor.author.fl_str_mv |
Corrêa, Renato Fernandes Celerino, Victor Galvão |
dc.subject.por.fl_str_mv |
Indexação automática. Sintagmas nominais. Normalização de sintagmas nominais. Palavras-chave. Tesauro. Automatic indexing. Noun phrases. Standardisation of noun phrases. Keywords. Thesaurus. |
topic |
Indexação automática. Sintagmas nominais. Normalização de sintagmas nominais. Palavras-chave. Tesauro. Automatic indexing. Noun phrases. Standardisation of noun phrases. Keywords. Thesaurus. |
description |
This work proposes and evaluates a method of standardisation ofnoun phrases in canonical terms. This procedure aims to contribute to thequalitative improvement of automatic indexing avoiding the terminologicaldispersion and preserving the keywords present within the noun phrases. Theresearch is exploratory and empirical, based on bibliographic research and anexperiment in a corpus composed of scientific articles in Information Science.The proposed standardisation method contains rules and criteria that follow theconstraints of preserving the valid structure of the noun phrase and thekeywords. The method evaluation consists of the analysis of the presence ofterms of the Brazilian Thesaurus in Information Science (TBCI) in the nounphrases resulting from the application of the proposed rules and criteria. Themethod consists of two stages: the first consists of 85 rules to reduce the size ofthe noun phrases, and the second stage contains seven criteria responsible foreliminating unnecessary grammatical elements from the noun phrases. Theresults of the evaluation indicate that the proposed method allows theachievement of positive results, even with two criteria of the second stage notpresenting results for the corpus. It concludes that the application of the methodin automatic indexing system is feasible and brings good results. |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019-01-01 |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion Avaliado por Pares |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://seer.ufrgs.br/index.php/EmQuestao/article/view/81901 10.19132/1808-5245251.321-344 |
url |
https://seer.ufrgs.br/index.php/EmQuestao/article/view/81901 |
identifier_str_mv |
10.19132/1808-5245251.321-344 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://seer.ufrgs.br/index.php/EmQuestao/article/view/81901/50838 |
dc.rights.driver.fl_str_mv |
Copyright (c) 2018 Renato Fernandes Corrêa, Victor Galvão Celerino https://creativecommons.org/licenses/by/4.0 info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Copyright (c) 2018 Renato Fernandes Corrêa, Victor Galvão Celerino https://creativecommons.org/licenses/by/4.0 |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Sul, Faculdade de Biblioteconomia e Comunicação, Programa de Pós-Graduação em Ciência da Informação (Porto Alegre/RS) |
publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Sul, Faculdade de Biblioteconomia e Comunicação, Programa de Pós-Graduação em Ciência da Informação (Porto Alegre/RS) |
dc.source.none.fl_str_mv |
Em Questão; v. 25, n. 1, jan./abr. 2019; 321-344 Em Questão; v. 25, n. 1, jan./abr. 2019; 321-344 Em Questão; v. 25, n. 1, jan./abr. 2019; 321-344 1808-5245 1807-8893 reponame:Em Questão (Online) instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Em Questão (Online) |
collection |
Em Questão (Online) |
repository.name.fl_str_mv |
Em Questão (Online) - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
emquestao@ufrgs.br||emquestao@ufrgs.br |
_version_ |
1789438635124195328 |