Standardisation method of noun phrases for automatic indexing

Detalhes bibliográficos
Autor(a) principal: Corrêa, Renato Fernandes
Data de Publicação: 2019
Outros Autores: Celerino, Victor Galvão
Tipo de documento: Artigo
Idioma: por
Título da fonte: Em Questão (Online)
Texto Completo: https://seer.ufrgs.br/index.php/EmQuestao/article/view/81901
Resumo: This work proposes and evaluates a method of standardisation ofnoun phrases in canonical terms. This procedure aims to contribute to thequalitative improvement of automatic indexing avoiding the terminologicaldispersion and preserving the keywords present within the noun phrases. Theresearch is exploratory and empirical, based on bibliographic research and anexperiment in a corpus composed of scientific articles in Information Science.The proposed standardisation method contains rules and criteria that follow theconstraints of preserving the valid structure of the noun phrase and thekeywords. The method evaluation consists of the analysis of the presence ofterms of the Brazilian Thesaurus in Information Science (TBCI) in the nounphrases resulting from the application of the proposed rules and criteria. Themethod consists of two stages: the first consists of 85 rules to reduce the size ofthe noun phrases, and the second stage contains seven criteria responsible foreliminating unnecessary grammatical elements from the noun phrases. Theresults of the evaluation indicate that the proposed method allows theachievement of positive results, even with two criteria of the second stage notpresenting results for the corpus. It concludes that the application of the methodin automatic indexing system is feasible and brings good results.
id UFRGS-8_3298842984b8d2bbd557291dd8ff4e6d
oai_identifier_str oai:seer.ufrgs.br:article/81901
network_acronym_str UFRGS-8
network_name_str Em Questão (Online)
repository_id_str
spelling Standardisation method of noun phrases for automatic indexingMétodo de normalização de sintagmas nominais na indexação automáticaIndexação automática. Sintagmas nominais. Normalização de sintagmas nominais. Palavras-chave. Tesauro.Automatic indexing. Noun phrases. Standardisation of noun phrases. Keywords. Thesaurus.This work proposes and evaluates a method of standardisation ofnoun phrases in canonical terms. This procedure aims to contribute to thequalitative improvement of automatic indexing avoiding the terminologicaldispersion and preserving the keywords present within the noun phrases. Theresearch is exploratory and empirical, based on bibliographic research and anexperiment in a corpus composed of scientific articles in Information Science.The proposed standardisation method contains rules and criteria that follow theconstraints of preserving the valid structure of the noun phrase and thekeywords. The method evaluation consists of the analysis of the presence ofterms of the Brazilian Thesaurus in Information Science (TBCI) in the nounphrases resulting from the application of the proposed rules and criteria. Themethod consists of two stages: the first consists of 85 rules to reduce the size ofthe noun phrases, and the second stage contains seven criteria responsible foreliminating unnecessary grammatical elements from the noun phrases. Theresults of the evaluation indicate that the proposed method allows theachievement of positive results, even with two criteria of the second stage notpresenting results for the corpus. It concludes that the application of the methodin automatic indexing system is feasible and brings good results.Propõe e avalia um método de normalização de sintagmas nominais em termos canônicos, que visa contribuir para a melhora qualitativa da indexação automática, evitando a dispersão terminológica e preservando as palavras-chave dos autores, presentes no interior dos sintagmas nominais. A pesquisa é exploratória e empírica, pautada em pesquisa bibliográfica e realização de um experimento em um corpus de artigos científicos da área de Ciência da Informação. O método proposto é constituído por regras e critérios de normalização que obedecem às restrições de preservação da estrutura válida do sintagma nominal e das palavras-chave. O método proposto é avaliado através da presença de termos do Tesauro Brasileiro em Ciência da Informação (TBCI) nos sintagmas nominais resultantes da aplicação das regras e critérios. O método consiste em duas etapas: a primeira é composta por 85 regras para minimizar os sintagmas nominais extensos; a segunda etapa é composta por sete critérios responsáveis por eliminar dos sintagmas nominais elementos gramaticais desnecessários em sua estrutura. Os resultados da avaliação indicam que o método de normalização permite o alcance de resultados positivos, mesmo com dois critérios da segunda etapa não apresentando resultados para o corpus utilizado. Conclui-se que a aplicação do método de normalização em sistema de indexação automática é viável e traz bons resultados.Universidade Federal do Rio Grande do Sul, Faculdade de Biblioteconomia e Comunicação, Programa de Pós-Graduação em Ciência da Informação (Porto Alegre/RS)2019-01-01info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionAvaliado por Paresapplication/pdfhttps://seer.ufrgs.br/index.php/EmQuestao/article/view/8190110.19132/1808-5245251.321-344Em Questão; v. 25, n. 1, jan./abr. 2019; 321-344Em Questão; v. 25, n. 1, jan./abr. 2019; 321-344Em Questão; v. 25, n. 1, jan./abr. 2019; 321-3441808-52451807-8893reponame:Em Questão (Online)instname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSporhttps://seer.ufrgs.br/index.php/EmQuestao/article/view/81901/50838Copyright (c) 2018 Renato Fernandes Corrêa, Victor Galvão Celerinohttps://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessCorrêa, Renato FernandesCelerino, Victor Galvão2023-12-06T12:40:40Zoai:seer.ufrgs.br:article/81901Revistahttps://seer.ufrgs.br/emquestao/PUBhttps://seer.ufrgs.br/EmQuestao/oaiemquestao@ufrgs.br||emquestao@ufrgs.br1808-52451807-8893opendoar:2023-12-06T12:40:40Em Questão (Online) - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.none.fl_str_mv Standardisation method of noun phrases for automatic indexing
Método de normalização de sintagmas nominais na indexação automática
title Standardisation method of noun phrases for automatic indexing
spellingShingle Standardisation method of noun phrases for automatic indexing
Corrêa, Renato Fernandes
Indexação automática. Sintagmas nominais. Normalização de sintagmas nominais. Palavras-chave. Tesauro.
Automatic indexing. Noun phrases. Standardisation of noun phrases. Keywords. Thesaurus.
title_short Standardisation method of noun phrases for automatic indexing
title_full Standardisation method of noun phrases for automatic indexing
title_fullStr Standardisation method of noun phrases for automatic indexing
title_full_unstemmed Standardisation method of noun phrases for automatic indexing
title_sort Standardisation method of noun phrases for automatic indexing
author Corrêa, Renato Fernandes
author_facet Corrêa, Renato Fernandes
Celerino, Victor Galvão
author_role author
author2 Celerino, Victor Galvão
author2_role author
dc.contributor.author.fl_str_mv Corrêa, Renato Fernandes
Celerino, Victor Galvão
dc.subject.por.fl_str_mv Indexação automática. Sintagmas nominais. Normalização de sintagmas nominais. Palavras-chave. Tesauro.
Automatic indexing. Noun phrases. Standardisation of noun phrases. Keywords. Thesaurus.
topic Indexação automática. Sintagmas nominais. Normalização de sintagmas nominais. Palavras-chave. Tesauro.
Automatic indexing. Noun phrases. Standardisation of noun phrases. Keywords. Thesaurus.
description This work proposes and evaluates a method of standardisation ofnoun phrases in canonical terms. This procedure aims to contribute to thequalitative improvement of automatic indexing avoiding the terminologicaldispersion and preserving the keywords present within the noun phrases. Theresearch is exploratory and empirical, based on bibliographic research and anexperiment in a corpus composed of scientific articles in Information Science.The proposed standardisation method contains rules and criteria that follow theconstraints of preserving the valid structure of the noun phrase and thekeywords. The method evaluation consists of the analysis of the presence ofterms of the Brazilian Thesaurus in Information Science (TBCI) in the nounphrases resulting from the application of the proposed rules and criteria. Themethod consists of two stages: the first consists of 85 rules to reduce the size ofthe noun phrases, and the second stage contains seven criteria responsible foreliminating unnecessary grammatical elements from the noun phrases. Theresults of the evaluation indicate that the proposed method allows theachievement of positive results, even with two criteria of the second stage notpresenting results for the corpus. It concludes that the application of the methodin automatic indexing system is feasible and brings good results.
publishDate 2019
dc.date.none.fl_str_mv 2019-01-01
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
Avaliado por Pares
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://seer.ufrgs.br/index.php/EmQuestao/article/view/81901
10.19132/1808-5245251.321-344
url https://seer.ufrgs.br/index.php/EmQuestao/article/view/81901
identifier_str_mv 10.19132/1808-5245251.321-344
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://seer.ufrgs.br/index.php/EmQuestao/article/view/81901/50838
dc.rights.driver.fl_str_mv Copyright (c) 2018 Renato Fernandes Corrêa, Victor Galvão Celerino
https://creativecommons.org/licenses/by/4.0
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Copyright (c) 2018 Renato Fernandes Corrêa, Victor Galvão Celerino
https://creativecommons.org/licenses/by/4.0
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do Rio Grande do Sul, Faculdade de Biblioteconomia e Comunicação, Programa de Pós-Graduação em Ciência da Informação (Porto Alegre/RS)
publisher.none.fl_str_mv Universidade Federal do Rio Grande do Sul, Faculdade de Biblioteconomia e Comunicação, Programa de Pós-Graduação em Ciência da Informação (Porto Alegre/RS)
dc.source.none.fl_str_mv Em Questão; v. 25, n. 1, jan./abr. 2019; 321-344
Em Questão; v. 25, n. 1, jan./abr. 2019; 321-344
Em Questão; v. 25, n. 1, jan./abr. 2019; 321-344
1808-5245
1807-8893
reponame:Em Questão (Online)
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Em Questão (Online)
collection Em Questão (Online)
repository.name.fl_str_mv Em Questão (Online) - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv emquestao@ufrgs.br||emquestao@ufrgs.br
_version_ 1789438635124195328