Noun phase selection in automatic indexing

Detalhes bibliográficos
Autor(a) principal: Nascimento, Gustavo Diniz do
Data de Publicação: 2019
Outros Autores: Correa, Renato Fernandes
Tipo de documento: Artigo
Idioma: por
Título da fonte: Encontros Bibli
Texto Completo: https://periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2019.e57927
Resumo: Objective: this study aims to synthetize and classify the noun phrases selection criteria present in methods for automatic indexing by noun phrases of texts written in Portuguese.Methods: The research methodology has an exploratory nature and bibliographic character, and has the content analysis as procedural method. The bases of the noun phrases selection methodologies are criteria as absolute frequency of occurrence, normalized frequency of occurrence, inverse document frequency, non-occurrence in list of stopwords, and the grammatical structure and level of noun phrases.Conclusions: As for the criteria scope, predominates in quantity those based on the noun phrases characteristics (grammatical structure, level, lexical content), in adoption predominates those based on the document content and the corpus content.Results: The main contribution of this work is the panoramic overview of the noun phrases selection criteria for texts written in the Portuguese idiom.
id UFSC-29_0367883153a76888ea27772fef2badf7
oai_identifier_str oai:periodicos.ufsc.br:article/57927
network_acronym_str UFSC-29
network_name_str Encontros Bibli
repository_id_str
spelling Noun phase selection in automatic indexingSeleção de sintagmas nominais na indexação automáticaIndexação automáticaSintagmas nominais Seleção de sintagmas nominaisLíngua portuguesaRecuperação da informaçãoAutomatic indexingNoun phrasesNoun phrase selection Portuguese language Information retrievalObjective: this study aims to synthetize and classify the noun phrases selection criteria present in methods for automatic indexing by noun phrases of texts written in Portuguese.Methods: The research methodology has an exploratory nature and bibliographic character, and has the content analysis as procedural method. The bases of the noun phrases selection methodologies are criteria as absolute frequency of occurrence, normalized frequency of occurrence, inverse document frequency, non-occurrence in list of stopwords, and the grammatical structure and level of noun phrases.Conclusions: As for the criteria scope, predominates in quantity those based on the noun phrases characteristics (grammatical structure, level, lexical content), in adoption predominates those based on the document content and the corpus content.Results: The main contribution of this work is the panoramic overview of the noun phrases selection criteria for texts written in the Portuguese idiom.O uso dos sintagmas nominais como instrumentos de organização da informação vem se mostrando uma alternativa promissora às palavras isoladas na construção dos sistemas de recuperação de informação. Nesse contexto, a indexação automática por sintagmas nominais minimiza alguns problemas encontrados na indexação baseada em palavras isoladas, como, por exemplo, a sinonímia e a polissemia. No entanto, é notório que nem todos os sintagmas nominais que se encontram em um documento são representativos do conteúdo desse documento, o que demonstra a necessidade de se selecionar os sintagmas nominais mais relevantes. Assim, o objetivo deste estudo consiste em sintetizar e classificar critérios de seleção de sintagmas nominais utilizados em metodologias de indexação automática por sintagmas nominais para textos escritos em língua portuguesa. A metodologia da pesquisa tem natureza exploratória, de cunho bibliográfico, e tem como método procedimental a análise de conteúdo. As metodologias de seleção de sintagmas nominais baseiam-se em critérios como: frequência absoluta de ocorrência, frequência normalizada de ocorrência, frequência inversa nos documentos, não ocorrência em lista de sintagmas nominais pouco significativos, na estrutura gramatical e no nível dos sintagmas nominais. Quanto ao escopo dos critérios, predominam em número os baseados em características do sintagma nominal (estrutura gramatical, nível, conteúdo lexical) e quanto a adoção predominam os baseados no conteúdo do documento e no conteúdo do corpus. A principal contribuição deste estudo consiste do panorama dos critérios de seleção de sintagmas nominais relevantes para textos em português.Departamento de Ciência da Informação – UFSC2019-05-06info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionPesquisa exploratória; Pesquisa bibliográfica; Análise de conteúdoapplication/pdftext/xmlhttps://periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2019.e5792710.5007/1518-2924.2019.e57927Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação; Vol. 24 No. 55 (2019); 1-19Encontros Bibli: revista electrónica de bibliotecología y ciencias de la información.; Vol. 24 Núm. 55 (2019); 1-19Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação; v. 24 n. 55 (2019); 1-191518-2924reponame:Encontros Bibliinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCporhttps://periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2019.e57927/39975https://periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2019.e57927/53729Copyright (c) 2019 Gustavo Diniz do Nascimento, Renato Fernandes Corrêahttps://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessNascimento, Gustavo Diniz doCorrea, Renato Fernandes2023-07-17T20:37:32Zoai:periodicos.ufsc.br:article/57927Revistahttps://periodicos.ufsc.br/index.php/eb/indexPUBhttps://periodicos.ufsc.br/index.php/eb/oaiencontrosbibli@contato.ufsc.br||portaldeperiodicos.bu@contato.ufsc.br1518-29241518-2924opendoar:2023-07-17T20:37:32Encontros Bibli - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv Noun phase selection in automatic indexing
Seleção de sintagmas nominais na indexação automática
title Noun phase selection in automatic indexing
spellingShingle Noun phase selection in automatic indexing
Nascimento, Gustavo Diniz do
Indexação automática
Sintagmas nominais
Seleção de sintagmas nominais
Língua portuguesa
Recuperação da informação
Automatic indexing
Noun phrases
Noun phrase selection
Portuguese language
Information retrieval
title_short Noun phase selection in automatic indexing
title_full Noun phase selection in automatic indexing
title_fullStr Noun phase selection in automatic indexing
title_full_unstemmed Noun phase selection in automatic indexing
title_sort Noun phase selection in automatic indexing
author Nascimento, Gustavo Diniz do
author_facet Nascimento, Gustavo Diniz do
Correa, Renato Fernandes
author_role author
author2 Correa, Renato Fernandes
author2_role author
dc.contributor.author.fl_str_mv Nascimento, Gustavo Diniz do
Correa, Renato Fernandes
dc.subject.por.fl_str_mv Indexação automática
Sintagmas nominais
Seleção de sintagmas nominais
Língua portuguesa
Recuperação da informação
Automatic indexing
Noun phrases
Noun phrase selection
Portuguese language
Information retrieval
topic Indexação automática
Sintagmas nominais
Seleção de sintagmas nominais
Língua portuguesa
Recuperação da informação
Automatic indexing
Noun phrases
Noun phrase selection
Portuguese language
Information retrieval
description Objective: this study aims to synthetize and classify the noun phrases selection criteria present in methods for automatic indexing by noun phrases of texts written in Portuguese.Methods: The research methodology has an exploratory nature and bibliographic character, and has the content analysis as procedural method. The bases of the noun phrases selection methodologies are criteria as absolute frequency of occurrence, normalized frequency of occurrence, inverse document frequency, non-occurrence in list of stopwords, and the grammatical structure and level of noun phrases.Conclusions: As for the criteria scope, predominates in quantity those based on the noun phrases characteristics (grammatical structure, level, lexical content), in adoption predominates those based on the document content and the corpus content.Results: The main contribution of this work is the panoramic overview of the noun phrases selection criteria for texts written in the Portuguese idiom.
publishDate 2019
dc.date.none.fl_str_mv 2019-05-06
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
Pesquisa exploratória; Pesquisa bibliográfica; Análise de conteúdo
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2019.e57927
10.5007/1518-2924.2019.e57927
url https://periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2019.e57927
identifier_str_mv 10.5007/1518-2924.2019.e57927
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2019.e57927/39975
https://periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2019.e57927/53729
dc.rights.driver.fl_str_mv Copyright (c) 2019 Gustavo Diniz do Nascimento, Renato Fernandes Corrêa
https://creativecommons.org/licenses/by/4.0
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Copyright (c) 2019 Gustavo Diniz do Nascimento, Renato Fernandes Corrêa
https://creativecommons.org/licenses/by/4.0
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
text/xml
dc.publisher.none.fl_str_mv Departamento de Ciência da Informação – UFSC
publisher.none.fl_str_mv Departamento de Ciência da Informação – UFSC
dc.source.none.fl_str_mv Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação; Vol. 24 No. 55 (2019); 1-19
Encontros Bibli: revista electrónica de bibliotecología y ciencias de la información.; Vol. 24 Núm. 55 (2019); 1-19
Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação; v. 24 n. 55 (2019); 1-19
1518-2924
reponame:Encontros Bibli
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Encontros Bibli
collection Encontros Bibli
repository.name.fl_str_mv Encontros Bibli - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv encontrosbibli@contato.ufsc.br||portaldeperiodicos.bu@contato.ufsc.br
_version_ 1797067778219311104