Indización y recuperación de tesis y disertaciones por medio de sintagmas nominales

Corrêa, Renato Fernandes; Miranda, Darliane Goes de; Lima, Camila Oliveira de Almeida; Silva, Tiago José da

Indización y recuperación de tesis y disertaciones por medio de sintagmas nominales

Detalhes bibliográficos
Autor(a) principal:	Corrêa, Renato Fernandes
Data de Publicação:	2011
Outros Autores:	Miranda, Darliane Goes de, Lima, Camila Oliveira de Almeida, Silva, Tiago José da
Tipo de documento:	Artigo
Idioma:	por
Título da fonte:	AtoZ (Curitiba)
Texto Completo:	https://revistas.ufpr.br/atoz/article/view/41280
Resumo:	Introdução. Aborda a utilização dos sintagmas nominais no processo indexação automática das teses e dissertações depositadas na Biblioteca Digital de Teses e Dissertações da UFPE (BDTD-UFPE), considerando a hipótese de que os sintagmas nominais consistiriam numa melhor unidade de conhecimento para a indexação e recuperação de informação que as palavras isoladas, permitindo aumentar a satisfação da necessidade de informação do usuário durante a busca pela informação. Discute-se sobre o estado da arte dos sintagmas nominais e de sua extração automática, bem como sua aplicação na indexação automática e recuperação de informação. Método. Analisa, com base em ferramenta para análise de texto (OGMA), a aplicabilidade da extração de sintagmas nominais na indexação automática e recuperação de informação de teses e dissertações no contexto da BDTD-UFPE. Com base em resumos da área de Direito, Computação e Nutrição, definiram-se os valores totais para cada uma das variáveis observadas, o que permitiu avaliar a extração de sintagmas nominais através dos percentuais de precisão de sintagmas nominais relevantes; da taxa de erro ao extrair cadeias de caracteres que não constituem sintagmas nominais, e; do percentual de sintagmas nominais extraídos não relevantes. Resultados. O processo de extração de sintagmas nominais através do OGMA teve diferentes desempenhos para cada programa de pós-graduação, sendo obtido melhor desempenho (melhor índice de precisão) para resumos de Direito, seguidos dos de Computação e Nutrição. Esta diferença de desempenho pode em parte ser explicada pela diferente natureza dos termos técnicos presentes nos resumos. Conclusões. Embora existam limitações nas ferramentas disponíveis, a aplicação de métodos automatizados de extração e indexação por sintagmas nominais mostra-se promissora, pois os sintagmas nominais se configuram como melhores descritores e pontos de acesso aos documentos, eliminando os problemas causados pela sinonímia e a polissemia das palavras isoladas.

Metadados do item

id	UFPR-6_f6cba1ae974f5f51a0fa42a3b04d8171
oai_identifier_str	oai:revistas.ufpr.br:article/41280
network_acronym_str	UFPR-6
network_name_str	AtoZ (Curitiba)
repository_id_str
spelling	Indización y recuperación de tesis y disertaciones por medio de sintagmas nominalesIndexação e recuperação de teses e dissertações por meio de sintagmas nominaisIndexing and information retrieval of theses and dissertations through noun phrasessintagmas nominales; recuperación de información; indización automática; tesis y disertacionesInformation Science; Information Retrieval TechniquesNoun phrase; Information retrieval; Automatic indexing; Theses and dissertationsAutomatic indexingCiência da Informação; Técnicas de Recuperação da InformaçãoSintagmas nominais; Recuperação de informação; Indexação automática; Teses e dissertaçõesindexação automáticaIntrodução. Aborda a utilização dos sintagmas nominais no processo indexação automática das teses e dissertações depositadas na Biblioteca Digital de Teses e Dissertações da UFPE (BDTD-UFPE), considerando a hipótese de que os sintagmas nominais consistiriam numa melhor unidade de conhecimento para a indexação e recuperação de informação que as palavras isoladas, permitindo aumentar a satisfação da necessidade de informação do usuário durante a busca pela informação. Discute-se sobre o estado da arte dos sintagmas nominais e de sua extração automática, bem como sua aplicação na indexação automática e recuperação de informação. Método. Analisa, com base em ferramenta para análise de texto (OGMA), a aplicabilidade da extração de sintagmas nominais na indexação automática e recuperação de informação de teses e dissertações no contexto da BDTD-UFPE. Com base em resumos da área de Direito, Computação e Nutrição, definiram-se os valores totais para cada uma das variáveis observadas, o que permitiu avaliar a extração de sintagmas nominais através dos percentuais de precisão de sintagmas nominais relevantes; da taxa de erro ao extrair cadeias de caracteres que não constituem sintagmas nominais, e; do percentual de sintagmas nominais extraídos não relevantes. Resultados. O processo de extração de sintagmas nominais através do OGMA teve diferentes desempenhos para cada programa de pós-graduação, sendo obtido melhor desempenho (melhor índice de precisão) para resumos de Direito, seguidos dos de Computação e Nutrição. Esta diferença de desempenho pode em parte ser explicada pela diferente natureza dos termos técnicos presentes nos resumos. Conclusões. Embora existam limitações nas ferramentas disponíveis, a aplicação de métodos automatizados de extração e indexação por sintagmas nominais mostra-se promissora, pois os sintagmas nominais se configuram como melhores descritores e pontos de acesso aos documentos, eliminando os problemas causados pela sinonímia e a polissemia das palavras isoladas.Introduction: Discusses the use of noun phrases in the automatic indexing process of theses and dissertations deposited in the UFPE Digital Library of Theses and Dissertations (BDTD-UFPE), on the assumption that noun phrases consist of a better knowledge unit for indexing and information retrieval that individual words, allowing an adequate response to the users information need when searching for information. It presentes the state of the art of noun phrases and their automatic extraction process, as well as its applicability in automatic indexing and information retrieval. Method: Based on text analysis tool (OGMA), analyses the applicability of the extraction of noun phrases in automatic indexing and information retrieval of thesis and dissertations in the context of BDTD-UFPE. Applied to abstracts from Law, Computer and Nutrition thesis and dissertations, the variables could be observed, allowing the research team assess the extraction of noun phrases using: the percentage of accuracy of relevant noun phrases; the error rate extract strings that are not noun phrases, and; the percentage of non relevant noun phrases extracted. Results: The process of extracting noun phrases by OGMA showed different performances for each graduate program, with better performance (better accuracy rate) for abstracts from Law Thesis and Dissertations, followed by Computer and Nutrition ones. This performance difference can be partly explained by the different nature of technical terms presented in the abstracts. Conclusions: It concludes that although there are limitations in the available tools, the application of automated methods of extraction and indexing by noun phrases appears to be quite promising, since the noun phrases are configured as best descriptors and access to documents, eliminating the problems caused by synonymy and polysemy of isolated words.Introducción: Aborda la utilización de los sintagmas nominales en el proceso de indización automática de las tesis y las disertaciones depositadas en la Biblioteca Digital de Tesis y Disertaciones de UFPE (BDTD-UFPE), considerando la hipótesis de que los sintagmas nominales consistirían en una mejor unidad de conocimiento para la indización y recuperación de información, que términos aislados, permitiendo aumentar la satisfacción de las necesidades de información del usuario durante la búsqueda de información. Se discute sobre el estado del arte de los sintagmas nominales y de su extracción automática, tanto como de su aplicación en la indización automática y en la recuperación de información. Metodología: Tomando como base la herramienta para análisis de texto (OGMA), analiza la aplicación de la extracción de sintagmas nominales en la indización automática y recuperación de información de las tesis y disertaciones en el contexto de BDTD-UFPE. Con base en los resúmenes en el área de Derecho, Computación y Nutrición, se definieron los valores totales para cada una de las variables observadas, lo que permitió evaluar la extracción de sintagmas nominales a través de los porcentajes de precisión de los sintagmas nominales relevantes; la tasa de error al extraer las cadenas de caracteres que no constituyen sintagmas nominales, y, el porcentaje de sintagmas nominales extraídos que no son relevantes. Resultados: El proceso de extracción de sintagmas nominales a través de OGMA tiene diferentes desarrollos para cada programa de posgrado, habiéndose obtenido un mejor desarrollo (mejor índice de precisión) para los resúmenes de Derecho, seguidos por los de Computación y los de Nutrición. Esta diferencia en el desarrollo puede explicarse en parte por la naturaleza diferente de los términos técnicos presentes en los resúmenes. Conclusión: Aunque existan limitaciones en las herramientas disponibles, la aplicación de métodos automatizados de extracción e indización por medio de sintagmas nominales es prometedora, ya que los sintagmas nominales se configuran como mejores descriptores y puntos de acceso a los documentos, eliminando los problemas causados por la sinonimia y la polisemia de las palabras aisladas.Programa de Pós-graduação em Gestão da Informação - UFPRCNPqCNPqCNPqCorrêa, Renato FernandesMiranda, Darliane Goes deLima, Camila Oliveira de AlmeidaSilva, Tiago José da2011-06-01info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionArtículo evaluado por paresAvaliado pelos parespesquisa empírica de campotext/htmlapplication/pdfapplication/epub+ziphttps://revistas.ufpr.br/atoz/article/view/4128010.5380/atoz.v1i1.41280AtoZ: novas práticas em informação e conhecimento; v. 1, n. 1 (2011): Edição de Estréia; 11-22AtoZ: novas práticas em informação e conhecimento; v. 1, n. 1 (2011): Edição de Estréia; 11-22AtoZ: novas práticas em informação e conhecimento; v. 1, n. 1 (2011): Edição de Estréia; 11-222237-826X10.5380/atoz.v1i1reponame:AtoZ (Curitiba)instname:Universidade Federal do Paraná (UFPR)instacron:UFPRporhttps://revistas.ufpr.br/atoz/article/view/41280/25197https://revistas.ufpr.br/atoz/article/view/41280/25198https://revistas.ufpr.br/atoz/article/view/41280/25199organizationsorganizaçõesamostra intencionalinfo:eu-repo/semantics/openAccess2017-11-03T12:10:43Zoai:revistas.ufpr.br:article/41280Revistahttp://revistas.ufpr.br/atozPUBhttp://ojs.c3sl.ufpr.br/ojs2/index.php/atoz/oai\|\|revistaatoz@ufpr.br\|\| contatoatoz@gmail.com2237-826X2237-826Xopendoar:2017-11-03T12:10:43AtoZ (Curitiba) - Universidade Federal do Paraná (UFPR)false
dc.title.none.fl_str_mv	Indización y recuperación de tesis y disertaciones por medio de sintagmas nominales Indexação e recuperação de teses e dissertações por meio de sintagmas nominais Indexing and information retrieval of theses and dissertations through noun phrases
title	Indización y recuperación de tesis y disertaciones por medio de sintagmas nominales
spellingShingle	Indización y recuperación de tesis y disertaciones por medio de sintagmas nominales Corrêa, Renato Fernandes sintagmas nominales; recuperación de información; indización automática; tesis y disertaciones Information Science; Information Retrieval Techniques Noun phrase; Information retrieval; Automatic indexing; Theses and dissertations Automatic indexing Ciência da Informação; Técnicas de Recuperação da Informação Sintagmas nominais; Recuperação de informação; Indexação automática; Teses e dissertações indexação automática
title_short	Indización y recuperación de tesis y disertaciones por medio de sintagmas nominales
title_full	Indización y recuperación de tesis y disertaciones por medio de sintagmas nominales
title_fullStr	Indización y recuperación de tesis y disertaciones por medio de sintagmas nominales
title_full_unstemmed	Indización y recuperación de tesis y disertaciones por medio de sintagmas nominales
title_sort	Indización y recuperación de tesis y disertaciones por medio de sintagmas nominales
author	Corrêa, Renato Fernandes
author_facet	Corrêa, Renato Fernandes Miranda, Darliane Goes de Lima, Camila Oliveira de Almeida Silva, Tiago José da
author_role	author
author2	Miranda, Darliane Goes de Lima, Camila Oliveira de Almeida Silva, Tiago José da
author2_role	author author author
dc.contributor.none.fl_str_mv	CNPq CNPq CNPq
dc.contributor.author.fl_str_mv	Corrêa, Renato Fernandes Miranda, Darliane Goes de Lima, Camila Oliveira de Almeida Silva, Tiago José da
dc.subject.none.fl_str_mv
dc.subject.por.fl_str_mv	sintagmas nominales; recuperación de información; indización automática; tesis y disertaciones Information Science; Information Retrieval Techniques Noun phrase; Information retrieval; Automatic indexing; Theses and dissertations Automatic indexing Ciência da Informação; Técnicas de Recuperação da Informação Sintagmas nominais; Recuperação de informação; Indexação automática; Teses e dissertações indexação automática
topic	sintagmas nominales; recuperación de información; indización automática; tesis y disertaciones Information Science; Information Retrieval Techniques Noun phrase; Information retrieval; Automatic indexing; Theses and dissertations Automatic indexing Ciência da Informação; Técnicas de Recuperação da Informação Sintagmas nominais; Recuperação de informação; Indexação automática; Teses e dissertações indexação automática
description	Introdução. Aborda a utilização dos sintagmas nominais no processo indexação automática das teses e dissertações depositadas na Biblioteca Digital de Teses e Dissertações da UFPE (BDTD-UFPE), considerando a hipótese de que os sintagmas nominais consistiriam numa melhor unidade de conhecimento para a indexação e recuperação de informação que as palavras isoladas, permitindo aumentar a satisfação da necessidade de informação do usuário durante a busca pela informação. Discute-se sobre o estado da arte dos sintagmas nominais e de sua extração automática, bem como sua aplicação na indexação automática e recuperação de informação. Método. Analisa, com base em ferramenta para análise de texto (OGMA), a aplicabilidade da extração de sintagmas nominais na indexação automática e recuperação de informação de teses e dissertações no contexto da BDTD-UFPE. Com base em resumos da área de Direito, Computação e Nutrição, definiram-se os valores totais para cada uma das variáveis observadas, o que permitiu avaliar a extração de sintagmas nominais através dos percentuais de precisão de sintagmas nominais relevantes; da taxa de erro ao extrair cadeias de caracteres que não constituem sintagmas nominais, e; do percentual de sintagmas nominais extraídos não relevantes. Resultados. O processo de extração de sintagmas nominais através do OGMA teve diferentes desempenhos para cada programa de pós-graduação, sendo obtido melhor desempenho (melhor índice de precisão) para resumos de Direito, seguidos dos de Computação e Nutrição. Esta diferença de desempenho pode em parte ser explicada pela diferente natureza dos termos técnicos presentes nos resumos. Conclusões. Embora existam limitações nas ferramentas disponíveis, a aplicação de métodos automatizados de extração e indexação por sintagmas nominais mostra-se promissora, pois os sintagmas nominais se configuram como melhores descritores e pontos de acesso aos documentos, eliminando os problemas causados pela sinonímia e a polissemia das palavras isoladas.
publishDate	2011
dc.date.none.fl_str_mv	2011-06-01
dc.type.none.fl_str_mv
dc.type.driver.fl_str_mv	info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion Artículo evaluado por pares Avaliado pelos pares pesquisa empírica de campo
format	article
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://revistas.ufpr.br/atoz/article/view/41280 10.5380/atoz.v1i1.41280
url	https://revistas.ufpr.br/atoz/article/view/41280
identifier_str_mv	10.5380/atoz.v1i1.41280
dc.language.iso.fl_str_mv	por
language	por
dc.relation.none.fl_str_mv	https://revistas.ufpr.br/atoz/article/view/41280/25197 https://revistas.ufpr.br/atoz/article/view/41280/25198 https://revistas.ufpr.br/atoz/article/view/41280/25199
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	text/html application/pdf application/epub+zip
dc.coverage.none.fl_str_mv	organizations organizações amostra intencional
dc.publisher.none.fl_str_mv	Programa de Pós-graduação em Gestão da Informação - UFPR
publisher.none.fl_str_mv	Programa de Pós-graduação em Gestão da Informação - UFPR
dc.source.none.fl_str_mv	AtoZ: novas práticas em informação e conhecimento; v. 1, n. 1 (2011): Edição de Estréia; 11-22 AtoZ: novas práticas em informação e conhecimento; v. 1, n. 1 (2011): Edição de Estréia; 11-22 AtoZ: novas práticas em informação e conhecimento; v. 1, n. 1 (2011): Edição de Estréia; 11-22 2237-826X 10.5380/atoz.v1i1 reponame:AtoZ (Curitiba) instname:Universidade Federal do Paraná (UFPR) instacron:UFPR
instname_str	Universidade Federal do Paraná (UFPR)
instacron_str	UFPR
institution	UFPR
reponame_str	AtoZ (Curitiba)
collection	AtoZ (Curitiba)
repository.name.fl_str_mv	AtoZ (Curitiba) - Universidade Federal do Paraná (UFPR)
repository.mail.fl_str_mv	\|\|revistaatoz@ufpr.br\|\| contatoatoz@gmail.com
_version_	1809276795720040448

Indización y recuperación de tesis y disertaciones por medio de sintagmas nominales

Registros relacionados