Estudo de vocabulário controlado na indexação automática: aplicação no processo de indexação do Sistema de Indización Semiautomática (SISA)

Detalhes bibliográficos
Autor(a) principal: Narukawa, Cristina Miyuki [UNESP]
Data de Publicação: 2011
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UNESP
Texto Completo: http://hdl.handle.net/11449/93677
Resumo: Automatic indexing is a complex process, and delegating the attribution of terms to automatic systems requires analyzing not only the methods, but also the features of indexing instruments. Thereby, we propose to investigate the role of controlled vocabulary in such process, based on the analysis of results from the application of ThesAgro vocabulary in the Semi-Automatic Indexing System (SISA - Sistema de Indización SemiAutomatica -), with the purposes of identifying the characteristics which define and distinguish the types of vocabularies; analyzing methodological proposals and indexing systems; applying the ThesAgro in the SISA, making a comparative analysis related to the manual indexing by the National Library of Agriculture (BINAGRI - Biblioteca Nacional de Agricultura), and analyzing the intervening factors pointing to the occurrence of problems concerning automatic indexing. As a general matter, we seek to contribute to the development of this theme by raising subsidies for adapting controlled vocabularies. We have performed a theoretical review on automatic indexing systems, and an experiment applying the ThesAgro in the SISA, with 100 articles on agriculture , specifically about fruit production. The manual indexing performed by BINAGRI and the comparative analysis with the results from a previous research, which evaluated the performance of the vocabulary from the Health Sciences Descriptors (DeCS - Descritores em Ciências da Saúde) in the before mentioned system, have served as the evaluation parameter. The analysis of results allows us to conclude that the vocabulary conditions the results of the automatic indexing process. Thus, it is necessary to understand it, considering the identification methods of the information representative units, application of linguistic treatment, features of the... (Complete abstract click electronic access below)
id UNSP_50837167a550ff561b6f47a2df3f4b23
oai_identifier_str oai:repositorio.unesp.br:11449/93677
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str 2946
spelling Estudo de vocabulário controlado na indexação automática: aplicação no processo de indexação do Sistema de Indización Semiautomática (SISA)Ciência da informaçãoIndexação automaticaSistemas de recuperação da informaçãoSistema de indización semiautomática (SISA)Linguagem de indexaçãoIndexação - SoftwareVocabulário controladoAutomatic indexingControlled vocabularyAutomatic Indexing SystemsSistema de Indización Semiautomático (SISA)Automatic indexing is a complex process, and delegating the attribution of terms to automatic systems requires analyzing not only the methods, but also the features of indexing instruments. Thereby, we propose to investigate the role of controlled vocabulary in such process, based on the analysis of results from the application of ThesAgro vocabulary in the Semi-Automatic Indexing System (SISA - Sistema de Indización SemiAutomatica -), with the purposes of identifying the characteristics which define and distinguish the types of vocabularies; analyzing methodological proposals and indexing systems; applying the ThesAgro in the SISA, making a comparative analysis related to the manual indexing by the National Library of Agriculture (BINAGRI - Biblioteca Nacional de Agricultura), and analyzing the intervening factors pointing to the occurrence of problems concerning automatic indexing. As a general matter, we seek to contribute to the development of this theme by raising subsidies for adapting controlled vocabularies. We have performed a theoretical review on automatic indexing systems, and an experiment applying the ThesAgro in the SISA, with 100 articles on agriculture , specifically about fruit production. The manual indexing performed by BINAGRI and the comparative analysis with the results from a previous research, which evaluated the performance of the vocabulary from the Health Sciences Descriptors (DeCS - Descritores em Ciências da Saúde) in the before mentioned system, have served as the evaluation parameter. The analysis of results allows us to conclude that the vocabulary conditions the results of the automatic indexing process. Thus, it is necessary to understand it, considering the identification methods of the information representative units, application of linguistic treatment, features of the... (Complete abstract click electronic access below)A indexação automática é um processo complexo e delegar a atividade de atribuição de termos aos sistemas automáticos requer análise, tanto dos métodos, quanto das características dos instrumentos de indexação. Desse modo, propomos investigar a atuação de vocabulário controlado neste processo a partir da análise dos resultados de aplicação do vocabulário ThesAgro no Sistema de Indización SemiAutomatica (SISA), com objetivos de identificar as características que definem e distinguem os tipos de vocabulários; analisar propostas metodológicas e sistemas de indexação; aplicar o ThesAgro no sistema SISA em análise comparativa com a indexação manual da Biblioteca Nacional de Agricultura (BINAGRI), e analisar os fatores intervenientes que apontam os problemas ocasionados à indexação automática. De modo geral, buscamos contribuir com o desenvolvimento do tema ao levantar subsídios para adaptação de vocabulários controlados. Realizamos uma revisão teórica sobre sistemas de indexação automática e um experimento aplicando o ThesAgro no sistema SISA com 100 artigos da área agrícola, especificamente sobre fruticultura. Utilizamos, como parâmetro de avaliação, a indexação manual realizada pela BINAGRI e análise comparativa com os resultados de pesquisa anterior em que se avaliou o desempenho do vocabulário Descritores em Ciências da Saúde (DeCS) no referido sistema. A partir da análise dos resultados constatamos que o vocabulário condiciona os resultados do processo de indexação automática e, portanto, é necessário compreendê-lo, considerando os métodos de identificação das unidades representativas da informação, aplicação de tratamento linguístico, características da área do conhecimento, relações semânticas, idioma, atualização, uso de vocabulários...Universidade Estadual Paulista (Unesp)Fujita, Mariângela Spotti Lopes [UNESP]Leiva, Isidoro Gil [UNESP]Universidade Estadual Paulista (Unesp)Narukawa, Cristina Miyuki [UNESP]2014-06-11T19:26:44Z2014-06-11T19:26:44Z2011-06-22info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis222 f. : il. color.application/pdfNARUKAWA, Cristina Miyuki. Estudo de vocabulário controlado na indexação automática: aplicação no processo de indexação do Sistema de Indización Semiautomática (SISA). 2011. 222 f. Dissertação (mestrado) - Universidade Estadual Paulista, Faculdade de Filosofia e Ciências, 2011.http://hdl.handle.net/11449/93677000670832narukawa_cm_me_mar.pdf33004110043P46530346906709462Alephreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESPporinfo:eu-repo/semantics/openAccess2024-08-12T18:09:46Zoai:repositorio.unesp.br:11449/93677Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462024-08-12T18:09:46Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv Estudo de vocabulário controlado na indexação automática: aplicação no processo de indexação do Sistema de Indización Semiautomática (SISA)
title Estudo de vocabulário controlado na indexação automática: aplicação no processo de indexação do Sistema de Indización Semiautomática (SISA)
spellingShingle Estudo de vocabulário controlado na indexação automática: aplicação no processo de indexação do Sistema de Indización Semiautomática (SISA)
Narukawa, Cristina Miyuki [UNESP]
Ciência da informação
Indexação automatica
Sistemas de recuperação da informação
Sistema de indización semiautomática (SISA)
Linguagem de indexação
Indexação - Software
Vocabulário controlado
Automatic indexing
Controlled vocabulary
Automatic Indexing Systems
Sistema de Indización Semiautomático (SISA)
title_short Estudo de vocabulário controlado na indexação automática: aplicação no processo de indexação do Sistema de Indización Semiautomática (SISA)
title_full Estudo de vocabulário controlado na indexação automática: aplicação no processo de indexação do Sistema de Indización Semiautomática (SISA)
title_fullStr Estudo de vocabulário controlado na indexação automática: aplicação no processo de indexação do Sistema de Indización Semiautomática (SISA)
title_full_unstemmed Estudo de vocabulário controlado na indexação automática: aplicação no processo de indexação do Sistema de Indización Semiautomática (SISA)
title_sort Estudo de vocabulário controlado na indexação automática: aplicação no processo de indexação do Sistema de Indización Semiautomática (SISA)
author Narukawa, Cristina Miyuki [UNESP]
author_facet Narukawa, Cristina Miyuki [UNESP]
author_role author
dc.contributor.none.fl_str_mv Fujita, Mariângela Spotti Lopes [UNESP]
Leiva, Isidoro Gil [UNESP]
Universidade Estadual Paulista (Unesp)
dc.contributor.author.fl_str_mv Narukawa, Cristina Miyuki [UNESP]
dc.subject.por.fl_str_mv Ciência da informação
Indexação automatica
Sistemas de recuperação da informação
Sistema de indización semiautomática (SISA)
Linguagem de indexação
Indexação - Software
Vocabulário controlado
Automatic indexing
Controlled vocabulary
Automatic Indexing Systems
Sistema de Indización Semiautomático (SISA)
topic Ciência da informação
Indexação automatica
Sistemas de recuperação da informação
Sistema de indización semiautomática (SISA)
Linguagem de indexação
Indexação - Software
Vocabulário controlado
Automatic indexing
Controlled vocabulary
Automatic Indexing Systems
Sistema de Indización Semiautomático (SISA)
description Automatic indexing is a complex process, and delegating the attribution of terms to automatic systems requires analyzing not only the methods, but also the features of indexing instruments. Thereby, we propose to investigate the role of controlled vocabulary in such process, based on the analysis of results from the application of ThesAgro vocabulary in the Semi-Automatic Indexing System (SISA - Sistema de Indización SemiAutomatica -), with the purposes of identifying the characteristics which define and distinguish the types of vocabularies; analyzing methodological proposals and indexing systems; applying the ThesAgro in the SISA, making a comparative analysis related to the manual indexing by the National Library of Agriculture (BINAGRI - Biblioteca Nacional de Agricultura), and analyzing the intervening factors pointing to the occurrence of problems concerning automatic indexing. As a general matter, we seek to contribute to the development of this theme by raising subsidies for adapting controlled vocabularies. We have performed a theoretical review on automatic indexing systems, and an experiment applying the ThesAgro in the SISA, with 100 articles on agriculture , specifically about fruit production. The manual indexing performed by BINAGRI and the comparative analysis with the results from a previous research, which evaluated the performance of the vocabulary from the Health Sciences Descriptors (DeCS - Descritores em Ciências da Saúde) in the before mentioned system, have served as the evaluation parameter. The analysis of results allows us to conclude that the vocabulary conditions the results of the automatic indexing process. Thus, it is necessary to understand it, considering the identification methods of the information representative units, application of linguistic treatment, features of the... (Complete abstract click electronic access below)
publishDate 2011
dc.date.none.fl_str_mv 2011-06-22
2014-06-11T19:26:44Z
2014-06-11T19:26:44Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv NARUKAWA, Cristina Miyuki. Estudo de vocabulário controlado na indexação automática: aplicação no processo de indexação do Sistema de Indización Semiautomática (SISA). 2011. 222 f. Dissertação (mestrado) - Universidade Estadual Paulista, Faculdade de Filosofia e Ciências, 2011.
http://hdl.handle.net/11449/93677
000670832
narukawa_cm_me_mar.pdf
33004110043P4
6530346906709462
identifier_str_mv NARUKAWA, Cristina Miyuki. Estudo de vocabulário controlado na indexação automática: aplicação no processo de indexação do Sistema de Indización Semiautomática (SISA). 2011. 222 f. Dissertação (mestrado) - Universidade Estadual Paulista, Faculdade de Filosofia e Ciências, 2011.
000670832
narukawa_cm_me_mar.pdf
33004110043P4
6530346906709462
url http://hdl.handle.net/11449/93677
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 222 f. : il. color.
application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv Aleph
reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv
_version_ 1808128137435807744