SALF: um algorítimo para indexação automática utilizando vocabulário controlado
Autor(a) principal: | |
---|---|
Data de Publicação: | 1985 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRJ |
Texto Completo: | http://hdl.handle.net/11422/8743 |
Resumo: | A thesaurus based method of automatic indexing able to assign controlled descriptors formed preferentially by phrases, is developed. The method is designed to index titles and abstracts of written documents. It also includes device to suggest description to the indexer in order to enrich the indexing and the specific vocabulary of the area. With the aim to test the method, a sample from the FONTE/CIN data base in energy, is indexed using the method. A comparative evaluation in relation to the manual indexing is carried out; the parameters investigated are: recall, precision, exaustivity, specificity, coincidence of descriptors and concordance of the high frequency descriptors. The results confirm the feasibility of the proposed method. |
id |
UFRJ_07ab4b633b1242d5bd73c37dc1bdf19d |
---|---|
oai_identifier_str |
oai:pantheon.ufrj.br:11422/8743 |
network_acronym_str |
UFRJ |
network_name_str |
Repositório Institucional da UFRJ |
repository_id_str |
|
spelling |
SALF: um algorítimo para indexação automática utilizando vocabulário controladoIndexaçãoVocabulários controladosTesaurosRecuperação da informaçãoAlgoritmosEnergia nuclearCNPQ::CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO::TEORIA DA INFORMACAO::REPRESENTACAO DA INFORMACAOA thesaurus based method of automatic indexing able to assign controlled descriptors formed preferentially by phrases, is developed. The method is designed to index titles and abstracts of written documents. It also includes device to suggest description to the indexer in order to enrich the indexing and the specific vocabulary of the area. With the aim to test the method, a sample from the FONTE/CIN data base in energy, is indexed using the method. A comparative evaluation in relation to the manual indexing is carried out; the parameters investigated are: recall, precision, exaustivity, specificity, coincidence of descriptors and concordance of the high frequency descriptors. The results confirm the feasibility of the proposed method.Propõe-se um método de indexação automática para indexar títulos e resumos de documentos escritos, baseado em tesauro, capaz de assinalar descritores controlados formados preferencialmente por mais de uma palavra. O método proposto incorpora também dispositivo capaz de sugerir descritores ao indexador, com intuito de enriquecer tanto a indexação quanto o vocabulário da área. Testa-se o método, indexando-se uma amostra da base de dados em energia FONTE/CIN. avaliam-se em comparação com a indexação manual os seguintes parâmetros: revocação, precisão, exaustividade, especificidade, consistência e concordância dos descritores de altas frequências. Os resultados obtidos demonstram que o método proposto é viável.Universidade Federal do Rio de JaneiroInstituto Brasileiro de Informação em Ciência e TecnologiaBrasilEscola de ComunicaçãoPrograma de Pós-Graduação em Ciência da InformaçãoUFRJIBICTBraga, Gilda Mariahttp://lattes.cnpq.br/2245026790419537http://lattes.cnpq.br/3422623122948389Sayão, Luis Fernando2019-07-09T21:22:01Z2023-12-21T03:06:13Z1985info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/11422/8743porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRJinstname:Universidade Federal do Rio de Janeiro (UFRJ)instacron:UFRJ2023-12-21T03:06:13Zoai:pantheon.ufrj.br:11422/8743Repositório InstitucionalPUBhttp://www.pantheon.ufrj.br/oai/requestpantheon@sibi.ufrj.bropendoar:2023-12-21T03:06:13Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)false |
dc.title.none.fl_str_mv |
SALF: um algorítimo para indexação automática utilizando vocabulário controlado |
title |
SALF: um algorítimo para indexação automática utilizando vocabulário controlado |
spellingShingle |
SALF: um algorítimo para indexação automática utilizando vocabulário controlado Sayão, Luis Fernando Indexação Vocabulários controlados Tesauros Recuperação da informação Algoritmos Energia nuclear CNPQ::CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO::TEORIA DA INFORMACAO::REPRESENTACAO DA INFORMACAO |
title_short |
SALF: um algorítimo para indexação automática utilizando vocabulário controlado |
title_full |
SALF: um algorítimo para indexação automática utilizando vocabulário controlado |
title_fullStr |
SALF: um algorítimo para indexação automática utilizando vocabulário controlado |
title_full_unstemmed |
SALF: um algorítimo para indexação automática utilizando vocabulário controlado |
title_sort |
SALF: um algorítimo para indexação automática utilizando vocabulário controlado |
author |
Sayão, Luis Fernando |
author_facet |
Sayão, Luis Fernando |
author_role |
author |
dc.contributor.none.fl_str_mv |
Braga, Gilda Maria http://lattes.cnpq.br/2245026790419537 http://lattes.cnpq.br/3422623122948389 |
dc.contributor.author.fl_str_mv |
Sayão, Luis Fernando |
dc.subject.por.fl_str_mv |
Indexação Vocabulários controlados Tesauros Recuperação da informação Algoritmos Energia nuclear CNPQ::CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO::TEORIA DA INFORMACAO::REPRESENTACAO DA INFORMACAO |
topic |
Indexação Vocabulários controlados Tesauros Recuperação da informação Algoritmos Energia nuclear CNPQ::CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO::TEORIA DA INFORMACAO::REPRESENTACAO DA INFORMACAO |
description |
A thesaurus based method of automatic indexing able to assign controlled descriptors formed preferentially by phrases, is developed. The method is designed to index titles and abstracts of written documents. It also includes device to suggest description to the indexer in order to enrich the indexing and the specific vocabulary of the area. With the aim to test the method, a sample from the FONTE/CIN data base in energy, is indexed using the method. A comparative evaluation in relation to the manual indexing is carried out; the parameters investigated are: recall, precision, exaustivity, specificity, coincidence of descriptors and concordance of the high frequency descriptors. The results confirm the feasibility of the proposed method. |
publishDate |
1985 |
dc.date.none.fl_str_mv |
1985 2019-07-09T21:22:01Z 2023-12-21T03:06:13Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/11422/8743 |
url |
http://hdl.handle.net/11422/8743 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal do Rio de Janeiro Instituto Brasileiro de Informação em Ciência e Tecnologia Brasil Escola de Comunicação Programa de Pós-Graduação em Ciência da Informação UFRJ IBICT |
publisher.none.fl_str_mv |
Universidade Federal do Rio de Janeiro Instituto Brasileiro de Informação em Ciência e Tecnologia Brasil Escola de Comunicação Programa de Pós-Graduação em Ciência da Informação UFRJ IBICT |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRJ instname:Universidade Federal do Rio de Janeiro (UFRJ) instacron:UFRJ |
instname_str |
Universidade Federal do Rio de Janeiro (UFRJ) |
instacron_str |
UFRJ |
institution |
UFRJ |
reponame_str |
Repositório Institucional da UFRJ |
collection |
Repositório Institucional da UFRJ |
repository.name.fl_str_mv |
Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ) |
repository.mail.fl_str_mv |
pantheon@sibi.ufrj.br |
_version_ |
1815455992219959296 |