SALF: um algorítimo para indexação automática utilizando vocabulário controlado

Detalhes bibliográficos
Autor(a) principal: Sayão, Luis Fernando
Data de Publicação: 1985
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFRJ
Texto Completo: http://hdl.handle.net/11422/8743
Resumo: Propõe-se um método de indexação automática para indexar títulos e resumos de documentos escritos, baseado em tesauro, capaz de assinalar descritores controlados formados preferencialmente por mais de uma palavra. O método proposto incorpora também dispositivo capaz de sugerir descritores ao indexador, com intuito de enriquecer tanto a indexação quanto o vocabulário da área. Testa-se o método, indexando-se uma amostra da base de dados em energia FONTE/CIN. avaliam-se em comparação com a indexação manual os seguintes parâmetros: revocação, precisão, exaustividade, especificidade, consistência e concordância dos descritores de altas frequências. Os resultados obtidos demonstram que o método proposto é viável.
id UFRJ_07ab4b633b1242d5bd73c37dc1bdf19d
oai_identifier_str oai:pantheon.ufrj.br:11422/8743
network_acronym_str UFRJ
network_name_str Repositório Institucional da UFRJ
repository_id_str
spelling Sayão, Luis Fernandohttp://lattes.cnpq.br/2245026790419537http://lattes.cnpq.br/3422623122948389Braga, Gilda Maria2019-07-09T21:22:01Z2023-11-30T03:03:36Z1985http://hdl.handle.net/11422/8743Propõe-se um método de indexação automática para indexar títulos e resumos de documentos escritos, baseado em tesauro, capaz de assinalar descritores controlados formados preferencialmente por mais de uma palavra. O método proposto incorpora também dispositivo capaz de sugerir descritores ao indexador, com intuito de enriquecer tanto a indexação quanto o vocabulário da área. Testa-se o método, indexando-se uma amostra da base de dados em energia FONTE/CIN. avaliam-se em comparação com a indexação manual os seguintes parâmetros: revocação, precisão, exaustividade, especificidade, consistência e concordância dos descritores de altas frequências. Os resultados obtidos demonstram que o método proposto é viável.A thesaurus based method of automatic indexing able to assign controlled descriptors formed preferentially by phrases, is developed. The method is designed to index titles and abstracts of written documents. It also includes device to suggest description to the indexer in order to enrich the indexing and the specific vocabulary of the area. With the aim to test the method, a sample from the FONTE/CIN data base in energy, is indexed using the method. A comparative evaluation in relation to the manual indexing is carried out; the parameters investigated are: recall, precision, exaustivity, specificity, coincidence of descriptors and concordance of the high frequency descriptors. The results confirm the feasibility of the proposed method.Submitted by Alberto Vieira (martins_vieira@ibest.com.br) on 2019-07-09T21:22:01Z No. of bitstreams: 1 276868.pdf: 14529201 bytes, checksum: 21ffc26c06126f1f25b697918c869cf4 (MD5)Made available in DSpace on 2019-07-09T21:22:01Z (GMT). No. of bitstreams: 1 276868.pdf: 14529201 bytes, checksum: 21ffc26c06126f1f25b697918c869cf4 (MD5) Previous issue date: 1985porUniversidade Federal do Rio de JaneiroInstituto Brasileiro de Informação em Ciência e TecnologiaPrograma de Pós-Graduação em Ciência da InformaçãoUFRJIBICTBrasilEscola de ComunicaçãoCNPQ::CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO::TEORIA DA INFORMACAO::REPRESENTACAO DA INFORMACAOIndexaçãoVocabulários controladosTesaurosRecuperação da informaçãoAlgoritmosEnergia nuclearSALF: um algorítimo para indexação automática utilizando vocabulário controladoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisabertoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRJinstname:Universidade Federal do Rio de Janeiro (UFRJ)instacron:UFRJORIGINAL276868.pdf276868.pdfapplication/pdf14529201http://pantheon.ufrj.br:80/bitstream/11422/8743/1/276868.pdf21ffc26c06126f1f25b697918c869cf4MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81853http://pantheon.ufrj.br:80/bitstream/11422/8743/2/license.txtdd32849f2bfb22da963c3aac6e26e255MD5211422/87432023-11-30 00:03:36.175oai:pantheon.ufrj.br:11422/8743TElDRU7Dh0EgTsODTy1FWENMVVNJVkEgREUgRElTVFJJQlVJw4fDg08KCkFvIGFzc2luYXIgZSBlbnRyZWdhciBlc3RhIGxpY2Vuw6dhLCB2b2PDqihzKSBvKHMpIGF1dG9yKGVzKSBvdSBwcm9wcmlldMOhcmlvKHMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBjb25jZWRlKG0pIGFvIFJlcG9zaXTDs3JpbyBQYW50aGVvbiBkYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gZGUgSmFuZWlybyAoVUZSSikgbyBkaXJlaXRvIG7Do28gLSBleGNsdXNpdm8gZGUgcmVwcm9kdXppciwgY29udmVydGVyIChjb21vIGRlZmluaWRvIGFiYWl4byksIGUvb3UgZGlzdHJpYnVpciBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vKSBlbSB0b2RvIG8gbXVuZG8sIGVtIGZvcm1hdG8gZWxldHLDtG5pY28gZSBlbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8sIG1hcyBuw6NvIGxpbWl0YWRvIGEgw6F1ZGlvIGUvb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIGEgVUZSSiBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhZHV6aXIgYSBhcHJlc2VudGHDp8OjbyBkZSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gY29tIGEgZmluYWxpZGFkZSBkZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogdGFtYsOpbSBjb25jb3JkYSBxdWUgYSBVRlJKIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXNzYSBzdWJtaXNzw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8OjbyBkaWdpdGFsLgoKRGVjbGFyYSBxdWUgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgc2V1IHRyYWJhbGhvIG9yaWdpbmFsLCBlIHF1ZSB2b2PDqiB0ZW0gbyBkaXJlaXRvIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIGEgc3VhIGFwcmVzZW50YcOnw6NvLCBjb20gbyBtZWxob3IgZGUgc2V1cyBjb25oZWNpbWVudG9zLCBuw6NvIGluZnJpbmdpIGRpcmVpdG9zIGF1dG9yYWlzIGRlIHRlcmNlaXJvcy4KClNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIGNvbnTDqW0gbWF0ZXJpYWwgZG8gcXVhbCB2b2PDqiBuw6NvIHRlbSBkaXJlaXRvcyBkZSBhdXRvciwgZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBlIGNvbmNlZGUgYSBVRlJKIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRhIHN1Ym1pc3PDo28uCgpTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBiYXNlYWRvIGVtIHRyYWJhbGhvIHF1ZSBmb2ksIG91IHRlbSBzaWRvIHBhdHJvY2luYWRvIG91IGFwb2lhZG8gcG9yIHVtYSBhZ8OqbmNpYSBvdSBvdXRybyhzKSBvcmdhbmlzbW8ocykgcXVlIG7Do28gYSBVRlJKLCB2b2PDqiBkZWNsYXJhIHF1ZSBjdW1wcml1IHF1YWxxdWVyIGRpcmVpdG8gZGUgUkVWSVPDg08gb3UgZGUgb3V0cmFzIG9icmlnYcOnw7VlcyByZXF1ZXJpZGFzIHBvciBjb250cmF0byBvdSBhY29yZG8uCgpBIFVGUkogaXLDoSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8ocykgc2V1KHMpIG5vbWUocykgY29tbyBhdXRvcihlcykgb3UgcHJvcHJpZXTDoXJpbyhzKSBkYSBzdWJtaXNzw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIHBhcmEgYWzDqW0gZGFzIHBlcm1pdGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EsIG5vIGF0byBkZSBzdWJtaXNzw6NvLgo=Repositório de PublicaçõesPUBhttp://www.pantheon.ufrj.br/oai/requestopendoar:2023-11-30T03:03:36Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)false
dc.title.pt_BR.fl_str_mv SALF: um algorítimo para indexação automática utilizando vocabulário controlado
title SALF: um algorítimo para indexação automática utilizando vocabulário controlado
spellingShingle SALF: um algorítimo para indexação automática utilizando vocabulário controlado
Sayão, Luis Fernando
CNPQ::CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO::TEORIA DA INFORMACAO::REPRESENTACAO DA INFORMACAO
Indexação
Vocabulários controlados
Tesauros
Recuperação da informação
Algoritmos
Energia nuclear
title_short SALF: um algorítimo para indexação automática utilizando vocabulário controlado
title_full SALF: um algorítimo para indexação automática utilizando vocabulário controlado
title_fullStr SALF: um algorítimo para indexação automática utilizando vocabulário controlado
title_full_unstemmed SALF: um algorítimo para indexação automática utilizando vocabulário controlado
title_sort SALF: um algorítimo para indexação automática utilizando vocabulário controlado
author Sayão, Luis Fernando
author_facet Sayão, Luis Fernando
author_role author
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/2245026790419537
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/3422623122948389
dc.contributor.author.fl_str_mv Sayão, Luis Fernando
dc.contributor.advisor1.fl_str_mv Braga, Gilda Maria
contributor_str_mv Braga, Gilda Maria
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO::TEORIA DA INFORMACAO::REPRESENTACAO DA INFORMACAO
topic CNPQ::CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO::TEORIA DA INFORMACAO::REPRESENTACAO DA INFORMACAO
Indexação
Vocabulários controlados
Tesauros
Recuperação da informação
Algoritmos
Energia nuclear
dc.subject.por.fl_str_mv Indexação
Vocabulários controlados
Tesauros
Recuperação da informação
Algoritmos
Energia nuclear
description Propõe-se um método de indexação automática para indexar títulos e resumos de documentos escritos, baseado em tesauro, capaz de assinalar descritores controlados formados preferencialmente por mais de uma palavra. O método proposto incorpora também dispositivo capaz de sugerir descritores ao indexador, com intuito de enriquecer tanto a indexação quanto o vocabulário da área. Testa-se o método, indexando-se uma amostra da base de dados em energia FONTE/CIN. avaliam-se em comparação com a indexação manual os seguintes parâmetros: revocação, precisão, exaustividade, especificidade, consistência e concordância dos descritores de altas frequências. Os resultados obtidos demonstram que o método proposto é viável.
publishDate 1985
dc.date.issued.fl_str_mv 1985
dc.date.accessioned.fl_str_mv 2019-07-09T21:22:01Z
dc.date.available.fl_str_mv 2023-11-30T03:03:36Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/11422/8743
url http://hdl.handle.net/11422/8743
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal do Rio de Janeiro
Instituto Brasileiro de Informação em Ciência e Tecnologia
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Informação
dc.publisher.initials.fl_str_mv UFRJ
IBICT
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Escola de Comunicação
publisher.none.fl_str_mv Universidade Federal do Rio de Janeiro
Instituto Brasileiro de Informação em Ciência e Tecnologia
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRJ
instname:Universidade Federal do Rio de Janeiro (UFRJ)
instacron:UFRJ
instname_str Universidade Federal do Rio de Janeiro (UFRJ)
instacron_str UFRJ
institution UFRJ
reponame_str Repositório Institucional da UFRJ
collection Repositório Institucional da UFRJ
bitstream.url.fl_str_mv http://pantheon.ufrj.br:80/bitstream/11422/8743/1/276868.pdf
http://pantheon.ufrj.br:80/bitstream/11422/8743/2/license.txt
bitstream.checksum.fl_str_mv 21ffc26c06126f1f25b697918c869cf4
dd32849f2bfb22da963c3aac6e26e255
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)
repository.mail.fl_str_mv
_version_ 1784097149054615552