SALF: um algorítimo para indexação automática utilizando vocabulário controlado
Autor(a) principal: | |
---|---|
Data de Publicação: | 1985 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRJ |
Texto Completo: | http://hdl.handle.net/11422/8743 |
Resumo: | Propõe-se um método de indexação automática para indexar títulos e resumos de documentos escritos, baseado em tesauro, capaz de assinalar descritores controlados formados preferencialmente por mais de uma palavra. O método proposto incorpora também dispositivo capaz de sugerir descritores ao indexador, com intuito de enriquecer tanto a indexação quanto o vocabulário da área. Testa-se o método, indexando-se uma amostra da base de dados em energia FONTE/CIN. avaliam-se em comparação com a indexação manual os seguintes parâmetros: revocação, precisão, exaustividade, especificidade, consistência e concordância dos descritores de altas frequências. Os resultados obtidos demonstram que o método proposto é viável. |
id |
UFRJ_07ab4b633b1242d5bd73c37dc1bdf19d |
---|---|
oai_identifier_str |
oai:pantheon.ufrj.br:11422/8743 |
network_acronym_str |
UFRJ |
network_name_str |
Repositório Institucional da UFRJ |
repository_id_str |
|
spelling |
Sayão, Luis Fernandohttp://lattes.cnpq.br/2245026790419537http://lattes.cnpq.br/3422623122948389Braga, Gilda Maria2019-07-09T21:22:01Z2023-11-30T03:03:36Z1985http://hdl.handle.net/11422/8743Propõe-se um método de indexação automática para indexar títulos e resumos de documentos escritos, baseado em tesauro, capaz de assinalar descritores controlados formados preferencialmente por mais de uma palavra. O método proposto incorpora também dispositivo capaz de sugerir descritores ao indexador, com intuito de enriquecer tanto a indexação quanto o vocabulário da área. Testa-se o método, indexando-se uma amostra da base de dados em energia FONTE/CIN. avaliam-se em comparação com a indexação manual os seguintes parâmetros: revocação, precisão, exaustividade, especificidade, consistência e concordância dos descritores de altas frequências. Os resultados obtidos demonstram que o método proposto é viável.A thesaurus based method of automatic indexing able to assign controlled descriptors formed preferentially by phrases, is developed. The method is designed to index titles and abstracts of written documents. It also includes device to suggest description to the indexer in order to enrich the indexing and the specific vocabulary of the area. With the aim to test the method, a sample from the FONTE/CIN data base in energy, is indexed using the method. A comparative evaluation in relation to the manual indexing is carried out; the parameters investigated are: recall, precision, exaustivity, specificity, coincidence of descriptors and concordance of the high frequency descriptors. The results confirm the feasibility of the proposed method.Submitted by Alberto Vieira (martins_vieira@ibest.com.br) on 2019-07-09T21:22:01Z No. of bitstreams: 1 276868.pdf: 14529201 bytes, checksum: 21ffc26c06126f1f25b697918c869cf4 (MD5)Made available in DSpace on 2019-07-09T21:22:01Z (GMT). No. of bitstreams: 1 276868.pdf: 14529201 bytes, checksum: 21ffc26c06126f1f25b697918c869cf4 (MD5) Previous issue date: 1985porUniversidade Federal do Rio de JaneiroInstituto Brasileiro de Informação em Ciência e TecnologiaPrograma de Pós-Graduação em Ciência da InformaçãoUFRJIBICTBrasilEscola de ComunicaçãoCNPQ::CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO::TEORIA DA INFORMACAO::REPRESENTACAO DA INFORMACAOIndexaçãoVocabulários controladosTesaurosRecuperação da informaçãoAlgoritmosEnergia nuclearSALF: um algorítimo para indexação automática utilizando vocabulário controladoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisabertoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRJinstname:Universidade Federal do Rio de Janeiro (UFRJ)instacron:UFRJORIGINAL276868.pdf276868.pdfapplication/pdf14529201http://pantheon.ufrj.br:80/bitstream/11422/8743/1/276868.pdf21ffc26c06126f1f25b697918c869cf4MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81853http://pantheon.ufrj.br:80/bitstream/11422/8743/2/license.txtdd32849f2bfb22da963c3aac6e26e255MD5211422/87432023-11-30 00:03:36.175oai:pantheon.ufrj.br:11422/8743TElDRU7Dh0EgTsODTy1FWENMVVNJVkEgREUgRElTVFJJQlVJw4fDg08KCkFvIGFzc2luYXIgZSBlbnRyZWdhciBlc3RhIGxpY2Vuw6dhLCB2b2PDqihzKSBvKHMpIGF1dG9yKGVzKSBvdSBwcm9wcmlldMOhcmlvKHMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBjb25jZWRlKG0pIGFvIFJlcG9zaXTDs3JpbyBQYW50aGVvbiBkYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gZGUgSmFuZWlybyAoVUZSSikgbyBkaXJlaXRvIG7Do28gLSBleGNsdXNpdm8gZGUgcmVwcm9kdXppciwgY29udmVydGVyIChjb21vIGRlZmluaWRvIGFiYWl4byksIGUvb3UgZGlzdHJpYnVpciBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vKSBlbSB0b2RvIG8gbXVuZG8sIGVtIGZvcm1hdG8gZWxldHLDtG5pY28gZSBlbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8sIG1hcyBuw6NvIGxpbWl0YWRvIGEgw6F1ZGlvIGUvb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIGEgVUZSSiBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhZHV6aXIgYSBhcHJlc2VudGHDp8OjbyBkZSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gY29tIGEgZmluYWxpZGFkZSBkZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogdGFtYsOpbSBjb25jb3JkYSBxdWUgYSBVRlJKIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXNzYSBzdWJtaXNzw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8OjbyBkaWdpdGFsLgoKRGVjbGFyYSBxdWUgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgc2V1IHRyYWJhbGhvIG9yaWdpbmFsLCBlIHF1ZSB2b2PDqiB0ZW0gbyBkaXJlaXRvIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIGEgc3VhIGFwcmVzZW50YcOnw6NvLCBjb20gbyBtZWxob3IgZGUgc2V1cyBjb25oZWNpbWVudG9zLCBuw6NvIGluZnJpbmdpIGRpcmVpdG9zIGF1dG9yYWlzIGRlIHRlcmNlaXJvcy4KClNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIGNvbnTDqW0gbWF0ZXJpYWwgZG8gcXVhbCB2b2PDqiBuw6NvIHRlbSBkaXJlaXRvcyBkZSBhdXRvciwgZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBlIGNvbmNlZGUgYSBVRlJKIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRhIHN1Ym1pc3PDo28uCgpTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBiYXNlYWRvIGVtIHRyYWJhbGhvIHF1ZSBmb2ksIG91IHRlbSBzaWRvIHBhdHJvY2luYWRvIG91IGFwb2lhZG8gcG9yIHVtYSBhZ8OqbmNpYSBvdSBvdXRybyhzKSBvcmdhbmlzbW8ocykgcXVlIG7Do28gYSBVRlJKLCB2b2PDqiBkZWNsYXJhIHF1ZSBjdW1wcml1IHF1YWxxdWVyIGRpcmVpdG8gZGUgUkVWSVPDg08gb3UgZGUgb3V0cmFzIG9icmlnYcOnw7VlcyByZXF1ZXJpZGFzIHBvciBjb250cmF0byBvdSBhY29yZG8uCgpBIFVGUkogaXLDoSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8ocykgc2V1KHMpIG5vbWUocykgY29tbyBhdXRvcihlcykgb3UgcHJvcHJpZXTDoXJpbyhzKSBkYSBzdWJtaXNzw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIHBhcmEgYWzDqW0gZGFzIHBlcm1pdGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EsIG5vIGF0byBkZSBzdWJtaXNzw6NvLgo=Repositório de PublicaçõesPUBhttp://www.pantheon.ufrj.br/oai/requestopendoar:2023-11-30T03:03:36Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)false |
dc.title.pt_BR.fl_str_mv |
SALF: um algorítimo para indexação automática utilizando vocabulário controlado |
title |
SALF: um algorítimo para indexação automática utilizando vocabulário controlado |
spellingShingle |
SALF: um algorítimo para indexação automática utilizando vocabulário controlado Sayão, Luis Fernando CNPQ::CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO::TEORIA DA INFORMACAO::REPRESENTACAO DA INFORMACAO Indexação Vocabulários controlados Tesauros Recuperação da informação Algoritmos Energia nuclear |
title_short |
SALF: um algorítimo para indexação automática utilizando vocabulário controlado |
title_full |
SALF: um algorítimo para indexação automática utilizando vocabulário controlado |
title_fullStr |
SALF: um algorítimo para indexação automática utilizando vocabulário controlado |
title_full_unstemmed |
SALF: um algorítimo para indexação automática utilizando vocabulário controlado |
title_sort |
SALF: um algorítimo para indexação automática utilizando vocabulário controlado |
author |
Sayão, Luis Fernando |
author_facet |
Sayão, Luis Fernando |
author_role |
author |
dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/2245026790419537 |
dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/3422623122948389 |
dc.contributor.author.fl_str_mv |
Sayão, Luis Fernando |
dc.contributor.advisor1.fl_str_mv |
Braga, Gilda Maria |
contributor_str_mv |
Braga, Gilda Maria |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO::TEORIA DA INFORMACAO::REPRESENTACAO DA INFORMACAO |
topic |
CNPQ::CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO::TEORIA DA INFORMACAO::REPRESENTACAO DA INFORMACAO Indexação Vocabulários controlados Tesauros Recuperação da informação Algoritmos Energia nuclear |
dc.subject.por.fl_str_mv |
Indexação Vocabulários controlados Tesauros Recuperação da informação Algoritmos Energia nuclear |
description |
Propõe-se um método de indexação automática para indexar títulos e resumos de documentos escritos, baseado em tesauro, capaz de assinalar descritores controlados formados preferencialmente por mais de uma palavra. O método proposto incorpora também dispositivo capaz de sugerir descritores ao indexador, com intuito de enriquecer tanto a indexação quanto o vocabulário da área. Testa-se o método, indexando-se uma amostra da base de dados em energia FONTE/CIN. avaliam-se em comparação com a indexação manual os seguintes parâmetros: revocação, precisão, exaustividade, especificidade, consistência e concordância dos descritores de altas frequências. Os resultados obtidos demonstram que o método proposto é viável. |
publishDate |
1985 |
dc.date.issued.fl_str_mv |
1985 |
dc.date.accessioned.fl_str_mv |
2019-07-09T21:22:01Z |
dc.date.available.fl_str_mv |
2023-11-30T03:03:36Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/11422/8743 |
url |
http://hdl.handle.net/11422/8743 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal do Rio de Janeiro Instituto Brasileiro de Informação em Ciência e Tecnologia |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Informação |
dc.publisher.initials.fl_str_mv |
UFRJ IBICT |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Escola de Comunicação |
publisher.none.fl_str_mv |
Universidade Federal do Rio de Janeiro Instituto Brasileiro de Informação em Ciência e Tecnologia |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRJ instname:Universidade Federal do Rio de Janeiro (UFRJ) instacron:UFRJ |
instname_str |
Universidade Federal do Rio de Janeiro (UFRJ) |
instacron_str |
UFRJ |
institution |
UFRJ |
reponame_str |
Repositório Institucional da UFRJ |
collection |
Repositório Institucional da UFRJ |
bitstream.url.fl_str_mv |
http://pantheon.ufrj.br:80/bitstream/11422/8743/1/276868.pdf http://pantheon.ufrj.br:80/bitstream/11422/8743/2/license.txt |
bitstream.checksum.fl_str_mv |
21ffc26c06126f1f25b697918c869cf4 dd32849f2bfb22da963c3aac6e26e255 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ) |
repository.mail.fl_str_mv |
|
_version_ |
1784097149054615552 |