Systems for automatic indexing by assignment: a comparative analysis
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Outros Autores: | |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Encontros Bibli |
Texto Completo: | https://periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2020.e70740 |
Resumo: | Objective: This work presents a comparative analysis between two multilingual automatic indexing systems that perform term assignment: SISA and MAUI. The SISA (Semi-automatic Indexing System) made in Spain and initially proposed for the area of Librarianship and Documentation, it is a specialist system that automatically indexes following a thesaurus and predetermined rules of indexation which are based on the frequency and position of the terms. The MAUI (Multi-purpose Automatic Topic Indexing) is a system of New Zealand origin that presents the specificity of use of a thesaurus and algorithm of machine learning to generate model through the results of the intellectual indexing, being the terms represented by statistical features. Methods: The research is exploratory and bibliographical, where the method used to construct this work was the comparative study based on content analysis of the scientific publications containing experience reports of application of that software. The stages of the research consisted of describing and comparing the characteristics of each system, raising information about how the documents are processed, how the systems performs the extraction and selection of the descriptors terms, and the application context. Results: The results show the approaches, main operations, the resources used by each system during the automatic indexing process, as well as the application context and quality of results. Conclusions: It hopes to contribute to the studies on the topic of automatic indexing in the deepening discussion about descriptive and comparative categories related to methods and techniques implemented in the systems. |
id |
UFSC-29_31966aab3f6eaf90bc2c7cc5bc12ef8f |
---|---|
oai_identifier_str |
oai:periodicos.ufsc.br:article/70740 |
network_acronym_str |
UFSC-29 |
network_name_str |
Encontros Bibli |
repository_id_str |
|
spelling |
Systems for automatic indexing by assignment: a comparative analysisSistemas de Indexação automática por atribuição: uma análise comparativaIndexação Automática Indexação Automática por Atribuição Sistema de Indexação Automática Processamento de Linguagem NaturalRecuperação da InformaçãoAutomatic Indexing Automatic Indexing by Assignment Automatic Indexing SystemsNatural Language ProcessingInformation retrievalObjective: This work presents a comparative analysis between two multilingual automatic indexing systems that perform term assignment: SISA and MAUI. The SISA (Semi-automatic Indexing System) made in Spain and initially proposed for the area of Librarianship and Documentation, it is a specialist system that automatically indexes following a thesaurus and predetermined rules of indexation which are based on the frequency and position of the terms. The MAUI (Multi-purpose Automatic Topic Indexing) is a system of New Zealand origin that presents the specificity of use of a thesaurus and algorithm of machine learning to generate model through the results of the intellectual indexing, being the terms represented by statistical features. Methods: The research is exploratory and bibliographical, where the method used to construct this work was the comparative study based on content analysis of the scientific publications containing experience reports of application of that software. The stages of the research consisted of describing and comparing the characteristics of each system, raising information about how the documents are processed, how the systems performs the extraction and selection of the descriptors terms, and the application context. Results: The results show the approaches, main operations, the resources used by each system during the automatic indexing process, as well as the application context and quality of results. Conclusions: It hopes to contribute to the studies on the topic of automatic indexing in the deepening discussion about descriptive and comparative categories related to methods and techniques implemented in the systems.Objetivo: Analisa comparativamente dois sistemas de indexação automática por atribuição multilíngue: SISA e MAUI. O SISA (Sistema de Indexação Semiautomático) foi desenvolvido na Espanha, sendo inicialmente proposto para a área de Biblioteconomia e Documentação. Trata-se de um sistema especialista que indexa de forma automática seguindo um tesauro e regras predeterminadas de indexação com base na frequência e posição dos termos. O MAUI (Multi-purpose Automatic Topic Indexing) é um sistema de origem neozelandesa que apresenta a especificidade de utilização de um tesauro e algoritmo de aprendizagem de máquina para gerar modelo a partir de resultados da indexação intelectual, sendo os termos representados por características estatísticas. Método: A pesquisa se classifica como exploratória e bibliográfica, onde o método utilizado para construção deste trabalho foi o estudo comparativo baseado na análise de conteúdo das publicações científicas contendo relatos de experiência na aplicação dos sistemas. As etapas da pesquisa consistiram em descrever e comparar as características de cada sistema, levantando informações acerca de como são processados os documentos, como é feita a extração e seleção dos termos que resulta nos descritores propostos por cada sistema, e contextos de aplicação. Resultado: Como resultados aponta-se as abordagens, as principais operações, os recursos utilizados por cada sistema durante o processamento da indexação automática, bem como os contextos de uso e qualidade alcançada nos resultados. Conclusões: O trabalho contribui para os estudos na temática indexação automática no aprofundamento da discussão sobre características descritivas e comparativas associadas aos métodos e técnicas implementadas nos sistemas analisados.Departamento de Ciência da Informação – UFSC2020-07-07info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdftext/xmlhttps://periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2020.e7074010.5007/1518-2924.2020.e70740Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação; Vol. 25 (2020): SEM CIÊNCIA NÃO HÁ FUTURO; 01-25Encontros Bibli: revista electrónica de bibliotecología y ciencias de la información.; Vol. 25 (2020): SEM CIÊNCIA NÃO HÁ FUTURO; 01-25Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação; v. 25 (2020): SEM CIÊNCIA NÃO HÁ FUTURO; 01-251518-2924reponame:Encontros Bibliinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCporhttps://periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2020.e70740/43771https://periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2020.e70740/53772Copyright (c) 2020 Sâmela Rouse de Brito Silva, Renato Fernandes Correahttps://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessSilva, Sâmela Rouse de BritoCorrea, Renato Fernandes2023-07-18T12:46:00Zoai:periodicos.ufsc.br:article/70740Revistahttps://periodicos.ufsc.br/index.php/eb/indexPUBhttps://periodicos.ufsc.br/index.php/eb/oaiencontrosbibli@contato.ufsc.br||portaldeperiodicos.bu@contato.ufsc.br1518-29241518-2924opendoar:2023-07-18T12:46Encontros Bibli - Universidade Federal de Santa Catarina (UFSC)false |
dc.title.none.fl_str_mv |
Systems for automatic indexing by assignment: a comparative analysis Sistemas de Indexação automática por atribuição: uma análise comparativa |
title |
Systems for automatic indexing by assignment: a comparative analysis |
spellingShingle |
Systems for automatic indexing by assignment: a comparative analysis Silva, Sâmela Rouse de Brito Indexação Automática Indexação Automática por Atribuição Sistema de Indexação Automática Processamento de Linguagem Natural Recuperação da Informação Automatic Indexing Automatic Indexing by Assignment Automatic Indexing Systems Natural Language Processing Information retrieval |
title_short |
Systems for automatic indexing by assignment: a comparative analysis |
title_full |
Systems for automatic indexing by assignment: a comparative analysis |
title_fullStr |
Systems for automatic indexing by assignment: a comparative analysis |
title_full_unstemmed |
Systems for automatic indexing by assignment: a comparative analysis |
title_sort |
Systems for automatic indexing by assignment: a comparative analysis |
author |
Silva, Sâmela Rouse de Brito |
author_facet |
Silva, Sâmela Rouse de Brito Correa, Renato Fernandes |
author_role |
author |
author2 |
Correa, Renato Fernandes |
author2_role |
author |
dc.contributor.author.fl_str_mv |
Silva, Sâmela Rouse de Brito Correa, Renato Fernandes |
dc.subject.por.fl_str_mv |
Indexação Automática Indexação Automática por Atribuição Sistema de Indexação Automática Processamento de Linguagem Natural Recuperação da Informação Automatic Indexing Automatic Indexing by Assignment Automatic Indexing Systems Natural Language Processing Information retrieval |
topic |
Indexação Automática Indexação Automática por Atribuição Sistema de Indexação Automática Processamento de Linguagem Natural Recuperação da Informação Automatic Indexing Automatic Indexing by Assignment Automatic Indexing Systems Natural Language Processing Information retrieval |
description |
Objective: This work presents a comparative analysis between two multilingual automatic indexing systems that perform term assignment: SISA and MAUI. The SISA (Semi-automatic Indexing System) made in Spain and initially proposed for the area of Librarianship and Documentation, it is a specialist system that automatically indexes following a thesaurus and predetermined rules of indexation which are based on the frequency and position of the terms. The MAUI (Multi-purpose Automatic Topic Indexing) is a system of New Zealand origin that presents the specificity of use of a thesaurus and algorithm of machine learning to generate model through the results of the intellectual indexing, being the terms represented by statistical features. Methods: The research is exploratory and bibliographical, where the method used to construct this work was the comparative study based on content analysis of the scientific publications containing experience reports of application of that software. The stages of the research consisted of describing and comparing the characteristics of each system, raising information about how the documents are processed, how the systems performs the extraction and selection of the descriptors terms, and the application context. Results: The results show the approaches, main operations, the resources used by each system during the automatic indexing process, as well as the application context and quality of results. Conclusions: It hopes to contribute to the studies on the topic of automatic indexing in the deepening discussion about descriptive and comparative categories related to methods and techniques implemented in the systems. |
publishDate |
2020 |
dc.date.none.fl_str_mv |
2020-07-07 |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2020.e70740 10.5007/1518-2924.2020.e70740 |
url |
https://periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2020.e70740 |
identifier_str_mv |
10.5007/1518-2924.2020.e70740 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2020.e70740/43771 https://periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2020.e70740/53772 |
dc.rights.driver.fl_str_mv |
Copyright (c) 2020 Sâmela Rouse de Brito Silva, Renato Fernandes Correa https://creativecommons.org/licenses/by/4.0 info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Copyright (c) 2020 Sâmela Rouse de Brito Silva, Renato Fernandes Correa https://creativecommons.org/licenses/by/4.0 |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf text/xml |
dc.publisher.none.fl_str_mv |
Departamento de Ciência da Informação – UFSC |
publisher.none.fl_str_mv |
Departamento de Ciência da Informação – UFSC |
dc.source.none.fl_str_mv |
Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação; Vol. 25 (2020): SEM CIÊNCIA NÃO HÁ FUTURO; 01-25 Encontros Bibli: revista electrónica de bibliotecología y ciencias de la información.; Vol. 25 (2020): SEM CIÊNCIA NÃO HÁ FUTURO; 01-25 Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação; v. 25 (2020): SEM CIÊNCIA NÃO HÁ FUTURO; 01-25 1518-2924 reponame:Encontros Bibli instname:Universidade Federal de Santa Catarina (UFSC) instacron:UFSC |
instname_str |
Universidade Federal de Santa Catarina (UFSC) |
instacron_str |
UFSC |
institution |
UFSC |
reponame_str |
Encontros Bibli |
collection |
Encontros Bibli |
repository.name.fl_str_mv |
Encontros Bibli - Universidade Federal de Santa Catarina (UFSC) |
repository.mail.fl_str_mv |
encontrosbibli@contato.ufsc.br||portaldeperiodicos.bu@contato.ufsc.br |
_version_ |
1797067778847408128 |