Systems for automatic indexing by assignment: a comparative analysis

Detalhes bibliográficos
Autor(a) principal: Silva, Sâmela Rouse de Brito
Data de Publicação: 2020
Outros Autores: Correa, Renato Fernandes
Tipo de documento: Artigo
Idioma: por
Título da fonte: Encontros Bibli
Texto Completo: https://periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2020.e70740
Resumo: Objective: This work presents a comparative analysis between two multilingual automatic indexing systems that perform term assignment: SISA and MAUI. The SISA (Semi-automatic Indexing System) made in Spain and initially proposed for the area of Librarianship and Documentation, it is a specialist system that automatically indexes following a thesaurus and predetermined rules of indexation which are based on the frequency and position of the terms. The MAUI (Multi-purpose Automatic Topic Indexing) is a system of New Zealand origin that presents the specificity of use of a thesaurus and algorithm of machine learning to generate model through the results of the intellectual indexing, being the terms represented by statistical features. Methods: The research is exploratory and bibliographical, where the method used to construct this work was the comparative study based on content analysis of the scientific publications containing experience reports of application of that software. The stages of the research consisted of describing and comparing the characteristics of each system, raising information about how the documents are processed, how the systems performs the extraction and selection of the descriptors terms, and the application context. Results: The results show the   approaches, main operations, the resources used by each system during the automatic indexing process, as well as the application context and quality of results. Conclusions: It hopes to contribute to the studies on the topic of automatic indexing in the deepening discussion about descriptive and comparative categories related to methods and techniques implemented in the systems.
id UFSC-29_31966aab3f6eaf90bc2c7cc5bc12ef8f
oai_identifier_str oai:periodicos.ufsc.br:article/70740
network_acronym_str UFSC-29
network_name_str Encontros Bibli
repository_id_str
spelling Systems for automatic indexing by assignment: a comparative analysisSistemas de Indexação automática por atribuição: uma análise comparativaIndexação Automática Indexação Automática por Atribuição Sistema de Indexação Automática Processamento de Linguagem NaturalRecuperação da InformaçãoAutomatic Indexing Automatic Indexing by Assignment Automatic Indexing SystemsNatural Language ProcessingInformation retrievalObjective: This work presents a comparative analysis between two multilingual automatic indexing systems that perform term assignment: SISA and MAUI. The SISA (Semi-automatic Indexing System) made in Spain and initially proposed for the area of Librarianship and Documentation, it is a specialist system that automatically indexes following a thesaurus and predetermined rules of indexation which are based on the frequency and position of the terms. The MAUI (Multi-purpose Automatic Topic Indexing) is a system of New Zealand origin that presents the specificity of use of a thesaurus and algorithm of machine learning to generate model through the results of the intellectual indexing, being the terms represented by statistical features. Methods: The research is exploratory and bibliographical, where the method used to construct this work was the comparative study based on content analysis of the scientific publications containing experience reports of application of that software. The stages of the research consisted of describing and comparing the characteristics of each system, raising information about how the documents are processed, how the systems performs the extraction and selection of the descriptors terms, and the application context. Results: The results show the   approaches, main operations, the resources used by each system during the automatic indexing process, as well as the application context and quality of results. Conclusions: It hopes to contribute to the studies on the topic of automatic indexing in the deepening discussion about descriptive and comparative categories related to methods and techniques implemented in the systems.Objetivo: Analisa comparativamente dois sistemas de indexação automática por atribuição multilíngue: SISA e MAUI. O SISA (Sistema de Indexação Semiautomático) foi desenvolvido na Espanha, sendo inicialmente proposto para a área de Biblioteconomia e Documentação. Trata-se de um sistema especialista que indexa de forma automática seguindo um tesauro e regras predeterminadas de indexação com base na frequência e posição dos termos. O MAUI (Multi-purpose Automatic Topic Indexing) é um sistema de origem neozelandesa que apresenta a especificidade de utilização de um tesauro e algoritmo de aprendizagem de máquina para gerar modelo a partir de resultados da indexação intelectual, sendo os termos representados por características estatísticas.  Método: A pesquisa se classifica como exploratória e bibliográfica, onde o método utilizado para construção deste trabalho foi o estudo comparativo baseado na análise de conteúdo das publicações científicas contendo relatos de experiência na aplicação dos sistemas. As etapas da pesquisa consistiram em descrever e comparar as características de cada sistema, levantando informações acerca de como são processados os documentos, como é feita a extração e seleção dos termos que resulta nos descritores propostos por cada sistema, e contextos de aplicação. Resultado: Como resultados aponta-se as abordagens, as principais operações, os recursos utilizados por cada sistema durante o processamento da indexação automática, bem como os contextos de uso e qualidade alcançada nos resultados. Conclusões: O trabalho contribui para os estudos na temática indexação automática no aprofundamento da discussão sobre características descritivas e comparativas associadas aos métodos e técnicas implementadas nos sistemas analisados.Departamento de Ciência da Informação – UFSC2020-07-07info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdftext/xmlhttps://periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2020.e7074010.5007/1518-2924.2020.e70740Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação; Vol. 25 (2020): SEM CIÊNCIA NÃO HÁ FUTURO; 01-25Encontros Bibli: revista electrónica de bibliotecología y ciencias de la información.; Vol. 25 (2020): SEM CIÊNCIA NÃO HÁ FUTURO; 01-25Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação; v. 25 (2020): SEM CIÊNCIA NÃO HÁ FUTURO; 01-251518-2924reponame:Encontros Bibliinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCporhttps://periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2020.e70740/43771https://periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2020.e70740/53772Copyright (c) 2020 Sâmela Rouse de Brito Silva, Renato Fernandes Correahttps://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessSilva, Sâmela Rouse de BritoCorrea, Renato Fernandes2023-07-18T12:46:00Zoai:periodicos.ufsc.br:article/70740Revistahttps://periodicos.ufsc.br/index.php/eb/indexPUBhttps://periodicos.ufsc.br/index.php/eb/oaiencontrosbibli@contato.ufsc.br||portaldeperiodicos.bu@contato.ufsc.br1518-29241518-2924opendoar:2023-07-18T12:46Encontros Bibli - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv Systems for automatic indexing by assignment: a comparative analysis
Sistemas de Indexação automática por atribuição: uma análise comparativa
title Systems for automatic indexing by assignment: a comparative analysis
spellingShingle Systems for automatic indexing by assignment: a comparative analysis
Silva, Sâmela Rouse de Brito
Indexação Automática
Indexação Automática por Atribuição
Sistema de Indexação Automática
Processamento de Linguagem Natural
Recuperação da Informação
Automatic Indexing
Automatic Indexing by Assignment
Automatic Indexing Systems
Natural Language Processing
Information retrieval
title_short Systems for automatic indexing by assignment: a comparative analysis
title_full Systems for automatic indexing by assignment: a comparative analysis
title_fullStr Systems for automatic indexing by assignment: a comparative analysis
title_full_unstemmed Systems for automatic indexing by assignment: a comparative analysis
title_sort Systems for automatic indexing by assignment: a comparative analysis
author Silva, Sâmela Rouse de Brito
author_facet Silva, Sâmela Rouse de Brito
Correa, Renato Fernandes
author_role author
author2 Correa, Renato Fernandes
author2_role author
dc.contributor.author.fl_str_mv Silva, Sâmela Rouse de Brito
Correa, Renato Fernandes
dc.subject.por.fl_str_mv Indexação Automática
Indexação Automática por Atribuição
Sistema de Indexação Automática
Processamento de Linguagem Natural
Recuperação da Informação
Automatic Indexing
Automatic Indexing by Assignment
Automatic Indexing Systems
Natural Language Processing
Information retrieval
topic Indexação Automática
Indexação Automática por Atribuição
Sistema de Indexação Automática
Processamento de Linguagem Natural
Recuperação da Informação
Automatic Indexing
Automatic Indexing by Assignment
Automatic Indexing Systems
Natural Language Processing
Information retrieval
description Objective: This work presents a comparative analysis between two multilingual automatic indexing systems that perform term assignment: SISA and MAUI. The SISA (Semi-automatic Indexing System) made in Spain and initially proposed for the area of Librarianship and Documentation, it is a specialist system that automatically indexes following a thesaurus and predetermined rules of indexation which are based on the frequency and position of the terms. The MAUI (Multi-purpose Automatic Topic Indexing) is a system of New Zealand origin that presents the specificity of use of a thesaurus and algorithm of machine learning to generate model through the results of the intellectual indexing, being the terms represented by statistical features. Methods: The research is exploratory and bibliographical, where the method used to construct this work was the comparative study based on content analysis of the scientific publications containing experience reports of application of that software. The stages of the research consisted of describing and comparing the characteristics of each system, raising information about how the documents are processed, how the systems performs the extraction and selection of the descriptors terms, and the application context. Results: The results show the   approaches, main operations, the resources used by each system during the automatic indexing process, as well as the application context and quality of results. Conclusions: It hopes to contribute to the studies on the topic of automatic indexing in the deepening discussion about descriptive and comparative categories related to methods and techniques implemented in the systems.
publishDate 2020
dc.date.none.fl_str_mv 2020-07-07
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2020.e70740
10.5007/1518-2924.2020.e70740
url https://periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2020.e70740
identifier_str_mv 10.5007/1518-2924.2020.e70740
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2020.e70740/43771
https://periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2020.e70740/53772
dc.rights.driver.fl_str_mv Copyright (c) 2020 Sâmela Rouse de Brito Silva, Renato Fernandes Correa
https://creativecommons.org/licenses/by/4.0
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Copyright (c) 2020 Sâmela Rouse de Brito Silva, Renato Fernandes Correa
https://creativecommons.org/licenses/by/4.0
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
text/xml
dc.publisher.none.fl_str_mv Departamento de Ciência da Informação – UFSC
publisher.none.fl_str_mv Departamento de Ciência da Informação – UFSC
dc.source.none.fl_str_mv Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação; Vol. 25 (2020): SEM CIÊNCIA NÃO HÁ FUTURO; 01-25
Encontros Bibli: revista electrónica de bibliotecología y ciencias de la información.; Vol. 25 (2020): SEM CIÊNCIA NÃO HÁ FUTURO; 01-25
Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação; v. 25 (2020): SEM CIÊNCIA NÃO HÁ FUTURO; 01-25
1518-2924
reponame:Encontros Bibli
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Encontros Bibli
collection Encontros Bibli
repository.name.fl_str_mv Encontros Bibli - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv encontrosbibli@contato.ufsc.br||portaldeperiodicos.bu@contato.ufsc.br
_version_ 1797067778847408128