Sistemas de indexação automática por atribuição : uma análise comparativa

Detalhes bibliográficos
Autor(a) principal: SILVA, Sâmela Rouse de Brito
Data de Publicação: 2020
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFPE
dARK ID: ark:/64986/0013000008f25
Texto Completo: https://repositorio.ufpe.br/handle/123456789/37626
Resumo: Avalia e compara a qualidade de indexação dos softwares SISA (Sistema de Indización Semi-Automático) e MAUI (Multi-Purpose Automatic Topic Indexing) na perspectiva da indexação automática por atribuição de artigos científicos escritos em português da área da Ciência da Informação. O SISA é bastante utilizado na área da Ciência da Informação e os experimentos envolvendo o software apontam resultados satisfatórios. O MAUI é muito utilizado na área na Ciência da Computação, porém, o software possui a característica de utilizar um modelo de indexação intelectual para realizar a indexação automática. A pesquisa visa responder às seguintes indagações: Qual a qualidade da indexação dos sistemas SISA e MAUI? Como se dá o processo de indexação em ambos os sistemas? Qual o sistema que apresenta melhor desempenho? Quais os tipos de erros cometidos pelos sistemas na indexação? Para tanto, estabelece objetivos específicos que são alcançados em etapas. A pesquisa classifica-se como exploratória e empírica, cujo método utilizado para construção deste trabalho é um estudo de caso e a forma de coleta de dados se dá por meio de um experimento de indexação. O experimento constitui-se da indexação automática dos artigos científicos do corpus de referência composto por 60 artigos da tese de doutorado de Souza (2005). A avaliação do SISA apresentou a média de 28% no índice de consistência, 63% de precisão, 34% de revocação e 42% de medida F. A avaliação do MAUI apresentou a média de 36% no índice de consistência, 54% de precisão, 51% de revocação e 52% de medida F. Apesar de alguns erros cometidos pelos sistemas como a atribuição de termos no plural e singular; dificuldade em atribuir termos compostos, diferenças entre as estruturas nos termos de indexação e atribuição automática de termos gerais e específicos, pode-se concluir que os softwares apresentaram bons resultados, porém o MAUI se destacou por apresentar melhores índices e desempenho.
id UFPE_ced40c1e3ff2b99cd4075333cd720460
oai_identifier_str oai:repositorio.ufpe.br:123456789/37626
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str 2221
spelling SILVA, Sâmela Rouse de Britohttp://lattes.cnpq.br/1043044601200225http://lattes.cnpq.br/7536537827447217CORRÊA, Renato Fernandes2020-08-13T15:05:06Z2020-08-13T15:05:06Z2020-02-28SILVA, Sâmela Rouse de Brito. Sistemas de indexação automática por atribuição: uma análise comparativa. 2020. Dissertação (Mestrado em Ciência da Informação) – Universidade Federal de Pernambuco, Recife, 2020.https://repositorio.ufpe.br/handle/123456789/37626ark:/64986/0013000008f25Avalia e compara a qualidade de indexação dos softwares SISA (Sistema de Indización Semi-Automático) e MAUI (Multi-Purpose Automatic Topic Indexing) na perspectiva da indexação automática por atribuição de artigos científicos escritos em português da área da Ciência da Informação. O SISA é bastante utilizado na área da Ciência da Informação e os experimentos envolvendo o software apontam resultados satisfatórios. O MAUI é muito utilizado na área na Ciência da Computação, porém, o software possui a característica de utilizar um modelo de indexação intelectual para realizar a indexação automática. A pesquisa visa responder às seguintes indagações: Qual a qualidade da indexação dos sistemas SISA e MAUI? Como se dá o processo de indexação em ambos os sistemas? Qual o sistema que apresenta melhor desempenho? Quais os tipos de erros cometidos pelos sistemas na indexação? Para tanto, estabelece objetivos específicos que são alcançados em etapas. A pesquisa classifica-se como exploratória e empírica, cujo método utilizado para construção deste trabalho é um estudo de caso e a forma de coleta de dados se dá por meio de um experimento de indexação. O experimento constitui-se da indexação automática dos artigos científicos do corpus de referência composto por 60 artigos da tese de doutorado de Souza (2005). A avaliação do SISA apresentou a média de 28% no índice de consistência, 63% de precisão, 34% de revocação e 42% de medida F. A avaliação do MAUI apresentou a média de 36% no índice de consistência, 54% de precisão, 51% de revocação e 52% de medida F. Apesar de alguns erros cometidos pelos sistemas como a atribuição de termos no plural e singular; dificuldade em atribuir termos compostos, diferenças entre as estruturas nos termos de indexação e atribuição automática de termos gerais e específicos, pode-se concluir que os softwares apresentaram bons resultados, porém o MAUI se destacou por apresentar melhores índices e desempenho.This work evaluates and compares the quality in automatic indexing of the SISA (System Indexing Semi-Automatic) and MAUI (Multi-Purpose Automatic Topic Indexing) software as they are applied to scientific articles written in Portuguese in Information Science. The SISA is widely used in the field of Information Science and experiments with the software point towards satisfactory results. The MAUI is widely used in the area in the Computer Science, however the software can use a model of intellectual property indexing in order to execute automatic indexing. The research aims to answer the following questions: What is the quality of SISA and MAUI indexing? How does the indexing process in both systems happen? Which system has the best performance? What kinds of errors do those systems make in indexing? To this end, this work establishes specific objectives that are accomplished in stages. The research is classified as exploratory and empirical, using case study as method and an indexing experiment as data gathering. The experiment consists of automatic indexing of scientific articles in the reference corpus made from 60 articles cited by Souza (2005). The evaluation of the SISA shows an average of 28% in consistency, 63% in precision, 34% in recalls and 42% of F measure. Evaluation of MAUI shows an average of 36% in consistency, 54% in precision, 51% in recalls and 52% of F measure. Although the systems have made some mistakes, such as the allocation of plural and singular terms; difficulty in assigning compound terms; differences between structures in terms of indexing; assignment of general and specific terms, it can be concluded that the software has shown good results, however MAUI stands out with better indexes and performance.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da InformacaoUFPEBrasilAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessIndexação automáticaIndexação automática por atribuiçãoCiência da InformaçãoSistemas de Indexação automáticaAvaliação da Indexação automáticaSistemas de indexação automática por atribuição : uma análise comparativainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesismestradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPEORIGINALDISSERTAÇÃO Sâmela Rouse de Brito Silva.pdfDISSERTAÇÃO Sâmela Rouse de Brito Silva.pdfapplication/pdf6370143https://repositorio.ufpe.br/bitstream/123456789/37626/1/DISSERTA%c3%87%c3%83O%20S%c3%a2mela%20Rouse%20de%20Brito%20Silva.pdf719a0a4fe0ddc9d17ec62e3d593213b1MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/37626/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82310https://repositorio.ufpe.br/bitstream/123456789/37626/3/license.txtbd573a5ca8288eb7272482765f819534MD53TEXTDISSERTAÇÃO Sâmela Rouse de Brito Silva.pdf.txtDISSERTAÇÃO Sâmela Rouse de Brito Silva.pdf.txtExtracted texttext/plain379562https://repositorio.ufpe.br/bitstream/123456789/37626/4/DISSERTA%c3%87%c3%83O%20S%c3%a2mela%20Rouse%20de%20Brito%20Silva.pdf.txt33eda9e6e5d6530f4ff91f1398215d58MD54THUMBNAILDISSERTAÇÃO Sâmela Rouse de Brito Silva.pdf.jpgDISSERTAÇÃO Sâmela Rouse de Brito Silva.pdf.jpgGenerated Thumbnailimage/jpeg1219https://repositorio.ufpe.br/bitstream/123456789/37626/5/DISSERTA%c3%87%c3%83O%20S%c3%a2mela%20Rouse%20de%20Brito%20Silva.pdf.jpg5f105942a96dcbcc7a4f3f842183440fMD55123456789/376262020-08-14 02:11:35.604oai:repositorio.ufpe.br:123456789/37626TGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKClRvZG8gZGVwb3NpdGFudGUgZGUgbWF0ZXJpYWwgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgKFJJKSBkZXZlIGNvbmNlZGVyLCDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIChVRlBFKSwgdW1hIExpY2Vuw6dhIGRlIERpc3RyaWJ1acOnw6NvIE7Do28gRXhjbHVzaXZhIHBhcmEgbWFudGVyIGUgdG9ybmFyIGFjZXNzw612ZWlzIG9zIHNldXMgZG9jdW1lbnRvcywgZW0gZm9ybWF0byBkaWdpdGFsLCBuZXN0ZSByZXBvc2l0w7NyaW8uCgpDb20gYSBjb25jZXNzw6NvIGRlc3RhIGxpY2Vuw6dhIG7Do28gZXhjbHVzaXZhLCBvIGRlcG9zaXRhbnRlIG1hbnTDqW0gdG9kb3Mgb3MgZGlyZWl0b3MgZGUgYXV0b3IuCl9fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fXwoKTGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKCkFvIGNvbmNvcmRhciBjb20gZXN0YSBsaWNlbsOnYSBlIGFjZWl0w6EtbGEsIHZvY8OqIChhdXRvciBvdSBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMpOgoKYSkgRGVjbGFyYSBxdWUgY29uaGVjZSBhIHBvbMOtdGljYSBkZSBjb3B5cmlnaHQgZGEgZWRpdG9yYSBkbyBzZXUgZG9jdW1lbnRvOwpiKSBEZWNsYXJhIHF1ZSBjb25oZWNlIGUgYWNlaXRhIGFzIERpcmV0cml6ZXMgcGFyYSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEU7CmMpIENvbmNlZGUgw6AgVUZQRSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZGUgYXJxdWl2YXIsIHJlcHJvZHV6aXIsIGNvbnZlcnRlciAoY29tbyBkZWZpbmlkbyBhIHNlZ3VpciksIGNvbXVuaWNhciBlL291IGRpc3RyaWJ1aXIsIG5vIFJJLCBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vL2Fic3RyYWN0KSBlbSBmb3JtYXRvIGRpZ2l0YWwgb3UgcG9yIG91dHJvIG1laW87CmQpIERlY2xhcmEgcXVlIGF1dG9yaXphIGEgVUZQRSBhIGFycXVpdmFyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXN0ZSBkb2N1bWVudG8gZSBjb252ZXJ0w6otbG8sIHNlbSBhbHRlcmFyIG8gc2V1IGNvbnRlw7pkbywgcGFyYSBxdWFscXVlciBmb3JtYXRvIGRlIGZpY2hlaXJvLCBtZWlvIG91IHN1cG9ydGUsIHBhcmEgZWZlaXRvcyBkZSBzZWd1cmFuw6dhLCBwcmVzZXJ2YcOnw6NvIChiYWNrdXApIGUgYWNlc3NvOwplKSBEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBzdWJtZXRpZG8gw6kgbyBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBhIHRlcmNlaXJvcyBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2Ugb3MgZGlyZWl0b3MgZGUgb3V0cmEgcGVzc29hIG91IGVudGlkYWRlOwpmKSBEZWNsYXJhIHF1ZSwgbm8gY2FzbyBkbyBkb2N1bWVudG8gc3VibWV0aWRvIGNvbnRlciBtYXRlcmlhbCBkbyBxdWFsIG7Do28gZGV0w6ltIG9zIGRpcmVpdG9zIGRlCmF1dG9yLCBvYnRldmUgYSBhdXRvcml6YcOnw6NvIGlycmVzdHJpdGEgZG8gcmVzcGVjdGl2byBkZXRlbnRvciBkZXNzZXMgZGlyZWl0b3MgcGFyYSBjZWRlciDDoApVRlBFIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgTGljZW7Dp2EgZSBhdXRvcml6YXIgYSB1bml2ZXJzaWRhZGUgYSB1dGlsaXrDoS1sb3MgbGVnYWxtZW50ZS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBlc3NlIG1hdGVyaWFsIGN1am9zIGRpcmVpdG9zIHPDo28gZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRvIGRvY3VtZW50byBlbnRyZWd1ZTsKZykgU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVRlBFLCBkZWNsYXJhIHF1ZSBjdW1wcml1IHF1YWlzcXVlciBvYnJpZ2HDp8O1ZXMgZXhpZ2lkYXMgcGVsbyByZXNwZWN0aXZvIGNvbnRyYXRvIG91IGFjb3Jkby4KCkEgVUZQRSBpZGVudGlmaWNhcsOhIGNsYXJhbWVudGUgbyhzKSBub21lKHMpIGRvKHMpIGF1dG9yIChlcykgZG9zIGRpcmVpdG9zIGRvIGRvY3VtZW50byBlbnRyZWd1ZSBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIHBhcmEgYWzDqW0gZG8gcHJldmlzdG8gbmEgYWzDrW5lYSBjKS4KRepositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212020-08-14T05:11:35Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.pt_BR.fl_str_mv Sistemas de indexação automática por atribuição : uma análise comparativa
title Sistemas de indexação automática por atribuição : uma análise comparativa
spellingShingle Sistemas de indexação automática por atribuição : uma análise comparativa
SILVA, Sâmela Rouse de Brito
Indexação automática
Indexação automática por atribuição
Ciência da Informação
Sistemas de Indexação automática
Avaliação da Indexação automática
title_short Sistemas de indexação automática por atribuição : uma análise comparativa
title_full Sistemas de indexação automática por atribuição : uma análise comparativa
title_fullStr Sistemas de indexação automática por atribuição : uma análise comparativa
title_full_unstemmed Sistemas de indexação automática por atribuição : uma análise comparativa
title_sort Sistemas de indexação automática por atribuição : uma análise comparativa
author SILVA, Sâmela Rouse de Brito
author_facet SILVA, Sâmela Rouse de Brito
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/1043044601200225
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/7536537827447217
dc.contributor.author.fl_str_mv SILVA, Sâmela Rouse de Brito
dc.contributor.advisor1.fl_str_mv CORRÊA, Renato Fernandes
contributor_str_mv CORRÊA, Renato Fernandes
dc.subject.por.fl_str_mv Indexação automática
Indexação automática por atribuição
Ciência da Informação
Sistemas de Indexação automática
Avaliação da Indexação automática
topic Indexação automática
Indexação automática por atribuição
Ciência da Informação
Sistemas de Indexação automática
Avaliação da Indexação automática
description Avalia e compara a qualidade de indexação dos softwares SISA (Sistema de Indización Semi-Automático) e MAUI (Multi-Purpose Automatic Topic Indexing) na perspectiva da indexação automática por atribuição de artigos científicos escritos em português da área da Ciência da Informação. O SISA é bastante utilizado na área da Ciência da Informação e os experimentos envolvendo o software apontam resultados satisfatórios. O MAUI é muito utilizado na área na Ciência da Computação, porém, o software possui a característica de utilizar um modelo de indexação intelectual para realizar a indexação automática. A pesquisa visa responder às seguintes indagações: Qual a qualidade da indexação dos sistemas SISA e MAUI? Como se dá o processo de indexação em ambos os sistemas? Qual o sistema que apresenta melhor desempenho? Quais os tipos de erros cometidos pelos sistemas na indexação? Para tanto, estabelece objetivos específicos que são alcançados em etapas. A pesquisa classifica-se como exploratória e empírica, cujo método utilizado para construção deste trabalho é um estudo de caso e a forma de coleta de dados se dá por meio de um experimento de indexação. O experimento constitui-se da indexação automática dos artigos científicos do corpus de referência composto por 60 artigos da tese de doutorado de Souza (2005). A avaliação do SISA apresentou a média de 28% no índice de consistência, 63% de precisão, 34% de revocação e 42% de medida F. A avaliação do MAUI apresentou a média de 36% no índice de consistência, 54% de precisão, 51% de revocação e 52% de medida F. Apesar de alguns erros cometidos pelos sistemas como a atribuição de termos no plural e singular; dificuldade em atribuir termos compostos, diferenças entre as estruturas nos termos de indexação e atribuição automática de termos gerais e específicos, pode-se concluir que os softwares apresentaram bons resultados, porém o MAUI se destacou por apresentar melhores índices e desempenho.
publishDate 2020
dc.date.accessioned.fl_str_mv 2020-08-13T15:05:06Z
dc.date.available.fl_str_mv 2020-08-13T15:05:06Z
dc.date.issued.fl_str_mv 2020-02-28
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SILVA, Sâmela Rouse de Brito. Sistemas de indexação automática por atribuição: uma análise comparativa. 2020. Dissertação (Mestrado em Ciência da Informação) – Universidade Federal de Pernambuco, Recife, 2020.
dc.identifier.uri.fl_str_mv https://repositorio.ufpe.br/handle/123456789/37626
dc.identifier.dark.fl_str_mv ark:/64986/0013000008f25
identifier_str_mv SILVA, Sâmela Rouse de Brito. Sistemas de indexação automática por atribuição: uma análise comparativa. 2020. Dissertação (Mestrado em Ciência da Informação) – Universidade Federal de Pernambuco, Recife, 2020.
ark:/64986/0013000008f25
url https://repositorio.ufpe.br/handle/123456789/37626
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.publisher.program.fl_str_mv Programa de Pos Graduacao em Ciencia da Informacao
dc.publisher.initials.fl_str_mv UFPE
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
bitstream.url.fl_str_mv https://repositorio.ufpe.br/bitstream/123456789/37626/1/DISSERTA%c3%87%c3%83O%20S%c3%a2mela%20Rouse%20de%20Brito%20Silva.pdf
https://repositorio.ufpe.br/bitstream/123456789/37626/2/license_rdf
https://repositorio.ufpe.br/bitstream/123456789/37626/3/license.txt
https://repositorio.ufpe.br/bitstream/123456789/37626/4/DISSERTA%c3%87%c3%83O%20S%c3%a2mela%20Rouse%20de%20Brito%20Silva.pdf.txt
https://repositorio.ufpe.br/bitstream/123456789/37626/5/DISSERTA%c3%87%c3%83O%20S%c3%a2mela%20Rouse%20de%20Brito%20Silva.pdf.jpg
bitstream.checksum.fl_str_mv 719a0a4fe0ddc9d17ec62e3d593213b1
e39d27027a6cc9cb039ad269a5db8e34
bd573a5ca8288eb7272482765f819534
33eda9e6e5d6530f4ff91f1398215d58
5f105942a96dcbcc7a4f3f842183440f
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1815172759261544448