Sistemas de indexação automática por atribuição : uma análise comparativa
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPE |
dARK ID: | ark:/64986/0013000008f25 |
Texto Completo: | https://repositorio.ufpe.br/handle/123456789/37626 |
Resumo: | Avalia e compara a qualidade de indexação dos softwares SISA (Sistema de Indización Semi-Automático) e MAUI (Multi-Purpose Automatic Topic Indexing) na perspectiva da indexação automática por atribuição de artigos científicos escritos em português da área da Ciência da Informação. O SISA é bastante utilizado na área da Ciência da Informação e os experimentos envolvendo o software apontam resultados satisfatórios. O MAUI é muito utilizado na área na Ciência da Computação, porém, o software possui a característica de utilizar um modelo de indexação intelectual para realizar a indexação automática. A pesquisa visa responder às seguintes indagações: Qual a qualidade da indexação dos sistemas SISA e MAUI? Como se dá o processo de indexação em ambos os sistemas? Qual o sistema que apresenta melhor desempenho? Quais os tipos de erros cometidos pelos sistemas na indexação? Para tanto, estabelece objetivos específicos que são alcançados em etapas. A pesquisa classifica-se como exploratória e empírica, cujo método utilizado para construção deste trabalho é um estudo de caso e a forma de coleta de dados se dá por meio de um experimento de indexação. O experimento constitui-se da indexação automática dos artigos científicos do corpus de referência composto por 60 artigos da tese de doutorado de Souza (2005). A avaliação do SISA apresentou a média de 28% no índice de consistência, 63% de precisão, 34% de revocação e 42% de medida F. A avaliação do MAUI apresentou a média de 36% no índice de consistência, 54% de precisão, 51% de revocação e 52% de medida F. Apesar de alguns erros cometidos pelos sistemas como a atribuição de termos no plural e singular; dificuldade em atribuir termos compostos, diferenças entre as estruturas nos termos de indexação e atribuição automática de termos gerais e específicos, pode-se concluir que os softwares apresentaram bons resultados, porém o MAUI se destacou por apresentar melhores índices e desempenho. |
id |
UFPE_ced40c1e3ff2b99cd4075333cd720460 |
---|---|
oai_identifier_str |
oai:repositorio.ufpe.br:123456789/37626 |
network_acronym_str |
UFPE |
network_name_str |
Repositório Institucional da UFPE |
repository_id_str |
2221 |
spelling |
SILVA, Sâmela Rouse de Britohttp://lattes.cnpq.br/1043044601200225http://lattes.cnpq.br/7536537827447217CORRÊA, Renato Fernandes2020-08-13T15:05:06Z2020-08-13T15:05:06Z2020-02-28SILVA, Sâmela Rouse de Brito. Sistemas de indexação automática por atribuição: uma análise comparativa. 2020. Dissertação (Mestrado em Ciência da Informação) – Universidade Federal de Pernambuco, Recife, 2020.https://repositorio.ufpe.br/handle/123456789/37626ark:/64986/0013000008f25Avalia e compara a qualidade de indexação dos softwares SISA (Sistema de Indización Semi-Automático) e MAUI (Multi-Purpose Automatic Topic Indexing) na perspectiva da indexação automática por atribuição de artigos científicos escritos em português da área da Ciência da Informação. O SISA é bastante utilizado na área da Ciência da Informação e os experimentos envolvendo o software apontam resultados satisfatórios. O MAUI é muito utilizado na área na Ciência da Computação, porém, o software possui a característica de utilizar um modelo de indexação intelectual para realizar a indexação automática. A pesquisa visa responder às seguintes indagações: Qual a qualidade da indexação dos sistemas SISA e MAUI? Como se dá o processo de indexação em ambos os sistemas? Qual o sistema que apresenta melhor desempenho? Quais os tipos de erros cometidos pelos sistemas na indexação? Para tanto, estabelece objetivos específicos que são alcançados em etapas. A pesquisa classifica-se como exploratória e empírica, cujo método utilizado para construção deste trabalho é um estudo de caso e a forma de coleta de dados se dá por meio de um experimento de indexação. O experimento constitui-se da indexação automática dos artigos científicos do corpus de referência composto por 60 artigos da tese de doutorado de Souza (2005). A avaliação do SISA apresentou a média de 28% no índice de consistência, 63% de precisão, 34% de revocação e 42% de medida F. A avaliação do MAUI apresentou a média de 36% no índice de consistência, 54% de precisão, 51% de revocação e 52% de medida F. Apesar de alguns erros cometidos pelos sistemas como a atribuição de termos no plural e singular; dificuldade em atribuir termos compostos, diferenças entre as estruturas nos termos de indexação e atribuição automática de termos gerais e específicos, pode-se concluir que os softwares apresentaram bons resultados, porém o MAUI se destacou por apresentar melhores índices e desempenho.This work evaluates and compares the quality in automatic indexing of the SISA (System Indexing Semi-Automatic) and MAUI (Multi-Purpose Automatic Topic Indexing) software as they are applied to scientific articles written in Portuguese in Information Science. The SISA is widely used in the field of Information Science and experiments with the software point towards satisfactory results. The MAUI is widely used in the area in the Computer Science, however the software can use a model of intellectual property indexing in order to execute automatic indexing. The research aims to answer the following questions: What is the quality of SISA and MAUI indexing? How does the indexing process in both systems happen? Which system has the best performance? What kinds of errors do those systems make in indexing? To this end, this work establishes specific objectives that are accomplished in stages. The research is classified as exploratory and empirical, using case study as method and an indexing experiment as data gathering. The experiment consists of automatic indexing of scientific articles in the reference corpus made from 60 articles cited by Souza (2005). The evaluation of the SISA shows an average of 28% in consistency, 63% in precision, 34% in recalls and 42% of F measure. Evaluation of MAUI shows an average of 36% in consistency, 54% in precision, 51% in recalls and 52% of F measure. Although the systems have made some mistakes, such as the allocation of plural and singular terms; difficulty in assigning compound terms; differences between structures in terms of indexing; assignment of general and specific terms, it can be concluded that the software has shown good results, however MAUI stands out with better indexes and performance.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da InformacaoUFPEBrasilAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessIndexação automáticaIndexação automática por atribuiçãoCiência da InformaçãoSistemas de Indexação automáticaAvaliação da Indexação automáticaSistemas de indexação automática por atribuição : uma análise comparativainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesismestradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPEORIGINALDISSERTAÇÃO Sâmela Rouse de Brito Silva.pdfDISSERTAÇÃO Sâmela Rouse de Brito Silva.pdfapplication/pdf6370143https://repositorio.ufpe.br/bitstream/123456789/37626/1/DISSERTA%c3%87%c3%83O%20S%c3%a2mela%20Rouse%20de%20Brito%20Silva.pdf719a0a4fe0ddc9d17ec62e3d593213b1MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/37626/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82310https://repositorio.ufpe.br/bitstream/123456789/37626/3/license.txtbd573a5ca8288eb7272482765f819534MD53TEXTDISSERTAÇÃO Sâmela Rouse de Brito Silva.pdf.txtDISSERTAÇÃO Sâmela Rouse de Brito Silva.pdf.txtExtracted texttext/plain379562https://repositorio.ufpe.br/bitstream/123456789/37626/4/DISSERTA%c3%87%c3%83O%20S%c3%a2mela%20Rouse%20de%20Brito%20Silva.pdf.txt33eda9e6e5d6530f4ff91f1398215d58MD54THUMBNAILDISSERTAÇÃO Sâmela Rouse de Brito Silva.pdf.jpgDISSERTAÇÃO Sâmela Rouse de Brito Silva.pdf.jpgGenerated Thumbnailimage/jpeg1219https://repositorio.ufpe.br/bitstream/123456789/37626/5/DISSERTA%c3%87%c3%83O%20S%c3%a2mela%20Rouse%20de%20Brito%20Silva.pdf.jpg5f105942a96dcbcc7a4f3f842183440fMD55123456789/376262020-08-14 02:11:35.604oai:repositorio.ufpe.br:123456789/37626TGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKClRvZG8gZGVwb3NpdGFudGUgZGUgbWF0ZXJpYWwgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgKFJJKSBkZXZlIGNvbmNlZGVyLCDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIChVRlBFKSwgdW1hIExpY2Vuw6dhIGRlIERpc3RyaWJ1acOnw6NvIE7Do28gRXhjbHVzaXZhIHBhcmEgbWFudGVyIGUgdG9ybmFyIGFjZXNzw612ZWlzIG9zIHNldXMgZG9jdW1lbnRvcywgZW0gZm9ybWF0byBkaWdpdGFsLCBuZXN0ZSByZXBvc2l0w7NyaW8uCgpDb20gYSBjb25jZXNzw6NvIGRlc3RhIGxpY2Vuw6dhIG7Do28gZXhjbHVzaXZhLCBvIGRlcG9zaXRhbnRlIG1hbnTDqW0gdG9kb3Mgb3MgZGlyZWl0b3MgZGUgYXV0b3IuCl9fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fXwoKTGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKCkFvIGNvbmNvcmRhciBjb20gZXN0YSBsaWNlbsOnYSBlIGFjZWl0w6EtbGEsIHZvY8OqIChhdXRvciBvdSBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMpOgoKYSkgRGVjbGFyYSBxdWUgY29uaGVjZSBhIHBvbMOtdGljYSBkZSBjb3B5cmlnaHQgZGEgZWRpdG9yYSBkbyBzZXUgZG9jdW1lbnRvOwpiKSBEZWNsYXJhIHF1ZSBjb25oZWNlIGUgYWNlaXRhIGFzIERpcmV0cml6ZXMgcGFyYSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEU7CmMpIENvbmNlZGUgw6AgVUZQRSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZGUgYXJxdWl2YXIsIHJlcHJvZHV6aXIsIGNvbnZlcnRlciAoY29tbyBkZWZpbmlkbyBhIHNlZ3VpciksIGNvbXVuaWNhciBlL291IGRpc3RyaWJ1aXIsIG5vIFJJLCBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vL2Fic3RyYWN0KSBlbSBmb3JtYXRvIGRpZ2l0YWwgb3UgcG9yIG91dHJvIG1laW87CmQpIERlY2xhcmEgcXVlIGF1dG9yaXphIGEgVUZQRSBhIGFycXVpdmFyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXN0ZSBkb2N1bWVudG8gZSBjb252ZXJ0w6otbG8sIHNlbSBhbHRlcmFyIG8gc2V1IGNvbnRlw7pkbywgcGFyYSBxdWFscXVlciBmb3JtYXRvIGRlIGZpY2hlaXJvLCBtZWlvIG91IHN1cG9ydGUsIHBhcmEgZWZlaXRvcyBkZSBzZWd1cmFuw6dhLCBwcmVzZXJ2YcOnw6NvIChiYWNrdXApIGUgYWNlc3NvOwplKSBEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBzdWJtZXRpZG8gw6kgbyBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBhIHRlcmNlaXJvcyBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2Ugb3MgZGlyZWl0b3MgZGUgb3V0cmEgcGVzc29hIG91IGVudGlkYWRlOwpmKSBEZWNsYXJhIHF1ZSwgbm8gY2FzbyBkbyBkb2N1bWVudG8gc3VibWV0aWRvIGNvbnRlciBtYXRlcmlhbCBkbyBxdWFsIG7Do28gZGV0w6ltIG9zIGRpcmVpdG9zIGRlCmF1dG9yLCBvYnRldmUgYSBhdXRvcml6YcOnw6NvIGlycmVzdHJpdGEgZG8gcmVzcGVjdGl2byBkZXRlbnRvciBkZXNzZXMgZGlyZWl0b3MgcGFyYSBjZWRlciDDoApVRlBFIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgTGljZW7Dp2EgZSBhdXRvcml6YXIgYSB1bml2ZXJzaWRhZGUgYSB1dGlsaXrDoS1sb3MgbGVnYWxtZW50ZS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBlc3NlIG1hdGVyaWFsIGN1am9zIGRpcmVpdG9zIHPDo28gZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRvIGRvY3VtZW50byBlbnRyZWd1ZTsKZykgU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVRlBFLCBkZWNsYXJhIHF1ZSBjdW1wcml1IHF1YWlzcXVlciBvYnJpZ2HDp8O1ZXMgZXhpZ2lkYXMgcGVsbyByZXNwZWN0aXZvIGNvbnRyYXRvIG91IGFjb3Jkby4KCkEgVUZQRSBpZGVudGlmaWNhcsOhIGNsYXJhbWVudGUgbyhzKSBub21lKHMpIGRvKHMpIGF1dG9yIChlcykgZG9zIGRpcmVpdG9zIGRvIGRvY3VtZW50byBlbnRyZWd1ZSBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIHBhcmEgYWzDqW0gZG8gcHJldmlzdG8gbmEgYWzDrW5lYSBjKS4KRepositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212020-08-14T05:11:35Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false |
dc.title.pt_BR.fl_str_mv |
Sistemas de indexação automática por atribuição : uma análise comparativa |
title |
Sistemas de indexação automática por atribuição : uma análise comparativa |
spellingShingle |
Sistemas de indexação automática por atribuição : uma análise comparativa SILVA, Sâmela Rouse de Brito Indexação automática Indexação automática por atribuição Ciência da Informação Sistemas de Indexação automática Avaliação da Indexação automática |
title_short |
Sistemas de indexação automática por atribuição : uma análise comparativa |
title_full |
Sistemas de indexação automática por atribuição : uma análise comparativa |
title_fullStr |
Sistemas de indexação automática por atribuição : uma análise comparativa |
title_full_unstemmed |
Sistemas de indexação automática por atribuição : uma análise comparativa |
title_sort |
Sistemas de indexação automática por atribuição : uma análise comparativa |
author |
SILVA, Sâmela Rouse de Brito |
author_facet |
SILVA, Sâmela Rouse de Brito |
author_role |
author |
dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/1043044601200225 |
dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/7536537827447217 |
dc.contributor.author.fl_str_mv |
SILVA, Sâmela Rouse de Brito |
dc.contributor.advisor1.fl_str_mv |
CORRÊA, Renato Fernandes |
contributor_str_mv |
CORRÊA, Renato Fernandes |
dc.subject.por.fl_str_mv |
Indexação automática Indexação automática por atribuição Ciência da Informação Sistemas de Indexação automática Avaliação da Indexação automática |
topic |
Indexação automática Indexação automática por atribuição Ciência da Informação Sistemas de Indexação automática Avaliação da Indexação automática |
description |
Avalia e compara a qualidade de indexação dos softwares SISA (Sistema de Indización Semi-Automático) e MAUI (Multi-Purpose Automatic Topic Indexing) na perspectiva da indexação automática por atribuição de artigos científicos escritos em português da área da Ciência da Informação. O SISA é bastante utilizado na área da Ciência da Informação e os experimentos envolvendo o software apontam resultados satisfatórios. O MAUI é muito utilizado na área na Ciência da Computação, porém, o software possui a característica de utilizar um modelo de indexação intelectual para realizar a indexação automática. A pesquisa visa responder às seguintes indagações: Qual a qualidade da indexação dos sistemas SISA e MAUI? Como se dá o processo de indexação em ambos os sistemas? Qual o sistema que apresenta melhor desempenho? Quais os tipos de erros cometidos pelos sistemas na indexação? Para tanto, estabelece objetivos específicos que são alcançados em etapas. A pesquisa classifica-se como exploratória e empírica, cujo método utilizado para construção deste trabalho é um estudo de caso e a forma de coleta de dados se dá por meio de um experimento de indexação. O experimento constitui-se da indexação automática dos artigos científicos do corpus de referência composto por 60 artigos da tese de doutorado de Souza (2005). A avaliação do SISA apresentou a média de 28% no índice de consistência, 63% de precisão, 34% de revocação e 42% de medida F. A avaliação do MAUI apresentou a média de 36% no índice de consistência, 54% de precisão, 51% de revocação e 52% de medida F. Apesar de alguns erros cometidos pelos sistemas como a atribuição de termos no plural e singular; dificuldade em atribuir termos compostos, diferenças entre as estruturas nos termos de indexação e atribuição automática de termos gerais e específicos, pode-se concluir que os softwares apresentaram bons resultados, porém o MAUI se destacou por apresentar melhores índices e desempenho. |
publishDate |
2020 |
dc.date.accessioned.fl_str_mv |
2020-08-13T15:05:06Z |
dc.date.available.fl_str_mv |
2020-08-13T15:05:06Z |
dc.date.issued.fl_str_mv |
2020-02-28 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
SILVA, Sâmela Rouse de Brito. Sistemas de indexação automática por atribuição: uma análise comparativa. 2020. Dissertação (Mestrado em Ciência da Informação) – Universidade Federal de Pernambuco, Recife, 2020. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufpe.br/handle/123456789/37626 |
dc.identifier.dark.fl_str_mv |
ark:/64986/0013000008f25 |
identifier_str_mv |
SILVA, Sâmela Rouse de Brito. Sistemas de indexação automática por atribuição: uma análise comparativa. 2020. Dissertação (Mestrado em Ciência da Informação) – Universidade Federal de Pernambuco, Recife, 2020. ark:/64986/0013000008f25 |
url |
https://repositorio.ufpe.br/handle/123456789/37626 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.publisher.program.fl_str_mv |
Programa de Pos Graduacao em Ciencia da Informacao |
dc.publisher.initials.fl_str_mv |
UFPE |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco (UFPE) instacron:UFPE |
instname_str |
Universidade Federal de Pernambuco (UFPE) |
instacron_str |
UFPE |
institution |
UFPE |
reponame_str |
Repositório Institucional da UFPE |
collection |
Repositório Institucional da UFPE |
bitstream.url.fl_str_mv |
https://repositorio.ufpe.br/bitstream/123456789/37626/1/DISSERTA%c3%87%c3%83O%20S%c3%a2mela%20Rouse%20de%20Brito%20Silva.pdf https://repositorio.ufpe.br/bitstream/123456789/37626/2/license_rdf https://repositorio.ufpe.br/bitstream/123456789/37626/3/license.txt https://repositorio.ufpe.br/bitstream/123456789/37626/4/DISSERTA%c3%87%c3%83O%20S%c3%a2mela%20Rouse%20de%20Brito%20Silva.pdf.txt https://repositorio.ufpe.br/bitstream/123456789/37626/5/DISSERTA%c3%87%c3%83O%20S%c3%a2mela%20Rouse%20de%20Brito%20Silva.pdf.jpg |
bitstream.checksum.fl_str_mv |
719a0a4fe0ddc9d17ec62e3d593213b1 e39d27027a6cc9cb039ad269a5db8e34 bd573a5ca8288eb7272482765f819534 33eda9e6e5d6530f4ff91f1398215d58 5f105942a96dcbcc7a4f3f842183440f |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE) |
repository.mail.fl_str_mv |
attena@ufpe.br |
_version_ |
1815172759261544448 |