Estratégias para redução da fragmentação em métodos incrementais para desambiguação de nomes de autores.
Autor(a) principal: | |
---|---|
Data de Publicação: | 2014 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFOP |
Texto Completo: | http://www.repositorio.ufop.br/handle/123456789/4164 |
Resumo: | Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto. |
id |
UFOP_78d5a55aec7adf509175831f97d05832 |
---|---|
oai_identifier_str |
oai:localhost:123456789/4164 |
network_acronym_str |
UFOP |
network_name_str |
Repositório Institucional da UFOP |
repository_id_str |
3233 |
spelling |
Espiridião, Luciano Vilas BoasFerreira, Anderson Almeida2014-12-14T12:48:39Z2014-12-14T12:48:39Z2014ESPIRIDIÃO, L. V. B. Estratégias para redução da fragmentação em métodos incrementais para desambiguação de nomes de autores. 2014. 71 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2014.http://www.repositorio.ufop.br/handle/123456789/4164Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.Ambiguidade de nomes de autores é um grande problema enfrentado pela comunidade científica. Este problema ocorre quando vários autores publicam artigos usando nomes similares, ou quando um mesmo autor publica seus artigos com variações do seu nome. Tradicionalmente, existem métodos de desambiguação automáticos que são aplicadas a todos os registros de citação que estão no repositório de uma biblioteca digital. Mas existem métodos incrementais, que apenas desambiguam os nomes dos autores durante a inserção de um registro de citação no repositório. Estes métodos foram propostos com o objetivo de se obter uma maior eficiência.Porém, como efeito colateral, vários registros de um mesmo autor podem ser considerados como pertencentes a diferentes autores, causando o que é chamado fragmentação. Neste trabalho, é realizado um estudo para comparar várias estratégias visando reduzir a fragmentação dos registros sem comprometer a pureza, ou seja, mantendo os grupos de registros atribuídos a um autor com registros somente de um autor.As estratégias avaliadas foram baseadas em técnicas capazes de isolar os registros de citação possivelmente atribuídos incorretamente durante o processo de desambiguação.A avaliação experimental mostra que algumas estratégias conseguiram produzir melhorias significativas em relação a uma abordagem incremental e mostraram-se muito competitivas em relação a alguns métodos tradicionais.Ambiguity in author names is a hard problem faced by the scientific community. This problem occurs when multiple authors publish their articles using similar names, or when the same author publishes their articles with variations in their name. Traditionally, automatic disambiguation methods perform on all citation records in a digital library repository. On the other hand, incremental methods only disambiguate author names when a citation record is inserted into the repository. These methods have been proposed aiming to improve the efficiency. However, as a side effect, several records from the same author may be considered as belonging to different authors, fragmenting the citation list of a same author into several citation lists. In this work, we conduct a study to compare several strategies, in order to reduce this fragmentation without compromising purity, i.e., keeping the groups of records assigned to an author with records from only one author. The evaluated strategies were based on techniques able to isolate citation records possibly incorrectly attributed during the disambiguation process. The experimental evaluation shows that some strategies produce significant improvements against an incremental method and are very competitive compared with some traditional methods.AmbiguidadeBibliotecas digitaisSimilaridadeEstratégias para redução da fragmentação em métodos incrementais para desambiguação de nomes de autores.info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisAutorização concedida ao Repositório Institucional da UFOP pelo autor, 04/12/2014, com as seguintes condições: disponível sob Licença Creative Commons 3.0, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFOPinstname:Universidade Federal de Ouro Preto (UFOP)instacron:UFOPLICENSElicense.txtlicense.txttext/plain; charset=utf-82636http://www.repositorio.ufop.br/bitstream/123456789/4164/5/license.txtc2ffdd99e58acf69202dff00d361f23aMD55CC-LICENSElicense_urllicense_urltext/plain; charset=utf-846http://www.repositorio.ufop.br/bitstream/123456789/4164/2/license_url6f1da3ff281999354d4abd56d1551468MD52license_textlicense_texttext/html; charset=utf-822675http://www.repositorio.ufop.br/bitstream/123456789/4164/3/license_text2cc6fa37db485fe6eb8e552710daa836MD53license_rdflicense_rdfapplication/rdf+xml; charset=utf-821174http://www.repositorio.ufop.br/bitstream/123456789/4164/4/license_rdfb98541e59f955f816d2d78f2222e44c8MD54ORIGINALDISSERTAÇÃO_EstratégiasReduçãoFragmentação.pdfDISSERTAÇÃO_EstratégiasReduçãoFragmentação.pdfapplication/pdf3683575http://www.repositorio.ufop.br/bitstream/123456789/4164/1/DISSERTA%c3%87%c3%83O_Estrat%c3%a9giasRedu%c3%a7%c3%a3oFragmenta%c3%a7%c3%a3o.pdfb7919dfc1e36337043f4f333b82b072fMD51123456789/41642019-05-16 11:22:30.788oai:localhost:123456789/4164PGh0bWw+Cjxib2R5Pgo8ZGl2IGFsaWduPSJqdXN0aWZ5Ij48c3Ryb25nPkxpY2VuJmNjZWRpbDthIGRvIFJlcG9zaXQmb2FjdXRlO3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIE91cm8gUHJldG88L3N0cm9uZz4KICA8YnI+CiAgPGJyPgogIEFvIGNvbmNvcmRhciBjb20gZXN0YSBsaWNlbiZjY2VkaWw7YSwgdm9jJmVjaXJjOyhzKSBhdXRvcihlcykgb3UgdGl0dWxhcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRhIG9icmEgYXF1aSBkZXNjcml0YSBjb25jZWRlKG0pICZhZ3JhdmU7CiAgPGJyPgogIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIE91cm8gUHJldG8gKFVGT1ApIGdlc3RvcmEgZG8gUmVwb3NpdCZvYWN1dGU7cmlvIEluc3RpdHVjaW9uYWwgZGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgT3VybyBQcmV0bwogIDxicj4KICAoUkktVUZPUCksIG8gZGlyZWl0byBuJmF0aWxkZTtvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyLCBjb252ZXJ0ZXIgKGNvbW8gZGVmaW5pZG8gYWJhaXhvKSBlL291IGRpc3RyaWJ1aXIgbyBkb2N1bWVudG8gZGVwb3NpdGFkbwogIDxicj4KICBlbSBmb3JtYXRvIGltcHJlc3NvLCBlbGV0ciZvY2lyYztuaWNvIG91IGVtIHF1YWxxdWVyIG91dHJvIG1laW8uCiAgPGJyPgogIDxicj4KICBWb2MmZWNpcmM7KHMpIGNvbmNvcmRhKG0pIHF1ZSBhIFVGT1AsIGdlc3RvcmEgZG8gUkktVUZPUCwgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZSZ1YWN1dGU7ZG8sIGNvbnZlcnRlciBvIGFycXVpdm8gZGVwb3NpdGFkbyBhCiAgPGJyPgogIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBjb20gZmlucyBkZSBwcmVzZXJ2YSZjY2VkaWw7JmF0aWxkZTtvLiBWb2MmZWNpcmM7KHMpIHRhbWImZWFjdXRlO20gY29uY29yZGEobSkgcXVlIGEgVUZPUCwgZ2VzdG9yYSBkbyBSSS1VRk9QLCBwb2RlCiAgPGJyPgogIG1hbnRlciBtYWlzIGRlIHVtYSBjJm9hY3V0ZTtwaWEgZGVzdGUgZGVwJm9hY3V0ZTtzaXRvIHBhcmEgZmlucyBkZSBzZWd1cmFuJmNjZWRpbDthLCA8ZW0+YmFjay11cDwvZW0+IGUvb3UgcHJlc2VydmEmY2NlZGlsOyZhdGlsZGU7by4KICA8YnI+CiAgPGJyPgogIFZvYyZlY2lyYzsocykgZGVjbGFyYShtKSBxdWUgYSBhcHJlc2VudGEmY2NlZGlsOyZhdGlsZGU7byBkbyBzZXUgdHJhYmFsaG8gJmVhY3V0ZTsgb3JpZ2luYWwgZSBxdWUgdm9jJmVjaXJjOyhzKSBwb2RlKG0pIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zCiAgPGJyPgogIG5lc3RhIGxpY2VuJmNjZWRpbDthLiBWb2MmZWNpcmM7KHMpIHRhbWImZWFjdXRlO20gZGVjbGFyYShtKSBxdWUgbyBlbnZpbyAmZWFjdXRlOyBkZSBzZXUgY29uaGVjaW1lbnRvIGUgbiZhdGlsZGU7byBpbmZyaW5nZSBvcyBkaXJlaXRvcyBhdXRvcmFpcyBkZSBvdXRyYQogIDxicj4KICBwZXNzb2Egb3UgaW5zdGl0dWkmY2NlZGlsOyZhdGlsZGU7by4gQ2FzbyBvIGRvY3VtZW50byBhIHNlciBkZXBvc2l0YWRvIGNvbnRlbmhhIG1hdGVyaWFsIHBhcmEgbyBxdWFsIHZvYyZlY2lyYzsocykgbiZhdGlsZGU7byBkZXQmZWFjdXRlO20gYSB0aXR1bGFyaWRhZGUKICA8YnI+CiAgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2MmZWNpcmM7KHMpIGRlY2xhcmEobSkgcXVlIG9idGV2ZSBhIHBlcm1pc3MmYXRpbGRlO28gaXJyZXN0cml0YSBkbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkZSBjb25jZWRlciAmYWdyYXZlOwogIDxicj4KICBVRk9QLCBnZXN0b3JhIGRvIFJJLVVGT1Agb3MgZGlyZWl0b3MgcmVxdWVyaWRvcyBwb3IgZXN0YSBsaWNlbiZjY2VkaWw7YSBlIHF1ZSBvcyBtYXRlcmlhaXMgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zLCBlc3QmYXRpbGRlO28KICA8YnI+CiAgZGV2aWRhbWVudGUgaWRlbnRpZmljYWRvcyBlIHJlY29uaGVjaWRvcyBubyB0ZXh0byBvdSBjb250ZSZ1YWN1dGU7ZG8gZGEgYXByZXNlbnRhJmNjZWRpbDsmYXRpbGRlO28uCiAgPGJyPgogIDxicj4KICBDQVNPIE8gVFJBQkFMSE8gREVQT1NJVEFETyBURU5IQSBTSURPIEZJTkFOQ0lBRE8gT1UgQVBPSUFETyBQT1IgVU0gJk9hY3V0ZTtSRyZBdGlsZGU7TywgUVVFIE4mQXRpbGRlO08gQSBJTlNUSVRVSSZDY2VkaWw7JkF0aWxkZTtPIERFU1RFCiAgPGJyPgogIFJFU1BPU0lUJk9hY3V0ZTtSSU86IFZPQyZFY2lyYzsgREVDTEFSQSBURVIgQ1VNUFJJRE8gVE9ET1MgT1MgRElSRUlUT1MgREUgUkVWSVMmQXRpbGRlO08gRSBRVUFJU1FVRVIgT1VUUkFTIE9CUklHQSZDY2VkaWw7Jk90aWxkZTtFUwogIDxicj4KICBSRVFVRVJJREFTIFBFTE8gQ09OVFJBVE8gT1UgQUNPUkRPLiAKICA8YnI+CiAgPGJyPgogIE8gcmVwb3NpdCZvYWN1dGU7cmlvIGlkZW50aWZpY2FyJmFhY3V0ZTsgY2xhcmFtZW50ZSBvIHNldShzKSBub21lKHMpIGNvbW8gYXV0b3IoZXMpIG91IHRpdHVsYXIoZXMpIGRvIGRpcmVpdG8gZGUgYXV0b3IoZXMpIGRvIGRvY3VtZW50bwogIDxicj4KICBzdWJtZXRpZG8gZSBkZWNsYXJhIHF1ZSBuJmF0aWxkZTtvIGZhciZhYWN1dGU7IHF1YWxxdWVyIGFsdGVyYSZjY2VkaWw7JmF0aWxkZTtvIGFsJmVhY3V0ZTttIGRhcyBwZXJtaXRpZGFzIHBvciBlc3RhIGxpY2VuJmNjZWRpbDthLjwvcD4KPC9kaXY+CjwvYm9keT4KPC9odG1sPgo=Repositório InstitucionalPUBhttp://www.repositorio.ufop.br/oai/requestrepositorio@ufop.edu.bropendoar:32332019-05-16T15:22:30Repositório Institucional da UFOP - Universidade Federal de Ouro Preto (UFOP)false |
dc.title.pt_BR.fl_str_mv |
Estratégias para redução da fragmentação em métodos incrementais para desambiguação de nomes de autores. |
title |
Estratégias para redução da fragmentação em métodos incrementais para desambiguação de nomes de autores. |
spellingShingle |
Estratégias para redução da fragmentação em métodos incrementais para desambiguação de nomes de autores. Espiridião, Luciano Vilas Boas Ambiguidade Bibliotecas digitais Similaridade |
title_short |
Estratégias para redução da fragmentação em métodos incrementais para desambiguação de nomes de autores. |
title_full |
Estratégias para redução da fragmentação em métodos incrementais para desambiguação de nomes de autores. |
title_fullStr |
Estratégias para redução da fragmentação em métodos incrementais para desambiguação de nomes de autores. |
title_full_unstemmed |
Estratégias para redução da fragmentação em métodos incrementais para desambiguação de nomes de autores. |
title_sort |
Estratégias para redução da fragmentação em métodos incrementais para desambiguação de nomes de autores. |
author |
Espiridião, Luciano Vilas Boas |
author_facet |
Espiridião, Luciano Vilas Boas |
author_role |
author |
dc.contributor.author.fl_str_mv |
Espiridião, Luciano Vilas Boas |
dc.contributor.advisor1.fl_str_mv |
Ferreira, Anderson Almeida |
contributor_str_mv |
Ferreira, Anderson Almeida |
dc.subject.por.fl_str_mv |
Ambiguidade Bibliotecas digitais Similaridade |
topic |
Ambiguidade Bibliotecas digitais Similaridade |
description |
Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto. |
publishDate |
2014 |
dc.date.accessioned.fl_str_mv |
2014-12-14T12:48:39Z |
dc.date.available.fl_str_mv |
2014-12-14T12:48:39Z |
dc.date.issued.fl_str_mv |
2014 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
ESPIRIDIÃO, L. V. B. Estratégias para redução da fragmentação em métodos incrementais para desambiguação de nomes de autores. 2014. 71 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2014. |
dc.identifier.uri.fl_str_mv |
http://www.repositorio.ufop.br/handle/123456789/4164 |
identifier_str_mv |
ESPIRIDIÃO, L. V. B. Estratégias para redução da fragmentação em métodos incrementais para desambiguação de nomes de autores. 2014. 71 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2014. |
url |
http://www.repositorio.ufop.br/handle/123456789/4164 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFOP instname:Universidade Federal de Ouro Preto (UFOP) instacron:UFOP |
instname_str |
Universidade Federal de Ouro Preto (UFOP) |
instacron_str |
UFOP |
institution |
UFOP |
reponame_str |
Repositório Institucional da UFOP |
collection |
Repositório Institucional da UFOP |
bitstream.url.fl_str_mv |
http://www.repositorio.ufop.br/bitstream/123456789/4164/5/license.txt http://www.repositorio.ufop.br/bitstream/123456789/4164/2/license_url http://www.repositorio.ufop.br/bitstream/123456789/4164/3/license_text http://www.repositorio.ufop.br/bitstream/123456789/4164/4/license_rdf http://www.repositorio.ufop.br/bitstream/123456789/4164/1/DISSERTA%c3%87%c3%83O_Estrat%c3%a9giasRedu%c3%a7%c3%a3oFragmenta%c3%a7%c3%a3o.pdf |
bitstream.checksum.fl_str_mv |
c2ffdd99e58acf69202dff00d361f23a 6f1da3ff281999354d4abd56d1551468 2cc6fa37db485fe6eb8e552710daa836 b98541e59f955f816d2d78f2222e44c8 b7919dfc1e36337043f4f333b82b072f |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFOP - Universidade Federal de Ouro Preto (UFOP) |
repository.mail.fl_str_mv |
repositorio@ufop.edu.br |
_version_ |
1801685714460475392 |