Uma proposta para combinar classificadores e colaboração de usuários na resolução do problema de ambiguidade de nomes de autores.

Detalhes bibliográficos
Autor(a) principal: Souza, Emília Alves de
Data de Publicação: 2014
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFOP
Texto Completo: http://www.repositorio.ufop.br/handle/123456789/4234
Resumo: Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.
id UFOP_bbc78ca3216afcdadc16ba60ff65ba94
oai_identifier_str oai:localhost:123456789/4234
network_acronym_str UFOP
network_name_str Repositório Institucional da UFOP
repository_id_str 3233
spelling Souza, Emília Alves deFerreira, Anderson Almeida2015-01-16T15:40:29Z2015-01-16T15:40:29Z2014SOUZA, E. A. de. Uma proposta para combinar classificadores e colaboração de usuários na resolução do problema de ambiguidade de nomes de autores. 2014. 86 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2014.http://www.repositorio.ufop.br/handle/123456789/4234Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.O problema de ambiguidade de nomes em citações bibliográficas tem sido amplamente estudado principalmente pela comunidade científica de bibliotecas digitais envolvendo nomes de autores. Normalmente, os métodos propostos na literatura seguem abordagens supervisionadas ou não supervisionadas. Os métodos supervisionados são normalmente os mais efetivos, mas geralmente requerem que uma grande quantidade de exemplos sejam manualmente rotulados e, além disso, também não são capazes de resolver a ambiguidade para todos os nomes devido a inerente dificuldade do problema. Recentemente, com o objetivo de melhorar o resultado do processo de desambiguação, alguns trabalhos têm utilizado a colaboração de usuários na desambiguação manual de alguns registros. Neste trabalho é proposto um método para combinar resultados de técnicas supervisionadas de aprendizado de máquina com a colaboração de usuários para resolver tal problema. Inicialmente, o método explora os atributos dos registros de citações para agrupar registros que pertençam a um único autor. A partir desses grupos, classificadores são combinados para gerar uma função de similaridade que, juntamente com a colaboração do usuário, contribuem para agrupar grupos separados de registros de citações que pertencem a um mesmo autor real. Apesar de usar técnicas supervisionadas, o único esforço exercido por parte do usuário é fornecer a sua colaboração desambiguando alguns nomes de autores. O método foi comparado com outros métodos representativos e o ganho em relação a eles atinge cerca de 20% nos resultados de desambiguação.The author name ambiguity problem in bibliographic citations has been widely studied by the scientific community, mostly, about author name ambiguity problem by the digital library research community. Usually, the methods proposed in the literature follow supervised or unsupervised approaches. The supervised methods are usually the most effective ones, but they generally require that a large amount of manually labeled examples and furthermore, they are not capable of solving the author name ambiguity for all names due to its inherent difficulty. Recently, aiming to improve the disambiguation performance, user feedback have been used in some works. This work proposes a method to combine results of supervised machine learning techniques along with users feedback to solve such a problem. Initially, the method exploits attributes present in citations to group ones with similar author names. From these groups, three classifiers are combined to produce a similarity function of pairs of records between two groups to, along with users feedback, group ones that belong to the same author. Although, it uses supervised techniques, the only effort applied by the user is to provide feedback for disambiguating author names. We compare our method with other representative ones and our gains reaches up to 20% in the disambiguation performance.Sistemas de recuperação da informaçãoBibliotecas digitaisUma proposta para combinar classificadores e colaboração de usuários na resolução do problema de ambiguidade de nomes de autores.info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisAutorização concedida ao Repositório Institucional da UFOP pelo(a) autor(a) em 19/12/2014 com as seguintes condições: disponível sob Licença Creative Commons 4.0 que permite copiar, distribuir e transmitir o trabalho desde que sejam citados o autor e o licenciante. Não permite o uso para fins comerciais nem a adaptação.info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFOPinstname:Universidade Federal de Ouro Preto (UFOP)instacron:UFOPLICENSElicense.txtlicense.txttext/plain; charset=utf-82636http://www.repositorio.ufop.br/bitstream/123456789/4234/5/license.txtc2ffdd99e58acf69202dff00d361f23aMD55CC-LICENSElicense_urllicense_urltext/plain; charset=utf-849http://www.repositorio.ufop.br/bitstream/123456789/4234/2/license_url4afdbb8c545fd630ea7db775da747b2fMD52license_textlicense_texttext/html; charset=utf-822901http://www.repositorio.ufop.br/bitstream/123456789/4234/3/license_textf31e50b6e7efabe2b8433fb87ca0b542MD53license_rdflicense_rdfapplication/rdf+xml; charset=utf-822190http://www.repositorio.ufop.br/bitstream/123456789/4234/4/license_rdf19e8a2b57ef43c09f4d7071d2153c97dMD54ORIGINALDISSERTAÇÃO_PropostaCombinarClassificadores.pdfDISSERTAÇÃO_PropostaCombinarClassificadores.pdfapplication/pdf1772529http://www.repositorio.ufop.br/bitstream/123456789/4234/1/DISSERTA%c3%87%c3%83O_PropostaCombinarClassificadores.pdf9b5cf663666dfc70a93b2a93bda1f609MD51123456789/42342019-06-10 13:24:46.42oai:localhost:123456789/4234PGh0bWw+Cjxib2R5Pgo8ZGl2IGFsaWduPSJqdXN0aWZ5Ij48c3Ryb25nPkxpY2VuJmNjZWRpbDthIGRvIFJlcG9zaXQmb2FjdXRlO3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIE91cm8gUHJldG88L3N0cm9uZz4KICA8YnI+CiAgPGJyPgogIEFvIGNvbmNvcmRhciBjb20gZXN0YSBsaWNlbiZjY2VkaWw7YSwgdm9jJmVjaXJjOyhzKSBhdXRvcihlcykgb3UgdGl0dWxhcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRhIG9icmEgYXF1aSBkZXNjcml0YSBjb25jZWRlKG0pICZhZ3JhdmU7CiAgPGJyPgogIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIE91cm8gUHJldG8gKFVGT1ApIGdlc3RvcmEgZG8gUmVwb3NpdCZvYWN1dGU7cmlvIEluc3RpdHVjaW9uYWwgZGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgT3VybyBQcmV0bwogIDxicj4KICAoUkktVUZPUCksIG8gZGlyZWl0byBuJmF0aWxkZTtvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyLCBjb252ZXJ0ZXIgKGNvbW8gZGVmaW5pZG8gYWJhaXhvKSBlL291IGRpc3RyaWJ1aXIgbyBkb2N1bWVudG8gZGVwb3NpdGFkbwogIDxicj4KICBlbSBmb3JtYXRvIGltcHJlc3NvLCBlbGV0ciZvY2lyYztuaWNvIG91IGVtIHF1YWxxdWVyIG91dHJvIG1laW8uCiAgPGJyPgogIDxicj4KICBWb2MmZWNpcmM7KHMpIGNvbmNvcmRhKG0pIHF1ZSBhIFVGT1AsIGdlc3RvcmEgZG8gUkktVUZPUCwgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZSZ1YWN1dGU7ZG8sIGNvbnZlcnRlciBvIGFycXVpdm8gZGVwb3NpdGFkbyBhCiAgPGJyPgogIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBjb20gZmlucyBkZSBwcmVzZXJ2YSZjY2VkaWw7JmF0aWxkZTtvLiBWb2MmZWNpcmM7KHMpIHRhbWImZWFjdXRlO20gY29uY29yZGEobSkgcXVlIGEgVUZPUCwgZ2VzdG9yYSBkbyBSSS1VRk9QLCBwb2RlCiAgPGJyPgogIG1hbnRlciBtYWlzIGRlIHVtYSBjJm9hY3V0ZTtwaWEgZGVzdGUgZGVwJm9hY3V0ZTtzaXRvIHBhcmEgZmlucyBkZSBzZWd1cmFuJmNjZWRpbDthLCA8ZW0+YmFjay11cDwvZW0+IGUvb3UgcHJlc2VydmEmY2NlZGlsOyZhdGlsZGU7by4KICA8YnI+CiAgPGJyPgogIFZvYyZlY2lyYzsocykgZGVjbGFyYShtKSBxdWUgYSBhcHJlc2VudGEmY2NlZGlsOyZhdGlsZGU7byBkbyBzZXUgdHJhYmFsaG8gJmVhY3V0ZTsgb3JpZ2luYWwgZSBxdWUgdm9jJmVjaXJjOyhzKSBwb2RlKG0pIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zCiAgPGJyPgogIG5lc3RhIGxpY2VuJmNjZWRpbDthLiBWb2MmZWNpcmM7KHMpIHRhbWImZWFjdXRlO20gZGVjbGFyYShtKSBxdWUgbyBlbnZpbyAmZWFjdXRlOyBkZSBzZXUgY29uaGVjaW1lbnRvIGUgbiZhdGlsZGU7byBpbmZyaW5nZSBvcyBkaXJlaXRvcyBhdXRvcmFpcyBkZSBvdXRyYQogIDxicj4KICBwZXNzb2Egb3UgaW5zdGl0dWkmY2NlZGlsOyZhdGlsZGU7by4gQ2FzbyBvIGRvY3VtZW50byBhIHNlciBkZXBvc2l0YWRvIGNvbnRlbmhhIG1hdGVyaWFsIHBhcmEgbyBxdWFsIHZvYyZlY2lyYzsocykgbiZhdGlsZGU7byBkZXQmZWFjdXRlO20gYSB0aXR1bGFyaWRhZGUKICA8YnI+CiAgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2MmZWNpcmM7KHMpIGRlY2xhcmEobSkgcXVlIG9idGV2ZSBhIHBlcm1pc3MmYXRpbGRlO28gaXJyZXN0cml0YSBkbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkZSBjb25jZWRlciAmYWdyYXZlOwogIDxicj4KICBVRk9QLCBnZXN0b3JhIGRvIFJJLVVGT1Agb3MgZGlyZWl0b3MgcmVxdWVyaWRvcyBwb3IgZXN0YSBsaWNlbiZjY2VkaWw7YSBlIHF1ZSBvcyBtYXRlcmlhaXMgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zLCBlc3QmYXRpbGRlO28KICA8YnI+CiAgZGV2aWRhbWVudGUgaWRlbnRpZmljYWRvcyBlIHJlY29uaGVjaWRvcyBubyB0ZXh0byBvdSBjb250ZSZ1YWN1dGU7ZG8gZGEgYXByZXNlbnRhJmNjZWRpbDsmYXRpbGRlO28uCiAgPGJyPgogIDxicj4KICBDQVNPIE8gVFJBQkFMSE8gREVQT1NJVEFETyBURU5IQSBTSURPIEZJTkFOQ0lBRE8gT1UgQVBPSUFETyBQT1IgVU0gJk9hY3V0ZTtSRyZBdGlsZGU7TywgUVVFIE4mQXRpbGRlO08gQSBJTlNUSVRVSSZDY2VkaWw7JkF0aWxkZTtPIERFU1RFCiAgPGJyPgogIFJFU1BPU0lUJk9hY3V0ZTtSSU86IFZPQyZFY2lyYzsgREVDTEFSQSBURVIgQ1VNUFJJRE8gVE9ET1MgT1MgRElSRUlUT1MgREUgUkVWSVMmQXRpbGRlO08gRSBRVUFJU1FVRVIgT1VUUkFTIE9CUklHQSZDY2VkaWw7Jk90aWxkZTtFUwogIDxicj4KICBSRVFVRVJJREFTIFBFTE8gQ09OVFJBVE8gT1UgQUNPUkRPLiAKICA8YnI+CiAgPGJyPgogIE8gcmVwb3NpdCZvYWN1dGU7cmlvIGlkZW50aWZpY2FyJmFhY3V0ZTsgY2xhcmFtZW50ZSBvIHNldShzKSBub21lKHMpIGNvbW8gYXV0b3IoZXMpIG91IHRpdHVsYXIoZXMpIGRvIGRpcmVpdG8gZGUgYXV0b3IoZXMpIGRvIGRvY3VtZW50bwogIDxicj4KICBzdWJtZXRpZG8gZSBkZWNsYXJhIHF1ZSBuJmF0aWxkZTtvIGZhciZhYWN1dGU7IHF1YWxxdWVyIGFsdGVyYSZjY2VkaWw7JmF0aWxkZTtvIGFsJmVhY3V0ZTttIGRhcyBwZXJtaXRpZGFzIHBvciBlc3RhIGxpY2VuJmNjZWRpbDthLjwvcD4KPC9kaXY+CjwvYm9keT4KPC9odG1sPgo=Repositório InstitucionalPUBhttp://www.repositorio.ufop.br/oai/requestrepositorio@ufop.edu.bropendoar:32332019-06-10T17:24:46Repositório Institucional da UFOP - Universidade Federal de Ouro Preto (UFOP)false
dc.title.pt_BR.fl_str_mv Uma proposta para combinar classificadores e colaboração de usuários na resolução do problema de ambiguidade de nomes de autores.
title Uma proposta para combinar classificadores e colaboração de usuários na resolução do problema de ambiguidade de nomes de autores.
spellingShingle Uma proposta para combinar classificadores e colaboração de usuários na resolução do problema de ambiguidade de nomes de autores.
Souza, Emília Alves de
Sistemas de recuperação da informação
Bibliotecas digitais
title_short Uma proposta para combinar classificadores e colaboração de usuários na resolução do problema de ambiguidade de nomes de autores.
title_full Uma proposta para combinar classificadores e colaboração de usuários na resolução do problema de ambiguidade de nomes de autores.
title_fullStr Uma proposta para combinar classificadores e colaboração de usuários na resolução do problema de ambiguidade de nomes de autores.
title_full_unstemmed Uma proposta para combinar classificadores e colaboração de usuários na resolução do problema de ambiguidade de nomes de autores.
title_sort Uma proposta para combinar classificadores e colaboração de usuários na resolução do problema de ambiguidade de nomes de autores.
author Souza, Emília Alves de
author_facet Souza, Emília Alves de
author_role author
dc.contributor.author.fl_str_mv Souza, Emília Alves de
dc.contributor.advisor1.fl_str_mv Ferreira, Anderson Almeida
contributor_str_mv Ferreira, Anderson Almeida
dc.subject.por.fl_str_mv Sistemas de recuperação da informação
Bibliotecas digitais
topic Sistemas de recuperação da informação
Bibliotecas digitais
description Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.
publishDate 2014
dc.date.issued.fl_str_mv 2014
dc.date.accessioned.fl_str_mv 2015-01-16T15:40:29Z
dc.date.available.fl_str_mv 2015-01-16T15:40:29Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SOUZA, E. A. de. Uma proposta para combinar classificadores e colaboração de usuários na resolução do problema de ambiguidade de nomes de autores. 2014. 86 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2014.
dc.identifier.uri.fl_str_mv http://www.repositorio.ufop.br/handle/123456789/4234
identifier_str_mv SOUZA, E. A. de. Uma proposta para combinar classificadores e colaboração de usuários na resolução do problema de ambiguidade de nomes de autores. 2014. 86 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2014.
url http://www.repositorio.ufop.br/handle/123456789/4234
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFOP
instname:Universidade Federal de Ouro Preto (UFOP)
instacron:UFOP
instname_str Universidade Federal de Ouro Preto (UFOP)
instacron_str UFOP
institution UFOP
reponame_str Repositório Institucional da UFOP
collection Repositório Institucional da UFOP
bitstream.url.fl_str_mv http://www.repositorio.ufop.br/bitstream/123456789/4234/5/license.txt
http://www.repositorio.ufop.br/bitstream/123456789/4234/2/license_url
http://www.repositorio.ufop.br/bitstream/123456789/4234/3/license_text
http://www.repositorio.ufop.br/bitstream/123456789/4234/4/license_rdf
http://www.repositorio.ufop.br/bitstream/123456789/4234/1/DISSERTA%c3%87%c3%83O_PropostaCombinarClassificadores.pdf
bitstream.checksum.fl_str_mv c2ffdd99e58acf69202dff00d361f23a
4afdbb8c545fd630ea7db775da747b2f
f31e50b6e7efabe2b8433fb87ca0b542
19e8a2b57ef43c09f4d7071d2153c97d
9b5cf663666dfc70a93b2a93bda1f609
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFOP - Universidade Federal de Ouro Preto (UFOP)
repository.mail.fl_str_mv repositorio@ufop.edu.br
_version_ 1797950177223376896