Um estudo comparativo entre abordagens supervisionadas para a resolução de referências a autores
Autor(a) principal: | |
---|---|
Data de Publicação: | 2011 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFG |
Texto Completo: | http://repositorio.bc.ufg.br/tede/handle/tde/514 |
Resumo: | In this work we investigate two classes of solutions for the problem of author name disambiguation.We refer to the approach of the first class as relational based on attributes (RBA) solutions. These approaches use similarity measures based on attributes of the two references being compared or based on the attributes of other references connected to them by authorship. The other class of approaches uses information on semantic relationships among entities in addition to attribute based similarity measures to decide if two references refer to the same author. We refer to the approaches of this class as relational based on entities (RBE) solutions. We present a supervised version of the RBE based on the work introduced by Bhattacharya and Gettor [7]. In the experiments we conducted our RBE solution presented statistically significant gains in efficacy over all the other methods studied. However, the gains are only marginal over the RBA methods experimented. On the other hand, the execution time of both training and testing phases of the RBE methods are notably greater than those of the RBA methods. As far as we know there is no other similar study reported in literature and we consider the results reported here are relevant because they inspire research about enhancing RBA solutions. |
id |
UFG-2_146feea2f2343cdec80c1fbb0fd2b655 |
---|---|
oai_identifier_str |
oai:repositorio.bc.ufg.br:tde/514 |
network_acronym_str |
UFG-2 |
network_name_str |
Repositório Institucional da UFG |
repository_id_str |
|
spelling |
ROSA, Thierson Coutohttp://lattes.cnpq.br/4414718560764818http://lattes.cnpq.br/5172447060300953CANUTO, Sérgio Daniel Carvalho2014-07-29T14:57:49Z2012-03-062011-08-25CANUTO, Sérgio Daniel Carvalho. A comparative study of supervised approaches for author reference resolution. 2011. 82 f. Dissertação (Mestrado em Ciências Exatas e da Terra - Ciências da Computação) - Universidade Federal de Goiás, Goiânia, 2011.http://repositorio.bc.ufg.br/tede/handle/tde/514ark:/38995/001300000bmnwIn this work we investigate two classes of solutions for the problem of author name disambiguation.We refer to the approach of the first class as relational based on attributes (RBA) solutions. These approaches use similarity measures based on attributes of the two references being compared or based on the attributes of other references connected to them by authorship. The other class of approaches uses information on semantic relationships among entities in addition to attribute based similarity measures to decide if two references refer to the same author. We refer to the approaches of this class as relational based on entities (RBE) solutions. We present a supervised version of the RBE based on the work introduced by Bhattacharya and Gettor [7]. In the experiments we conducted our RBE solution presented statistically significant gains in efficacy over all the other methods studied. However, the gains are only marginal over the RBA methods experimented. On the other hand, the execution time of both training and testing phases of the RBE methods are notably greater than those of the RBA methods. As far as we know there is no other similar study reported in literature and we consider the results reported here are relevant because they inspire research about enhancing RBA solutions.Neste trabalho investigamos duas classes de soluções supervisionadas para o problema de resolver se duas ou mais referências a autores (nomes de autores) correspondem à mesma pessoa. Denominamos abordagens relacionais baseadas em atributo (RBA) as abordagens da primeira classe. Nessas abordagens são utilizadas medidas de similaridades entre atributos textuais de duas referências ou de referências ligadas a elas por coautoria. A outra classe de soluções estudada utiliza informações de relacionamento semântico entre entidades, em adição às similaridades por atributos, para decidir quando duas ou mais referências devem ser consideradas correferentes. Denominamos as abordagens dessa classe de relacionais baseadas em entidades (RBE). Apresentamos uma versão supervisionada de solução RBE que se baseia na proposta apresentada por Bhattacharya e Gettor [7]. Experimentos utilizando duas coleções reais e uma coleção artificial mostram que a solução RBE proposta neste trabalho apresenta ganhos de eficácia estatisticamente comprovados em relação a todos os métodos analisados. Entretanto, o ganho é apenas marginal em relação aos métodos da classe RBA analisados. Por outro lado, o custo computacional tanto de treino quanto de teste das abordagens RBE é consideravelmente maior que o custo dos métodos RBA. Consideramos que esse estudo comparativo é inédito e que as conclusões são importantes, pois incentivam pesquisas para o aprimoramento das soluções RBA.Made available in DSpace on 2014-07-29T14:57:49Z (GMT). No. of bitstreams: 1 Dissertacao Sergio Daniel Carvalho Canuto.pdf: 584503 bytes, checksum: 6a393853a561ed8fec4bd9e4eef56628 (MD5) Previous issue date: 2011-08-25application/pdfporUniversidade Federal de GoiásMestrado em Ciência da ComputaçãoUFGBRCiências Exatas e da Terra - Ciências da ComputaçãoResolução de entidadesDesambiguação de nomes de autoresResolução de entidades; Desambiguação de nomes de autoresEentity resolutionAuthor name disambiguationCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOUm estudo comparativo entre abordagens supervisionadas para a resolução de referências a autoresA comparative study of supervised approaches for author reference resolutioninfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFGinstname:Universidade Federal de Goiás (UFG)instacron:UFGORIGINALDissertacao Sergio Daniel Carvalho Canuto.pdfapplication/pdf584503http://repositorio.bc.ufg.br/tede/bitstreams/cb7c3291-9eaf-47f7-871b-0b5a2484cf8f/download6a393853a561ed8fec4bd9e4eef56628MD51tde/5142014-07-29 11:57:49.783open.accessoai:repositorio.bc.ufg.br:tde/514http://repositorio.bc.ufg.br/tedeRepositório InstitucionalPUBhttp://repositorio.bc.ufg.br/oai/requesttasesdissertacoes.bc@ufg.bropendoar:2014-07-29T14:57:49Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)false |
dc.title.por.fl_str_mv |
Um estudo comparativo entre abordagens supervisionadas para a resolução de referências a autores |
dc.title.alternative.eng.fl_str_mv |
A comparative study of supervised approaches for author reference resolution |
title |
Um estudo comparativo entre abordagens supervisionadas para a resolução de referências a autores |
spellingShingle |
Um estudo comparativo entre abordagens supervisionadas para a resolução de referências a autores CANUTO, Sérgio Daniel Carvalho Resolução de entidades Desambiguação de nomes de autores Resolução de entidades; Desambiguação de nomes de autores Eentity resolution Author name disambiguation CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
title_short |
Um estudo comparativo entre abordagens supervisionadas para a resolução de referências a autores |
title_full |
Um estudo comparativo entre abordagens supervisionadas para a resolução de referências a autores |
title_fullStr |
Um estudo comparativo entre abordagens supervisionadas para a resolução de referências a autores |
title_full_unstemmed |
Um estudo comparativo entre abordagens supervisionadas para a resolução de referências a autores |
title_sort |
Um estudo comparativo entre abordagens supervisionadas para a resolução de referências a autores |
author |
CANUTO, Sérgio Daniel Carvalho |
author_facet |
CANUTO, Sérgio Daniel Carvalho |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
ROSA, Thierson Couto |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/4414718560764818 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/5172447060300953 |
dc.contributor.author.fl_str_mv |
CANUTO, Sérgio Daniel Carvalho |
contributor_str_mv |
ROSA, Thierson Couto |
dc.subject.por.fl_str_mv |
Resolução de entidades Desambiguação de nomes de autores Resolução de entidades; Desambiguação de nomes de autores |
topic |
Resolução de entidades Desambiguação de nomes de autores Resolução de entidades; Desambiguação de nomes de autores Eentity resolution Author name disambiguation CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
dc.subject.eng.fl_str_mv |
Eentity resolution Author name disambiguation |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
description |
In this work we investigate two classes of solutions for the problem of author name disambiguation.We refer to the approach of the first class as relational based on attributes (RBA) solutions. These approaches use similarity measures based on attributes of the two references being compared or based on the attributes of other references connected to them by authorship. The other class of approaches uses information on semantic relationships among entities in addition to attribute based similarity measures to decide if two references refer to the same author. We refer to the approaches of this class as relational based on entities (RBE) solutions. We present a supervised version of the RBE based on the work introduced by Bhattacharya and Gettor [7]. In the experiments we conducted our RBE solution presented statistically significant gains in efficacy over all the other methods studied. However, the gains are only marginal over the RBA methods experimented. On the other hand, the execution time of both training and testing phases of the RBE methods are notably greater than those of the RBA methods. As far as we know there is no other similar study reported in literature and we consider the results reported here are relevant because they inspire research about enhancing RBA solutions. |
publishDate |
2011 |
dc.date.issued.fl_str_mv |
2011-08-25 |
dc.date.available.fl_str_mv |
2012-03-06 |
dc.date.accessioned.fl_str_mv |
2014-07-29T14:57:49Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
CANUTO, Sérgio Daniel Carvalho. A comparative study of supervised approaches for author reference resolution. 2011. 82 f. Dissertação (Mestrado em Ciências Exatas e da Terra - Ciências da Computação) - Universidade Federal de Goiás, Goiânia, 2011. |
dc.identifier.uri.fl_str_mv |
http://repositorio.bc.ufg.br/tede/handle/tde/514 |
dc.identifier.dark.fl_str_mv |
ark:/38995/001300000bmnw |
identifier_str_mv |
CANUTO, Sérgio Daniel Carvalho. A comparative study of supervised approaches for author reference resolution. 2011. 82 f. Dissertação (Mestrado em Ciências Exatas e da Terra - Ciências da Computação) - Universidade Federal de Goiás, Goiânia, 2011. ark:/38995/001300000bmnw |
url |
http://repositorio.bc.ufg.br/tede/handle/tde/514 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de Goiás |
dc.publisher.program.fl_str_mv |
Mestrado em Ciência da Computação |
dc.publisher.initials.fl_str_mv |
UFG |
dc.publisher.country.fl_str_mv |
BR |
dc.publisher.department.fl_str_mv |
Ciências Exatas e da Terra - Ciências da Computação |
publisher.none.fl_str_mv |
Universidade Federal de Goiás |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFG instname:Universidade Federal de Goiás (UFG) instacron:UFG |
instname_str |
Universidade Federal de Goiás (UFG) |
instacron_str |
UFG |
institution |
UFG |
reponame_str |
Repositório Institucional da UFG |
collection |
Repositório Institucional da UFG |
bitstream.url.fl_str_mv |
http://repositorio.bc.ufg.br/tede/bitstreams/cb7c3291-9eaf-47f7-871b-0b5a2484cf8f/download |
bitstream.checksum.fl_str_mv |
6a393853a561ed8fec4bd9e4eef56628 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFG - Universidade Federal de Goiás (UFG) |
repository.mail.fl_str_mv |
tasesdissertacoes.bc@ufg.br |
_version_ |
1811721485532790784 |