Um estudo comparativo entre abordagens supervisionadas para a resolução de referências a autores

Detalhes bibliográficos
Autor(a) principal: CANUTO, Sérgio Daniel Carvalho
Data de Publicação: 2011
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFG
Texto Completo: http://repositorio.bc.ufg.br/tede/handle/tde/514
Resumo: In this work we investigate two classes of solutions for the problem of author name disambiguation.We refer to the approach of the first class as relational based on attributes (RBA) solutions. These approaches use similarity measures based on attributes of the two references being compared or based on the attributes of other references connected to them by authorship. The other class of approaches uses information on semantic relationships among entities in addition to attribute based similarity measures to decide if two references refer to the same author. We refer to the approaches of this class as relational based on entities (RBE) solutions. We present a supervised version of the RBE based on the work introduced by Bhattacharya and Gettor [7]. In the experiments we conducted our RBE solution presented statistically significant gains in efficacy over all the other methods studied. However, the gains are only marginal over the RBA methods experimented. On the other hand, the execution time of both training and testing phases of the RBE methods are notably greater than those of the RBA methods. As far as we know there is no other similar study reported in literature and we consider the results reported here are relevant because they inspire research about enhancing RBA solutions.
id UFG-2_146feea2f2343cdec80c1fbb0fd2b655
oai_identifier_str oai:repositorio.bc.ufg.br:tde/514
network_acronym_str UFG-2
network_name_str Repositório Institucional da UFG
repository_id_str
spelling ROSA, Thierson Coutohttp://lattes.cnpq.br/4414718560764818http://lattes.cnpq.br/5172447060300953CANUTO, Sérgio Daniel Carvalho2014-07-29T14:57:49Z2012-03-062011-08-25CANUTO, Sérgio Daniel Carvalho. A comparative study of supervised approaches for author reference resolution. 2011. 82 f. Dissertação (Mestrado em Ciências Exatas e da Terra - Ciências da Computação) - Universidade Federal de Goiás, Goiânia, 2011.http://repositorio.bc.ufg.br/tede/handle/tde/514In this work we investigate two classes of solutions for the problem of author name disambiguation.We refer to the approach of the first class as relational based on attributes (RBA) solutions. These approaches use similarity measures based on attributes of the two references being compared or based on the attributes of other references connected to them by authorship. The other class of approaches uses information on semantic relationships among entities in addition to attribute based similarity measures to decide if two references refer to the same author. We refer to the approaches of this class as relational based on entities (RBE) solutions. We present a supervised version of the RBE based on the work introduced by Bhattacharya and Gettor [7]. In the experiments we conducted our RBE solution presented statistically significant gains in efficacy over all the other methods studied. However, the gains are only marginal over the RBA methods experimented. On the other hand, the execution time of both training and testing phases of the RBE methods are notably greater than those of the RBA methods. As far as we know there is no other similar study reported in literature and we consider the results reported here are relevant because they inspire research about enhancing RBA solutions.Neste trabalho investigamos duas classes de soluções supervisionadas para o problema de resolver se duas ou mais referências a autores (nomes de autores) correspondem à mesma pessoa. Denominamos abordagens relacionais baseadas em atributo (RBA) as abordagens da primeira classe. Nessas abordagens são utilizadas medidas de similaridades entre atributos textuais de duas referências ou de referências ligadas a elas por coautoria. A outra classe de soluções estudada utiliza informações de relacionamento semântico entre entidades, em adição às similaridades por atributos, para decidir quando duas ou mais referências devem ser consideradas correferentes. Denominamos as abordagens dessa classe de relacionais baseadas em entidades (RBE). Apresentamos uma versão supervisionada de solução RBE que se baseia na proposta apresentada por Bhattacharya e Gettor [7]. Experimentos utilizando duas coleções reais e uma coleção artificial mostram que a solução RBE proposta neste trabalho apresenta ganhos de eficácia estatisticamente comprovados em relação a todos os métodos analisados. Entretanto, o ganho é apenas marginal em relação aos métodos da classe RBA analisados. Por outro lado, o custo computacional tanto de treino quanto de teste das abordagens RBE é consideravelmente maior que o custo dos métodos RBA. Consideramos que esse estudo comparativo é inédito e que as conclusões são importantes, pois incentivam pesquisas para o aprimoramento das soluções RBA.Made available in DSpace on 2014-07-29T14:57:49Z (GMT). No. of bitstreams: 1 Dissertacao Sergio Daniel Carvalho Canuto.pdf: 584503 bytes, checksum: 6a393853a561ed8fec4bd9e4eef56628 (MD5) Previous issue date: 2011-08-25application/pdfporUniversidade Federal de GoiásMestrado em Ciência da ComputaçãoUFGBRCiências Exatas e da Terra - Ciências da ComputaçãoResolução de entidadesDesambiguação de nomes de autoresResolução de entidades; Desambiguação de nomes de autoresEentity resolutionAuthor name disambiguationCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOUm estudo comparativo entre abordagens supervisionadas para a resolução de referências a autoresA comparative study of supervised approaches for author reference resolutioninfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFGinstname:Universidade Federal de Goiás (UFG)instacron:UFGORIGINALDissertacao Sergio Daniel Carvalho Canuto.pdfapplication/pdf584503http://repositorio.bc.ufg.br/tede/bitstreams/cb7c3291-9eaf-47f7-871b-0b5a2484cf8f/download6a393853a561ed8fec4bd9e4eef56628MD51tde/5142014-07-29 11:57:49.783open.accessoai:repositorio.bc.ufg.br:tde/514http://repositorio.bc.ufg.br/tedeRepositório InstitucionalPUBhttp://repositorio.bc.ufg.br/oai/requesttasesdissertacoes.bc@ufg.bropendoar:2014-07-29T14:57:49Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)false
dc.title.por.fl_str_mv Um estudo comparativo entre abordagens supervisionadas para a resolução de referências a autores
dc.title.alternative.eng.fl_str_mv A comparative study of supervised approaches for author reference resolution
title Um estudo comparativo entre abordagens supervisionadas para a resolução de referências a autores
spellingShingle Um estudo comparativo entre abordagens supervisionadas para a resolução de referências a autores
CANUTO, Sérgio Daniel Carvalho
Resolução de entidades
Desambiguação de nomes de autores
Resolução de entidades; Desambiguação de nomes de autores
Eentity resolution
Author name disambiguation
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Um estudo comparativo entre abordagens supervisionadas para a resolução de referências a autores
title_full Um estudo comparativo entre abordagens supervisionadas para a resolução de referências a autores
title_fullStr Um estudo comparativo entre abordagens supervisionadas para a resolução de referências a autores
title_full_unstemmed Um estudo comparativo entre abordagens supervisionadas para a resolução de referências a autores
title_sort Um estudo comparativo entre abordagens supervisionadas para a resolução de referências a autores
author CANUTO, Sérgio Daniel Carvalho
author_facet CANUTO, Sérgio Daniel Carvalho
author_role author
dc.contributor.advisor1.fl_str_mv ROSA, Thierson Couto
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/4414718560764818
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/5172447060300953
dc.contributor.author.fl_str_mv CANUTO, Sérgio Daniel Carvalho
contributor_str_mv ROSA, Thierson Couto
dc.subject.por.fl_str_mv Resolução de entidades
Desambiguação de nomes de autores
Resolução de entidades; Desambiguação de nomes de autores
topic Resolução de entidades
Desambiguação de nomes de autores
Resolução de entidades; Desambiguação de nomes de autores
Eentity resolution
Author name disambiguation
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.eng.fl_str_mv Eentity resolution
Author name disambiguation
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description In this work we investigate two classes of solutions for the problem of author name disambiguation.We refer to the approach of the first class as relational based on attributes (RBA) solutions. These approaches use similarity measures based on attributes of the two references being compared or based on the attributes of other references connected to them by authorship. The other class of approaches uses information on semantic relationships among entities in addition to attribute based similarity measures to decide if two references refer to the same author. We refer to the approaches of this class as relational based on entities (RBE) solutions. We present a supervised version of the RBE based on the work introduced by Bhattacharya and Gettor [7]. In the experiments we conducted our RBE solution presented statistically significant gains in efficacy over all the other methods studied. However, the gains are only marginal over the RBA methods experimented. On the other hand, the execution time of both training and testing phases of the RBE methods are notably greater than those of the RBA methods. As far as we know there is no other similar study reported in literature and we consider the results reported here are relevant because they inspire research about enhancing RBA solutions.
publishDate 2011
dc.date.issued.fl_str_mv 2011-08-25
dc.date.available.fl_str_mv 2012-03-06
dc.date.accessioned.fl_str_mv 2014-07-29T14:57:49Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv CANUTO, Sérgio Daniel Carvalho. A comparative study of supervised approaches for author reference resolution. 2011. 82 f. Dissertação (Mestrado em Ciências Exatas e da Terra - Ciências da Computação) - Universidade Federal de Goiás, Goiânia, 2011.
dc.identifier.uri.fl_str_mv http://repositorio.bc.ufg.br/tede/handle/tde/514
identifier_str_mv CANUTO, Sérgio Daniel Carvalho. A comparative study of supervised approaches for author reference resolution. 2011. 82 f. Dissertação (Mestrado em Ciências Exatas e da Terra - Ciências da Computação) - Universidade Federal de Goiás, Goiânia, 2011.
url http://repositorio.bc.ufg.br/tede/handle/tde/514
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Goiás
dc.publisher.program.fl_str_mv Mestrado em Ciência da Computação
dc.publisher.initials.fl_str_mv UFG
dc.publisher.country.fl_str_mv BR
dc.publisher.department.fl_str_mv Ciências Exatas e da Terra - Ciências da Computação
publisher.none.fl_str_mv Universidade Federal de Goiás
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFG
instname:Universidade Federal de Goiás (UFG)
instacron:UFG
instname_str Universidade Federal de Goiás (UFG)
instacron_str UFG
institution UFG
reponame_str Repositório Institucional da UFG
collection Repositório Institucional da UFG
bitstream.url.fl_str_mv http://repositorio.bc.ufg.br/tede/bitstreams/cb7c3291-9eaf-47f7-871b-0b5a2484cf8f/download
bitstream.checksum.fl_str_mv 6a393853a561ed8fec4bd9e4eef56628
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)
repository.mail.fl_str_mv tasesdissertacoes.bc@ufg.br
_version_ 1798044405881372672