Intent-aware semantic query annotation

Detalhes bibliográficos
Autor(a) principal: Rafael Glater da Cruz Machado
Data de Publicação: 2017
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/30489
Resumo: O entendimento de uma consulta é uma tarefa desafiadora, principalmente devido à ambigüidade inerente da linguagem natural. Uma estratégia comum para melhorar a compreensão das consultas em linguagem natural é anotá-las com informações semânticas extraídas de uma base de conhecimento. No entanto, consultas com diferentes intenções podem se beneficiar de diferentes estratégias de anotação. Por exemplo, algumas consultas podem ser efetivamente anotadas com uma única entidade ou um atributo de entidade, outras podem ser melhor representadas por uma lista de entidades de um único tipo ou por entidades de vários tipos distintos, e outras podem ser simplesmente ambíguas. Nesta dissertação, propomos um framework para aprendizagem de anotações semânticas em consultas de acordo com a intenção existente em cada uma. Experimentos minuciosos em um benchmark publicamente disponível mostram que a abordagem proposta pode melhorar significativamente quando comparadas às abordagens agnósticas baseadas em campos aleatórios de Markov e de aprendizado de ranqueamento. Nossos resultados demonstram ainda, de forma consistente, a eficácia de nossa abordagem para consultas de várias intenções, comprimentos e níveis de dificuldade, bem como sua robustez ao ruído na detecção de intenção.
id UFMG_10bc8515af6b58236862beb24dc4d3f8
oai_identifier_str oai:repositorio.ufmg.br:1843/30489
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Intent-aware semantic query annotationAnotações semânticas em consultas baseada na intenção do usuárioAprendizado de ranqueamentoRecuperação da informaçãoAprendizado de representaçõesBusca semânticaAnotação semântica em consultasAprendizado de ranqueamentoRecuperação de informaçãoO entendimento de uma consulta é uma tarefa desafiadora, principalmente devido à ambigüidade inerente da linguagem natural. Uma estratégia comum para melhorar a compreensão das consultas em linguagem natural é anotá-las com informações semânticas extraídas de uma base de conhecimento. No entanto, consultas com diferentes intenções podem se beneficiar de diferentes estratégias de anotação. Por exemplo, algumas consultas podem ser efetivamente anotadas com uma única entidade ou um atributo de entidade, outras podem ser melhor representadas por uma lista de entidades de um único tipo ou por entidades de vários tipos distintos, e outras podem ser simplesmente ambíguas. Nesta dissertação, propomos um framework para aprendizagem de anotações semânticas em consultas de acordo com a intenção existente em cada uma. Experimentos minuciosos em um benchmark publicamente disponível mostram que a abordagem proposta pode melhorar significativamente quando comparadas às abordagens agnósticas baseadas em campos aleatórios de Markov e de aprendizado de ranqueamento. Nossos resultados demonstram ainda, de forma consistente, a eficácia de nossa abordagem para consultas de várias intenções, comprimentos e níveis de dificuldade, bem como sua robustez ao ruído na detecção de intenção.Query understanding is a challenging task primarily due to the inherent ambiguity of natural language. A common strategy for improving the understanding of natural language queries is to annotate them with semantic information mined from a knowledge base. Nevertheless, queries with different intents may arguably benefit from specialized annotation strategies. For instance, some queries could be effectively annotated with a single entity or an entity attribute, others could be better represented by a list of entities of a single type or by entities of multiple distinct types, and others may be simply ambiguous. In this dissertation, we propose a framework for learning semantic query annotations suitable to the target intent of each individual query. Thorough experiments on a publicly available benchmark show that our proposed approach can significantly improve state-of-the-art intent-agnostic approaches based on Markov random fields and learning to rank. Our results further demonstrate the consistent effectiveness of our approach for queries of various target intents, lengths, and difficulty levels, as well as its robustness to noise in intent detection.Universidade Federal de Minas GeraisBrasilPrograma de Pós-Graduação em Ciência da ComputaçãoUFMGRodrygo Luis Teodoro Santoshttp://lattes.cnpq.br/1162362624079364Nivio ZivianiAltigran Soares da SilvaMarcos André GonçalvesRafael Glater da Cruz Machado2019-10-17T20:20:51Z2019-10-17T20:20:51Z2017-04-07info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/1843/30489enginfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMG2019-11-14T15:32:16Zoai:repositorio.ufmg.br:1843/30489Repositório InstitucionalPUBhttps://repositorio.ufmg.br/oairepositorio@ufmg.bropendoar:2019-11-14T15:32:16Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.none.fl_str_mv Intent-aware semantic query annotation
Anotações semânticas em consultas baseada na intenção do usuário
title Intent-aware semantic query annotation
spellingShingle Intent-aware semantic query annotation
Rafael Glater da Cruz Machado
Aprendizado de ranqueamento
Recuperação da informação
Aprendizado de representações
Busca semântica
Anotação semântica em consultas
Aprendizado de ranqueamento
Recuperação de informação
title_short Intent-aware semantic query annotation
title_full Intent-aware semantic query annotation
title_fullStr Intent-aware semantic query annotation
title_full_unstemmed Intent-aware semantic query annotation
title_sort Intent-aware semantic query annotation
author Rafael Glater da Cruz Machado
author_facet Rafael Glater da Cruz Machado
author_role author
dc.contributor.none.fl_str_mv Rodrygo Luis Teodoro Santos
http://lattes.cnpq.br/1162362624079364
Nivio Ziviani
Altigran Soares da Silva
Marcos André Gonçalves
dc.contributor.author.fl_str_mv Rafael Glater da Cruz Machado
dc.subject.por.fl_str_mv Aprendizado de ranqueamento
Recuperação da informação
Aprendizado de representações
Busca semântica
Anotação semântica em consultas
Aprendizado de ranqueamento
Recuperação de informação
topic Aprendizado de ranqueamento
Recuperação da informação
Aprendizado de representações
Busca semântica
Anotação semântica em consultas
Aprendizado de ranqueamento
Recuperação de informação
description O entendimento de uma consulta é uma tarefa desafiadora, principalmente devido à ambigüidade inerente da linguagem natural. Uma estratégia comum para melhorar a compreensão das consultas em linguagem natural é anotá-las com informações semânticas extraídas de uma base de conhecimento. No entanto, consultas com diferentes intenções podem se beneficiar de diferentes estratégias de anotação. Por exemplo, algumas consultas podem ser efetivamente anotadas com uma única entidade ou um atributo de entidade, outras podem ser melhor representadas por uma lista de entidades de um único tipo ou por entidades de vários tipos distintos, e outras podem ser simplesmente ambíguas. Nesta dissertação, propomos um framework para aprendizagem de anotações semânticas em consultas de acordo com a intenção existente em cada uma. Experimentos minuciosos em um benchmark publicamente disponível mostram que a abordagem proposta pode melhorar significativamente quando comparadas às abordagens agnósticas baseadas em campos aleatórios de Markov e de aprendizado de ranqueamento. Nossos resultados demonstram ainda, de forma consistente, a eficácia de nossa abordagem para consultas de várias intenções, comprimentos e níveis de dificuldade, bem como sua robustez ao ruído na detecção de intenção.
publishDate 2017
dc.date.none.fl_str_mv 2017-04-07
2019-10-17T20:20:51Z
2019-10-17T20:20:51Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/30489
url http://hdl.handle.net/1843/30489
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
Brasil
Programa de Pós-Graduação em Ciência da Computação
UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
Brasil
Programa de Pós-Graduação em Ciência da Computação
UFMG
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv repositorio@ufmg.br
_version_ 1816829887849168896