Desambiguação no ANSA: Implementação de Métodos de Desambiguação para uma Interface de Linguagem Natural para Pesquisas Analíticas

Detalhes bibliográficos
Autor(a) principal: Mourão, Cátia Craveiro
Data de Publicação: 2020
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10316/92293
Resumo: Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia
id RCAP_8c0beef82555298875df4a5fe67aeab4
oai_identifier_str oai:estudogeral.uc.pt:10316/92293
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Desambiguação no ANSA: Implementação de Métodos de Desambiguação para uma Interface de Linguagem Natural para Pesquisas AnalíticasDisambiguation in ANSA: Implementation of Disambiguation Methods for a Natural Language Interface for Search AnalyticsProcessamento de Linguagem NaturaInterface de Linguagem Natural para Pesquisas AnalíticasAmbiguidadeDesambiguação ao Nível da PalavraNatural Language ProcessingNatural Language Interface for Search AnalyticsAmbiguityWord Sense DisambiguationDissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e TecnologiaANSA is a natural language interface for search analytics. This is a program that allows a user to do queries in natural language in a database, where the answer is given with the most appropriate visualization. Natural language interfaces for search analytics have a large component of naturallanguage processing, where ambiguity is one of the challenges present in this area. Ambiguity can arise at various stages of natural language processing. However, this work will only focus on ambiguity at the word level. In ANSA, there is no mechanism to deal with ambiguities at the word level yet. Thus, this internship aims to study and implement approaches for disambiguation at the word level for the queries asked in ANSA. These approaches are divided into disambiguation of words with user interaction and withoutuser interaction. In ANSA, disambiguation at the word level implies choosing the bestinterpretation for the word with the available data.The interactive approach allows the user to participate in the process of disambiguation, through visual and interactive elements that allow the user to choose and view theinterpretation chosen for the words of the query. The approaches without user interaction process information about the context of the target word, using machine learning methodsto obtain the most adequate interpretations for a target word written by the user. During this internship, approaches were developed for the two disambiguation components with and without user interaction, which are inspired by existing systems. One of the challenges during the construction of systems for disambiguation without user interactionwas the lack of data since the datasets have to be adapted to ANSA. This was reflected inthe results, where models that need more data got worse results.O ANSA é uma interface de linguagem natural para pesquisas analíticas. Este é um programa que permite fazer pesquisas em linguagem natural para uma base de dados, onde a resposta é dada com a visualização mais adequada. As interfaces de linguagem natural para pesquisas analíticas têm uma grande componente de processamento linguagem natural, onde a ambiguidade é um dos desafios desta área. A ambiguidade pode surgir nas várias etapas do processamento de linguagem natural.No entanto, o presente trabalho será apenas focado na resolução da ambiguidade ao níveldas palavras das perguntas do utilizador. No ANSA, ainda não existe um mecanismo para lidar com as ambiguidades ao nível da palavra. Assim, este estágio tem como objectivo oestudo e implementação de abordagens para a desambiguação ao nível da palavra para asperguntas feitas no ANSA. Estas abordagens são divididas em desambiguação das palavrascom interação do utilizador e sem interação do utilizador. No ANSA, a desambiguação aonível da palavra implica a escolha da melhor interpretação para a palavra com os dados disponíveis. As abordagens com interação permitem ao utilizador participar no processo de desam-biguação, através de elementos visuais e interactivos que permitem ao utilizador escolhere visualizar a interpretação da sua pergunta no ANSA. As abordagens sem interação doutilizador processam informação sobre o contexto da pergunta do utilizador, com recurso a métodos de aprendizagem computacional, e obtém as interpretações mais adequadas para uma palavra alvo escrita pelo utilizador.Durante este estágio foram desenvolvidas abordagens para as duas componentes de desambiguação com e sem interação do utilizador, sendo estas inspiradas por sistemas jáexistentes. Um dos desafios durante a construção dos sistemas para desambiguação sem interação do utilizador, foi a falta de recursos, pois os conjunto de dados a usar tem que ser adaptado ao ANSA. Isto refletiu-se nos resultados, onde os modelos que precisam de mais recursos obtiveram resultados piores.2020-09-152026-09-14T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/10316/92293http://hdl.handle.net/10316/92293TID:202553787porMourão, Cátia Craveiroinfo:eu-repo/semantics/embargoedAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-10-27T10:58:21Zoai:estudogeral.uc.pt:10316/92293Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:11:25.542401Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Desambiguação no ANSA: Implementação de Métodos de Desambiguação para uma Interface de Linguagem Natural para Pesquisas Analíticas
Disambiguation in ANSA: Implementation of Disambiguation Methods for a Natural Language Interface for Search Analytics
title Desambiguação no ANSA: Implementação de Métodos de Desambiguação para uma Interface de Linguagem Natural para Pesquisas Analíticas
spellingShingle Desambiguação no ANSA: Implementação de Métodos de Desambiguação para uma Interface de Linguagem Natural para Pesquisas Analíticas
Mourão, Cátia Craveiro
Processamento de Linguagem Natura
Interface de Linguagem Natural para Pesquisas Analíticas
Ambiguidade
Desambiguação ao Nível da Palavra
Natural Language Processing
Natural Language Interface for Search Analytics
Ambiguity
Word Sense Disambiguation
title_short Desambiguação no ANSA: Implementação de Métodos de Desambiguação para uma Interface de Linguagem Natural para Pesquisas Analíticas
title_full Desambiguação no ANSA: Implementação de Métodos de Desambiguação para uma Interface de Linguagem Natural para Pesquisas Analíticas
title_fullStr Desambiguação no ANSA: Implementação de Métodos de Desambiguação para uma Interface de Linguagem Natural para Pesquisas Analíticas
title_full_unstemmed Desambiguação no ANSA: Implementação de Métodos de Desambiguação para uma Interface de Linguagem Natural para Pesquisas Analíticas
title_sort Desambiguação no ANSA: Implementação de Métodos de Desambiguação para uma Interface de Linguagem Natural para Pesquisas Analíticas
author Mourão, Cátia Craveiro
author_facet Mourão, Cátia Craveiro
author_role author
dc.contributor.author.fl_str_mv Mourão, Cátia Craveiro
dc.subject.por.fl_str_mv Processamento de Linguagem Natura
Interface de Linguagem Natural para Pesquisas Analíticas
Ambiguidade
Desambiguação ao Nível da Palavra
Natural Language Processing
Natural Language Interface for Search Analytics
Ambiguity
Word Sense Disambiguation
topic Processamento de Linguagem Natura
Interface de Linguagem Natural para Pesquisas Analíticas
Ambiguidade
Desambiguação ao Nível da Palavra
Natural Language Processing
Natural Language Interface for Search Analytics
Ambiguity
Word Sense Disambiguation
description Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia
publishDate 2020
dc.date.none.fl_str_mv 2020-09-15
2026-09-14T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10316/92293
http://hdl.handle.net/10316/92293
TID:202553787
url http://hdl.handle.net/10316/92293
identifier_str_mv TID:202553787
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/embargoedAccess
eu_rights_str_mv embargoedAccess
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134011118845952