Desambiguação no ANSA: Implementação de Métodos de Desambiguação para uma Interface de Linguagem Natural para Pesquisas Analíticas
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10316/92293 |
Resumo: | Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia |
id |
RCAP_8c0beef82555298875df4a5fe67aeab4 |
---|---|
oai_identifier_str |
oai:estudogeral.uc.pt:10316/92293 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Desambiguação no ANSA: Implementação de Métodos de Desambiguação para uma Interface de Linguagem Natural para Pesquisas AnalíticasDisambiguation in ANSA: Implementation of Disambiguation Methods for a Natural Language Interface for Search AnalyticsProcessamento de Linguagem NaturaInterface de Linguagem Natural para Pesquisas AnalíticasAmbiguidadeDesambiguação ao Nível da PalavraNatural Language ProcessingNatural Language Interface for Search AnalyticsAmbiguityWord Sense DisambiguationDissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e TecnologiaANSA is a natural language interface for search analytics. This is a program that allows a user to do queries in natural language in a database, where the answer is given with the most appropriate visualization. Natural language interfaces for search analytics have a large component of naturallanguage processing, where ambiguity is one of the challenges present in this area. Ambiguity can arise at various stages of natural language processing. However, this work will only focus on ambiguity at the word level. In ANSA, there is no mechanism to deal with ambiguities at the word level yet. Thus, this internship aims to study and implement approaches for disambiguation at the word level for the queries asked in ANSA. These approaches are divided into disambiguation of words with user interaction and withoutuser interaction. In ANSA, disambiguation at the word level implies choosing the bestinterpretation for the word with the available data.The interactive approach allows the user to participate in the process of disambiguation, through visual and interactive elements that allow the user to choose and view theinterpretation chosen for the words of the query. The approaches without user interaction process information about the context of the target word, using machine learning methodsto obtain the most adequate interpretations for a target word written by the user. During this internship, approaches were developed for the two disambiguation components with and without user interaction, which are inspired by existing systems. One of the challenges during the construction of systems for disambiguation without user interactionwas the lack of data since the datasets have to be adapted to ANSA. This was reflected inthe results, where models that need more data got worse results.O ANSA é uma interface de linguagem natural para pesquisas analíticas. Este é um programa que permite fazer pesquisas em linguagem natural para uma base de dados, onde a resposta é dada com a visualização mais adequada. As interfaces de linguagem natural para pesquisas analíticas têm uma grande componente de processamento linguagem natural, onde a ambiguidade é um dos desafios desta área. A ambiguidade pode surgir nas várias etapas do processamento de linguagem natural.No entanto, o presente trabalho será apenas focado na resolução da ambiguidade ao níveldas palavras das perguntas do utilizador. No ANSA, ainda não existe um mecanismo para lidar com as ambiguidades ao nível da palavra. Assim, este estágio tem como objectivo oestudo e implementação de abordagens para a desambiguação ao nível da palavra para asperguntas feitas no ANSA. Estas abordagens são divididas em desambiguação das palavrascom interação do utilizador e sem interação do utilizador. No ANSA, a desambiguação aonível da palavra implica a escolha da melhor interpretação para a palavra com os dados disponíveis. As abordagens com interação permitem ao utilizador participar no processo de desam-biguação, através de elementos visuais e interactivos que permitem ao utilizador escolhere visualizar a interpretação da sua pergunta no ANSA. As abordagens sem interação doutilizador processam informação sobre o contexto da pergunta do utilizador, com recurso a métodos de aprendizagem computacional, e obtém as interpretações mais adequadas para uma palavra alvo escrita pelo utilizador.Durante este estágio foram desenvolvidas abordagens para as duas componentes de desambiguação com e sem interação do utilizador, sendo estas inspiradas por sistemas jáexistentes. Um dos desafios durante a construção dos sistemas para desambiguação sem interação do utilizador, foi a falta de recursos, pois os conjunto de dados a usar tem que ser adaptado ao ANSA. Isto refletiu-se nos resultados, onde os modelos que precisam de mais recursos obtiveram resultados piores.2020-09-152026-09-14T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/10316/92293http://hdl.handle.net/10316/92293TID:202553787porMourão, Cátia Craveiroinfo:eu-repo/semantics/embargoedAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-10-27T10:58:21Zoai:estudogeral.uc.pt:10316/92293Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:11:25.542401Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Desambiguação no ANSA: Implementação de Métodos de Desambiguação para uma Interface de Linguagem Natural para Pesquisas Analíticas Disambiguation in ANSA: Implementation of Disambiguation Methods for a Natural Language Interface for Search Analytics |
title |
Desambiguação no ANSA: Implementação de Métodos de Desambiguação para uma Interface de Linguagem Natural para Pesquisas Analíticas |
spellingShingle |
Desambiguação no ANSA: Implementação de Métodos de Desambiguação para uma Interface de Linguagem Natural para Pesquisas Analíticas Mourão, Cátia Craveiro Processamento de Linguagem Natura Interface de Linguagem Natural para Pesquisas Analíticas Ambiguidade Desambiguação ao Nível da Palavra Natural Language Processing Natural Language Interface for Search Analytics Ambiguity Word Sense Disambiguation |
title_short |
Desambiguação no ANSA: Implementação de Métodos de Desambiguação para uma Interface de Linguagem Natural para Pesquisas Analíticas |
title_full |
Desambiguação no ANSA: Implementação de Métodos de Desambiguação para uma Interface de Linguagem Natural para Pesquisas Analíticas |
title_fullStr |
Desambiguação no ANSA: Implementação de Métodos de Desambiguação para uma Interface de Linguagem Natural para Pesquisas Analíticas |
title_full_unstemmed |
Desambiguação no ANSA: Implementação de Métodos de Desambiguação para uma Interface de Linguagem Natural para Pesquisas Analíticas |
title_sort |
Desambiguação no ANSA: Implementação de Métodos de Desambiguação para uma Interface de Linguagem Natural para Pesquisas Analíticas |
author |
Mourão, Cátia Craveiro |
author_facet |
Mourão, Cátia Craveiro |
author_role |
author |
dc.contributor.author.fl_str_mv |
Mourão, Cátia Craveiro |
dc.subject.por.fl_str_mv |
Processamento de Linguagem Natura Interface de Linguagem Natural para Pesquisas Analíticas Ambiguidade Desambiguação ao Nível da Palavra Natural Language Processing Natural Language Interface for Search Analytics Ambiguity Word Sense Disambiguation |
topic |
Processamento de Linguagem Natura Interface de Linguagem Natural para Pesquisas Analíticas Ambiguidade Desambiguação ao Nível da Palavra Natural Language Processing Natural Language Interface for Search Analytics Ambiguity Word Sense Disambiguation |
description |
Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia |
publishDate |
2020 |
dc.date.none.fl_str_mv |
2020-09-15 2026-09-14T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10316/92293 http://hdl.handle.net/10316/92293 TID:202553787 |
url |
http://hdl.handle.net/10316/92293 |
identifier_str_mv |
TID:202553787 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/embargoedAccess |
eu_rights_str_mv |
embargoedAccess |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799134011118845952 |