Análise Semântica com base em AMR para o Português
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Outros Autores: | |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | https://doi.org/10.21814/lm.14.1.358 |
Resumo: | A Representação Abstrata de Significado (no inglês, Abstract Meaning Representation ---AMR) é um formalismo semântico projetado para capturar o significado de uma sentença, representando-a como um grafo direcionado acíclico de única raiz com nós rotulados (conceitos) e arestas (relações) entre os nós. Essa representação tem recebido bastante atenção da comunidade de Processamento de Língua Natural, pois muitos autores têm proposto vários modelos de analise semântica para produzir grafos AMR a partir de uma sentença, visando melhorar o entendimento da língua natural. Entretanto, a maioria desses modelos focam no inglês devido a falta de grandes corpora anotados para outras línguas, deixando uma lacuna entre o inglês e outros idiomas. A fim de superar esse problema, neste artigo, é realizada uma análise detalhada de vários analisadores AMR, adaptando três modelos diferentes para o português e propondo melhorias. Além disso, estendeu-se um analisador baseado em regras desenvolvido previamente para o português. Esses modelos foram avaliados sobre um corpus anotado para o português. Por fim, realizou-se uma análise detalhada de erros com o objetivo de identificar os maiores desafios para análise no português e obter insights que possam ajudar pesquisas futuras nesta área. |
id |
RCAP_9e3de5637ae9c0a57d5c6e219c9fe3ce |
---|---|
oai_identifier_str |
oai:linguamatica.com:article/358 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Análise Semântica com base em AMR para o PortuguêsAMR-based Semantic Parsing for the Portuguese LanguageAnálise Semântica com base em AMR para o Portuguêsabstract meaning representationsemantic parsingPortugueserepresentación abstracta del significadoanálisis semánticoPortuguêsrepresentação abstrata de significadoPortuguêsanálise semântica A Representação Abstrata de Significado (no inglês, Abstract Meaning Representation ---AMR) é um formalismo semântico projetado para capturar o significado de uma sentença, representando-a como um grafo direcionado acíclico de única raiz com nós rotulados (conceitos) e arestas (relações) entre os nós. Essa representação tem recebido bastante atenção da comunidade de Processamento de Língua Natural, pois muitos autores têm proposto vários modelos de analise semântica para produzir grafos AMR a partir de uma sentença, visando melhorar o entendimento da língua natural. Entretanto, a maioria desses modelos focam no inglês devido a falta de grandes corpora anotados para outras línguas, deixando uma lacuna entre o inglês e outros idiomas. A fim de superar esse problema, neste artigo, é realizada uma análise detalhada de vários analisadores AMR, adaptando três modelos diferentes para o português e propondo melhorias. Além disso, estendeu-se um analisador baseado em regras desenvolvido previamente para o português. Esses modelos foram avaliados sobre um corpus anotado para o português. Por fim, realizou-se uma análise detalhada de erros com o objetivo de identificar os maiores desafios para análise no português e obter insights que possam ajudar pesquisas futuras nesta área. Abstract Meaning Representation (AMR) is a semantic formalism designed to capture the meaning of a sentence, representing it as a single rooted directed acyclic graph with labeled nodes (concepts) and edges (relations) among them. This representation has received growing attention from the Natural Language Processing community as many authors have proposed several models to produce an AMR graph from a sentence, aiming to improve natural language understanding. However, most of these models have focused on the English language due to the lack of large annotated corpora for other languages, producing a gap between English and other languages. To overcome this issue, in this paper, we carried out a fine-grained analysis of several parsers, adapted three different models to Portuguese, and proposed some improvements. Furthermore, we extended a previous rule-based AMR parser designed for Portuguese. We evaluated these models on a manually annotated corpus in Portuguese. Then, we performed a detailed error analysis to identify the major challenges in Portuguese AMR parsing that we hope will inform future research in this area. A Representação Abstrata de Significado (no inglês, Abstract Meaning Representation ---AMR) é um formalismo semântico projetado para capturar o significado de uma sentença, representando-a como um grafo direcionado acíclico de única raiz com nós rotulados (conceitos) e arestas (relações) entre os nós. Essa representação tem recebido bastante atenção da comunidade de Processamento de Língua Natural, pois muitos autores têm proposto vários modelos de analise semântica para produzir grafos AMR a partir de uma sentença, visando melhorar o entendimento da língua natural. Entretanto, a maioria desses modelos focam no inglês devido a falta de grandes corpora anotados para outras línguas, deixando uma lacuna entre o inglês e outros idiomas. A fim de superar esse problema, neste artigo, é realizada uma análise detalhada de vários analisadores AMR, adaptando três modelos diferentes para o português e propondo melhorias. Além disso, estendeu-se um analisador baseado em regras desenvolvido previamente para o português. Esses modelos foram avaliados sobre um corpus anotado para o português. Por fim, realizou-se uma análise detalhada de erros com o objetivo de identificar os maiores desafios para análise no português e obter insights que possam ajudar pesquisas futuras nesta área.Universidade do Minho e Universidade de Vigo2022-07-02info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttps://doi.org/10.21814/lm.14.1.358https://doi.org/10.21814/lm.14.1.358Linguamática; Vol. 14 No. 1; 33-48Linguamática; Vol. 14 Núm. 1; 33-48Linguamática; v. 14 n. 1; 33-481647-0818reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAPporhttps://linguamatica.com/index.php/linguamatica/article/view/358https://linguamatica.com/index.php/linguamatica/article/view/358/483Direitos de Autor (c) 2022 Rafael Torres Anchiêta, Thiago Alexandre Salgueiro Pardohttp://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessTorres Anchiêta, RafaelSalgueiro Pardo, Thiago Alexandre2023-09-08T13:46:45Zoai:linguamatica.com:article/358Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T20:28:40.703614Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Análise Semântica com base em AMR para o Português AMR-based Semantic Parsing for the Portuguese Language Análise Semântica com base em AMR para o Português |
title |
Análise Semântica com base em AMR para o Português |
spellingShingle |
Análise Semântica com base em AMR para o Português Torres Anchiêta, Rafael abstract meaning representation semantic parsing Portuguese representación abstracta del significado análisis semántico Português representação abstrata de significado Português análise semântica |
title_short |
Análise Semântica com base em AMR para o Português |
title_full |
Análise Semântica com base em AMR para o Português |
title_fullStr |
Análise Semântica com base em AMR para o Português |
title_full_unstemmed |
Análise Semântica com base em AMR para o Português |
title_sort |
Análise Semântica com base em AMR para o Português |
author |
Torres Anchiêta, Rafael |
author_facet |
Torres Anchiêta, Rafael Salgueiro Pardo, Thiago Alexandre |
author_role |
author |
author2 |
Salgueiro Pardo, Thiago Alexandre |
author2_role |
author |
dc.contributor.author.fl_str_mv |
Torres Anchiêta, Rafael Salgueiro Pardo, Thiago Alexandre |
dc.subject.por.fl_str_mv |
abstract meaning representation semantic parsing Portuguese representación abstracta del significado análisis semántico Português representação abstrata de significado Português análise semântica |
topic |
abstract meaning representation semantic parsing Portuguese representación abstracta del significado análisis semántico Português representação abstrata de significado Português análise semântica |
description |
A Representação Abstrata de Significado (no inglês, Abstract Meaning Representation ---AMR) é um formalismo semântico projetado para capturar o significado de uma sentença, representando-a como um grafo direcionado acíclico de única raiz com nós rotulados (conceitos) e arestas (relações) entre os nós. Essa representação tem recebido bastante atenção da comunidade de Processamento de Língua Natural, pois muitos autores têm proposto vários modelos de analise semântica para produzir grafos AMR a partir de uma sentença, visando melhorar o entendimento da língua natural. Entretanto, a maioria desses modelos focam no inglês devido a falta de grandes corpora anotados para outras línguas, deixando uma lacuna entre o inglês e outros idiomas. A fim de superar esse problema, neste artigo, é realizada uma análise detalhada de vários analisadores AMR, adaptando três modelos diferentes para o português e propondo melhorias. Além disso, estendeu-se um analisador baseado em regras desenvolvido previamente para o português. Esses modelos foram avaliados sobre um corpus anotado para o português. Por fim, realizou-se uma análise detalhada de erros com o objetivo de identificar os maiores desafios para análise no português e obter insights que possam ajudar pesquisas futuras nesta área. |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-07-02 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://doi.org/10.21814/lm.14.1.358 https://doi.org/10.21814/lm.14.1.358 |
url |
https://doi.org/10.21814/lm.14.1.358 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://linguamatica.com/index.php/linguamatica/article/view/358 https://linguamatica.com/index.php/linguamatica/article/view/358/483 |
dc.rights.driver.fl_str_mv |
Direitos de Autor (c) 2022 Rafael Torres Anchiêta, Thiago Alexandre Salgueiro Pardo http://creativecommons.org/licenses/by/4.0 info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Direitos de Autor (c) 2022 Rafael Torres Anchiêta, Thiago Alexandre Salgueiro Pardo http://creativecommons.org/licenses/by/4.0 |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade do Minho e Universidade de Vigo |
publisher.none.fl_str_mv |
Universidade do Minho e Universidade de Vigo |
dc.source.none.fl_str_mv |
Linguamática; Vol. 14 No. 1; 33-48 Linguamática; Vol. 14 Núm. 1; 33-48 Linguamática; v. 14 n. 1; 33-48 1647-0818 reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799133554084413440 |