Análise Semântica com base em AMR para o Português

Detalhes bibliográficos
Autor(a) principal: Torres Anchiêta, Rafael
Data de Publicação: 2022
Outros Autores: Salgueiro Pardo, Thiago Alexandre
Tipo de documento: Artigo
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: https://doi.org/10.21814/lm.14.1.358
Resumo:  A Representação Abstrata de Significado (no inglês, Abstract Meaning Representation ---AMR) é um formalismo semântico projetado para capturar o significado de uma sentença, representando-a como um grafo direcionado acíclico de única raiz com nós rotulados (conceitos) e arestas (relações) entre os nós. Essa representação tem recebido bastante atenção da comunidade de Processamento de Língua Natural, pois muitos autores têm proposto vários modelos de analise semântica para produzir grafos AMR a partir de uma sentença, visando melhorar o entendimento da língua natural. Entretanto, a maioria desses modelos focam no inglês devido a falta de grandes corpora anotados para outras línguas, deixando uma lacuna entre o inglês e outros idiomas. A fim de superar esse problema, neste artigo, é realizada uma análise detalhada de vários analisadores AMR, adaptando três modelos diferentes para o português e propondo melhorias. Além disso, estendeu-se um analisador baseado em regras desenvolvido previamente para o português. Esses modelos foram avaliados sobre um corpus anotado para o português. Por fim, realizou-se uma análise detalhada de erros com o objetivo de identificar os maiores desafios para análise no português e obter insights que possam ajudar pesquisas futuras nesta área.
id RCAP_9e3de5637ae9c0a57d5c6e219c9fe3ce
oai_identifier_str oai:linguamatica.com:article/358
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Análise Semântica com base em AMR para o PortuguêsAMR-based Semantic Parsing for the Portuguese LanguageAnálise Semântica com base em AMR para o Portuguêsabstract meaning representationsemantic parsingPortugueserepresentación abstracta del significadoanálisis semánticoPortuguêsrepresentação abstrata de significadoPortuguêsanálise semântica A Representação Abstrata de Significado (no inglês, Abstract Meaning Representation ---AMR) é um formalismo semântico projetado para capturar o significado de uma sentença, representando-a como um grafo direcionado acíclico de única raiz com nós rotulados (conceitos) e arestas (relações) entre os nós. Essa representação tem recebido bastante atenção da comunidade de Processamento de Língua Natural, pois muitos autores têm proposto vários modelos de analise semântica para produzir grafos AMR a partir de uma sentença, visando melhorar o entendimento da língua natural. Entretanto, a maioria desses modelos focam no inglês devido a falta de grandes corpora anotados para outras línguas, deixando uma lacuna entre o inglês e outros idiomas. A fim de superar esse problema, neste artigo, é realizada uma análise detalhada de vários analisadores AMR, adaptando três modelos diferentes para o português e propondo melhorias. Além disso, estendeu-se um analisador baseado em regras desenvolvido previamente para o português. Esses modelos foram avaliados sobre um corpus anotado para o português. Por fim, realizou-se uma análise detalhada de erros com o objetivo de identificar os maiores desafios para análise no português e obter insights que possam ajudar pesquisas futuras nesta área. Abstract Meaning Representation (AMR) is a semantic formalism designed to capture the meaning of a sentence, representing it as a single rooted directed acyclic graph with labeled nodes (concepts) and edges (relations) among them. This representation has received growing attention from the Natural Language Processing community as many authors have proposed several models to produce an AMR graph from a sentence, aiming to improve natural language understanding. However, most of these models have focused on the English language due to the lack of large annotated corpora for other languages, producing a gap between English and other languages. To overcome this issue, in this paper, we carried out a fine-grained analysis of several parsers, adapted three different models to Portuguese, and proposed some improvements. Furthermore, we extended a previous rule-based AMR parser designed for Portuguese. We evaluated these models on a manually annotated corpus in Portuguese. Then, we performed a detailed error analysis to identify the major challenges in Portuguese AMR parsing that we hope will inform future research in this area. A Representação Abstrata de Significado (no inglês, Abstract Meaning Representation ---AMR) é um formalismo semântico projetado para capturar o significado de uma sentença, representando-a como um grafo direcionado acíclico de única raiz com nós rotulados (conceitos) e arestas (relações) entre os nós. Essa representação tem recebido bastante atenção da comunidade de Processamento de Língua Natural, pois muitos autores têm proposto vários modelos de analise semântica para produzir grafos AMR a partir de uma sentença, visando melhorar o entendimento da língua natural. Entretanto, a maioria desses modelos focam no inglês devido a falta de grandes corpora anotados para outras línguas, deixando uma lacuna entre o inglês e outros idiomas. A fim de superar esse problema, neste artigo, é realizada uma análise detalhada de vários analisadores AMR, adaptando três modelos diferentes para o português e propondo melhorias. Além disso, estendeu-se um analisador baseado em regras desenvolvido previamente para o português. Esses modelos foram avaliados sobre um corpus anotado para o português. Por fim, realizou-se uma análise detalhada de erros com o objetivo de identificar os maiores desafios para análise no português e obter insights que possam ajudar pesquisas futuras nesta área.Universidade do Minho e Universidade de Vigo2022-07-02info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttps://doi.org/10.21814/lm.14.1.358https://doi.org/10.21814/lm.14.1.358Linguamática; Vol. 14 No. 1; 33-48Linguamática; Vol. 14 Núm. 1; 33-48Linguamática; v. 14 n. 1; 33-481647-0818reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAPporhttps://linguamatica.com/index.php/linguamatica/article/view/358https://linguamatica.com/index.php/linguamatica/article/view/358/483Direitos de Autor (c) 2022 Rafael Torres Anchiêta, Thiago Alexandre Salgueiro Pardohttp://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessTorres Anchiêta, RafaelSalgueiro Pardo, Thiago Alexandre2023-09-08T13:46:45Zoai:linguamatica.com:article/358Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T20:28:40.703614Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Análise Semântica com base em AMR para o Português
AMR-based Semantic Parsing for the Portuguese Language
Análise Semântica com base em AMR para o Português
title Análise Semântica com base em AMR para o Português
spellingShingle Análise Semântica com base em AMR para o Português
Torres Anchiêta, Rafael
abstract meaning representation
semantic parsing
Portuguese
representación abstracta del significado
análisis semántico
Português
representação abstrata de significado
Português
análise semântica
title_short Análise Semântica com base em AMR para o Português
title_full Análise Semântica com base em AMR para o Português
title_fullStr Análise Semântica com base em AMR para o Português
title_full_unstemmed Análise Semântica com base em AMR para o Português
title_sort Análise Semântica com base em AMR para o Português
author Torres Anchiêta, Rafael
author_facet Torres Anchiêta, Rafael
Salgueiro Pardo, Thiago Alexandre
author_role author
author2 Salgueiro Pardo, Thiago Alexandre
author2_role author
dc.contributor.author.fl_str_mv Torres Anchiêta, Rafael
Salgueiro Pardo, Thiago Alexandre
dc.subject.por.fl_str_mv abstract meaning representation
semantic parsing
Portuguese
representación abstracta del significado
análisis semántico
Português
representação abstrata de significado
Português
análise semântica
topic abstract meaning representation
semantic parsing
Portuguese
representación abstracta del significado
análisis semántico
Português
representação abstrata de significado
Português
análise semântica
description  A Representação Abstrata de Significado (no inglês, Abstract Meaning Representation ---AMR) é um formalismo semântico projetado para capturar o significado de uma sentença, representando-a como um grafo direcionado acíclico de única raiz com nós rotulados (conceitos) e arestas (relações) entre os nós. Essa representação tem recebido bastante atenção da comunidade de Processamento de Língua Natural, pois muitos autores têm proposto vários modelos de analise semântica para produzir grafos AMR a partir de uma sentença, visando melhorar o entendimento da língua natural. Entretanto, a maioria desses modelos focam no inglês devido a falta de grandes corpora anotados para outras línguas, deixando uma lacuna entre o inglês e outros idiomas. A fim de superar esse problema, neste artigo, é realizada uma análise detalhada de vários analisadores AMR, adaptando três modelos diferentes para o português e propondo melhorias. Além disso, estendeu-se um analisador baseado em regras desenvolvido previamente para o português. Esses modelos foram avaliados sobre um corpus anotado para o português. Por fim, realizou-se uma análise detalhada de erros com o objetivo de identificar os maiores desafios para análise no português e obter insights que possam ajudar pesquisas futuras nesta área.
publishDate 2022
dc.date.none.fl_str_mv 2022-07-02
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://doi.org/10.21814/lm.14.1.358
https://doi.org/10.21814/lm.14.1.358
url https://doi.org/10.21814/lm.14.1.358
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://linguamatica.com/index.php/linguamatica/article/view/358
https://linguamatica.com/index.php/linguamatica/article/view/358/483
dc.rights.driver.fl_str_mv Direitos de Autor (c) 2022 Rafael Torres Anchiêta, Thiago Alexandre Salgueiro Pardo
http://creativecommons.org/licenses/by/4.0
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Direitos de Autor (c) 2022 Rafael Torres Anchiêta, Thiago Alexandre Salgueiro Pardo
http://creativecommons.org/licenses/by/4.0
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade do Minho e Universidade de Vigo
publisher.none.fl_str_mv Universidade do Minho e Universidade de Vigo
dc.source.none.fl_str_mv Linguamática; Vol. 14 No. 1; 33-48
Linguamática; Vol. 14 Núm. 1; 33-48
Linguamática; v. 14 n. 1; 33-48
1647-0818
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799133554084413440