PFN-PT: a Framenet annotator for Portuguese

Detalhes bibliográficos
Autor(a) principal: Bick, Eckhard
Data de Publicação: 2022
Tipo de documento: Artigo
Idioma: eng
por
Título da fonte: Domínios de Lingu@gem
Texto Completo: https://seer.ufu.br/index.php/dominiosdelinguagem/article/view/63821
Resumo: This article presents PFN-PT, a robust system for the automatic semantic annotation of Portuguese, consisting of a new, parsing-oriented framenet and a rule-based frame- and role-tagger. The framenet provides almost 13,000 valency frames covering 7,300 verb lemmas with 10,700 senses. Frame and role tagging is achieved by iterated matching of syntactic structures and semantic noun types with slot-filler conditions in the framenet. We discuss design principles and present frame and role statistics. In an evaluation run on news data, the system achieved an overall F-score of 92.2% for frame senses.
id UFU-12_4ba4163b48f3494daa235d23307a28ae
oai_identifier_str oai:ojs.www.seer.ufu.br:article/63821
network_acronym_str UFU-12
network_name_str Domínios de Lingu@gem
repository_id_str
spelling PFN-PT: a Framenet annotator for PortugueseAnotação semântica automática: um novo Framenet para o português FrameNet PortuguêsEtiquetagem semânticaPapéis semânticosGramática de restrições (CG)PALAVRASPortuguese Framenet (PFN-PT)Semantic Role Labeling (SRL)Semantic ParsingConstraint Grammar (CG)PALAVRAS parserThis article presents PFN-PT, a robust system for the automatic semantic annotation of Portuguese, consisting of a new, parsing-oriented framenet and a rule-based frame- and role-tagger. The framenet provides almost 13,000 valency frames covering 7,300 verb lemmas with 10,700 senses. Frame and role tagging is achieved by iterated matching of syntactic structures and semantic noun types with slot-filler conditions in the framenet. We discuss design principles and present frame and role statistics. In an evaluation run on news data, the system achieved an overall F-score of 92.2% for frame senses.Este artigo apresenta o PFN-PT, um sistema robusto para a anotação semântica automática de Português, consistindo numa nova framenet com foco em parsing, e um tagger para frames e papéis semânticos baseado em regras. A framenet contêm cerca de 13.000 padrões sintáticos cobrindo 7.300 lemas verbais com 10.700 sentidos. A etiquetagem é realizada por meio de um alinhamento iterativo de estruturas sintáticas e classe semântica de substantivos com as condições listadas no framenet para argumentos sintáticos. Discutimos princípios de desenho e apresentamos estatísticas de distribuição de categorias. Numa avaliação realizada com base em textos jornalísticos, o sistema alcançou 92,2% sentidos/frames corretos para verbos.PP/UFU2022-09-12info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdftext/xmlhttps://seer.ufu.br/index.php/dominiosdelinguagem/article/view/6382110.14393/DL52-v16n4a2022-7Domínios de Lingu@gem; Vol. 16 No. 4 (2022): The computational treatment of Brazilian Portuguese; 1401-1435Domínios de Lingu@gem; Vol. 16 Núm. 4 (2022): El tratamiento computacional del portugués brasileño; 1401-1435Domínios de Lingu@gem; v. 16 n. 4 (2022): Tratamento Computacional do Português Brasileiro; 1401-14351980-5799reponame:Domínios de Lingu@geminstname:Universidade Federal de Uberlândia (UFU)instacron:UFUengporhttps://seer.ufu.br/index.php/dominiosdelinguagem/article/view/63821/34630https://seer.ufu.br/index.php/dominiosdelinguagem/article/view/63821/35232Copyright (c) 2022 Eckhard Bickhttp://creativecommons.org/licenses/by-nc-nd/4.0info:eu-repo/semantics/openAccessBick, Eckhard2022-12-09T17:47:58Zoai:ojs.www.seer.ufu.br:article/63821Revistahttps://seer.ufu.br/index.php/dominiosdelinguagemPUBhttps://seer.ufu.br/index.php/dominiosdelinguagem/oairevistadominios@ileel.ufu.br||1980-57991980-5799opendoar:2022-12-09T17:47:58Domínios de Lingu@gem - Universidade Federal de Uberlândia (UFU)false
dc.title.none.fl_str_mv PFN-PT: a Framenet annotator for Portuguese
Anotação semântica automática: um novo Framenet para o português
title PFN-PT: a Framenet annotator for Portuguese
spellingShingle PFN-PT: a Framenet annotator for Portuguese
Bick, Eckhard
FrameNet Português
Etiquetagem semântica
Papéis semânticos
Gramática de restrições (CG)
PALAVRAS
Portuguese Framenet (PFN-PT)
Semantic Role Labeling (SRL)
Semantic Parsing
Constraint Grammar (CG)
PALAVRAS parser
title_short PFN-PT: a Framenet annotator for Portuguese
title_full PFN-PT: a Framenet annotator for Portuguese
title_fullStr PFN-PT: a Framenet annotator for Portuguese
title_full_unstemmed PFN-PT: a Framenet annotator for Portuguese
title_sort PFN-PT: a Framenet annotator for Portuguese
author Bick, Eckhard
author_facet Bick, Eckhard
author_role author
dc.contributor.author.fl_str_mv Bick, Eckhard
dc.subject.por.fl_str_mv FrameNet Português
Etiquetagem semântica
Papéis semânticos
Gramática de restrições (CG)
PALAVRAS
Portuguese Framenet (PFN-PT)
Semantic Role Labeling (SRL)
Semantic Parsing
Constraint Grammar (CG)
PALAVRAS parser
topic FrameNet Português
Etiquetagem semântica
Papéis semânticos
Gramática de restrições (CG)
PALAVRAS
Portuguese Framenet (PFN-PT)
Semantic Role Labeling (SRL)
Semantic Parsing
Constraint Grammar (CG)
PALAVRAS parser
description This article presents PFN-PT, a robust system for the automatic semantic annotation of Portuguese, consisting of a new, parsing-oriented framenet and a rule-based frame- and role-tagger. The framenet provides almost 13,000 valency frames covering 7,300 verb lemmas with 10,700 senses. Frame and role tagging is achieved by iterated matching of syntactic structures and semantic noun types with slot-filler conditions in the framenet. We discuss design principles and present frame and role statistics. In an evaluation run on news data, the system achieved an overall F-score of 92.2% for frame senses.
publishDate 2022
dc.date.none.fl_str_mv 2022-09-12
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://seer.ufu.br/index.php/dominiosdelinguagem/article/view/63821
10.14393/DL52-v16n4a2022-7
url https://seer.ufu.br/index.php/dominiosdelinguagem/article/view/63821
identifier_str_mv 10.14393/DL52-v16n4a2022-7
dc.language.iso.fl_str_mv eng
por
language eng
por
dc.relation.none.fl_str_mv https://seer.ufu.br/index.php/dominiosdelinguagem/article/view/63821/34630
https://seer.ufu.br/index.php/dominiosdelinguagem/article/view/63821/35232
dc.rights.driver.fl_str_mv Copyright (c) 2022 Eckhard Bick
http://creativecommons.org/licenses/by-nc-nd/4.0
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Copyright (c) 2022 Eckhard Bick
http://creativecommons.org/licenses/by-nc-nd/4.0
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
text/xml
dc.publisher.none.fl_str_mv PP/UFU
publisher.none.fl_str_mv PP/UFU
dc.source.none.fl_str_mv Domínios de Lingu@gem; Vol. 16 No. 4 (2022): The computational treatment of Brazilian Portuguese; 1401-1435
Domínios de Lingu@gem; Vol. 16 Núm. 4 (2022): El tratamiento computacional del portugués brasileño; 1401-1435
Domínios de Lingu@gem; v. 16 n. 4 (2022): Tratamento Computacional do Português Brasileiro; 1401-1435
1980-5799
reponame:Domínios de Lingu@gem
instname:Universidade Federal de Uberlândia (UFU)
instacron:UFU
instname_str Universidade Federal de Uberlândia (UFU)
instacron_str UFU
institution UFU
reponame_str Domínios de Lingu@gem
collection Domínios de Lingu@gem
repository.name.fl_str_mv Domínios de Lingu@gem - Universidade Federal de Uberlândia (UFU)
repository.mail.fl_str_mv revistadominios@ileel.ufu.br||
_version_ 1797067717708087296