PFN-PT: a Framenet annotator for Portuguese
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Artigo |
Idioma: | eng por |
Título da fonte: | Domínios de Lingu@gem |
Texto Completo: | https://seer.ufu.br/index.php/dominiosdelinguagem/article/view/63821 |
Resumo: | This article presents PFN-PT, a robust system for the automatic semantic annotation of Portuguese, consisting of a new, parsing-oriented framenet and a rule-based frame- and role-tagger. The framenet provides almost 13,000 valency frames covering 7,300 verb lemmas with 10,700 senses. Frame and role tagging is achieved by iterated matching of syntactic structures and semantic noun types with slot-filler conditions in the framenet. We discuss design principles and present frame and role statistics. In an evaluation run on news data, the system achieved an overall F-score of 92.2% for frame senses. |
id |
UFU-12_4ba4163b48f3494daa235d23307a28ae |
---|---|
oai_identifier_str |
oai:ojs.www.seer.ufu.br:article/63821 |
network_acronym_str |
UFU-12 |
network_name_str |
Domínios de Lingu@gem |
repository_id_str |
|
spelling |
PFN-PT: a Framenet annotator for PortugueseAnotação semântica automática: um novo Framenet para o português FrameNet PortuguêsEtiquetagem semânticaPapéis semânticosGramática de restrições (CG)PALAVRASPortuguese Framenet (PFN-PT)Semantic Role Labeling (SRL)Semantic ParsingConstraint Grammar (CG)PALAVRAS parserThis article presents PFN-PT, a robust system for the automatic semantic annotation of Portuguese, consisting of a new, parsing-oriented framenet and a rule-based frame- and role-tagger. The framenet provides almost 13,000 valency frames covering 7,300 verb lemmas with 10,700 senses. Frame and role tagging is achieved by iterated matching of syntactic structures and semantic noun types with slot-filler conditions in the framenet. We discuss design principles and present frame and role statistics. In an evaluation run on news data, the system achieved an overall F-score of 92.2% for frame senses.Este artigo apresenta o PFN-PT, um sistema robusto para a anotação semântica automática de Português, consistindo numa nova framenet com foco em parsing, e um tagger para frames e papéis semânticos baseado em regras. A framenet contêm cerca de 13.000 padrões sintáticos cobrindo 7.300 lemas verbais com 10.700 sentidos. A etiquetagem é realizada por meio de um alinhamento iterativo de estruturas sintáticas e classe semântica de substantivos com as condições listadas no framenet para argumentos sintáticos. Discutimos princípios de desenho e apresentamos estatísticas de distribuição de categorias. Numa avaliação realizada com base em textos jornalísticos, o sistema alcançou 92,2% sentidos/frames corretos para verbos.PP/UFU2022-09-12info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdftext/xmlhttps://seer.ufu.br/index.php/dominiosdelinguagem/article/view/6382110.14393/DL52-v16n4a2022-7Domínios de Lingu@gem; Vol. 16 No. 4 (2022): The computational treatment of Brazilian Portuguese; 1401-1435Domínios de Lingu@gem; Vol. 16 Núm. 4 (2022): El tratamiento computacional del portugués brasileño; 1401-1435Domínios de Lingu@gem; v. 16 n. 4 (2022): Tratamento Computacional do Português Brasileiro; 1401-14351980-5799reponame:Domínios de Lingu@geminstname:Universidade Federal de Uberlândia (UFU)instacron:UFUengporhttps://seer.ufu.br/index.php/dominiosdelinguagem/article/view/63821/34630https://seer.ufu.br/index.php/dominiosdelinguagem/article/view/63821/35232Copyright (c) 2022 Eckhard Bickhttp://creativecommons.org/licenses/by-nc-nd/4.0info:eu-repo/semantics/openAccessBick, Eckhard2022-12-09T17:47:58Zoai:ojs.www.seer.ufu.br:article/63821Revistahttps://seer.ufu.br/index.php/dominiosdelinguagemPUBhttps://seer.ufu.br/index.php/dominiosdelinguagem/oairevistadominios@ileel.ufu.br||1980-57991980-5799opendoar:2022-12-09T17:47:58Domínios de Lingu@gem - Universidade Federal de Uberlândia (UFU)false |
dc.title.none.fl_str_mv |
PFN-PT: a Framenet annotator for Portuguese Anotação semântica automática: um novo Framenet para o português |
title |
PFN-PT: a Framenet annotator for Portuguese |
spellingShingle |
PFN-PT: a Framenet annotator for Portuguese Bick, Eckhard FrameNet Português Etiquetagem semântica Papéis semânticos Gramática de restrições (CG) PALAVRAS Portuguese Framenet (PFN-PT) Semantic Role Labeling (SRL) Semantic Parsing Constraint Grammar (CG) PALAVRAS parser |
title_short |
PFN-PT: a Framenet annotator for Portuguese |
title_full |
PFN-PT: a Framenet annotator for Portuguese |
title_fullStr |
PFN-PT: a Framenet annotator for Portuguese |
title_full_unstemmed |
PFN-PT: a Framenet annotator for Portuguese |
title_sort |
PFN-PT: a Framenet annotator for Portuguese |
author |
Bick, Eckhard |
author_facet |
Bick, Eckhard |
author_role |
author |
dc.contributor.author.fl_str_mv |
Bick, Eckhard |
dc.subject.por.fl_str_mv |
FrameNet Português Etiquetagem semântica Papéis semânticos Gramática de restrições (CG) PALAVRAS Portuguese Framenet (PFN-PT) Semantic Role Labeling (SRL) Semantic Parsing Constraint Grammar (CG) PALAVRAS parser |
topic |
FrameNet Português Etiquetagem semântica Papéis semânticos Gramática de restrições (CG) PALAVRAS Portuguese Framenet (PFN-PT) Semantic Role Labeling (SRL) Semantic Parsing Constraint Grammar (CG) PALAVRAS parser |
description |
This article presents PFN-PT, a robust system for the automatic semantic annotation of Portuguese, consisting of a new, parsing-oriented framenet and a rule-based frame- and role-tagger. The framenet provides almost 13,000 valency frames covering 7,300 verb lemmas with 10,700 senses. Frame and role tagging is achieved by iterated matching of syntactic structures and semantic noun types with slot-filler conditions in the framenet. We discuss design principles and present frame and role statistics. In an evaluation run on news data, the system achieved an overall F-score of 92.2% for frame senses. |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-09-12 |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://seer.ufu.br/index.php/dominiosdelinguagem/article/view/63821 10.14393/DL52-v16n4a2022-7 |
url |
https://seer.ufu.br/index.php/dominiosdelinguagem/article/view/63821 |
identifier_str_mv |
10.14393/DL52-v16n4a2022-7 |
dc.language.iso.fl_str_mv |
eng por |
language |
eng por |
dc.relation.none.fl_str_mv |
https://seer.ufu.br/index.php/dominiosdelinguagem/article/view/63821/34630 https://seer.ufu.br/index.php/dominiosdelinguagem/article/view/63821/35232 |
dc.rights.driver.fl_str_mv |
Copyright (c) 2022 Eckhard Bick http://creativecommons.org/licenses/by-nc-nd/4.0 info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Copyright (c) 2022 Eckhard Bick http://creativecommons.org/licenses/by-nc-nd/4.0 |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf text/xml |
dc.publisher.none.fl_str_mv |
PP/UFU |
publisher.none.fl_str_mv |
PP/UFU |
dc.source.none.fl_str_mv |
Domínios de Lingu@gem; Vol. 16 No. 4 (2022): The computational treatment of Brazilian Portuguese; 1401-1435 Domínios de Lingu@gem; Vol. 16 Núm. 4 (2022): El tratamiento computacional del portugués brasileño; 1401-1435 Domínios de Lingu@gem; v. 16 n. 4 (2022): Tratamento Computacional do Português Brasileiro; 1401-1435 1980-5799 reponame:Domínios de Lingu@gem instname:Universidade Federal de Uberlândia (UFU) instacron:UFU |
instname_str |
Universidade Federal de Uberlândia (UFU) |
instacron_str |
UFU |
institution |
UFU |
reponame_str |
Domínios de Lingu@gem |
collection |
Domínios de Lingu@gem |
repository.name.fl_str_mv |
Domínios de Lingu@gem - Universidade Federal de Uberlândia (UFU) |
repository.mail.fl_str_mv |
revistadominios@ileel.ufu.br|| |
_version_ |
1797067717708087296 |