Adaptação Lexical Automática em Textos Informativos do Português Brasileiro para o Ensino Fundamental
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Outros Autores: | |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | https://doi.org/10.21814/lm.12.2.323 |
Resumo: | A Adaptação Textual é uma grande área de pesquisa do Processamento de Línguas Naturais (PLN), bastante conhecida como prática educacional, e possui duas grandes abordagens: a Simplificação e a Elaboração Textual. Não há muitos trabalhos na literatura de PLN que tratam todas as fases da Adaptação Lexical para implementação de sistemas. Vários trabalhos tratam independentemente as tarefas de Simplificação e Elaboração Lexicais, trazendo contribuições parciais, já que cada uma das tarefas possuem seus próprios desafios. Este trabalho propôs um pipeline para a Adaptação Lexical e apresenta contribuições para três das quatro etapas do pipeline, sendo elas: (i) proposta e avaliação de métodos para a tarefa de Identificação de Palavras Complexas; (ii) análise de córpus para levantamento de padrões de Elaboração Lexical do tipo definição; (iii) disponibilização do córpus SIMPLEX-PB 3.0, contendo em sua nova versão definições curtas extraídas de dicionário que foram revisadas manualmente, anotações de termos técnicos extraídas de dicionário, e métricas linguísticas de complexidade lexical; e (iv) proposta e avaliação de métodos para Simplificação Lexical, estabelecendo um novo SOTA para a tarefa aplicada no Português Brasileiro. |
id |
RCAP_107cdc1e7d48f332663fad09b51c087a |
---|---|
oai_identifier_str |
oai:linguamatica.com:article/323 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Adaptação Lexical Automática em Textos Informativos do Português Brasileiro para o Ensino FundamentalAutomatic Lexical Adaptation in Brazilian Portuguese Informative Texts for Elementary EducationAdaptação Lexical Automática em Textos Informativos do Português Brasileiro para o Ensino Fundamentaltext adaptationlexical simplificationlexical elaborationreading aid for childrenadaptação textualsimplificação lexicalelaboração lexicalauxílio à leitura de criançasA Adaptação Textual é uma grande área de pesquisa do Processamento de Línguas Naturais (PLN), bastante conhecida como prática educacional, e possui duas grandes abordagens: a Simplificação e a Elaboração Textual. Não há muitos trabalhos na literatura de PLN que tratam todas as fases da Adaptação Lexical para implementação de sistemas. Vários trabalhos tratam independentemente as tarefas de Simplificação e Elaboração Lexicais, trazendo contribuições parciais, já que cada uma das tarefas possuem seus próprios desafios. Este trabalho propôs um pipeline para a Adaptação Lexical e apresenta contribuições para três das quatro etapas do pipeline, sendo elas: (i) proposta e avaliação de métodos para a tarefa de Identificação de Palavras Complexas; (ii) análise de córpus para levantamento de padrões de Elaboração Lexical do tipo definição; (iii) disponibilização do córpus SIMPLEX-PB 3.0, contendo em sua nova versão definições curtas extraídas de dicionário que foram revisadas manualmente, anotações de termos técnicos extraídas de dicionário, e métricas linguísticas de complexidade lexical; e (iv) proposta e avaliação de métodos para Simplificação Lexical, estabelecendo um novo SOTA para a tarefa aplicada no Português Brasileiro.Text Adaptation is a large Natural Language Processing (NLP) research area, well known as educational practice and has two main approaches: Simplification and Text Elaboration. There is not much work in the NLP literature that addresses all phases of Lexical Adaptation for systems implementation. Several works independently deal with the Lexical Simplification and Elaboration tasks, bringing partial contributions, since each task has its own challenges. This work proposed a pipeline for Lexical Adaptation and presents contributions in three of the four stages of the Lexical Adaptation pipeline: (i) proposal and evaluation of methods for the Complex Word Identification task; (ii) corpus analysis to survey Lexical Elaboration word definition standards; (iii) the SIMPLEX-PB 3.0 corpus, containing in its new version short definitions extracted from dictionaries that were manually revised, annotations of technical terms extracted from a dictionary, and linguistic metrics of lexical complexity; and (iv) proposal and evaluation of methods for Lexical Simplification, establishing a new SOTA for the task applied in Brazilian Portuguese.A Adaptação Textual é uma grande área de pesquisa do Processamento de Línguas Naturais (PLN), bastante conhecida como prática educacional, e possui duas grandes abordagens: a Simplificação e a Elaboração Textual. Não há muitos trabalhos na literatura de PLN que tratam todas as fases da Adaptação Lexical para implementação de sistemas. Vários trabalhos tratam independentemente as tarefas de Simplificação e Elaboração Lexicais, trazendo contribuições parciais, já que cada uma das tarefas possuem seus próprios desafios. Este trabalho propôs um pipeline para a Adaptação Lexical e apresenta contribuições para três das quatro etapas do pipeline, sendo elas: (i) proposta e avaliação de métodos para a tarefa de Identificação de Palavras Complexas; (ii) análise de córpus para levantamento de padrões de Elaboração Lexical do tipo definição; (iii) disponibilização do córpus SIMPLEX-PB 3.0, contendo em sua nova versão definições curtas extraídas de dicionário que foram revisadas manualmente, anotações de termos técnicos extraídas de dicionário, e métricas linguísticas de complexidade lexical; e (iv) proposta e avaliação de métodos para Simplificação Lexical, estabelecendo um novo SOTA para a tarefa aplicada no Português Brasileiro.Universidade do Minho e Universidade de Vigo2020-12-31info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttps://doi.org/10.21814/lm.12.2.323https://doi.org/10.21814/lm.12.2.323Linguamática; Vol. 12 No. 2; 3-27Linguamática; Vol. 12 Núm. 2; 3-27Linguamática; v. 12 n. 2; 3-271647-0818reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAPporhttps://linguamatica.com/index.php/linguamatica/article/view/323https://linguamatica.com/index.php/linguamatica/article/view/323/469Direitos de Autor (c) 2020 Nathan Siegle Hartmann, Sandra Maria Aluísiohttp://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessHartmann, Nathan SiegleAluísio, Sandra Maria2023-09-08T13:46:42Zoai:linguamatica.com:article/323Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T20:28:40.022201Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Adaptação Lexical Automática em Textos Informativos do Português Brasileiro para o Ensino Fundamental Automatic Lexical Adaptation in Brazilian Portuguese Informative Texts for Elementary Education Adaptação Lexical Automática em Textos Informativos do Português Brasileiro para o Ensino Fundamental |
title |
Adaptação Lexical Automática em Textos Informativos do Português Brasileiro para o Ensino Fundamental |
spellingShingle |
Adaptação Lexical Automática em Textos Informativos do Português Brasileiro para o Ensino Fundamental Hartmann, Nathan Siegle text adaptation lexical simplification lexical elaboration reading aid for children adaptação textual simplificação lexical elaboração lexical auxílio à leitura de crianças |
title_short |
Adaptação Lexical Automática em Textos Informativos do Português Brasileiro para o Ensino Fundamental |
title_full |
Adaptação Lexical Automática em Textos Informativos do Português Brasileiro para o Ensino Fundamental |
title_fullStr |
Adaptação Lexical Automática em Textos Informativos do Português Brasileiro para o Ensino Fundamental |
title_full_unstemmed |
Adaptação Lexical Automática em Textos Informativos do Português Brasileiro para o Ensino Fundamental |
title_sort |
Adaptação Lexical Automática em Textos Informativos do Português Brasileiro para o Ensino Fundamental |
author |
Hartmann, Nathan Siegle |
author_facet |
Hartmann, Nathan Siegle Aluísio, Sandra Maria |
author_role |
author |
author2 |
Aluísio, Sandra Maria |
author2_role |
author |
dc.contributor.author.fl_str_mv |
Hartmann, Nathan Siegle Aluísio, Sandra Maria |
dc.subject.por.fl_str_mv |
text adaptation lexical simplification lexical elaboration reading aid for children adaptação textual simplificação lexical elaboração lexical auxílio à leitura de crianças |
topic |
text adaptation lexical simplification lexical elaboration reading aid for children adaptação textual simplificação lexical elaboração lexical auxílio à leitura de crianças |
description |
A Adaptação Textual é uma grande área de pesquisa do Processamento de Línguas Naturais (PLN), bastante conhecida como prática educacional, e possui duas grandes abordagens: a Simplificação e a Elaboração Textual. Não há muitos trabalhos na literatura de PLN que tratam todas as fases da Adaptação Lexical para implementação de sistemas. Vários trabalhos tratam independentemente as tarefas de Simplificação e Elaboração Lexicais, trazendo contribuições parciais, já que cada uma das tarefas possuem seus próprios desafios. Este trabalho propôs um pipeline para a Adaptação Lexical e apresenta contribuições para três das quatro etapas do pipeline, sendo elas: (i) proposta e avaliação de métodos para a tarefa de Identificação de Palavras Complexas; (ii) análise de córpus para levantamento de padrões de Elaboração Lexical do tipo definição; (iii) disponibilização do córpus SIMPLEX-PB 3.0, contendo em sua nova versão definições curtas extraídas de dicionário que foram revisadas manualmente, anotações de termos técnicos extraídas de dicionário, e métricas linguísticas de complexidade lexical; e (iv) proposta e avaliação de métodos para Simplificação Lexical, estabelecendo um novo SOTA para a tarefa aplicada no Português Brasileiro. |
publishDate |
2020 |
dc.date.none.fl_str_mv |
2020-12-31 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://doi.org/10.21814/lm.12.2.323 https://doi.org/10.21814/lm.12.2.323 |
url |
https://doi.org/10.21814/lm.12.2.323 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://linguamatica.com/index.php/linguamatica/article/view/323 https://linguamatica.com/index.php/linguamatica/article/view/323/469 |
dc.rights.driver.fl_str_mv |
Direitos de Autor (c) 2020 Nathan Siegle Hartmann, Sandra Maria Aluísio http://creativecommons.org/licenses/by/4.0 info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Direitos de Autor (c) 2020 Nathan Siegle Hartmann, Sandra Maria Aluísio http://creativecommons.org/licenses/by/4.0 |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade do Minho e Universidade de Vigo |
publisher.none.fl_str_mv |
Universidade do Minho e Universidade de Vigo |
dc.source.none.fl_str_mv |
Linguamática; Vol. 12 No. 2; 3-27 Linguamática; Vol. 12 Núm. 2; 3-27 Linguamática; v. 12 n. 2; 3-27 1647-0818 reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799133554054004736 |