Adaptação Lexical Automática em Textos Informativos do Português Brasileiro para o Ensino Fundamental

Detalhes bibliográficos
Autor(a) principal: Hartmann, Nathan Siegle
Data de Publicação: 2020
Outros Autores: Aluísio, Sandra Maria
Tipo de documento: Artigo
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: https://doi.org/10.21814/lm.12.2.323
Resumo: A Adaptação Textual é uma grande área de pesquisa do Processamento de Línguas Naturais (PLN), bastante conhecida como prática educacional, e possui duas grandes abordagens: a Simplificação e a Elaboração Textual. Não há muitos trabalhos na literatura de PLN que tratam todas as fases da Adaptação Lexical para implementação de sistemas. Vários trabalhos tratam independentemente as tarefas de Simplificação e Elaboração Lexicais, trazendo contribuições parciais, já que cada uma das tarefas possuem seus próprios desafios. Este trabalho propôs um pipeline para a Adaptação Lexical e apresenta contribuições para três das quatro etapas do pipeline, sendo elas: (i) proposta e avaliação de métodos para a tarefa de Identificação de Palavras Complexas; (ii) análise de córpus para levantamento de padrões de Elaboração Lexical do tipo definição; (iii) disponibilização do córpus SIMPLEX-PB 3.0, contendo em sua nova versão definições curtas extraídas de dicionário que foram revisadas manualmente, anotações de termos técnicos extraídas de dicionário, e métricas linguísticas de complexidade lexical; e (iv) proposta e avaliação de métodos para Simplificação Lexical, estabelecendo um novo SOTA para a tarefa aplicada no Português Brasileiro.
id RCAP_107cdc1e7d48f332663fad09b51c087a
oai_identifier_str oai:linguamatica.com:article/323
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Adaptação Lexical Automática em Textos Informativos do Português Brasileiro para o Ensino FundamentalAutomatic Lexical Adaptation in Brazilian Portuguese Informative Texts for Elementary EducationAdaptação Lexical Automática em Textos Informativos do Português Brasileiro para o Ensino Fundamentaltext adaptationlexical simplificationlexical elaborationreading aid for childrenadaptação textualsimplificação lexicalelaboração lexicalauxílio à leitura de criançasA Adaptação Textual é uma grande área de pesquisa do Processamento de Línguas Naturais (PLN), bastante conhecida como prática educacional, e possui duas grandes abordagens: a Simplificação e a Elaboração Textual. Não há muitos trabalhos na literatura de PLN que tratam todas as fases da Adaptação Lexical para implementação de sistemas. Vários trabalhos tratam independentemente as tarefas de Simplificação e Elaboração Lexicais, trazendo contribuições parciais, já que cada uma das tarefas possuem seus próprios desafios. Este trabalho propôs um pipeline para a Adaptação Lexical e apresenta contribuições para três das quatro etapas do pipeline, sendo elas: (i) proposta e avaliação de métodos para a tarefa de Identificação de Palavras Complexas; (ii) análise de córpus para levantamento de padrões de Elaboração Lexical do tipo definição; (iii) disponibilização do córpus SIMPLEX-PB 3.0, contendo em sua nova versão definições curtas extraídas de dicionário que foram revisadas manualmente, anotações de termos técnicos extraídas de dicionário, e métricas linguísticas de complexidade lexical; e (iv) proposta e avaliação de métodos para Simplificação Lexical, estabelecendo um novo SOTA para a tarefa aplicada no Português Brasileiro.Text Adaptation is a large Natural Language Processing (NLP) research area, well known as educational practice and has two main approaches: Simplification and Text Elaboration. There is not much work in the NLP literature that addresses all phases of Lexical Adaptation for systems implementation. Several works independently deal with the Lexical Simplification and Elaboration tasks, bringing partial contributions, since each task has its own challenges. This work proposed a pipeline for Lexical Adaptation and presents contributions in three of the four stages of the Lexical Adaptation pipeline: (i) proposal and evaluation of methods for the Complex Word Identification task; (ii) corpus analysis to survey Lexical Elaboration word definition standards; (iii) the SIMPLEX-PB 3.0 corpus, containing in its new version short definitions extracted from dictionaries that were manually revised, annotations of technical terms extracted from a dictionary, and linguistic metrics of lexical complexity; and (iv) proposal and evaluation of methods for Lexical Simplification, establishing a new SOTA for the task applied in Brazilian Portuguese.A Adaptação Textual é uma grande área de pesquisa do Processamento de Línguas Naturais (PLN), bastante conhecida como prática educacional, e possui duas grandes abordagens: a Simplificação e a Elaboração Textual. Não há muitos trabalhos na literatura de PLN que tratam todas as fases da Adaptação Lexical para implementação de sistemas. Vários trabalhos tratam independentemente as tarefas de Simplificação e Elaboração Lexicais, trazendo contribuições parciais, já que cada uma das tarefas possuem seus próprios desafios. Este trabalho propôs um pipeline para a Adaptação Lexical e apresenta contribuições para três das quatro etapas do pipeline, sendo elas: (i) proposta e avaliação de métodos para a tarefa de Identificação de Palavras Complexas; (ii) análise de córpus para levantamento de padrões de Elaboração Lexical do tipo definição; (iii) disponibilização do córpus SIMPLEX-PB 3.0, contendo em sua nova versão definições curtas extraídas de dicionário que foram revisadas manualmente, anotações de termos técnicos extraídas de dicionário, e métricas linguísticas de complexidade lexical; e (iv) proposta e avaliação de métodos para Simplificação Lexical, estabelecendo um novo SOTA para a tarefa aplicada no Português Brasileiro.Universidade do Minho e Universidade de Vigo2020-12-31info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttps://doi.org/10.21814/lm.12.2.323https://doi.org/10.21814/lm.12.2.323Linguamática; Vol. 12 No. 2; 3-27Linguamática; Vol. 12 Núm. 2; 3-27Linguamática; v. 12 n. 2; 3-271647-0818reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAPporhttps://linguamatica.com/index.php/linguamatica/article/view/323https://linguamatica.com/index.php/linguamatica/article/view/323/469Direitos de Autor (c) 2020 Nathan Siegle Hartmann, Sandra Maria Aluísiohttp://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessHartmann, Nathan SiegleAluísio, Sandra Maria2023-09-08T13:46:42Zoai:linguamatica.com:article/323Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T20:28:40.022201Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Adaptação Lexical Automática em Textos Informativos do Português Brasileiro para o Ensino Fundamental
Automatic Lexical Adaptation in Brazilian Portuguese Informative Texts for Elementary Education
Adaptação Lexical Automática em Textos Informativos do Português Brasileiro para o Ensino Fundamental
title Adaptação Lexical Automática em Textos Informativos do Português Brasileiro para o Ensino Fundamental
spellingShingle Adaptação Lexical Automática em Textos Informativos do Português Brasileiro para o Ensino Fundamental
Hartmann, Nathan Siegle
text adaptation
lexical simplification
lexical elaboration
reading aid for children
adaptação textual
simplificação lexical
elaboração lexical
auxílio à leitura de crianças
title_short Adaptação Lexical Automática em Textos Informativos do Português Brasileiro para o Ensino Fundamental
title_full Adaptação Lexical Automática em Textos Informativos do Português Brasileiro para o Ensino Fundamental
title_fullStr Adaptação Lexical Automática em Textos Informativos do Português Brasileiro para o Ensino Fundamental
title_full_unstemmed Adaptação Lexical Automática em Textos Informativos do Português Brasileiro para o Ensino Fundamental
title_sort Adaptação Lexical Automática em Textos Informativos do Português Brasileiro para o Ensino Fundamental
author Hartmann, Nathan Siegle
author_facet Hartmann, Nathan Siegle
Aluísio, Sandra Maria
author_role author
author2 Aluísio, Sandra Maria
author2_role author
dc.contributor.author.fl_str_mv Hartmann, Nathan Siegle
Aluísio, Sandra Maria
dc.subject.por.fl_str_mv text adaptation
lexical simplification
lexical elaboration
reading aid for children
adaptação textual
simplificação lexical
elaboração lexical
auxílio à leitura de crianças
topic text adaptation
lexical simplification
lexical elaboration
reading aid for children
adaptação textual
simplificação lexical
elaboração lexical
auxílio à leitura de crianças
description A Adaptação Textual é uma grande área de pesquisa do Processamento de Línguas Naturais (PLN), bastante conhecida como prática educacional, e possui duas grandes abordagens: a Simplificação e a Elaboração Textual. Não há muitos trabalhos na literatura de PLN que tratam todas as fases da Adaptação Lexical para implementação de sistemas. Vários trabalhos tratam independentemente as tarefas de Simplificação e Elaboração Lexicais, trazendo contribuições parciais, já que cada uma das tarefas possuem seus próprios desafios. Este trabalho propôs um pipeline para a Adaptação Lexical e apresenta contribuições para três das quatro etapas do pipeline, sendo elas: (i) proposta e avaliação de métodos para a tarefa de Identificação de Palavras Complexas; (ii) análise de córpus para levantamento de padrões de Elaboração Lexical do tipo definição; (iii) disponibilização do córpus SIMPLEX-PB 3.0, contendo em sua nova versão definições curtas extraídas de dicionário que foram revisadas manualmente, anotações de termos técnicos extraídas de dicionário, e métricas linguísticas de complexidade lexical; e (iv) proposta e avaliação de métodos para Simplificação Lexical, estabelecendo um novo SOTA para a tarefa aplicada no Português Brasileiro.
publishDate 2020
dc.date.none.fl_str_mv 2020-12-31
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://doi.org/10.21814/lm.12.2.323
https://doi.org/10.21814/lm.12.2.323
url https://doi.org/10.21814/lm.12.2.323
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://linguamatica.com/index.php/linguamatica/article/view/323
https://linguamatica.com/index.php/linguamatica/article/view/323/469
dc.rights.driver.fl_str_mv Direitos de Autor (c) 2020 Nathan Siegle Hartmann, Sandra Maria Aluísio
http://creativecommons.org/licenses/by/4.0
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Direitos de Autor (c) 2020 Nathan Siegle Hartmann, Sandra Maria Aluísio
http://creativecommons.org/licenses/by/4.0
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade do Minho e Universidade de Vigo
publisher.none.fl_str_mv Universidade do Minho e Universidade de Vigo
dc.source.none.fl_str_mv Linguamática; Vol. 12 No. 2; 3-27
Linguamática; Vol. 12 Núm. 2; 3-27
Linguamática; v. 12 n. 2; 3-27
1647-0818
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799133554054004736