Identification of disabilities in educational texts with the application of natural language processing and machine learning

Detalhes bibliográficos
Autor(a) principal: Pinho, Cíntia Maria de Araújo
Data de Publicação: 2022
Outros Autores: Moura, Amanda Ferreira de, Gaspar, Marcos Antonio, Napolitano, Domingos Márcio Rodrigues
Tipo de documento: Artigo
Idioma: por
Título da fonte: ETD - Educação Temática Digital
Texto Completo: https://periodicos.sbu.unicamp.br/ojs/index.php/etd/article/view/8660061
Resumo: The correction of educational texts such as essays and discursive questions is an important task, in addition, several schools have demanded the intensification of the activity of writing for the evolution of the student. However, the effort spent on correction can increase the workload of the teacher or even generate additional costs and a long correction time for institutions such as the MEC (Ministry of Education), which is responsible for the application of ENEM (National Examination for Education Medium). In 2019, MEC announced the trend of ENEM to become digital, bringing new possibilities for evaluating and analyzing the essays prepared by students. In this context, some artificial intelligence techniques for analyzing educational texts have proven to be useful in the process of automatic assessment of written language. Thus, the objective of this research is to analyze texts using the techniques of Natural Language Processing and Machine Learning to identify deficiencies in educational texts. This experimental research consisted of the classification of 695 essays prepared in Portuguese in 20 themes. The results showed that the techniques employed made it possible to identify essays whose content differs from the theme proposed in the test, among other important information so that the teacher can identify flaws in the writing of the essay, such as textual cohesion or insufficient text. The expected results with the application of the solution developed in this experiment seek to optimize the work of the teacher, reducing the time and cost of the process of evaluating educational texts.
id UNICAMP-19_9329ba682599cb9a5e4d6fca6c91c565
oai_identifier_str oai:ojs.periodicos.sbu.unicamp.br:article/8660061
network_acronym_str UNICAMP-19
network_name_str ETD - Educação Temática Digital
repository_id_str
spelling Identification of disabilities in educational texts with the application of natural language processing and machine learningIdentificación de deficiencias en textos educativos con la aplicación de procesamiento del lenguaje natural y aprendizaje automático Identificação de deficiências em textos educacionais com a aplicação de processamento de linguagem natural e aprendizado de máquinaDesarrollo educativoConocimiento administrativoRedacciónInteligencia artificialTecnologíaDesenvolvimento educacionalRedaçãoInteligência artificialTecnologiaGestão do conhecimentoEducational developmentKnowledge managementRedactionArtificial intelligenceTechnologyThe correction of educational texts such as essays and discursive questions is an important task, in addition, several schools have demanded the intensification of the activity of writing for the evolution of the student. However, the effort spent on correction can increase the workload of the teacher or even generate additional costs and a long correction time for institutions such as the MEC (Ministry of Education), which is responsible for the application of ENEM (National Examination for Education Medium). In 2019, MEC announced the trend of ENEM to become digital, bringing new possibilities for evaluating and analyzing the essays prepared by students. In this context, some artificial intelligence techniques for analyzing educational texts have proven to be useful in the process of automatic assessment of written language. Thus, the objective of this research is to analyze texts using the techniques of Natural Language Processing and Machine Learning to identify deficiencies in educational texts. This experimental research consisted of the classification of 695 essays prepared in Portuguese in 20 themes. The results showed that the techniques employed made it possible to identify essays whose content differs from the theme proposed in the test, among other important information so that the teacher can identify flaws in the writing of the essay, such as textual cohesion or insufficient text. The expected results with the application of the solution developed in this experiment seek to optimize the work of the teacher, reducing the time and cost of the process of evaluating educational texts.La corrección de textos educativos como redacciones y preguntas discursivas es una tarea importante, especialmente porque varias escuelas han exigido la intensificación de la actividad de la escritura para la evolución del estudiante. El esfuerzo dedicado a la corrección puede aumentar la carga de trabajo del maestro o incluso generar costos adicionales, además del largo tiempo de corrección para instituciones como el MEC (Ministerio de Educación), que es responsable de aplicar el ENEM (Examen Nacional del escuela secundaria). En 2019, MEC anunció la tendencia de ENEM a convertirse en digital, brindando nuevas posibilidades para evaluar y analizar las redacciones preparadas por los estudiantes. En este contexto, algunas técnicas de Inteligencia Artificial para el análisis automático de textos educativos han demostrado ser útiles en el proceso de evaluación automática del lenguaje escrito. El objetivo de esta investigación es analizar textos utilizando las técnicas de Procesamiento del lenguaje natural  y Aprendizaje automático  para identificar deficiencias en los textos educativos. Esta investigación experimental consistió en la clasificación de 695 redacciones en portugués en 20 temas. Los resultados mostraron que las técnicas empleadas permitieron identificar salas de redacción cuyo contenido difiere del tema propuesto en la prueba, entre otra información importante para que el maestro pueda identificar fallas en la redacción, como la cohesión textual o texto insuficiente. Los resultados esperados con la aplicación de la solución desarrollada en este experimento buscan optimizar el trabajo del profesor, reduciendo el tiempo y el costo del proceso de evaluación de textos educativos.A correção de textos educacionais como redações e questões discursivas é uma tarefa importante, além disso, diversas escolas têm exigido a intensificação da atividade da escrita para a evolução do discente. Entretanto, o esforço despendido para a correção pode aumentar a carga de trabalho do professor ou até mesmo gerar custos adicionais, bem como um longo tempo de correção para instituições como o MEC (Ministério da Educação), que é responsável pela aplicação do ENEM (Exame Nacional do Ensino Médio). Em 2019 foi anunciado pelo MEC a tendência do ENEM se tornar digital, trazendo novas possibilidades para a análise e avaliação das redações elaboradas pelos estudantes. Neste contexto, algumas técnicas de inteligência artificial para análise de textos educacionais tem se revelado úteis no processo de avaliação automática da linguagem escrita. Assim, o objetivo desta pesquisa é analisar textos empregando para tanto as técnicas de Processamento de Linguagem Natural e Aprendizado de Máquina para identificar deficiências em textos educacionais. Esta pesquisa experimental consistiu na classificação de 695 redações elaboradas em língua portuguesa em 20 temas. Os resultados demonstraram que as técnicas empregadas possibilitaram a identificação de redações cujo conteúdo foge à temática proposta na prova, dentre outras informações importantes para que o docente possa identificar falhas na escrita da redação, tais como a coesão textual ou texto insuficiente. Os resultados esperados com a aplicação da solução desenvolvida neste experimento buscam otimizar o trabalho do professor, bem como reduzir o tempo e o custo do processo de avaliação de textos educativos.Universidade Estadual de Campinas2022-05-23info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionTextoTextoinfo:eu-repo/semantics/otherapplication/pdfhttps://periodicos.sbu.unicamp.br/ojs/index.php/etd/article/view/866006110.20396/etd.v24i2.8660061ETD - Educação Temática Digital; v. 24 n. 2 (2022): Fragmentos, experimentos, realidades: composições; 350-372ETD - Educação Temática Digital; Vol. 24 No. 2 (2022): Fragments, experiments, realities: compositions; 350-372ETD - Educação Temática Digital; Vol. 24 Núm. 2 (2022): Fragmentos, experimentos, realidades: composiciones; 350-3721676-2592reponame:ETD - Educação Temática Digitalinstname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPporhttps://periodicos.sbu.unicamp.br/ojs/index.php/etd/article/view/8660061/28624Brazil; ContemporaryBrasil; ContemporáneoBrasil; ContemporâneoCopyright (c) 2022 ETD - Educação Temática Digitalhttps://creativecommons.org/licenses/by-nc-nd/4.0info:eu-repo/semantics/openAccessPinho, Cíntia Maria de Araújo Moura, Amanda Ferreira deGaspar, Marcos AntonioNapolitano, Domingos Márcio Rodrigues2022-06-09T14:10:42Zoai:ojs.periodicos.sbu.unicamp.br:article/8660061Revistahttp://periodicos.sbu.unicamp.br/ojs/index.php/etdPUBhttps://periodicos.sbu.unicamp.br/ojs/index.php/etd/oaippec@unicamp.br||acdiasjr@gmail.com||etd@unicamp.br|| gilbfe@unicamp.br1676-25921676-2592opendoar:2022-11-08T14:25:36.766332ETD - Educação Temática Digital - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv Identification of disabilities in educational texts with the application of natural language processing and machine learning
Identificación de deficiencias en textos educativos con la aplicación de procesamiento del lenguaje natural y aprendizaje automático
Identificação de deficiências em textos educacionais com a aplicação de processamento de linguagem natural e aprendizado de máquina
title Identification of disabilities in educational texts with the application of natural language processing and machine learning
spellingShingle Identification of disabilities in educational texts with the application of natural language processing and machine learning
Pinho, Cíntia Maria de Araújo
Desarrollo educativo
Conocimiento administrativo
Redacción
Inteligencia artificial
Tecnología
Desenvolvimento educacional
Redação
Inteligência artificial
Tecnologia
Gestão do conhecimento
Educational development
Knowledge management
Redaction
Artificial intelligence
Technology
title_short Identification of disabilities in educational texts with the application of natural language processing and machine learning
title_full Identification of disabilities in educational texts with the application of natural language processing and machine learning
title_fullStr Identification of disabilities in educational texts with the application of natural language processing and machine learning
title_full_unstemmed Identification of disabilities in educational texts with the application of natural language processing and machine learning
title_sort Identification of disabilities in educational texts with the application of natural language processing and machine learning
author Pinho, Cíntia Maria de Araújo
author_facet Pinho, Cíntia Maria de Araújo
Moura, Amanda Ferreira de
Gaspar, Marcos Antonio
Napolitano, Domingos Márcio Rodrigues
author_role author
author2 Moura, Amanda Ferreira de
Gaspar, Marcos Antonio
Napolitano, Domingos Márcio Rodrigues
author2_role author
author
author
dc.contributor.author.fl_str_mv Pinho, Cíntia Maria de Araújo
Moura, Amanda Ferreira de
Gaspar, Marcos Antonio
Napolitano, Domingos Márcio Rodrigues
dc.subject.por.fl_str_mv Desarrollo educativo
Conocimiento administrativo
Redacción
Inteligencia artificial
Tecnología
Desenvolvimento educacional
Redação
Inteligência artificial
Tecnologia
Gestão do conhecimento
Educational development
Knowledge management
Redaction
Artificial intelligence
Technology
topic Desarrollo educativo
Conocimiento administrativo
Redacción
Inteligencia artificial
Tecnología
Desenvolvimento educacional
Redação
Inteligência artificial
Tecnologia
Gestão do conhecimento
Educational development
Knowledge management
Redaction
Artificial intelligence
Technology
description The correction of educational texts such as essays and discursive questions is an important task, in addition, several schools have demanded the intensification of the activity of writing for the evolution of the student. However, the effort spent on correction can increase the workload of the teacher or even generate additional costs and a long correction time for institutions such as the MEC (Ministry of Education), which is responsible for the application of ENEM (National Examination for Education Medium). In 2019, MEC announced the trend of ENEM to become digital, bringing new possibilities for evaluating and analyzing the essays prepared by students. In this context, some artificial intelligence techniques for analyzing educational texts have proven to be useful in the process of automatic assessment of written language. Thus, the objective of this research is to analyze texts using the techniques of Natural Language Processing and Machine Learning to identify deficiencies in educational texts. This experimental research consisted of the classification of 695 essays prepared in Portuguese in 20 themes. The results showed that the techniques employed made it possible to identify essays whose content differs from the theme proposed in the test, among other important information so that the teacher can identify flaws in the writing of the essay, such as textual cohesion or insufficient text. The expected results with the application of the solution developed in this experiment seek to optimize the work of the teacher, reducing the time and cost of the process of evaluating educational texts.
publishDate 2022
dc.date.none.fl_str_mv 2022-05-23
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
Texto
Texto
info:eu-repo/semantics/other
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://periodicos.sbu.unicamp.br/ojs/index.php/etd/article/view/8660061
10.20396/etd.v24i2.8660061
url https://periodicos.sbu.unicamp.br/ojs/index.php/etd/article/view/8660061
identifier_str_mv 10.20396/etd.v24i2.8660061
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://periodicos.sbu.unicamp.br/ojs/index.php/etd/article/view/8660061/28624
dc.rights.driver.fl_str_mv Copyright (c) 2022 ETD - Educação Temática Digital
https://creativecommons.org/licenses/by-nc-nd/4.0
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Copyright (c) 2022 ETD - Educação Temática Digital
https://creativecommons.org/licenses/by-nc-nd/4.0
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv Brazil; Contemporary
Brasil; Contemporáneo
Brasil; Contemporâneo
dc.publisher.none.fl_str_mv Universidade Estadual de Campinas
publisher.none.fl_str_mv Universidade Estadual de Campinas
dc.source.none.fl_str_mv ETD - Educação Temática Digital; v. 24 n. 2 (2022): Fragmentos, experimentos, realidades: composições; 350-372
ETD - Educação Temática Digital; Vol. 24 No. 2 (2022): Fragments, experiments, realities: compositions; 350-372
ETD - Educação Temática Digital; Vol. 24 Núm. 2 (2022): Fragmentos, experimentos, realidades: composiciones; 350-372
1676-2592
reponame:ETD - Educação Temática Digital
instname:Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
instname_str Universidade Estadual de Campinas (UNICAMP)
instacron_str UNICAMP
institution UNICAMP
reponame_str ETD - Educação Temática Digital
collection ETD - Educação Temática Digital
repository.name.fl_str_mv ETD - Educação Temática Digital - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv ppec@unicamp.br||acdiasjr@gmail.com||etd@unicamp.br|| gilbfe@unicamp.br
_version_ 1800216655014395904