Identification of disabilities in educational texts with the application of natural language processing and machine learning
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Outros Autores: | , , |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | ETD - Educação Temática Digital |
Texto Completo: | https://periodicos.sbu.unicamp.br/ojs/index.php/etd/article/view/8660061 |
Resumo: | The correction of educational texts such as essays and discursive questions is an important task, in addition, several schools have demanded the intensification of the activity of writing for the evolution of the student. However, the effort spent on correction can increase the workload of the teacher or even generate additional costs and a long correction time for institutions such as the MEC (Ministry of Education), which is responsible for the application of ENEM (National Examination for Education Medium). In 2019, MEC announced the trend of ENEM to become digital, bringing new possibilities for evaluating and analyzing the essays prepared by students. In this context, some artificial intelligence techniques for analyzing educational texts have proven to be useful in the process of automatic assessment of written language. Thus, the objective of this research is to analyze texts using the techniques of Natural Language Processing and Machine Learning to identify deficiencies in educational texts. This experimental research consisted of the classification of 695 essays prepared in Portuguese in 20 themes. The results showed that the techniques employed made it possible to identify essays whose content differs from the theme proposed in the test, among other important information so that the teacher can identify flaws in the writing of the essay, such as textual cohesion or insufficient text. The expected results with the application of the solution developed in this experiment seek to optimize the work of the teacher, reducing the time and cost of the process of evaluating educational texts. |
id |
UNICAMP-19_9329ba682599cb9a5e4d6fca6c91c565 |
---|---|
oai_identifier_str |
oai:ojs.periodicos.sbu.unicamp.br:article/8660061 |
network_acronym_str |
UNICAMP-19 |
network_name_str |
ETD - Educação Temática Digital |
repository_id_str |
|
spelling |
Identification of disabilities in educational texts with the application of natural language processing and machine learningIdentificación de deficiencias en textos educativos con la aplicación de procesamiento del lenguaje natural y aprendizaje automático Identificação de deficiências em textos educacionais com a aplicação de processamento de linguagem natural e aprendizado de máquinaDesarrollo educativoConocimiento administrativoRedacciónInteligencia artificialTecnologíaDesenvolvimento educacionalRedaçãoInteligência artificialTecnologiaGestão do conhecimentoEducational developmentKnowledge managementRedactionArtificial intelligenceTechnologyThe correction of educational texts such as essays and discursive questions is an important task, in addition, several schools have demanded the intensification of the activity of writing for the evolution of the student. However, the effort spent on correction can increase the workload of the teacher or even generate additional costs and a long correction time for institutions such as the MEC (Ministry of Education), which is responsible for the application of ENEM (National Examination for Education Medium). In 2019, MEC announced the trend of ENEM to become digital, bringing new possibilities for evaluating and analyzing the essays prepared by students. In this context, some artificial intelligence techniques for analyzing educational texts have proven to be useful in the process of automatic assessment of written language. Thus, the objective of this research is to analyze texts using the techniques of Natural Language Processing and Machine Learning to identify deficiencies in educational texts. This experimental research consisted of the classification of 695 essays prepared in Portuguese in 20 themes. The results showed that the techniques employed made it possible to identify essays whose content differs from the theme proposed in the test, among other important information so that the teacher can identify flaws in the writing of the essay, such as textual cohesion or insufficient text. The expected results with the application of the solution developed in this experiment seek to optimize the work of the teacher, reducing the time and cost of the process of evaluating educational texts.La corrección de textos educativos como redacciones y preguntas discursivas es una tarea importante, especialmente porque varias escuelas han exigido la intensificación de la actividad de la escritura para la evolución del estudiante. El esfuerzo dedicado a la corrección puede aumentar la carga de trabajo del maestro o incluso generar costos adicionales, además del largo tiempo de corrección para instituciones como el MEC (Ministerio de Educación), que es responsable de aplicar el ENEM (Examen Nacional del escuela secundaria). En 2019, MEC anunció la tendencia de ENEM a convertirse en digital, brindando nuevas posibilidades para evaluar y analizar las redacciones preparadas por los estudiantes. En este contexto, algunas técnicas de Inteligencia Artificial para el análisis automático de textos educativos han demostrado ser útiles en el proceso de evaluación automática del lenguaje escrito. El objetivo de esta investigación es analizar textos utilizando las técnicas de Procesamiento del lenguaje natural y Aprendizaje automático para identificar deficiencias en los textos educativos. Esta investigación experimental consistió en la clasificación de 695 redacciones en portugués en 20 temas. Los resultados mostraron que las técnicas empleadas permitieron identificar salas de redacción cuyo contenido difiere del tema propuesto en la prueba, entre otra información importante para que el maestro pueda identificar fallas en la redacción, como la cohesión textual o texto insuficiente. Los resultados esperados con la aplicación de la solución desarrollada en este experimento buscan optimizar el trabajo del profesor, reduciendo el tiempo y el costo del proceso de evaluación de textos educativos.A correção de textos educacionais como redações e questões discursivas é uma tarefa importante, além disso, diversas escolas têm exigido a intensificação da atividade da escrita para a evolução do discente. Entretanto, o esforço despendido para a correção pode aumentar a carga de trabalho do professor ou até mesmo gerar custos adicionais, bem como um longo tempo de correção para instituições como o MEC (Ministério da Educação), que é responsável pela aplicação do ENEM (Exame Nacional do Ensino Médio). Em 2019 foi anunciado pelo MEC a tendência do ENEM se tornar digital, trazendo novas possibilidades para a análise e avaliação das redações elaboradas pelos estudantes. Neste contexto, algumas técnicas de inteligência artificial para análise de textos educacionais tem se revelado úteis no processo de avaliação automática da linguagem escrita. Assim, o objetivo desta pesquisa é analisar textos empregando para tanto as técnicas de Processamento de Linguagem Natural e Aprendizado de Máquina para identificar deficiências em textos educacionais. Esta pesquisa experimental consistiu na classificação de 695 redações elaboradas em língua portuguesa em 20 temas. Os resultados demonstraram que as técnicas empregadas possibilitaram a identificação de redações cujo conteúdo foge à temática proposta na prova, dentre outras informações importantes para que o docente possa identificar falhas na escrita da redação, tais como a coesão textual ou texto insuficiente. Os resultados esperados com a aplicação da solução desenvolvida neste experimento buscam otimizar o trabalho do professor, bem como reduzir o tempo e o custo do processo de avaliação de textos educativos.Universidade Estadual de Campinas2022-05-23info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionTextoTextoinfo:eu-repo/semantics/otherapplication/pdfhttps://periodicos.sbu.unicamp.br/ojs/index.php/etd/article/view/866006110.20396/etd.v24i2.8660061ETD - Educação Temática Digital; v. 24 n. 2 (2022): Fragmentos, experimentos, realidades: composições; 350-372ETD - Educação Temática Digital; Vol. 24 No. 2 (2022): Fragments, experiments, realities: compositions; 350-372ETD - Educação Temática Digital; Vol. 24 Núm. 2 (2022): Fragmentos, experimentos, realidades: composiciones; 350-3721676-2592reponame:ETD - Educação Temática Digitalinstname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPporhttps://periodicos.sbu.unicamp.br/ojs/index.php/etd/article/view/8660061/28624Brazil; ContemporaryBrasil; ContemporáneoBrasil; ContemporâneoCopyright (c) 2022 ETD - Educação Temática Digitalhttps://creativecommons.org/licenses/by-nc-nd/4.0info:eu-repo/semantics/openAccessPinho, Cíntia Maria de Araújo Moura, Amanda Ferreira deGaspar, Marcos AntonioNapolitano, Domingos Márcio Rodrigues2022-06-09T14:10:42Zoai:ojs.periodicos.sbu.unicamp.br:article/8660061Revistahttp://periodicos.sbu.unicamp.br/ojs/index.php/etdPUBhttps://periodicos.sbu.unicamp.br/ojs/index.php/etd/oaippec@unicamp.br||acdiasjr@gmail.com||etd@unicamp.br|| gilbfe@unicamp.br1676-25921676-2592opendoar:2022-11-08T14:25:36.766332ETD - Educação Temática Digital - Universidade Estadual de Campinas (UNICAMP)false |
dc.title.none.fl_str_mv |
Identification of disabilities in educational texts with the application of natural language processing and machine learning Identificación de deficiencias en textos educativos con la aplicación de procesamiento del lenguaje natural y aprendizaje automático Identificação de deficiências em textos educacionais com a aplicação de processamento de linguagem natural e aprendizado de máquina |
title |
Identification of disabilities in educational texts with the application of natural language processing and machine learning |
spellingShingle |
Identification of disabilities in educational texts with the application of natural language processing and machine learning Pinho, Cíntia Maria de Araújo Desarrollo educativo Conocimiento administrativo Redacción Inteligencia artificial Tecnología Desenvolvimento educacional Redação Inteligência artificial Tecnologia Gestão do conhecimento Educational development Knowledge management Redaction Artificial intelligence Technology |
title_short |
Identification of disabilities in educational texts with the application of natural language processing and machine learning |
title_full |
Identification of disabilities in educational texts with the application of natural language processing and machine learning |
title_fullStr |
Identification of disabilities in educational texts with the application of natural language processing and machine learning |
title_full_unstemmed |
Identification of disabilities in educational texts with the application of natural language processing and machine learning |
title_sort |
Identification of disabilities in educational texts with the application of natural language processing and machine learning |
author |
Pinho, Cíntia Maria de Araújo |
author_facet |
Pinho, Cíntia Maria de Araújo Moura, Amanda Ferreira de Gaspar, Marcos Antonio Napolitano, Domingos Márcio Rodrigues |
author_role |
author |
author2 |
Moura, Amanda Ferreira de Gaspar, Marcos Antonio Napolitano, Domingos Márcio Rodrigues |
author2_role |
author author author |
dc.contributor.author.fl_str_mv |
Pinho, Cíntia Maria de Araújo Moura, Amanda Ferreira de Gaspar, Marcos Antonio Napolitano, Domingos Márcio Rodrigues |
dc.subject.por.fl_str_mv |
Desarrollo educativo Conocimiento administrativo Redacción Inteligencia artificial Tecnología Desenvolvimento educacional Redação Inteligência artificial Tecnologia Gestão do conhecimento Educational development Knowledge management Redaction Artificial intelligence Technology |
topic |
Desarrollo educativo Conocimiento administrativo Redacción Inteligencia artificial Tecnología Desenvolvimento educacional Redação Inteligência artificial Tecnologia Gestão do conhecimento Educational development Knowledge management Redaction Artificial intelligence Technology |
description |
The correction of educational texts such as essays and discursive questions is an important task, in addition, several schools have demanded the intensification of the activity of writing for the evolution of the student. However, the effort spent on correction can increase the workload of the teacher or even generate additional costs and a long correction time for institutions such as the MEC (Ministry of Education), which is responsible for the application of ENEM (National Examination for Education Medium). In 2019, MEC announced the trend of ENEM to become digital, bringing new possibilities for evaluating and analyzing the essays prepared by students. In this context, some artificial intelligence techniques for analyzing educational texts have proven to be useful in the process of automatic assessment of written language. Thus, the objective of this research is to analyze texts using the techniques of Natural Language Processing and Machine Learning to identify deficiencies in educational texts. This experimental research consisted of the classification of 695 essays prepared in Portuguese in 20 themes. The results showed that the techniques employed made it possible to identify essays whose content differs from the theme proposed in the test, among other important information so that the teacher can identify flaws in the writing of the essay, such as textual cohesion or insufficient text. The expected results with the application of the solution developed in this experiment seek to optimize the work of the teacher, reducing the time and cost of the process of evaluating educational texts. |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-05-23 |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion Texto Texto info:eu-repo/semantics/other |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://periodicos.sbu.unicamp.br/ojs/index.php/etd/article/view/8660061 10.20396/etd.v24i2.8660061 |
url |
https://periodicos.sbu.unicamp.br/ojs/index.php/etd/article/view/8660061 |
identifier_str_mv |
10.20396/etd.v24i2.8660061 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://periodicos.sbu.unicamp.br/ojs/index.php/etd/article/view/8660061/28624 |
dc.rights.driver.fl_str_mv |
Copyright (c) 2022 ETD - Educação Temática Digital https://creativecommons.org/licenses/by-nc-nd/4.0 info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Copyright (c) 2022 ETD - Educação Temática Digital https://creativecommons.org/licenses/by-nc-nd/4.0 |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
Brazil; Contemporary Brasil; Contemporáneo Brasil; Contemporâneo |
dc.publisher.none.fl_str_mv |
Universidade Estadual de Campinas |
publisher.none.fl_str_mv |
Universidade Estadual de Campinas |
dc.source.none.fl_str_mv |
ETD - Educação Temática Digital; v. 24 n. 2 (2022): Fragmentos, experimentos, realidades: composições; 350-372 ETD - Educação Temática Digital; Vol. 24 No. 2 (2022): Fragments, experiments, realities: compositions; 350-372 ETD - Educação Temática Digital; Vol. 24 Núm. 2 (2022): Fragmentos, experimentos, realidades: composiciones; 350-372 1676-2592 reponame:ETD - Educação Temática Digital instname:Universidade Estadual de Campinas (UNICAMP) instacron:UNICAMP |
instname_str |
Universidade Estadual de Campinas (UNICAMP) |
instacron_str |
UNICAMP |
institution |
UNICAMP |
reponame_str |
ETD - Educação Temática Digital |
collection |
ETD - Educação Temática Digital |
repository.name.fl_str_mv |
ETD - Educação Temática Digital - Universidade Estadual de Campinas (UNICAMP) |
repository.mail.fl_str_mv |
ppec@unicamp.br||acdiasjr@gmail.com||etd@unicamp.br|| gilbfe@unicamp.br |
_version_ |
1800216655014395904 |