Um processo orientado a dados para geração de modelo de predição de evasão escolar

Detalhes bibliográficos
Autor(a) principal: Barros, Thiago Medeiros
Data de Publicação: 2020
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFRN
Texto Completo: https://repositorio.ufrn.br/handle/123456789/31933
Resumo: A evasão escolar, também conhecida como abandono escolar, é um problema extremamente complexo, pois envolve não apenas uma variedade de perspectivas, mas também uma variedade de diferentes tipos de comportamento de abandono. Historicamente, os modelos de evasão escolar mais citados tiveram sua origem na educação, entretanto a emergente área de Ciência de Dados aplicada na Educação é capaz de desenvolver novos modelos preditivos, com resultados geralmente melhores quando comparados com os métodos estatísticos tradicionais. O principal objetivo dessa tese é a proposição de um processo para geração de um modelo preditivo de evasão escolar baseada em Ciências de Dados. Para tal, uma sequência de etapas é definida, a fim de modelar um fluxo de informação, desde a definição do problema até a geração de informação útil a gestores e professores. As etapas são compostas por: "Entender o Problema", "Entender os Dados", "Engenharia de Atributos", "Seleção de Atributos", "Balanceamento de Dados", "Modelos", "Avaliação"e "Interpretação". A contribuição da proposta se encontra na indicação de quais técnicas e algoritmos devem ser empregados em cada etapa do processo apresentado, e na exposição de que o fenômeno de evasão escolar deve ser abordado como um problema de classes desbalanceadas, a qual deve utilizar-se de ferramentas e métricas apropriadas, a fim de gerar um modelo de predição robusto e de fácil interpretação. O processo proposto foi validado sobre dados educacionais, socioeconômicos e demográficos de alunos de cursos integrados do Instituto Federal do Rio Grande do Norte (IFRN).
id UFRN_59b343fe3dad4c3c2ee910df94a029d9
oai_identifier_str oai:https://repositorio.ufrn.br:123456789/31933
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling Barros, Thiago Medeiroshttp://lattes.cnpq.br/3844440611390386http://lattes.cnpq.br/7987212907837941Silva, Ivanovitch Medeiros Dantas dahttp://lattes.cnpq.br/3608440944832201Ramalho, Betânia Leitehttp://lattes.cnpq.br/1326690619078211Ferreira Filho, Raymundo Carlos Machadohttp://lattes.cnpq.br/1297246206844791Souza Neto, Plácido Antônio dehttp://lattes.cnpq.br/3641504724164977Oliveira, Luiz Affonso Henderson Guedes de2021-03-17T23:53:23Z2021-03-17T23:53:23Z2020-10-22BARROS, Thiago Medeiros. Um processo orientado a dados para geração de modelo de predição de evasão escolar. 2020. 116f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2020.https://repositorio.ufrn.br/handle/123456789/31933A evasão escolar, também conhecida como abandono escolar, é um problema extremamente complexo, pois envolve não apenas uma variedade de perspectivas, mas também uma variedade de diferentes tipos de comportamento de abandono. Historicamente, os modelos de evasão escolar mais citados tiveram sua origem na educação, entretanto a emergente área de Ciência de Dados aplicada na Educação é capaz de desenvolver novos modelos preditivos, com resultados geralmente melhores quando comparados com os métodos estatísticos tradicionais. O principal objetivo dessa tese é a proposição de um processo para geração de um modelo preditivo de evasão escolar baseada em Ciências de Dados. Para tal, uma sequência de etapas é definida, a fim de modelar um fluxo de informação, desde a definição do problema até a geração de informação útil a gestores e professores. As etapas são compostas por: "Entender o Problema", "Entender os Dados", "Engenharia de Atributos", "Seleção de Atributos", "Balanceamento de Dados", "Modelos", "Avaliação"e "Interpretação". A contribuição da proposta se encontra na indicação de quais técnicas e algoritmos devem ser empregados em cada etapa do processo apresentado, e na exposição de que o fenômeno de evasão escolar deve ser abordado como um problema de classes desbalanceadas, a qual deve utilizar-se de ferramentas e métricas apropriadas, a fim de gerar um modelo de predição robusto e de fácil interpretação. O processo proposto foi validado sobre dados educacionais, socioeconômicos e demográficos de alunos de cursos integrados do Instituto Federal do Rio Grande do Norte (IFRN).School dropout is an extremely complex problem, as it involves not only a variety of perspectives, but also a variety of different types of dropout behavior. Historically, the most cited school dropout models had their origin in education, however the emerging area of Data Science applied in Education is capable of developing new predictive models, with generally better results when compared to the most used traditional statistical methods. The main objective of this thesis is the proposition of a process for the generation of a predictive school dropout model based on Data Science. To this end, a sequence of steps is defined in order to model an information flow from problem definition to generation of useful information for managers and teachers. The steps consist of: Understanding the Problem, Understanding the Data, Feature Engineering, Feature Selection, Data Balancing, Models, Evaluation and Interpretation. The proposal’s contribution is found in the indication of which techniques and algorithms should be used in each phase of knowledge discovery, and show that the phenomenon of school dropout must be addressed as a problem of imbalanced classes, and should be approached with appropriate tools and metrics, in order to generate a robust and easy to interpret prediction model. The proposed process was validated on educational and socioeconomic data of students Federal Institute of Rio Grande do Norte (IFRN).Universidade Federal do Rio Grande do NortePROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃOUFRNBrasilMineração de dados educacionaisEvasãoModelo preditivoClasses desbalanceadasUm processo orientado a dados para geração de modelo de predição de evasão escolarinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNTEXTProcessoorientadodados_Barros_2020.pdf.txtProcessoorientadodados_Barros_2020.pdf.txtExtracted texttext/plain221535https://repositorio.ufrn.br/bitstream/123456789/31933/2/Processoorientadodados_Barros_2020.pdf.txt64cd9433bf2c5bc98ff16a2abaee5d07MD52THUMBNAILProcessoorientadodados_Barros_2020.pdf.jpgProcessoorientadodados_Barros_2020.pdf.jpgGenerated Thumbnailimage/jpeg1497https://repositorio.ufrn.br/bitstream/123456789/31933/3/Processoorientadodados_Barros_2020.pdf.jpgbe153846281dea395c725cb1756345aeMD53ORIGINALProcessoorientadodados_Barros_2020.pdfapplication/pdf4135903https://repositorio.ufrn.br/bitstream/123456789/31933/1/Processoorientadodados_Barros_2020.pdf624d289667c1102c49e3d431825405ebMD51123456789/319332021-03-21 05:48:20.085oai:https://repositorio.ufrn.br:123456789/31933Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2021-03-21T08:48:20Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.pt_BR.fl_str_mv Um processo orientado a dados para geração de modelo de predição de evasão escolar
title Um processo orientado a dados para geração de modelo de predição de evasão escolar
spellingShingle Um processo orientado a dados para geração de modelo de predição de evasão escolar
Barros, Thiago Medeiros
Mineração de dados educacionais
Evasão
Modelo preditivo
Classes desbalanceadas
title_short Um processo orientado a dados para geração de modelo de predição de evasão escolar
title_full Um processo orientado a dados para geração de modelo de predição de evasão escolar
title_fullStr Um processo orientado a dados para geração de modelo de predição de evasão escolar
title_full_unstemmed Um processo orientado a dados para geração de modelo de predição de evasão escolar
title_sort Um processo orientado a dados para geração de modelo de predição de evasão escolar
author Barros, Thiago Medeiros
author_facet Barros, Thiago Medeiros
author_role author
dc.contributor.authorID.pt_BR.fl_str_mv
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/3844440611390386
dc.contributor.advisorID.pt_BR.fl_str_mv
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/7987212907837941
dc.contributor.advisor-co1ID.pt_BR.fl_str_mv
dc.contributor.referees1.none.fl_str_mv Ramalho, Betânia Leite
dc.contributor.referees1ID.pt_BR.fl_str_mv
dc.contributor.referees1Lattes.pt_BR.fl_str_mv http://lattes.cnpq.br/1326690619078211
dc.contributor.referees2.none.fl_str_mv Ferreira Filho, Raymundo Carlos Machado
dc.contributor.referees2ID.pt_BR.fl_str_mv
dc.contributor.referees2Lattes.pt_BR.fl_str_mv http://lattes.cnpq.br/1297246206844791
dc.contributor.referees3.none.fl_str_mv Souza Neto, Plácido Antônio de
dc.contributor.referees3ID.pt_BR.fl_str_mv
dc.contributor.referees3Lattes.pt_BR.fl_str_mv http://lattes.cnpq.br/3641504724164977
dc.contributor.author.fl_str_mv Barros, Thiago Medeiros
dc.contributor.advisor-co1.fl_str_mv Silva, Ivanovitch Medeiros Dantas da
dc.contributor.advisor-co1Lattes.fl_str_mv http://lattes.cnpq.br/3608440944832201
dc.contributor.advisor1.fl_str_mv Oliveira, Luiz Affonso Henderson Guedes de
contributor_str_mv Silva, Ivanovitch Medeiros Dantas da
Oliveira, Luiz Affonso Henderson Guedes de
dc.subject.por.fl_str_mv Mineração de dados educacionais
Evasão
Modelo preditivo
Classes desbalanceadas
topic Mineração de dados educacionais
Evasão
Modelo preditivo
Classes desbalanceadas
description A evasão escolar, também conhecida como abandono escolar, é um problema extremamente complexo, pois envolve não apenas uma variedade de perspectivas, mas também uma variedade de diferentes tipos de comportamento de abandono. Historicamente, os modelos de evasão escolar mais citados tiveram sua origem na educação, entretanto a emergente área de Ciência de Dados aplicada na Educação é capaz de desenvolver novos modelos preditivos, com resultados geralmente melhores quando comparados com os métodos estatísticos tradicionais. O principal objetivo dessa tese é a proposição de um processo para geração de um modelo preditivo de evasão escolar baseada em Ciências de Dados. Para tal, uma sequência de etapas é definida, a fim de modelar um fluxo de informação, desde a definição do problema até a geração de informação útil a gestores e professores. As etapas são compostas por: "Entender o Problema", "Entender os Dados", "Engenharia de Atributos", "Seleção de Atributos", "Balanceamento de Dados", "Modelos", "Avaliação"e "Interpretação". A contribuição da proposta se encontra na indicação de quais técnicas e algoritmos devem ser empregados em cada etapa do processo apresentado, e na exposição de que o fenômeno de evasão escolar deve ser abordado como um problema de classes desbalanceadas, a qual deve utilizar-se de ferramentas e métricas apropriadas, a fim de gerar um modelo de predição robusto e de fácil interpretação. O processo proposto foi validado sobre dados educacionais, socioeconômicos e demográficos de alunos de cursos integrados do Instituto Federal do Rio Grande do Norte (IFRN).
publishDate 2020
dc.date.issued.fl_str_mv 2020-10-22
dc.date.accessioned.fl_str_mv 2021-03-17T23:53:23Z
dc.date.available.fl_str_mv 2021-03-17T23:53:23Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv BARROS, Thiago Medeiros. Um processo orientado a dados para geração de modelo de predição de evasão escolar. 2020. 116f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2020.
dc.identifier.uri.fl_str_mv https://repositorio.ufrn.br/handle/123456789/31933
identifier_str_mv BARROS, Thiago Medeiros. Um processo orientado a dados para geração de modelo de predição de evasão escolar. 2020. 116f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2020.
url https://repositorio.ufrn.br/handle/123456789/31933
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.publisher.program.fl_str_mv PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO
dc.publisher.initials.fl_str_mv UFRN
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
bitstream.url.fl_str_mv https://repositorio.ufrn.br/bitstream/123456789/31933/2/Processoorientadodados_Barros_2020.pdf.txt
https://repositorio.ufrn.br/bitstream/123456789/31933/3/Processoorientadodados_Barros_2020.pdf.jpg
https://repositorio.ufrn.br/bitstream/123456789/31933/1/Processoorientadodados_Barros_2020.pdf
bitstream.checksum.fl_str_mv 64cd9433bf2c5bc98ff16a2abaee5d07
be153846281dea395c725cb1756345ae
624d289667c1102c49e3d431825405eb
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv
_version_ 1814832697203228672