Um processo orientado a dados para geração de modelo de predição de evasão escolar
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRN |
Texto Completo: | https://repositorio.ufrn.br/handle/123456789/31933 |
Resumo: | A evasão escolar, também conhecida como abandono escolar, é um problema extremamente complexo, pois envolve não apenas uma variedade de perspectivas, mas também uma variedade de diferentes tipos de comportamento de abandono. Historicamente, os modelos de evasão escolar mais citados tiveram sua origem na educação, entretanto a emergente área de Ciência de Dados aplicada na Educação é capaz de desenvolver novos modelos preditivos, com resultados geralmente melhores quando comparados com os métodos estatísticos tradicionais. O principal objetivo dessa tese é a proposição de um processo para geração de um modelo preditivo de evasão escolar baseada em Ciências de Dados. Para tal, uma sequência de etapas é definida, a fim de modelar um fluxo de informação, desde a definição do problema até a geração de informação útil a gestores e professores. As etapas são compostas por: "Entender o Problema", "Entender os Dados", "Engenharia de Atributos", "Seleção de Atributos", "Balanceamento de Dados", "Modelos", "Avaliação"e "Interpretação". A contribuição da proposta se encontra na indicação de quais técnicas e algoritmos devem ser empregados em cada etapa do processo apresentado, e na exposição de que o fenômeno de evasão escolar deve ser abordado como um problema de classes desbalanceadas, a qual deve utilizar-se de ferramentas e métricas apropriadas, a fim de gerar um modelo de predição robusto e de fácil interpretação. O processo proposto foi validado sobre dados educacionais, socioeconômicos e demográficos de alunos de cursos integrados do Instituto Federal do Rio Grande do Norte (IFRN). |
id |
UFRN_59b343fe3dad4c3c2ee910df94a029d9 |
---|---|
oai_identifier_str |
oai:https://repositorio.ufrn.br:123456789/31933 |
network_acronym_str |
UFRN |
network_name_str |
Repositório Institucional da UFRN |
repository_id_str |
|
spelling |
Barros, Thiago Medeiroshttp://lattes.cnpq.br/3844440611390386http://lattes.cnpq.br/7987212907837941Silva, Ivanovitch Medeiros Dantas dahttp://lattes.cnpq.br/3608440944832201Ramalho, Betânia Leitehttp://lattes.cnpq.br/1326690619078211Ferreira Filho, Raymundo Carlos Machadohttp://lattes.cnpq.br/1297246206844791Souza Neto, Plácido Antônio dehttp://lattes.cnpq.br/3641504724164977Oliveira, Luiz Affonso Henderson Guedes de2021-03-17T23:53:23Z2021-03-17T23:53:23Z2020-10-22BARROS, Thiago Medeiros. Um processo orientado a dados para geração de modelo de predição de evasão escolar. 2020. 116f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2020.https://repositorio.ufrn.br/handle/123456789/31933A evasão escolar, também conhecida como abandono escolar, é um problema extremamente complexo, pois envolve não apenas uma variedade de perspectivas, mas também uma variedade de diferentes tipos de comportamento de abandono. Historicamente, os modelos de evasão escolar mais citados tiveram sua origem na educação, entretanto a emergente área de Ciência de Dados aplicada na Educação é capaz de desenvolver novos modelos preditivos, com resultados geralmente melhores quando comparados com os métodos estatísticos tradicionais. O principal objetivo dessa tese é a proposição de um processo para geração de um modelo preditivo de evasão escolar baseada em Ciências de Dados. Para tal, uma sequência de etapas é definida, a fim de modelar um fluxo de informação, desde a definição do problema até a geração de informação útil a gestores e professores. As etapas são compostas por: "Entender o Problema", "Entender os Dados", "Engenharia de Atributos", "Seleção de Atributos", "Balanceamento de Dados", "Modelos", "Avaliação"e "Interpretação". A contribuição da proposta se encontra na indicação de quais técnicas e algoritmos devem ser empregados em cada etapa do processo apresentado, e na exposição de que o fenômeno de evasão escolar deve ser abordado como um problema de classes desbalanceadas, a qual deve utilizar-se de ferramentas e métricas apropriadas, a fim de gerar um modelo de predição robusto e de fácil interpretação. O processo proposto foi validado sobre dados educacionais, socioeconômicos e demográficos de alunos de cursos integrados do Instituto Federal do Rio Grande do Norte (IFRN).School dropout is an extremely complex problem, as it involves not only a variety of perspectives, but also a variety of different types of dropout behavior. Historically, the most cited school dropout models had their origin in education, however the emerging area of Data Science applied in Education is capable of developing new predictive models, with generally better results when compared to the most used traditional statistical methods. The main objective of this thesis is the proposition of a process for the generation of a predictive school dropout model based on Data Science. To this end, a sequence of steps is defined in order to model an information flow from problem definition to generation of useful information for managers and teachers. The steps consist of: Understanding the Problem, Understanding the Data, Feature Engineering, Feature Selection, Data Balancing, Models, Evaluation and Interpretation. The proposal’s contribution is found in the indication of which techniques and algorithms should be used in each phase of knowledge discovery, and show that the phenomenon of school dropout must be addressed as a problem of imbalanced classes, and should be approached with appropriate tools and metrics, in order to generate a robust and easy to interpret prediction model. The proposed process was validated on educational and socioeconomic data of students Federal Institute of Rio Grande do Norte (IFRN).Universidade Federal do Rio Grande do NortePROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃOUFRNBrasilMineração de dados educacionaisEvasãoModelo preditivoClasses desbalanceadasUm processo orientado a dados para geração de modelo de predição de evasão escolarinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNTEXTProcessoorientadodados_Barros_2020.pdf.txtProcessoorientadodados_Barros_2020.pdf.txtExtracted texttext/plain221535https://repositorio.ufrn.br/bitstream/123456789/31933/2/Processoorientadodados_Barros_2020.pdf.txt64cd9433bf2c5bc98ff16a2abaee5d07MD52THUMBNAILProcessoorientadodados_Barros_2020.pdf.jpgProcessoorientadodados_Barros_2020.pdf.jpgGenerated Thumbnailimage/jpeg1497https://repositorio.ufrn.br/bitstream/123456789/31933/3/Processoorientadodados_Barros_2020.pdf.jpgbe153846281dea395c725cb1756345aeMD53ORIGINALProcessoorientadodados_Barros_2020.pdfapplication/pdf4135903https://repositorio.ufrn.br/bitstream/123456789/31933/1/Processoorientadodados_Barros_2020.pdf624d289667c1102c49e3d431825405ebMD51123456789/319332021-03-21 05:48:20.085oai:https://repositorio.ufrn.br:123456789/31933Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2021-03-21T08:48:20Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false |
dc.title.pt_BR.fl_str_mv |
Um processo orientado a dados para geração de modelo de predição de evasão escolar |
title |
Um processo orientado a dados para geração de modelo de predição de evasão escolar |
spellingShingle |
Um processo orientado a dados para geração de modelo de predição de evasão escolar Barros, Thiago Medeiros Mineração de dados educacionais Evasão Modelo preditivo Classes desbalanceadas |
title_short |
Um processo orientado a dados para geração de modelo de predição de evasão escolar |
title_full |
Um processo orientado a dados para geração de modelo de predição de evasão escolar |
title_fullStr |
Um processo orientado a dados para geração de modelo de predição de evasão escolar |
title_full_unstemmed |
Um processo orientado a dados para geração de modelo de predição de evasão escolar |
title_sort |
Um processo orientado a dados para geração de modelo de predição de evasão escolar |
author |
Barros, Thiago Medeiros |
author_facet |
Barros, Thiago Medeiros |
author_role |
author |
dc.contributor.authorID.pt_BR.fl_str_mv |
|
dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/3844440611390386 |
dc.contributor.advisorID.pt_BR.fl_str_mv |
|
dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/7987212907837941 |
dc.contributor.advisor-co1ID.pt_BR.fl_str_mv |
|
dc.contributor.referees1.none.fl_str_mv |
Ramalho, Betânia Leite |
dc.contributor.referees1ID.pt_BR.fl_str_mv |
|
dc.contributor.referees1Lattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/1326690619078211 |
dc.contributor.referees2.none.fl_str_mv |
Ferreira Filho, Raymundo Carlos Machado |
dc.contributor.referees2ID.pt_BR.fl_str_mv |
|
dc.contributor.referees2Lattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/1297246206844791 |
dc.contributor.referees3.none.fl_str_mv |
Souza Neto, Plácido Antônio de |
dc.contributor.referees3ID.pt_BR.fl_str_mv |
|
dc.contributor.referees3Lattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/3641504724164977 |
dc.contributor.author.fl_str_mv |
Barros, Thiago Medeiros |
dc.contributor.advisor-co1.fl_str_mv |
Silva, Ivanovitch Medeiros Dantas da |
dc.contributor.advisor-co1Lattes.fl_str_mv |
http://lattes.cnpq.br/3608440944832201 |
dc.contributor.advisor1.fl_str_mv |
Oliveira, Luiz Affonso Henderson Guedes de |
contributor_str_mv |
Silva, Ivanovitch Medeiros Dantas da Oliveira, Luiz Affonso Henderson Guedes de |
dc.subject.por.fl_str_mv |
Mineração de dados educacionais Evasão Modelo preditivo Classes desbalanceadas |
topic |
Mineração de dados educacionais Evasão Modelo preditivo Classes desbalanceadas |
description |
A evasão escolar, também conhecida como abandono escolar, é um problema extremamente complexo, pois envolve não apenas uma variedade de perspectivas, mas também uma variedade de diferentes tipos de comportamento de abandono. Historicamente, os modelos de evasão escolar mais citados tiveram sua origem na educação, entretanto a emergente área de Ciência de Dados aplicada na Educação é capaz de desenvolver novos modelos preditivos, com resultados geralmente melhores quando comparados com os métodos estatísticos tradicionais. O principal objetivo dessa tese é a proposição de um processo para geração de um modelo preditivo de evasão escolar baseada em Ciências de Dados. Para tal, uma sequência de etapas é definida, a fim de modelar um fluxo de informação, desde a definição do problema até a geração de informação útil a gestores e professores. As etapas são compostas por: "Entender o Problema", "Entender os Dados", "Engenharia de Atributos", "Seleção de Atributos", "Balanceamento de Dados", "Modelos", "Avaliação"e "Interpretação". A contribuição da proposta se encontra na indicação de quais técnicas e algoritmos devem ser empregados em cada etapa do processo apresentado, e na exposição de que o fenômeno de evasão escolar deve ser abordado como um problema de classes desbalanceadas, a qual deve utilizar-se de ferramentas e métricas apropriadas, a fim de gerar um modelo de predição robusto e de fácil interpretação. O processo proposto foi validado sobre dados educacionais, socioeconômicos e demográficos de alunos de cursos integrados do Instituto Federal do Rio Grande do Norte (IFRN). |
publishDate |
2020 |
dc.date.issued.fl_str_mv |
2020-10-22 |
dc.date.accessioned.fl_str_mv |
2021-03-17T23:53:23Z |
dc.date.available.fl_str_mv |
2021-03-17T23:53:23Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
BARROS, Thiago Medeiros. Um processo orientado a dados para geração de modelo de predição de evasão escolar. 2020. 116f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2020. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufrn.br/handle/123456789/31933 |
identifier_str_mv |
BARROS, Thiago Medeiros. Um processo orientado a dados para geração de modelo de predição de evasão escolar. 2020. 116f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2020. |
url |
https://repositorio.ufrn.br/handle/123456789/31933 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte |
dc.publisher.program.fl_str_mv |
PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO |
dc.publisher.initials.fl_str_mv |
UFRN |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRN instname:Universidade Federal do Rio Grande do Norte (UFRN) instacron:UFRN |
instname_str |
Universidade Federal do Rio Grande do Norte (UFRN) |
instacron_str |
UFRN |
institution |
UFRN |
reponame_str |
Repositório Institucional da UFRN |
collection |
Repositório Institucional da UFRN |
bitstream.url.fl_str_mv |
https://repositorio.ufrn.br/bitstream/123456789/31933/2/Processoorientadodados_Barros_2020.pdf.txt https://repositorio.ufrn.br/bitstream/123456789/31933/3/Processoorientadodados_Barros_2020.pdf.jpg https://repositorio.ufrn.br/bitstream/123456789/31933/1/Processoorientadodados_Barros_2020.pdf |
bitstream.checksum.fl_str_mv |
64cd9433bf2c5bc98ff16a2abaee5d07 be153846281dea395c725cb1756345ae 624d289667c1102c49e3d431825405eb |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN) |
repository.mail.fl_str_mv |
|
_version_ |
1814832697203228672 |