Identificação de padrões para a análise da evasão em cursos de graduação usando mineração de dados educacionais
Autor(a) principal: | |
---|---|
Data de Publicação: | 2015 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
Texto Completo: | http://repositorio.utfpr.edu.br/jspui/handle/1/1995 |
Resumo: | A mineração de dados educacionais é uma área recente de pesquisa que está ganhando popularidade por causa de seus potenciais para as instituições de ensino. Um dos desafios dessas instituições é a redução da evasão escolar. A evasão no ensino superior é um fenômeno em crescimento e tornou-se foco de preocupação para pesquisadores de diferentes áreas. Entretanto, as características da evasão ainda são pouco estudadas e há carência de informações e modelos de identificação dos seus motivos. Esta pesquisa propõe uma abordagem computacional para a identificação de padrões a serem utilizados na análise da evasão de estudantes em cursos presenciais de graduação, a fim de auxiliar os tomadores de decisão das instituições de ensino. Propõe-se um método para seleção dos melhores atributos para tarefa de classificação, que considera as classes “haverá evasão” e “não haverá evasão”, baseado na seleção e criação de atributos. Os experimentos foram realizados com dados de alunos da Universidade Tecnológica Federal do Paraná, consolidados em um Data Warehouse, que permitiu investigar a evasão entre os anos de 1980 e 2014. Nesta pesquisa são abordados os problemas mais comuns que ocorrem na mineração de dados educacionais, como a seleção do subconjunto de atributos, dados desbalanceados, valores discrepantes e sobreajuste. Os resultados experimentais apresentam os atributos mais relevantes a previsão da evasão, indicando a contribuição da criação de atributos na tarefa de mineração de dados, permitindo com estas inferências apoiar a tomada de decisão pelos gestores educacionais situados nos níveis estratégico, tático e operacional. |
id |
UTFPR-12_2c6617234f7e7a7c83b880508c62db6b |
---|---|
oai_identifier_str |
oai:repositorio.utfpr.edu.br:1/1995 |
network_acronym_str |
UTFPR-12 |
network_name_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
repository_id_str |
|
spelling |
2017-02-23T18:05:17Z2017-02-23T18:05:17Z2015-12-08OLIVEIRA JÚNIOR, José Gonçalves de. Identificação de padrões para a análise da evasão em cursos de graduação usando mineração de dados educacionais. 2015. 86 f. Dissertação (Mestrado em Computação Aplicada) - Universidade Tecnológica Federal do Paraná, Curitiba, 2015.http://repositorio.utfpr.edu.br/jspui/handle/1/1995A mineração de dados educacionais é uma área recente de pesquisa que está ganhando popularidade por causa de seus potenciais para as instituições de ensino. Um dos desafios dessas instituições é a redução da evasão escolar. A evasão no ensino superior é um fenômeno em crescimento e tornou-se foco de preocupação para pesquisadores de diferentes áreas. Entretanto, as características da evasão ainda são pouco estudadas e há carência de informações e modelos de identificação dos seus motivos. Esta pesquisa propõe uma abordagem computacional para a identificação de padrões a serem utilizados na análise da evasão de estudantes em cursos presenciais de graduação, a fim de auxiliar os tomadores de decisão das instituições de ensino. Propõe-se um método para seleção dos melhores atributos para tarefa de classificação, que considera as classes “haverá evasão” e “não haverá evasão”, baseado na seleção e criação de atributos. Os experimentos foram realizados com dados de alunos da Universidade Tecnológica Federal do Paraná, consolidados em um Data Warehouse, que permitiu investigar a evasão entre os anos de 1980 e 2014. Nesta pesquisa são abordados os problemas mais comuns que ocorrem na mineração de dados educacionais, como a seleção do subconjunto de atributos, dados desbalanceados, valores discrepantes e sobreajuste. Os resultados experimentais apresentam os atributos mais relevantes a previsão da evasão, indicando a contribuição da criação de atributos na tarefa de mineração de dados, permitindo com estas inferências apoiar a tomada de decisão pelos gestores educacionais situados nos níveis estratégico, tático e operacional.Educational data mining is a recent research area that is gaining popularity because of their potential for educational institutions. One of the challenges of these institutions is to reduce the course dropout. The dropout in higher education is a phenomenon in growth and has become the focus of concern for researchers from different areas. However, the avoidance features are poorly studied and there is a lack of information and identification of models of their motives. This research proposes a computational approach for identifying patterns to be used in the analysis of dropout students in undergraduate classroom courses, in order to assist decision-makers in educational institutions. The proposed method selects the best attributes for classification task, in which the classes “dropout” and “non-dropout” are considered, based on the feature subset selection and feature creation. The experiments were conducted with the undergraduate students’ data at the Federal University of Technology - Paraná, consolidated in a Data Warehouse, that allowed the dropout investigation between the years 1980 and 2014. In this research are discussed the most common problems that occur in educational data mining, such as feature subset selection, unbalanced data, outliers and overfitting. The experimental results show the most relevant attributes to dropout prediction, indicating the contribution of the feature creation in the data mining task, allowing with these inferences to support the decision-making by educational managers located in strategic, tactical and operational levels.porUniversidade Tecnológica Federal do ParanáCuritibaPrograma de Pós-Graduação em Computação AplicadaUTFPRBrasilCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOUniversidade Tecnológica Federal do ParanáMineração de dados (Computação)Evasão escolarComputaçãoData miningDropoutsComputer scienceIdentificação de padrões para a análise da evasão em cursos de graduação usando mineração de dados educacionaisPattern identification for dropout analysis in undergraduate courses usinge educational data mininginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisCuritibaKaestner, Celso Antônio Alveshttp://lattes.cnpq.br/3979454625416654Noronha, Robinson Vidahttp://lattes.cnpq.br/5337565921995591Kaestner, Celso Antônio AlvesNoronha, Robinson VidaSilva, Leandro Augusto daBastos, Laudelino Cordeirohttp://lattes.cnpq.br/1437274162865693Oliveira Júnior, José Gonçalves deinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRTHUMBNAILCT_PPGCA_M_Oliveira Junior, José Gonçalves_2015.pdf.jpgCT_PPGCA_M_Oliveira Junior, José Gonçalves_2015.pdf.jpgGenerated Thumbnailimage/jpeg1374http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/1995/4/CT_PPGCA_M_Oliveira%20Junior%2c%20Jos%c3%a9%20Gon%c3%a7alves_2015.pdf.jpg93c5696551227d6dcdca228d66e2c6a3MD54TEXTCT_PPGCA_M_Oliveira Junior, José Gonçalves_2015.pdf.txtCT_PPGCA_M_Oliveira Junior, José Gonçalves_2015.pdf.txtExtracted texttext/plain167600http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/1995/3/CT_PPGCA_M_Oliveira%20Junior%2c%20Jos%c3%a9%20Gon%c3%a7alves_2015.pdf.txtde82bbf1bc8adf1813a58d25dc4ee342MD53ORIGINALCT_PPGCA_M_Oliveira Junior, José Gonçalves_2015.pdfCT_PPGCA_M_Oliveira Junior, José Gonçalves_2015.pdfapplication/pdf2249213http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/1995/1/CT_PPGCA_M_Oliveira%20Junior%2c%20Jos%c3%a9%20Gon%c3%a7alves_2015.pdfeffa9c7381dfc6b506dfffee2ca084bcMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81290http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/1995/2/license.txtb9d82215ab23456fa2d8b49c5df1b95bMD521/19952017-02-24 03:00:42.926oai:repositorio.utfpr.edu.br:1/1995TmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbywgYXV0b3Jpem8gYSBVVEZQUiBhIHZlaWN1bGFyLCAKYXRyYXbDqXMgZG8gUG9ydGFsIGRlIEluZm9ybWHDp8OjbyBlbSBBY2Vzc28gQWJlcnRvIChQSUFBKSBlIGRvcyBDYXTDoWxvZ29zIGRhcyBCaWJsaW90ZWNhcyAKZGVzdGEgSW5zdGl0dWnDp8Ojbywgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBkZSBhY29yZG8gY29tIGEgTGVpIG5vIDkuNjEwLzk4LCAKbyB0ZXh0byBkZXN0YSBvYnJhLCBvYnNlcnZhbmRvIGFzIGNvbmRpw6fDtWVzIGRlIGRpc3BvbmliaWxpemHDp8OjbyByZWdpc3RyYWRhcyBubyBpdGVtIDQgZG8gCuKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgVHJhYmFsaG9zIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28gZGUgR3JhZHVhw6fDo28gZSAKRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgZGUgSW5mb3JtYcOnw6NvIGUgbm9zIENhdMOhbG9nb3MgRWxldHLDtG5pY29zIGRvIApTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkLCB2aXNhbmRvIGEgCmRpdnVsZ2HDp8OjbyBkYSBwcm9kdcOnw6NvIGNpZW50w61maWNhIGJyYXNpbGVpcmEuCgogIEFzIHZpYXMgb3JpZ2luYWlzIGUgYXNzaW5hZGFzIHBlbG8ocykgYXV0b3IoZXMpIGRvIOKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgClRyYWJhbGhvcyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvIGRlIEdyYWR1YcOnw6NvIGUgRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgCmRlIEluZm9ybWHDp8OjbyBlIG5vcyBDYXTDoWxvZ29zIEVsZXRyw7RuaWNvcyBkbyBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdIGUgZGEg4oCcRGVjbGFyYcOnw6NvIApkZSBBdXRvcmlh4oCdIGVuY29udHJhbS1zZSBhcnF1aXZhZGFzIG5hIEJpYmxpb3RlY2EgZG8gQ8OibXB1cyBubyBxdWFsIG8gdHJhYmFsaG8gZm9pIGRlZmVuZGlkby4gCk5vIGNhc28gZGUgcHVibGljYcOnw7VlcyBkZSBhdXRvcmlhIGNvbGV0aXZhIGUgbXVsdGljw6JtcHVzLCBvcyBkb2N1bWVudG9zIGZpY2Fyw6NvIHNvYiBndWFyZGEgZGEgCkJpYmxpb3RlY2EgY29tIGEgcXVhbCBvIOKAnHByaW1laXJvIGF1dG9y4oCdIHBvc3N1YSB2w61uY3Vsby4KRepositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2017-02-24T06:00:42Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false |
dc.title.pt_BR.fl_str_mv |
Identificação de padrões para a análise da evasão em cursos de graduação usando mineração de dados educacionais |
dc.title.alternative.pt_BR.fl_str_mv |
Pattern identification for dropout analysis in undergraduate courses usinge educational data mining |
title |
Identificação de padrões para a análise da evasão em cursos de graduação usando mineração de dados educacionais |
spellingShingle |
Identificação de padrões para a análise da evasão em cursos de graduação usando mineração de dados educacionais Oliveira Júnior, José Gonçalves de CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO Universidade Tecnológica Federal do Paraná Mineração de dados (Computação) Evasão escolar Computação Data mining Dropouts Computer science |
title_short |
Identificação de padrões para a análise da evasão em cursos de graduação usando mineração de dados educacionais |
title_full |
Identificação de padrões para a análise da evasão em cursos de graduação usando mineração de dados educacionais |
title_fullStr |
Identificação de padrões para a análise da evasão em cursos de graduação usando mineração de dados educacionais |
title_full_unstemmed |
Identificação de padrões para a análise da evasão em cursos de graduação usando mineração de dados educacionais |
title_sort |
Identificação de padrões para a análise da evasão em cursos de graduação usando mineração de dados educacionais |
author |
Oliveira Júnior, José Gonçalves de |
author_facet |
Oliveira Júnior, José Gonçalves de |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Kaestner, Celso Antônio Alves |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/3979454625416654 |
dc.contributor.advisor-co1.fl_str_mv |
Noronha, Robinson Vida |
dc.contributor.advisor-co1Lattes.fl_str_mv |
http://lattes.cnpq.br/5337565921995591 |
dc.contributor.referee1.fl_str_mv |
Kaestner, Celso Antônio Alves |
dc.contributor.referee2.fl_str_mv |
Noronha, Robinson Vida |
dc.contributor.referee3.fl_str_mv |
Silva, Leandro Augusto da |
dc.contributor.referee4.fl_str_mv |
Bastos, Laudelino Cordeiro |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/1437274162865693 |
dc.contributor.author.fl_str_mv |
Oliveira Júnior, José Gonçalves de |
contributor_str_mv |
Kaestner, Celso Antônio Alves Noronha, Robinson Vida Kaestner, Celso Antônio Alves Noronha, Robinson Vida Silva, Leandro Augusto da Bastos, Laudelino Cordeiro |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO Universidade Tecnológica Federal do Paraná Mineração de dados (Computação) Evasão escolar Computação Data mining Dropouts Computer science |
dc.subject.por.fl_str_mv |
Universidade Tecnológica Federal do Paraná Mineração de dados (Computação) Evasão escolar Computação Data mining Dropouts Computer science |
description |
A mineração de dados educacionais é uma área recente de pesquisa que está ganhando popularidade por causa de seus potenciais para as instituições de ensino. Um dos desafios dessas instituições é a redução da evasão escolar. A evasão no ensino superior é um fenômeno em crescimento e tornou-se foco de preocupação para pesquisadores de diferentes áreas. Entretanto, as características da evasão ainda são pouco estudadas e há carência de informações e modelos de identificação dos seus motivos. Esta pesquisa propõe uma abordagem computacional para a identificação de padrões a serem utilizados na análise da evasão de estudantes em cursos presenciais de graduação, a fim de auxiliar os tomadores de decisão das instituições de ensino. Propõe-se um método para seleção dos melhores atributos para tarefa de classificação, que considera as classes “haverá evasão” e “não haverá evasão”, baseado na seleção e criação de atributos. Os experimentos foram realizados com dados de alunos da Universidade Tecnológica Federal do Paraná, consolidados em um Data Warehouse, que permitiu investigar a evasão entre os anos de 1980 e 2014. Nesta pesquisa são abordados os problemas mais comuns que ocorrem na mineração de dados educacionais, como a seleção do subconjunto de atributos, dados desbalanceados, valores discrepantes e sobreajuste. Os resultados experimentais apresentam os atributos mais relevantes a previsão da evasão, indicando a contribuição da criação de atributos na tarefa de mineração de dados, permitindo com estas inferências apoiar a tomada de decisão pelos gestores educacionais situados nos níveis estratégico, tático e operacional. |
publishDate |
2015 |
dc.date.issued.fl_str_mv |
2015-12-08 |
dc.date.accessioned.fl_str_mv |
2017-02-23T18:05:17Z |
dc.date.available.fl_str_mv |
2017-02-23T18:05:17Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
OLIVEIRA JÚNIOR, José Gonçalves de. Identificação de padrões para a análise da evasão em cursos de graduação usando mineração de dados educacionais. 2015. 86 f. Dissertação (Mestrado em Computação Aplicada) - Universidade Tecnológica Federal do Paraná, Curitiba, 2015. |
dc.identifier.uri.fl_str_mv |
http://repositorio.utfpr.edu.br/jspui/handle/1/1995 |
identifier_str_mv |
OLIVEIRA JÚNIOR, José Gonçalves de. Identificação de padrões para a análise da evasão em cursos de graduação usando mineração de dados educacionais. 2015. 86 f. Dissertação (Mestrado em Computação Aplicada) - Universidade Tecnológica Federal do Paraná, Curitiba, 2015. |
url |
http://repositorio.utfpr.edu.br/jspui/handle/1/1995 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Curitiba |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Computação Aplicada |
dc.publisher.initials.fl_str_mv |
UTFPR |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Curitiba |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) instname:Universidade Tecnológica Federal do Paraná (UTFPR) instacron:UTFPR |
instname_str |
Universidade Tecnológica Federal do Paraná (UTFPR) |
instacron_str |
UTFPR |
institution |
UTFPR |
reponame_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
collection |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
bitstream.url.fl_str_mv |
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/1995/4/CT_PPGCA_M_Oliveira%20Junior%2c%20Jos%c3%a9%20Gon%c3%a7alves_2015.pdf.jpg http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/1995/3/CT_PPGCA_M_Oliveira%20Junior%2c%20Jos%c3%a9%20Gon%c3%a7alves_2015.pdf.txt http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/1995/1/CT_PPGCA_M_Oliveira%20Junior%2c%20Jos%c3%a9%20Gon%c3%a7alves_2015.pdf http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/1995/2/license.txt |
bitstream.checksum.fl_str_mv |
93c5696551227d6dcdca228d66e2c6a3 de82bbf1bc8adf1813a58d25dc4ee342 effa9c7381dfc6b506dfffee2ca084bc b9d82215ab23456fa2d8b49c5df1b95b |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR) |
repository.mail.fl_str_mv |
|
_version_ |
1805922899176980480 |