Predição do risco de evasão dos cursos técnicos a distância do IFPI : uma aplicação da metodologia CRISP-DM em dados educacionais
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFRPE |
Texto Completo: | http://www.tede2.ufrpe.br:8080/tede2/handle/tede2/7950 |
Resumo: | This study aims to understand the contribution of knowledge discovery in educational databases through the application of the Cross Industry Standard Process for Data Mining (CRISP-DM) methodology to the problem of school dropout from distance learning courses. Thus, the main goal was to adapt a data mining process to estimate the evasion risk of students from Secondary Technical Level Courses, in the Distance Learning modality, on the Federal Institute of Piauí (IFPI), under the aforementioned methodology. To do so, it was necessary to understand the knowledge discovery over high volume data and the CRISP-DM methodology as a paradigm of educational data mining; To apply the CRISP-DM methodology to identify the common characteristics of students who drop out of the technical distance courses of the IFPI, in order to allow the management coordination a chance to proceed with preventive intervention; And to evaluate the risk of evasion of students from technical courses in the Distance Learning modality on the IFPI, based on academic data of incoming students from the year 2013. The research has quantitative, documental, descriptive and applied approaches. We used the first five phases of the CRISP-DM methodology in data collected from the socioeconomic questionnaires, and the final situation of the students regarding the classification of evaded or not evaded after the first semester of the Distance Learning Technical Course in Work Safety of the Federal Institute of Education, Science and Technology of Piauí, Campus Teresina Zona Sul. Data collection was done through Google form and the data integration was done using the Excel 2010 software. In order to identify the predictor variables that explain the target variable, school dropout, we used logistic regression through the Ordinary Least Squares (OLS) function of Gretl 2016c software. In light of this study, it is possible to say that the use of data mining techniques following the CRISP-DM methodology based on distance learning courses can also contribute to courses in any modalities regarding the search for strategies against school dropout. |
id |
URPE_6ebe32e148557c0767deb92da77ac06e |
---|---|
oai_identifier_str |
oai:tede2:tede2/7950 |
network_acronym_str |
URPE |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFRPE |
repository_id_str |
|
spelling |
SALAZAR, Domingos Sávio PereiraDINIZ, Juliana Regueira BastoSOUZA, Rodrigo Nonamor Pereira Mariano deCORREIA NETO, Jorge da Silvahttp://lattes.cnpq.br/4798683027793177PÁDUA, Antonio Francisco Lima de Oliveira2019-04-10T13:43:04Z2017-08-23PÁDUA, Antonio Francisco Lima de Oliveira. Predição do risco de evasão dos cursos técnicos a distância do IFPI : uma aplicação da metodologia CRISP-DM em dados educacionais. 2017. 75 f. Dissertação (Programa de Pós-Graduação em Tecnologia e Gestão em Educação a Distância) - Universidade Federal Rural de Pernambuco, Recife.http://www.tede2.ufrpe.br:8080/tede2/handle/tede2/7950This study aims to understand the contribution of knowledge discovery in educational databases through the application of the Cross Industry Standard Process for Data Mining (CRISP-DM) methodology to the problem of school dropout from distance learning courses. Thus, the main goal was to adapt a data mining process to estimate the evasion risk of students from Secondary Technical Level Courses, in the Distance Learning modality, on the Federal Institute of Piauí (IFPI), under the aforementioned methodology. To do so, it was necessary to understand the knowledge discovery over high volume data and the CRISP-DM methodology as a paradigm of educational data mining; To apply the CRISP-DM methodology to identify the common characteristics of students who drop out of the technical distance courses of the IFPI, in order to allow the management coordination a chance to proceed with preventive intervention; And to evaluate the risk of evasion of students from technical courses in the Distance Learning modality on the IFPI, based on academic data of incoming students from the year 2013. The research has quantitative, documental, descriptive and applied approaches. We used the first five phases of the CRISP-DM methodology in data collected from the socioeconomic questionnaires, and the final situation of the students regarding the classification of evaded or not evaded after the first semester of the Distance Learning Technical Course in Work Safety of the Federal Institute of Education, Science and Technology of Piauí, Campus Teresina Zona Sul. Data collection was done through Google form and the data integration was done using the Excel 2010 software. In order to identify the predictor variables that explain the target variable, school dropout, we used logistic regression through the Ordinary Least Squares (OLS) function of Gretl 2016c software. In light of this study, it is possible to say that the use of data mining techniques following the CRISP-DM methodology based on distance learning courses can also contribute to courses in any modalities regarding the search for strategies against school dropout.Este estudo busca compreender a contribuição da descoberta de conhecimento em bases de dados educacionais aplicando a metodologia Cross Industry Standard Process for Data Mining (CRISP-DM) no problema da evasão escolar de cursos na modalidade a distância. Assim, teve como objetivo geral adaptar um processo de mineração de dados para estimar o risco de evasão de alunos de Cursos Técnicos de Nível Médio, na modalidade a distância, do Instituto Federal do Piauí (IFPI), sob as etapas da metodologia aludida. Para tanto, foi necessário, entender a descoberta de conhecimento sobre dados de grande volume e a metodologia CRISP-DM como paradigma de mineração de dados educacionais; aplicar a metodologia CRISP-DM para identificar as características comuns de alunos que evadem dos Cursos técnicos a distância do IFPI, para intervenção preventiva da coordenação gestora; e avaliar o risco da evasão de alunos de cursos técnicos na modalidade EAD do IFPI, a partir de dados acadêmicos de alunos ingressantes no ano 2013. A pesquisa possui abordagem quantitativa, documental, descritiva e aplicada. Utilizamos as cinco primeiras fases da metodologia CRISP-DM em dados coletados dos questionários socioeconômicos, e situação final dos alunos no que tange a classificação de evadido ou não evadido após o primeiro semestre do Curso Técnico de Nível Médio em Segurança do Trabalho, na modalidade a distância, do Instituto Federal de Educação, Ciência e Tecnologia do Piauí, Campus Teresina Zona Sul. A coleta de dados foi realizada através do Google formulário e integrados utilizando o software Excel 2010. Para identificação das variáveis preditoras que explicam a variável alvo, evasão, utilizamos a regressão logística através da função Mínimos Quadrados Ordinários (MQO) do software Gretl 2016c. Em face deste estudo, é possível dizer que o uso de técnicas de mineração de dados seguindo a metodologia CRISP-DM em base proveniente de cursos a distância também pode contribuir para cursos em quaisquer modalidades no que concerne a busca por estratégias contra a evasão escolar.Submitted by Mario BC (mario@bc.ufrpe.br) on 2019-04-10T13:43:04Z No. of bitstreams: 1 Antonio Francisco Lima de Oliveira Padua.pdf: 2303189 bytes, checksum: 4c8f6edac74f58f24da59912e5ad1d12 (MD5)Made available in DSpace on 2019-04-10T13:43:04Z (GMT). No. of bitstreams: 1 Antonio Francisco Lima de Oliveira Padua.pdf: 2303189 bytes, checksum: 4c8f6edac74f58f24da59912e5ad1d12 (MD5) Previous issue date: 2017-08-23application/pdfporUniversidade Federal Rural de PernambucoPrograma de Pós-Graduação em Tecnologia e Gestão em Educação a DistânciaUFRPEBrasilUnidade Acadêmica de Educação a Distância e TecnologiaEvasão escolarEducação a distânciaEnsino técnicoCIENCIAS HUMANAS::EDUCACAOPredição do risco de evasão dos cursos técnicos a distância do IFPI : uma aplicação da metodologia CRISP-DM em dados educacionaisinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis-1507696901338236785600600600-4680941754421711741-240345818910352367info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRPEinstname:Universidade Federal Rural de Pernambuco (UFRPE)instacron:UFRPEORIGINALAntonio Francisco Lima de Oliveira Padua.pdfAntonio Francisco Lima de Oliveira Padua.pdfapplication/pdf2303189http://www.tede2.ufrpe.br:8080/tede2/bitstream/tede2/7950/2/Antonio+Francisco+Lima+de+Oliveira+Padua.pdf4c8f6edac74f58f24da59912e5ad1d12MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82165http://www.tede2.ufrpe.br:8080/tede2/bitstream/tede2/7950/1/license.txtbd3efa91386c1718a7f26a329fdcb468MD51tede2/79502023-09-22 16:34:04.297oai:tede2:tede2/7950Tk9UQTogQ09MT1FVRSBBUVVJIEEgU1VBIFBSw5NQUklBIExJQ0VOw4dBCkVzdGEgbGljZW7Dp2EgZGUgZXhlbXBsbyDDqSBmb3JuZWNpZGEgYXBlbmFzIHBhcmEgZmlucyBpbmZvcm1hdGl2b3MuCgpMSUNFTsOHQSBERSBESVNUUklCVUnDh8ODTyBOw4NPLUVYQ0xVU0lWQQoKQ29tIGEgYXByZXNlbnRhw6fDo28gZGVzdGEgbGljZW7Dp2EsIHZvY8OqIChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSDDoCBVbml2ZXJzaWRhZGUgClhYWCAoU2lnbGEgZGEgVW5pdmVyc2lkYWRlKSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUgcmVwcm9kdXppciwgIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pLCBlL291IApkaXN0cmlidWlyIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0csO0bmljbyBlIAplbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KClZvY8OqIGNvbmNvcmRhIHF1ZSBhIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhbnNwb3IgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIApwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIHRhbWLDqW0gY29uY29yZGEgcXVlIGEgU2lnbGEgZGUgVW5pdmVyc2lkYWRlIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBhIHN1YSB0ZXNlIG91IApkaXNzZXJ0YcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyAKbmVzdGEgbGljZW7Dp2EuIFZvY8OqIHRhbWLDqW0gZGVjbGFyYSBxdWUgbyBkZXDDs3NpdG8gZGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBuw6NvLCBxdWUgc2VqYSBkZSBzZXUgCmNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiAKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIMOgIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSAKb3MgZGlyZWl0b3MgYXByZXNlbnRhZG9zIG5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIAppZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBubyBjb250ZcO6ZG8gZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFRFU0UgT1UgRElTU0VSVEHDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSAKQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBTSUdMQSBERSAKVU5JVkVSU0lEQURFLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyAKVEFNQsOJTSBBUyBERU1BSVMgT0JSSUdBw4fDlUVTIEVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpBIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lIChzKSBvdSBvKHMpIG5vbWUocykgZG8ocykgCmRldGVudG9yKGVzKSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzIApjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgo=Biblioteca Digital de Teses e Dissertaçõeshttp://www.tede2.ufrpe.br:8080/tede/PUBhttp://www.tede2.ufrpe.br:8080/oai/requestbdtd@ufrpe.br ||bdtd@ufrpe.bropendoar:2024-05-28T12:36:19.577488Biblioteca Digital de Teses e Dissertações da UFRPE - Universidade Federal Rural de Pernambuco (UFRPE)false |
dc.title.por.fl_str_mv |
Predição do risco de evasão dos cursos técnicos a distância do IFPI : uma aplicação da metodologia CRISP-DM em dados educacionais |
title |
Predição do risco de evasão dos cursos técnicos a distância do IFPI : uma aplicação da metodologia CRISP-DM em dados educacionais |
spellingShingle |
Predição do risco de evasão dos cursos técnicos a distância do IFPI : uma aplicação da metodologia CRISP-DM em dados educacionais PÁDUA, Antonio Francisco Lima de Oliveira Evasão escolar Educação a distância Ensino técnico CIENCIAS HUMANAS::EDUCACAO |
title_short |
Predição do risco de evasão dos cursos técnicos a distância do IFPI : uma aplicação da metodologia CRISP-DM em dados educacionais |
title_full |
Predição do risco de evasão dos cursos técnicos a distância do IFPI : uma aplicação da metodologia CRISP-DM em dados educacionais |
title_fullStr |
Predição do risco de evasão dos cursos técnicos a distância do IFPI : uma aplicação da metodologia CRISP-DM em dados educacionais |
title_full_unstemmed |
Predição do risco de evasão dos cursos técnicos a distância do IFPI : uma aplicação da metodologia CRISP-DM em dados educacionais |
title_sort |
Predição do risco de evasão dos cursos técnicos a distância do IFPI : uma aplicação da metodologia CRISP-DM em dados educacionais |
author |
PÁDUA, Antonio Francisco Lima de Oliveira |
author_facet |
PÁDUA, Antonio Francisco Lima de Oliveira |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
SALAZAR, Domingos Sávio Pereira |
dc.contributor.referee1.fl_str_mv |
DINIZ, Juliana Regueira Basto |
dc.contributor.referee2.fl_str_mv |
SOUZA, Rodrigo Nonamor Pereira Mariano de |
dc.contributor.referee3.fl_str_mv |
CORREIA NETO, Jorge da Silva |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/4798683027793177 |
dc.contributor.author.fl_str_mv |
PÁDUA, Antonio Francisco Lima de Oliveira |
contributor_str_mv |
SALAZAR, Domingos Sávio Pereira DINIZ, Juliana Regueira Basto SOUZA, Rodrigo Nonamor Pereira Mariano de CORREIA NETO, Jorge da Silva |
dc.subject.por.fl_str_mv |
Evasão escolar Educação a distância Ensino técnico |
topic |
Evasão escolar Educação a distância Ensino técnico CIENCIAS HUMANAS::EDUCACAO |
dc.subject.cnpq.fl_str_mv |
CIENCIAS HUMANAS::EDUCACAO |
description |
This study aims to understand the contribution of knowledge discovery in educational databases through the application of the Cross Industry Standard Process for Data Mining (CRISP-DM) methodology to the problem of school dropout from distance learning courses. Thus, the main goal was to adapt a data mining process to estimate the evasion risk of students from Secondary Technical Level Courses, in the Distance Learning modality, on the Federal Institute of Piauí (IFPI), under the aforementioned methodology. To do so, it was necessary to understand the knowledge discovery over high volume data and the CRISP-DM methodology as a paradigm of educational data mining; To apply the CRISP-DM methodology to identify the common characteristics of students who drop out of the technical distance courses of the IFPI, in order to allow the management coordination a chance to proceed with preventive intervention; And to evaluate the risk of evasion of students from technical courses in the Distance Learning modality on the IFPI, based on academic data of incoming students from the year 2013. The research has quantitative, documental, descriptive and applied approaches. We used the first five phases of the CRISP-DM methodology in data collected from the socioeconomic questionnaires, and the final situation of the students regarding the classification of evaded or not evaded after the first semester of the Distance Learning Technical Course in Work Safety of the Federal Institute of Education, Science and Technology of Piauí, Campus Teresina Zona Sul. Data collection was done through Google form and the data integration was done using the Excel 2010 software. In order to identify the predictor variables that explain the target variable, school dropout, we used logistic regression through the Ordinary Least Squares (OLS) function of Gretl 2016c software. In light of this study, it is possible to say that the use of data mining techniques following the CRISP-DM methodology based on distance learning courses can also contribute to courses in any modalities regarding the search for strategies against school dropout. |
publishDate |
2017 |
dc.date.issued.fl_str_mv |
2017-08-23 |
dc.date.accessioned.fl_str_mv |
2019-04-10T13:43:04Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
PÁDUA, Antonio Francisco Lima de Oliveira. Predição do risco de evasão dos cursos técnicos a distância do IFPI : uma aplicação da metodologia CRISP-DM em dados educacionais. 2017. 75 f. Dissertação (Programa de Pós-Graduação em Tecnologia e Gestão em Educação a Distância) - Universidade Federal Rural de Pernambuco, Recife. |
dc.identifier.uri.fl_str_mv |
http://www.tede2.ufrpe.br:8080/tede2/handle/tede2/7950 |
identifier_str_mv |
PÁDUA, Antonio Francisco Lima de Oliveira. Predição do risco de evasão dos cursos técnicos a distância do IFPI : uma aplicação da metodologia CRISP-DM em dados educacionais. 2017. 75 f. Dissertação (Programa de Pós-Graduação em Tecnologia e Gestão em Educação a Distância) - Universidade Federal Rural de Pernambuco, Recife. |
url |
http://www.tede2.ufrpe.br:8080/tede2/handle/tede2/7950 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.program.fl_str_mv |
-1507696901338236785 |
dc.relation.confidence.fl_str_mv |
600 600 600 |
dc.relation.department.fl_str_mv |
-4680941754421711741 |
dc.relation.cnpq.fl_str_mv |
-240345818910352367 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal Rural de Pernambuco |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Tecnologia e Gestão em Educação a Distância |
dc.publisher.initials.fl_str_mv |
UFRPE |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Unidade Acadêmica de Educação a Distância e Tecnologia |
publisher.none.fl_str_mv |
Universidade Federal Rural de Pernambuco |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRPE instname:Universidade Federal Rural de Pernambuco (UFRPE) instacron:UFRPE |
instname_str |
Universidade Federal Rural de Pernambuco (UFRPE) |
instacron_str |
UFRPE |
institution |
UFRPE |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRPE |
collection |
Biblioteca Digital de Teses e Dissertações da UFRPE |
bitstream.url.fl_str_mv |
http://www.tede2.ufrpe.br:8080/tede2/bitstream/tede2/7950/2/Antonio+Francisco+Lima+de+Oliveira+Padua.pdf http://www.tede2.ufrpe.br:8080/tede2/bitstream/tede2/7950/1/license.txt |
bitstream.checksum.fl_str_mv |
4c8f6edac74f58f24da59912e5ad1d12 bd3efa91386c1718a7f26a329fdcb468 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRPE - Universidade Federal Rural de Pernambuco (UFRPE) |
repository.mail.fl_str_mv |
bdtd@ufrpe.br ||bdtd@ufrpe.br |
_version_ |
1810102257005363200 |