Uma abordagem de ensemble regression para o disgnóstico de problemas educacionais
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPE |
Texto Completo: | https://repositorio.ufpe.br/handle/123456789/36047 |
Resumo: | Atualmente, os dados mostram situações alarmantes em relação a problemas da educação, como: niveis baixos de aprendizagem, evasão, reprovação, baixo desempenho em leitura e escrita, entre outros. Nas instituições educacionais, esses problemas são um grande obstáculo na busca pela qualidade na educação. Nesse contexto, é essencial identificar, antecipadamente, quais fatores estão associados a esses problemas. Para isso, utiliza-se técnicas de Mineração de Dados Educacionais (EDM). Essas técnicas são capazes de obter informações e organizar tais informações em conhecimento útil. A EDM requer adaptações de métodos existentes e o desenvolvimento de novas tecnologias. Essa diversidade nos dados representa um potencial para implementação de recursos críticos para auxiliar na melhoria da educação. Partindo dessa necessidade, este trabalho utilizou as teorias do desempenho escolar proposta por Andrade e Soares (2008), e as teorias da evasão proposta por Spady (1970), Vincent Tinto (1975, 1987, 1993), para propor uma abordagem baseada em EDM. Assim, essa abordagem determina a relação dos fatores associados com os problemas educacionais, como também, utiliza-se modelos combinados de regressão (Ensemble Regression - ER) para predição da evasão e do desempenho escolar. Mesmo existindo evidências na literatura do uso de diversas técnicas aplicadas a EDM, esses modelos ER reduzem o erro de predição e/ou a variância dos modelos individuais, alcançando melhor acurácia. A metodologia CRISP-DM (Cross Industry Standard Process for Data Mining) foi utilizada e aplicada nesse contexto. Para avaliar a predição dos modelos propostos, um ambiente experimental utilizando bases de dados educacionais reais foi utilizado e o desempenho foi avaliado por meio do erro médio absoluto. Por fim, foi proposta uma abordagem utilizando o diagrama de causa e efeito educacional com base nas teorias: evasão, desempenho escolar e nos resultados dos modelos de predição propostos para o diagnóstico dos problemas educacionais. Assim, essa abordagem serve como uma ferramenta de conhecimento e suporte aos agentes educacionais para a tomada de decisão e o desenvolvimento de estratégias de intervenção educacionais mais eficientes. |
id |
UFPE_efbe2e07f4d8f672b6c7e621f1da88b5 |
---|---|
oai_identifier_str |
oai:repositorio.ufpe.br:123456789/36047 |
network_acronym_str |
UFPE |
network_name_str |
Repositório Institucional da UFPE |
repository_id_str |
2221 |
spelling |
SILVA, Paulo Mello dahttp://lattes.cnpq.br/8976586263200932http://lattes.cnpq.br/7076371974874150SOUZA, Fernando da Fonseca de2020-01-17T12:15:00Z2020-01-17T12:15:00Z2019-09-12SILVA, Paulo Mello da. Uma abordagem de ensemble regression para o disgnóstico de problemas educacionais. 2019. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2019.https://repositorio.ufpe.br/handle/123456789/36047Atualmente, os dados mostram situações alarmantes em relação a problemas da educação, como: niveis baixos de aprendizagem, evasão, reprovação, baixo desempenho em leitura e escrita, entre outros. Nas instituições educacionais, esses problemas são um grande obstáculo na busca pela qualidade na educação. Nesse contexto, é essencial identificar, antecipadamente, quais fatores estão associados a esses problemas. Para isso, utiliza-se técnicas de Mineração de Dados Educacionais (EDM). Essas técnicas são capazes de obter informações e organizar tais informações em conhecimento útil. A EDM requer adaptações de métodos existentes e o desenvolvimento de novas tecnologias. Essa diversidade nos dados representa um potencial para implementação de recursos críticos para auxiliar na melhoria da educação. Partindo dessa necessidade, este trabalho utilizou as teorias do desempenho escolar proposta por Andrade e Soares (2008), e as teorias da evasão proposta por Spady (1970), Vincent Tinto (1975, 1987, 1993), para propor uma abordagem baseada em EDM. Assim, essa abordagem determina a relação dos fatores associados com os problemas educacionais, como também, utiliza-se modelos combinados de regressão (Ensemble Regression - ER) para predição da evasão e do desempenho escolar. Mesmo existindo evidências na literatura do uso de diversas técnicas aplicadas a EDM, esses modelos ER reduzem o erro de predição e/ou a variância dos modelos individuais, alcançando melhor acurácia. A metodologia CRISP-DM (Cross Industry Standard Process for Data Mining) foi utilizada e aplicada nesse contexto. Para avaliar a predição dos modelos propostos, um ambiente experimental utilizando bases de dados educacionais reais foi utilizado e o desempenho foi avaliado por meio do erro médio absoluto. Por fim, foi proposta uma abordagem utilizando o diagrama de causa e efeito educacional com base nas teorias: evasão, desempenho escolar e nos resultados dos modelos de predição propostos para o diagnóstico dos problemas educacionais. Assim, essa abordagem serve como uma ferramenta de conhecimento e suporte aos agentes educacionais para a tomada de decisão e o desenvolvimento de estratégias de intervenção educacionais mais eficientes.Currently, data show alarming situations related to educational problems, such as: low levels of learning, evasion, failure, low performance in reading and writing, amongst others. In educational institutions, such problems are a big obstacle in the search for the quality of education. In this context, it’s essential to identify, beforehand, which factors are associated to those problems. Therefore, educational data mining (EDM) techniques will be used. These techniques are able to obtain and organize useful knowledge. EDM requires adaptations of existing methods and development of new technologies. Such a diversity in data represents a potential for the implementation of critical resources to help improving education. Based on this necessity, this work has used the theories of school performance proposed by Andrade e Soares (2008), and the theories of evasion proposed by Spady (1970) and Vincent Tinto (1975, 1987, 1993), to propose an approach based on EDM. Thus, this approach determines the relationship between factors associated with educational problems, as well as the use of combined regression models (Ensemble Regression -ER) to predict dropout and academic performance. Even though there is evidence in the literature of the use of various techniques applied to EDM, models ER reduce the error and/or variance of the individual models achieving better accuracy. The methodology CRISP-DM (Cross Industry Standard Process for Data Mining) was used and applied in this context. To evaluate the prediction of the proposed models, an experimental environment using real educational databases was used and the performance was assessed through absolute mean error. Finally, an approach was proposed using the cause diagram and the effect educational based on the theories: evasion, academic performance, and in the results of the proposed prediction models for the diagnostic of educational problems. Therefore, this approach serves as a knowledge and support tool for educational agents for decision-making and the development of more effective educational intervention strategies.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da ComputacaoUFPEBrasilAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/embargoedAccessMineração de dadosDiagnóstico educacionalUma abordagem de ensemble regression para o disgnóstico de problemas educacionaisinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisdoutoradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPECC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/36047/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52ORIGINALTESE Paulo Mello da Silva.pdfTESE Paulo Mello da Silva.pdfapplication/pdf4003683https://repositorio.ufpe.br/bitstream/123456789/36047/1/TESE%20Paulo%20Mello%20da%20Silva.pdfce6f31e106aec1e900bb6c85ec06de7eMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-82310https://repositorio.ufpe.br/bitstream/123456789/36047/3/license.txtbd573a5ca8288eb7272482765f819534MD53TEXTTESE Paulo Mello da Silva.pdf.txtTESE Paulo Mello da Silva.pdf.txtExtracted texttext/plain344643https://repositorio.ufpe.br/bitstream/123456789/36047/4/TESE%20Paulo%20Mello%20da%20Silva.pdf.txt695c4c9f14cb5242e697bc8fc6c69926MD54THUMBNAILTESE Paulo Mello da Silva.pdf.jpgTESE Paulo Mello da Silva.pdf.jpgGenerated Thumbnailimage/jpeg1274https://repositorio.ufpe.br/bitstream/123456789/36047/5/TESE%20Paulo%20Mello%20da%20Silva.pdf.jpgb851c53257bed117fc5760fb33011e3cMD55123456789/360472020-01-18 02:15:39.041oai:repositorio.ufpe.br:123456789/36047TGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKClRvZG8gZGVwb3NpdGFudGUgZGUgbWF0ZXJpYWwgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgKFJJKSBkZXZlIGNvbmNlZGVyLCDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIChVRlBFKSwgdW1hIExpY2Vuw6dhIGRlIERpc3RyaWJ1acOnw6NvIE7Do28gRXhjbHVzaXZhIHBhcmEgbWFudGVyIGUgdG9ybmFyIGFjZXNzw612ZWlzIG9zIHNldXMgZG9jdW1lbnRvcywgZW0gZm9ybWF0byBkaWdpdGFsLCBuZXN0ZSByZXBvc2l0w7NyaW8uCgpDb20gYSBjb25jZXNzw6NvIGRlc3RhIGxpY2Vuw6dhIG7Do28gZXhjbHVzaXZhLCBvIGRlcG9zaXRhbnRlIG1hbnTDqW0gdG9kb3Mgb3MgZGlyZWl0b3MgZGUgYXV0b3IuCl9fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fXwoKTGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKCkFvIGNvbmNvcmRhciBjb20gZXN0YSBsaWNlbsOnYSBlIGFjZWl0w6EtbGEsIHZvY8OqIChhdXRvciBvdSBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMpOgoKYSkgRGVjbGFyYSBxdWUgY29uaGVjZSBhIHBvbMOtdGljYSBkZSBjb3B5cmlnaHQgZGEgZWRpdG9yYSBkbyBzZXUgZG9jdW1lbnRvOwpiKSBEZWNsYXJhIHF1ZSBjb25oZWNlIGUgYWNlaXRhIGFzIERpcmV0cml6ZXMgcGFyYSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEU7CmMpIENvbmNlZGUgw6AgVUZQRSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZGUgYXJxdWl2YXIsIHJlcHJvZHV6aXIsIGNvbnZlcnRlciAoY29tbyBkZWZpbmlkbyBhIHNlZ3VpciksIGNvbXVuaWNhciBlL291IGRpc3RyaWJ1aXIsIG5vIFJJLCBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vL2Fic3RyYWN0KSBlbSBmb3JtYXRvIGRpZ2l0YWwgb3UgcG9yIG91dHJvIG1laW87CmQpIERlY2xhcmEgcXVlIGF1dG9yaXphIGEgVUZQRSBhIGFycXVpdmFyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXN0ZSBkb2N1bWVudG8gZSBjb252ZXJ0w6otbG8sIHNlbSBhbHRlcmFyIG8gc2V1IGNvbnRlw7pkbywgcGFyYSBxdWFscXVlciBmb3JtYXRvIGRlIGZpY2hlaXJvLCBtZWlvIG91IHN1cG9ydGUsIHBhcmEgZWZlaXRvcyBkZSBzZWd1cmFuw6dhLCBwcmVzZXJ2YcOnw6NvIChiYWNrdXApIGUgYWNlc3NvOwplKSBEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBzdWJtZXRpZG8gw6kgbyBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBhIHRlcmNlaXJvcyBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2Ugb3MgZGlyZWl0b3MgZGUgb3V0cmEgcGVzc29hIG91IGVudGlkYWRlOwpmKSBEZWNsYXJhIHF1ZSwgbm8gY2FzbyBkbyBkb2N1bWVudG8gc3VibWV0aWRvIGNvbnRlciBtYXRlcmlhbCBkbyBxdWFsIG7Do28gZGV0w6ltIG9zIGRpcmVpdG9zIGRlCmF1dG9yLCBvYnRldmUgYSBhdXRvcml6YcOnw6NvIGlycmVzdHJpdGEgZG8gcmVzcGVjdGl2byBkZXRlbnRvciBkZXNzZXMgZGlyZWl0b3MgcGFyYSBjZWRlciDDoApVRlBFIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgTGljZW7Dp2EgZSBhdXRvcml6YXIgYSB1bml2ZXJzaWRhZGUgYSB1dGlsaXrDoS1sb3MgbGVnYWxtZW50ZS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBlc3NlIG1hdGVyaWFsIGN1am9zIGRpcmVpdG9zIHPDo28gZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRvIGRvY3VtZW50byBlbnRyZWd1ZTsKZykgU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVRlBFLCBkZWNsYXJhIHF1ZSBjdW1wcml1IHF1YWlzcXVlciBvYnJpZ2HDp8O1ZXMgZXhpZ2lkYXMgcGVsbyByZXNwZWN0aXZvIGNvbnRyYXRvIG91IGFjb3Jkby4KCkEgVUZQRSBpZGVudGlmaWNhcsOhIGNsYXJhbWVudGUgbyhzKSBub21lKHMpIGRvKHMpIGF1dG9yIChlcykgZG9zIGRpcmVpdG9zIGRvIGRvY3VtZW50byBlbnRyZWd1ZSBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIHBhcmEgYWzDqW0gZG8gcHJldmlzdG8gbmEgYWzDrW5lYSBjKS4KRepositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212020-01-18T05:15:39Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false |
dc.title.pt_BR.fl_str_mv |
Uma abordagem de ensemble regression para o disgnóstico de problemas educacionais |
title |
Uma abordagem de ensemble regression para o disgnóstico de problemas educacionais |
spellingShingle |
Uma abordagem de ensemble regression para o disgnóstico de problemas educacionais SILVA, Paulo Mello da Mineração de dados Diagnóstico educacional |
title_short |
Uma abordagem de ensemble regression para o disgnóstico de problemas educacionais |
title_full |
Uma abordagem de ensemble regression para o disgnóstico de problemas educacionais |
title_fullStr |
Uma abordagem de ensemble regression para o disgnóstico de problemas educacionais |
title_full_unstemmed |
Uma abordagem de ensemble regression para o disgnóstico de problemas educacionais |
title_sort |
Uma abordagem de ensemble regression para o disgnóstico de problemas educacionais |
author |
SILVA, Paulo Mello da |
author_facet |
SILVA, Paulo Mello da |
author_role |
author |
dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/8976586263200932 |
dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/7076371974874150 |
dc.contributor.author.fl_str_mv |
SILVA, Paulo Mello da |
dc.contributor.advisor1.fl_str_mv |
SOUZA, Fernando da Fonseca de |
contributor_str_mv |
SOUZA, Fernando da Fonseca de |
dc.subject.por.fl_str_mv |
Mineração de dados Diagnóstico educacional |
topic |
Mineração de dados Diagnóstico educacional |
description |
Atualmente, os dados mostram situações alarmantes em relação a problemas da educação, como: niveis baixos de aprendizagem, evasão, reprovação, baixo desempenho em leitura e escrita, entre outros. Nas instituições educacionais, esses problemas são um grande obstáculo na busca pela qualidade na educação. Nesse contexto, é essencial identificar, antecipadamente, quais fatores estão associados a esses problemas. Para isso, utiliza-se técnicas de Mineração de Dados Educacionais (EDM). Essas técnicas são capazes de obter informações e organizar tais informações em conhecimento útil. A EDM requer adaptações de métodos existentes e o desenvolvimento de novas tecnologias. Essa diversidade nos dados representa um potencial para implementação de recursos críticos para auxiliar na melhoria da educação. Partindo dessa necessidade, este trabalho utilizou as teorias do desempenho escolar proposta por Andrade e Soares (2008), e as teorias da evasão proposta por Spady (1970), Vincent Tinto (1975, 1987, 1993), para propor uma abordagem baseada em EDM. Assim, essa abordagem determina a relação dos fatores associados com os problemas educacionais, como também, utiliza-se modelos combinados de regressão (Ensemble Regression - ER) para predição da evasão e do desempenho escolar. Mesmo existindo evidências na literatura do uso de diversas técnicas aplicadas a EDM, esses modelos ER reduzem o erro de predição e/ou a variância dos modelos individuais, alcançando melhor acurácia. A metodologia CRISP-DM (Cross Industry Standard Process for Data Mining) foi utilizada e aplicada nesse contexto. Para avaliar a predição dos modelos propostos, um ambiente experimental utilizando bases de dados educacionais reais foi utilizado e o desempenho foi avaliado por meio do erro médio absoluto. Por fim, foi proposta uma abordagem utilizando o diagrama de causa e efeito educacional com base nas teorias: evasão, desempenho escolar e nos resultados dos modelos de predição propostos para o diagnóstico dos problemas educacionais. Assim, essa abordagem serve como uma ferramenta de conhecimento e suporte aos agentes educacionais para a tomada de decisão e o desenvolvimento de estratégias de intervenção educacionais mais eficientes. |
publishDate |
2019 |
dc.date.issued.fl_str_mv |
2019-09-12 |
dc.date.accessioned.fl_str_mv |
2020-01-17T12:15:00Z |
dc.date.available.fl_str_mv |
2020-01-17T12:15:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
SILVA, Paulo Mello da. Uma abordagem de ensemble regression para o disgnóstico de problemas educacionais. 2019. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2019. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufpe.br/handle/123456789/36047 |
identifier_str_mv |
SILVA, Paulo Mello da. Uma abordagem de ensemble regression para o disgnóstico de problemas educacionais. 2019. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2019. |
url |
https://repositorio.ufpe.br/handle/123456789/36047 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/embargoedAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
embargoedAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.publisher.program.fl_str_mv |
Programa de Pos Graduacao em Ciencia da Computacao |
dc.publisher.initials.fl_str_mv |
UFPE |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco (UFPE) instacron:UFPE |
instname_str |
Universidade Federal de Pernambuco (UFPE) |
instacron_str |
UFPE |
institution |
UFPE |
reponame_str |
Repositório Institucional da UFPE |
collection |
Repositório Institucional da UFPE |
bitstream.url.fl_str_mv |
https://repositorio.ufpe.br/bitstream/123456789/36047/2/license_rdf https://repositorio.ufpe.br/bitstream/123456789/36047/1/TESE%20Paulo%20Mello%20da%20Silva.pdf https://repositorio.ufpe.br/bitstream/123456789/36047/3/license.txt https://repositorio.ufpe.br/bitstream/123456789/36047/4/TESE%20Paulo%20Mello%20da%20Silva.pdf.txt https://repositorio.ufpe.br/bitstream/123456789/36047/5/TESE%20Paulo%20Mello%20da%20Silva.pdf.jpg |
bitstream.checksum.fl_str_mv |
e39d27027a6cc9cb039ad269a5db8e34 ce6f31e106aec1e900bb6c85ec06de7e bd573a5ca8288eb7272482765f819534 695c4c9f14cb5242e697bc8fc6c69926 b851c53257bed117fc5760fb33011e3c |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE) |
repository.mail.fl_str_mv |
attena@ufpe.br |
_version_ |
1802310754562473984 |