Uma abordagem de ensemble regression para o disgnóstico de problemas educacionais

Detalhes bibliográficos
Autor(a) principal: SILVA, Paulo Mello da
Data de Publicação: 2019
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFPE
Texto Completo: https://repositorio.ufpe.br/handle/123456789/36047
Resumo: Atualmente, os dados mostram situações alarmantes em relação a problemas da educação, como: niveis baixos de aprendizagem, evasão, reprovação, baixo desempenho em leitura e escrita, entre outros. Nas instituições educacionais, esses problemas são um grande obstáculo na busca pela qualidade na educação. Nesse contexto, é essencial identificar, antecipadamente, quais fatores estão associados a esses problemas. Para isso, utiliza-se técnicas de Mineração de Dados Educacionais (EDM). Essas técnicas são capazes de obter informações e organizar tais informações em conhecimento útil. A EDM requer adaptações de métodos existentes e o desenvolvimento de novas tecnologias. Essa diversidade nos dados representa um potencial para implementação de recursos críticos para auxiliar na melhoria da educação. Partindo dessa necessidade, este trabalho utilizou as teorias do desempenho escolar proposta por Andrade e Soares (2008), e as teorias da evasão proposta por Spady (1970), Vincent Tinto (1975, 1987, 1993), para propor uma abordagem baseada em EDM. Assim, essa abordagem determina a relação dos fatores associados com os problemas educacionais, como também, utiliza-se modelos combinados de regressão (Ensemble Regression - ER) para predição da evasão e do desempenho escolar. Mesmo existindo evidências na literatura do uso de diversas técnicas aplicadas a EDM, esses modelos ER reduzem o erro de predição e/ou a variância dos modelos individuais, alcançando melhor acurácia. A metodologia CRISP-DM (Cross Industry Standard Process for Data Mining) foi utilizada e aplicada nesse contexto. Para avaliar a predição dos modelos propostos, um ambiente experimental utilizando bases de dados educacionais reais foi utilizado e o desempenho foi avaliado por meio do erro médio absoluto. Por fim, foi proposta uma abordagem utilizando o diagrama de causa e efeito educacional com base nas teorias: evasão, desempenho escolar e nos resultados dos modelos de predição propostos para o diagnóstico dos problemas educacionais. Assim, essa abordagem serve como uma ferramenta de conhecimento e suporte aos agentes educacionais para a tomada de decisão e o desenvolvimento de estratégias de intervenção educacionais mais eficientes.
id UFPE_efbe2e07f4d8f672b6c7e621f1da88b5
oai_identifier_str oai:repositorio.ufpe.br:123456789/36047
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str 2221
spelling SILVA, Paulo Mello dahttp://lattes.cnpq.br/8976586263200932http://lattes.cnpq.br/7076371974874150SOUZA, Fernando da Fonseca de2020-01-17T12:15:00Z2020-01-17T12:15:00Z2019-09-12SILVA, Paulo Mello da. Uma abordagem de ensemble regression para o disgnóstico de problemas educacionais. 2019. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2019.https://repositorio.ufpe.br/handle/123456789/36047Atualmente, os dados mostram situações alarmantes em relação a problemas da educação, como: niveis baixos de aprendizagem, evasão, reprovação, baixo desempenho em leitura e escrita, entre outros. Nas instituições educacionais, esses problemas são um grande obstáculo na busca pela qualidade na educação. Nesse contexto, é essencial identificar, antecipadamente, quais fatores estão associados a esses problemas. Para isso, utiliza-se técnicas de Mineração de Dados Educacionais (EDM). Essas técnicas são capazes de obter informações e organizar tais informações em conhecimento útil. A EDM requer adaptações de métodos existentes e o desenvolvimento de novas tecnologias. Essa diversidade nos dados representa um potencial para implementação de recursos críticos para auxiliar na melhoria da educação. Partindo dessa necessidade, este trabalho utilizou as teorias do desempenho escolar proposta por Andrade e Soares (2008), e as teorias da evasão proposta por Spady (1970), Vincent Tinto (1975, 1987, 1993), para propor uma abordagem baseada em EDM. Assim, essa abordagem determina a relação dos fatores associados com os problemas educacionais, como também, utiliza-se modelos combinados de regressão (Ensemble Regression - ER) para predição da evasão e do desempenho escolar. Mesmo existindo evidências na literatura do uso de diversas técnicas aplicadas a EDM, esses modelos ER reduzem o erro de predição e/ou a variância dos modelos individuais, alcançando melhor acurácia. A metodologia CRISP-DM (Cross Industry Standard Process for Data Mining) foi utilizada e aplicada nesse contexto. Para avaliar a predição dos modelos propostos, um ambiente experimental utilizando bases de dados educacionais reais foi utilizado e o desempenho foi avaliado por meio do erro médio absoluto. Por fim, foi proposta uma abordagem utilizando o diagrama de causa e efeito educacional com base nas teorias: evasão, desempenho escolar e nos resultados dos modelos de predição propostos para o diagnóstico dos problemas educacionais. Assim, essa abordagem serve como uma ferramenta de conhecimento e suporte aos agentes educacionais para a tomada de decisão e o desenvolvimento de estratégias de intervenção educacionais mais eficientes.Currently, data show alarming situations related to educational problems, such as: low levels of learning, evasion, failure, low performance in reading and writing, amongst others. In educational institutions, such problems are a big obstacle in the search for the quality of education. In this context, it’s essential to identify, beforehand, which factors are associated to those problems. Therefore, educational data mining (EDM) techniques will be used. These techniques are able to obtain and organize useful knowledge. EDM requires adaptations of existing methods and development of new technologies. Such a diversity in data represents a potential for the implementation of critical resources to help improving education. Based on this necessity, this work has used the theories of school performance proposed by Andrade e Soares (2008), and the theories of evasion proposed by Spady (1970) and Vincent Tinto (1975, 1987, 1993), to propose an approach based on EDM. Thus, this approach determines the relationship between factors associated with educational problems, as well as the use of combined regression models (Ensemble Regression -ER) to predict dropout and academic performance. Even though there is evidence in the literature of the use of various techniques applied to EDM, models ER reduce the error and/or variance of the individual models achieving better accuracy. The methodology CRISP-DM (Cross Industry Standard Process for Data Mining) was used and applied in this context. To evaluate the prediction of the proposed models, an experimental environment using real educational databases was used and the performance was assessed through absolute mean error. Finally, an approach was proposed using the cause diagram and the effect educational based on the theories: evasion, academic performance, and in the results of the proposed prediction models for the diagnostic of educational problems. Therefore, this approach serves as a knowledge and support tool for educational agents for decision-making and the development of more effective educational intervention strategies.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da ComputacaoUFPEBrasilAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/embargoedAccessMineração de dadosDiagnóstico educacionalUma abordagem de ensemble regression para o disgnóstico de problemas educacionaisinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisdoutoradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPECC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/36047/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52ORIGINALTESE Paulo Mello da Silva.pdfTESE Paulo Mello da Silva.pdfapplication/pdf4003683https://repositorio.ufpe.br/bitstream/123456789/36047/1/TESE%20Paulo%20Mello%20da%20Silva.pdfce6f31e106aec1e900bb6c85ec06de7eMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-82310https://repositorio.ufpe.br/bitstream/123456789/36047/3/license.txtbd573a5ca8288eb7272482765f819534MD53TEXTTESE Paulo Mello da Silva.pdf.txtTESE Paulo Mello da Silva.pdf.txtExtracted texttext/plain344643https://repositorio.ufpe.br/bitstream/123456789/36047/4/TESE%20Paulo%20Mello%20da%20Silva.pdf.txt695c4c9f14cb5242e697bc8fc6c69926MD54THUMBNAILTESE Paulo Mello da Silva.pdf.jpgTESE Paulo Mello da Silva.pdf.jpgGenerated Thumbnailimage/jpeg1274https://repositorio.ufpe.br/bitstream/123456789/36047/5/TESE%20Paulo%20Mello%20da%20Silva.pdf.jpgb851c53257bed117fc5760fb33011e3cMD55123456789/360472020-01-18 02:15:39.041oai:repositorio.ufpe.br:123456789/36047TGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKClRvZG8gZGVwb3NpdGFudGUgZGUgbWF0ZXJpYWwgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgKFJJKSBkZXZlIGNvbmNlZGVyLCDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIChVRlBFKSwgdW1hIExpY2Vuw6dhIGRlIERpc3RyaWJ1acOnw6NvIE7Do28gRXhjbHVzaXZhIHBhcmEgbWFudGVyIGUgdG9ybmFyIGFjZXNzw612ZWlzIG9zIHNldXMgZG9jdW1lbnRvcywgZW0gZm9ybWF0byBkaWdpdGFsLCBuZXN0ZSByZXBvc2l0w7NyaW8uCgpDb20gYSBjb25jZXNzw6NvIGRlc3RhIGxpY2Vuw6dhIG7Do28gZXhjbHVzaXZhLCBvIGRlcG9zaXRhbnRlIG1hbnTDqW0gdG9kb3Mgb3MgZGlyZWl0b3MgZGUgYXV0b3IuCl9fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fXwoKTGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKCkFvIGNvbmNvcmRhciBjb20gZXN0YSBsaWNlbsOnYSBlIGFjZWl0w6EtbGEsIHZvY8OqIChhdXRvciBvdSBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMpOgoKYSkgRGVjbGFyYSBxdWUgY29uaGVjZSBhIHBvbMOtdGljYSBkZSBjb3B5cmlnaHQgZGEgZWRpdG9yYSBkbyBzZXUgZG9jdW1lbnRvOwpiKSBEZWNsYXJhIHF1ZSBjb25oZWNlIGUgYWNlaXRhIGFzIERpcmV0cml6ZXMgcGFyYSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEU7CmMpIENvbmNlZGUgw6AgVUZQRSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZGUgYXJxdWl2YXIsIHJlcHJvZHV6aXIsIGNvbnZlcnRlciAoY29tbyBkZWZpbmlkbyBhIHNlZ3VpciksIGNvbXVuaWNhciBlL291IGRpc3RyaWJ1aXIsIG5vIFJJLCBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vL2Fic3RyYWN0KSBlbSBmb3JtYXRvIGRpZ2l0YWwgb3UgcG9yIG91dHJvIG1laW87CmQpIERlY2xhcmEgcXVlIGF1dG9yaXphIGEgVUZQRSBhIGFycXVpdmFyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXN0ZSBkb2N1bWVudG8gZSBjb252ZXJ0w6otbG8sIHNlbSBhbHRlcmFyIG8gc2V1IGNvbnRlw7pkbywgcGFyYSBxdWFscXVlciBmb3JtYXRvIGRlIGZpY2hlaXJvLCBtZWlvIG91IHN1cG9ydGUsIHBhcmEgZWZlaXRvcyBkZSBzZWd1cmFuw6dhLCBwcmVzZXJ2YcOnw6NvIChiYWNrdXApIGUgYWNlc3NvOwplKSBEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBzdWJtZXRpZG8gw6kgbyBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBhIHRlcmNlaXJvcyBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2Ugb3MgZGlyZWl0b3MgZGUgb3V0cmEgcGVzc29hIG91IGVudGlkYWRlOwpmKSBEZWNsYXJhIHF1ZSwgbm8gY2FzbyBkbyBkb2N1bWVudG8gc3VibWV0aWRvIGNvbnRlciBtYXRlcmlhbCBkbyBxdWFsIG7Do28gZGV0w6ltIG9zIGRpcmVpdG9zIGRlCmF1dG9yLCBvYnRldmUgYSBhdXRvcml6YcOnw6NvIGlycmVzdHJpdGEgZG8gcmVzcGVjdGl2byBkZXRlbnRvciBkZXNzZXMgZGlyZWl0b3MgcGFyYSBjZWRlciDDoApVRlBFIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgTGljZW7Dp2EgZSBhdXRvcml6YXIgYSB1bml2ZXJzaWRhZGUgYSB1dGlsaXrDoS1sb3MgbGVnYWxtZW50ZS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBlc3NlIG1hdGVyaWFsIGN1am9zIGRpcmVpdG9zIHPDo28gZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRvIGRvY3VtZW50byBlbnRyZWd1ZTsKZykgU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVRlBFLCBkZWNsYXJhIHF1ZSBjdW1wcml1IHF1YWlzcXVlciBvYnJpZ2HDp8O1ZXMgZXhpZ2lkYXMgcGVsbyByZXNwZWN0aXZvIGNvbnRyYXRvIG91IGFjb3Jkby4KCkEgVUZQRSBpZGVudGlmaWNhcsOhIGNsYXJhbWVudGUgbyhzKSBub21lKHMpIGRvKHMpIGF1dG9yIChlcykgZG9zIGRpcmVpdG9zIGRvIGRvY3VtZW50byBlbnRyZWd1ZSBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIHBhcmEgYWzDqW0gZG8gcHJldmlzdG8gbmEgYWzDrW5lYSBjKS4KRepositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212020-01-18T05:15:39Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.pt_BR.fl_str_mv Uma abordagem de ensemble regression para o disgnóstico de problemas educacionais
title Uma abordagem de ensemble regression para o disgnóstico de problemas educacionais
spellingShingle Uma abordagem de ensemble regression para o disgnóstico de problemas educacionais
SILVA, Paulo Mello da
Mineração de dados
Diagnóstico educacional
title_short Uma abordagem de ensemble regression para o disgnóstico de problemas educacionais
title_full Uma abordagem de ensemble regression para o disgnóstico de problemas educacionais
title_fullStr Uma abordagem de ensemble regression para o disgnóstico de problemas educacionais
title_full_unstemmed Uma abordagem de ensemble regression para o disgnóstico de problemas educacionais
title_sort Uma abordagem de ensemble regression para o disgnóstico de problemas educacionais
author SILVA, Paulo Mello da
author_facet SILVA, Paulo Mello da
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/8976586263200932
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/7076371974874150
dc.contributor.author.fl_str_mv SILVA, Paulo Mello da
dc.contributor.advisor1.fl_str_mv SOUZA, Fernando da Fonseca de
contributor_str_mv SOUZA, Fernando da Fonseca de
dc.subject.por.fl_str_mv Mineração de dados
Diagnóstico educacional
topic Mineração de dados
Diagnóstico educacional
description Atualmente, os dados mostram situações alarmantes em relação a problemas da educação, como: niveis baixos de aprendizagem, evasão, reprovação, baixo desempenho em leitura e escrita, entre outros. Nas instituições educacionais, esses problemas são um grande obstáculo na busca pela qualidade na educação. Nesse contexto, é essencial identificar, antecipadamente, quais fatores estão associados a esses problemas. Para isso, utiliza-se técnicas de Mineração de Dados Educacionais (EDM). Essas técnicas são capazes de obter informações e organizar tais informações em conhecimento útil. A EDM requer adaptações de métodos existentes e o desenvolvimento de novas tecnologias. Essa diversidade nos dados representa um potencial para implementação de recursos críticos para auxiliar na melhoria da educação. Partindo dessa necessidade, este trabalho utilizou as teorias do desempenho escolar proposta por Andrade e Soares (2008), e as teorias da evasão proposta por Spady (1970), Vincent Tinto (1975, 1987, 1993), para propor uma abordagem baseada em EDM. Assim, essa abordagem determina a relação dos fatores associados com os problemas educacionais, como também, utiliza-se modelos combinados de regressão (Ensemble Regression - ER) para predição da evasão e do desempenho escolar. Mesmo existindo evidências na literatura do uso de diversas técnicas aplicadas a EDM, esses modelos ER reduzem o erro de predição e/ou a variância dos modelos individuais, alcançando melhor acurácia. A metodologia CRISP-DM (Cross Industry Standard Process for Data Mining) foi utilizada e aplicada nesse contexto. Para avaliar a predição dos modelos propostos, um ambiente experimental utilizando bases de dados educacionais reais foi utilizado e o desempenho foi avaliado por meio do erro médio absoluto. Por fim, foi proposta uma abordagem utilizando o diagrama de causa e efeito educacional com base nas teorias: evasão, desempenho escolar e nos resultados dos modelos de predição propostos para o diagnóstico dos problemas educacionais. Assim, essa abordagem serve como uma ferramenta de conhecimento e suporte aos agentes educacionais para a tomada de decisão e o desenvolvimento de estratégias de intervenção educacionais mais eficientes.
publishDate 2019
dc.date.issued.fl_str_mv 2019-09-12
dc.date.accessioned.fl_str_mv 2020-01-17T12:15:00Z
dc.date.available.fl_str_mv 2020-01-17T12:15:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SILVA, Paulo Mello da. Uma abordagem de ensemble regression para o disgnóstico de problemas educacionais. 2019. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2019.
dc.identifier.uri.fl_str_mv https://repositorio.ufpe.br/handle/123456789/36047
identifier_str_mv SILVA, Paulo Mello da. Uma abordagem de ensemble regression para o disgnóstico de problemas educacionais. 2019. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2019.
url https://repositorio.ufpe.br/handle/123456789/36047
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/embargoedAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv embargoedAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.publisher.program.fl_str_mv Programa de Pos Graduacao em Ciencia da Computacao
dc.publisher.initials.fl_str_mv UFPE
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
bitstream.url.fl_str_mv https://repositorio.ufpe.br/bitstream/123456789/36047/2/license_rdf
https://repositorio.ufpe.br/bitstream/123456789/36047/1/TESE%20Paulo%20Mello%20da%20Silva.pdf
https://repositorio.ufpe.br/bitstream/123456789/36047/3/license.txt
https://repositorio.ufpe.br/bitstream/123456789/36047/4/TESE%20Paulo%20Mello%20da%20Silva.pdf.txt
https://repositorio.ufpe.br/bitstream/123456789/36047/5/TESE%20Paulo%20Mello%20da%20Silva.pdf.jpg
bitstream.checksum.fl_str_mv e39d27027a6cc9cb039ad269a5db8e34
ce6f31e106aec1e900bb6c85ec06de7e
bd573a5ca8288eb7272482765f819534
695c4c9f14cb5242e697bc8fc6c69926
b851c53257bed117fc5760fb33011e3c
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1802310754562473984