Predição de absenteísmo docente na rede pública com machine learning

Detalhes bibliográficos
Autor(a) principal: Fernandes, Fernando Timoteo
Data de Publicação: 2021
Outros Autores: Chiavegatto Filho, Alexandre Dias Porto
Tipo de documento: Artigo
Idioma: por
eng
Título da fonte: Revista de Saúde Pública
Texto Completo: https://www.revistas.usp.br/rsp/article/view/187647
Resumo: OBJETIVO Predizer o risco de ausência laboral decorrente de morbidades dos docentes que atuam na educação infantil na rede pública municipal, com o uso de algoritmos de machine learning. MÉTODOS Trata-se de um estudo transversal utilizando dados secundários, públicos e anônimos da Relação Anual de Informações Sociais, selecionando professores da educação infantil que atuaram na rede pública municipal do estado de São Paulo entre 2014 e 2018 (n = 174.294). Foram também vinculados dados da média de alunos por turma e número de habitantes no município. Os dados foram separados em treinamento e teste, utilizando os registros de 2014 a 2016 (n = 103.357) para treinar cinco modelos preditivos e os dados de 2017 a 2018 (n = 70.937) para testar seus desempenhos em dados novos. A performance preditiva dos algoritmos foi avaliada por meio do valor da área abaixo da curva ROC (AUROC). RESULTADOS Todos os cinco algoritmos testados apresentaram área abaixo da curva acima de 0,76. O algoritmo com melhor performance preditiva (redes neurais artificiais) obteve 0,79 de área abaixo da curva, com acurácia de 71,52%, sensibilidade de 72,86%, especificidade de 70,52% e kappa de 0,427 nos dados de teste. CONCLUSÃO É possível predizer casos de afastamentos por morbidade em docentes da rede pública com machine learning usando dados públicos. O melhor algoritmo apresentou melhor resultado da área abaixo da curva quando comparado ao modelo de referência (regressão logística). Os algoritmos podem contribuir para predições mais assertivas na área da saúde pública e da saúde do trabalhador, permitindo acompanhar e ajudar a prevenir afastamentos por morbidade desses trabalhadores.
id USP-23_017ba7504b7183ab32e7caa3b4d9e1d2
oai_identifier_str oai:revistas.usp.br:article/187647
network_acronym_str USP-23
network_name_str Revista de Saúde Pública
repository_id_str
spelling Predição de absenteísmo docente na rede pública com machine learningPrediction of absenteeism in public schools teachers with machine learningAbsenteísmoFatores de riscoAprendizado de máquina supervisionadoProfessores escolaresEducação infantilAbsenteeismRisk factorsSupervised machine learningSchool teachersEarly childhood educationOBJETIVO Predizer o risco de ausência laboral decorrente de morbidades dos docentes que atuam na educação infantil na rede pública municipal, com o uso de algoritmos de machine learning. MÉTODOS Trata-se de um estudo transversal utilizando dados secundários, públicos e anônimos da Relação Anual de Informações Sociais, selecionando professores da educação infantil que atuaram na rede pública municipal do estado de São Paulo entre 2014 e 2018 (n = 174.294). Foram também vinculados dados da média de alunos por turma e número de habitantes no município. Os dados foram separados em treinamento e teste, utilizando os registros de 2014 a 2016 (n = 103.357) para treinar cinco modelos preditivos e os dados de 2017 a 2018 (n = 70.937) para testar seus desempenhos em dados novos. A performance preditiva dos algoritmos foi avaliada por meio do valor da área abaixo da curva ROC (AUROC). RESULTADOS Todos os cinco algoritmos testados apresentaram área abaixo da curva acima de 0,76. O algoritmo com melhor performance preditiva (redes neurais artificiais) obteve 0,79 de área abaixo da curva, com acurácia de 71,52%, sensibilidade de 72,86%, especificidade de 70,52% e kappa de 0,427 nos dados de teste. CONCLUSÃO É possível predizer casos de afastamentos por morbidade em docentes da rede pública com machine learning usando dados públicos. O melhor algoritmo apresentou melhor resultado da área abaixo da curva quando comparado ao modelo de referência (regressão logística). Os algoritmos podem contribuir para predições mais assertivas na área da saúde pública e da saúde do trabalhador, permitindo acompanhar e ajudar a prevenir afastamentos por morbidade desses trabalhadores.OBJECTIVE To predict the risk of absence from work due to morbidities of teachers working in early childhood education in the municipal public schools, using machine learning algorithms. METHODS This is a cross-sectional study using secondary, public and anonymous data from the Relação Anual de Informações Sociais, selecting early childhood education teachers who worked in the municipal public schools of the state of São Paulo between 2014 and 2018 (n = 174,294). Data on the average number of students per class and number of inhabitants in the municipality were also linked. The data were separated into training and testing, using records from 2014 to 2016 (n = 103,357) to train five predictive models, and data from 2017 to 2018 (n = 70,937) to test their performance in new data. The predictive performance of the algorithms was evaluated using the value of the area under the ROC curve (AUROC). RESULTS All five algorithms tested showed an area under the curve above 0.76. The algorithm with the best predictive performance (artificial neural networks) achieved 0.79 of area under the curve, with accuracy of 71.52%, sensitivity of 72.86%, specificity of 70.52%, and kappa of 0.427 in the test data. CONCLUSION It is possible to predict cases of sickness absence in teachers of public schools with machine learning using public data. The best algorithm showed a better result of the area under the curve when compared with the reference model (logistic regression). The algorithms can contribute to more assertive predictions in the public health and worker health areas, allowing to monitor and help prevent the absence of these workers due to morbidity.Universidade de São Paulo. Faculdade de Saúde Pública2021-06-14info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdftext/xmlapplication/pdfhttps://www.revistas.usp.br/rsp/article/view/18764710.11606/s1518-8787.2021055002677Revista de Saúde Pública; Vol. 55 (2021); 23Revista de Saúde Pública; Vol. 55 (2021); 23Revista de Saúde Pública; v. 55 (2021); 231518-87870034-8910reponame:Revista de Saúde Públicainstname:Universidade de São Paulo (USP)instacron:USPporenghttps://www.revistas.usp.br/rsp/article/view/187647/173319https://www.revistas.usp.br/rsp/article/view/187647/173317https://www.revistas.usp.br/rsp/article/view/187647/173318Copyright (c) 2021 Fernando Timoteo Fernandes, Alexandre Dias Porto Chiavegatto Filhohttp://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessFernandes, Fernando TimoteoChiavegatto Filho, Alexandre Dias Porto2021-06-23T15:06:32Zoai:revistas.usp.br:article/187647Revistahttps://www.revistas.usp.br/rsp/indexONGhttps://www.revistas.usp.br/rsp/oairevsp@org.usp.br||revsp1@usp.br1518-87870034-8910opendoar:2021-06-23T15:06:32Revista de Saúde Pública - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Predição de absenteísmo docente na rede pública com machine learning
Prediction of absenteeism in public schools teachers with machine learning
title Predição de absenteísmo docente na rede pública com machine learning
spellingShingle Predição de absenteísmo docente na rede pública com machine learning
Fernandes, Fernando Timoteo
Absenteísmo
Fatores de risco
Aprendizado de máquina supervisionado
Professores escolares
Educação infantil
Absenteeism
Risk factors
Supervised machine learning
School teachers
Early childhood education
title_short Predição de absenteísmo docente na rede pública com machine learning
title_full Predição de absenteísmo docente na rede pública com machine learning
title_fullStr Predição de absenteísmo docente na rede pública com machine learning
title_full_unstemmed Predição de absenteísmo docente na rede pública com machine learning
title_sort Predição de absenteísmo docente na rede pública com machine learning
author Fernandes, Fernando Timoteo
author_facet Fernandes, Fernando Timoteo
Chiavegatto Filho, Alexandre Dias Porto
author_role author
author2 Chiavegatto Filho, Alexandre Dias Porto
author2_role author
dc.contributor.author.fl_str_mv Fernandes, Fernando Timoteo
Chiavegatto Filho, Alexandre Dias Porto
dc.subject.por.fl_str_mv Absenteísmo
Fatores de risco
Aprendizado de máquina supervisionado
Professores escolares
Educação infantil
Absenteeism
Risk factors
Supervised machine learning
School teachers
Early childhood education
topic Absenteísmo
Fatores de risco
Aprendizado de máquina supervisionado
Professores escolares
Educação infantil
Absenteeism
Risk factors
Supervised machine learning
School teachers
Early childhood education
description OBJETIVO Predizer o risco de ausência laboral decorrente de morbidades dos docentes que atuam na educação infantil na rede pública municipal, com o uso de algoritmos de machine learning. MÉTODOS Trata-se de um estudo transversal utilizando dados secundários, públicos e anônimos da Relação Anual de Informações Sociais, selecionando professores da educação infantil que atuaram na rede pública municipal do estado de São Paulo entre 2014 e 2018 (n = 174.294). Foram também vinculados dados da média de alunos por turma e número de habitantes no município. Os dados foram separados em treinamento e teste, utilizando os registros de 2014 a 2016 (n = 103.357) para treinar cinco modelos preditivos e os dados de 2017 a 2018 (n = 70.937) para testar seus desempenhos em dados novos. A performance preditiva dos algoritmos foi avaliada por meio do valor da área abaixo da curva ROC (AUROC). RESULTADOS Todos os cinco algoritmos testados apresentaram área abaixo da curva acima de 0,76. O algoritmo com melhor performance preditiva (redes neurais artificiais) obteve 0,79 de área abaixo da curva, com acurácia de 71,52%, sensibilidade de 72,86%, especificidade de 70,52% e kappa de 0,427 nos dados de teste. CONCLUSÃO É possível predizer casos de afastamentos por morbidade em docentes da rede pública com machine learning usando dados públicos. O melhor algoritmo apresentou melhor resultado da área abaixo da curva quando comparado ao modelo de referência (regressão logística). Os algoritmos podem contribuir para predições mais assertivas na área da saúde pública e da saúde do trabalhador, permitindo acompanhar e ajudar a prevenir afastamentos por morbidade desses trabalhadores.
publishDate 2021
dc.date.none.fl_str_mv 2021-06-14
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.revistas.usp.br/rsp/article/view/187647
10.11606/s1518-8787.2021055002677
url https://www.revistas.usp.br/rsp/article/view/187647
identifier_str_mv 10.11606/s1518-8787.2021055002677
dc.language.iso.fl_str_mv por
eng
language por
eng
dc.relation.none.fl_str_mv https://www.revistas.usp.br/rsp/article/view/187647/173319
https://www.revistas.usp.br/rsp/article/view/187647/173317
https://www.revistas.usp.br/rsp/article/view/187647/173318
dc.rights.driver.fl_str_mv Copyright (c) 2021 Fernando Timoteo Fernandes, Alexandre Dias Porto Chiavegatto Filho
http://creativecommons.org/licenses/by/4.0
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Copyright (c) 2021 Fernando Timoteo Fernandes, Alexandre Dias Porto Chiavegatto Filho
http://creativecommons.org/licenses/by/4.0
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
text/xml
application/pdf
dc.publisher.none.fl_str_mv Universidade de São Paulo. Faculdade de Saúde Pública
publisher.none.fl_str_mv Universidade de São Paulo. Faculdade de Saúde Pública
dc.source.none.fl_str_mv Revista de Saúde Pública; Vol. 55 (2021); 23
Revista de Saúde Pública; Vol. 55 (2021); 23
Revista de Saúde Pública; v. 55 (2021); 23
1518-8787
0034-8910
reponame:Revista de Saúde Pública
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Revista de Saúde Pública
collection Revista de Saúde Pública
repository.name.fl_str_mv Revista de Saúde Pública - Universidade de São Paulo (USP)
repository.mail.fl_str_mv revsp@org.usp.br||revsp1@usp.br
_version_ 1787713241120505856