People Analytics : previsão de desligamentos por meio das técnicas de regressão logística e análise de sobrevivência

Detalhes bibliográficos
Autor(a) principal: Bianchi, Fernanda Buffon
Data de Publicação: 2023
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFRGS
Texto Completo: http://hdl.handle.net/10183/262041
Resumo: O mercado de trabalho se tornou mais competitivo e globalizado nos últimos anos, acarretando altos indíces de rotatividade para as empresas. Com isso, surge uma necessidade cada vez maior de alocar ações de retenção de forma mais assertiva, identificando os colaboradores com maior risco de pedir desligamento e atuando em relação a eles, evitando assim impactos financeiros e de performance, e investindo tempo e dinheiro de forma mais estratégica. A técnica mais amplamente utilizada para predição de desligamentos voluntários é a Regressão Logística. Um modelo pouco conhecido na área, mas que é cada vez mais utilizado em problemas similares é a Análise de Sobrevivência. Sendo assim, este trabalho propõe tanto a utilização do modelo mais tradicional, quanto a introdução do modelo de sobrevivência. Visto que cada modelo prediz um aspecto diferente em relação ao desligamento do colaborador, probabilidade e tempo, respectivamente, o objetivo é cruzar as variáveis resposta dos dois modelos a fim de se desenvolver uma ferramenta de visualização de dados que forneça aos tomadores de decisão a possibilidade de alocar seus investimentos nos indivíduos com maior risco de desligamento, e que são, portanto, de alta prioridade em ações de retenção. Os modelos foram desenvolvidos com uma base de dados do período de Janeiro de 2021 e formada por 534 colaboradores. Os modelos foram analisados com base em três medidas de desempenho: percentual de acerto, teste KS e área abaixo da curva ROC, sendo a primeira medida apenas para o modelo logístico. Neste estudo, ambas as técnicas obtiveram desempenhos satisfatórios e demonstraram boa capacidade de predição. A ferramenta de visualização de dados desenvolvida propôs a divisão dos colaboradores em 3 níveis diferentes de priorização, cruzando os riscos de perda sob os aspectos probabilidade e tempo.
id UFRGS-2_3cbaa888411557c311fe4907fc7505e0
oai_identifier_str oai:www.lume.ufrgs.br:10183/262041
network_acronym_str UFRGS-2
network_name_str Repositório Institucional da UFRGS
repository_id_str
spelling Bianchi, Fernanda BuffonSelau, Lisiane Priscila Roldão2023-07-12T03:34:52Z2023http://hdl.handle.net/10183/262041001172531O mercado de trabalho se tornou mais competitivo e globalizado nos últimos anos, acarretando altos indíces de rotatividade para as empresas. Com isso, surge uma necessidade cada vez maior de alocar ações de retenção de forma mais assertiva, identificando os colaboradores com maior risco de pedir desligamento e atuando em relação a eles, evitando assim impactos financeiros e de performance, e investindo tempo e dinheiro de forma mais estratégica. A técnica mais amplamente utilizada para predição de desligamentos voluntários é a Regressão Logística. Um modelo pouco conhecido na área, mas que é cada vez mais utilizado em problemas similares é a Análise de Sobrevivência. Sendo assim, este trabalho propõe tanto a utilização do modelo mais tradicional, quanto a introdução do modelo de sobrevivência. Visto que cada modelo prediz um aspecto diferente em relação ao desligamento do colaborador, probabilidade e tempo, respectivamente, o objetivo é cruzar as variáveis resposta dos dois modelos a fim de se desenvolver uma ferramenta de visualização de dados que forneça aos tomadores de decisão a possibilidade de alocar seus investimentos nos indivíduos com maior risco de desligamento, e que são, portanto, de alta prioridade em ações de retenção. Os modelos foram desenvolvidos com uma base de dados do período de Janeiro de 2021 e formada por 534 colaboradores. Os modelos foram analisados com base em três medidas de desempenho: percentual de acerto, teste KS e área abaixo da curva ROC, sendo a primeira medida apenas para o modelo logístico. Neste estudo, ambas as técnicas obtiveram desempenhos satisfatórios e demonstraram boa capacidade de predição. A ferramenta de visualização de dados desenvolvida propôs a divisão dos colaboradores em 3 níveis diferentes de priorização, cruzando os riscos de perda sob os aspectos probabilidade e tempo.The job market has become more competitive and globalized in recent years, leading to high turnover rates for companies. As a result, there is an increasing need to allocate retention actions more assertively, identifying employees with a higher risk of leaving and acting on them, thus avoiding financial and performance impacts and investing time and money more strategically. The most widely used technique for predicting voluntary turnover is Logistic Regression. A less well-known model in the field but increasingly used in similar problems is Survival Analysis. Therefore, this work proposes both the use of the traditional model and the introduction of the survival model. Since each model predicts a different aspect of employee turnover, probability and time, respectively, the goal is to cross the response variables of both models to develop a data visualization tool that provides decision-makers with the ability to allocate their investments in individuals with the highest risk of turnover, and who are therefore a high priority for retention actions. The models were developed using a database from January 2021 and consisting of 534 employees. The models were evaluated based on three performance measures: accuracy rate, KS test, and area under the ROC curve, with the first measure only for the logistic model. In this study, both techniques achieved satisfactory performance and demonstrated good predictive ability. The data visualization tool developed proposed dividing employees into three different prioritization levels, crossing the risks of loss under the probability and time aspects.application/pdfporRegressão logísticaAnálise de sobrevivênciaVisualização de dadosPeople analyticsLogistic regressionSurvival analysisData visualizationPeople Analytics : previsão de desligamentos por meio das técnicas de regressão logística e análise de sobrevivênciainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de Matemática e EstatísticaPorto Alegre, BR-RS2023Estatística: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001172531.pdf.txt001172531.pdf.txtExtracted Texttext/plain68323http://www.lume.ufrgs.br/bitstream/10183/262041/2/001172531.pdf.txt89530efa519531173065f183c29ecfcdMD52ORIGINAL001172531.pdfTexto completoapplication/pdf742764http://www.lume.ufrgs.br/bitstream/10183/262041/1/001172531.pdfd5066a3c09ad1846879af7fa15a49ef7MD5110183/2620412023-07-13 03:35:38.217405oai:www.lume.ufrgs.br:10183/262041Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2023-07-13T06:35:38Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv People Analytics : previsão de desligamentos por meio das técnicas de regressão logística e análise de sobrevivência
title People Analytics : previsão de desligamentos por meio das técnicas de regressão logística e análise de sobrevivência
spellingShingle People Analytics : previsão de desligamentos por meio das técnicas de regressão logística e análise de sobrevivência
Bianchi, Fernanda Buffon
Regressão logística
Análise de sobrevivência
Visualização de dados
People analytics
Logistic regression
Survival analysis
Data visualization
title_short People Analytics : previsão de desligamentos por meio das técnicas de regressão logística e análise de sobrevivência
title_full People Analytics : previsão de desligamentos por meio das técnicas de regressão logística e análise de sobrevivência
title_fullStr People Analytics : previsão de desligamentos por meio das técnicas de regressão logística e análise de sobrevivência
title_full_unstemmed People Analytics : previsão de desligamentos por meio das técnicas de regressão logística e análise de sobrevivência
title_sort People Analytics : previsão de desligamentos por meio das técnicas de regressão logística e análise de sobrevivência
author Bianchi, Fernanda Buffon
author_facet Bianchi, Fernanda Buffon
author_role author
dc.contributor.author.fl_str_mv Bianchi, Fernanda Buffon
dc.contributor.advisor1.fl_str_mv Selau, Lisiane Priscila Roldão
contributor_str_mv Selau, Lisiane Priscila Roldão
dc.subject.por.fl_str_mv Regressão logística
Análise de sobrevivência
Visualização de dados
topic Regressão logística
Análise de sobrevivência
Visualização de dados
People analytics
Logistic regression
Survival analysis
Data visualization
dc.subject.eng.fl_str_mv People analytics
Logistic regression
Survival analysis
Data visualization
description O mercado de trabalho se tornou mais competitivo e globalizado nos últimos anos, acarretando altos indíces de rotatividade para as empresas. Com isso, surge uma necessidade cada vez maior de alocar ações de retenção de forma mais assertiva, identificando os colaboradores com maior risco de pedir desligamento e atuando em relação a eles, evitando assim impactos financeiros e de performance, e investindo tempo e dinheiro de forma mais estratégica. A técnica mais amplamente utilizada para predição de desligamentos voluntários é a Regressão Logística. Um modelo pouco conhecido na área, mas que é cada vez mais utilizado em problemas similares é a Análise de Sobrevivência. Sendo assim, este trabalho propõe tanto a utilização do modelo mais tradicional, quanto a introdução do modelo de sobrevivência. Visto que cada modelo prediz um aspecto diferente em relação ao desligamento do colaborador, probabilidade e tempo, respectivamente, o objetivo é cruzar as variáveis resposta dos dois modelos a fim de se desenvolver uma ferramenta de visualização de dados que forneça aos tomadores de decisão a possibilidade de alocar seus investimentos nos indivíduos com maior risco de desligamento, e que são, portanto, de alta prioridade em ações de retenção. Os modelos foram desenvolvidos com uma base de dados do período de Janeiro de 2021 e formada por 534 colaboradores. Os modelos foram analisados com base em três medidas de desempenho: percentual de acerto, teste KS e área abaixo da curva ROC, sendo a primeira medida apenas para o modelo logístico. Neste estudo, ambas as técnicas obtiveram desempenhos satisfatórios e demonstraram boa capacidade de predição. A ferramenta de visualização de dados desenvolvida propôs a divisão dos colaboradores em 3 níveis diferentes de priorização, cruzando os riscos de perda sob os aspectos probabilidade e tempo.
publishDate 2023
dc.date.accessioned.fl_str_mv 2023-07-12T03:34:52Z
dc.date.issued.fl_str_mv 2023
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/262041
dc.identifier.nrb.pt_BR.fl_str_mv 001172531
url http://hdl.handle.net/10183/262041
identifier_str_mv 001172531
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Repositório Institucional da UFRGS
collection Repositório Institucional da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/262041/2/001172531.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/262041/1/001172531.pdf
bitstream.checksum.fl_str_mv 89530efa519531173065f183c29ecfcd
d5066a3c09ad1846879af7fa15a49ef7
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv
_version_ 1815447345417945088