People Analytics : previsão de desligamentos por meio das técnicas de regressão logística e análise de sobrevivência
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/262041 |
Resumo: | O mercado de trabalho se tornou mais competitivo e globalizado nos últimos anos, acarretando altos indíces de rotatividade para as empresas. Com isso, surge uma necessidade cada vez maior de alocar ações de retenção de forma mais assertiva, identificando os colaboradores com maior risco de pedir desligamento e atuando em relação a eles, evitando assim impactos financeiros e de performance, e investindo tempo e dinheiro de forma mais estratégica. A técnica mais amplamente utilizada para predição de desligamentos voluntários é a Regressão Logística. Um modelo pouco conhecido na área, mas que é cada vez mais utilizado em problemas similares é a Análise de Sobrevivência. Sendo assim, este trabalho propõe tanto a utilização do modelo mais tradicional, quanto a introdução do modelo de sobrevivência. Visto que cada modelo prediz um aspecto diferente em relação ao desligamento do colaborador, probabilidade e tempo, respectivamente, o objetivo é cruzar as variáveis resposta dos dois modelos a fim de se desenvolver uma ferramenta de visualização de dados que forneça aos tomadores de decisão a possibilidade de alocar seus investimentos nos indivíduos com maior risco de desligamento, e que são, portanto, de alta prioridade em ações de retenção. Os modelos foram desenvolvidos com uma base de dados do período de Janeiro de 2021 e formada por 534 colaboradores. Os modelos foram analisados com base em três medidas de desempenho: percentual de acerto, teste KS e área abaixo da curva ROC, sendo a primeira medida apenas para o modelo logístico. Neste estudo, ambas as técnicas obtiveram desempenhos satisfatórios e demonstraram boa capacidade de predição. A ferramenta de visualização de dados desenvolvida propôs a divisão dos colaboradores em 3 níveis diferentes de priorização, cruzando os riscos de perda sob os aspectos probabilidade e tempo. |
id |
UFRGS-2_3cbaa888411557c311fe4907fc7505e0 |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/262041 |
network_acronym_str |
UFRGS-2 |
network_name_str |
Repositório Institucional da UFRGS |
repository_id_str |
|
spelling |
Bianchi, Fernanda BuffonSelau, Lisiane Priscila Roldão2023-07-12T03:34:52Z2023http://hdl.handle.net/10183/262041001172531O mercado de trabalho se tornou mais competitivo e globalizado nos últimos anos, acarretando altos indíces de rotatividade para as empresas. Com isso, surge uma necessidade cada vez maior de alocar ações de retenção de forma mais assertiva, identificando os colaboradores com maior risco de pedir desligamento e atuando em relação a eles, evitando assim impactos financeiros e de performance, e investindo tempo e dinheiro de forma mais estratégica. A técnica mais amplamente utilizada para predição de desligamentos voluntários é a Regressão Logística. Um modelo pouco conhecido na área, mas que é cada vez mais utilizado em problemas similares é a Análise de Sobrevivência. Sendo assim, este trabalho propõe tanto a utilização do modelo mais tradicional, quanto a introdução do modelo de sobrevivência. Visto que cada modelo prediz um aspecto diferente em relação ao desligamento do colaborador, probabilidade e tempo, respectivamente, o objetivo é cruzar as variáveis resposta dos dois modelos a fim de se desenvolver uma ferramenta de visualização de dados que forneça aos tomadores de decisão a possibilidade de alocar seus investimentos nos indivíduos com maior risco de desligamento, e que são, portanto, de alta prioridade em ações de retenção. Os modelos foram desenvolvidos com uma base de dados do período de Janeiro de 2021 e formada por 534 colaboradores. Os modelos foram analisados com base em três medidas de desempenho: percentual de acerto, teste KS e área abaixo da curva ROC, sendo a primeira medida apenas para o modelo logístico. Neste estudo, ambas as técnicas obtiveram desempenhos satisfatórios e demonstraram boa capacidade de predição. A ferramenta de visualização de dados desenvolvida propôs a divisão dos colaboradores em 3 níveis diferentes de priorização, cruzando os riscos de perda sob os aspectos probabilidade e tempo.The job market has become more competitive and globalized in recent years, leading to high turnover rates for companies. As a result, there is an increasing need to allocate retention actions more assertively, identifying employees with a higher risk of leaving and acting on them, thus avoiding financial and performance impacts and investing time and money more strategically. The most widely used technique for predicting voluntary turnover is Logistic Regression. A less well-known model in the field but increasingly used in similar problems is Survival Analysis. Therefore, this work proposes both the use of the traditional model and the introduction of the survival model. Since each model predicts a different aspect of employee turnover, probability and time, respectively, the goal is to cross the response variables of both models to develop a data visualization tool that provides decision-makers with the ability to allocate their investments in individuals with the highest risk of turnover, and who are therefore a high priority for retention actions. The models were developed using a database from January 2021 and consisting of 534 employees. The models were evaluated based on three performance measures: accuracy rate, KS test, and area under the ROC curve, with the first measure only for the logistic model. In this study, both techniques achieved satisfactory performance and demonstrated good predictive ability. The data visualization tool developed proposed dividing employees into three different prioritization levels, crossing the risks of loss under the probability and time aspects.application/pdfporRegressão logísticaAnálise de sobrevivênciaVisualização de dadosPeople analyticsLogistic regressionSurvival analysisData visualizationPeople Analytics : previsão de desligamentos por meio das técnicas de regressão logística e análise de sobrevivênciainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de Matemática e EstatísticaPorto Alegre, BR-RS2023Estatística: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001172531.pdf.txt001172531.pdf.txtExtracted Texttext/plain68323http://www.lume.ufrgs.br/bitstream/10183/262041/2/001172531.pdf.txt89530efa519531173065f183c29ecfcdMD52ORIGINAL001172531.pdfTexto completoapplication/pdf742764http://www.lume.ufrgs.br/bitstream/10183/262041/1/001172531.pdfd5066a3c09ad1846879af7fa15a49ef7MD5110183/2620412023-07-13 03:35:38.217405oai:www.lume.ufrgs.br:10183/262041Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2023-07-13T06:35:38Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
People Analytics : previsão de desligamentos por meio das técnicas de regressão logística e análise de sobrevivência |
title |
People Analytics : previsão de desligamentos por meio das técnicas de regressão logística e análise de sobrevivência |
spellingShingle |
People Analytics : previsão de desligamentos por meio das técnicas de regressão logística e análise de sobrevivência Bianchi, Fernanda Buffon Regressão logística Análise de sobrevivência Visualização de dados People analytics Logistic regression Survival analysis Data visualization |
title_short |
People Analytics : previsão de desligamentos por meio das técnicas de regressão logística e análise de sobrevivência |
title_full |
People Analytics : previsão de desligamentos por meio das técnicas de regressão logística e análise de sobrevivência |
title_fullStr |
People Analytics : previsão de desligamentos por meio das técnicas de regressão logística e análise de sobrevivência |
title_full_unstemmed |
People Analytics : previsão de desligamentos por meio das técnicas de regressão logística e análise de sobrevivência |
title_sort |
People Analytics : previsão de desligamentos por meio das técnicas de regressão logística e análise de sobrevivência |
author |
Bianchi, Fernanda Buffon |
author_facet |
Bianchi, Fernanda Buffon |
author_role |
author |
dc.contributor.author.fl_str_mv |
Bianchi, Fernanda Buffon |
dc.contributor.advisor1.fl_str_mv |
Selau, Lisiane Priscila Roldão |
contributor_str_mv |
Selau, Lisiane Priscila Roldão |
dc.subject.por.fl_str_mv |
Regressão logística Análise de sobrevivência Visualização de dados |
topic |
Regressão logística Análise de sobrevivência Visualização de dados People analytics Logistic regression Survival analysis Data visualization |
dc.subject.eng.fl_str_mv |
People analytics Logistic regression Survival analysis Data visualization |
description |
O mercado de trabalho se tornou mais competitivo e globalizado nos últimos anos, acarretando altos indíces de rotatividade para as empresas. Com isso, surge uma necessidade cada vez maior de alocar ações de retenção de forma mais assertiva, identificando os colaboradores com maior risco de pedir desligamento e atuando em relação a eles, evitando assim impactos financeiros e de performance, e investindo tempo e dinheiro de forma mais estratégica. A técnica mais amplamente utilizada para predição de desligamentos voluntários é a Regressão Logística. Um modelo pouco conhecido na área, mas que é cada vez mais utilizado em problemas similares é a Análise de Sobrevivência. Sendo assim, este trabalho propõe tanto a utilização do modelo mais tradicional, quanto a introdução do modelo de sobrevivência. Visto que cada modelo prediz um aspecto diferente em relação ao desligamento do colaborador, probabilidade e tempo, respectivamente, o objetivo é cruzar as variáveis resposta dos dois modelos a fim de se desenvolver uma ferramenta de visualização de dados que forneça aos tomadores de decisão a possibilidade de alocar seus investimentos nos indivíduos com maior risco de desligamento, e que são, portanto, de alta prioridade em ações de retenção. Os modelos foram desenvolvidos com uma base de dados do período de Janeiro de 2021 e formada por 534 colaboradores. Os modelos foram analisados com base em três medidas de desempenho: percentual de acerto, teste KS e área abaixo da curva ROC, sendo a primeira medida apenas para o modelo logístico. Neste estudo, ambas as técnicas obtiveram desempenhos satisfatórios e demonstraram boa capacidade de predição. A ferramenta de visualização de dados desenvolvida propôs a divisão dos colaboradores em 3 níveis diferentes de priorização, cruzando os riscos de perda sob os aspectos probabilidade e tempo. |
publishDate |
2023 |
dc.date.accessioned.fl_str_mv |
2023-07-12T03:34:52Z |
dc.date.issued.fl_str_mv |
2023 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/262041 |
dc.identifier.nrb.pt_BR.fl_str_mv |
001172531 |
url |
http://hdl.handle.net/10183/262041 |
identifier_str_mv |
001172531 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Repositório Institucional da UFRGS |
collection |
Repositório Institucional da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/262041/2/001172531.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/262041/1/001172531.pdf |
bitstream.checksum.fl_str_mv |
89530efa519531173065f183c29ecfcd d5066a3c09ad1846879af7fa15a49ef7 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
|
_version_ |
1815447345417945088 |