People Analytics: uso de árvores de decisão na retenção de talentos

Detalhes bibliográficos
Autor(a) principal: Abreu, Leonardo Evangelista de
Data de Publicação: 2022
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UNESP
Texto Completo: http://hdl.handle.net/11449/217419
Resumo: Este trabalho foi desenvolvido com uma base de dados disponível pelo Kaggle e tem como objetivo identificar, traçar o perfil e prever, por meio do uso de árvores de decisão, quais pessoas têm tendência a se desligar de uma empresa a partir de suas características pessoais e profissionais. A ideia do projeto consiste em mostrar que o uso de ferramentas estatísticas na área de Gestão de Pessoas pode agregar muito valor de forma prática e simples, ainda mais nessa área que a análise de dados não é muito frequente. Embora a base de dados seja desbalanceada e possui muitos valores faltantes, para fins práticos desconsiderou-se as observações que possuíam pelo menos um dado faltante e não foi usado nenhuma técnica para equilibrar as classes de interesse. Para lidar com as variáveis categóricas foram criadas variáveis dummy pois o sckit-learn, biblioteca usada para modelagem no Python, não suporta dados categóricos. Foram feitos dois modelos, o primeiro cresceu exaustivamente, ficando muito específico com problemas de sobreajuste, enquanto o segundo foi podado usando o critério de custo de complexidade. Através de métricas estatísticas, tais como Recall, Precisão e F1-Score, checou-se a performance dos modelos avaliando se possuem boa capacidade discriminante. Embora alguns dados sobre os colaboradores possam ser difíceis de serem obtidos, as árvores de decisão demonstram serem bem interessantes para auxiliar na retenção de talentos.
id UNSP_c2261eb8ac57fc69484eb2a890b7b5e0
oai_identifier_str oai:repositorio.unesp.br:11449/217419
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str 2946
spelling People Analytics: uso de árvores de decisão na retenção de talentosPeople Analytics: use of decision trees in talent retentionÁrvores de decisãoRetenção de talentosRecursos humanosGestão de pessoasPeople analyticsDecision treesRetaining talentHuman resourcesPeople managementEste trabalho foi desenvolvido com uma base de dados disponível pelo Kaggle e tem como objetivo identificar, traçar o perfil e prever, por meio do uso de árvores de decisão, quais pessoas têm tendência a se desligar de uma empresa a partir de suas características pessoais e profissionais. A ideia do projeto consiste em mostrar que o uso de ferramentas estatísticas na área de Gestão de Pessoas pode agregar muito valor de forma prática e simples, ainda mais nessa área que a análise de dados não é muito frequente. Embora a base de dados seja desbalanceada e possui muitos valores faltantes, para fins práticos desconsiderou-se as observações que possuíam pelo menos um dado faltante e não foi usado nenhuma técnica para equilibrar as classes de interesse. Para lidar com as variáveis categóricas foram criadas variáveis dummy pois o sckit-learn, biblioteca usada para modelagem no Python, não suporta dados categóricos. Foram feitos dois modelos, o primeiro cresceu exaustivamente, ficando muito específico com problemas de sobreajuste, enquanto o segundo foi podado usando o critério de custo de complexidade. Através de métricas estatísticas, tais como Recall, Precisão e F1-Score, checou-se a performance dos modelos avaliando se possuem boa capacidade discriminante. Embora alguns dados sobre os colaboradores possam ser difíceis de serem obtidos, as árvores de decisão demonstram serem bem interessantes para auxiliar na retenção de talentos.This work was developed with a database available by Kaggle and aims to identify, profile and predict, through the use of decision trees, which people tend to leave a company based on their personal characteristics and professionals. The idea of the project is to show that the use of statistical tools in the area of People Management can add a lot of value in a practical and simple way, especially in this area where data analysis is not very frequent. Although the database is unbalanced and has many missing values, for practical purposes, observations that had at least one missing data were disregarded and no technique was used to balance the classes of interest. To deal with category variables, dummy variables were created because sckit-learn, the library used for modeling in Python, does not support categorical data. Two models were made, the first grew exhaustively, becoming very specific with overfitting problems, while the second was pruned using the complexity cost criterion. Through statistical metrics, such as Recall, Precision and F1-Score, the performance of the models was checked, evaluating whether they have good discriminating capacity. Although some data about employees can be difficult to obtain, decision trees prove to be very interesting to help retain talent.Não recebi financiamentoUniversidade Estadual Paulista (Unesp)Schlunzen Junior, Klaus [UNESP]Universidade Estadual Paulista (Unesp)Abreu, Leonardo Evangelista de2022-03-28T12:31:59Z2022-03-28T12:31:59Z2022-03-07info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfhttp://hdl.handle.net/11449/217419porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2023-11-23T06:10:20Zoai:repositorio.unesp.br:11449/217419Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462024-08-05T18:28:39.862280Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv People Analytics: uso de árvores de decisão na retenção de talentos
People Analytics: use of decision trees in talent retention
title People Analytics: uso de árvores de decisão na retenção de talentos
spellingShingle People Analytics: uso de árvores de decisão na retenção de talentos
Abreu, Leonardo Evangelista de
Árvores de decisão
Retenção de talentos
Recursos humanos
Gestão de pessoas
People analytics
Decision trees
Retaining talent
Human resources
People management
title_short People Analytics: uso de árvores de decisão na retenção de talentos
title_full People Analytics: uso de árvores de decisão na retenção de talentos
title_fullStr People Analytics: uso de árvores de decisão na retenção de talentos
title_full_unstemmed People Analytics: uso de árvores de decisão na retenção de talentos
title_sort People Analytics: uso de árvores de decisão na retenção de talentos
author Abreu, Leonardo Evangelista de
author_facet Abreu, Leonardo Evangelista de
author_role author
dc.contributor.none.fl_str_mv Schlunzen Junior, Klaus [UNESP]
Universidade Estadual Paulista (Unesp)
dc.contributor.author.fl_str_mv Abreu, Leonardo Evangelista de
dc.subject.por.fl_str_mv Árvores de decisão
Retenção de talentos
Recursos humanos
Gestão de pessoas
People analytics
Decision trees
Retaining talent
Human resources
People management
topic Árvores de decisão
Retenção de talentos
Recursos humanos
Gestão de pessoas
People analytics
Decision trees
Retaining talent
Human resources
People management
description Este trabalho foi desenvolvido com uma base de dados disponível pelo Kaggle e tem como objetivo identificar, traçar o perfil e prever, por meio do uso de árvores de decisão, quais pessoas têm tendência a se desligar de uma empresa a partir de suas características pessoais e profissionais. A ideia do projeto consiste em mostrar que o uso de ferramentas estatísticas na área de Gestão de Pessoas pode agregar muito valor de forma prática e simples, ainda mais nessa área que a análise de dados não é muito frequente. Embora a base de dados seja desbalanceada e possui muitos valores faltantes, para fins práticos desconsiderou-se as observações que possuíam pelo menos um dado faltante e não foi usado nenhuma técnica para equilibrar as classes de interesse. Para lidar com as variáveis categóricas foram criadas variáveis dummy pois o sckit-learn, biblioteca usada para modelagem no Python, não suporta dados categóricos. Foram feitos dois modelos, o primeiro cresceu exaustivamente, ficando muito específico com problemas de sobreajuste, enquanto o segundo foi podado usando o critério de custo de complexidade. Através de métricas estatísticas, tais como Recall, Precisão e F1-Score, checou-se a performance dos modelos avaliando se possuem boa capacidade discriminante. Embora alguns dados sobre os colaboradores possam ser difíceis de serem obtidos, as árvores de decisão demonstram serem bem interessantes para auxiliar na retenção de talentos.
publishDate 2022
dc.date.none.fl_str_mv 2022-03-28T12:31:59Z
2022-03-28T12:31:59Z
2022-03-07
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/11449/217419
url http://hdl.handle.net/11449/217419
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv
_version_ 1808128937288531968