Modelação do cancelamento de apólices de seguro automóvel, por parte do cliente
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10400.22/12790 |
Resumo: | Os cancelamentos de apólices influenciam diretamente as operações comerciais diárias e têm impacto no risco assumido pelas companhias de seguros, o que torna evidente a necessidade de ter um papel ativo na definição de estratégias que levem à promoção da fidelidade do cliente e na garantia de meios que facilitem a monitorização dos riscos comerciais. Quis-se identificar, entre os clientes com seguro automóvel de uma companhia de seguros, características que distinguem aqueles que cancelam as suas apólices de seguro dos outros clientes, de modo que, conhecidas as características de um novo indivíduo, se possa prever a que grupo pertence. Ponto de partida: dois conjuntos de dados contendo informações relativas a apólices de seguro e a sinistros ocorridos. Os conjuntos de dados foram trabalhados e uni cados até um conjunto final, composto por 371252 apólices ativas no ano de 2015 e, para cada uma delas, dados relativos a vinte variáveis, sendo uma delas a variável resposta (anulação da apólice, por parte do cliente) a ser predita pelas dezanove restantes. Um modelo linear generalizado, em particular uma regressão logística, construído com o conjunto das quatro variáveis mais significativas (data inicial, bonificação, forma de pagamento e pack de coberturas 2 ), dada a sua parcimónia, foi preferido pela companhia de seguros. A curva ROC correspondente tem uma AUC de aproximadamente 66.6%, com IC95% = [65.8%, 67.3%]. Fixando o objetivo de 80% para a sensibilidade, tem-se uma especificidade de aproximadamente 42% e uma exatidão pouco superior a 47%. Como alternativa, apresenta-se um modelo, construído com recurso a 5 variáveis simples (data inicial, bonificação, forma de pagamento, pack de coberturas 1, prémio apólice) e a uma das interações entre um par dessas variáveis (data inicial / forma de pagamento). A este modelo corresponde uma curva ROC com AUC = 69.4%, IC95% = [68.7%, 70.1%] e, para o mesmo objetivo de cerca de 80% de sensibilidade, consegue 47% de especificidade e exatidão pouco acima de 51%. Tendo como meta para o modelo o objetivo do equilíbrio entre bom ajustamento, parcimónia e interpretação, verificou-se que apenas a qualidade de ajustamento deixa a desejar. |
id |
RCAP_9d220f21dfeb9650f298307651b7e464 |
---|---|
oai_identifier_str |
oai:recipp.ipp.pt:10400.22/12790 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Modelação do cancelamento de apólices de seguro automóvel, por parte do clienteFidelidade do clienteModelos lineares generalizadosRegressão logísticaCurva ROCCustomer loyaltyGeneralized linear modelsLogistic regressionROC curveOs cancelamentos de apólices influenciam diretamente as operações comerciais diárias e têm impacto no risco assumido pelas companhias de seguros, o que torna evidente a necessidade de ter um papel ativo na definição de estratégias que levem à promoção da fidelidade do cliente e na garantia de meios que facilitem a monitorização dos riscos comerciais. Quis-se identificar, entre os clientes com seguro automóvel de uma companhia de seguros, características que distinguem aqueles que cancelam as suas apólices de seguro dos outros clientes, de modo que, conhecidas as características de um novo indivíduo, se possa prever a que grupo pertence. Ponto de partida: dois conjuntos de dados contendo informações relativas a apólices de seguro e a sinistros ocorridos. Os conjuntos de dados foram trabalhados e uni cados até um conjunto final, composto por 371252 apólices ativas no ano de 2015 e, para cada uma delas, dados relativos a vinte variáveis, sendo uma delas a variável resposta (anulação da apólice, por parte do cliente) a ser predita pelas dezanove restantes. Um modelo linear generalizado, em particular uma regressão logística, construído com o conjunto das quatro variáveis mais significativas (data inicial, bonificação, forma de pagamento e pack de coberturas 2 ), dada a sua parcimónia, foi preferido pela companhia de seguros. A curva ROC correspondente tem uma AUC de aproximadamente 66.6%, com IC95% = [65.8%, 67.3%]. Fixando o objetivo de 80% para a sensibilidade, tem-se uma especificidade de aproximadamente 42% e uma exatidão pouco superior a 47%. Como alternativa, apresenta-se um modelo, construído com recurso a 5 variáveis simples (data inicial, bonificação, forma de pagamento, pack de coberturas 1, prémio apólice) e a uma das interações entre um par dessas variáveis (data inicial / forma de pagamento). A este modelo corresponde uma curva ROC com AUC = 69.4%, IC95% = [68.7%, 70.1%] e, para o mesmo objetivo de cerca de 80% de sensibilidade, consegue 47% de especificidade e exatidão pouco acima de 51%. Tendo como meta para o modelo o objetivo do equilíbrio entre bom ajustamento, parcimónia e interpretação, verificou-se que apenas a qualidade de ajustamento deixa a desejar.Policy cancellations directly influence daily business operations and have an impact on the risk assumed by insurance companies, which makes clear the need to take an active role in defining strategies that promote customer loyalty and guarantee the means to facilitate monitoring of commercial risks. It was intended to identify, among the customers with auto insurance policies of an insurance company, characteristics that distinguish those who cancel their insurance policies from other clients, so that, knowing the characteristics of a new individual, one can predict to which group belongs. Starting point: two data sets containing information on insurance policies and car accidents occurred. The data sets were worked and unified to a final set, composed by 371252 policies active in the year 2015 and, for each of them, data related to twenty variables, one of them being the response variable (policy cancellation, by the customer) to be predicted by the nineteen remaining. A generalized linear model with logistic regression, constructed with the set of the four most significant variables (initial date, bonus, form of payment and coverages pack 2 ), due its parsimony, was preferred by the insurance company. The corresponding ROC curve has an AUC of approximately 66.6%, with IC95% = [65.8%, 67.3%]. Setting the 80% target for sensitivity, we have a specificity of approximately 42% and an accuracy just over 47%. As an alternative, it is presented a model constructed using five simple variables (initial date, bonus, form of payment, coverages pack 1, policy premium) and one of the interactions between a pair of these variables (initial date / form of payment). This model corresponds to a ROC curve with AUC = 69.4%, IC95% = [68.7%, 70.1%] and, for the same objective of about 80% sensitivity, achieves 47% of specificity and accuracy just over 51%. Having as goal for the model the objective of the balance between good adjustment, parsimony and interpretation, it was noticed that only the quality of adjustment is not what it is desired.Ramos, Sandra Cristina de FariaRepositório Científico do Instituto Politécnico do PortoCordeiro, Vasco André Mota Torres2019-01-29T15:18:25Z20172017-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.22/12790TID:201768542porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-03-13T12:54:46Zoai:recipp.ipp.pt:10400.22/12790Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T17:33:04.662713Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Modelação do cancelamento de apólices de seguro automóvel, por parte do cliente |
title |
Modelação do cancelamento de apólices de seguro automóvel, por parte do cliente |
spellingShingle |
Modelação do cancelamento de apólices de seguro automóvel, por parte do cliente Cordeiro, Vasco André Mota Torres Fidelidade do cliente Modelos lineares generalizados Regressão logística Curva ROC Customer loyalty Generalized linear models Logistic regression ROC curve |
title_short |
Modelação do cancelamento de apólices de seguro automóvel, por parte do cliente |
title_full |
Modelação do cancelamento de apólices de seguro automóvel, por parte do cliente |
title_fullStr |
Modelação do cancelamento de apólices de seguro automóvel, por parte do cliente |
title_full_unstemmed |
Modelação do cancelamento de apólices de seguro automóvel, por parte do cliente |
title_sort |
Modelação do cancelamento de apólices de seguro automóvel, por parte do cliente |
author |
Cordeiro, Vasco André Mota Torres |
author_facet |
Cordeiro, Vasco André Mota Torres |
author_role |
author |
dc.contributor.none.fl_str_mv |
Ramos, Sandra Cristina de Faria Repositório Científico do Instituto Politécnico do Porto |
dc.contributor.author.fl_str_mv |
Cordeiro, Vasco André Mota Torres |
dc.subject.por.fl_str_mv |
Fidelidade do cliente Modelos lineares generalizados Regressão logística Curva ROC Customer loyalty Generalized linear models Logistic regression ROC curve |
topic |
Fidelidade do cliente Modelos lineares generalizados Regressão logística Curva ROC Customer loyalty Generalized linear models Logistic regression ROC curve |
description |
Os cancelamentos de apólices influenciam diretamente as operações comerciais diárias e têm impacto no risco assumido pelas companhias de seguros, o que torna evidente a necessidade de ter um papel ativo na definição de estratégias que levem à promoção da fidelidade do cliente e na garantia de meios que facilitem a monitorização dos riscos comerciais. Quis-se identificar, entre os clientes com seguro automóvel de uma companhia de seguros, características que distinguem aqueles que cancelam as suas apólices de seguro dos outros clientes, de modo que, conhecidas as características de um novo indivíduo, se possa prever a que grupo pertence. Ponto de partida: dois conjuntos de dados contendo informações relativas a apólices de seguro e a sinistros ocorridos. Os conjuntos de dados foram trabalhados e uni cados até um conjunto final, composto por 371252 apólices ativas no ano de 2015 e, para cada uma delas, dados relativos a vinte variáveis, sendo uma delas a variável resposta (anulação da apólice, por parte do cliente) a ser predita pelas dezanove restantes. Um modelo linear generalizado, em particular uma regressão logística, construído com o conjunto das quatro variáveis mais significativas (data inicial, bonificação, forma de pagamento e pack de coberturas 2 ), dada a sua parcimónia, foi preferido pela companhia de seguros. A curva ROC correspondente tem uma AUC de aproximadamente 66.6%, com IC95% = [65.8%, 67.3%]. Fixando o objetivo de 80% para a sensibilidade, tem-se uma especificidade de aproximadamente 42% e uma exatidão pouco superior a 47%. Como alternativa, apresenta-se um modelo, construído com recurso a 5 variáveis simples (data inicial, bonificação, forma de pagamento, pack de coberturas 1, prémio apólice) e a uma das interações entre um par dessas variáveis (data inicial / forma de pagamento). A este modelo corresponde uma curva ROC com AUC = 69.4%, IC95% = [68.7%, 70.1%] e, para o mesmo objetivo de cerca de 80% de sensibilidade, consegue 47% de especificidade e exatidão pouco acima de 51%. Tendo como meta para o modelo o objetivo do equilíbrio entre bom ajustamento, parcimónia e interpretação, verificou-se que apenas a qualidade de ajustamento deixa a desejar. |
publishDate |
2017 |
dc.date.none.fl_str_mv |
2017 2017-01-01T00:00:00Z 2019-01-29T15:18:25Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10400.22/12790 TID:201768542 |
url |
http://hdl.handle.net/10400.22/12790 |
identifier_str_mv |
TID:201768542 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799131422947016704 |