Best practice of risk modelling in motor insurance : using GLM and Machine Learning approach

Detalhes bibliográficos
Autor(a) principal: Xu, Zhifeng
Data de Publicação: 2020
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10400.5/20405
Resumo: Mestrado em Actuarial Science
id RCAP_a90c309aab48e943e5fbd3893a454815
oai_identifier_str oai:www.repository.utl.pt:10400.5/20405
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Best practice of risk modelling in motor insurance : using GLM and Machine Learning approachseguro automóvelmachine learningmodelos sofisticação de pric- ingmodelos GLM penalizadosboostingGLManálise dos resíduostreinovalidaçãotestemotor insurancepricing sophisticationpenalized GLMresidual analysistrainingvalidationholdoutMestrado em Actuarial ScienceO pricing na atividade seguradora está a tornar-se cada vez mais interessante e desafi- ador pelo facto de a dimensão dos dados a analisar estar a crescer de forma explosiva. Torna-se assim urgente para as seguradoras reconsiderar a forma de lidar com este vol- ume de dados. Para implementar modelos sofisticados de pricing para produtos de seguro automóvel, aplicámos técnicas de machine learning, incluindo modelos GLM penalizados e métodos de boosting, que ajudam a identificar as características mais importantes de entre uma grande quantidade de variáveis candidatas. Estes métodos também permitem detetar potenciais interações sem testar as inúmeras combinações bidimensionais. Para um uso eficiente desses métodos, é necessário compreender o objetivo do modelo, as hipóteses que o suportam e dominar as metodologias estatísticas. Embora haja alguma evidência de um maior poder preditivo dos modelos baseados em machine learning quando comparados com os tradicionais GLM, estes últimos beneficiam de uma estrutura, mais conveniente e mais interpretável. O modelo GLM é mais fácil de ex- plicar às partes interessadas o que nos levou a utilizar os GLM na modelação do risco, mas absorvendo os ensinamentos dados pelos modelos de machine learning. A avaliação dos modelos é realizada pela análise dos resíduos quer na fase de treino quer de validação quer ainda de teste. Após a revisão pela equipa, aplicam-se alguns ajustes em cada modelo para reforçar a sua significância e a sua robustez. Espera-se que eles tenham alto poder preditivo nos dados fora da amostra e possam, portanto, ser usados no futuro.Insurance pricing nowadays is getting more and more interesting and challenging due to the fact that the dimension of analysable data is evolutionarily exploding. It is an urgent call for insurers to reconsider how to deal with the data more accurately and precisely. To implement pricing sophistication in motor insurance products, we apply cutting edge machine learning techniques including penalized GLM and boosting methods, which help us identify the important features among massive amount of candidate variables, and detect potential interactions without trying the endless two-way combinations manually. In order to sufficiently make use of these methods, we need to deeply understand the research objective, preliminary assumptions and statistical backgrounds. Although there is some evidence indicating the existence of higher predictive power of machine learning models compared with traditional GLM (Generalized Linear Models), GLM is more convenient and interpretable, especially for multiplicative models. GLM model is easier to be demonstrated to stakeholder, therefore we still achieve our risk models in GLM, but absorbing the insights from our machine learning results. The evaluation of models is done by progression, it is generally performed by residual analysis of the training or validation dataset, and testing errors for the holdout dataset. After peer review, we apply some adjustment in each model, to get models that are significant and robust. They are expected to have high predictive power in the out-of- sample data, thus can be used in the future.Instituto Superior de Economia e GestãoSilva, João Andrade eChiong, ClaytonRepositório da Universidade de LisboaXu, Zhifeng2020-09-28T17:02:57Z2020-082020-08-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.5/20405engXu, Zhifeng (2020). "Best practice of risk modelling in motor insurance : using GLM and Machine Learning approach". Dissertação de Mestrado, Universidade de Lisboa. Instituto Superior de Economia e Gestão.info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-03-06T14:49:50Zoai:www.repository.utl.pt:10400.5/20405Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T17:05:09.875407Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Best practice of risk modelling in motor insurance : using GLM and Machine Learning approach
title Best practice of risk modelling in motor insurance : using GLM and Machine Learning approach
spellingShingle Best practice of risk modelling in motor insurance : using GLM and Machine Learning approach
Xu, Zhifeng
seguro automóvel
machine learning
modelos sofisticação de pric- ing
modelos GLM penalizados
boosting
GLM
análise dos resíduos
treino
validação
teste
motor insurance
pricing sophistication
penalized GLM
residual analysis
training
validation
holdout
title_short Best practice of risk modelling in motor insurance : using GLM and Machine Learning approach
title_full Best practice of risk modelling in motor insurance : using GLM and Machine Learning approach
title_fullStr Best practice of risk modelling in motor insurance : using GLM and Machine Learning approach
title_full_unstemmed Best practice of risk modelling in motor insurance : using GLM and Machine Learning approach
title_sort Best practice of risk modelling in motor insurance : using GLM and Machine Learning approach
author Xu, Zhifeng
author_facet Xu, Zhifeng
author_role author
dc.contributor.none.fl_str_mv Silva, João Andrade e
Chiong, Clayton
Repositório da Universidade de Lisboa
dc.contributor.author.fl_str_mv Xu, Zhifeng
dc.subject.por.fl_str_mv seguro automóvel
machine learning
modelos sofisticação de pric- ing
modelos GLM penalizados
boosting
GLM
análise dos resíduos
treino
validação
teste
motor insurance
pricing sophistication
penalized GLM
residual analysis
training
validation
holdout
topic seguro automóvel
machine learning
modelos sofisticação de pric- ing
modelos GLM penalizados
boosting
GLM
análise dos resíduos
treino
validação
teste
motor insurance
pricing sophistication
penalized GLM
residual analysis
training
validation
holdout
description Mestrado em Actuarial Science
publishDate 2020
dc.date.none.fl_str_mv 2020-09-28T17:02:57Z
2020-08
2020-08-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10400.5/20405
url http://hdl.handle.net/10400.5/20405
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv Xu, Zhifeng (2020). "Best practice of risk modelling in motor insurance : using GLM and Machine Learning approach". Dissertação de Mestrado, Universidade de Lisboa. Instituto Superior de Economia e Gestão.
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Instituto Superior de Economia e Gestão
publisher.none.fl_str_mv Instituto Superior de Economia e Gestão
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799131143982809088