Best practice of risk modelling in motor insurance : using GLM and Machine Learning approach
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10400.5/20405 |
Resumo: | Mestrado em Actuarial Science |
id |
RCAP_a90c309aab48e943e5fbd3893a454815 |
---|---|
oai_identifier_str |
oai:www.repository.utl.pt:10400.5/20405 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Best practice of risk modelling in motor insurance : using GLM and Machine Learning approachseguro automóvelmachine learningmodelos sofisticação de pric- ingmodelos GLM penalizadosboostingGLManálise dos resíduostreinovalidaçãotestemotor insurancepricing sophisticationpenalized GLMresidual analysistrainingvalidationholdoutMestrado em Actuarial ScienceO pricing na atividade seguradora está a tornar-se cada vez mais interessante e desafi- ador pelo facto de a dimensão dos dados a analisar estar a crescer de forma explosiva. Torna-se assim urgente para as seguradoras reconsiderar a forma de lidar com este vol- ume de dados. Para implementar modelos sofisticados de pricing para produtos de seguro automóvel, aplicámos técnicas de machine learning, incluindo modelos GLM penalizados e métodos de boosting, que ajudam a identificar as características mais importantes de entre uma grande quantidade de variáveis candidatas. Estes métodos também permitem detetar potenciais interações sem testar as inúmeras combinações bidimensionais. Para um uso eficiente desses métodos, é necessário compreender o objetivo do modelo, as hipóteses que o suportam e dominar as metodologias estatísticas. Embora haja alguma evidência de um maior poder preditivo dos modelos baseados em machine learning quando comparados com os tradicionais GLM, estes últimos beneficiam de uma estrutura, mais conveniente e mais interpretável. O modelo GLM é mais fácil de ex- plicar às partes interessadas o que nos levou a utilizar os GLM na modelação do risco, mas absorvendo os ensinamentos dados pelos modelos de machine learning. A avaliação dos modelos é realizada pela análise dos resíduos quer na fase de treino quer de validação quer ainda de teste. Após a revisão pela equipa, aplicam-se alguns ajustes em cada modelo para reforçar a sua significância e a sua robustez. Espera-se que eles tenham alto poder preditivo nos dados fora da amostra e possam, portanto, ser usados no futuro.Insurance pricing nowadays is getting more and more interesting and challenging due to the fact that the dimension of analysable data is evolutionarily exploding. It is an urgent call for insurers to reconsider how to deal with the data more accurately and precisely. To implement pricing sophistication in motor insurance products, we apply cutting edge machine learning techniques including penalized GLM and boosting methods, which help us identify the important features among massive amount of candidate variables, and detect potential interactions without trying the endless two-way combinations manually. In order to sufficiently make use of these methods, we need to deeply understand the research objective, preliminary assumptions and statistical backgrounds. Although there is some evidence indicating the existence of higher predictive power of machine learning models compared with traditional GLM (Generalized Linear Models), GLM is more convenient and interpretable, especially for multiplicative models. GLM model is easier to be demonstrated to stakeholder, therefore we still achieve our risk models in GLM, but absorbing the insights from our machine learning results. The evaluation of models is done by progression, it is generally performed by residual analysis of the training or validation dataset, and testing errors for the holdout dataset. After peer review, we apply some adjustment in each model, to get models that are significant and robust. They are expected to have high predictive power in the out-of- sample data, thus can be used in the future.Instituto Superior de Economia e GestãoSilva, João Andrade eChiong, ClaytonRepositório da Universidade de LisboaXu, Zhifeng2020-09-28T17:02:57Z2020-082020-08-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.5/20405engXu, Zhifeng (2020). "Best practice of risk modelling in motor insurance : using GLM and Machine Learning approach". Dissertação de Mestrado, Universidade de Lisboa. Instituto Superior de Economia e Gestão.info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-03-06T14:49:50Zoai:www.repository.utl.pt:10400.5/20405Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T17:05:09.875407Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Best practice of risk modelling in motor insurance : using GLM and Machine Learning approach |
title |
Best practice of risk modelling in motor insurance : using GLM and Machine Learning approach |
spellingShingle |
Best practice of risk modelling in motor insurance : using GLM and Machine Learning approach Xu, Zhifeng seguro automóvel machine learning modelos sofisticação de pric- ing modelos GLM penalizados boosting GLM análise dos resíduos treino validação teste motor insurance pricing sophistication penalized GLM residual analysis training validation holdout |
title_short |
Best practice of risk modelling in motor insurance : using GLM and Machine Learning approach |
title_full |
Best practice of risk modelling in motor insurance : using GLM and Machine Learning approach |
title_fullStr |
Best practice of risk modelling in motor insurance : using GLM and Machine Learning approach |
title_full_unstemmed |
Best practice of risk modelling in motor insurance : using GLM and Machine Learning approach |
title_sort |
Best practice of risk modelling in motor insurance : using GLM and Machine Learning approach |
author |
Xu, Zhifeng |
author_facet |
Xu, Zhifeng |
author_role |
author |
dc.contributor.none.fl_str_mv |
Silva, João Andrade e Chiong, Clayton Repositório da Universidade de Lisboa |
dc.contributor.author.fl_str_mv |
Xu, Zhifeng |
dc.subject.por.fl_str_mv |
seguro automóvel machine learning modelos sofisticação de pric- ing modelos GLM penalizados boosting GLM análise dos resíduos treino validação teste motor insurance pricing sophistication penalized GLM residual analysis training validation holdout |
topic |
seguro automóvel machine learning modelos sofisticação de pric- ing modelos GLM penalizados boosting GLM análise dos resíduos treino validação teste motor insurance pricing sophistication penalized GLM residual analysis training validation holdout |
description |
Mestrado em Actuarial Science |
publishDate |
2020 |
dc.date.none.fl_str_mv |
2020-09-28T17:02:57Z 2020-08 2020-08-01T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10400.5/20405 |
url |
http://hdl.handle.net/10400.5/20405 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.relation.none.fl_str_mv |
Xu, Zhifeng (2020). "Best practice of risk modelling in motor insurance : using GLM and Machine Learning approach". Dissertação de Mestrado, Universidade de Lisboa. Instituto Superior de Economia e Gestão. |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Instituto Superior de Economia e Gestão |
publisher.none.fl_str_mv |
Instituto Superior de Economia e Gestão |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799131143982809088 |