Modelling large claims in non-life insurance: An application in motor insurance industry based on extreme value theory and gradient boosting machine techniques
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10362/144999 |
Resumo: | Internship Report presented as the partial requirement for obtaining a Master's degree in Statistics and Information Management, specialization in Risk Analysis and Management |
id |
RCAP_2f847240ab6122c32d6dbf9c1231fb0a |
---|---|
oai_identifier_str |
oai:run.unl.pt:10362/144999 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Modelling large claims in non-life insurance: An application in motor insurance industry based on extreme value theory and gradient boosting machine techniquesMotor InsuranceClaims SeverityExtremal EventsPrediction ModelsGradient BoostingSeguro AutomóvelResponsabilidade Civil AutomóvelGravidade de SinistrosEventos ExtremosModelos PreditivosInternship Report presented as the partial requirement for obtaining a Master's degree in Statistics and Information Management, specialization in Risk Analysis and ManagementIn recent years, there has been an increased interest in non-life insurance sector, especially in motor insurance segment. In fact, thousands of collisions, crashes, breakdowns, and thefts are reported to Portuguese insurance companies every day. Some with bigger claims than others- the extreme events. Extreme value theory has been used to develop models for describing the distribution of this rare events. Modelling extremes is challenging and there is usually a trade-off between being as close as possible to the "asymptotic regime" and, at the same time, having as much data as possible for estimates to be reliable. An important challenge in the application of such extreme models is the choice of a threshold, beyond which point the asymptotically justified extreme value models can provide good extrapolation. The focus of this study will be the greatest losses. This aims to contribute to the literature of extreme values analysis - modelling extreme values based on thresholds. Moreover, this project pretends analyse the mains factors that facilitate the decision-making process by the insurance company. Several risk factors that could explain the costs’ behaviour are used to model the claims’ severity. The applied methodology will focus on Gradient Boosting machine learning techniques, from which a modelling process is developed on a set of data of Fidelidade Motor Insurance portfolio. The results show that it makes sense to have two borders and to analyse factors of relevance in each segment. Regression models are built, and it is achieved, in the three main models developed, vehicle category is always very present as the main responsible variable followed by the variable’s year analysis and years in portfolio.Nos últimos anos, tem-se assistido a um grande interesse pelo setor dos seguros não vida, particularmente no segmento automóvel. De facto, milhares de colisões, despistes e avarias são comunicados diariamente nas seguradoras portuguesas. Alguns com maior gravidade e custos do que outros – os eventos extremos. A teoria dos valores extremos é usada para desenvolver modelos extremos para descrever uma distribuição dos mesmos. A modelagem é um enorme desafio e geralmente há um trade-off entre escolher um valor mais próximo possível do regime assintótico do conjunto dos dados e, ao mesmo tempo, o segmento acima do valor escolhido conter o máximo de dados para existir qualidade na estimação. Um desafio importante na aplicação de tais modelos é a escolha de um valor fronteiro- a partir do qual os modelos de valores extremos podem fornecer uma boa extrapolação. O foco deste estudo será os custos mais elevados existentes com sinistros automóveis (apenas sobre a cobertura de responsabilidade civil). O mesmo visa contribuir com literatura sobre valores extremos e modelação de valores extremos com base em fronteiras. Além disso, pretende-se neste estudo analisar as principais variáveis que explicam os modelos. Vários fatores de risco que podem explicar o comportamento dos custos são usados para modelar a gravidade dos sinistros. A metodologia é aplicada à carteira de dados da Fidelidade. Os modelos são criados utilizando a técnica de Gradient Boosting Machine. Os resultados mostram que faz sentido ter duas fronteiras e analisar fatores de relevância em cada segmento. São construídos três modelos de regressão e a categoria do veículo é o fator de relevância que aparece mais presente como a principal variável responsável do modelo, seguida do fator ano do sinistro e do número de anos de carteira do segurado.Vilares, Manuel JoséRUNVieira, Maria Inês Trindade2022-10-172025-10-17T00:00:00Z2022-10-17T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10362/144999TID:203138589enginfo:eu-repo/semantics/embargoedAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-03-11T05:25:04Zoai:run.unl.pt:10362/144999Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T03:51:51.822566Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Modelling large claims in non-life insurance: An application in motor insurance industry based on extreme value theory and gradient boosting machine techniques |
title |
Modelling large claims in non-life insurance: An application in motor insurance industry based on extreme value theory and gradient boosting machine techniques |
spellingShingle |
Modelling large claims in non-life insurance: An application in motor insurance industry based on extreme value theory and gradient boosting machine techniques Vieira, Maria Inês Trindade Motor Insurance Claims Severity Extremal Events Prediction Models Gradient Boosting Seguro Automóvel Responsabilidade Civil Automóvel Gravidade de Sinistros Eventos Extremos Modelos Preditivos |
title_short |
Modelling large claims in non-life insurance: An application in motor insurance industry based on extreme value theory and gradient boosting machine techniques |
title_full |
Modelling large claims in non-life insurance: An application in motor insurance industry based on extreme value theory and gradient boosting machine techniques |
title_fullStr |
Modelling large claims in non-life insurance: An application in motor insurance industry based on extreme value theory and gradient boosting machine techniques |
title_full_unstemmed |
Modelling large claims in non-life insurance: An application in motor insurance industry based on extreme value theory and gradient boosting machine techniques |
title_sort |
Modelling large claims in non-life insurance: An application in motor insurance industry based on extreme value theory and gradient boosting machine techniques |
author |
Vieira, Maria Inês Trindade |
author_facet |
Vieira, Maria Inês Trindade |
author_role |
author |
dc.contributor.none.fl_str_mv |
Vilares, Manuel José RUN |
dc.contributor.author.fl_str_mv |
Vieira, Maria Inês Trindade |
dc.subject.por.fl_str_mv |
Motor Insurance Claims Severity Extremal Events Prediction Models Gradient Boosting Seguro Automóvel Responsabilidade Civil Automóvel Gravidade de Sinistros Eventos Extremos Modelos Preditivos |
topic |
Motor Insurance Claims Severity Extremal Events Prediction Models Gradient Boosting Seguro Automóvel Responsabilidade Civil Automóvel Gravidade de Sinistros Eventos Extremos Modelos Preditivos |
description |
Internship Report presented as the partial requirement for obtaining a Master's degree in Statistics and Information Management, specialization in Risk Analysis and Management |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-10-17 2022-10-17T00:00:00Z 2025-10-17T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10362/144999 TID:203138589 |
url |
http://hdl.handle.net/10362/144999 |
identifier_str_mv |
TID:203138589 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/embargoedAccess |
eu_rights_str_mv |
embargoedAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799138111004868608 |