Modelling large claims in non-life insurance: An application in motor insurance industry based on extreme value theory and gradient boosting machine techniques

Detalhes bibliográficos
Autor(a) principal: Vieira, Maria Inês Trindade
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10362/144999
Resumo: Internship Report presented as the partial requirement for obtaining a Master's degree in Statistics and Information Management, specialization in Risk Analysis and Management
id RCAP_2f847240ab6122c32d6dbf9c1231fb0a
oai_identifier_str oai:run.unl.pt:10362/144999
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Modelling large claims in non-life insurance: An application in motor insurance industry based on extreme value theory and gradient boosting machine techniquesMotor InsuranceClaims SeverityExtremal EventsPrediction ModelsGradient BoostingSeguro AutomóvelResponsabilidade Civil AutomóvelGravidade de SinistrosEventos ExtremosModelos PreditivosInternship Report presented as the partial requirement for obtaining a Master's degree in Statistics and Information Management, specialization in Risk Analysis and ManagementIn recent years, there has been an increased interest in non-life insurance sector, especially in motor insurance segment. In fact, thousands of collisions, crashes, breakdowns, and thefts are reported to Portuguese insurance companies every day. Some with bigger claims than others- the extreme events. Extreme value theory has been used to develop models for describing the distribution of this rare events. Modelling extremes is challenging and there is usually a trade-off between being as close as possible to the "asymptotic regime" and, at the same time, having as much data as possible for estimates to be reliable. An important challenge in the application of such extreme models is the choice of a threshold, beyond which point the asymptotically justified extreme value models can provide good extrapolation. The focus of this study will be the greatest losses. This aims to contribute to the literature of extreme values analysis - modelling extreme values based on thresholds. Moreover, this project pretends analyse the mains factors that facilitate the decision-making process by the insurance company. Several risk factors that could explain the costs’ behaviour are used to model the claims’ severity. The applied methodology will focus on Gradient Boosting machine learning techniques, from which a modelling process is developed on a set of data of Fidelidade Motor Insurance portfolio. The results show that it makes sense to have two borders and to analyse factors of relevance in each segment. Regression models are built, and it is achieved, in the three main models developed, vehicle category is always very present as the main responsible variable followed by the variable’s year analysis and years in portfolio.Nos últimos anos, tem-se assistido a um grande interesse pelo setor dos seguros não vida, particularmente no segmento automóvel. De facto, milhares de colisões, despistes e avarias são comunicados diariamente nas seguradoras portuguesas. Alguns com maior gravidade e custos do que outros – os eventos extremos. A teoria dos valores extremos é usada para desenvolver modelos extremos para descrever uma distribuição dos mesmos. A modelagem é um enorme desafio e geralmente há um trade-off entre escolher um valor mais próximo possível do regime assintótico do conjunto dos dados e, ao mesmo tempo, o segmento acima do valor escolhido conter o máximo de dados para existir qualidade na estimação. Um desafio importante na aplicação de tais modelos é a escolha de um valor fronteiro- a partir do qual os modelos de valores extremos podem fornecer uma boa extrapolação. O foco deste estudo será os custos mais elevados existentes com sinistros automóveis (apenas sobre a cobertura de responsabilidade civil). O mesmo visa contribuir com literatura sobre valores extremos e modelação de valores extremos com base em fronteiras. Além disso, pretende-se neste estudo analisar as principais variáveis que explicam os modelos. Vários fatores de risco que podem explicar o comportamento dos custos são usados para modelar a gravidade dos sinistros. A metodologia é aplicada à carteira de dados da Fidelidade. Os modelos são criados utilizando a técnica de Gradient Boosting Machine. Os resultados mostram que faz sentido ter duas fronteiras e analisar fatores de relevância em cada segmento. São construídos três modelos de regressão e a categoria do veículo é o fator de relevância que aparece mais presente como a principal variável responsável do modelo, seguida do fator ano do sinistro e do número de anos de carteira do segurado.Vilares, Manuel JoséRUNVieira, Maria Inês Trindade2022-10-172025-10-17T00:00:00Z2022-10-17T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10362/144999TID:203138589enginfo:eu-repo/semantics/embargoedAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-03-11T05:25:04Zoai:run.unl.pt:10362/144999Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T03:51:51.822566Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Modelling large claims in non-life insurance: An application in motor insurance industry based on extreme value theory and gradient boosting machine techniques
title Modelling large claims in non-life insurance: An application in motor insurance industry based on extreme value theory and gradient boosting machine techniques
spellingShingle Modelling large claims in non-life insurance: An application in motor insurance industry based on extreme value theory and gradient boosting machine techniques
Vieira, Maria Inês Trindade
Motor Insurance
Claims Severity
Extremal Events
Prediction Models
Gradient Boosting
Seguro Automóvel
Responsabilidade Civil Automóvel
Gravidade de Sinistros
Eventos Extremos
Modelos Preditivos
title_short Modelling large claims in non-life insurance: An application in motor insurance industry based on extreme value theory and gradient boosting machine techniques
title_full Modelling large claims in non-life insurance: An application in motor insurance industry based on extreme value theory and gradient boosting machine techniques
title_fullStr Modelling large claims in non-life insurance: An application in motor insurance industry based on extreme value theory and gradient boosting machine techniques
title_full_unstemmed Modelling large claims in non-life insurance: An application in motor insurance industry based on extreme value theory and gradient boosting machine techniques
title_sort Modelling large claims in non-life insurance: An application in motor insurance industry based on extreme value theory and gradient boosting machine techniques
author Vieira, Maria Inês Trindade
author_facet Vieira, Maria Inês Trindade
author_role author
dc.contributor.none.fl_str_mv Vilares, Manuel José
RUN
dc.contributor.author.fl_str_mv Vieira, Maria Inês Trindade
dc.subject.por.fl_str_mv Motor Insurance
Claims Severity
Extremal Events
Prediction Models
Gradient Boosting
Seguro Automóvel
Responsabilidade Civil Automóvel
Gravidade de Sinistros
Eventos Extremos
Modelos Preditivos
topic Motor Insurance
Claims Severity
Extremal Events
Prediction Models
Gradient Boosting
Seguro Automóvel
Responsabilidade Civil Automóvel
Gravidade de Sinistros
Eventos Extremos
Modelos Preditivos
description Internship Report presented as the partial requirement for obtaining a Master's degree in Statistics and Information Management, specialization in Risk Analysis and Management
publishDate 2022
dc.date.none.fl_str_mv 2022-10-17
2022-10-17T00:00:00Z
2025-10-17T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10362/144999
TID:203138589
url http://hdl.handle.net/10362/144999
identifier_str_mv TID:203138589
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/embargoedAccess
eu_rights_str_mv embargoedAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799138111004868608