Extreme value theory: an application to sports

Detalhes bibliográficos
Autor(a) principal: Vicente, Sérgio Luís Ganhão
Data de Publicação: 2012
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10451/8889
Resumo: Tese de mestrado em Estatística, apresentada à Universidade de Lisboa, através da Faculdade de Ciências, 2012
id RCAP_bc3cc5ea253b8818a124ecfe42ebed7b
oai_identifier_str oai:repositorio.ul.pt:10451/8889
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Extreme value theory: an application to sportsTeoria dos valores extremosMétodo dos máximos por blocosAbordagem POTAbordagem semi-paramétricaDesportoTeses de mestrado - 2012Tese de mestrado em Estatística, apresentada à Universidade de Lisboa, através da Faculdade de Ciências, 2012A Teoria dos Valores Extremos tem as suas origens na década de 1920, com o trabalho pioneiro de Leonard Tippett, ao qual foi solicitado que encontrasse uma forma de tornar os fios de algodão produzidos pela indústria algodoeira britânica mais resistentes. Nos seus estudos, rapidamente se apercebeu de que a resistência dos fios estava directamente relacionada com a força das fibras mais fracas. Surgiu então a necessidade de criar uma teoria probabilística que permitisse lidar com situações em que a quantificação e modelação de acontecimentos ditos extremos passasse a ser o alvo de interesse do investigador, uma vez que a Teoria Clássica era insuficiente para fornecer respostas às questões que se colocavam. Com a ajuda de Sir Ronald Fisher, Leonard Tippett lançou as bases de todo um corpo probabilístico teórico que viria a adqurir uma importância fundamental e crescente em ramos onde a existência de acontecimentos extremos acaba por ser uma condição sine qua non, podendo colocar sérios problemas e entraves se não houver uma compreensão e controlo do fenómeno que os origina. Dada a escassez de dados que caracteriza tais fenómenos, pela sua natureza extrema, e mesmo até rara, a Teoria dos Valores Extremos adquire um papel crucial no sentido de expurgar informação estatística a partir dos elementos disponíveis. Desde então, são inúmeras as áreas que, cada vez mais, recorrem à Teoria dos Valores Extremos no sentido de obter uma maior compreensão acerca do mecanismo de produção dos fenómenos extremos que regem e justificam a existência dessas áreas. Encontramos assim a sua presença em áreas como a Hidrologia, onde a constante ameaça de cheias, ruptura de diques e elevação do nível das águas do mar pode pôr em risco inúmeras vidas humanas. O Mercado Financeiro, assolado pela atuação constante dos indicadores financeiros, vê na Teoria dos Valores Extremos uma ferramenta preciosa para poder lidar com as graves consequências económicas que podem surgir quando tais indicadores atingem níveis extremos. O aumento da temperatura global do planeta, cujos níveis extremos podem ameaçar a sobrevivência de muitas espécies, obriga a área do Ambiente a socorrer-se e obter respostas junto da Teoria dos Valores Extremos. A área do Desporto não foge à regra. Em particular, o Atletismo é caracterizado por um constante aperfeiçoamento dos atletas, onde a prossecução e manutenção de recordes acaba por ser um factor determinante e um objectivo comum, no sentido de alcançarem prestígio, reconhecimento e realização profissional. Variáveis como tempos mínimos, alturas máximas e comprimentos máximos caracterizam por si só as diversas modalidades que compõem as provas atléticas. Uma das mais famosas modalidades do Atletismo, pelo interesse crescente que suscita e pela natureza excpecional dos recordes alcançados, é sem dúvida a prova dos 100 metros. Nomes tais como Carl Lewis, Ben Johnson ou, mais recentemente, Usain Bolt são indissociáveis desta modalidade, onde o talento do atleta é medido pelo tempo mínimo que demora a percorrer uma distância de 100 metros. Actualmente, o recorde mundial é detido pelo jamaicano Usain Bolt, que conseguiu percorrer 100 metros em 9.58 segundos, no Campeonato Mundial de Atletismo de 2009, em Berlim. Face a este recorde, quais são as possibilidades actuais de vencer este recorde? Qual a probabilidade de manter este nível ou então de reduzi-lo para um nível inferior? Ou então, será que se chegou a um patamar abaixo do qual um atleta não consegue descer mais? Quaisquer que sejam as respostas a estas perguntas, é consenso universal que a prestação dum atleta de corrida de alta competição está directamente relacionada com a sua capacidade cardiorrespiratória. _E precisamente a monitorização e aperfeiçoamento dessa capacidade que conduz um atleta no caminho do sucesso, permitindo-lhe, assim, atingir níveis extremos, quer em termos de tempo, quer em termos de velocidade. Uma das variáveis usadas na medição da capacidade cardiorrespiratória dum atleta é o consumo máximo de oxigénio, mais conhecido por V O2max, que representa a quantidade máxima de oxigénio que o corpo humano consegue assimilar, transportar e usar durante um exercício físico intenso, medida em mililitros por quilo de peso corporal e por minuto (ml/kg/min). O controlo permanente desta variável _e de importância vital não só em atletas de corrida de velocidade, como também em ciclistas de alta competição e esquiadores de fundo. A manutenção dum nível elevado do VO2max acaba por ser um factor de preocupação constante por parte deste tipo de atletas, dada a sua ligação íntima com um alto desempenho durante as provas atléticas. O VO2max mais elevado até à actualidade foi registado nos esquiadores noruegueses Bjorn Daehlie e Espen Harald Bjerke, que atingiram um nível de 96 ml/kg/min. Qual a probabilidade de um atleta de alta competição ultrapassar este valor? Será que o corpo humano tem a possibilidade de exceder muito mais este limite? Qual o valor mais elevado do V O2max que, nas circunstâncias actuais, pode ser atingido por um atleta de alta competição? Para responder a todas as questões colocadas no parágrafo anterior, a Teoria dos Valores Extremos é sem dúvida a ferramenta mais adequada. As respostas podem ser então obtidas seguindo duas perspectivas: uma perspectiva paramétrica e uma perspectiva semi-paramétrica. A perspectiva paramétrica tem por pressuposto base a existência dum modelo paramétrico subjacente à obtenção dos dados provenientes de acontecimentos extremos, em que o objectivo central passa pela estimação dos parâmetros desse modelo por métodos de estimação pontual, tais como o método da Máxima Verosimilhança e o método dos Momentos Ponderados de Probabilidade. A partir dessas estimativas, as perguntas anteriormente colocadas encontram as suas respostas em parâmetros estimados, tais como o limite superior (ou inferior) do suporte do modelo subjacente aos dados ou ainda a probabilidade de excedência de níveis elevados (ou baixos). A adopção dum modelo paramétrico adequado é então a questão-chave da abordagem paramétrica. Uma vez que esse modelo é evidentemente desconhecido, surgem então várias propostas dentro do âmbito paramétrico. O método dos Máximo por Blocos (vulgo método dos Máximo Anuais, quando os dados são obtidos de forma anual) propõe um ajustamento da família Generalizada de Valores Extremos aos dados disponíveis, considerando que estes são réplicas independentes duma variável aleatória que selecciona apenas o máximo de cada bloco previamente definido. Por outro lado, o método POT (do inglês Peaks-Over-Threshold) propõe o ajustamento da família Generalizada Pareto às observações que excedem um determinado nível fixado a priori, considerando que essas observações representam uma amostra proveniente da cauda direita (ou esquerda) do modelo subjacente aos dados disponíveis. A perspectiva semi-paramética não propõe nenhum modelo paramétrico para ajustar aos dados e centra a sua atenção na estimação do parâmetro de forma do modelo subjacente desconhecido, que se designa por Índice de Valores Extremos, e que está directamente relacionado com o peso da cauda direita (ou esquerda) do modelo. Para essa estimação ser então possível, a cauda do modelo subjacente deve obedecer a certas condições, uniformizadas e formalizadas por Boris Gnedenko em 1943, que, de acordo com a abordagem semi-paramétrica, são assumidas como estando satisfeitas pelo modelo desconhecido. A estimação do parâmetro de forma é então feita seleccionando as observações da amostra que se encontram acima dum determinado nível aleatório, que não está fixo à partida e que depende do tamanho da amostra em causa, uma vez que se considera que as observações de topo transportam a informação necessária acerca da cauda do modelo subjacente. A determinação do nível aleatório óptimo a considerar perante uma determinada amostra é então uma questão de importância central, sem a qual a obtenção duma estimativa para o Índice de Valores Extremos fica seriamente comprometida. Uma vez obtida a estimativa desse parâmetro, a abordagem semi-paramétrica também permite responder às questões atrás colocadas, focando-se na estimação do limite superior (ou inferior) do suporte do modelo subjacente ou na obtenção de probabilidades de excedência de níveis elevados (ou baixos).Extreme Value Theory can be applied to several areas, where the existence of extreme events is a daily reality. Characterized by constant record breaks such as minimal times or maximal speeds, Sports can obtain bene_ts from Extreme Value Theory, when used as indicator of records' quality. In particular, the 100 metres race, whose current lowest record of 9.58 seconds is held by Usain Bolt, requires an exceptional cardiorespiratory capacity, monitored by the Maximal Oxygen Uptake, or V O2max, which measures the maximal amount of oxygen used during intense e_orts, in millilitres per bodyweight and per minute (ml/kg/min). The highest V O2max (96 ml/kg/min) was recorded for the skiers Bjorn Daelie and Espen Harald Bjerke. What is the probability of exceeding the aforementioned records? Is there a finite limit for these quantities? Extreme Value Theory is the most appropriate tool to answer these questions, ofering two possible approaches: a parametric and a semi-parametric one. The former focuses on estimating the parameters of a proposed underlying model, using the Maximum Likelihood or the Probability Weighted Moments methods. In particular, the Block Maxima method proposes the Generalized Extreme Value distribution as a suitable model to be fitted to the whole dataset and the POT method proposes the Generalized Pareto distribution as a suitable one to be fitted only to observations above a fixed level. Concerning the semi-parametric approach, there is no distribution proposal. Assuming only that the underlying distribution's tail satisfies Gnedenko's Theorem, the goal is to estimate the shape parameter of the underlying distribution, known as Extreme Value Index, which determines the weight of its tail. All the inference is based on a portion of the sample above a random level to be determined. With the obtained estimates, both approaches answer the previous questions computing exceedance probabilities and endpoint estimates.Alves, Maria Isabel Fraga, 1958-Gomes, M. Ivete, 1948-Repositório da Universidade de LisboaVicente, Sérgio Luís Ganhão2013-07-26T13:22:32Z20122012-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10451/8889enginfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-08T15:52:57Zoai:repositorio.ul.pt:10451/8889Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:33:15.358670Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Extreme value theory: an application to sports
title Extreme value theory: an application to sports
spellingShingle Extreme value theory: an application to sports
Vicente, Sérgio Luís Ganhão
Teoria dos valores extremos
Método dos máximos por blocos
Abordagem POT
Abordagem semi-paramétrica
Desporto
Teses de mestrado - 2012
title_short Extreme value theory: an application to sports
title_full Extreme value theory: an application to sports
title_fullStr Extreme value theory: an application to sports
title_full_unstemmed Extreme value theory: an application to sports
title_sort Extreme value theory: an application to sports
author Vicente, Sérgio Luís Ganhão
author_facet Vicente, Sérgio Luís Ganhão
author_role author
dc.contributor.none.fl_str_mv Alves, Maria Isabel Fraga, 1958-
Gomes, M. Ivete, 1948-
Repositório da Universidade de Lisboa
dc.contributor.author.fl_str_mv Vicente, Sérgio Luís Ganhão
dc.subject.por.fl_str_mv Teoria dos valores extremos
Método dos máximos por blocos
Abordagem POT
Abordagem semi-paramétrica
Desporto
Teses de mestrado - 2012
topic Teoria dos valores extremos
Método dos máximos por blocos
Abordagem POT
Abordagem semi-paramétrica
Desporto
Teses de mestrado - 2012
description Tese de mestrado em Estatística, apresentada à Universidade de Lisboa, através da Faculdade de Ciências, 2012
publishDate 2012
dc.date.none.fl_str_mv 2012
2012-01-01T00:00:00Z
2013-07-26T13:22:32Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10451/8889
url http://hdl.handle.net/10451/8889
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134226470141952