Modelos Skellam Generalizados
Autor(a) principal: | |
---|---|
Data de Publicação: | 2024 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://www.teses.usp.br/teses/disponiveis/104/104131/tde-28082024-170823/ |
Resumo: | Na estatística aplicada, frequentemente dados de contagem são observados em diferentes áreas de estudo. Devido a grande diversidade dos problemas que resultam nestes tipos dados, torna-se necessário a proposta de novos modelos. Neste trabalho, propomos generalizações da distribuição Skellam, cujo suporte consiste do conjunto formado pelos números inteiros (positivos e negativos), visando explorar também no contexto de modelos de regressão. Para o processo de estimação e inferência dos parâmetros dos modelos foram consideradas as abordagens clássica (método de máxima verossimilhança) e bayesiana (Monte Carlo em Cadeia de Markov) para fins de comparação. Especificamente sobre a abordagem bayesiana, que foi mais eficiente nas propostas aqui apresentadas, utilizamos uma variante do algoritmo Hamiltoniano Monte Carlo, que consiste na reformulação das equações de Hamilton ao introduzir uma componente estocástica na equação do gradiente, derivando o algoritmo Gradiente Estocástico Hamiltoniano Monte Carlo. Para ilustrações dos modelos propostos, apresentamos as análises de conjuntos de dados referentes a dois problemas reais (total de 3 conjuntos de dados): no primeiro problema foi considerado um conjunto de dados correspondente às observações da variação semanal da pontuação do Ibovespa, isto é, a diferença de preço, medida em ticks (centavos) do dia atual com relação ao dia anterior, no período entre janeiro de 2000 e dezembro de 2022. Os valores estimados para o parâmetro p, caracterizaram o conjunto de dados como inflacionado de observações -2 (ticks); no segundo problema, foram considerados dois conjuntos de dados, correspondentes aos valores das diferenças entre partidas ganhas e partidas perdidas pelos times na temporada regular de 2022-2023 da National Basketball Association, em cada conferência (Leste e Oeste). Os critérios de seleção indicaram para o modelo k-MS com k = -12 como o mais bem ajustado para a conferência Leste, enquanto para a conferência Oeste, o valor indicado foi k = - 38. Diante dos bons resultados, tanto os modelos k-MS quanto os k-IS demonstraram ser boas alternativas para explicar o comportamento de dados com valores inteiros. |
id |
USP_ec1a86a5800a6ed7324c9e0c9182b458 |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-28082024-170823 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Modelos Skellam GeneralizadosGeneralized Skellam ModelsAbordagem BayesianaBayesian approachDeflaçãoDeflatedDistribuição k-modificadaHamiltonian Monte CarloHamiltoniano Monte CarloInflaçãoInflatedk-modified distributionNa estatística aplicada, frequentemente dados de contagem são observados em diferentes áreas de estudo. Devido a grande diversidade dos problemas que resultam nestes tipos dados, torna-se necessário a proposta de novos modelos. Neste trabalho, propomos generalizações da distribuição Skellam, cujo suporte consiste do conjunto formado pelos números inteiros (positivos e negativos), visando explorar também no contexto de modelos de regressão. Para o processo de estimação e inferência dos parâmetros dos modelos foram consideradas as abordagens clássica (método de máxima verossimilhança) e bayesiana (Monte Carlo em Cadeia de Markov) para fins de comparação. Especificamente sobre a abordagem bayesiana, que foi mais eficiente nas propostas aqui apresentadas, utilizamos uma variante do algoritmo Hamiltoniano Monte Carlo, que consiste na reformulação das equações de Hamilton ao introduzir uma componente estocástica na equação do gradiente, derivando o algoritmo Gradiente Estocástico Hamiltoniano Monte Carlo. Para ilustrações dos modelos propostos, apresentamos as análises de conjuntos de dados referentes a dois problemas reais (total de 3 conjuntos de dados): no primeiro problema foi considerado um conjunto de dados correspondente às observações da variação semanal da pontuação do Ibovespa, isto é, a diferença de preço, medida em ticks (centavos) do dia atual com relação ao dia anterior, no período entre janeiro de 2000 e dezembro de 2022. Os valores estimados para o parâmetro p, caracterizaram o conjunto de dados como inflacionado de observações -2 (ticks); no segundo problema, foram considerados dois conjuntos de dados, correspondentes aos valores das diferenças entre partidas ganhas e partidas perdidas pelos times na temporada regular de 2022-2023 da National Basketball Association, em cada conferência (Leste e Oeste). Os critérios de seleção indicaram para o modelo k-MS com k = -12 como o mais bem ajustado para a conferência Leste, enquanto para a conferência Oeste, o valor indicado foi k = - 38. Diante dos bons resultados, tanto os modelos k-MS quanto os k-IS demonstraram ser boas alternativas para explicar o comportamento de dados com valores inteiros.In applied statistics, counting data are often observed in different areas of study. Due to the great diversity of problems that result in these types of data, it is necessary to propose new models. In this work, we propose generalizations of the Skellam distribution, whose support consists of the set formed by integers (positive and negative), aiming to also explore in the context of regression models. For the process of estimating and inferring model parameters, the classical (maximum likelihood method) and Bayesian (Markov Chain Monte Carlo) approaches were considered for comparison purposes. Specifically regarding the Bayesian approach, which was more efficient in the proposals presented here, we used a variant of the Hamiltonian Monte Carlo algorithm, which consists of reformulating Hamiltons equations by introducing a stochastic component into the gradient equation, deriving the Stochastic Gradient Hamiltonian Monte Carlo algorithm. To illustrate the proposed models, we present the analyzes of data sets referring to two real problems (3 datasets in total): In the first problem, a set of data corresponding to observations of the weekly variation of the Ibovespa score was considered, that is, the price difference, measured in ticks (cents) of the current day in relation to the previous day, in the period between January 2000 and December 2022. The estimated values for the parameter p characterized the data set as inflated with observations -2 (ticks); In the second problem, two sets of data were considered, corresponding to the values of the differences between games won and games lost by teams in the 2022-2023 regular season of the National Basketball Association, in each conference (East and West). The selection criteria indicated the k-MS model with k = -12 as the best adjusted for the Eastern conference, while for the Western conference, the indicated value was k = -38. Given the good results, both the k-MS and the k-IS models proved to be good alternatives to explain the behavior of data with integer values.Biblioteca Digitais de Teses e Dissertações da USPConceição, Katiane SilvaDiniz, Carlos Alberto RibeiroGandolfi, Marina2024-06-24info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/104/104131/tde-28082024-170823/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-08-30T17:01:02Zoai:teses.usp.br:tde-28082024-170823Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-08-30T17:01:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Modelos Skellam Generalizados Generalized Skellam Models |
title |
Modelos Skellam Generalizados |
spellingShingle |
Modelos Skellam Generalizados Gandolfi, Marina Abordagem Bayesiana Bayesian approach Deflação Deflated Distribuição k-modificada Hamiltonian Monte Carlo Hamiltoniano Monte Carlo Inflação Inflated k-modified distribution |
title_short |
Modelos Skellam Generalizados |
title_full |
Modelos Skellam Generalizados |
title_fullStr |
Modelos Skellam Generalizados |
title_full_unstemmed |
Modelos Skellam Generalizados |
title_sort |
Modelos Skellam Generalizados |
author |
Gandolfi, Marina |
author_facet |
Gandolfi, Marina |
author_role |
author |
dc.contributor.none.fl_str_mv |
Conceição, Katiane Silva Diniz, Carlos Alberto Ribeiro |
dc.contributor.author.fl_str_mv |
Gandolfi, Marina |
dc.subject.por.fl_str_mv |
Abordagem Bayesiana Bayesian approach Deflação Deflated Distribuição k-modificada Hamiltonian Monte Carlo Hamiltoniano Monte Carlo Inflação Inflated k-modified distribution |
topic |
Abordagem Bayesiana Bayesian approach Deflação Deflated Distribuição k-modificada Hamiltonian Monte Carlo Hamiltoniano Monte Carlo Inflação Inflated k-modified distribution |
description |
Na estatística aplicada, frequentemente dados de contagem são observados em diferentes áreas de estudo. Devido a grande diversidade dos problemas que resultam nestes tipos dados, torna-se necessário a proposta de novos modelos. Neste trabalho, propomos generalizações da distribuição Skellam, cujo suporte consiste do conjunto formado pelos números inteiros (positivos e negativos), visando explorar também no contexto de modelos de regressão. Para o processo de estimação e inferência dos parâmetros dos modelos foram consideradas as abordagens clássica (método de máxima verossimilhança) e bayesiana (Monte Carlo em Cadeia de Markov) para fins de comparação. Especificamente sobre a abordagem bayesiana, que foi mais eficiente nas propostas aqui apresentadas, utilizamos uma variante do algoritmo Hamiltoniano Monte Carlo, que consiste na reformulação das equações de Hamilton ao introduzir uma componente estocástica na equação do gradiente, derivando o algoritmo Gradiente Estocástico Hamiltoniano Monte Carlo. Para ilustrações dos modelos propostos, apresentamos as análises de conjuntos de dados referentes a dois problemas reais (total de 3 conjuntos de dados): no primeiro problema foi considerado um conjunto de dados correspondente às observações da variação semanal da pontuação do Ibovespa, isto é, a diferença de preço, medida em ticks (centavos) do dia atual com relação ao dia anterior, no período entre janeiro de 2000 e dezembro de 2022. Os valores estimados para o parâmetro p, caracterizaram o conjunto de dados como inflacionado de observações -2 (ticks); no segundo problema, foram considerados dois conjuntos de dados, correspondentes aos valores das diferenças entre partidas ganhas e partidas perdidas pelos times na temporada regular de 2022-2023 da National Basketball Association, em cada conferência (Leste e Oeste). Os critérios de seleção indicaram para o modelo k-MS com k = -12 como o mais bem ajustado para a conferência Leste, enquanto para a conferência Oeste, o valor indicado foi k = - 38. Diante dos bons resultados, tanto os modelos k-MS quanto os k-IS demonstraram ser boas alternativas para explicar o comportamento de dados com valores inteiros. |
publishDate |
2024 |
dc.date.none.fl_str_mv |
2024-06-24 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/104/104131/tde-28082024-170823/ |
url |
https://www.teses.usp.br/teses/disponiveis/104/104131/tde-28082024-170823/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1809091157182906368 |