Uma família de modelos de regressão com a distribuição original da variável resposta
Autor(a) principal: | |
---|---|
Data de Publicação: | 2013 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSCAR |
Texto Completo: | https://repositorio.ufscar.br/handle/ufscar/4490 |
Resumo: | We know that statistic modeling by regression had a stronger impulse since generalized linear models (GLMs) development in 70 decade beginning of the XX century, proposed by Nelder e Wedderburn (1972). GLMs theory can be interpret like a traditional linear regression model generalization, where outcomes don't need necessary to assume a normal distribution, that is, any distribution belong to exponential distributions family. In binary logistic regression case, however, in many practice situations the outcomes response is originally from a discrete or continuous distribution, that is, the outcomes response has an original distribution that is not Bernoulli distribution and, although, because some purpose this variable was later dicothomized by an arbitrary cut of point C. In this work we propose a regression models family with original outcomes information, whose probability distribution or density function probability belong to exponential family. We present the models construction and development to each class, incorporating the original distribution outcomes response information. The proposed models are an extension of Suissa (1991) and Suissa and Blais (1995) works which present methods of estimating the risk of an event de_ned in a sample subspace of a continuous outcome variable. Simulation studies are presented in order to illustrate the performance of the developed methodology. For original normal outcomes we considered logistic, exponential, geometric, Poisson and lognormal models. For original exponential outcomes we considered logistic, normal, geometric, Poisson and lognormal models. In contribution to Suissa and Blais (1995) works we attribute two discrete outcomes for binary model, geometric and Poisson, and we also considered a normal distributions with multiplicative heteroscedastic structures continuous outcomes. In supplement we also propose the binary model with inated power series distributions outcomes considering a sample subspace of a zero inated geometric outcomes. We do several artificial data studies comparing the model of original distribution information regression model with usual regression model. Simulation studies are presented in order to illustrate the performance of the developed methodology. A real data set is analyzed by using the proposed models. Assuming a correct speci_ed distribution, the incorporation of this information about outcome response in the model produces more eficient likelihood estimates. |
id |
SCAR_c4bc63069c8cd2771ac8993163748919 |
---|---|
oai_identifier_str |
oai:repositorio.ufscar.br:ufscar/4490 |
network_acronym_str |
SCAR |
network_name_str |
Repositório Institucional da UFSCAR |
repository_id_str |
4322 |
spelling |
Paula, Marcelo deDiniz, Carlos Alberto Ribeirohttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4781846J4&dataRevisao=null77e3c77c-dae3-4c2f-b92a-5f2a3465bf142016-06-02T20:04:52Z2013-04-232016-06-02T20:04:52Z2013-04-05PAULA, Marcelo de. Uma família de modelos de regressão com a distribuição original da variável resposta. 2013. 116 f. Tese (Doutorado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2013.https://repositorio.ufscar.br/handle/ufscar/4490We know that statistic modeling by regression had a stronger impulse since generalized linear models (GLMs) development in 70 decade beginning of the XX century, proposed by Nelder e Wedderburn (1972). GLMs theory can be interpret like a traditional linear regression model generalization, where outcomes don't need necessary to assume a normal distribution, that is, any distribution belong to exponential distributions family. In binary logistic regression case, however, in many practice situations the outcomes response is originally from a discrete or continuous distribution, that is, the outcomes response has an original distribution that is not Bernoulli distribution and, although, because some purpose this variable was later dicothomized by an arbitrary cut of point C. In this work we propose a regression models family with original outcomes information, whose probability distribution or density function probability belong to exponential family. We present the models construction and development to each class, incorporating the original distribution outcomes response information. The proposed models are an extension of Suissa (1991) and Suissa and Blais (1995) works which present methods of estimating the risk of an event de_ned in a sample subspace of a continuous outcome variable. Simulation studies are presented in order to illustrate the performance of the developed methodology. For original normal outcomes we considered logistic, exponential, geometric, Poisson and lognormal models. For original exponential outcomes we considered logistic, normal, geometric, Poisson and lognormal models. In contribution to Suissa and Blais (1995) works we attribute two discrete outcomes for binary model, geometric and Poisson, and we also considered a normal distributions with multiplicative heteroscedastic structures continuous outcomes. In supplement we also propose the binary model with inated power series distributions outcomes considering a sample subspace of a zero inated geometric outcomes. We do several artificial data studies comparing the model of original distribution information regression model with usual regression model. Simulation studies are presented in order to illustrate the performance of the developed methodology. A real data set is analyzed by using the proposed models. Assuming a correct speci_ed distribution, the incorporation of this information about outcome response in the model produces more eficient likelihood estimates.É sabido que a área de modelagem estatística por regressão sofreu um grande impulso desde o desenvolvimento dos modelos lineares generalizados (MLGs) no início da década de 70 do Século XX, propostos por Nelder e Wedderburn (1972). A teoria dos MLGs pode ser interpretada como uma generalização do modelo de regressão linear tradicional, em que a variável resposta não precisa necessariamente assumir a distribuição normal, e sim, qualquer distribuição pertencente à família exponencial de distribuições. Em algumas situações, porém, a distribuição da variável resposta Se originalmente fruto de uma outra distribuição discreta ou contínua, ou seja, a variável resposta tem uma distribuição original que não Se a usualmente considerada. Um exemplo desta situação Se a dicotomização de uma variável discreta ou contínua por meio de um ponto de corte arbitrário. Além disso, a variável resposta pode estar relacionada, de alguma forma, com uma outra variável de interesse. Nesse trabalho propomos uma família de modelos de regressão com a informação da variável resposta original, cuja distribuição de probabilidades ou função densidade de probabilidade pertence à família exponencial. O modelo de regressão logística com resposta normal e log-normal desenvolvido por Suissa e Blais (1995) Se apresentado como caso particular dos modelos de regressão com resposta de origem. Para a resposta de origem normal consideramos os modelos logístico, exponencial, geométrico, Poisson e log-normal. Para a resposta de origem exponencial consideramos os modelos logístico, normal, geométrico, Poisson e log-normal. Em contribuição ao trabalho de Suissa e Blais atribuímos duas respostas discretas ao modelo logístico, geométrico e de Poisson, e também consideramos uma resposta contínua normal com estrutura heteroscedástica. Adicionalmente, propomos também o modelo logístico com resposta pertencente à classe de distribuições séries de potências inflacionadas considerando o caso particular da resposta geométrica zero inflacionada. Realizamos vários estudos com dados artificiais comparando o modelo de regressão proposto com a informação da distribuição de origem e o modelo de regressão usual. Dois conjuntos de dados reais também são considerados. Assumindo uma distribuição corretamente especificada, o modelo produz estimativas de máxima verossimilhança mais eficientes e estimativas intervalares mais precisas para os coeficientes de regressão.Financiadora de Estudos e Projetosapplication/pdfporUniversidade Federal de São CarlosPrograma de Pós-Graduação em Estatística - PPGEsUFSCarBRAnálise de regressãoModelos lineares (Estatística)Variável resposta de origemModelos de regressãoModelos lineares generalizadosRegression modelsgeneralized linear modelsoriginal distributionCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICAUma família de modelos de regressão com a distribuição original da variável respostainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesis-1-184611362-11c0-4efd-b118-a7df9999df87info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINAL5021.pdfapplication/pdf1591649https://repositorio.ufscar.br/bitstream/ufscar/4490/1/5021.pdf6798e65e3b572fcfe760f083f660ff50MD51TEXT5021.pdf.txt5021.pdf.txtExtracted texttext/plain0https://repositorio.ufscar.br/bitstream/ufscar/4490/2/5021.pdf.txtd41d8cd98f00b204e9800998ecf8427eMD52THUMBNAIL5021.pdf.jpg5021.pdf.jpgIM Thumbnailimage/jpeg7231https://repositorio.ufscar.br/bitstream/ufscar/4490/3/5021.pdf.jpgb05bd68657e1192872533ba1a8e69edbMD53ufscar/44902023-09-18 18:31:19.809oai:repositorio.ufscar.br:ufscar/4490Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:31:19Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
dc.title.por.fl_str_mv |
Uma família de modelos de regressão com a distribuição original da variável resposta |
title |
Uma família de modelos de regressão com a distribuição original da variável resposta |
spellingShingle |
Uma família de modelos de regressão com a distribuição original da variável resposta Paula, Marcelo de Análise de regressão Modelos lineares (Estatística) Variável resposta de origem Modelos de regressão Modelos lineares generalizados Regression models generalized linear models original distribution CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA |
title_short |
Uma família de modelos de regressão com a distribuição original da variável resposta |
title_full |
Uma família de modelos de regressão com a distribuição original da variável resposta |
title_fullStr |
Uma família de modelos de regressão com a distribuição original da variável resposta |
title_full_unstemmed |
Uma família de modelos de regressão com a distribuição original da variável resposta |
title_sort |
Uma família de modelos de regressão com a distribuição original da variável resposta |
author |
Paula, Marcelo de |
author_facet |
Paula, Marcelo de |
author_role |
author |
dc.contributor.author.fl_str_mv |
Paula, Marcelo de |
dc.contributor.advisor1.fl_str_mv |
Diniz, Carlos Alberto Ribeiro |
dc.contributor.advisor1Lattes.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4781846J4&dataRevisao=null |
dc.contributor.authorID.fl_str_mv |
77e3c77c-dae3-4c2f-b92a-5f2a3465bf14 |
contributor_str_mv |
Diniz, Carlos Alberto Ribeiro |
dc.subject.por.fl_str_mv |
Análise de regressão Modelos lineares (Estatística) Variável resposta de origem Modelos de regressão Modelos lineares generalizados |
topic |
Análise de regressão Modelos lineares (Estatística) Variável resposta de origem Modelos de regressão Modelos lineares generalizados Regression models generalized linear models original distribution CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA |
dc.subject.eng.fl_str_mv |
Regression models generalized linear models original distribution |
dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA |
description |
We know that statistic modeling by regression had a stronger impulse since generalized linear models (GLMs) development in 70 decade beginning of the XX century, proposed by Nelder e Wedderburn (1972). GLMs theory can be interpret like a traditional linear regression model generalization, where outcomes don't need necessary to assume a normal distribution, that is, any distribution belong to exponential distributions family. In binary logistic regression case, however, in many practice situations the outcomes response is originally from a discrete or continuous distribution, that is, the outcomes response has an original distribution that is not Bernoulli distribution and, although, because some purpose this variable was later dicothomized by an arbitrary cut of point C. In this work we propose a regression models family with original outcomes information, whose probability distribution or density function probability belong to exponential family. We present the models construction and development to each class, incorporating the original distribution outcomes response information. The proposed models are an extension of Suissa (1991) and Suissa and Blais (1995) works which present methods of estimating the risk of an event de_ned in a sample subspace of a continuous outcome variable. Simulation studies are presented in order to illustrate the performance of the developed methodology. For original normal outcomes we considered logistic, exponential, geometric, Poisson and lognormal models. For original exponential outcomes we considered logistic, normal, geometric, Poisson and lognormal models. In contribution to Suissa and Blais (1995) works we attribute two discrete outcomes for binary model, geometric and Poisson, and we also considered a normal distributions with multiplicative heteroscedastic structures continuous outcomes. In supplement we also propose the binary model with inated power series distributions outcomes considering a sample subspace of a zero inated geometric outcomes. We do several artificial data studies comparing the model of original distribution information regression model with usual regression model. Simulation studies are presented in order to illustrate the performance of the developed methodology. A real data set is analyzed by using the proposed models. Assuming a correct speci_ed distribution, the incorporation of this information about outcome response in the model produces more eficient likelihood estimates. |
publishDate |
2013 |
dc.date.available.fl_str_mv |
2013-04-23 2016-06-02T20:04:52Z |
dc.date.issued.fl_str_mv |
2013-04-05 |
dc.date.accessioned.fl_str_mv |
2016-06-02T20:04:52Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
PAULA, Marcelo de. Uma família de modelos de regressão com a distribuição original da variável resposta. 2013. 116 f. Tese (Doutorado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2013. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufscar.br/handle/ufscar/4490 |
identifier_str_mv |
PAULA, Marcelo de. Uma família de modelos de regressão com a distribuição original da variável resposta. 2013. 116 f. Tese (Doutorado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2013. |
url |
https://repositorio.ufscar.br/handle/ufscar/4490 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.confidence.fl_str_mv |
-1 -1 |
dc.relation.authority.fl_str_mv |
84611362-11c0-4efd-b118-a7df9999df87 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Estatística - PPGEs |
dc.publisher.initials.fl_str_mv |
UFSCar |
dc.publisher.country.fl_str_mv |
BR |
publisher.none.fl_str_mv |
Universidade Federal de São Carlos |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
instname_str |
Universidade Federal de São Carlos (UFSCAR) |
instacron_str |
UFSCAR |
institution |
UFSCAR |
reponame_str |
Repositório Institucional da UFSCAR |
collection |
Repositório Institucional da UFSCAR |
bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstream/ufscar/4490/1/5021.pdf https://repositorio.ufscar.br/bitstream/ufscar/4490/2/5021.pdf.txt https://repositorio.ufscar.br/bitstream/ufscar/4490/3/5021.pdf.jpg |
bitstream.checksum.fl_str_mv |
6798e65e3b572fcfe760f083f660ff50 d41d8cd98f00b204e9800998ecf8427e b05bd68657e1192872533ba1a8e69edb |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
repository.mail.fl_str_mv |
|
_version_ |
1813715536699195392 |