Um procedimento para seleção de variáveis em modelos lineares generalizados duplos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSCAR |
Texto Completo: | https://repositorio.ufscar.br/handle/ufscar/11412 |
Resumo: | The double generalized linear models (DGLM), unlike the generalized linear model (GLM), allow the fit of the dispersion parameter of the response variable as a function of predictor variables, improving the way of modeling phenomena. Thus, they are a possible solution when the assumption that the constant dispersion parameter is unreasonable and the response variable has distribution belonging to the exponential family. Considering our interest in variable selection in this class of models, we studied the two-step variable selection scheme proposed by Bayer and Cribari-Neto (2015) and, based on this method, we developed a scheme to select variables in up to “k” steps. To check the performance of our procedure, we performed Monte Carlo simulation studies in DGLM. The results indicate that our procedure for variable selection presents, in general, similar or superior performance than the other studied methods without requiring a large computational cost. We also evaluated the scheme to select variables in up to “k” steps in a set of real data and compared it with different regression methods. The results showed that our procedure can also be a good alternative when the interest is in making predictions. |
id |
SCAR_85a059e87f9a44dbdd29b40cf412ad5f |
---|---|
oai_identifier_str |
oai:repositorio.ufscar.br:ufscar/11412 |
network_acronym_str |
SCAR |
network_name_str |
Repositório Institucional da UFSCAR |
repository_id_str |
4322 |
spelling |
Cavalaro, Lucas LeitePereira, Gustavo Henrique de Araujohttp://lattes.cnpq.br/4536501674241631http://lattes.cnpq.br/2371167969495052425a12d3-1e4a-41ce-9ca6-d15b4f6ec0582019-05-13T19:26:57Z2019-05-13T19:26:57Z2019-04-01CAVALARO, Lucas Leite. Um procedimento para seleção de variáveis em modelos lineares generalizados duplos. 2019. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2019. Disponível em: https://repositorio.ufscar.br/handle/ufscar/11412.https://repositorio.ufscar.br/handle/ufscar/11412The double generalized linear models (DGLM), unlike the generalized linear model (GLM), allow the fit of the dispersion parameter of the response variable as a function of predictor variables, improving the way of modeling phenomena. Thus, they are a possible solution when the assumption that the constant dispersion parameter is unreasonable and the response variable has distribution belonging to the exponential family. Considering our interest in variable selection in this class of models, we studied the two-step variable selection scheme proposed by Bayer and Cribari-Neto (2015) and, based on this method, we developed a scheme to select variables in up to “k” steps. To check the performance of our procedure, we performed Monte Carlo simulation studies in DGLM. The results indicate that our procedure for variable selection presents, in general, similar or superior performance than the other studied methods without requiring a large computational cost. We also evaluated the scheme to select variables in up to “k” steps in a set of real data and compared it with different regression methods. The results showed that our procedure can also be a good alternative when the interest is in making predictions.Os modelos lineares generalizados duplos (MLGD), diferentemente dos modelos lineares generalizados (MLG), permitem o ajuste do parâmetro de dispersão da variável resposta em função de variáveis preditoras, aperfeiçoando a forma de modelar fenômenos. Desse modo, os mesmos são uma possível solução quando a suposição de que o parâmetro de dispersão constante não é razoável e a variável resposta tem distribuição que pertence à família exponencial. Considerando nosso interesse em seleção de variáveis nesta classe de modelos, estudamos o esquema de seleção de variáveis em dois passos proposto por Bayer e Cribari-Neto (2015) e, com base neste método, desenvolvemos um esquema para seleção de variáveis em até “k” passos. Para verificar a performance do nosso procedimento, realizamos estudos de simulação de Monte Carlo em MLGD. Os resultados obtidos indicam que o nosso procedimento para seleção de variáveis apresenta, em geral, performance semelhante ou superior à das demais metodologias estudadas sem necessitar de um grande custo computacional. Também avaliamos o esquema para seleção de variáveis em até “k” passos em um conjunto de dados reais e o comparamos com diferentes métodos de regressão. Os resultados mostraram que o nosso procedimento pode ser também uma boa alternativa quando possui-se interesse em realizar previsões.Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)CNPq: 132746/2017-4porUniversidade Federal de São CarlosCâmpus São CarlosPrograma Interinstitucional de Pós-Graduação em Estatística - PIPGEsUFSCarCritérios de informaçãoModelos lineares generalizados duplosSeleção de variáveisInformation criteriaDouble generalized linear modelsVariable selectionStepwiseCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAOUm procedimento para seleção de variáveis em modelos lineares generalizados duplosA procedure for variable selection in double generalized linear modelsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisOnline600600c46df921-489b-4fcd-b981-2bd7f0512e1ainfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALDissertação_Lucas_Cavalaro_UFSCar.pdfDissertação_Lucas_Cavalaro_UFSCar.pdfapplication/pdf1386242https://repositorio.ufscar.br/bitstream/ufscar/11412/1/Disserta%c3%a7%c3%a3o_Lucas_Cavalaro_UFSCar.pdff010705cb68e4d1edd9fdfc27e1fe921MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81957https://repositorio.ufscar.br/bitstream/ufscar/11412/3/license.txtae0398b6f8b235e40ad82cba6c50031dMD53TEXTDissertação_Lucas_Cavalaro_UFSCar.pdf.txtDissertação_Lucas_Cavalaro_UFSCar.pdf.txtExtracted texttext/plain278995https://repositorio.ufscar.br/bitstream/ufscar/11412/4/Disserta%c3%a7%c3%a3o_Lucas_Cavalaro_UFSCar.pdf.txt20a5ffdf7bde987bc457ff9d2154004dMD54THUMBNAILDissertação_Lucas_Cavalaro_UFSCar.pdf.jpgDissertação_Lucas_Cavalaro_UFSCar.pdf.jpgIM Thumbnailimage/jpeg5047https://repositorio.ufscar.br/bitstream/ufscar/11412/5/Disserta%c3%a7%c3%a3o_Lucas_Cavalaro_UFSCar.pdf.jpgfdf6425a7273523322dc49a674403618MD55ufscar/114122023-09-18 18:31:22.66oai:repositorio.ufscar.br:ufscar/11412TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgw6AgVW5pdmVyc2lkYWRlCkZlZGVyYWwgZGUgU8OjbyBDYXJsb3MgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsICB0cmFkdXppciAoY29uZm9ybWUgZGVmaW5pZG8gYWJhaXhvKSwgZS9vdQpkaXN0cmlidWlyIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0csO0bmljbyBlCmVtIHF1YWxxdWVyIG1laW8sIGluY2x1aW5kbyBvcyBmb3JtYXRvcyDDoXVkaW8gb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIGEgVUZTQ2FyIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28KcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBhIFVGU0NhciBwb2RlIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgYSBzdWEgdGVzZSBvdQpkaXNzZXJ0YcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcwpuZXN0YSBsaWNlbsOnYS4gVm9jw6ogdGFtYsOpbSBkZWNsYXJhIHF1ZSBvIGRlcMOzc2l0byBkYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIG7Do28sIHF1ZSBzZWphIGRlIHNldQpjb25oZWNpbWVudG8sIGluZnJpbmdlIGRpcmVpdG9zIGF1dG9yYWlzIGRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY8OqIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6oKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIMOgIFVGU0NhcgpvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUKaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBURVNFIE9VIERJU1NFUlRBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UKQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBVRlNDYXIsClZPQ8OKIERFQ0xBUkEgUVVFIFJFU1BFSVRPVSBUT0RPUyBFIFFVQUlTUVVFUiBESVJFSVRPUyBERSBSRVZJU8ODTyBDT01PClRBTULDiU0gQVMgREVNQUlTIE9CUklHQcOHw5VFUyBFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKQSBVRlNDYXIgc2UgY29tcHJvbWV0ZSBhIGlkZW50aWZpY2FyIGNsYXJhbWVudGUgbyBzZXUgbm9tZSAocykgb3UgbyhzKSBub21lKHMpIGRvKHMpCmRldGVudG9yKGVzKSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzCmNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuCg==Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:31:22Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
dc.title.por.fl_str_mv |
Um procedimento para seleção de variáveis em modelos lineares generalizados duplos |
dc.title.alternative.eng.fl_str_mv |
A procedure for variable selection in double generalized linear models |
title |
Um procedimento para seleção de variáveis em modelos lineares generalizados duplos |
spellingShingle |
Um procedimento para seleção de variáveis em modelos lineares generalizados duplos Cavalaro, Lucas Leite Critérios de informação Modelos lineares generalizados duplos Seleção de variáveis Information criteria Double generalized linear models Variable selection Stepwise CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAO |
title_short |
Um procedimento para seleção de variáveis em modelos lineares generalizados duplos |
title_full |
Um procedimento para seleção de variáveis em modelos lineares generalizados duplos |
title_fullStr |
Um procedimento para seleção de variáveis em modelos lineares generalizados duplos |
title_full_unstemmed |
Um procedimento para seleção de variáveis em modelos lineares generalizados duplos |
title_sort |
Um procedimento para seleção de variáveis em modelos lineares generalizados duplos |
author |
Cavalaro, Lucas Leite |
author_facet |
Cavalaro, Lucas Leite |
author_role |
author |
dc.contributor.authorlattes.por.fl_str_mv |
http://lattes.cnpq.br/2371167969495052 |
dc.contributor.author.fl_str_mv |
Cavalaro, Lucas Leite |
dc.contributor.advisor1.fl_str_mv |
Pereira, Gustavo Henrique de Araujo |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/4536501674241631 |
dc.contributor.authorID.fl_str_mv |
425a12d3-1e4a-41ce-9ca6-d15b4f6ec058 |
contributor_str_mv |
Pereira, Gustavo Henrique de Araujo |
dc.subject.por.fl_str_mv |
Critérios de informação Modelos lineares generalizados duplos Seleção de variáveis |
topic |
Critérios de informação Modelos lineares generalizados duplos Seleção de variáveis Information criteria Double generalized linear models Variable selection Stepwise CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAO |
dc.subject.eng.fl_str_mv |
Information criteria Double generalized linear models Variable selection Stepwise |
dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAO |
description |
The double generalized linear models (DGLM), unlike the generalized linear model (GLM), allow the fit of the dispersion parameter of the response variable as a function of predictor variables, improving the way of modeling phenomena. Thus, they are a possible solution when the assumption that the constant dispersion parameter is unreasonable and the response variable has distribution belonging to the exponential family. Considering our interest in variable selection in this class of models, we studied the two-step variable selection scheme proposed by Bayer and Cribari-Neto (2015) and, based on this method, we developed a scheme to select variables in up to “k” steps. To check the performance of our procedure, we performed Monte Carlo simulation studies in DGLM. The results indicate that our procedure for variable selection presents, in general, similar or superior performance than the other studied methods without requiring a large computational cost. We also evaluated the scheme to select variables in up to “k” steps in a set of real data and compared it with different regression methods. The results showed that our procedure can also be a good alternative when the interest is in making predictions. |
publishDate |
2019 |
dc.date.accessioned.fl_str_mv |
2019-05-13T19:26:57Z |
dc.date.available.fl_str_mv |
2019-05-13T19:26:57Z |
dc.date.issued.fl_str_mv |
2019-04-01 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
CAVALARO, Lucas Leite. Um procedimento para seleção de variáveis em modelos lineares generalizados duplos. 2019. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2019. Disponível em: https://repositorio.ufscar.br/handle/ufscar/11412. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufscar.br/handle/ufscar/11412 |
identifier_str_mv |
CAVALARO, Lucas Leite. Um procedimento para seleção de variáveis em modelos lineares generalizados duplos. 2019. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2019. Disponível em: https://repositorio.ufscar.br/handle/ufscar/11412. |
url |
https://repositorio.ufscar.br/handle/ufscar/11412 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.confidence.fl_str_mv |
600 600 |
dc.relation.authority.fl_str_mv |
c46df921-489b-4fcd-b981-2bd7f0512e1a |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
dc.publisher.program.fl_str_mv |
Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs |
dc.publisher.initials.fl_str_mv |
UFSCar |
publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
instname_str |
Universidade Federal de São Carlos (UFSCAR) |
instacron_str |
UFSCAR |
institution |
UFSCAR |
reponame_str |
Repositório Institucional da UFSCAR |
collection |
Repositório Institucional da UFSCAR |
bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstream/ufscar/11412/1/Disserta%c3%a7%c3%a3o_Lucas_Cavalaro_UFSCar.pdf https://repositorio.ufscar.br/bitstream/ufscar/11412/3/license.txt https://repositorio.ufscar.br/bitstream/ufscar/11412/4/Disserta%c3%a7%c3%a3o_Lucas_Cavalaro_UFSCar.pdf.txt https://repositorio.ufscar.br/bitstream/ufscar/11412/5/Disserta%c3%a7%c3%a3o_Lucas_Cavalaro_UFSCar.pdf.jpg |
bitstream.checksum.fl_str_mv |
f010705cb68e4d1edd9fdfc27e1fe921 ae0398b6f8b235e40ad82cba6c50031d 20a5ffdf7bde987bc457ff9d2154004d fdf6425a7273523322dc49a674403618 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
repository.mail.fl_str_mv |
|
_version_ |
1813715604654260224 |