Um procedimento para seleção de variáveis em modelos lineares generalizados duplos

Detalhes bibliográficos
Autor(a) principal: Cavalaro, Lucas Leite
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFSCAR
Texto Completo: https://repositorio.ufscar.br/handle/ufscar/11412
Resumo: The double generalized linear models (DGLM), unlike the generalized linear model (GLM), allow the fit of the dispersion parameter of the response variable as a function of predictor variables, improving the way of modeling phenomena. Thus, they are a possible solution when the assumption that the constant dispersion parameter is unreasonable and the response variable has distribution belonging to the exponential family. Considering our interest in variable selection in this class of models, we studied the two-step variable selection scheme proposed by Bayer and Cribari-Neto (2015) and, based on this method, we developed a scheme to select variables in up to “k” steps. To check the performance of our procedure, we performed Monte Carlo simulation studies in DGLM. The results indicate that our procedure for variable selection presents, in general, similar or superior performance than the other studied methods without requiring a large computational cost. We also evaluated the scheme to select variables in up to “k” steps in a set of real data and compared it with different regression methods. The results showed that our procedure can also be a good alternative when the interest is in making predictions.
id SCAR_85a059e87f9a44dbdd29b40cf412ad5f
oai_identifier_str oai:repositorio.ufscar.br:ufscar/11412
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str 4322
spelling Cavalaro, Lucas LeitePereira, Gustavo Henrique de Araujohttp://lattes.cnpq.br/4536501674241631http://lattes.cnpq.br/2371167969495052425a12d3-1e4a-41ce-9ca6-d15b4f6ec0582019-05-13T19:26:57Z2019-05-13T19:26:57Z2019-04-01CAVALARO, Lucas Leite. Um procedimento para seleção de variáveis em modelos lineares generalizados duplos. 2019. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2019. Disponível em: https://repositorio.ufscar.br/handle/ufscar/11412.https://repositorio.ufscar.br/handle/ufscar/11412The double generalized linear models (DGLM), unlike the generalized linear model (GLM), allow the fit of the dispersion parameter of the response variable as a function of predictor variables, improving the way of modeling phenomena. Thus, they are a possible solution when the assumption that the constant dispersion parameter is unreasonable and the response variable has distribution belonging to the exponential family. Considering our interest in variable selection in this class of models, we studied the two-step variable selection scheme proposed by Bayer and Cribari-Neto (2015) and, based on this method, we developed a scheme to select variables in up to “k” steps. To check the performance of our procedure, we performed Monte Carlo simulation studies in DGLM. The results indicate that our procedure for variable selection presents, in general, similar or superior performance than the other studied methods without requiring a large computational cost. We also evaluated the scheme to select variables in up to “k” steps in a set of real data and compared it with different regression methods. The results showed that our procedure can also be a good alternative when the interest is in making predictions.Os modelos lineares generalizados duplos (MLGD), diferentemente dos modelos lineares generalizados (MLG), permitem o ajuste do parâmetro de dispersão da variável resposta em função de variáveis preditoras, aperfeiçoando a forma de modelar fenômenos. Desse modo, os mesmos são uma possível solução quando a suposição de que o parâmetro de dispersão constante não é razoável e a variável resposta tem distribuição que pertence à família exponencial. Considerando nosso interesse em seleção de variáveis nesta classe de modelos, estudamos o esquema de seleção de variáveis em dois passos proposto por Bayer e Cribari-Neto (2015) e, com base neste método, desenvolvemos um esquema para seleção de variáveis em até “k” passos. Para verificar a performance do nosso procedimento, realizamos estudos de simulação de Monte Carlo em MLGD. Os resultados obtidos indicam que o nosso procedimento para seleção de variáveis apresenta, em geral, performance semelhante ou superior à das demais metodologias estudadas sem necessitar de um grande custo computacional. Também avaliamos o esquema para seleção de variáveis em até “k” passos em um conjunto de dados reais e o comparamos com diferentes métodos de regressão. Os resultados mostraram que o nosso procedimento pode ser também uma boa alternativa quando possui-se interesse em realizar previsões.Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)CNPq: 132746/2017-4porUniversidade Federal de São CarlosCâmpus São CarlosPrograma Interinstitucional de Pós-Graduação em Estatística - PIPGEsUFSCarCritérios de informaçãoModelos lineares generalizados duplosSeleção de variáveisInformation criteriaDouble generalized linear modelsVariable selectionStepwiseCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAOUm procedimento para seleção de variáveis em modelos lineares generalizados duplosA procedure for variable selection in double generalized linear modelsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisOnline600600c46df921-489b-4fcd-b981-2bd7f0512e1ainfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALDissertação_Lucas_Cavalaro_UFSCar.pdfDissertação_Lucas_Cavalaro_UFSCar.pdfapplication/pdf1386242https://repositorio.ufscar.br/bitstream/ufscar/11412/1/Disserta%c3%a7%c3%a3o_Lucas_Cavalaro_UFSCar.pdff010705cb68e4d1edd9fdfc27e1fe921MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81957https://repositorio.ufscar.br/bitstream/ufscar/11412/3/license.txtae0398b6f8b235e40ad82cba6c50031dMD53TEXTDissertação_Lucas_Cavalaro_UFSCar.pdf.txtDissertação_Lucas_Cavalaro_UFSCar.pdf.txtExtracted texttext/plain278995https://repositorio.ufscar.br/bitstream/ufscar/11412/4/Disserta%c3%a7%c3%a3o_Lucas_Cavalaro_UFSCar.pdf.txt20a5ffdf7bde987bc457ff9d2154004dMD54THUMBNAILDissertação_Lucas_Cavalaro_UFSCar.pdf.jpgDissertação_Lucas_Cavalaro_UFSCar.pdf.jpgIM Thumbnailimage/jpeg5047https://repositorio.ufscar.br/bitstream/ufscar/11412/5/Disserta%c3%a7%c3%a3o_Lucas_Cavalaro_UFSCar.pdf.jpgfdf6425a7273523322dc49a674403618MD55ufscar/114122023-09-18 18:31:22.66oai:repositorio.ufscar.br:ufscar/11412TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgw6AgVW5pdmVyc2lkYWRlCkZlZGVyYWwgZGUgU8OjbyBDYXJsb3MgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsICB0cmFkdXppciAoY29uZm9ybWUgZGVmaW5pZG8gYWJhaXhvKSwgZS9vdQpkaXN0cmlidWlyIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0csO0bmljbyBlCmVtIHF1YWxxdWVyIG1laW8sIGluY2x1aW5kbyBvcyBmb3JtYXRvcyDDoXVkaW8gb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIGEgVUZTQ2FyIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28KcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBhIFVGU0NhciBwb2RlIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgYSBzdWEgdGVzZSBvdQpkaXNzZXJ0YcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcwpuZXN0YSBsaWNlbsOnYS4gVm9jw6ogdGFtYsOpbSBkZWNsYXJhIHF1ZSBvIGRlcMOzc2l0byBkYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIG7Do28sIHF1ZSBzZWphIGRlIHNldQpjb25oZWNpbWVudG8sIGluZnJpbmdlIGRpcmVpdG9zIGF1dG9yYWlzIGRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY8OqIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6oKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIMOgIFVGU0NhcgpvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUKaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBURVNFIE9VIERJU1NFUlRBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UKQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBVRlNDYXIsClZPQ8OKIERFQ0xBUkEgUVVFIFJFU1BFSVRPVSBUT0RPUyBFIFFVQUlTUVVFUiBESVJFSVRPUyBERSBSRVZJU8ODTyBDT01PClRBTULDiU0gQVMgREVNQUlTIE9CUklHQcOHw5VFUyBFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKQSBVRlNDYXIgc2UgY29tcHJvbWV0ZSBhIGlkZW50aWZpY2FyIGNsYXJhbWVudGUgbyBzZXUgbm9tZSAocykgb3UgbyhzKSBub21lKHMpIGRvKHMpCmRldGVudG9yKGVzKSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzCmNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuCg==Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:31:22Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Um procedimento para seleção de variáveis em modelos lineares generalizados duplos
dc.title.alternative.eng.fl_str_mv A procedure for variable selection in double generalized linear models
title Um procedimento para seleção de variáveis em modelos lineares generalizados duplos
spellingShingle Um procedimento para seleção de variáveis em modelos lineares generalizados duplos
Cavalaro, Lucas Leite
Critérios de informação
Modelos lineares generalizados duplos
Seleção de variáveis
Information criteria
Double generalized linear models
Variable selection
Stepwise
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAO
title_short Um procedimento para seleção de variáveis em modelos lineares generalizados duplos
title_full Um procedimento para seleção de variáveis em modelos lineares generalizados duplos
title_fullStr Um procedimento para seleção de variáveis em modelos lineares generalizados duplos
title_full_unstemmed Um procedimento para seleção de variáveis em modelos lineares generalizados duplos
title_sort Um procedimento para seleção de variáveis em modelos lineares generalizados duplos
author Cavalaro, Lucas Leite
author_facet Cavalaro, Lucas Leite
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://lattes.cnpq.br/2371167969495052
dc.contributor.author.fl_str_mv Cavalaro, Lucas Leite
dc.contributor.advisor1.fl_str_mv Pereira, Gustavo Henrique de Araujo
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/4536501674241631
dc.contributor.authorID.fl_str_mv 425a12d3-1e4a-41ce-9ca6-d15b4f6ec058
contributor_str_mv Pereira, Gustavo Henrique de Araujo
dc.subject.por.fl_str_mv Critérios de informação
Modelos lineares generalizados duplos
Seleção de variáveis
topic Critérios de informação
Modelos lineares generalizados duplos
Seleção de variáveis
Information criteria
Double generalized linear models
Variable selection
Stepwise
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAO
dc.subject.eng.fl_str_mv Information criteria
Double generalized linear models
Variable selection
Stepwise
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAO
description The double generalized linear models (DGLM), unlike the generalized linear model (GLM), allow the fit of the dispersion parameter of the response variable as a function of predictor variables, improving the way of modeling phenomena. Thus, they are a possible solution when the assumption that the constant dispersion parameter is unreasonable and the response variable has distribution belonging to the exponential family. Considering our interest in variable selection in this class of models, we studied the two-step variable selection scheme proposed by Bayer and Cribari-Neto (2015) and, based on this method, we developed a scheme to select variables in up to “k” steps. To check the performance of our procedure, we performed Monte Carlo simulation studies in DGLM. The results indicate that our procedure for variable selection presents, in general, similar or superior performance than the other studied methods without requiring a large computational cost. We also evaluated the scheme to select variables in up to “k” steps in a set of real data and compared it with different regression methods. The results showed that our procedure can also be a good alternative when the interest is in making predictions.
publishDate 2019
dc.date.accessioned.fl_str_mv 2019-05-13T19:26:57Z
dc.date.available.fl_str_mv 2019-05-13T19:26:57Z
dc.date.issued.fl_str_mv 2019-04-01
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv CAVALARO, Lucas Leite. Um procedimento para seleção de variáveis em modelos lineares generalizados duplos. 2019. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2019. Disponível em: https://repositorio.ufscar.br/handle/ufscar/11412.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/ufscar/11412
identifier_str_mv CAVALARO, Lucas Leite. Um procedimento para seleção de variáveis em modelos lineares generalizados duplos. 2019. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2019. Disponível em: https://repositorio.ufscar.br/handle/ufscar/11412.
url https://repositorio.ufscar.br/handle/ufscar/11412
dc.language.iso.fl_str_mv por
language por
dc.relation.confidence.fl_str_mv 600
600
dc.relation.authority.fl_str_mv c46df921-489b-4fcd-b981-2bd7f0512e1a
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.publisher.program.fl_str_mv Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs
dc.publisher.initials.fl_str_mv UFSCar
publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstream/ufscar/11412/1/Disserta%c3%a7%c3%a3o_Lucas_Cavalaro_UFSCar.pdf
https://repositorio.ufscar.br/bitstream/ufscar/11412/3/license.txt
https://repositorio.ufscar.br/bitstream/ufscar/11412/4/Disserta%c3%a7%c3%a3o_Lucas_Cavalaro_UFSCar.pdf.txt
https://repositorio.ufscar.br/bitstream/ufscar/11412/5/Disserta%c3%a7%c3%a3o_Lucas_Cavalaro_UFSCar.pdf.jpg
bitstream.checksum.fl_str_mv f010705cb68e4d1edd9fdfc27e1fe921
ae0398b6f8b235e40ad82cba6c50031d
20a5ffdf7bde987bc457ff9d2154004d
fdf6425a7273523322dc49a674403618
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv
_version_ 1813715604654260224