A robust lasso regression for linear mixed-effects models with diagnostic analysis

Detalhes bibliográficos
Autor(a) principal: Garcia, Rafael Rocha de Oliveira
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Institucional da UFSCAR
Texto Completo: https://repositorio.ufscar.br/handle/ufscar/15373
Resumo: Variable selection has been a topic of great interest for statisticians and researchers alike. The choice of the best subset of predictors may be carried out with the objective of improving prediction or for easier interpretation of results. However, such methods are not always straightforward, mainly in the context of linear mixed-effects models. Variable selection for such models must be carried out for both fixed and random effects, the first being related to the global mean of data and the second to subject-level variance. There are two possible approaches when selecting variables for mixed-effects models: joint or two-stage procedures. In existing literature on the topic of variable selection for linear mixed-effects model, there is a method of joint selection via lasso for linear mixed-effects models under a normal distribution. Another topic of remarkable importance, is diagnostics and residual analysis. While residual analyses are carried out to assess issues with the fitted model and identification of atypical observations, diagnostic analyses are carried out assuming the model as correct and, assessing its conclusions robustness to small disturbances in the data and/or the model. There are many possible ways to deal with such observations. One is using robust models, which are said to be robust to disturbances in the data. That is, models that are better fit to data sets that possess observations considered to be as outliers and/or leverage. This work aims to use the robust method for variable selection in linear mixed-effects model and compare it with the normal method using diagnostic analysis.
id SCAR_3c43a3a56958fe1ccaaaeb4abc84fad2
oai_identifier_str oai:repositorio.ufscar.br:ufscar/15373
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str 4322
spelling Garcia, Rafael Rocha de OliveiraNovelli, Cibele Maria Russohttp://lattes.cnpq.br/1011098065426388http://lattes.cnpq.br/04123600556866375a99f797-fd65-4951-92b9-6cd7450472152021-12-16T20:56:29Z2021-12-16T20:56:29Z2021-10-22GARCIA, Rafael Rocha de Oliveira. A robust lasso regression for linear mixed-effects models with diagnostic analysis. 2021. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2021. Disponível em: https://repositorio.ufscar.br/handle/ufscar/15373.https://repositorio.ufscar.br/handle/ufscar/15373Variable selection has been a topic of great interest for statisticians and researchers alike. The choice of the best subset of predictors may be carried out with the objective of improving prediction or for easier interpretation of results. However, such methods are not always straightforward, mainly in the context of linear mixed-effects models. Variable selection for such models must be carried out for both fixed and random effects, the first being related to the global mean of data and the second to subject-level variance. There are two possible approaches when selecting variables for mixed-effects models: joint or two-stage procedures. In existing literature on the topic of variable selection for linear mixed-effects model, there is a method of joint selection via lasso for linear mixed-effects models under a normal distribution. Another topic of remarkable importance, is diagnostics and residual analysis. While residual analyses are carried out to assess issues with the fitted model and identification of atypical observations, diagnostic analyses are carried out assuming the model as correct and, assessing its conclusions robustness to small disturbances in the data and/or the model. There are many possible ways to deal with such observations. One is using robust models, which are said to be robust to disturbances in the data. That is, models that are better fit to data sets that possess observations considered to be as outliers and/or leverage. This work aims to use the robust method for variable selection in linear mixed-effects model and compare it with the normal method using diagnostic analysis.Seleção de variáveis é um tópico de elevada importância para o processo de modelagem. A escolha do melhor conjunto de variáveis explicativas pode ser feita com o intuito de melhorar uma previsão ou facilitar a interpretação dos resultados. Contudo, os métodos para seleção de variáveis nem sempre são triviais, principalmente no contexto de modelos lineares de efeitos mistos. A seleção para esses modelos deve ser feita para os efeitos fixos, que estão relacionados a uma média global, e para os efeitos aleatórios, relacionados à variância a nível individual nesse contexto. São dois os tipos de abordagens para a seleção de variáveis em modelos de efeitos mistos: conjunta ou em dois estágios, havendo na literatura existente o processo de seleção conjunta via lasso para modelos lineares de efeitos-mistos normais. Outro tópico de elevada importância, é a análise de diagnóstico e resíduos. Enquanto as análises de resíduos são feitas para investigar problemas com o modelo ajustado e identificação de observações atípicas, uma análise de diagnóstico é feita assumindo o modelo como correto, e investigando a robustez das conclusões a pequenas perturbações dos dados e/ou no modelo. Para lidar com essas observações, são várias as alternativas. Uma delas, é a utilização de modelos robustos, os quais seriam ditos robustos a perturbações nos dados. Isto é, modelos que melhor se ajustam a conjuntos de dados que possuem pontos considerados como sendo outliers e/ou alavanca. Este trabalho tem como objetivo utilizar o método robusto para seleção de variáveis em modelos lineares de efeitos mistos e compará-lo com o método normal através de análise de diagnóstico.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)CAPES: 88882.461700/2019-01engUniversidade Federal de São CarlosCâmpus São CarlosPrograma Interinstitucional de Pós-Graduação em Estatística - PIPGEsUFSCarAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessModelos mistosLassoModelos robustosDiagnósticoAnálise de regressãoMixed modelsRobust modelsDiagnosticsRegression analysisCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICACIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOSCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAOA robust lasso regression for linear mixed-effects models with diagnostic analysisRegressão lasso robusta para modelos lineares de efeitos mistos com análise de diagnósticoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis60060059c3dc44-c7aa-491b-9d15-ce2d5d5a0ea2reponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALDissertacao_Rafael_final.pdfDissertacao_Rafael_final.pdfDissertaçãoapplication/pdf1066793https://repositorio.ufscar.br/bitstream/ufscar/15373/1/Dissertacao_Rafael_final.pdfe0a6db82981900999fb1aff8ec2b5a7bMD51carta_comprovante.pdfcarta_comprovante.pdfCarta comprovante assinada pela orientadoraapplication/pdf129312https://repositorio.ufscar.br/bitstream/ufscar/15373/3/carta_comprovante.pdf220e327dca8109ce3bc974fed3bcf0f3MD53CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufscar.br/bitstream/ufscar/15373/4/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD54TEXTDissertacao_Rafael_final.pdf.txtDissertacao_Rafael_final.pdf.txtExtracted texttext/plain122535https://repositorio.ufscar.br/bitstream/ufscar/15373/5/Dissertacao_Rafael_final.pdf.txt222e016d7f7bcab5f6a77695cef3545dMD55carta_comprovante.pdf.txtcarta_comprovante.pdf.txtExtracted texttext/plain1187https://repositorio.ufscar.br/bitstream/ufscar/15373/7/carta_comprovante.pdf.txt1bd0ed866d7fdb2eacc967754745cfc0MD57THUMBNAILDissertacao_Rafael_final.pdf.jpgDissertacao_Rafael_final.pdf.jpgIM Thumbnailimage/jpeg15098https://repositorio.ufscar.br/bitstream/ufscar/15373/6/Dissertacao_Rafael_final.pdf.jpg21199f340efc42d37a8c2d15f9313843MD56carta_comprovante.pdf.jpgcarta_comprovante.pdf.jpgIM Thumbnailimage/jpeg12684https://repositorio.ufscar.br/bitstream/ufscar/15373/8/carta_comprovante.pdf.jpg63e4a61aea224d00e160380e87624a9eMD58ufscar/153732023-09-18 18:32:28.477oai:repositorio.ufscar.br:ufscar/15373Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:32:28Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.eng.fl_str_mv A robust lasso regression for linear mixed-effects models with diagnostic analysis
dc.title.alternative.por.fl_str_mv Regressão lasso robusta para modelos lineares de efeitos mistos com análise de diagnóstico
title A robust lasso regression for linear mixed-effects models with diagnostic analysis
spellingShingle A robust lasso regression for linear mixed-effects models with diagnostic analysis
Garcia, Rafael Rocha de Oliveira
Modelos mistos
Lasso
Modelos robustos
Diagnóstico
Análise de regressão
Mixed models
Robust models
Diagnostics
Regression analysis
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOS
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAO
title_short A robust lasso regression for linear mixed-effects models with diagnostic analysis
title_full A robust lasso regression for linear mixed-effects models with diagnostic analysis
title_fullStr A robust lasso regression for linear mixed-effects models with diagnostic analysis
title_full_unstemmed A robust lasso regression for linear mixed-effects models with diagnostic analysis
title_sort A robust lasso regression for linear mixed-effects models with diagnostic analysis
author Garcia, Rafael Rocha de Oliveira
author_facet Garcia, Rafael Rocha de Oliveira
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://lattes.cnpq.br/0412360055686637
dc.contributor.author.fl_str_mv Garcia, Rafael Rocha de Oliveira
dc.contributor.advisor1.fl_str_mv Novelli, Cibele Maria Russo
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/1011098065426388
dc.contributor.authorID.fl_str_mv 5a99f797-fd65-4951-92b9-6cd745047215
contributor_str_mv Novelli, Cibele Maria Russo
dc.subject.por.fl_str_mv Modelos mistos
Lasso
Modelos robustos
Diagnóstico
Análise de regressão
topic Modelos mistos
Lasso
Modelos robustos
Diagnóstico
Análise de regressão
Mixed models
Robust models
Diagnostics
Regression analysis
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOS
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAO
dc.subject.eng.fl_str_mv Mixed models
Robust models
Diagnostics
Regression analysis
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOS
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAO
description Variable selection has been a topic of great interest for statisticians and researchers alike. The choice of the best subset of predictors may be carried out with the objective of improving prediction or for easier interpretation of results. However, such methods are not always straightforward, mainly in the context of linear mixed-effects models. Variable selection for such models must be carried out for both fixed and random effects, the first being related to the global mean of data and the second to subject-level variance. There are two possible approaches when selecting variables for mixed-effects models: joint or two-stage procedures. In existing literature on the topic of variable selection for linear mixed-effects model, there is a method of joint selection via lasso for linear mixed-effects models under a normal distribution. Another topic of remarkable importance, is diagnostics and residual analysis. While residual analyses are carried out to assess issues with the fitted model and identification of atypical observations, diagnostic analyses are carried out assuming the model as correct and, assessing its conclusions robustness to small disturbances in the data and/or the model. There are many possible ways to deal with such observations. One is using robust models, which are said to be robust to disturbances in the data. That is, models that are better fit to data sets that possess observations considered to be as outliers and/or leverage. This work aims to use the robust method for variable selection in linear mixed-effects model and compare it with the normal method using diagnostic analysis.
publishDate 2021
dc.date.accessioned.fl_str_mv 2021-12-16T20:56:29Z
dc.date.available.fl_str_mv 2021-12-16T20:56:29Z
dc.date.issued.fl_str_mv 2021-10-22
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv GARCIA, Rafael Rocha de Oliveira. A robust lasso regression for linear mixed-effects models with diagnostic analysis. 2021. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2021. Disponível em: https://repositorio.ufscar.br/handle/ufscar/15373.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/ufscar/15373
identifier_str_mv GARCIA, Rafael Rocha de Oliveira. A robust lasso regression for linear mixed-effects models with diagnostic analysis. 2021. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2021. Disponível em: https://repositorio.ufscar.br/handle/ufscar/15373.
url https://repositorio.ufscar.br/handle/ufscar/15373
dc.language.iso.fl_str_mv eng
language eng
dc.relation.confidence.fl_str_mv 600
600
dc.relation.authority.fl_str_mv 59c3dc44-c7aa-491b-9d15-ce2d5d5a0ea2
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.publisher.program.fl_str_mv Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs
dc.publisher.initials.fl_str_mv UFSCar
publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstream/ufscar/15373/1/Dissertacao_Rafael_final.pdf
https://repositorio.ufscar.br/bitstream/ufscar/15373/3/carta_comprovante.pdf
https://repositorio.ufscar.br/bitstream/ufscar/15373/4/license_rdf
https://repositorio.ufscar.br/bitstream/ufscar/15373/5/Dissertacao_Rafael_final.pdf.txt
https://repositorio.ufscar.br/bitstream/ufscar/15373/7/carta_comprovante.pdf.txt
https://repositorio.ufscar.br/bitstream/ufscar/15373/6/Dissertacao_Rafael_final.pdf.jpg
https://repositorio.ufscar.br/bitstream/ufscar/15373/8/carta_comprovante.pdf.jpg
bitstream.checksum.fl_str_mv e0a6db82981900999fb1aff8ec2b5a7b
220e327dca8109ce3bc974fed3bcf0f3
e39d27027a6cc9cb039ad269a5db8e34
222e016d7f7bcab5f6a77695cef3545d
1bd0ed866d7fdb2eacc967754745cfc0
21199f340efc42d37a8c2d15f9313843
63e4a61aea224d00e160380e87624a9e
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv
_version_ 1813715640951767040