A robust lasso regression for linear mixed-effects models with diagnostic analysis
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Institucional da UFSCAR |
Texto Completo: | https://repositorio.ufscar.br/handle/ufscar/15373 |
Resumo: | Variable selection has been a topic of great interest for statisticians and researchers alike. The choice of the best subset of predictors may be carried out with the objective of improving prediction or for easier interpretation of results. However, such methods are not always straightforward, mainly in the context of linear mixed-effects models. Variable selection for such models must be carried out for both fixed and random effects, the first being related to the global mean of data and the second to subject-level variance. There are two possible approaches when selecting variables for mixed-effects models: joint or two-stage procedures. In existing literature on the topic of variable selection for linear mixed-effects model, there is a method of joint selection via lasso for linear mixed-effects models under a normal distribution. Another topic of remarkable importance, is diagnostics and residual analysis. While residual analyses are carried out to assess issues with the fitted model and identification of atypical observations, diagnostic analyses are carried out assuming the model as correct and, assessing its conclusions robustness to small disturbances in the data and/or the model. There are many possible ways to deal with such observations. One is using robust models, which are said to be robust to disturbances in the data. That is, models that are better fit to data sets that possess observations considered to be as outliers and/or leverage. This work aims to use the robust method for variable selection in linear mixed-effects model and compare it with the normal method using diagnostic analysis. |
id |
SCAR_3c43a3a56958fe1ccaaaeb4abc84fad2 |
---|---|
oai_identifier_str |
oai:repositorio.ufscar.br:ufscar/15373 |
network_acronym_str |
SCAR |
network_name_str |
Repositório Institucional da UFSCAR |
repository_id_str |
4322 |
spelling |
Garcia, Rafael Rocha de OliveiraNovelli, Cibele Maria Russohttp://lattes.cnpq.br/1011098065426388http://lattes.cnpq.br/04123600556866375a99f797-fd65-4951-92b9-6cd7450472152021-12-16T20:56:29Z2021-12-16T20:56:29Z2021-10-22GARCIA, Rafael Rocha de Oliveira. A robust lasso regression for linear mixed-effects models with diagnostic analysis. 2021. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2021. Disponível em: https://repositorio.ufscar.br/handle/ufscar/15373.https://repositorio.ufscar.br/handle/ufscar/15373Variable selection has been a topic of great interest for statisticians and researchers alike. The choice of the best subset of predictors may be carried out with the objective of improving prediction or for easier interpretation of results. However, such methods are not always straightforward, mainly in the context of linear mixed-effects models. Variable selection for such models must be carried out for both fixed and random effects, the first being related to the global mean of data and the second to subject-level variance. There are two possible approaches when selecting variables for mixed-effects models: joint or two-stage procedures. In existing literature on the topic of variable selection for linear mixed-effects model, there is a method of joint selection via lasso for linear mixed-effects models under a normal distribution. Another topic of remarkable importance, is diagnostics and residual analysis. While residual analyses are carried out to assess issues with the fitted model and identification of atypical observations, diagnostic analyses are carried out assuming the model as correct and, assessing its conclusions robustness to small disturbances in the data and/or the model. There are many possible ways to deal with such observations. One is using robust models, which are said to be robust to disturbances in the data. That is, models that are better fit to data sets that possess observations considered to be as outliers and/or leverage. This work aims to use the robust method for variable selection in linear mixed-effects model and compare it with the normal method using diagnostic analysis.Seleção de variáveis é um tópico de elevada importância para o processo de modelagem. A escolha do melhor conjunto de variáveis explicativas pode ser feita com o intuito de melhorar uma previsão ou facilitar a interpretação dos resultados. Contudo, os métodos para seleção de variáveis nem sempre são triviais, principalmente no contexto de modelos lineares de efeitos mistos. A seleção para esses modelos deve ser feita para os efeitos fixos, que estão relacionados a uma média global, e para os efeitos aleatórios, relacionados à variância a nível individual nesse contexto. São dois os tipos de abordagens para a seleção de variáveis em modelos de efeitos mistos: conjunta ou em dois estágios, havendo na literatura existente o processo de seleção conjunta via lasso para modelos lineares de efeitos-mistos normais. Outro tópico de elevada importância, é a análise de diagnóstico e resíduos. Enquanto as análises de resíduos são feitas para investigar problemas com o modelo ajustado e identificação de observações atípicas, uma análise de diagnóstico é feita assumindo o modelo como correto, e investigando a robustez das conclusões a pequenas perturbações dos dados e/ou no modelo. Para lidar com essas observações, são várias as alternativas. Uma delas, é a utilização de modelos robustos, os quais seriam ditos robustos a perturbações nos dados. Isto é, modelos que melhor se ajustam a conjuntos de dados que possuem pontos considerados como sendo outliers e/ou alavanca. Este trabalho tem como objetivo utilizar o método robusto para seleção de variáveis em modelos lineares de efeitos mistos e compará-lo com o método normal através de análise de diagnóstico.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)CAPES: 88882.461700/2019-01engUniversidade Federal de São CarlosCâmpus São CarlosPrograma Interinstitucional de Pós-Graduação em Estatística - PIPGEsUFSCarAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessModelos mistosLassoModelos robustosDiagnósticoAnálise de regressãoMixed modelsRobust modelsDiagnosticsRegression analysisCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICACIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOSCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAOA robust lasso regression for linear mixed-effects models with diagnostic analysisRegressão lasso robusta para modelos lineares de efeitos mistos com análise de diagnósticoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis60060059c3dc44-c7aa-491b-9d15-ce2d5d5a0ea2reponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALDissertacao_Rafael_final.pdfDissertacao_Rafael_final.pdfDissertaçãoapplication/pdf1066793https://repositorio.ufscar.br/bitstream/ufscar/15373/1/Dissertacao_Rafael_final.pdfe0a6db82981900999fb1aff8ec2b5a7bMD51carta_comprovante.pdfcarta_comprovante.pdfCarta comprovante assinada pela orientadoraapplication/pdf129312https://repositorio.ufscar.br/bitstream/ufscar/15373/3/carta_comprovante.pdf220e327dca8109ce3bc974fed3bcf0f3MD53CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufscar.br/bitstream/ufscar/15373/4/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD54TEXTDissertacao_Rafael_final.pdf.txtDissertacao_Rafael_final.pdf.txtExtracted texttext/plain122535https://repositorio.ufscar.br/bitstream/ufscar/15373/5/Dissertacao_Rafael_final.pdf.txt222e016d7f7bcab5f6a77695cef3545dMD55carta_comprovante.pdf.txtcarta_comprovante.pdf.txtExtracted texttext/plain1187https://repositorio.ufscar.br/bitstream/ufscar/15373/7/carta_comprovante.pdf.txt1bd0ed866d7fdb2eacc967754745cfc0MD57THUMBNAILDissertacao_Rafael_final.pdf.jpgDissertacao_Rafael_final.pdf.jpgIM Thumbnailimage/jpeg15098https://repositorio.ufscar.br/bitstream/ufscar/15373/6/Dissertacao_Rafael_final.pdf.jpg21199f340efc42d37a8c2d15f9313843MD56carta_comprovante.pdf.jpgcarta_comprovante.pdf.jpgIM Thumbnailimage/jpeg12684https://repositorio.ufscar.br/bitstream/ufscar/15373/8/carta_comprovante.pdf.jpg63e4a61aea224d00e160380e87624a9eMD58ufscar/153732023-09-18 18:32:28.477oai:repositorio.ufscar.br:ufscar/15373Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:32:28Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
dc.title.eng.fl_str_mv |
A robust lasso regression for linear mixed-effects models with diagnostic analysis |
dc.title.alternative.por.fl_str_mv |
Regressão lasso robusta para modelos lineares de efeitos mistos com análise de diagnóstico |
title |
A robust lasso regression for linear mixed-effects models with diagnostic analysis |
spellingShingle |
A robust lasso regression for linear mixed-effects models with diagnostic analysis Garcia, Rafael Rocha de Oliveira Modelos mistos Lasso Modelos robustos Diagnóstico Análise de regressão Mixed models Robust models Diagnostics Regression analysis CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOS CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAO |
title_short |
A robust lasso regression for linear mixed-effects models with diagnostic analysis |
title_full |
A robust lasso regression for linear mixed-effects models with diagnostic analysis |
title_fullStr |
A robust lasso regression for linear mixed-effects models with diagnostic analysis |
title_full_unstemmed |
A robust lasso regression for linear mixed-effects models with diagnostic analysis |
title_sort |
A robust lasso regression for linear mixed-effects models with diagnostic analysis |
author |
Garcia, Rafael Rocha de Oliveira |
author_facet |
Garcia, Rafael Rocha de Oliveira |
author_role |
author |
dc.contributor.authorlattes.por.fl_str_mv |
http://lattes.cnpq.br/0412360055686637 |
dc.contributor.author.fl_str_mv |
Garcia, Rafael Rocha de Oliveira |
dc.contributor.advisor1.fl_str_mv |
Novelli, Cibele Maria Russo |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/1011098065426388 |
dc.contributor.authorID.fl_str_mv |
5a99f797-fd65-4951-92b9-6cd745047215 |
contributor_str_mv |
Novelli, Cibele Maria Russo |
dc.subject.por.fl_str_mv |
Modelos mistos Lasso Modelos robustos Diagnóstico Análise de regressão |
topic |
Modelos mistos Lasso Modelos robustos Diagnóstico Análise de regressão Mixed models Robust models Diagnostics Regression analysis CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOS CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAO |
dc.subject.eng.fl_str_mv |
Mixed models Robust models Diagnostics Regression analysis |
dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOS CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAO |
description |
Variable selection has been a topic of great interest for statisticians and researchers alike. The choice of the best subset of predictors may be carried out with the objective of improving prediction or for easier interpretation of results. However, such methods are not always straightforward, mainly in the context of linear mixed-effects models. Variable selection for such models must be carried out for both fixed and random effects, the first being related to the global mean of data and the second to subject-level variance. There are two possible approaches when selecting variables for mixed-effects models: joint or two-stage procedures. In existing literature on the topic of variable selection for linear mixed-effects model, there is a method of joint selection via lasso for linear mixed-effects models under a normal distribution. Another topic of remarkable importance, is diagnostics and residual analysis. While residual analyses are carried out to assess issues with the fitted model and identification of atypical observations, diagnostic analyses are carried out assuming the model as correct and, assessing its conclusions robustness to small disturbances in the data and/or the model. There are many possible ways to deal with such observations. One is using robust models, which are said to be robust to disturbances in the data. That is, models that are better fit to data sets that possess observations considered to be as outliers and/or leverage. This work aims to use the robust method for variable selection in linear mixed-effects model and compare it with the normal method using diagnostic analysis. |
publishDate |
2021 |
dc.date.accessioned.fl_str_mv |
2021-12-16T20:56:29Z |
dc.date.available.fl_str_mv |
2021-12-16T20:56:29Z |
dc.date.issued.fl_str_mv |
2021-10-22 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
GARCIA, Rafael Rocha de Oliveira. A robust lasso regression for linear mixed-effects models with diagnostic analysis. 2021. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2021. Disponível em: https://repositorio.ufscar.br/handle/ufscar/15373. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufscar.br/handle/ufscar/15373 |
identifier_str_mv |
GARCIA, Rafael Rocha de Oliveira. A robust lasso regression for linear mixed-effects models with diagnostic analysis. 2021. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2021. Disponível em: https://repositorio.ufscar.br/handle/ufscar/15373. |
url |
https://repositorio.ufscar.br/handle/ufscar/15373 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.relation.confidence.fl_str_mv |
600 600 |
dc.relation.authority.fl_str_mv |
59c3dc44-c7aa-491b-9d15-ce2d5d5a0ea2 |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
dc.publisher.program.fl_str_mv |
Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs |
dc.publisher.initials.fl_str_mv |
UFSCar |
publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
instname_str |
Universidade Federal de São Carlos (UFSCAR) |
instacron_str |
UFSCAR |
institution |
UFSCAR |
reponame_str |
Repositório Institucional da UFSCAR |
collection |
Repositório Institucional da UFSCAR |
bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstream/ufscar/15373/1/Dissertacao_Rafael_final.pdf https://repositorio.ufscar.br/bitstream/ufscar/15373/3/carta_comprovante.pdf https://repositorio.ufscar.br/bitstream/ufscar/15373/4/license_rdf https://repositorio.ufscar.br/bitstream/ufscar/15373/5/Dissertacao_Rafael_final.pdf.txt https://repositorio.ufscar.br/bitstream/ufscar/15373/7/carta_comprovante.pdf.txt https://repositorio.ufscar.br/bitstream/ufscar/15373/6/Dissertacao_Rafael_final.pdf.jpg https://repositorio.ufscar.br/bitstream/ufscar/15373/8/carta_comprovante.pdf.jpg |
bitstream.checksum.fl_str_mv |
e0a6db82981900999fb1aff8ec2b5a7b 220e327dca8109ce3bc974fed3bcf0f3 e39d27027a6cc9cb039ad269a5db8e34 222e016d7f7bcab5f6a77695cef3545d 1bd0ed866d7fdb2eacc967754745cfc0 21199f340efc42d37a8c2d15f9313843 63e4a61aea224d00e160380e87624a9e |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
repository.mail.fl_str_mv |
|
_version_ |
1813715640951767040 |