Métodos de regularização no aprendizado de Máquinas: Ridge e LASSO

Detalhes bibliográficos
Autor(a) principal: Passos, Luiz Fernando Coelho
Data de Publicação: 2022
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da Universidade Federal Fluminense (RIUFF)
Texto Completo: http://app.uff.br/riuff/handle/1/28391
Resumo: O presente trabalho tem como proposta analisar o comportamento dos métodos de regularização de Ridge e LASSO. A Regressão Linear é um dos modelos mais utilizado no aprendizado de máquinas, porém quando o modelo possui muitas variáveis pode causar subajuste ou sobreajuste, gerando predições ruins. Uma solução para este problema é considerar os métodos de regularização que aplicam uma penalização sobre os parâmetros do modelo, minimizando a importância de variáveis menos relevantes, diminuindo a complexidade e garantindo que o modelo seja generalizável. Dois dos métodos de regularização mais utilizados são a regressão de Ridge, que inclui todos os preditores no modelo final, e a regressão de LASSO que, além de penalizar os parâmetros, realiza seleção de variáveis, ou seja, pode zerar as estimativas de alguns parâmetros. Por fim, realizou-se um estudo prático a partir de três bases de dados distintas, aplicando os métodos de Ridge e LASSO com auxílio do pacote tidymodels na linguagem de programação R. Em suma, Ridge e LASSO são dois poderosos métodos para modelagem de dados, entretanto, na análise prática, LASSO obteve melhores resultados em todos os casos.
id UFF-2_a123077a30d29b1dd049a64fa0b15404
oai_identifier_str oai:app.uff.br:1/28391
network_acronym_str UFF-2
network_name_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository_id_str 2120
spelling Métodos de regularização no aprendizado de Máquinas: Ridge e LASSOAprendizado de máquinaMétodos de regularizaçãoRidgeLASSORegressão linear múltiplaMétodo estatísticoLinguagem de programação de computadorO presente trabalho tem como proposta analisar o comportamento dos métodos de regularização de Ridge e LASSO. A Regressão Linear é um dos modelos mais utilizado no aprendizado de máquinas, porém quando o modelo possui muitas variáveis pode causar subajuste ou sobreajuste, gerando predições ruins. Uma solução para este problema é considerar os métodos de regularização que aplicam uma penalização sobre os parâmetros do modelo, minimizando a importância de variáveis menos relevantes, diminuindo a complexidade e garantindo que o modelo seja generalizável. Dois dos métodos de regularização mais utilizados são a regressão de Ridge, que inclui todos os preditores no modelo final, e a regressão de LASSO que, além de penalizar os parâmetros, realiza seleção de variáveis, ou seja, pode zerar as estimativas de alguns parâmetros. Por fim, realizou-se um estudo prático a partir de três bases de dados distintas, aplicando os métodos de Ridge e LASSO com auxílio do pacote tidymodels na linguagem de programação R. Em suma, Ridge e LASSO são dois poderosos métodos para modelagem de dados, entretanto, na análise prática, LASSO obteve melhores resultados em todos os casos.49 f.Yaginuma, Karina YurikoYaginuma, Karina YurikoPinto, Douglas RodriguesCapistrano, Estelina Serrano de MarinsPassos, Luiz Fernando Coelho2023-03-28T16:51:48Z2023-03-28T16:51:48Z2022info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfPASSOS, Luiz Fernando Coelho. Métodos de Regularização no Aprendizado de Máquinas: Ridge e LASSO. 2022. 49 f. Trabalho de Conclusão de Curso (Graduação de Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2022.http://app.uff.br/riuff/handle/1/28391CC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2023-03-28T16:51:52Zoai:app.uff.br:1/28391Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202023-03-28T16:51:52Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false
dc.title.none.fl_str_mv Métodos de regularização no aprendizado de Máquinas: Ridge e LASSO
title Métodos de regularização no aprendizado de Máquinas: Ridge e LASSO
spellingShingle Métodos de regularização no aprendizado de Máquinas: Ridge e LASSO
Passos, Luiz Fernando Coelho
Aprendizado de máquina
Métodos de regularização
Ridge
LASSO
Regressão linear múltipla
Método estatístico
Linguagem de programação de computador
title_short Métodos de regularização no aprendizado de Máquinas: Ridge e LASSO
title_full Métodos de regularização no aprendizado de Máquinas: Ridge e LASSO
title_fullStr Métodos de regularização no aprendizado de Máquinas: Ridge e LASSO
title_full_unstemmed Métodos de regularização no aprendizado de Máquinas: Ridge e LASSO
title_sort Métodos de regularização no aprendizado de Máquinas: Ridge e LASSO
author Passos, Luiz Fernando Coelho
author_facet Passos, Luiz Fernando Coelho
author_role author
dc.contributor.none.fl_str_mv Yaginuma, Karina Yuriko
Yaginuma, Karina Yuriko
Pinto, Douglas Rodrigues
Capistrano, Estelina Serrano de Marins
dc.contributor.author.fl_str_mv Passos, Luiz Fernando Coelho
dc.subject.por.fl_str_mv Aprendizado de máquina
Métodos de regularização
Ridge
LASSO
Regressão linear múltipla
Método estatístico
Linguagem de programação de computador
topic Aprendizado de máquina
Métodos de regularização
Ridge
LASSO
Regressão linear múltipla
Método estatístico
Linguagem de programação de computador
description O presente trabalho tem como proposta analisar o comportamento dos métodos de regularização de Ridge e LASSO. A Regressão Linear é um dos modelos mais utilizado no aprendizado de máquinas, porém quando o modelo possui muitas variáveis pode causar subajuste ou sobreajuste, gerando predições ruins. Uma solução para este problema é considerar os métodos de regularização que aplicam uma penalização sobre os parâmetros do modelo, minimizando a importância de variáveis menos relevantes, diminuindo a complexidade e garantindo que o modelo seja generalizável. Dois dos métodos de regularização mais utilizados são a regressão de Ridge, que inclui todos os preditores no modelo final, e a regressão de LASSO que, além de penalizar os parâmetros, realiza seleção de variáveis, ou seja, pode zerar as estimativas de alguns parâmetros. Por fim, realizou-se um estudo prático a partir de três bases de dados distintas, aplicando os métodos de Ridge e LASSO com auxílio do pacote tidymodels na linguagem de programação R. Em suma, Ridge e LASSO são dois poderosos métodos para modelagem de dados, entretanto, na análise prática, LASSO obteve melhores resultados em todos os casos.
publishDate 2022
dc.date.none.fl_str_mv 2022
2023-03-28T16:51:48Z
2023-03-28T16:51:48Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv PASSOS, Luiz Fernando Coelho. Métodos de Regularização no Aprendizado de Máquinas: Ridge e LASSO. 2022. 49 f. Trabalho de Conclusão de Curso (Graduação de Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2022.
http://app.uff.br/riuff/handle/1/28391
identifier_str_mv PASSOS, Luiz Fernando Coelho. Métodos de Regularização no Aprendizado de Máquinas: Ridge e LASSO. 2022. 49 f. Trabalho de Conclusão de Curso (Graduação de Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2022.
url http://app.uff.br/riuff/handle/1/28391
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv CC-BY-SA
info:eu-repo/semantics/openAccess
rights_invalid_str_mv CC-BY-SA
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)
instname:Universidade Federal Fluminense (UFF)
instacron:UFF
instname_str Universidade Federal Fluminense (UFF)
instacron_str UFF
institution UFF
reponame_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
collection Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository.name.fl_str_mv Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)
repository.mail.fl_str_mv riuff@id.uff.br
_version_ 1807838743227269120