Métodos de regularização no aprendizado de Máquinas: Ridge e LASSO
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
Texto Completo: | http://app.uff.br/riuff/handle/1/28391 |
Resumo: | O presente trabalho tem como proposta analisar o comportamento dos métodos de regularização de Ridge e LASSO. A Regressão Linear é um dos modelos mais utilizado no aprendizado de máquinas, porém quando o modelo possui muitas variáveis pode causar subajuste ou sobreajuste, gerando predições ruins. Uma solução para este problema é considerar os métodos de regularização que aplicam uma penalização sobre os parâmetros do modelo, minimizando a importância de variáveis menos relevantes, diminuindo a complexidade e garantindo que o modelo seja generalizável. Dois dos métodos de regularização mais utilizados são a regressão de Ridge, que inclui todos os preditores no modelo final, e a regressão de LASSO que, além de penalizar os parâmetros, realiza seleção de variáveis, ou seja, pode zerar as estimativas de alguns parâmetros. Por fim, realizou-se um estudo prático a partir de três bases de dados distintas, aplicando os métodos de Ridge e LASSO com auxílio do pacote tidymodels na linguagem de programação R. Em suma, Ridge e LASSO são dois poderosos métodos para modelagem de dados, entretanto, na análise prática, LASSO obteve melhores resultados em todos os casos. |
id |
UFF-2_a123077a30d29b1dd049a64fa0b15404 |
---|---|
oai_identifier_str |
oai:app.uff.br:1/28391 |
network_acronym_str |
UFF-2 |
network_name_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
repository_id_str |
2120 |
spelling |
Métodos de regularização no aprendizado de Máquinas: Ridge e LASSOAprendizado de máquinaMétodos de regularizaçãoRidgeLASSORegressão linear múltiplaMétodo estatísticoLinguagem de programação de computadorO presente trabalho tem como proposta analisar o comportamento dos métodos de regularização de Ridge e LASSO. A Regressão Linear é um dos modelos mais utilizado no aprendizado de máquinas, porém quando o modelo possui muitas variáveis pode causar subajuste ou sobreajuste, gerando predições ruins. Uma solução para este problema é considerar os métodos de regularização que aplicam uma penalização sobre os parâmetros do modelo, minimizando a importância de variáveis menos relevantes, diminuindo a complexidade e garantindo que o modelo seja generalizável. Dois dos métodos de regularização mais utilizados são a regressão de Ridge, que inclui todos os preditores no modelo final, e a regressão de LASSO que, além de penalizar os parâmetros, realiza seleção de variáveis, ou seja, pode zerar as estimativas de alguns parâmetros. Por fim, realizou-se um estudo prático a partir de três bases de dados distintas, aplicando os métodos de Ridge e LASSO com auxílio do pacote tidymodels na linguagem de programação R. Em suma, Ridge e LASSO são dois poderosos métodos para modelagem de dados, entretanto, na análise prática, LASSO obteve melhores resultados em todos os casos.49 f.Yaginuma, Karina YurikoYaginuma, Karina YurikoPinto, Douglas RodriguesCapistrano, Estelina Serrano de MarinsPassos, Luiz Fernando Coelho2023-03-28T16:51:48Z2023-03-28T16:51:48Z2022info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfPASSOS, Luiz Fernando Coelho. Métodos de Regularização no Aprendizado de Máquinas: Ridge e LASSO. 2022. 49 f. Trabalho de Conclusão de Curso (Graduação de Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2022.http://app.uff.br/riuff/handle/1/28391CC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2023-03-28T16:51:52Zoai:app.uff.br:1/28391Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202024-08-19T10:55:50.681701Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false |
dc.title.none.fl_str_mv |
Métodos de regularização no aprendizado de Máquinas: Ridge e LASSO |
title |
Métodos de regularização no aprendizado de Máquinas: Ridge e LASSO |
spellingShingle |
Métodos de regularização no aprendizado de Máquinas: Ridge e LASSO Passos, Luiz Fernando Coelho Aprendizado de máquina Métodos de regularização Ridge LASSO Regressão linear múltipla Método estatístico Linguagem de programação de computador |
title_short |
Métodos de regularização no aprendizado de Máquinas: Ridge e LASSO |
title_full |
Métodos de regularização no aprendizado de Máquinas: Ridge e LASSO |
title_fullStr |
Métodos de regularização no aprendizado de Máquinas: Ridge e LASSO |
title_full_unstemmed |
Métodos de regularização no aprendizado de Máquinas: Ridge e LASSO |
title_sort |
Métodos de regularização no aprendizado de Máquinas: Ridge e LASSO |
author |
Passos, Luiz Fernando Coelho |
author_facet |
Passos, Luiz Fernando Coelho |
author_role |
author |
dc.contributor.none.fl_str_mv |
Yaginuma, Karina Yuriko Yaginuma, Karina Yuriko Pinto, Douglas Rodrigues Capistrano, Estelina Serrano de Marins |
dc.contributor.author.fl_str_mv |
Passos, Luiz Fernando Coelho |
dc.subject.por.fl_str_mv |
Aprendizado de máquina Métodos de regularização Ridge LASSO Regressão linear múltipla Método estatístico Linguagem de programação de computador |
topic |
Aprendizado de máquina Métodos de regularização Ridge LASSO Regressão linear múltipla Método estatístico Linguagem de programação de computador |
description |
O presente trabalho tem como proposta analisar o comportamento dos métodos de regularização de Ridge e LASSO. A Regressão Linear é um dos modelos mais utilizado no aprendizado de máquinas, porém quando o modelo possui muitas variáveis pode causar subajuste ou sobreajuste, gerando predições ruins. Uma solução para este problema é considerar os métodos de regularização que aplicam uma penalização sobre os parâmetros do modelo, minimizando a importância de variáveis menos relevantes, diminuindo a complexidade e garantindo que o modelo seja generalizável. Dois dos métodos de regularização mais utilizados são a regressão de Ridge, que inclui todos os preditores no modelo final, e a regressão de LASSO que, além de penalizar os parâmetros, realiza seleção de variáveis, ou seja, pode zerar as estimativas de alguns parâmetros. Por fim, realizou-se um estudo prático a partir de três bases de dados distintas, aplicando os métodos de Ridge e LASSO com auxílio do pacote tidymodels na linguagem de programação R. Em suma, Ridge e LASSO são dois poderosos métodos para modelagem de dados, entretanto, na análise prática, LASSO obteve melhores resultados em todos os casos. |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022 2023-03-28T16:51:48Z 2023-03-28T16:51:48Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
PASSOS, Luiz Fernando Coelho. Métodos de Regularização no Aprendizado de Máquinas: Ridge e LASSO. 2022. 49 f. Trabalho de Conclusão de Curso (Graduação de Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2022. http://app.uff.br/riuff/handle/1/28391 |
identifier_str_mv |
PASSOS, Luiz Fernando Coelho. Métodos de Regularização no Aprendizado de Máquinas: Ridge e LASSO. 2022. 49 f. Trabalho de Conclusão de Curso (Graduação de Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2022. |
url |
http://app.uff.br/riuff/handle/1/28391 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
CC-BY-SA info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
CC-BY-SA |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF) instname:Universidade Federal Fluminense (UFF) instacron:UFF |
instname_str |
Universidade Federal Fluminense (UFF) |
instacron_str |
UFF |
institution |
UFF |
reponame_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
collection |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF) |
repository.mail.fl_str_mv |
riuff@id.uff.br |
_version_ |
1811823610696826880 |