Aplicação do método de Gradient Boosting

Detalhes bibliográficos
Autor(a) principal: Spolador, Rodolfo Hauret
Data de Publicação: 2021
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da Universidade Federal Fluminense (RIUFF)
Texto Completo: http://app.uff.br/riuff/handle/1/25319
Resumo: Devido ao aumento exponencial da quantidade de dados, os custos mais baixos deprocessamento computacional e uma maior acessibilidade no armazenamento de dados, as técnicas de aprendizado de máquinas tornaram-se mais atrativas. O aprendizado de máquina é um método de análise de dados que automatiza o desenvolvimento de modelos e permite a criação de modelos preditores, que auxiliam na tomada de decisões, reduzindo assim possíveis riscos. Os modelos de previsão de aprendizado de máquinas podem utilizar de regressões, árvores de classificação, entre outros. Neste trabalho é estudado o modelo supervisionado de Gradient Boosting que é baseado em árvores de classificação, ele constrói o modelo em etapas, como outros métodos de boosting, e os generaliza, permitindo a otimização de uma função de perda diferenciável arbitrária. Este método e o método de Regressão Logística serão aplicados em um conjunto de dados rotulados, afim de compará-los. Os resultados obtidos foram diferentes em ambos os métodos, nos dados de treino o modelo de Gradient Boosting apresentou maiores valores de AUC do que o modelo de Regressão Logística, entretanto este padrão não se manteve na base de teste. O melhor modelo de Gradient Boosting ajustado apresentou uma acurácia de 0.5685, este modelo apresentou métricas de sensibilidade (0.652) e especificidade (0.4063) não muito discrepantes, indicando que ele acerta bem ambas as características, enquanto que o melhor modelo de Regressão Logística foi o modelo com uma acurácia de 0.6054, sensibilidade (0.81) e especificidade (0.2084). Apesar do modelo de Regressão Logística apresentar maior acurácia, considerou-se que o Gradient Boosting apresentou melhor desempenho, visto que ele acertou as duas características da variável resposta de forma mais consistente.
id UFF-2_d0beb7213345551a378e59dcf585de1c
oai_identifier_str oai:app.uff.br:1/25319
network_acronym_str UFF-2
network_name_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository_id_str 2120
spelling Aplicação do método de Gradient BoostingAprendizado de MáquinaGradient BoostingRegressão LogísticaClassificaçãoEstatísticaAprendizado de máquinaRegressão logísticaDevido ao aumento exponencial da quantidade de dados, os custos mais baixos deprocessamento computacional e uma maior acessibilidade no armazenamento de dados, as técnicas de aprendizado de máquinas tornaram-se mais atrativas. O aprendizado de máquina é um método de análise de dados que automatiza o desenvolvimento de modelos e permite a criação de modelos preditores, que auxiliam na tomada de decisões, reduzindo assim possíveis riscos. Os modelos de previsão de aprendizado de máquinas podem utilizar de regressões, árvores de classificação, entre outros. Neste trabalho é estudado o modelo supervisionado de Gradient Boosting que é baseado em árvores de classificação, ele constrói o modelo em etapas, como outros métodos de boosting, e os generaliza, permitindo a otimização de uma função de perda diferenciável arbitrária. Este método e o método de Regressão Logística serão aplicados em um conjunto de dados rotulados, afim de compará-los. Os resultados obtidos foram diferentes em ambos os métodos, nos dados de treino o modelo de Gradient Boosting apresentou maiores valores de AUC do que o modelo de Regressão Logística, entretanto este padrão não se manteve na base de teste. O melhor modelo de Gradient Boosting ajustado apresentou uma acurácia de 0.5685, este modelo apresentou métricas de sensibilidade (0.652) e especificidade (0.4063) não muito discrepantes, indicando que ele acerta bem ambas as características, enquanto que o melhor modelo de Regressão Logística foi o modelo com uma acurácia de 0.6054, sensibilidade (0.81) e especificidade (0.2084). Apesar do modelo de Regressão Logística apresentar maior acurácia, considerou-se que o Gradient Boosting apresentou melhor desempenho, visto que ele acertou as duas características da variável resposta de forma mais consistente.63 f.Universidade Federal FluminenseNiteróiYaginuma, Karina YurikoYaginuma, Karina YurikoPinto, Douglas RodriguesKubrusly, Jessica QuintanilhaYaginuma, Karina YurikoSpolador, Rodolfo Hauret2022-06-23T14:09:06Z2022-06-23T14:09:06Z2021-05info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfSPOLADOR, Rodolfo Hauret. Aplicação do método de Gradient Boosting. 2021 63 f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2021.http://app.uff.br/riuff/handle/1/25319Aluno de Graduaçãohttp://creativecommons.org/licenses/by-nc-nd/3.0/br/CC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2022-06-23T14:09:10Zoai:app.uff.br:1/25319Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202024-08-19T11:08:12.792923Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false
dc.title.none.fl_str_mv Aplicação do método de Gradient Boosting
title Aplicação do método de Gradient Boosting
spellingShingle Aplicação do método de Gradient Boosting
Spolador, Rodolfo Hauret
Aprendizado de Máquina
Gradient Boosting
Regressão Logística
Classificação
Estatística
Aprendizado de máquina
Regressão logística
title_short Aplicação do método de Gradient Boosting
title_full Aplicação do método de Gradient Boosting
title_fullStr Aplicação do método de Gradient Boosting
title_full_unstemmed Aplicação do método de Gradient Boosting
title_sort Aplicação do método de Gradient Boosting
author Spolador, Rodolfo Hauret
author_facet Spolador, Rodolfo Hauret
author_role author
dc.contributor.none.fl_str_mv Yaginuma, Karina Yuriko
Yaginuma, Karina Yuriko
Pinto, Douglas Rodrigues
Kubrusly, Jessica Quintanilha
Yaginuma, Karina Yuriko
dc.contributor.author.fl_str_mv Spolador, Rodolfo Hauret
dc.subject.por.fl_str_mv Aprendizado de Máquina
Gradient Boosting
Regressão Logística
Classificação
Estatística
Aprendizado de máquina
Regressão logística
topic Aprendizado de Máquina
Gradient Boosting
Regressão Logística
Classificação
Estatística
Aprendizado de máquina
Regressão logística
description Devido ao aumento exponencial da quantidade de dados, os custos mais baixos deprocessamento computacional e uma maior acessibilidade no armazenamento de dados, as técnicas de aprendizado de máquinas tornaram-se mais atrativas. O aprendizado de máquina é um método de análise de dados que automatiza o desenvolvimento de modelos e permite a criação de modelos preditores, que auxiliam na tomada de decisões, reduzindo assim possíveis riscos. Os modelos de previsão de aprendizado de máquinas podem utilizar de regressões, árvores de classificação, entre outros. Neste trabalho é estudado o modelo supervisionado de Gradient Boosting que é baseado em árvores de classificação, ele constrói o modelo em etapas, como outros métodos de boosting, e os generaliza, permitindo a otimização de uma função de perda diferenciável arbitrária. Este método e o método de Regressão Logística serão aplicados em um conjunto de dados rotulados, afim de compará-los. Os resultados obtidos foram diferentes em ambos os métodos, nos dados de treino o modelo de Gradient Boosting apresentou maiores valores de AUC do que o modelo de Regressão Logística, entretanto este padrão não se manteve na base de teste. O melhor modelo de Gradient Boosting ajustado apresentou uma acurácia de 0.5685, este modelo apresentou métricas de sensibilidade (0.652) e especificidade (0.4063) não muito discrepantes, indicando que ele acerta bem ambas as características, enquanto que o melhor modelo de Regressão Logística foi o modelo com uma acurácia de 0.6054, sensibilidade (0.81) e especificidade (0.2084). Apesar do modelo de Regressão Logística apresentar maior acurácia, considerou-se que o Gradient Boosting apresentou melhor desempenho, visto que ele acertou as duas características da variável resposta de forma mais consistente.
publishDate 2021
dc.date.none.fl_str_mv 2021-05
2022-06-23T14:09:06Z
2022-06-23T14:09:06Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv SPOLADOR, Rodolfo Hauret. Aplicação do método de Gradient Boosting. 2021 63 f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2021.
http://app.uff.br/riuff/handle/1/25319
Aluno de Graduação
identifier_str_mv SPOLADOR, Rodolfo Hauret. Aplicação do método de Gradient Boosting. 2021 63 f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2021.
Aluno de Graduação
url http://app.uff.br/riuff/handle/1/25319
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/3.0/br/
CC-BY-SA
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/3.0/br/
CC-BY-SA
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal Fluminense
Niterói
publisher.none.fl_str_mv Universidade Federal Fluminense
Niterói
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)
instname:Universidade Federal Fluminense (UFF)
instacron:UFF
instname_str Universidade Federal Fluminense (UFF)
instacron_str UFF
institution UFF
reponame_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
collection Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository.name.fl_str_mv Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)
repository.mail.fl_str_mv riuff@id.uff.br
_version_ 1811823669661401088