Solução automatizada de engenharia de características para problemas de aprendizado de máquina

Detalhes bibliográficos
Autor(a) principal: Prado, Fernando Favoretti Vital do
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/100/100131/tde-18112021-212329/
Resumo: Atualmente, o aprendizado de máquina vem sendo amplamente utilizado para auxiliar em diferentes atividades, desde a sugestão de vídeos ou séries até no auxílio ao diagnóstico médico. O desenvolvimento de soluções envolvendo aprendizado de máquina envolve uma série de tarefas que incluem entendimento do problema, entendimento dos dados, preparação dos dados, modelagem, avaliação e verificação dos resultados. A construção de modelos de aprendizado de máquina de alta qualidade é, tipicamente, interativo e complexo, exigindo conhecimento específico e um grande esforço do executor. O aprendizado de máquina automatizado AutoML procura automatizar partes desse processo. Uma etapa importante do desenvolvimento desse tipo de solução é a engenharia de características que aplica transformações nos dados originais, tornando-os mais representativos para o modelo final. O presente trabalho atua no escopo de apresentar uma solução que automatize o processo de engenharia de características. A estratégia resultante da aplicação de técnicas de geração e seleção automatizadas de características em um arcabouço único é capaz de propiciar melhoria no desempenho de diferentes algoritmos aplicados a problemas de classificação quando comparados a um baseline inicial frente a quatro diferentes métricas. A solução apresentada neste trabalho provê a opção de automatização do arcabouço completo de engenharia de características, para o contexto específico de problemas de aprendizado do tipo classificação que utilizam dados tabulares
id USP_cb57507bd61a5ffeee1465fe431a9f69
oai_identifier_str oai:teses.usp.br:tde-18112021-212329
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Solução automatizada de engenharia de características para problemas de aprendizado de máquinaAutomated feature engineering solution for machine learning problemsAprendizado de máquinaAutoMLAutoMLEngenharia de CaracterísticasFeature engineeringMachine learningAtualmente, o aprendizado de máquina vem sendo amplamente utilizado para auxiliar em diferentes atividades, desde a sugestão de vídeos ou séries até no auxílio ao diagnóstico médico. O desenvolvimento de soluções envolvendo aprendizado de máquina envolve uma série de tarefas que incluem entendimento do problema, entendimento dos dados, preparação dos dados, modelagem, avaliação e verificação dos resultados. A construção de modelos de aprendizado de máquina de alta qualidade é, tipicamente, interativo e complexo, exigindo conhecimento específico e um grande esforço do executor. O aprendizado de máquina automatizado AutoML procura automatizar partes desse processo. Uma etapa importante do desenvolvimento desse tipo de solução é a engenharia de características que aplica transformações nos dados originais, tornando-os mais representativos para o modelo final. O presente trabalho atua no escopo de apresentar uma solução que automatize o processo de engenharia de características. A estratégia resultante da aplicação de técnicas de geração e seleção automatizadas de características em um arcabouço único é capaz de propiciar melhoria no desempenho de diferentes algoritmos aplicados a problemas de classificação quando comparados a um baseline inicial frente a quatro diferentes métricas. A solução apresentada neste trabalho provê a opção de automatização do arcabouço completo de engenharia de características, para o contexto específico de problemas de aprendizado do tipo classificação que utilizam dados tabularesNowadays, machine learning has been widely used to assist in different activities, from recommending videos or series to aiding in medical diagnosis. The development of solutions involving machine learning involves a series of tasks which include understanding the problem, understanding the data, preparing the data, modeling, evaluating, and verifying the results. Building high-quality machine learning models is iterative and complex, requiring specific knowledge and a great deal of effort from the performer. Automated machine learning (AutoML) seeks to automate parts of this process. An important step in the development of this type of solution is feature engineering that applies transformations to the original data, making them more representative for the final model. The present work presents an approach that automates the feature engineering process. The developed solution combines automated feature generation and selection techniques in a single framework. It was able to improve the performance of different algorithms applied to classification problems when compared with an initial baseline, considering four different metrics. The solution presented in this work provides the option of automating the complete feature engineering framework, for the specific context of classification problems that use tabular dataBiblioteca Digitais de Teses e Dissertações da USPDigiampietri, Luciano AntonioPrado, Fernando Favoretti Vital do2021-10-05info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/100/100131/tde-18112021-212329/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2023-05-16T16:27:53Zoai:teses.usp.br:tde-18112021-212329Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-05-16T16:27:53Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Solução automatizada de engenharia de características para problemas de aprendizado de máquina
Automated feature engineering solution for machine learning problems
title Solução automatizada de engenharia de características para problemas de aprendizado de máquina
spellingShingle Solução automatizada de engenharia de características para problemas de aprendizado de máquina
Prado, Fernando Favoretti Vital do
Aprendizado de máquina
AutoML
AutoML
Engenharia de Características
Feature engineering
Machine learning
title_short Solução automatizada de engenharia de características para problemas de aprendizado de máquina
title_full Solução automatizada de engenharia de características para problemas de aprendizado de máquina
title_fullStr Solução automatizada de engenharia de características para problemas de aprendizado de máquina
title_full_unstemmed Solução automatizada de engenharia de características para problemas de aprendizado de máquina
title_sort Solução automatizada de engenharia de características para problemas de aprendizado de máquina
author Prado, Fernando Favoretti Vital do
author_facet Prado, Fernando Favoretti Vital do
author_role author
dc.contributor.none.fl_str_mv Digiampietri, Luciano Antonio
dc.contributor.author.fl_str_mv Prado, Fernando Favoretti Vital do
dc.subject.por.fl_str_mv Aprendizado de máquina
AutoML
AutoML
Engenharia de Características
Feature engineering
Machine learning
topic Aprendizado de máquina
AutoML
AutoML
Engenharia de Características
Feature engineering
Machine learning
description Atualmente, o aprendizado de máquina vem sendo amplamente utilizado para auxiliar em diferentes atividades, desde a sugestão de vídeos ou séries até no auxílio ao diagnóstico médico. O desenvolvimento de soluções envolvendo aprendizado de máquina envolve uma série de tarefas que incluem entendimento do problema, entendimento dos dados, preparação dos dados, modelagem, avaliação e verificação dos resultados. A construção de modelos de aprendizado de máquina de alta qualidade é, tipicamente, interativo e complexo, exigindo conhecimento específico e um grande esforço do executor. O aprendizado de máquina automatizado AutoML procura automatizar partes desse processo. Uma etapa importante do desenvolvimento desse tipo de solução é a engenharia de características que aplica transformações nos dados originais, tornando-os mais representativos para o modelo final. O presente trabalho atua no escopo de apresentar uma solução que automatize o processo de engenharia de características. A estratégia resultante da aplicação de técnicas de geração e seleção automatizadas de características em um arcabouço único é capaz de propiciar melhoria no desempenho de diferentes algoritmos aplicados a problemas de classificação quando comparados a um baseline inicial frente a quatro diferentes métricas. A solução apresentada neste trabalho provê a opção de automatização do arcabouço completo de engenharia de características, para o contexto específico de problemas de aprendizado do tipo classificação que utilizam dados tabulares
publishDate 2021
dc.date.none.fl_str_mv 2021-10-05
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/100/100131/tde-18112021-212329/
url https://www.teses.usp.br/teses/disponiveis/100/100131/tde-18112021-212329/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1809090845406658560