Solução automatizada de engenharia de características para problemas de aprendizado de máquina
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://www.teses.usp.br/teses/disponiveis/100/100131/tde-18112021-212329/ |
Resumo: | Atualmente, o aprendizado de máquina vem sendo amplamente utilizado para auxiliar em diferentes atividades, desde a sugestão de vídeos ou séries até no auxílio ao diagnóstico médico. O desenvolvimento de soluções envolvendo aprendizado de máquina envolve uma série de tarefas que incluem entendimento do problema, entendimento dos dados, preparação dos dados, modelagem, avaliação e verificação dos resultados. A construção de modelos de aprendizado de máquina de alta qualidade é, tipicamente, interativo e complexo, exigindo conhecimento específico e um grande esforço do executor. O aprendizado de máquina automatizado AutoML procura automatizar partes desse processo. Uma etapa importante do desenvolvimento desse tipo de solução é a engenharia de características que aplica transformações nos dados originais, tornando-os mais representativos para o modelo final. O presente trabalho atua no escopo de apresentar uma solução que automatize o processo de engenharia de características. A estratégia resultante da aplicação de técnicas de geração e seleção automatizadas de características em um arcabouço único é capaz de propiciar melhoria no desempenho de diferentes algoritmos aplicados a problemas de classificação quando comparados a um baseline inicial frente a quatro diferentes métricas. A solução apresentada neste trabalho provê a opção de automatização do arcabouço completo de engenharia de características, para o contexto específico de problemas de aprendizado do tipo classificação que utilizam dados tabulares |
id |
USP_cb57507bd61a5ffeee1465fe431a9f69 |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-18112021-212329 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Solução automatizada de engenharia de características para problemas de aprendizado de máquinaAutomated feature engineering solution for machine learning problemsAprendizado de máquinaAutoMLAutoMLEngenharia de CaracterísticasFeature engineeringMachine learningAtualmente, o aprendizado de máquina vem sendo amplamente utilizado para auxiliar em diferentes atividades, desde a sugestão de vídeos ou séries até no auxílio ao diagnóstico médico. O desenvolvimento de soluções envolvendo aprendizado de máquina envolve uma série de tarefas que incluem entendimento do problema, entendimento dos dados, preparação dos dados, modelagem, avaliação e verificação dos resultados. A construção de modelos de aprendizado de máquina de alta qualidade é, tipicamente, interativo e complexo, exigindo conhecimento específico e um grande esforço do executor. O aprendizado de máquina automatizado AutoML procura automatizar partes desse processo. Uma etapa importante do desenvolvimento desse tipo de solução é a engenharia de características que aplica transformações nos dados originais, tornando-os mais representativos para o modelo final. O presente trabalho atua no escopo de apresentar uma solução que automatize o processo de engenharia de características. A estratégia resultante da aplicação de técnicas de geração e seleção automatizadas de características em um arcabouço único é capaz de propiciar melhoria no desempenho de diferentes algoritmos aplicados a problemas de classificação quando comparados a um baseline inicial frente a quatro diferentes métricas. A solução apresentada neste trabalho provê a opção de automatização do arcabouço completo de engenharia de características, para o contexto específico de problemas de aprendizado do tipo classificação que utilizam dados tabularesNowadays, machine learning has been widely used to assist in different activities, from recommending videos or series to aiding in medical diagnosis. The development of solutions involving machine learning involves a series of tasks which include understanding the problem, understanding the data, preparing the data, modeling, evaluating, and verifying the results. Building high-quality machine learning models is iterative and complex, requiring specific knowledge and a great deal of effort from the performer. Automated machine learning (AutoML) seeks to automate parts of this process. An important step in the development of this type of solution is feature engineering that applies transformations to the original data, making them more representative for the final model. The present work presents an approach that automates the feature engineering process. The developed solution combines automated feature generation and selection techniques in a single framework. It was able to improve the performance of different algorithms applied to classification problems when compared with an initial baseline, considering four different metrics. The solution presented in this work provides the option of automating the complete feature engineering framework, for the specific context of classification problems that use tabular dataBiblioteca Digitais de Teses e Dissertações da USPDigiampietri, Luciano AntonioPrado, Fernando Favoretti Vital do2021-10-05info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/100/100131/tde-18112021-212329/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-10-09T13:16:04Zoai:teses.usp.br:tde-18112021-212329Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-10-09T13:16:04Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Solução automatizada de engenharia de características para problemas de aprendizado de máquina Automated feature engineering solution for machine learning problems |
title |
Solução automatizada de engenharia de características para problemas de aprendizado de máquina |
spellingShingle |
Solução automatizada de engenharia de características para problemas de aprendizado de máquina Prado, Fernando Favoretti Vital do Aprendizado de máquina AutoML AutoML Engenharia de Características Feature engineering Machine learning |
title_short |
Solução automatizada de engenharia de características para problemas de aprendizado de máquina |
title_full |
Solução automatizada de engenharia de características para problemas de aprendizado de máquina |
title_fullStr |
Solução automatizada de engenharia de características para problemas de aprendizado de máquina |
title_full_unstemmed |
Solução automatizada de engenharia de características para problemas de aprendizado de máquina |
title_sort |
Solução automatizada de engenharia de características para problemas de aprendizado de máquina |
author |
Prado, Fernando Favoretti Vital do |
author_facet |
Prado, Fernando Favoretti Vital do |
author_role |
author |
dc.contributor.none.fl_str_mv |
Digiampietri, Luciano Antonio |
dc.contributor.author.fl_str_mv |
Prado, Fernando Favoretti Vital do |
dc.subject.por.fl_str_mv |
Aprendizado de máquina AutoML AutoML Engenharia de Características Feature engineering Machine learning |
topic |
Aprendizado de máquina AutoML AutoML Engenharia de Características Feature engineering Machine learning |
description |
Atualmente, o aprendizado de máquina vem sendo amplamente utilizado para auxiliar em diferentes atividades, desde a sugestão de vídeos ou séries até no auxílio ao diagnóstico médico. O desenvolvimento de soluções envolvendo aprendizado de máquina envolve uma série de tarefas que incluem entendimento do problema, entendimento dos dados, preparação dos dados, modelagem, avaliação e verificação dos resultados. A construção de modelos de aprendizado de máquina de alta qualidade é, tipicamente, interativo e complexo, exigindo conhecimento específico e um grande esforço do executor. O aprendizado de máquina automatizado AutoML procura automatizar partes desse processo. Uma etapa importante do desenvolvimento desse tipo de solução é a engenharia de características que aplica transformações nos dados originais, tornando-os mais representativos para o modelo final. O presente trabalho atua no escopo de apresentar uma solução que automatize o processo de engenharia de características. A estratégia resultante da aplicação de técnicas de geração e seleção automatizadas de características em um arcabouço único é capaz de propiciar melhoria no desempenho de diferentes algoritmos aplicados a problemas de classificação quando comparados a um baseline inicial frente a quatro diferentes métricas. A solução apresentada neste trabalho provê a opção de automatização do arcabouço completo de engenharia de características, para o contexto específico de problemas de aprendizado do tipo classificação que utilizam dados tabulares |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021-10-05 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/100/100131/tde-18112021-212329/ |
url |
https://www.teses.usp.br/teses/disponiveis/100/100131/tde-18112021-212329/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815256518253084672 |