Geração Automática de Features para Modelagem Preditiva - Predição de Empresas Brasileiras de Alto Crescimento

Detalhes bibliográficos
Autor(a) principal: Pelison, Luis Felipe
Data de Publicação: 2018
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFSC
Texto Completo: https://repositorio.ufsc.br/handle/123456789/200013
Resumo: TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Engenharia de Controle e Automação.
id UFSC_7a50f31b1d796c758f0f667fa311a344
oai_identifier_str oai:repositorio.ufsc.br:123456789/200013
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str 2373
spelling Geração Automática de Features para Modelagem Preditiva - Predição de Empresas Brasileiras de Alto CrescimentoGeração de Features Automáticas. Engenharia de Features. Modelo Preditivo. Aprendizado de Máquina Automático. Inteligência Artificial. Empresas de Alto Crescimento.Automated Feature Generation. Automated Machine Learning. Feature Engi- neering. Deep Feature Synthesis. Artificial Intelligence. High-Growth Firms.TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Engenharia de Controle e Automação.A Neoway Business Solutions, empresa brasileira focada em inteligência de negócios a partir de um grande volume de dados, coletados em mais de 3.000 fontes públicas, atua em um mercado Business to Business (B2B) para prospectar e entender o mercado ou prevenir perdas dos clientes. Nesse contexto, a área interna de Analytics é responsável por gerar inteligência em cima dos mais variados dados. O projeto desenvolvido, dentro da área de Analytics, visa gerar inteligência a partir de dados relacionados à natureza e localidade das empresas, a fim de predizer se o crescimento médio dos próximos três anos será superior a 17%, para qualquer empresa ativa do Brasil que possua 10 ou mais funcionários. Aliado à inteligência, o projeto tem como objetivo validar uma abordagem muito recente no mundo de aprendizado de máquina e ciência de dados: a geração automática de features. Com a geração automática de features, os modelos inteligentes podem ser rapidamente implementados, com uma redução de até 5x no tempo de desenvolvimento, comparado ao pipeline de ciência de dados padrão. Técnicas de geração automática de features foram estudadas e uma foi escolhida para ser utilizada. Base de dados relacionais foram utilizadas para a geração automática de features a partir da teoria chamada Deep Feature Synthesis. Com essas features, alguns modelos foram criados e comparados entre si. Por fim, o melhor modelo preditivo (com features automáticas) foi comparado com outro, gerado por um cientista de dados especialista no domínio, e atingiu resultados muito semelhantes.The Neoway Business Solutions is a brazilian company focused in business intelligence for big data. With more than 3.000 public data sources, the company operates in a Business-to- Business (B2B) marketplace to prospect and understand the customer’s market or prevent customer losses. At this scenario, the Neoway’s Analytics team is responsible for generating intelligence on the most varied data. The project developed aims to generate knowledge from data related to the firmographics, in order to predict wich brazilian company with 10 or more employees will be a High-Growth Firm. Also, the projects aims to validate a very recent approach in the Data Science world: the Automated Feature Generation. With this approach, smart models can be raplidly deployed, with up to a 5x reduction in development time compared to standard Data Science pipeline. Some techniques about Automated Feature Generation have been studied and one chosen to be used. Relational databases were used to generate the automated features from the Deep Feature Synthesis theory. With these new features, some models were created and compared to each other. Lastly, the best predictive model generated (with automated features) was compared to another, builded by a senior data scientist, and have gotten results very similar.Florianópolis, SC.Hubner, Jomi FredUniversidade Federal de Santa CatarinaPelison, Luis Felipe2019-08-21T19:24:31Z2019-08-21T19:24:31Z2018info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfhttps://repositorio.ufsc.br/handle/123456789/200013info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSC2019-08-21T19:24:32Zoai:repositorio.ufsc.br:123456789/200013Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732019-08-21T19:24:32Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv Geração Automática de Features para Modelagem Preditiva - Predição de Empresas Brasileiras de Alto Crescimento
title Geração Automática de Features para Modelagem Preditiva - Predição de Empresas Brasileiras de Alto Crescimento
spellingShingle Geração Automática de Features para Modelagem Preditiva - Predição de Empresas Brasileiras de Alto Crescimento
Pelison, Luis Felipe
Geração de Features Automáticas. Engenharia de Features. Modelo Preditivo. Aprendizado de Máquina Automático. Inteligência Artificial. Empresas de Alto Crescimento.
Automated Feature Generation. Automated Machine Learning. Feature Engi- neering. Deep Feature Synthesis. Artificial Intelligence. High-Growth Firms.
title_short Geração Automática de Features para Modelagem Preditiva - Predição de Empresas Brasileiras de Alto Crescimento
title_full Geração Automática de Features para Modelagem Preditiva - Predição de Empresas Brasileiras de Alto Crescimento
title_fullStr Geração Automática de Features para Modelagem Preditiva - Predição de Empresas Brasileiras de Alto Crescimento
title_full_unstemmed Geração Automática de Features para Modelagem Preditiva - Predição de Empresas Brasileiras de Alto Crescimento
title_sort Geração Automática de Features para Modelagem Preditiva - Predição de Empresas Brasileiras de Alto Crescimento
author Pelison, Luis Felipe
author_facet Pelison, Luis Felipe
author_role author
dc.contributor.none.fl_str_mv Hubner, Jomi Fred
Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv Pelison, Luis Felipe
dc.subject.por.fl_str_mv Geração de Features Automáticas. Engenharia de Features. Modelo Preditivo. Aprendizado de Máquina Automático. Inteligência Artificial. Empresas de Alto Crescimento.
Automated Feature Generation. Automated Machine Learning. Feature Engi- neering. Deep Feature Synthesis. Artificial Intelligence. High-Growth Firms.
topic Geração de Features Automáticas. Engenharia de Features. Modelo Preditivo. Aprendizado de Máquina Automático. Inteligência Artificial. Empresas de Alto Crescimento.
Automated Feature Generation. Automated Machine Learning. Feature Engi- neering. Deep Feature Synthesis. Artificial Intelligence. High-Growth Firms.
description TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Engenharia de Controle e Automação.
publishDate 2018
dc.date.none.fl_str_mv 2018
2019-08-21T19:24:31Z
2019-08-21T19:24:31Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufsc.br/handle/123456789/200013
url https://repositorio.ufsc.br/handle/123456789/200013
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Florianópolis, SC.
publisher.none.fl_str_mv Florianópolis, SC.
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv
_version_ 1808652316917628928