Geração Automática de Features para Modelagem Preditiva - Predição de Empresas Brasileiras de Alto Crescimento
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSC |
Texto Completo: | https://repositorio.ufsc.br/handle/123456789/200013 |
Resumo: | TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Engenharia de Controle e Automação. |
id |
UFSC_7a50f31b1d796c758f0f667fa311a344 |
---|---|
oai_identifier_str |
oai:repositorio.ufsc.br:123456789/200013 |
network_acronym_str |
UFSC |
network_name_str |
Repositório Institucional da UFSC |
repository_id_str |
2373 |
spelling |
Geração Automática de Features para Modelagem Preditiva - Predição de Empresas Brasileiras de Alto CrescimentoGeração de Features Automáticas. Engenharia de Features. Modelo Preditivo. Aprendizado de Máquina Automático. Inteligência Artificial. Empresas de Alto Crescimento.Automated Feature Generation. Automated Machine Learning. Feature Engi- neering. Deep Feature Synthesis. Artificial Intelligence. High-Growth Firms.TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Engenharia de Controle e Automação.A Neoway Business Solutions, empresa brasileira focada em inteligência de negócios a partir de um grande volume de dados, coletados em mais de 3.000 fontes públicas, atua em um mercado Business to Business (B2B) para prospectar e entender o mercado ou prevenir perdas dos clientes. Nesse contexto, a área interna de Analytics é responsável por gerar inteligência em cima dos mais variados dados. O projeto desenvolvido, dentro da área de Analytics, visa gerar inteligência a partir de dados relacionados à natureza e localidade das empresas, a fim de predizer se o crescimento médio dos próximos três anos será superior a 17%, para qualquer empresa ativa do Brasil que possua 10 ou mais funcionários. Aliado à inteligência, o projeto tem como objetivo validar uma abordagem muito recente no mundo de aprendizado de máquina e ciência de dados: a geração automática de features. Com a geração automática de features, os modelos inteligentes podem ser rapidamente implementados, com uma redução de até 5x no tempo de desenvolvimento, comparado ao pipeline de ciência de dados padrão. Técnicas de geração automática de features foram estudadas e uma foi escolhida para ser utilizada. Base de dados relacionais foram utilizadas para a geração automática de features a partir da teoria chamada Deep Feature Synthesis. Com essas features, alguns modelos foram criados e comparados entre si. Por fim, o melhor modelo preditivo (com features automáticas) foi comparado com outro, gerado por um cientista de dados especialista no domínio, e atingiu resultados muito semelhantes.The Neoway Business Solutions is a brazilian company focused in business intelligence for big data. With more than 3.000 public data sources, the company operates in a Business-to- Business (B2B) marketplace to prospect and understand the customer’s market or prevent customer losses. At this scenario, the Neoway’s Analytics team is responsible for generating intelligence on the most varied data. The project developed aims to generate knowledge from data related to the firmographics, in order to predict wich brazilian company with 10 or more employees will be a High-Growth Firm. Also, the projects aims to validate a very recent approach in the Data Science world: the Automated Feature Generation. With this approach, smart models can be raplidly deployed, with up to a 5x reduction in development time compared to standard Data Science pipeline. Some techniques about Automated Feature Generation have been studied and one chosen to be used. Relational databases were used to generate the automated features from the Deep Feature Synthesis theory. With these new features, some models were created and compared to each other. Lastly, the best predictive model generated (with automated features) was compared to another, builded by a senior data scientist, and have gotten results very similar.Florianópolis, SC.Hubner, Jomi FredUniversidade Federal de Santa CatarinaPelison, Luis Felipe2019-08-21T19:24:31Z2019-08-21T19:24:31Z2018info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfhttps://repositorio.ufsc.br/handle/123456789/200013info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSC2019-08-21T19:24:32Zoai:repositorio.ufsc.br:123456789/200013Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732019-08-21T19:24:32Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false |
dc.title.none.fl_str_mv |
Geração Automática de Features para Modelagem Preditiva - Predição de Empresas Brasileiras de Alto Crescimento |
title |
Geração Automática de Features para Modelagem Preditiva - Predição de Empresas Brasileiras de Alto Crescimento |
spellingShingle |
Geração Automática de Features para Modelagem Preditiva - Predição de Empresas Brasileiras de Alto Crescimento Pelison, Luis Felipe Geração de Features Automáticas. Engenharia de Features. Modelo Preditivo. Aprendizado de Máquina Automático. Inteligência Artificial. Empresas de Alto Crescimento. Automated Feature Generation. Automated Machine Learning. Feature Engi- neering. Deep Feature Synthesis. Artificial Intelligence. High-Growth Firms. |
title_short |
Geração Automática de Features para Modelagem Preditiva - Predição de Empresas Brasileiras de Alto Crescimento |
title_full |
Geração Automática de Features para Modelagem Preditiva - Predição de Empresas Brasileiras de Alto Crescimento |
title_fullStr |
Geração Automática de Features para Modelagem Preditiva - Predição de Empresas Brasileiras de Alto Crescimento |
title_full_unstemmed |
Geração Automática de Features para Modelagem Preditiva - Predição de Empresas Brasileiras de Alto Crescimento |
title_sort |
Geração Automática de Features para Modelagem Preditiva - Predição de Empresas Brasileiras de Alto Crescimento |
author |
Pelison, Luis Felipe |
author_facet |
Pelison, Luis Felipe |
author_role |
author |
dc.contributor.none.fl_str_mv |
Hubner, Jomi Fred Universidade Federal de Santa Catarina |
dc.contributor.author.fl_str_mv |
Pelison, Luis Felipe |
dc.subject.por.fl_str_mv |
Geração de Features Automáticas. Engenharia de Features. Modelo Preditivo. Aprendizado de Máquina Automático. Inteligência Artificial. Empresas de Alto Crescimento. Automated Feature Generation. Automated Machine Learning. Feature Engi- neering. Deep Feature Synthesis. Artificial Intelligence. High-Growth Firms. |
topic |
Geração de Features Automáticas. Engenharia de Features. Modelo Preditivo. Aprendizado de Máquina Automático. Inteligência Artificial. Empresas de Alto Crescimento. Automated Feature Generation. Automated Machine Learning. Feature Engi- neering. Deep Feature Synthesis. Artificial Intelligence. High-Growth Firms. |
description |
TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Engenharia de Controle e Automação. |
publishDate |
2018 |
dc.date.none.fl_str_mv |
2018 2019-08-21T19:24:31Z 2019-08-21T19:24:31Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufsc.br/handle/123456789/200013 |
url |
https://repositorio.ufsc.br/handle/123456789/200013 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Florianópolis, SC. |
publisher.none.fl_str_mv |
Florianópolis, SC. |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSC instname:Universidade Federal de Santa Catarina (UFSC) instacron:UFSC |
instname_str |
Universidade Federal de Santa Catarina (UFSC) |
instacron_str |
UFSC |
institution |
UFSC |
reponame_str |
Repositório Institucional da UFSC |
collection |
Repositório Institucional da UFSC |
repository.name.fl_str_mv |
Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC) |
repository.mail.fl_str_mv |
|
_version_ |
1808652316917628928 |