Como otimizar análises preditivas utilizando um data lake
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
Texto Completo: | http://app.uff.br/riuff/handle/1/28265 |
Resumo: | Quando o assunto é análise de dados, é comum encontrar o termo big data. Hoje em dia gera-se uma grande quantidade de dados, numa velocidade surpreendente e em uma variedade inumerável. Analisar esses conjuntos de informações torna-se algo trabalhoso sem as ferramentas corretas. O conceito de um data lake é frequentemente adotado como solução nesse cenário. Ao utilizar este conceito, algumas vantagens são observadas: o armazenamento dos dados, a facilidade de acesso a qualquer um deles e escalabilidade de processamento dos mesmos. Sendo assim, é possível aplicar analises preditivas cada vez mais robustas, pois todos os dados estão organizados num mesmo repositório que permite um processamento adequado. Neste projeto, será demonstrado como implementar um data lake utilizando a solução do Azure Microsoft evidenciando suas vantagens. Além disso, serão aplicadas modelagens de aprendizado de máquinas a fim de utilizar uma análise preditiva sobre a contratação de um certificado de depósito bancário (CDB), que será objeto de estudo deste projeto. Logo, identificou-se que há uma maior simplicidade ao comparar e executar modelagens de aprendizado de máquinas otimizando uma análise preditiva ao adotar essa solução. |
id |
UFF-2_504981fddeeb1511a81118d37ad04c59 |
---|---|
oai_identifier_str |
oai:app.uff.br:1/28265 |
network_acronym_str |
UFF-2 |
network_name_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
repository_id_str |
2120 |
spelling |
Como otimizar análises preditivas utilizando um data lakeData lakeAprendizado de máquinasAnálise preditivaBig dataArmazenamento de dadosData WarehousingMicrosoftQuando o assunto é análise de dados, é comum encontrar o termo big data. Hoje em dia gera-se uma grande quantidade de dados, numa velocidade surpreendente e em uma variedade inumerável. Analisar esses conjuntos de informações torna-se algo trabalhoso sem as ferramentas corretas. O conceito de um data lake é frequentemente adotado como solução nesse cenário. Ao utilizar este conceito, algumas vantagens são observadas: o armazenamento dos dados, a facilidade de acesso a qualquer um deles e escalabilidade de processamento dos mesmos. Sendo assim, é possível aplicar analises preditivas cada vez mais robustas, pois todos os dados estão organizados num mesmo repositório que permite um processamento adequado. Neste projeto, será demonstrado como implementar um data lake utilizando a solução do Azure Microsoft evidenciando suas vantagens. Além disso, serão aplicadas modelagens de aprendizado de máquinas a fim de utilizar uma análise preditiva sobre a contratação de um certificado de depósito bancário (CDB), que será objeto de estudo deste projeto. Logo, identificou-se que há uma maior simplicidade ao comparar e executar modelagens de aprendizado de máquinas otimizando uma análise preditiva ao adotar essa solução.56 f.Pinto, Douglas RodriguesPinto, Douglas RodriguesKubrusly, Jessica QuintanilhaYaginuma, Karina YurikoFernandes, Fernanda da Silva2023-03-17T20:31:53Z2023-03-17T20:31:53Z2022info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfFERNANDES, Fernanda da Silva. Como otimizar análises preditivas utilizando um data lake. 2022. 56 f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2022.http://app.uff.br/riuff/handle/1/28265CC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2023-03-17T20:31:56Zoai:app.uff.br:1/28265Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202023-03-17T20:31:56Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false |
dc.title.none.fl_str_mv |
Como otimizar análises preditivas utilizando um data lake |
title |
Como otimizar análises preditivas utilizando um data lake |
spellingShingle |
Como otimizar análises preditivas utilizando um data lake Fernandes, Fernanda da Silva Data lake Aprendizado de máquinas Análise preditiva Big data Armazenamento de dados Data Warehousing Microsoft |
title_short |
Como otimizar análises preditivas utilizando um data lake |
title_full |
Como otimizar análises preditivas utilizando um data lake |
title_fullStr |
Como otimizar análises preditivas utilizando um data lake |
title_full_unstemmed |
Como otimizar análises preditivas utilizando um data lake |
title_sort |
Como otimizar análises preditivas utilizando um data lake |
author |
Fernandes, Fernanda da Silva |
author_facet |
Fernandes, Fernanda da Silva |
author_role |
author |
dc.contributor.none.fl_str_mv |
Pinto, Douglas Rodrigues Pinto, Douglas Rodrigues Kubrusly, Jessica Quintanilha Yaginuma, Karina Yuriko |
dc.contributor.author.fl_str_mv |
Fernandes, Fernanda da Silva |
dc.subject.por.fl_str_mv |
Data lake Aprendizado de máquinas Análise preditiva Big data Armazenamento de dados Data Warehousing Microsoft |
topic |
Data lake Aprendizado de máquinas Análise preditiva Big data Armazenamento de dados Data Warehousing Microsoft |
description |
Quando o assunto é análise de dados, é comum encontrar o termo big data. Hoje em dia gera-se uma grande quantidade de dados, numa velocidade surpreendente e em uma variedade inumerável. Analisar esses conjuntos de informações torna-se algo trabalhoso sem as ferramentas corretas. O conceito de um data lake é frequentemente adotado como solução nesse cenário. Ao utilizar este conceito, algumas vantagens são observadas: o armazenamento dos dados, a facilidade de acesso a qualquer um deles e escalabilidade de processamento dos mesmos. Sendo assim, é possível aplicar analises preditivas cada vez mais robustas, pois todos os dados estão organizados num mesmo repositório que permite um processamento adequado. Neste projeto, será demonstrado como implementar um data lake utilizando a solução do Azure Microsoft evidenciando suas vantagens. Além disso, serão aplicadas modelagens de aprendizado de máquinas a fim de utilizar uma análise preditiva sobre a contratação de um certificado de depósito bancário (CDB), que será objeto de estudo deste projeto. Logo, identificou-se que há uma maior simplicidade ao comparar e executar modelagens de aprendizado de máquinas otimizando uma análise preditiva ao adotar essa solução. |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022 2023-03-17T20:31:53Z 2023-03-17T20:31:53Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
FERNANDES, Fernanda da Silva. Como otimizar análises preditivas utilizando um data lake. 2022. 56 f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2022. http://app.uff.br/riuff/handle/1/28265 |
identifier_str_mv |
FERNANDES, Fernanda da Silva. Como otimizar análises preditivas utilizando um data lake. 2022. 56 f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2022. |
url |
http://app.uff.br/riuff/handle/1/28265 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
CC-BY-SA info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
CC-BY-SA |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF) instname:Universidade Federal Fluminense (UFF) instacron:UFF |
instname_str |
Universidade Federal Fluminense (UFF) |
instacron_str |
UFF |
institution |
UFF |
reponame_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
collection |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF) |
repository.mail.fl_str_mv |
riuff@id.uff.br |
_version_ |
1807838770835226624 |