Como otimizar análises preditivas utilizando um data lake

Detalhes bibliográficos
Autor(a) principal: Fernandes, Fernanda da Silva
Data de Publicação: 2022
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da Universidade Federal Fluminense (RIUFF)
Texto Completo: http://app.uff.br/riuff/handle/1/28265
Resumo: Quando o assunto é análise de dados, é comum encontrar o termo big data. Hoje em dia gera-se uma grande quantidade de dados, numa velocidade surpreendente e em uma variedade inumerável. Analisar esses conjuntos de informações torna-se algo trabalhoso sem as ferramentas corretas. O conceito de um data lake é frequentemente adotado como solução nesse cenário. Ao utilizar este conceito, algumas vantagens são observadas: o armazenamento dos dados, a facilidade de acesso a qualquer um deles e escalabilidade de processamento dos mesmos. Sendo assim, é possível aplicar analises preditivas cada vez mais robustas, pois todos os dados estão organizados num mesmo repositório que permite um processamento adequado. Neste projeto, será demonstrado como implementar um data lake utilizando a solução do Azure Microsoft evidenciando suas vantagens. Além disso, serão aplicadas modelagens de aprendizado de máquinas a fim de utilizar uma análise preditiva sobre a contratação de um certificado de depósito bancário (CDB), que será objeto de estudo deste projeto. Logo, identificou-se que há uma maior simplicidade ao comparar e executar modelagens de aprendizado de máquinas otimizando uma análise preditiva ao adotar essa solução.
id UFF-2_504981fddeeb1511a81118d37ad04c59
oai_identifier_str oai:app.uff.br:1/28265
network_acronym_str UFF-2
network_name_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository_id_str 2120
spelling Como otimizar análises preditivas utilizando um data lakeData lakeAprendizado de máquinasAnálise preditivaBig dataArmazenamento de dadosData WarehousingMicrosoftQuando o assunto é análise de dados, é comum encontrar o termo big data. Hoje em dia gera-se uma grande quantidade de dados, numa velocidade surpreendente e em uma variedade inumerável. Analisar esses conjuntos de informações torna-se algo trabalhoso sem as ferramentas corretas. O conceito de um data lake é frequentemente adotado como solução nesse cenário. Ao utilizar este conceito, algumas vantagens são observadas: o armazenamento dos dados, a facilidade de acesso a qualquer um deles e escalabilidade de processamento dos mesmos. Sendo assim, é possível aplicar analises preditivas cada vez mais robustas, pois todos os dados estão organizados num mesmo repositório que permite um processamento adequado. Neste projeto, será demonstrado como implementar um data lake utilizando a solução do Azure Microsoft evidenciando suas vantagens. Além disso, serão aplicadas modelagens de aprendizado de máquinas a fim de utilizar uma análise preditiva sobre a contratação de um certificado de depósito bancário (CDB), que será objeto de estudo deste projeto. Logo, identificou-se que há uma maior simplicidade ao comparar e executar modelagens de aprendizado de máquinas otimizando uma análise preditiva ao adotar essa solução.56 f.Pinto, Douglas RodriguesPinto, Douglas RodriguesKubrusly, Jessica QuintanilhaYaginuma, Karina YurikoFernandes, Fernanda da Silva2023-03-17T20:31:53Z2023-03-17T20:31:53Z2022info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfFERNANDES, Fernanda da Silva. Como otimizar análises preditivas utilizando um data lake. 2022. 56 f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2022.http://app.uff.br/riuff/handle/1/28265CC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2023-03-17T20:31:56Zoai:app.uff.br:1/28265Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202023-03-17T20:31:56Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false
dc.title.none.fl_str_mv Como otimizar análises preditivas utilizando um data lake
title Como otimizar análises preditivas utilizando um data lake
spellingShingle Como otimizar análises preditivas utilizando um data lake
Fernandes, Fernanda da Silva
Data lake
Aprendizado de máquinas
Análise preditiva
Big data
Armazenamento de dados
Data Warehousing
Microsoft
title_short Como otimizar análises preditivas utilizando um data lake
title_full Como otimizar análises preditivas utilizando um data lake
title_fullStr Como otimizar análises preditivas utilizando um data lake
title_full_unstemmed Como otimizar análises preditivas utilizando um data lake
title_sort Como otimizar análises preditivas utilizando um data lake
author Fernandes, Fernanda da Silva
author_facet Fernandes, Fernanda da Silva
author_role author
dc.contributor.none.fl_str_mv Pinto, Douglas Rodrigues
Pinto, Douglas Rodrigues
Kubrusly, Jessica Quintanilha
Yaginuma, Karina Yuriko
dc.contributor.author.fl_str_mv Fernandes, Fernanda da Silva
dc.subject.por.fl_str_mv Data lake
Aprendizado de máquinas
Análise preditiva
Big data
Armazenamento de dados
Data Warehousing
Microsoft
topic Data lake
Aprendizado de máquinas
Análise preditiva
Big data
Armazenamento de dados
Data Warehousing
Microsoft
description Quando o assunto é análise de dados, é comum encontrar o termo big data. Hoje em dia gera-se uma grande quantidade de dados, numa velocidade surpreendente e em uma variedade inumerável. Analisar esses conjuntos de informações torna-se algo trabalhoso sem as ferramentas corretas. O conceito de um data lake é frequentemente adotado como solução nesse cenário. Ao utilizar este conceito, algumas vantagens são observadas: o armazenamento dos dados, a facilidade de acesso a qualquer um deles e escalabilidade de processamento dos mesmos. Sendo assim, é possível aplicar analises preditivas cada vez mais robustas, pois todos os dados estão organizados num mesmo repositório que permite um processamento adequado. Neste projeto, será demonstrado como implementar um data lake utilizando a solução do Azure Microsoft evidenciando suas vantagens. Além disso, serão aplicadas modelagens de aprendizado de máquinas a fim de utilizar uma análise preditiva sobre a contratação de um certificado de depósito bancário (CDB), que será objeto de estudo deste projeto. Logo, identificou-se que há uma maior simplicidade ao comparar e executar modelagens de aprendizado de máquinas otimizando uma análise preditiva ao adotar essa solução.
publishDate 2022
dc.date.none.fl_str_mv 2022
2023-03-17T20:31:53Z
2023-03-17T20:31:53Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv FERNANDES, Fernanda da Silva. Como otimizar análises preditivas utilizando um data lake. 2022. 56 f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2022.
http://app.uff.br/riuff/handle/1/28265
identifier_str_mv FERNANDES, Fernanda da Silva. Como otimizar análises preditivas utilizando um data lake. 2022. 56 f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2022.
url http://app.uff.br/riuff/handle/1/28265
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv CC-BY-SA
info:eu-repo/semantics/openAccess
rights_invalid_str_mv CC-BY-SA
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)
instname:Universidade Federal Fluminense (UFF)
instacron:UFF
instname_str Universidade Federal Fluminense (UFF)
instacron_str UFF
institution UFF
reponame_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
collection Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository.name.fl_str_mv Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)
repository.mail.fl_str_mv riuff@id.uff.br
_version_ 1807838770835226624