Big Data em contexto real de negócio

Detalhes bibliográficos
Autor(a) principal: Abreu, Ricardo Ascenção
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10451/54457
Resumo: Trabalho de projeto de mestrado, Matemática Aplicada à Economia e Gestão , 2022, Universidade de Lisboa, Faculdade de Ciências
id RCAP_3b5a0f00fbd9c8419118f1862ffbdc3d
oai_identifier_str oai:repositorio.ul.pt:10451/54457
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Big Data em contexto real de negócioBusiness Intelligence.Big DataGestão de InformaçãoAnálise de DadosRegressão LogísticaTrabalhos de projeto de mestrado - 2022Departamento de Estatística e Investigação OperacionalTrabalho de projeto de mestrado, Matemática Aplicada à Economia e Gestão , 2022, Universidade de Lisboa, Faculdade de CiênciasOs desafios constantes, as adversidades e a competição na consultoria faz com que as empresas da área, optem por estratégias eficientes de forma a diagnosticar problemas e a conceber soluções e estratégias de diferenciação que tragam valor acrescido às empresas para as quais fornecem serviços. No decorrer do estágio de seis meses, tive a oportunidade de conhecer de forma mais profunda, todo o fluxo de negócio de uma empresa de consultoria, desde o planeamento, estimativa e desenvolvimento de funções até às reuniões mais importantes de negócio. Durante este período, o meu trabalho focou-se na área de Customer Logistics para uma empresa multinacional, cujo objetivo é a consolidação de informação de armazéns, de expedição e de transporte das mercadorias desde os armazéns até ao cliente final. Dado o amplo âmbito de atuação da empresa, este projeto constituiu um interessante desafio de modernização tecnológica, sendo na história da empresa o primeiro repositório intersectorial, e fonte para muitos outros sistemas. Dada a sua importância, a gestão de uma panóplia de diferentes fontes de dados, a sua qualidade e a escalabilidade da arquitetura, foram fatores chave para o sucesso da iniciativa da empresa. Uma das áreas onde trabalhei, foi a da gestão da métrica de desempenho logístico, On-Time Delivery (OTD). A importância desta métrica para o negócio tem um interesse bastante particular, visto que qualquer deteção e correção de possíveis atrasos e inconformidades desde o empacotamento da encomenda à entrega da mesma. O OTD tem um impacto significativo não só na imagem da empresa junto do cliente final, como também para o negócio do mesmo, já que muitas das encomendas são de cariz médico ou farmacêutico. Este processo é constituído em três fases: a ordem/encomenda, o processamento e o transporte/entrega. Para cada uma delas a abordagem é semelhante. Para gerir as tarefas e/ou os problemas a solucionar, usou-se o software Jira. Para desenvolver estas tarefas usou-se o software Talend, a base de dados da Cloudera e a ferramenta HP Application Lifecycle Management (ALM) para os testes necessários para validar a qualidade dos dados. Como parte deste trabalho, foram estudados modelos de regressão logística múltipla, visto que a variável resposta (OTD) é uma variável binária, ou seja, pode tomar valores 0 ou 1. Através destes modelos podemos descrever a métrica de desempenho logístico por meio das variáveis associadas ao processo, como a urgência, a transportadora, entre outras. Para a criação destes modelos, optou-se por retirar as variáveis explicativas não significativas do modelo deste estudo para termos uma informação válida e 100% fidedigna. Foram realizadas análises das variáveis explicativas para melhor compreender se haveria ou não alguma relação entre as mesmas e a probabilidade de retenção. Após a obtenção do modelo final, foi feita uma análise aos resíduos para se aferir se de facto as variáveis respeitavam os pressupostos do modelo em estudo.The constant challenges, adversities and competition in consulting make companies in the area opt for efficient strategies to diagnose problems and devise solutions and differentiation strategies that bring added value to the companies they provide services to. During the six-month internship, I had the opportunity to get to know more thoroughly the entire business flow of a consulting firm, from planning, estimating and developing functions to the most important business meetings. During this period, my work focused on Customer Logistics for a multinational company, whose main goal is the consolidation of warehousing information, shipping, and transportation of goods to the end customer. Due to the broad scope of the company, this project built an interesting challenge for technological modernization, being in the company’s history the first intersectoral repository, and source for many other systems. Given its importance, managing a panoply of different data sources, their quality and the scalability of the architecture were key factors in the success of the company's initiative. One of the areas I worked on was the management of the logistics performance metric, OnTime Delivery (OTD). The importance of this metric to the business is of particular interest, as any detection and correction of possible delays and non-conformities since the packaging of the order to delivery. It has a significant impact not only on the image to the end customer, but also to the end user, as many of the orders are of a medical or pharmaceutical nature. This process consists of three phases: order, processing and shipping / delivery. For each of them the approach is similar. To manage the tasks and / or problems to be solved, Jira software was used. To perform these tasks, Talend software, Cloudera's database, and HP Application Lifecycle Management (ALM) tool were used for testing. As part of this work, multiple logistic regression models were studied, since the response variable (OTD) is a proportion, that is, it can take values between 0 and 1. Through these models we can describe the logistic performance metric through the variables associated with the process, such as the warehouse, the carrier, among others. For a better analysis of these models, I chose to remove non-significant explanatory variables from the model of this study to have a valid and 100% reliable information. Explanatory variables were analysed to better understand whether or not there was any relationship between them and the likelihood of retention. After obtaining the final model, a residual analysis was performed to determine if the variables actually respected the assumptions under study.Bermudez, Patrícia Cortés de Zea, 1966-Repositório da Universidade de LisboaAbreu, Ricardo Ascenção2022-09-14T09:56:13Z202220212022-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10451/54457enginfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-08T17:00:50Zoai:repositorio.ul.pt:10451/54457Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T22:05:17.026418Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Big Data em contexto real de negócio
title Big Data em contexto real de negócio
spellingShingle Big Data em contexto real de negócio
Abreu, Ricardo Ascenção
Business Intelligence.
Big Data
Gestão de Informação
Análise de Dados
Regressão Logística
Trabalhos de projeto de mestrado - 2022
Departamento de Estatística e Investigação Operacional
title_short Big Data em contexto real de negócio
title_full Big Data em contexto real de negócio
title_fullStr Big Data em contexto real de negócio
title_full_unstemmed Big Data em contexto real de negócio
title_sort Big Data em contexto real de negócio
author Abreu, Ricardo Ascenção
author_facet Abreu, Ricardo Ascenção
author_role author
dc.contributor.none.fl_str_mv Bermudez, Patrícia Cortés de Zea, 1966-
Repositório da Universidade de Lisboa
dc.contributor.author.fl_str_mv Abreu, Ricardo Ascenção
dc.subject.por.fl_str_mv Business Intelligence.
Big Data
Gestão de Informação
Análise de Dados
Regressão Logística
Trabalhos de projeto de mestrado - 2022
Departamento de Estatística e Investigação Operacional
topic Business Intelligence.
Big Data
Gestão de Informação
Análise de Dados
Regressão Logística
Trabalhos de projeto de mestrado - 2022
Departamento de Estatística e Investigação Operacional
description Trabalho de projeto de mestrado, Matemática Aplicada à Economia e Gestão , 2022, Universidade de Lisboa, Faculdade de Ciências
publishDate 2021
dc.date.none.fl_str_mv 2021
2022-09-14T09:56:13Z
2022
2022-01-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10451/54457
url http://hdl.handle.net/10451/54457
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134604407341056