Big Data em contexto real de negócio
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10451/54457 |
Resumo: | Trabalho de projeto de mestrado, Matemática Aplicada à Economia e Gestão , 2022, Universidade de Lisboa, Faculdade de Ciências |
id |
RCAP_3b5a0f00fbd9c8419118f1862ffbdc3d |
---|---|
oai_identifier_str |
oai:repositorio.ul.pt:10451/54457 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Big Data em contexto real de negócioBusiness Intelligence.Big DataGestão de InformaçãoAnálise de DadosRegressão LogísticaTrabalhos de projeto de mestrado - 2022Departamento de Estatística e Investigação OperacionalTrabalho de projeto de mestrado, Matemática Aplicada à Economia e Gestão , 2022, Universidade de Lisboa, Faculdade de CiênciasOs desafios constantes, as adversidades e a competição na consultoria faz com que as empresas da área, optem por estratégias eficientes de forma a diagnosticar problemas e a conceber soluções e estratégias de diferenciação que tragam valor acrescido às empresas para as quais fornecem serviços. No decorrer do estágio de seis meses, tive a oportunidade de conhecer de forma mais profunda, todo o fluxo de negócio de uma empresa de consultoria, desde o planeamento, estimativa e desenvolvimento de funções até às reuniões mais importantes de negócio. Durante este período, o meu trabalho focou-se na área de Customer Logistics para uma empresa multinacional, cujo objetivo é a consolidação de informação de armazéns, de expedição e de transporte das mercadorias desde os armazéns até ao cliente final. Dado o amplo âmbito de atuação da empresa, este projeto constituiu um interessante desafio de modernização tecnológica, sendo na história da empresa o primeiro repositório intersectorial, e fonte para muitos outros sistemas. Dada a sua importância, a gestão de uma panóplia de diferentes fontes de dados, a sua qualidade e a escalabilidade da arquitetura, foram fatores chave para o sucesso da iniciativa da empresa. Uma das áreas onde trabalhei, foi a da gestão da métrica de desempenho logístico, On-Time Delivery (OTD). A importância desta métrica para o negócio tem um interesse bastante particular, visto que qualquer deteção e correção de possíveis atrasos e inconformidades desde o empacotamento da encomenda à entrega da mesma. O OTD tem um impacto significativo não só na imagem da empresa junto do cliente final, como também para o negócio do mesmo, já que muitas das encomendas são de cariz médico ou farmacêutico. Este processo é constituído em três fases: a ordem/encomenda, o processamento e o transporte/entrega. Para cada uma delas a abordagem é semelhante. Para gerir as tarefas e/ou os problemas a solucionar, usou-se o software Jira. Para desenvolver estas tarefas usou-se o software Talend, a base de dados da Cloudera e a ferramenta HP Application Lifecycle Management (ALM) para os testes necessários para validar a qualidade dos dados. Como parte deste trabalho, foram estudados modelos de regressão logística múltipla, visto que a variável resposta (OTD) é uma variável binária, ou seja, pode tomar valores 0 ou 1. Através destes modelos podemos descrever a métrica de desempenho logístico por meio das variáveis associadas ao processo, como a urgência, a transportadora, entre outras. Para a criação destes modelos, optou-se por retirar as variáveis explicativas não significativas do modelo deste estudo para termos uma informação válida e 100% fidedigna. Foram realizadas análises das variáveis explicativas para melhor compreender se haveria ou não alguma relação entre as mesmas e a probabilidade de retenção. Após a obtenção do modelo final, foi feita uma análise aos resíduos para se aferir se de facto as variáveis respeitavam os pressupostos do modelo em estudo.The constant challenges, adversities and competition in consulting make companies in the area opt for efficient strategies to diagnose problems and devise solutions and differentiation strategies that bring added value to the companies they provide services to. During the six-month internship, I had the opportunity to get to know more thoroughly the entire business flow of a consulting firm, from planning, estimating and developing functions to the most important business meetings. During this period, my work focused on Customer Logistics for a multinational company, whose main goal is the consolidation of warehousing information, shipping, and transportation of goods to the end customer. Due to the broad scope of the company, this project built an interesting challenge for technological modernization, being in the company’s history the first intersectoral repository, and source for many other systems. Given its importance, managing a panoply of different data sources, their quality and the scalability of the architecture were key factors in the success of the company's initiative. One of the areas I worked on was the management of the logistics performance metric, OnTime Delivery (OTD). The importance of this metric to the business is of particular interest, as any detection and correction of possible delays and non-conformities since the packaging of the order to delivery. It has a significant impact not only on the image to the end customer, but also to the end user, as many of the orders are of a medical or pharmaceutical nature. This process consists of three phases: order, processing and shipping / delivery. For each of them the approach is similar. To manage the tasks and / or problems to be solved, Jira software was used. To perform these tasks, Talend software, Cloudera's database, and HP Application Lifecycle Management (ALM) tool were used for testing. As part of this work, multiple logistic regression models were studied, since the response variable (OTD) is a proportion, that is, it can take values between 0 and 1. Through these models we can describe the logistic performance metric through the variables associated with the process, such as the warehouse, the carrier, among others. For a better analysis of these models, I chose to remove non-significant explanatory variables from the model of this study to have a valid and 100% reliable information. Explanatory variables were analysed to better understand whether or not there was any relationship between them and the likelihood of retention. After obtaining the final model, a residual analysis was performed to determine if the variables actually respected the assumptions under study.Bermudez, Patrícia Cortés de Zea, 1966-Repositório da Universidade de LisboaAbreu, Ricardo Ascenção2022-09-14T09:56:13Z202220212022-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10451/54457enginfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-08T17:00:50Zoai:repositorio.ul.pt:10451/54457Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T22:05:17.026418Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Big Data em contexto real de negócio |
title |
Big Data em contexto real de negócio |
spellingShingle |
Big Data em contexto real de negócio Abreu, Ricardo Ascenção Business Intelligence. Big Data Gestão de Informação Análise de Dados Regressão Logística Trabalhos de projeto de mestrado - 2022 Departamento de Estatística e Investigação Operacional |
title_short |
Big Data em contexto real de negócio |
title_full |
Big Data em contexto real de negócio |
title_fullStr |
Big Data em contexto real de negócio |
title_full_unstemmed |
Big Data em contexto real de negócio |
title_sort |
Big Data em contexto real de negócio |
author |
Abreu, Ricardo Ascenção |
author_facet |
Abreu, Ricardo Ascenção |
author_role |
author |
dc.contributor.none.fl_str_mv |
Bermudez, Patrícia Cortés de Zea, 1966- Repositório da Universidade de Lisboa |
dc.contributor.author.fl_str_mv |
Abreu, Ricardo Ascenção |
dc.subject.por.fl_str_mv |
Business Intelligence. Big Data Gestão de Informação Análise de Dados Regressão Logística Trabalhos de projeto de mestrado - 2022 Departamento de Estatística e Investigação Operacional |
topic |
Business Intelligence. Big Data Gestão de Informação Análise de Dados Regressão Logística Trabalhos de projeto de mestrado - 2022 Departamento de Estatística e Investigação Operacional |
description |
Trabalho de projeto de mestrado, Matemática Aplicada à Economia e Gestão , 2022, Universidade de Lisboa, Faculdade de Ciências |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021 2022-09-14T09:56:13Z 2022 2022-01-01T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10451/54457 |
url |
http://hdl.handle.net/10451/54457 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799134604407341056 |