Materialização à medida de vistas multidimensionais de dados

Detalhes bibliográficos
Autor(a) principal: Duarte, Ana Sofia da Silva
Data de Publicação: 2012
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/1822/27823
Resumo: Dissertação de mestrado em Engenharia de Informática
id RCAP_db2bbdad15ad693d90c655a5fc480e2d
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/27823
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Materialização à medida de vistas multidimensionais de dadosSistemas de data warehousingProcessamento analítico de dadosOLAPSessões OLAPCadeias de markovClasses de equivalênciaAssinaturas OLAPData warehousing systemsOn-line analytical processingOLAP SessionsMarkov chainsEquivalence classesOLAP signatures681.3:658.0658.0:681.3Dissertação de mestrado em Engenharia de InformáticaCom o emergir da era da informação foram muitas as empresas que recorreram a data warehouses para armazenar a crescente quantidade de dados que dispõem sobre os seus negócios. Com essa evolução dos volumes de dados surge também a necessidade da sua melhor exploração para que sejam úteis de alguma forma nas avaliações e decisões sobre o negócio. Os sistemas de processamento analítico (ou OLAP – On-Line Analytical Processing) vêm dar resposta a essas necessidades de auxiliar o analista de negócio na exploração e avaliação dos dados, dotando-o de autonomia de exploração, disponibilizando-lhe uma estrutura multiperspetiva e de rápida resposta. Contudo para que o acesso a essa informação seja rápido existe a necessidade de fazer a materialização de estruturas multidimensionais com esses dados já pré-calculados, reduzindo o tempo de interrogação ao tempo de leitura da resposta e evitando o tempo de processamento de cada query. A materialização completa dos dados necessários torna-se na prática impraticável dada a volumetria de dados a que os sistemas estão sujeitos e ao tempo de processamento necessário para calcular todas as combinações possíveis. Dado que o analista do negócio é o elemento diferenciador na utilização efetiva das estruturas, ou pelo menos aquele que seleciona os dados que são consultados nessas estruturas, este trabalho propõe um conjunto de técnicas que estudam o comportamento do utilizador, de forma a perceber o seu comportamento sazonal e as vistas alvo das suas explorações, para que seja possível fazer a definição de novas estruturas contendo as vistas mais apropriadas à materialização e assim melhor satisfaçam as necessidades de exploração dos seus utilizadores. Nesta dissertação são definidas estruturas que acolhem os registos de consultas dos utilizadores e com esses dados são aplicadas técnicas de identificação de perfis de utilização e padrões de utilização, nomeadamente a definição de sessões OLAP, a aplicação de cadeias de Markov e a determinação de classes de equivalência de atributos consultados. No final deste estudo propomos a definição de uma assinatura OLAP capaz de definir o comportamento OLAP do utilizador com os elementos identificados nas técnicas estudadas e, assim, possibilitar ao administrador de sistema uma definição de reestruturação das estruturas multidimensionais “à medida” da utilização feita pelos analistas.With the emergence of the information era many companies resorted to data warehouses to store an increasing amount of their business data. With this evolution of data volume the need to better explore this data arises in order to be somewhat useful in evaluating and making business decisions. OLAP (On-Line Analytical Processing) systems respond to the need of helping the business analyst in exploring the data by giving him the autonomy of exploration, providing him with a multi-perspective and quick answer structure. However, in order to provide quick access to this information the materialization of multi-dimensional structures with this data already calculated is required, reducing the query time to the answer reading time and avoiding the processing time of each query. The complete materialization of the required data is practically impossible due to the volume of data that the systems are subjected to and due to the processing time needed to calculate all combinations possible. Since the business analyst is the differentiating element in the effective use of these structures, this work proposes a set of techniques that study the user‟s behaviour in order to understand his seasonal behaviour and the target views of his explorations, so that it becomes possible to define new structures containing the most appropriate views for materialization and in this way better satisfying the exploration needs of its users. In this dissertation, structures that collect the query records of the users will be defined and with this data techniques of identification of user profiles and utilization patterns are applied, namely the definition of OLAP sessions, the application of Markov chains and the determination of equivalence classes of queried attributes. In the end of this study, the definition of an OLAP signature capable of defining the OLAP behaviour of the user with the elements identified in the studied techniques will be proposed and this way allowing the system administrator a definition for restructuring of the multi-dimensional structures in “size” with the use done by the analysts.Belo, OrlandoUniversidade do MinhoDuarte, Ana Sofia da Silva2012-11-222012-11-22T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/1822/27823porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T12:49:13Zoai:repositorium.sdum.uminho.pt:1822/27823Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T19:47:39.043109Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Materialização à medida de vistas multidimensionais de dados
title Materialização à medida de vistas multidimensionais de dados
spellingShingle Materialização à medida de vistas multidimensionais de dados
Duarte, Ana Sofia da Silva
Sistemas de data warehousing
Processamento analítico de dados
OLAP
Sessões OLAP
Cadeias de markov
Classes de equivalência
Assinaturas OLAP
Data warehousing systems
On-line analytical processing
OLAP Sessions
Markov chains
Equivalence classes
OLAP signatures
681.3:658.0
658.0:681.3
title_short Materialização à medida de vistas multidimensionais de dados
title_full Materialização à medida de vistas multidimensionais de dados
title_fullStr Materialização à medida de vistas multidimensionais de dados
title_full_unstemmed Materialização à medida de vistas multidimensionais de dados
title_sort Materialização à medida de vistas multidimensionais de dados
author Duarte, Ana Sofia da Silva
author_facet Duarte, Ana Sofia da Silva
author_role author
dc.contributor.none.fl_str_mv Belo, Orlando
Universidade do Minho
dc.contributor.author.fl_str_mv Duarte, Ana Sofia da Silva
dc.subject.por.fl_str_mv Sistemas de data warehousing
Processamento analítico de dados
OLAP
Sessões OLAP
Cadeias de markov
Classes de equivalência
Assinaturas OLAP
Data warehousing systems
On-line analytical processing
OLAP Sessions
Markov chains
Equivalence classes
OLAP signatures
681.3:658.0
658.0:681.3
topic Sistemas de data warehousing
Processamento analítico de dados
OLAP
Sessões OLAP
Cadeias de markov
Classes de equivalência
Assinaturas OLAP
Data warehousing systems
On-line analytical processing
OLAP Sessions
Markov chains
Equivalence classes
OLAP signatures
681.3:658.0
658.0:681.3
description Dissertação de mestrado em Engenharia de Informática
publishDate 2012
dc.date.none.fl_str_mv 2012-11-22
2012-11-22T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1822/27823
url http://hdl.handle.net/1822/27823
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799133050786807808