Materialização à medida de vistas multidimensionais de dados
Autor(a) principal: | |
---|---|
Data de Publicação: | 2012 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/1822/27823 |
Resumo: | Dissertação de mestrado em Engenharia de Informática |
id |
RCAP_db2bbdad15ad693d90c655a5fc480e2d |
---|---|
oai_identifier_str |
oai:repositorium.sdum.uminho.pt:1822/27823 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Materialização à medida de vistas multidimensionais de dadosSistemas de data warehousingProcessamento analítico de dadosOLAPSessões OLAPCadeias de markovClasses de equivalênciaAssinaturas OLAPData warehousing systemsOn-line analytical processingOLAP SessionsMarkov chainsEquivalence classesOLAP signatures681.3:658.0658.0:681.3Dissertação de mestrado em Engenharia de InformáticaCom o emergir da era da informação foram muitas as empresas que recorreram a data warehouses para armazenar a crescente quantidade de dados que dispõem sobre os seus negócios. Com essa evolução dos volumes de dados surge também a necessidade da sua melhor exploração para que sejam úteis de alguma forma nas avaliações e decisões sobre o negócio. Os sistemas de processamento analítico (ou OLAP – On-Line Analytical Processing) vêm dar resposta a essas necessidades de auxiliar o analista de negócio na exploração e avaliação dos dados, dotando-o de autonomia de exploração, disponibilizando-lhe uma estrutura multiperspetiva e de rápida resposta. Contudo para que o acesso a essa informação seja rápido existe a necessidade de fazer a materialização de estruturas multidimensionais com esses dados já pré-calculados, reduzindo o tempo de interrogação ao tempo de leitura da resposta e evitando o tempo de processamento de cada query. A materialização completa dos dados necessários torna-se na prática impraticável dada a volumetria de dados a que os sistemas estão sujeitos e ao tempo de processamento necessário para calcular todas as combinações possíveis. Dado que o analista do negócio é o elemento diferenciador na utilização efetiva das estruturas, ou pelo menos aquele que seleciona os dados que são consultados nessas estruturas, este trabalho propõe um conjunto de técnicas que estudam o comportamento do utilizador, de forma a perceber o seu comportamento sazonal e as vistas alvo das suas explorações, para que seja possível fazer a definição de novas estruturas contendo as vistas mais apropriadas à materialização e assim melhor satisfaçam as necessidades de exploração dos seus utilizadores. Nesta dissertação são definidas estruturas que acolhem os registos de consultas dos utilizadores e com esses dados são aplicadas técnicas de identificação de perfis de utilização e padrões de utilização, nomeadamente a definição de sessões OLAP, a aplicação de cadeias de Markov e a determinação de classes de equivalência de atributos consultados. No final deste estudo propomos a definição de uma assinatura OLAP capaz de definir o comportamento OLAP do utilizador com os elementos identificados nas técnicas estudadas e, assim, possibilitar ao administrador de sistema uma definição de reestruturação das estruturas multidimensionais “à medida” da utilização feita pelos analistas.With the emergence of the information era many companies resorted to data warehouses to store an increasing amount of their business data. With this evolution of data volume the need to better explore this data arises in order to be somewhat useful in evaluating and making business decisions. OLAP (On-Line Analytical Processing) systems respond to the need of helping the business analyst in exploring the data by giving him the autonomy of exploration, providing him with a multi-perspective and quick answer structure. However, in order to provide quick access to this information the materialization of multi-dimensional structures with this data already calculated is required, reducing the query time to the answer reading time and avoiding the processing time of each query. The complete materialization of the required data is practically impossible due to the volume of data that the systems are subjected to and due to the processing time needed to calculate all combinations possible. Since the business analyst is the differentiating element in the effective use of these structures, this work proposes a set of techniques that study the user‟s behaviour in order to understand his seasonal behaviour and the target views of his explorations, so that it becomes possible to define new structures containing the most appropriate views for materialization and in this way better satisfying the exploration needs of its users. In this dissertation, structures that collect the query records of the users will be defined and with this data techniques of identification of user profiles and utilization patterns are applied, namely the definition of OLAP sessions, the application of Markov chains and the determination of equivalence classes of queried attributes. In the end of this study, the definition of an OLAP signature capable of defining the OLAP behaviour of the user with the elements identified in the studied techniques will be proposed and this way allowing the system administrator a definition for restructuring of the multi-dimensional structures in “size” with the use done by the analysts.Belo, OrlandoUniversidade do MinhoDuarte, Ana Sofia da Silva2012-11-222012-11-22T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/1822/27823porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-05-11T07:21:38Zoai:repositorium.sdum.uminho.pt:1822/27823Portal AgregadorONGhttps://www.rcaap.pt/oai/openairemluisa.alvim@gmail.comopendoar:71602024-05-11T07:21:38Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Materialização à medida de vistas multidimensionais de dados |
title |
Materialização à medida de vistas multidimensionais de dados |
spellingShingle |
Materialização à medida de vistas multidimensionais de dados Duarte, Ana Sofia da Silva Sistemas de data warehousing Processamento analítico de dados OLAP Sessões OLAP Cadeias de markov Classes de equivalência Assinaturas OLAP Data warehousing systems On-line analytical processing OLAP Sessions Markov chains Equivalence classes OLAP signatures 681.3:658.0 658.0:681.3 |
title_short |
Materialização à medida de vistas multidimensionais de dados |
title_full |
Materialização à medida de vistas multidimensionais de dados |
title_fullStr |
Materialização à medida de vistas multidimensionais de dados |
title_full_unstemmed |
Materialização à medida de vistas multidimensionais de dados |
title_sort |
Materialização à medida de vistas multidimensionais de dados |
author |
Duarte, Ana Sofia da Silva |
author_facet |
Duarte, Ana Sofia da Silva |
author_role |
author |
dc.contributor.none.fl_str_mv |
Belo, Orlando Universidade do Minho |
dc.contributor.author.fl_str_mv |
Duarte, Ana Sofia da Silva |
dc.subject.por.fl_str_mv |
Sistemas de data warehousing Processamento analítico de dados OLAP Sessões OLAP Cadeias de markov Classes de equivalência Assinaturas OLAP Data warehousing systems On-line analytical processing OLAP Sessions Markov chains Equivalence classes OLAP signatures 681.3:658.0 658.0:681.3 |
topic |
Sistemas de data warehousing Processamento analítico de dados OLAP Sessões OLAP Cadeias de markov Classes de equivalência Assinaturas OLAP Data warehousing systems On-line analytical processing OLAP Sessions Markov chains Equivalence classes OLAP signatures 681.3:658.0 658.0:681.3 |
description |
Dissertação de mestrado em Engenharia de Informática |
publishDate |
2012 |
dc.date.none.fl_str_mv |
2012-11-22 2012-11-22T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1822/27823 |
url |
http://hdl.handle.net/1822/27823 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
mluisa.alvim@gmail.com |
_version_ |
1817545289275277312 |