Dynamic topic herarchies and segmented rankings in textual OLAP technology.

Detalhes bibliográficos
Autor(a) principal: Souza, Adriano Neves de Paula e
Data de Publicação: 2017
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFOP
Texto Completo: http://www.repositorio.ufop.br/handle/123456789/9236
Resumo: Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.
id UFOP_6b02f647b657423820e8b2e3a54ab0d7
oai_identifier_str oai:repositorio.ufop.br:123456789/9236
network_acronym_str UFOP
network_name_str Repositório Institucional da UFOP
repository_id_str 3233
spelling Dynamic topic herarchies and segmented rankings in textual OLAP technology.Administração de dadosDados textuaisClassificaçãoCubo de dadosPrograma de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.A tecnologia OLAP tem se consolidado há 20 anos e recentemente foi redesenhada para que suas dimensões, hierarquias e medidas possam suportar as particularidades dos dados textuais. A tarefa de organizar dados textuais de forma hierárquica pode ser resolvida com a construção de hierarquias de tópicos. Atualmente, a hierarquia de tópicos é definida apenas uma vez no cubo de dados, ou seja, para todo o \textit{lattice} de cuboides. No entanto, tal hierarquia é sensível ao conteúdo da coleção de documentos, portanto em um mesmo cubo de dados podem existir células com conteúdos completamente diferentes, agregando coleções de documentos distintas, provocando potenciais alterações na hierarquia de tópicos. Além disso, o segmento de texto utilizado na análise OLAP também influencia diretamente nos tópicos elencados por tal hierarquia. Neste trabalho, apresentamos um cubo de dados textual com múltiplas e dinâmicas hierarquias de tópicos. Múltiplas por serem construídas a partir de diferentes segmentos de texto e dinâmicas por serem construídas para cada célula do cubo. Outra contribuição deste trabalho refere-se à resposta das consultas multidimensionais. O estado da arte normalmente retorna os top-k documentos mais relevantes para um determinado tópico. Vamos além disso, retornando outros segmentos de texto, como os títulos mais significativos, resumos e parágrafos. A abordagem é projetada em quatro etapas adicionais, onde cada passo atenua um pouco mais o impacto da construção de várias hierarquias de tópicos e rankings de segmentos por célula de cubo. Experimentos que utilizam parte dos documentos da DBLP como uma coleção de documentos reforçam nossas hipóteses.The OLAP technology emerged 20 years ago and recently has been redesigned so that its dimensions, hierarchies and measures can support the particularities of textual data. Organizing textual data hierarchically can be solved with topic hierarchies. Currently, the topic hierarchy is de ned only once in the data cube, e.g., forthe entire lattice of cubo ids. However, such hierarchy is sensitive to the document collection content. Thus, a data cube cell can contain a collection of documents distinct fromothers in the same cube, causing potential changes in the topic hierarchy. Further more, the text segment used in OLAP analysis also changes this hierarchy. In this work, we present a textual data cube with multiple dynamic topic hierarchies for each cube cell. Multiple hierarchies, since the presented approach builds a topic hierarchy per text segment. Another contribution of this work refers to query response. The state-of-the-art normally returns the top-k documents to the topic selected in the query. We go beyond by returning other text segments, such as the most signi cant titles, abstracts and paragraphs. The approach is designed in four complementary steps and each step attenuates a bit more the impact of building multiple to pic hierarchies and segmented rankings per cube cell. Experiments using part of the DBLP papers as a document collection reinforce our hypotheses.Lima, Joubert de CastroLima, Joubert de CastroFortes, Reinaldo SilvaCiferri, Ricardo RodriguesSilva, Rodrigo RochaSouza, Adriano Neves de Paula e2017-12-21T11:35:21Z2017-12-21T11:35:21Z2017info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfSOUZA, Adriano Neves de Paula e. Dynamic topic herarchies and segmented rankings in textual OLAP technology. 2017. 82 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2017.http://www.repositorio.ufop.br/handle/123456789/9236Autorização concedida ao Repositório Institucional da UFOP pelo(a) autor(a) em 01/12/2017 com as seguintes condições: disponível sob Licença Creative Commons 4.0 que permite copiar, distribuir e transmitir o trabalho desde que sejam citados o autor e o licenciante. Não permite o uso para fins comerciais nem a adaptação.info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFOPinstname:Universidade Federal de Ouro Preto (UFOP)instacron:UFOP2020-02-20T15:18:26Zoai:repositorio.ufop.br:123456789/9236Repositório InstitucionalPUBhttp://www.repositorio.ufop.br/oai/requestrepositorio@ufop.edu.bropendoar:32332020-02-20T15:18:26Repositório Institucional da UFOP - Universidade Federal de Ouro Preto (UFOP)false
dc.title.none.fl_str_mv Dynamic topic herarchies and segmented rankings in textual OLAP technology.
title Dynamic topic herarchies and segmented rankings in textual OLAP technology.
spellingShingle Dynamic topic herarchies and segmented rankings in textual OLAP technology.
Souza, Adriano Neves de Paula e
Administração de dados
Dados textuais
Classificação
Cubo de dados
title_short Dynamic topic herarchies and segmented rankings in textual OLAP technology.
title_full Dynamic topic herarchies and segmented rankings in textual OLAP technology.
title_fullStr Dynamic topic herarchies and segmented rankings in textual OLAP technology.
title_full_unstemmed Dynamic topic herarchies and segmented rankings in textual OLAP technology.
title_sort Dynamic topic herarchies and segmented rankings in textual OLAP technology.
author Souza, Adriano Neves de Paula e
author_facet Souza, Adriano Neves de Paula e
author_role author
dc.contributor.none.fl_str_mv Lima, Joubert de Castro
Lima, Joubert de Castro
Fortes, Reinaldo Silva
Ciferri, Ricardo Rodrigues
Silva, Rodrigo Rocha
dc.contributor.author.fl_str_mv Souza, Adriano Neves de Paula e
dc.subject.por.fl_str_mv Administração de dados
Dados textuais
Classificação
Cubo de dados
topic Administração de dados
Dados textuais
Classificação
Cubo de dados
description Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.
publishDate 2017
dc.date.none.fl_str_mv 2017-12-21T11:35:21Z
2017-12-21T11:35:21Z
2017
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv SOUZA, Adriano Neves de Paula e. Dynamic topic herarchies and segmented rankings in textual OLAP technology. 2017. 82 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2017.
http://www.repositorio.ufop.br/handle/123456789/9236
identifier_str_mv SOUZA, Adriano Neves de Paula e. Dynamic topic herarchies and segmented rankings in textual OLAP technology. 2017. 82 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2017.
url http://www.repositorio.ufop.br/handle/123456789/9236
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFOP
instname:Universidade Federal de Ouro Preto (UFOP)
instacron:UFOP
instname_str Universidade Federal de Ouro Preto (UFOP)
instacron_str UFOP
institution UFOP
reponame_str Repositório Institucional da UFOP
collection Repositório Institucional da UFOP
repository.name.fl_str_mv Repositório Institucional da UFOP - Universidade Federal de Ouro Preto (UFOP)
repository.mail.fl_str_mv repositorio@ufop.edu.br
_version_ 1813002801581654016