Dynamic topic herarchies and segmented rankings in textual OLAP technology.
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFOP |
Texto Completo: | http://www.repositorio.ufop.br/handle/123456789/9236 |
Resumo: | Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto. |
id |
UFOP_6b02f647b657423820e8b2e3a54ab0d7 |
---|---|
oai_identifier_str |
oai:repositorio.ufop.br:123456789/9236 |
network_acronym_str |
UFOP |
network_name_str |
Repositório Institucional da UFOP |
repository_id_str |
3233 |
spelling |
Dynamic topic herarchies and segmented rankings in textual OLAP technology.Administração de dadosDados textuaisClassificaçãoCubo de dadosPrograma de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.A tecnologia OLAP tem se consolidado há 20 anos e recentemente foi redesenhada para que suas dimensões, hierarquias e medidas possam suportar as particularidades dos dados textuais. A tarefa de organizar dados textuais de forma hierárquica pode ser resolvida com a construção de hierarquias de tópicos. Atualmente, a hierarquia de tópicos é definida apenas uma vez no cubo de dados, ou seja, para todo o \textit{lattice} de cuboides. No entanto, tal hierarquia é sensível ao conteúdo da coleção de documentos, portanto em um mesmo cubo de dados podem existir células com conteúdos completamente diferentes, agregando coleções de documentos distintas, provocando potenciais alterações na hierarquia de tópicos. Além disso, o segmento de texto utilizado na análise OLAP também influencia diretamente nos tópicos elencados por tal hierarquia. Neste trabalho, apresentamos um cubo de dados textual com múltiplas e dinâmicas hierarquias de tópicos. Múltiplas por serem construídas a partir de diferentes segmentos de texto e dinâmicas por serem construídas para cada célula do cubo. Outra contribuição deste trabalho refere-se à resposta das consultas multidimensionais. O estado da arte normalmente retorna os top-k documentos mais relevantes para um determinado tópico. Vamos além disso, retornando outros segmentos de texto, como os títulos mais significativos, resumos e parágrafos. A abordagem é projetada em quatro etapas adicionais, onde cada passo atenua um pouco mais o impacto da construção de várias hierarquias de tópicos e rankings de segmentos por célula de cubo. Experimentos que utilizam parte dos documentos da DBLP como uma coleção de documentos reforçam nossas hipóteses.The OLAP technology emerged 20 years ago and recently has been redesigned so that its dimensions, hierarchies and measures can support the particularities of textual data. Organizing textual data hierarchically can be solved with topic hierarchies. Currently, the topic hierarchy is de ned only once in the data cube, e.g., forthe entire lattice of cubo ids. However, such hierarchy is sensitive to the document collection content. Thus, a data cube cell can contain a collection of documents distinct fromothers in the same cube, causing potential changes in the topic hierarchy. Further more, the text segment used in OLAP analysis also changes this hierarchy. In this work, we present a textual data cube with multiple dynamic topic hierarchies for each cube cell. Multiple hierarchies, since the presented approach builds a topic hierarchy per text segment. Another contribution of this work refers to query response. The state-of-the-art normally returns the top-k documents to the topic selected in the query. We go beyond by returning other text segments, such as the most signi cant titles, abstracts and paragraphs. The approach is designed in four complementary steps and each step attenuates a bit more the impact of building multiple to pic hierarchies and segmented rankings per cube cell. Experiments using part of the DBLP papers as a document collection reinforce our hypotheses.Lima, Joubert de CastroLima, Joubert de CastroFortes, Reinaldo SilvaCiferri, Ricardo RodriguesSilva, Rodrigo RochaSouza, Adriano Neves de Paula e2017-12-21T11:35:21Z2017-12-21T11:35:21Z2017info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfSOUZA, Adriano Neves de Paula e. Dynamic topic herarchies and segmented rankings in textual OLAP technology. 2017. 82 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2017.http://www.repositorio.ufop.br/handle/123456789/9236Autorização concedida ao Repositório Institucional da UFOP pelo(a) autor(a) em 01/12/2017 com as seguintes condições: disponível sob Licença Creative Commons 4.0 que permite copiar, distribuir e transmitir o trabalho desde que sejam citados o autor e o licenciante. Não permite o uso para fins comerciais nem a adaptação.info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFOPinstname:Universidade Federal de Ouro Preto (UFOP)instacron:UFOP2020-02-20T15:18:26Zoai:repositorio.ufop.br:123456789/9236Repositório InstitucionalPUBhttp://www.repositorio.ufop.br/oai/requestrepositorio@ufop.edu.bropendoar:32332020-02-20T15:18:26Repositório Institucional da UFOP - Universidade Federal de Ouro Preto (UFOP)false |
dc.title.none.fl_str_mv |
Dynamic topic herarchies and segmented rankings in textual OLAP technology. |
title |
Dynamic topic herarchies and segmented rankings in textual OLAP technology. |
spellingShingle |
Dynamic topic herarchies and segmented rankings in textual OLAP technology. Souza, Adriano Neves de Paula e Administração de dados Dados textuais Classificação Cubo de dados |
title_short |
Dynamic topic herarchies and segmented rankings in textual OLAP technology. |
title_full |
Dynamic topic herarchies and segmented rankings in textual OLAP technology. |
title_fullStr |
Dynamic topic herarchies and segmented rankings in textual OLAP technology. |
title_full_unstemmed |
Dynamic topic herarchies and segmented rankings in textual OLAP technology. |
title_sort |
Dynamic topic herarchies and segmented rankings in textual OLAP technology. |
author |
Souza, Adriano Neves de Paula e |
author_facet |
Souza, Adriano Neves de Paula e |
author_role |
author |
dc.contributor.none.fl_str_mv |
Lima, Joubert de Castro Lima, Joubert de Castro Fortes, Reinaldo Silva Ciferri, Ricardo Rodrigues Silva, Rodrigo Rocha |
dc.contributor.author.fl_str_mv |
Souza, Adriano Neves de Paula e |
dc.subject.por.fl_str_mv |
Administração de dados Dados textuais Classificação Cubo de dados |
topic |
Administração de dados Dados textuais Classificação Cubo de dados |
description |
Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto. |
publishDate |
2017 |
dc.date.none.fl_str_mv |
2017-12-21T11:35:21Z 2017-12-21T11:35:21Z 2017 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
SOUZA, Adriano Neves de Paula e. Dynamic topic herarchies and segmented rankings in textual OLAP technology. 2017. 82 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2017. http://www.repositorio.ufop.br/handle/123456789/9236 |
identifier_str_mv |
SOUZA, Adriano Neves de Paula e. Dynamic topic herarchies and segmented rankings in textual OLAP technology. 2017. 82 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2017. |
url |
http://www.repositorio.ufop.br/handle/123456789/9236 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFOP instname:Universidade Federal de Ouro Preto (UFOP) instacron:UFOP |
instname_str |
Universidade Federal de Ouro Preto (UFOP) |
instacron_str |
UFOP |
institution |
UFOP |
reponame_str |
Repositório Institucional da UFOP |
collection |
Repositório Institucional da UFOP |
repository.name.fl_str_mv |
Repositório Institucional da UFOP - Universidade Federal de Ouro Preto (UFOP) |
repository.mail.fl_str_mv |
repositorio@ufop.edu.br |
_version_ |
1813002801581654016 |