Dynamic topic herarchies and segmented rankings in textual OLAP technology.

Detalhes bibliográficos
Autor(a) principal: Souza, Adriano Neves de Paula e
Data de Publicação: 2017
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFOP
Texto Completo: http://www.repositorio.ufop.br/handle/123456789/9236
Resumo: Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.
id UFOP_82390ca88649862ddfa85a4c3c8739ef
oai_identifier_str oai:localhost:123456789/9236
network_acronym_str UFOP
network_name_str Repositório Institucional da UFOP
repository_id_str 3233
spelling Souza, Adriano Neves de Paula eLima, Joubert de CastroFortes, Reinaldo SilvaCiferri, Ricardo RodriguesSilva, Rodrigo RochaLima, Joubert de Castro2017-12-21T11:35:21Z2017-12-21T11:35:21Z2017SOUZA, Adriano Neves de Paula e. Dynamic topic herarchies and segmented rankings in textual OLAP technology. 2017. 82 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2017.http://www.repositorio.ufop.br/handle/123456789/9236Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.A tecnologia OLAP tem se consolidado há 20 anos e recentemente foi redesenhada para que suas dimensões, hierarquias e medidas possam suportar as particularidades dos dados textuais. A tarefa de organizar dados textuais de forma hierárquica pode ser resolvida com a construção de hierarquias de tópicos. Atualmente, a hierarquia de tópicos é definida apenas uma vez no cubo de dados, ou seja, para todo o \textit{lattice} de cuboides. No entanto, tal hierarquia é sensível ao conteúdo da coleção de documentos, portanto em um mesmo cubo de dados podem existir células com conteúdos completamente diferentes, agregando coleções de documentos distintas, provocando potenciais alterações na hierarquia de tópicos. Além disso, o segmento de texto utilizado na análise OLAP também influencia diretamente nos tópicos elencados por tal hierarquia. Neste trabalho, apresentamos um cubo de dados textual com múltiplas e dinâmicas hierarquias de tópicos. Múltiplas por serem construídas a partir de diferentes segmentos de texto e dinâmicas por serem construídas para cada célula do cubo. Outra contribuição deste trabalho refere-se à resposta das consultas multidimensionais. O estado da arte normalmente retorna os top-k documentos mais relevantes para um determinado tópico. Vamos além disso, retornando outros segmentos de texto, como os títulos mais significativos, resumos e parágrafos. A abordagem é projetada em quatro etapas adicionais, onde cada passo atenua um pouco mais o impacto da construção de várias hierarquias de tópicos e rankings de segmentos por célula de cubo. Experimentos que utilizam parte dos documentos da DBLP como uma coleção de documentos reforçam nossas hipóteses.The OLAP technology emerged 20 years ago and recently has been redesigned so that its dimensions, hierarchies and measures can support the particularities of textual data. Organizing textual data hierarchically can be solved with topic hierarchies. Currently, the topic hierarchy is de ned only once in the data cube, e.g., forthe entire lattice of cubo ids. However, such hierarchy is sensitive to the document collection content. Thus, a data cube cell can contain a collection of documents distinct fromothers in the same cube, causing potential changes in the topic hierarchy. Further more, the text segment used in OLAP analysis also changes this hierarchy. In this work, we present a textual data cube with multiple dynamic topic hierarchies for each cube cell. Multiple hierarchies, since the presented approach builds a topic hierarchy per text segment. Another contribution of this work refers to query response. The state-of-the-art normally returns the top-k documents to the topic selected in the query. We go beyond by returning other text segments, such as the most signi cant titles, abstracts and paragraphs. The approach is designed in four complementary steps and each step attenuates a bit more the impact of building multiple to pic hierarchies and segmented rankings per cube cell. Experiments using part of the DBLP papers as a document collection reinforce our hypotheses.Autorização concedida ao Repositório Institucional da UFOP pelo(a) autor(a) em 01/12/2017 com as seguintes condições: disponível sob Licença Creative Commons 4.0 que permite copiar, distribuir e transmitir o trabalho desde que sejam citados o autor e o licenciante. Não permite o uso para fins comerciais nem a adaptação.info:eu-repo/semantics/openAccessAdministração de dadosDados textuaisClassificaçãoCubo de dadosDynamic topic herarchies and segmented rankings in textual OLAP technology.info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporreponame:Repositório Institucional da UFOPinstname:Universidade Federal de Ouro Preto (UFOP)instacron:UFOPLICENSElicense.txtlicense.txttext/plain; charset=utf-8924http://www.repositorio.ufop.br/bitstream/123456789/9236/5/license.txt62604f8d955274beb56c80ce1ee5dcaeMD55CC-LICENSElicense_urllicense_urltext/plain; charset=utf-849http://www.repositorio.ufop.br/bitstream/123456789/9236/2/license_url4afdbb8c545fd630ea7db775da747b2fMD52license_textlicense_texttext/html; charset=utf-80http://www.repositorio.ufop.br/bitstream/123456789/9236/3/license_textd41d8cd98f00b204e9800998ecf8427eMD53license_rdflicense_rdfapplication/rdf+xml; charset=utf-80http://www.repositorio.ufop.br/bitstream/123456789/9236/4/license_rdfd41d8cd98f00b204e9800998ecf8427eMD54ORIGINALDISSERTAÇÃO_DynamicTopicHierarchies.pdfDISSERTAÇÃO_DynamicTopicHierarchies.pdfapplication/pdf3186332http://www.repositorio.ufop.br/bitstream/123456789/9236/1/DISSERTA%c3%87%c3%83O_DynamicTopicHierarchies.pdfd02cc451034c046e5c01da6a74a67d4eMD51123456789/92362020-02-20 10:18:26.003oai:localhost:123456789/9236RGVjbGFyYcOnw6NvIGRlIGRpc3RyaWJ1acOnw6NvIG7Do28tZXhjbHVzaXZhCgpPIHJlZmVyaWRvIGF1dG9yOgoKYSlEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50byBsaGUgw6kgcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBwZXNzb2Egb3UgZW50aWRhZGUuCgpiKVNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIGNvbnTDqW0gbWF0ZXJpYWwgZG8gcXVhbCBuw6NvIGRldMOpbSBvcyBkaXJlaXRvcyBkZSBhdXRvciwgZGVjbGFyYSBxdWUgb2J0ZXZlIGF1dG9yaXphw6fDo28gZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIHBhcmEgY29uY2VkZXIgw6AgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgT3VybyBQcmV0by9VRk9QIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW7Dp2EgZSBxdWUgZXNzZSBtYXRlcmlhbCwgY3Vqb3MgZGlyZWl0b3Mgc8OjbyBkZSB0ZXJjZWlyb3MsIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvcyBkbyBkb2N1bWVudG8gZW50cmVndWUuCgpjKVNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIGJhc2VhZG8gZW0gdHJhYmFsaG8gZmluYW5jaWFkbyBvdSBhcG9pYWRvIHBvciBvdXRyYSBpbnN0aXR1acOnw6NvIHF1ZSBuw6NvIGEgVUZPUCwgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIgb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gY29udHJhdG8gb3UgYWNvcmRvLgoKRepositório InstitucionalPUBhttp://www.repositorio.ufop.br/oai/requestrepositorio@ufop.edu.bropendoar:32332020-02-20T15:18:26Repositório Institucional da UFOP - Universidade Federal de Ouro Preto (UFOP)false
dc.title.pt_BR.fl_str_mv Dynamic topic herarchies and segmented rankings in textual OLAP technology.
title Dynamic topic herarchies and segmented rankings in textual OLAP technology.
spellingShingle Dynamic topic herarchies and segmented rankings in textual OLAP technology.
Souza, Adriano Neves de Paula e
Administração de dados
Dados textuais
Classificação
Cubo de dados
title_short Dynamic topic herarchies and segmented rankings in textual OLAP technology.
title_full Dynamic topic herarchies and segmented rankings in textual OLAP technology.
title_fullStr Dynamic topic herarchies and segmented rankings in textual OLAP technology.
title_full_unstemmed Dynamic topic herarchies and segmented rankings in textual OLAP technology.
title_sort Dynamic topic herarchies and segmented rankings in textual OLAP technology.
author Souza, Adriano Neves de Paula e
author_facet Souza, Adriano Neves de Paula e
author_role author
dc.contributor.referee.pt_BR.fl_str_mv Lima, Joubert de Castro
Fortes, Reinaldo Silva
Ciferri, Ricardo Rodrigues
Silva, Rodrigo Rocha
dc.contributor.author.fl_str_mv Souza, Adriano Neves de Paula e
dc.contributor.advisor1.fl_str_mv Lima, Joubert de Castro
contributor_str_mv Lima, Joubert de Castro
dc.subject.por.fl_str_mv Administração de dados
Dados textuais
Classificação
Cubo de dados
topic Administração de dados
Dados textuais
Classificação
Cubo de dados
description Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.
publishDate 2017
dc.date.accessioned.fl_str_mv 2017-12-21T11:35:21Z
dc.date.available.fl_str_mv 2017-12-21T11:35:21Z
dc.date.issued.fl_str_mv 2017
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SOUZA, Adriano Neves de Paula e. Dynamic topic herarchies and segmented rankings in textual OLAP technology. 2017. 82 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2017.
dc.identifier.uri.fl_str_mv http://www.repositorio.ufop.br/handle/123456789/9236
identifier_str_mv SOUZA, Adriano Neves de Paula e. Dynamic topic herarchies and segmented rankings in textual OLAP technology. 2017. 82 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2017.
url http://www.repositorio.ufop.br/handle/123456789/9236
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFOP
instname:Universidade Federal de Ouro Preto (UFOP)
instacron:UFOP
instname_str Universidade Federal de Ouro Preto (UFOP)
instacron_str UFOP
institution UFOP
reponame_str Repositório Institucional da UFOP
collection Repositório Institucional da UFOP
bitstream.url.fl_str_mv http://www.repositorio.ufop.br/bitstream/123456789/9236/5/license.txt
http://www.repositorio.ufop.br/bitstream/123456789/9236/2/license_url
http://www.repositorio.ufop.br/bitstream/123456789/9236/3/license_text
http://www.repositorio.ufop.br/bitstream/123456789/9236/4/license_rdf
http://www.repositorio.ufop.br/bitstream/123456789/9236/1/DISSERTA%c3%87%c3%83O_DynamicTopicHierarchies.pdf
bitstream.checksum.fl_str_mv 62604f8d955274beb56c80ce1ee5dcae
4afdbb8c545fd630ea7db775da747b2f
d41d8cd98f00b204e9800998ecf8427e
d41d8cd98f00b204e9800998ecf8427e
d02cc451034c046e5c01da6a74a67d4e
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFOP - Universidade Federal de Ouro Preto (UFOP)
repository.mail.fl_str_mv repositorio@ufop.edu.br
_version_ 1801685710855471104