Abordagens interativas para exploração de coleções de documentos

Detalhes bibliográficos
Autor(a) principal: Andreotti, André Luis Dias
Data de Publicação: 2020
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UNESP
Texto Completo: http://hdl.handle.net/11449/191677
Resumo: Os dados textuais têm desempenhado um papel cada vez mais importante em várias tarefas analíticas em pesquisas acadêmicas, inteligência de negócios, monitoramento de mídias sociais, jornalismo e outras áreas. A fim de explorar e dar sentido a esses dados, várias técnicas de visualização de textos surgiram nos últimos anos. Técnicas de visualizações, neste contexto, visam permitir que usuários possam explorar as relações entre documentos, descobrir documentos de interesse ou analisar padrões contidos nos documentos. Nessa forma de análise, um documento é comumente modelado por seu conteúdo subjacente e pelo conjunto de palavras que o compõe. Geralmente, técnicas de projeção multidimensional são empregadas para projetar esses documentos no espaço 2D, porém o usuário precisa ler cada documento para entender a geração dos agrupamentos e também existem problemas quanto a sobreposição de marcadores quando o número de documentos cresce. Neste trabalho são apresentadas duas propostas de elaboração de abordagens para exploração de coleções de documentos, em que o objetivo é reduzir o esforço cognitivo necessário para explorar o conjunto de documentos comparado com representações comuns de projeções multidimensionais. A primeira é uma abordagem híbrida, que mostra o relacionamento e o conteúdo do documento em uma única visualização, utilizando “mapas de documentos” e tag clouds. A segunda é uma abordagem hierárquica, que utiliza tag clouds para preencher as texturas de agrupamentos formados por meio do domínio de Voronoi para codificar visualmente as fronteiras dos grupos de documentos. Mostramos a eficácia das abordagens propostas na exploração de coleções de documentos, fornecendo explorações em que o usuário recebe poucas informações durante o processo exploratório e detalha o conteúdo de acordo com a demanda, superando problemas de identificação de agrupamentos e sobreposição de marcadores.
id UNSP_29dd3f040835492f69b4e11761e04a42
oai_identifier_str oai:repositorio.unesp.br:11449/191677
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str 2946
spelling Abordagens interativas para exploração de coleções de documentosInteractive approaches to exploring document collectionsVisualizaçãoRecuperação de textosTag cloudsVisualizationText retrievalOs dados textuais têm desempenhado um papel cada vez mais importante em várias tarefas analíticas em pesquisas acadêmicas, inteligência de negócios, monitoramento de mídias sociais, jornalismo e outras áreas. A fim de explorar e dar sentido a esses dados, várias técnicas de visualização de textos surgiram nos últimos anos. Técnicas de visualizações, neste contexto, visam permitir que usuários possam explorar as relações entre documentos, descobrir documentos de interesse ou analisar padrões contidos nos documentos. Nessa forma de análise, um documento é comumente modelado por seu conteúdo subjacente e pelo conjunto de palavras que o compõe. Geralmente, técnicas de projeção multidimensional são empregadas para projetar esses documentos no espaço 2D, porém o usuário precisa ler cada documento para entender a geração dos agrupamentos e também existem problemas quanto a sobreposição de marcadores quando o número de documentos cresce. Neste trabalho são apresentadas duas propostas de elaboração de abordagens para exploração de coleções de documentos, em que o objetivo é reduzir o esforço cognitivo necessário para explorar o conjunto de documentos comparado com representações comuns de projeções multidimensionais. A primeira é uma abordagem híbrida, que mostra o relacionamento e o conteúdo do documento em uma única visualização, utilizando “mapas de documentos” e tag clouds. A segunda é uma abordagem hierárquica, que utiliza tag clouds para preencher as texturas de agrupamentos formados por meio do domínio de Voronoi para codificar visualmente as fronteiras dos grupos de documentos. Mostramos a eficácia das abordagens propostas na exploração de coleções de documentos, fornecendo explorações em que o usuário recebe poucas informações durante o processo exploratório e detalha o conteúdo de acordo com a demanda, superando problemas de identificação de agrupamentos e sobreposição de marcadores.Textual data has played an increasingly important role in various analytical tasks in academic research, business intelligence, social media monitoring, journalism, and other fields. In order to explore and make sense of this data, various text visualization techniques have emerged in recent years. Visualization techniques, in this context, are intended to enable users to explore relationships between documents, discover documents of interest, or analyze patterns contained in documents. In this form of analysis, a document is commonly shaped by its underlying content and the set of words that compose it. Multidimensional projection techniques are often employed to project these documents into the 2D space, but you need to read each document to understand the generation of collations, and there are also problems with overlapping markers as the number of documents grows. This paper presents two proposals for developing approaches for exploring document collections, in which the objective is to reduce the cognitive effort required to explore the set of documents compared to common representations of multidimensional projections. The first is a hybrid approach, which shows the relationship and content of the document in a single view using “document maps” and tag clouds. The second is a hierarchical approach that uses tag clouds to fill in the textures of groupings formed through the Voronoi domain to visually encode the boundaries of document groups. We show the effectiveness of the proposed approaches in exploring document collections by providing explorations where the user receives little information during the exploratory process and details the content according to demand, overcoming cluster identification and marker overlap issues.Universidade Estadual Paulista (Unesp)Eler, Danilo Medeiros [UNESP]Universidade Estadual Paulista (Unesp)Andreotti, André Luis Dias2020-02-27T20:10:23Z2020-02-27T20:10:23Z2020-02-07info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/11449/19167700092918633004153073P2porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2023-11-20T06:17:15Zoai:repositorio.unesp.br:11449/191677Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462024-08-05T18:16:29.978529Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv Abordagens interativas para exploração de coleções de documentos
Interactive approaches to exploring document collections
title Abordagens interativas para exploração de coleções de documentos
spellingShingle Abordagens interativas para exploração de coleções de documentos
Andreotti, André Luis Dias
Visualização
Recuperação de textos
Tag clouds
Visualization
Text retrieval
title_short Abordagens interativas para exploração de coleções de documentos
title_full Abordagens interativas para exploração de coleções de documentos
title_fullStr Abordagens interativas para exploração de coleções de documentos
title_full_unstemmed Abordagens interativas para exploração de coleções de documentos
title_sort Abordagens interativas para exploração de coleções de documentos
author Andreotti, André Luis Dias
author_facet Andreotti, André Luis Dias
author_role author
dc.contributor.none.fl_str_mv Eler, Danilo Medeiros [UNESP]
Universidade Estadual Paulista (Unesp)
dc.contributor.author.fl_str_mv Andreotti, André Luis Dias
dc.subject.por.fl_str_mv Visualização
Recuperação de textos
Tag clouds
Visualization
Text retrieval
topic Visualização
Recuperação de textos
Tag clouds
Visualization
Text retrieval
description Os dados textuais têm desempenhado um papel cada vez mais importante em várias tarefas analíticas em pesquisas acadêmicas, inteligência de negócios, monitoramento de mídias sociais, jornalismo e outras áreas. A fim de explorar e dar sentido a esses dados, várias técnicas de visualização de textos surgiram nos últimos anos. Técnicas de visualizações, neste contexto, visam permitir que usuários possam explorar as relações entre documentos, descobrir documentos de interesse ou analisar padrões contidos nos documentos. Nessa forma de análise, um documento é comumente modelado por seu conteúdo subjacente e pelo conjunto de palavras que o compõe. Geralmente, técnicas de projeção multidimensional são empregadas para projetar esses documentos no espaço 2D, porém o usuário precisa ler cada documento para entender a geração dos agrupamentos e também existem problemas quanto a sobreposição de marcadores quando o número de documentos cresce. Neste trabalho são apresentadas duas propostas de elaboração de abordagens para exploração de coleções de documentos, em que o objetivo é reduzir o esforço cognitivo necessário para explorar o conjunto de documentos comparado com representações comuns de projeções multidimensionais. A primeira é uma abordagem híbrida, que mostra o relacionamento e o conteúdo do documento em uma única visualização, utilizando “mapas de documentos” e tag clouds. A segunda é uma abordagem hierárquica, que utiliza tag clouds para preencher as texturas de agrupamentos formados por meio do domínio de Voronoi para codificar visualmente as fronteiras dos grupos de documentos. Mostramos a eficácia das abordagens propostas na exploração de coleções de documentos, fornecendo explorações em que o usuário recebe poucas informações durante o processo exploratório e detalha o conteúdo de acordo com a demanda, superando problemas de identificação de agrupamentos e sobreposição de marcadores.
publishDate 2020
dc.date.none.fl_str_mv 2020-02-27T20:10:23Z
2020-02-27T20:10:23Z
2020-02-07
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/11449/191677
000929186
33004153073P2
url http://hdl.handle.net/11449/191677
identifier_str_mv 000929186
33004153073P2
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv
_version_ 1808128915169869824