Visualização de dados como ferramenta de classificação em sistemas de bases de dados para Data Mining

Detalhes bibliográficos
Autor(a) principal: Botelho, Elisângela
Data de Publicação: 2002
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-02062015-090709/
Resumo: A automação das atividades em diversas áreas, tais como negócios, engenharia, medicina, ciência e governo, vêm aumentando a cada dia, e com isso, cresce o volume de dados armazenados nas bases de dados. É interessante usar esses dados além dos objetivos originais das operações de pura armazenagem e busca do empreendimento inicial. Em outras palavras, é desejável extrair informações úteis, não previstas inicialmente, agregando valor ao empreendimento. Embora os gerenciadores de bases de dados forneçam ferramentas básicas para recuperação de dados em transações padrão em grandes quantidades de dados, analisar grandes volumes de dados em formato numérico ou textual, especialmente em espaços de altas dimensões, não é fácil para o ser humano. Por outro lado, o ser humano tem uma capacidade de absorver e entender informação representada de forma gráfica muito rapidamente. Dessa forma, este trabalho visa o desenvolvimento de uma nova técnica para construção visual de classificadores de dados em atividades de Data Mining, utilizando essa reconhecidamente elevada capacidade humana de análise de dados representados em formato gráfico como fator que auxilia o treinamento do classificador. Este trabalho estende a ferramenta FastMapDB, que em sua versão original permitia apenas a visualização de dados e não possibilitava ao usuário interferir no processo de visualização, para permitir, não apenas essa visualização de dados, mas também, a seleção visual dos objetos mapeados e a delimitação de regiões de objetos na visualização. Com isso, a ferramenta passa a permitir a recuperação dos dados presentes na base de dados que o usuário considerar interessantes a partir da visualização, e provê à ferramenta recursos de classificação de novos objetos segundo regras visuais que o usuário possa definir no espaço mapeado de visualização. A proposta deste trabalho é inédita no sentido de aplicar técnicas de visualização como fator de treinamento do classificador. As ferramentas atuais apenas mostram resultados já elaborados pelo sistema, e a continuação do processo é sempre solicitada, ou decidida manualmente, pelo usuário. Nosso sistema, ao contrário, realimenta a interpretação que o usuário pode fazer a respeito dos dados, e permite que os passos de análise seguintes utilizem automaticamente esse resultado.
id USP_17b2a18c099d5971806fd196f5eb1a1a
oai_identifier_str oai:teses.usp.br:tde-02062015-090709
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Visualização de dados como ferramenta de classificação em sistemas de bases de dados para Data MiningUsing data visualization to perform classification tasks in database management systemsNão disponívelNot availableA automação das atividades em diversas áreas, tais como negócios, engenharia, medicina, ciência e governo, vêm aumentando a cada dia, e com isso, cresce o volume de dados armazenados nas bases de dados. É interessante usar esses dados além dos objetivos originais das operações de pura armazenagem e busca do empreendimento inicial. Em outras palavras, é desejável extrair informações úteis, não previstas inicialmente, agregando valor ao empreendimento. Embora os gerenciadores de bases de dados forneçam ferramentas básicas para recuperação de dados em transações padrão em grandes quantidades de dados, analisar grandes volumes de dados em formato numérico ou textual, especialmente em espaços de altas dimensões, não é fácil para o ser humano. Por outro lado, o ser humano tem uma capacidade de absorver e entender informação representada de forma gráfica muito rapidamente. Dessa forma, este trabalho visa o desenvolvimento de uma nova técnica para construção visual de classificadores de dados em atividades de Data Mining, utilizando essa reconhecidamente elevada capacidade humana de análise de dados representados em formato gráfico como fator que auxilia o treinamento do classificador. Este trabalho estende a ferramenta FastMapDB, que em sua versão original permitia apenas a visualização de dados e não possibilitava ao usuário interferir no processo de visualização, para permitir, não apenas essa visualização de dados, mas também, a seleção visual dos objetos mapeados e a delimitação de regiões de objetos na visualização. Com isso, a ferramenta passa a permitir a recuperação dos dados presentes na base de dados que o usuário considerar interessantes a partir da visualização, e provê à ferramenta recursos de classificação de novos objetos segundo regras visuais que o usuário possa definir no espaço mapeado de visualização. A proposta deste trabalho é inédita no sentido de aplicar técnicas de visualização como fator de treinamento do classificador. As ferramentas atuais apenas mostram resultados já elaborados pelo sistema, e a continuação do processo é sempre solicitada, ou decidida manualmente, pelo usuário. Nosso sistema, ao contrário, realimenta a interpretação que o usuário pode fazer a respeito dos dados, e permite que os passos de análise seguintes utilizem automaticamente esse resultado.The automation of the activities in several areas, sueh as business, engineering, medicine, science and government, are increasing everyday, pressing, the volume of data stored in the databases to grow exponentially. It is interesting to make use of these data beyond the original objectives of the enterprise. Moreover, it is desirable to extract useful information not previously foreseen, aggregating value to the enterprise. Although the database management systems supply basic tools to data recovery and analysis through the standard transactions in large amounts of data, analyzing these data in numerical or textual format, especially in spaces of high dimensions, is an overwhelming job to human beings. On the other hand, human being has a great capacity to quickly absorb and understand information represented of graphical form. As classification is one of the most common analysis tasks, this work aims at the development of a new technique for the visual construction of classifiers, using this high human capacity to analyze data represented in graphical format as factor to guide the training of the classifier. This work extends the FastMapDB tool, that in its original version allowed only the visualization of data and it did not make possible the user to interfere in the visualization process, to allow not only this visualization of data, but also, the reverse identification of mapped objects and the delimitation of object regions in the visualization. This makes it possible to recover the data present in the database that the user consider interesting from the visualization, and providing to the tool visual resources for classification of the new objects according to rules that the user can define in the mapped space of visualization. The proposal of this work is new in regarding to apply visualization techniques as a factor to train the classifier. Existing tools are restricted to show results already discovered by the system. Our system, in contrast, takes advantages from the interpretation obtained from the user will through its interaction with the visualizations presented, and allows that subsequent data analysis tasks automatically use these results.Biblioteca Digitais de Teses e Dissertações da USPTraina Junior, CaetanoBotelho, Elisângela2002-08-09info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/55/55134/tde-02062015-090709/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2016-07-28T16:11:57Zoai:teses.usp.br:tde-02062015-090709Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212016-07-28T16:11:57Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Visualização de dados como ferramenta de classificação em sistemas de bases de dados para Data Mining
Using data visualization to perform classification tasks in database management systems
title Visualização de dados como ferramenta de classificação em sistemas de bases de dados para Data Mining
spellingShingle Visualização de dados como ferramenta de classificação em sistemas de bases de dados para Data Mining
Botelho, Elisângela
Não disponível
Not available
title_short Visualização de dados como ferramenta de classificação em sistemas de bases de dados para Data Mining
title_full Visualização de dados como ferramenta de classificação em sistemas de bases de dados para Data Mining
title_fullStr Visualização de dados como ferramenta de classificação em sistemas de bases de dados para Data Mining
title_full_unstemmed Visualização de dados como ferramenta de classificação em sistemas de bases de dados para Data Mining
title_sort Visualização de dados como ferramenta de classificação em sistemas de bases de dados para Data Mining
author Botelho, Elisângela
author_facet Botelho, Elisângela
author_role author
dc.contributor.none.fl_str_mv Traina Junior, Caetano
dc.contributor.author.fl_str_mv Botelho, Elisângela
dc.subject.por.fl_str_mv Não disponível
Not available
topic Não disponível
Not available
description A automação das atividades em diversas áreas, tais como negócios, engenharia, medicina, ciência e governo, vêm aumentando a cada dia, e com isso, cresce o volume de dados armazenados nas bases de dados. É interessante usar esses dados além dos objetivos originais das operações de pura armazenagem e busca do empreendimento inicial. Em outras palavras, é desejável extrair informações úteis, não previstas inicialmente, agregando valor ao empreendimento. Embora os gerenciadores de bases de dados forneçam ferramentas básicas para recuperação de dados em transações padrão em grandes quantidades de dados, analisar grandes volumes de dados em formato numérico ou textual, especialmente em espaços de altas dimensões, não é fácil para o ser humano. Por outro lado, o ser humano tem uma capacidade de absorver e entender informação representada de forma gráfica muito rapidamente. Dessa forma, este trabalho visa o desenvolvimento de uma nova técnica para construção visual de classificadores de dados em atividades de Data Mining, utilizando essa reconhecidamente elevada capacidade humana de análise de dados representados em formato gráfico como fator que auxilia o treinamento do classificador. Este trabalho estende a ferramenta FastMapDB, que em sua versão original permitia apenas a visualização de dados e não possibilitava ao usuário interferir no processo de visualização, para permitir, não apenas essa visualização de dados, mas também, a seleção visual dos objetos mapeados e a delimitação de regiões de objetos na visualização. Com isso, a ferramenta passa a permitir a recuperação dos dados presentes na base de dados que o usuário considerar interessantes a partir da visualização, e provê à ferramenta recursos de classificação de novos objetos segundo regras visuais que o usuário possa definir no espaço mapeado de visualização. A proposta deste trabalho é inédita no sentido de aplicar técnicas de visualização como fator de treinamento do classificador. As ferramentas atuais apenas mostram resultados já elaborados pelo sistema, e a continuação do processo é sempre solicitada, ou decidida manualmente, pelo usuário. Nosso sistema, ao contrário, realimenta a interpretação que o usuário pode fazer a respeito dos dados, e permite que os passos de análise seguintes utilizem automaticamente esse resultado.
publishDate 2002
dc.date.none.fl_str_mv 2002-08-09
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://www.teses.usp.br/teses/disponiveis/55/55134/tde-02062015-090709/
url http://www.teses.usp.br/teses/disponiveis/55/55134/tde-02062015-090709/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815256608292208640