Wizdee Discovery - Automatic Analysis and Visualization of Information

Detalhes bibliográficos
Autor(a) principal: Leal, João Pedro Silva
Data de Publicação: 2015
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10316/35524
Resumo: Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia da Universidade de Coimbra
id RCAP_16e45dd6b1b4c1b693611fe89e212dc4
oai_identifier_str oai:estudogeral.uc.pt:10316/35524
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Wizdee Discovery - Automatic Analysis and Visualization of Informationautomatic visualizationautomated data miningdata miningmachine learningcase based reasoningDissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia da Universidade de CoimbraNa era das novas tecnologias, grandes quantidades de informação estão a ser criadas a um ritmo impressionante, no entanto, existe uma grande quantidade de conhecimento potencialmente importante que ainda está para ser descoberto. Existem dois processos importantes que podem ajudar na descoberta de novas informações: Análise de Informação e Visualização de Informação. Análise de Informação, em particular Data Mining, tem como objetivo descobrir informa ção útil, como a descoberta de relações entre os dados que eram anteriormente desconhecidas. No entanto, Data Mining é uma tarefa difícil, que requer tempo e um conhecimento extensivo das diferentes técnicas e procedimentos envolvidos, tais como a criação de modelos e otimização de parâmetros. Por outro lado, Visualização de Informação não produz, por si só, a descoberta de novas e úteis informações. No entanto, permite expor uma quantidade enorme de informação através de representações grá cas. Contudo, a criação dessas visualizações é uma tarefa complexa. O trabalho descrito neste documento foi desenvolvido na Wizdee, uma empresa especializada em soluções que representam o estado da arte para a gestão de conhecimento. De forma a melhorar a plataforma, foram desenvolvidos dois sistemas principais: Data Mining Automatizado e Visualização Automática. O objetivo principal destes sistemas é permitir que todos os utilizadores de negócio sejam capazes de utilizar estas tecnologias, sem a necessidade de ter conhecimento técnico. Ou seja, o sistema desenvolvido permite responder a questões como "A partir deste conjunto de dados qual é a visualização mais adequada?" ou "Quais são as razões para perda de oportunidades?", sem necessidade de intervenção do utilizador. A abordagem seguida para a Visualização Automática é de Raciocínio baseado em Casos. Neste documento é apresentada uma descrição detalhada de um novo procedimento desenvolvido, denominado por Mapeamento de Casos. São também descritos detalhes sobre o processamento de dados e sua automatização para diferentes tipos de grá cos. Sobre o sistema de Data Mining Automatizado, é descrito em detalhe o desenvolvimento de uma arquitetura escalável e exível, que é usada na automatização das diferentes tarefas de Data Mining. Para cada tarefa, foi desenvolvida uma metodologia que automatiza cada fase do processo. É de salientar, que para cada componente desenvolvida, foram realizados diversos testes utilizando uma avaliação comparativa, sempre que possível. As análises realizadas aos resultados sugerem que as abordagens usadas são rápidas e e cazes. Por m, é de salientar, que todos os sistemas desenvolvidos estão integrados e a ser usados na plataforma Wizdee, o que demonstra a viabilidade das abordagens desenvolvidas num cenário prático.In the age of new technologies, where information is all around us and large amounts of data is being created at an impressive rate, there is a big amount of knowledge that is potentially important, but is yet to be discovered. There are two processes closely related to discovering new information: Information Analysis and Information Visualization. Information Analysis, and in particular Data Mining, has the goal of discovering useful information such as previously unknown relationships in data. However, data mining is a di cult and time consuming task, that requires extensive know-how of the many techniques and procedures, such as creation of appropriate models and parameter tuning. Information Visualization, on the other hand, does not discover useful information on its own. It provides, however, an huge amount of information through graphical representations. Yet, the creation of these visualizations is a di cult task. This work was developed at Wizdee, a company specialized in state of the art solutions for knowledge management. In an e ort to extend and improve the platform, two large systems were developed: Automated Data Mining and Automatic Visualization, where the focus is the enabling of those technologies to any business user, by removing the need for technical knowledge and expertise. The developed systems can answer questions such as "Given this dataset what is the most appropriate visualization?" and "What are the causes for lost opportunities." without needing input from the user. The approach for Automatic Visualization is based on Case Based Reasoning. A detailed explanation of a novel procedure, named Case Mapping, for case retrieval, that is accurate and e cient, is also presented. Furthermore, details about data processing and how that can be automated into creating various types of charts is described. As for the Automated Data Mining, this work describes an approach to design a scalable and exible machine learning architecture, that can be used to automate various data mining tasks. For each task, a methodology was developed that automates each step of the processes. Additionally, for each component, tests were performed using a comparative evaluation when possible, where our analysis suggest that the approaches used are fast and e ective. Finally, the nal implementation was integrated in the platform, showing the viability of the approaches used in a practical scenario.2015-07-17info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/10316/35524http://hdl.handle.net/10316/35524TID:201537923engLeal, João Pedro Silvainfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2022-01-21T17:34:34Zoai:estudogeral.uc.pt:10316/35524Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T20:54:18.474769Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Wizdee Discovery - Automatic Analysis and Visualization of Information
title Wizdee Discovery - Automatic Analysis and Visualization of Information
spellingShingle Wizdee Discovery - Automatic Analysis and Visualization of Information
Leal, João Pedro Silva
automatic visualization
automated data mining
data mining
machine learning
case based reasoning
title_short Wizdee Discovery - Automatic Analysis and Visualization of Information
title_full Wizdee Discovery - Automatic Analysis and Visualization of Information
title_fullStr Wizdee Discovery - Automatic Analysis and Visualization of Information
title_full_unstemmed Wizdee Discovery - Automatic Analysis and Visualization of Information
title_sort Wizdee Discovery - Automatic Analysis and Visualization of Information
author Leal, João Pedro Silva
author_facet Leal, João Pedro Silva
author_role author
dc.contributor.author.fl_str_mv Leal, João Pedro Silva
dc.subject.por.fl_str_mv automatic visualization
automated data mining
data mining
machine learning
case based reasoning
topic automatic visualization
automated data mining
data mining
machine learning
case based reasoning
description Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia da Universidade de Coimbra
publishDate 2015
dc.date.none.fl_str_mv 2015-07-17
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10316/35524
http://hdl.handle.net/10316/35524
TID:201537923
url http://hdl.handle.net/10316/35524
identifier_str_mv TID:201537923
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799133830390480897