RSAPP, um algoritmo baseado em rough sets para auxílio ao processo de descoberta de conhecimento em banco de dados

Detalhes bibliográficos
Autor(a) principal: Silveira, Juliano Gomes da
Data de Publicação: 2013
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional PUCRS
Texto Completo: http://hdl.handle.net/10923/5544
Resumo: Techniques of Business Intelligence (BI) became one of the main allies of organizations in tasks of transforming data into knowledge, supporting the middle and upper management levels in decision making. BI tools in their composition are based on techniques of knowledge management, such as Data Warehouse (DW), OLAP (Online Analytical Processing), Data Mining (DM), among others. In this context, it is observed that in many case, DM projects become unfeasible by some factors, such as project costs, duration and specially the uncertainty in obtaining results that return the investment spent on the project. This work seeks to minimize these factors through a diagnosis on data, by an algorithm based on Rough Sets Theory. The algorithm, named Rough Set App (RSAPP) aims to create a diagnosis on data persisted in DW, in order to map which attributes have the greatest potential for generating more accurate mining models and more interesting results. Thus, it is expected that the diagnosis generated by RSAPP can complement the KDD (Knowledge Discovery in Database) process, reducing the time spent on activities of understanding and reducing data dimensionality. This work presents a detailed description about the implemented algorithm, as well as the report of the executed tests. At the end there is an empirical analysis of the results, in order to estimate the effectiveness of the proposed algorithm.
id PUCR_73c873629f673082ae08a5afb978100d
oai_identifier_str oai:meriva.pucrs.br:10923/5544
network_acronym_str PUCR
network_name_str Repositório Institucional PUCRS
repository_id_str 2753
spelling Silveira, Juliano Gomes daRuiz, Duncan Dubugras Alcoba2013-11-12T11:38:27Z2013-11-12T11:38:27Z2013http://hdl.handle.net/10923/5544Techniques of Business Intelligence (BI) became one of the main allies of organizations in tasks of transforming data into knowledge, supporting the middle and upper management levels in decision making. BI tools in their composition are based on techniques of knowledge management, such as Data Warehouse (DW), OLAP (Online Analytical Processing), Data Mining (DM), among others. In this context, it is observed that in many case, DM projects become unfeasible by some factors, such as project costs, duration and specially the uncertainty in obtaining results that return the investment spent on the project. This work seeks to minimize these factors through a diagnosis on data, by an algorithm based on Rough Sets Theory. The algorithm, named Rough Set App (RSAPP) aims to create a diagnosis on data persisted in DW, in order to map which attributes have the greatest potential for generating more accurate mining models and more interesting results. Thus, it is expected that the diagnosis generated by RSAPP can complement the KDD (Knowledge Discovery in Database) process, reducing the time spent on activities of understanding and reducing data dimensionality. This work presents a detailed description about the implemented algorithm, as well as the report of the executed tests. At the end there is an empirical analysis of the results, in order to estimate the effectiveness of the proposed algorithm.As técnicas, business intelligence (BI) firmaram-se como grandes aliadas das organizações nas tarefas de transformar dados em conhecimento, apoiando a média e alta gestão na tomada de decisões. As ferramentas de BI em sua, composição são fundadas em técnicas de gestão do conhecimento, tais como Data Warehouse (DW), OLAP (Online Analytical Processing), minaração de dados (MD), entre outras. Neste contexto, observa-se que em muitos casos, projatos de MD acabam sendo inviabilizados por alguns fatores, tais como, custo do projeto, duração e principalmente, a incerteza na obtenção de resultados que retornem o investimento despedindo no projeto. O presente trabalho busca minimizar os fatores acima por meio um diagnóstico sobre dados, através de um algoritmo baseado em Rough Sets Theory (Teoria dos Conjuntos Aproximados (TCA)). O algoritmo desenvolvido, nomeado Rough Set App (RSAPP) objetiva criar um diagnóstico sobre os dados persistidos no DW, a fim de mapear quais atributos possuem maior potencial de gerar modelos de mineração mais preciosos e resultados mais interessantes. Desta forma, entende-se que o diagnóstico gerado por RSAPP pode complementar o processo de KDD (Knowledge Discovery in database), reduzindo o tempo gasto nas atividades de entendimento e redução da dimensionalidade dos dados. No trabalho se faz uma descrição detalhada acerca do algoritmo implementado, bem como o relato dos, testes que foram executados. Ao final faz-se uma análise empírica sobre os resultados a fim de estimar a eficácia do algoritmo quanto a sua proposta.Made available in DSpace on 2013-11-12T11:38:27Z (GMT). No. of bitstreams: 1 000451416-Texto+Completo-0.pdf: 14725586 bytes, checksum: 00990626e7c5d4d2d585832062bda2f3 (MD5) Previous issue date: 2013Pontifícia Universidade Católica do Rio Grande do SulPorto AlegreINFORMÁTICABANCO DE DADOSMINERAÇÃO DE DADOS (INFORMÁTICA)RSAPP, um algoritmo baseado em rough sets para auxílio ao processo de descoberta de conhecimento em banco de dadosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisPontifícia Universidade Católica do Rio Grande do SulFaculdade de InformáticaPrograma de Pós-Graduação em Ciência da ComputaçãoMestrado2013porreponame:Repositório Institucional PUCRSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RSinfo:eu-repo/semantics/openAccessORIGINAL000451416-Texto+Completo-0.pdfTexto Completoapplication/pdf14725586http://meriva.pucrs.br:8080/jspui/bitstream/10923/5544/1/000451416-Texto%2BCompleto-0.pdf00990626e7c5d4d2d585832062bda2f3MD51LICENSElicense.txttext/plain601http://meriva.pucrs.br:8080/jspui/bitstream/10923/5544/2/license.txt3d470ad030ca6782c9f44a1fb7650ec0MD52TEXT000451416-Texto+Completo-0.pdf.txt000451416-Texto+Completo-0.pdf.txtExtracted texttext/plain4914http://meriva.pucrs.br:8080/jspui/bitstream/10923/5544/3/000451416-Texto%2BCompleto-0.pdf.txta432cb3aa283fbba107dd09583e5ccfbMD5310923/55442017-09-27 15:49:26.708oai:meriva.pucrs.br:10923/5544QXV0b3JpemHDp8OjbyBwYXJhIFB1YmxpY2HDp8OjbyBFbGV0csO0bmljYTogQ29tIGJhc2Ugbm8gZGlzcG9zdG8gbmEgTGVpIEZlZGVyYWwgbsK6OS42MTAsIGRlIDE5IGRlIGZldmVyZWlybyBkZSAxOTk4LCBBVVRPUklaTyBhIHB1YmxpY2HDp8OjbyBlbGV0csO0bmljYSBkYSBwcmVzZW50ZSBvYnJhIG5vIGFjZXJ2byBkYSBCaWJsaW90ZWNhIERpZ2l0YWwgZGEgUG9udGlmw61jaWEgVW5pdmVyc2lkYWRlIENhdMOzbGljYSBkbyBSaW8gR3JhbmRlIGRvIFN1bCwgc2VkaWFkYSBhIEF2LiBJcGlyYW5nYSA2NjgxLCBQb3J0byBBbGVncmUsIFJpbyBHcmFuZGUgZG8gU3VsLCBjb20gcmVnaXN0cm8gZGUgQ05QSiA4ODYzMDQxMzAwMDItODEgYmVtIGNvbW8gZW0gb3V0cmFzIGJpYmxpb3RlY2FzIGRpZ2l0YWlzLCBuYWNpb25haXMgZSBpbnRlcm5hY2lvbmFpcywgY29uc8OzcmNpb3MgZSByZWRlcyDDoHMgcXVhaXMgYSBiaWJsaW90ZWNhIGRhIFBVQ1JTIHBvc3NhIGEgdmlyIHBhcnRpY2lwYXIsIHNlbSDDtG51cyBhbHVzaXZvIGFvcyBkaXJlaXRvcyBhdXRvcmFpcywgYSB0w610dWxvIGRlIGRpdnVsZ2HDp8OjbyBkYSBwcm9kdcOnw6NvIGNpZW50w61maWNhLg==Repositório InstitucionalPRIhttp://repositorio.pucrs.br/oai/request?verb=Identifyopendoar:27532017-09-27T18:49:26Repositório Institucional PUCRS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false
dc.title.pt_BR.fl_str_mv RSAPP, um algoritmo baseado em rough sets para auxílio ao processo de descoberta de conhecimento em banco de dados
title RSAPP, um algoritmo baseado em rough sets para auxílio ao processo de descoberta de conhecimento em banco de dados
spellingShingle RSAPP, um algoritmo baseado em rough sets para auxílio ao processo de descoberta de conhecimento em banco de dados
Silveira, Juliano Gomes da
INFORMÁTICA
BANCO DE DADOS
MINERAÇÃO DE DADOS (INFORMÁTICA)
title_short RSAPP, um algoritmo baseado em rough sets para auxílio ao processo de descoberta de conhecimento em banco de dados
title_full RSAPP, um algoritmo baseado em rough sets para auxílio ao processo de descoberta de conhecimento em banco de dados
title_fullStr RSAPP, um algoritmo baseado em rough sets para auxílio ao processo de descoberta de conhecimento em banco de dados
title_full_unstemmed RSAPP, um algoritmo baseado em rough sets para auxílio ao processo de descoberta de conhecimento em banco de dados
title_sort RSAPP, um algoritmo baseado em rough sets para auxílio ao processo de descoberta de conhecimento em banco de dados
author Silveira, Juliano Gomes da
author_facet Silveira, Juliano Gomes da
author_role author
dc.contributor.author.fl_str_mv Silveira, Juliano Gomes da
dc.contributor.advisor1.fl_str_mv Ruiz, Duncan Dubugras Alcoba
contributor_str_mv Ruiz, Duncan Dubugras Alcoba
dc.subject.por.fl_str_mv INFORMÁTICA
BANCO DE DADOS
MINERAÇÃO DE DADOS (INFORMÁTICA)
topic INFORMÁTICA
BANCO DE DADOS
MINERAÇÃO DE DADOS (INFORMÁTICA)
description Techniques of Business Intelligence (BI) became one of the main allies of organizations in tasks of transforming data into knowledge, supporting the middle and upper management levels in decision making. BI tools in their composition are based on techniques of knowledge management, such as Data Warehouse (DW), OLAP (Online Analytical Processing), Data Mining (DM), among others. In this context, it is observed that in many case, DM projects become unfeasible by some factors, such as project costs, duration and specially the uncertainty in obtaining results that return the investment spent on the project. This work seeks to minimize these factors through a diagnosis on data, by an algorithm based on Rough Sets Theory. The algorithm, named Rough Set App (RSAPP) aims to create a diagnosis on data persisted in DW, in order to map which attributes have the greatest potential for generating more accurate mining models and more interesting results. Thus, it is expected that the diagnosis generated by RSAPP can complement the KDD (Knowledge Discovery in Database) process, reducing the time spent on activities of understanding and reducing data dimensionality. This work presents a detailed description about the implemented algorithm, as well as the report of the executed tests. At the end there is an empirical analysis of the results, in order to estimate the effectiveness of the proposed algorithm.
publishDate 2013
dc.date.accessioned.fl_str_mv 2013-11-12T11:38:27Z
dc.date.available.fl_str_mv 2013-11-12T11:38:27Z
dc.date.issued.fl_str_mv 2013
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10923/5544
url http://hdl.handle.net/10923/5544
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
Porto Alegre
publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
Porto Alegre
dc.source.none.fl_str_mv reponame:Repositório Institucional PUCRS
instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron:PUC_RS
instname_str Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron_str PUC_RS
institution PUC_RS
reponame_str Repositório Institucional PUCRS
collection Repositório Institucional PUCRS
bitstream.url.fl_str_mv http://meriva.pucrs.br:8080/jspui/bitstream/10923/5544/1/000451416-Texto%2BCompleto-0.pdf
http://meriva.pucrs.br:8080/jspui/bitstream/10923/5544/2/license.txt
http://meriva.pucrs.br:8080/jspui/bitstream/10923/5544/3/000451416-Texto%2BCompleto-0.pdf.txt
bitstream.checksum.fl_str_mv 00990626e7c5d4d2d585832062bda2f3
3d470ad030ca6782c9f44a1fb7650ec0
a432cb3aa283fbba107dd09583e5ccfb
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional PUCRS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
repository.mail.fl_str_mv
_version_ 1817559055294529536