RSAPP, um algoritmo baseado em rough sets para auxílio ao processo de descoberta de conhecimento em banco de dados
Autor(a) principal: | |
---|---|
Data de Publicação: | 2013 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional PUCRS |
Texto Completo: | http://hdl.handle.net/10923/5544 |
Resumo: | Techniques of Business Intelligence (BI) became one of the main allies of organizations in tasks of transforming data into knowledge, supporting the middle and upper management levels in decision making. BI tools in their composition are based on techniques of knowledge management, such as Data Warehouse (DW), OLAP (Online Analytical Processing), Data Mining (DM), among others. In this context, it is observed that in many case, DM projects become unfeasible by some factors, such as project costs, duration and specially the uncertainty in obtaining results that return the investment spent on the project. This work seeks to minimize these factors through a diagnosis on data, by an algorithm based on Rough Sets Theory. The algorithm, named Rough Set App (RSAPP) aims to create a diagnosis on data persisted in DW, in order to map which attributes have the greatest potential for generating more accurate mining models and more interesting results. Thus, it is expected that the diagnosis generated by RSAPP can complement the KDD (Knowledge Discovery in Database) process, reducing the time spent on activities of understanding and reducing data dimensionality. This work presents a detailed description about the implemented algorithm, as well as the report of the executed tests. At the end there is an empirical analysis of the results, in order to estimate the effectiveness of the proposed algorithm. |
id |
PUCR_73c873629f673082ae08a5afb978100d |
---|---|
oai_identifier_str |
oai:meriva.pucrs.br:10923/5544 |
network_acronym_str |
PUCR |
network_name_str |
Repositório Institucional PUCRS |
repository_id_str |
2753 |
spelling |
Silveira, Juliano Gomes daRuiz, Duncan Dubugras Alcoba2013-11-12T11:38:27Z2013-11-12T11:38:27Z2013http://hdl.handle.net/10923/5544Techniques of Business Intelligence (BI) became one of the main allies of organizations in tasks of transforming data into knowledge, supporting the middle and upper management levels in decision making. BI tools in their composition are based on techniques of knowledge management, such as Data Warehouse (DW), OLAP (Online Analytical Processing), Data Mining (DM), among others. In this context, it is observed that in many case, DM projects become unfeasible by some factors, such as project costs, duration and specially the uncertainty in obtaining results that return the investment spent on the project. This work seeks to minimize these factors through a diagnosis on data, by an algorithm based on Rough Sets Theory. The algorithm, named Rough Set App (RSAPP) aims to create a diagnosis on data persisted in DW, in order to map which attributes have the greatest potential for generating more accurate mining models and more interesting results. Thus, it is expected that the diagnosis generated by RSAPP can complement the KDD (Knowledge Discovery in Database) process, reducing the time spent on activities of understanding and reducing data dimensionality. This work presents a detailed description about the implemented algorithm, as well as the report of the executed tests. At the end there is an empirical analysis of the results, in order to estimate the effectiveness of the proposed algorithm.As técnicas, business intelligence (BI) firmaram-se como grandes aliadas das organizações nas tarefas de transformar dados em conhecimento, apoiando a média e alta gestão na tomada de decisões. As ferramentas de BI em sua, composição são fundadas em técnicas de gestão do conhecimento, tais como Data Warehouse (DW), OLAP (Online Analytical Processing), minaração de dados (MD), entre outras. Neste contexto, observa-se que em muitos casos, projatos de MD acabam sendo inviabilizados por alguns fatores, tais como, custo do projeto, duração e principalmente, a incerteza na obtenção de resultados que retornem o investimento despedindo no projeto. O presente trabalho busca minimizar os fatores acima por meio um diagnóstico sobre dados, através de um algoritmo baseado em Rough Sets Theory (Teoria dos Conjuntos Aproximados (TCA)). O algoritmo desenvolvido, nomeado Rough Set App (RSAPP) objetiva criar um diagnóstico sobre os dados persistidos no DW, a fim de mapear quais atributos possuem maior potencial de gerar modelos de mineração mais preciosos e resultados mais interessantes. Desta forma, entende-se que o diagnóstico gerado por RSAPP pode complementar o processo de KDD (Knowledge Discovery in database), reduzindo o tempo gasto nas atividades de entendimento e redução da dimensionalidade dos dados. No trabalho se faz uma descrição detalhada acerca do algoritmo implementado, bem como o relato dos, testes que foram executados. Ao final faz-se uma análise empírica sobre os resultados a fim de estimar a eficácia do algoritmo quanto a sua proposta.Made available in DSpace on 2013-11-12T11:38:27Z (GMT). No. of bitstreams: 1 000451416-Texto+Completo-0.pdf: 14725586 bytes, checksum: 00990626e7c5d4d2d585832062bda2f3 (MD5) Previous issue date: 2013Pontifícia Universidade Católica do Rio Grande do SulPorto AlegreINFORMÁTICABANCO DE DADOSMINERAÇÃO DE DADOS (INFORMÁTICA)RSAPP, um algoritmo baseado em rough sets para auxílio ao processo de descoberta de conhecimento em banco de dadosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisPontifícia Universidade Católica do Rio Grande do SulFaculdade de InformáticaPrograma de Pós-Graduação em Ciência da ComputaçãoMestrado2013porreponame:Repositório Institucional PUCRSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RSinfo:eu-repo/semantics/openAccessORIGINAL000451416-Texto+Completo-0.pdfTexto Completoapplication/pdf14725586http://meriva.pucrs.br:8080/jspui/bitstream/10923/5544/1/000451416-Texto%2BCompleto-0.pdf00990626e7c5d4d2d585832062bda2f3MD51LICENSElicense.txttext/plain601http://meriva.pucrs.br:8080/jspui/bitstream/10923/5544/2/license.txt3d470ad030ca6782c9f44a1fb7650ec0MD52TEXT000451416-Texto+Completo-0.pdf.txt000451416-Texto+Completo-0.pdf.txtExtracted texttext/plain4914http://meriva.pucrs.br:8080/jspui/bitstream/10923/5544/3/000451416-Texto%2BCompleto-0.pdf.txta432cb3aa283fbba107dd09583e5ccfbMD5310923/55442017-09-27 15:49:26.708oai:meriva.pucrs.br:10923/5544QXV0b3JpemHDp8OjbyBwYXJhIFB1YmxpY2HDp8OjbyBFbGV0csO0bmljYTogQ29tIGJhc2Ugbm8gZGlzcG9zdG8gbmEgTGVpIEZlZGVyYWwgbsK6OS42MTAsIGRlIDE5IGRlIGZldmVyZWlybyBkZSAxOTk4LCBBVVRPUklaTyBhIHB1YmxpY2HDp8OjbyBlbGV0csO0bmljYSBkYSBwcmVzZW50ZSBvYnJhIG5vIGFjZXJ2byBkYSBCaWJsaW90ZWNhIERpZ2l0YWwgZGEgUG9udGlmw61jaWEgVW5pdmVyc2lkYWRlIENhdMOzbGljYSBkbyBSaW8gR3JhbmRlIGRvIFN1bCwgc2VkaWFkYSBhIEF2LiBJcGlyYW5nYSA2NjgxLCBQb3J0byBBbGVncmUsIFJpbyBHcmFuZGUgZG8gU3VsLCBjb20gcmVnaXN0cm8gZGUgQ05QSiA4ODYzMDQxMzAwMDItODEgYmVtIGNvbW8gZW0gb3V0cmFzIGJpYmxpb3RlY2FzIGRpZ2l0YWlzLCBuYWNpb25haXMgZSBpbnRlcm5hY2lvbmFpcywgY29uc8OzcmNpb3MgZSByZWRlcyDDoHMgcXVhaXMgYSBiaWJsaW90ZWNhIGRhIFBVQ1JTIHBvc3NhIGEgdmlyIHBhcnRpY2lwYXIsIHNlbSDDtG51cyBhbHVzaXZvIGFvcyBkaXJlaXRvcyBhdXRvcmFpcywgYSB0w610dWxvIGRlIGRpdnVsZ2HDp8OjbyBkYSBwcm9kdcOnw6NvIGNpZW50w61maWNhLg==Repositório InstitucionalPRIhttp://repositorio.pucrs.br/oai/request?verb=Identifyopendoar:27532017-09-27T18:49:26Repositório Institucional PUCRS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false |
dc.title.pt_BR.fl_str_mv |
RSAPP, um algoritmo baseado em rough sets para auxílio ao processo de descoberta de conhecimento em banco de dados |
title |
RSAPP, um algoritmo baseado em rough sets para auxílio ao processo de descoberta de conhecimento em banco de dados |
spellingShingle |
RSAPP, um algoritmo baseado em rough sets para auxílio ao processo de descoberta de conhecimento em banco de dados Silveira, Juliano Gomes da INFORMÁTICA BANCO DE DADOS MINERAÇÃO DE DADOS (INFORMÁTICA) |
title_short |
RSAPP, um algoritmo baseado em rough sets para auxílio ao processo de descoberta de conhecimento em banco de dados |
title_full |
RSAPP, um algoritmo baseado em rough sets para auxílio ao processo de descoberta de conhecimento em banco de dados |
title_fullStr |
RSAPP, um algoritmo baseado em rough sets para auxílio ao processo de descoberta de conhecimento em banco de dados |
title_full_unstemmed |
RSAPP, um algoritmo baseado em rough sets para auxílio ao processo de descoberta de conhecimento em banco de dados |
title_sort |
RSAPP, um algoritmo baseado em rough sets para auxílio ao processo de descoberta de conhecimento em banco de dados |
author |
Silveira, Juliano Gomes da |
author_facet |
Silveira, Juliano Gomes da |
author_role |
author |
dc.contributor.author.fl_str_mv |
Silveira, Juliano Gomes da |
dc.contributor.advisor1.fl_str_mv |
Ruiz, Duncan Dubugras Alcoba |
contributor_str_mv |
Ruiz, Duncan Dubugras Alcoba |
dc.subject.por.fl_str_mv |
INFORMÁTICA BANCO DE DADOS MINERAÇÃO DE DADOS (INFORMÁTICA) |
topic |
INFORMÁTICA BANCO DE DADOS MINERAÇÃO DE DADOS (INFORMÁTICA) |
description |
Techniques of Business Intelligence (BI) became one of the main allies of organizations in tasks of transforming data into knowledge, supporting the middle and upper management levels in decision making. BI tools in their composition are based on techniques of knowledge management, such as Data Warehouse (DW), OLAP (Online Analytical Processing), Data Mining (DM), among others. In this context, it is observed that in many case, DM projects become unfeasible by some factors, such as project costs, duration and specially the uncertainty in obtaining results that return the investment spent on the project. This work seeks to minimize these factors through a diagnosis on data, by an algorithm based on Rough Sets Theory. The algorithm, named Rough Set App (RSAPP) aims to create a diagnosis on data persisted in DW, in order to map which attributes have the greatest potential for generating more accurate mining models and more interesting results. Thus, it is expected that the diagnosis generated by RSAPP can complement the KDD (Knowledge Discovery in Database) process, reducing the time spent on activities of understanding and reducing data dimensionality. This work presents a detailed description about the implemented algorithm, as well as the report of the executed tests. At the end there is an empirical analysis of the results, in order to estimate the effectiveness of the proposed algorithm. |
publishDate |
2013 |
dc.date.accessioned.fl_str_mv |
2013-11-12T11:38:27Z |
dc.date.available.fl_str_mv |
2013-11-12T11:38:27Z |
dc.date.issued.fl_str_mv |
2013 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10923/5544 |
url |
http://hdl.handle.net/10923/5544 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio Grande do Sul Porto Alegre |
publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio Grande do Sul Porto Alegre |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional PUCRS instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) instacron:PUC_RS |
instname_str |
Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
instacron_str |
PUC_RS |
institution |
PUC_RS |
reponame_str |
Repositório Institucional PUCRS |
collection |
Repositório Institucional PUCRS |
bitstream.url.fl_str_mv |
http://meriva.pucrs.br:8080/jspui/bitstream/10923/5544/1/000451416-Texto%2BCompleto-0.pdf http://meriva.pucrs.br:8080/jspui/bitstream/10923/5544/2/license.txt http://meriva.pucrs.br:8080/jspui/bitstream/10923/5544/3/000451416-Texto%2BCompleto-0.pdf.txt |
bitstream.checksum.fl_str_mv |
00990626e7c5d4d2d585832062bda2f3 3d470ad030ca6782c9f44a1fb7650ec0 a432cb3aa283fbba107dd09583e5ccfb |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional PUCRS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
repository.mail.fl_str_mv |
|
_version_ |
1817559055294529536 |