Uso de medidas de desempenho e de grau de interesse para análise de regras descobertas nos classificadores
Autor(a) principal: | |
---|---|
Data de Publicação: | 2008 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações do Mackenzie |
Texto Completo: | http://dspace.mackenzie.br/handle/10899/24405 |
Resumo: | The process of knowledge discovery in databases has become necessary because of the large amount of data currently stored in databases of companies. They operated properly can help the managers in decision-making in organizations. This process is composed of several steps, among them there is a data mining, stage where they are applied techniques for obtaining knowledge that can not be obtained through traditional methods of analysis. In addition to the technical, in step of data mining is also chosen the task of data mining that will be used. The data mining usually produces large amount of rules that often are not important, relevant or interesting to the end user. This makes it necessary to review the knowledge discovered in post-processing of data. In the stage of post-processing is used both measures of performance but also of degree of interest in order to sharpen the rules more interesting, useful and relevant. In this work, using a tool called WEKA (Waikato Environment for Knowledge Analysis), were applied techniques of mining, decision trees and rules of classification by the classification algorithms J48.J48 and J48.PART respectively. In the post-processing data was implemented a package with functions and procedures for calculation of both measures of performance but also of the degree of interest rules. At this stage consultations have also been developed (querys) to select the most important rules in accordance with measures of performance and degree of interest. |
id |
UPM_92e39dca38ee9eafaa9c13ced412c8d4 |
---|---|
oai_identifier_str |
oai:dspace.mackenzie.br:10899/24405 |
network_acronym_str |
UPM |
network_name_str |
Biblioteca Digital de Teses e Dissertações do Mackenzie |
repository_id_str |
10277 |
spelling |
http://lattes.cnpq.br/2067336430076971Rocha, Mauricio Rêgo Mota daOmar, Nizamhttp://lattes.cnpq.br/19296705218728492016-03-15T19:38:11Z2020-05-28T18:08:43Z2008-09-022020-05-28T18:08:43Z2008-08-20The process of knowledge discovery in databases has become necessary because of the large amount of data currently stored in databases of companies. They operated properly can help the managers in decision-making in organizations. This process is composed of several steps, among them there is a data mining, stage where they are applied techniques for obtaining knowledge that can not be obtained through traditional methods of analysis. In addition to the technical, in step of data mining is also chosen the task of data mining that will be used. The data mining usually produces large amount of rules that often are not important, relevant or interesting to the end user. This makes it necessary to review the knowledge discovered in post-processing of data. In the stage of post-processing is used both measures of performance but also of degree of interest in order to sharpen the rules more interesting, useful and relevant. In this work, using a tool called WEKA (Waikato Environment for Knowledge Analysis), were applied techniques of mining, decision trees and rules of classification by the classification algorithms J48.J48 and J48.PART respectively. In the post-processing data was implemented a package with functions and procedures for calculation of both measures of performance but also of the degree of interest rules. At this stage consultations have also been developed (querys) to select the most important rules in accordance with measures of performance and degree of interest.O processo de descoberta de conhecimento em banco de dados tem se tornado necessário devido à grande quantidade de dados atualmente armazenados nas bases de dados das empresas. Esses dados devidamente explorados podem auxiliar os gestores na tomada de decisões nas organizações. Este processo é composto de várias etapas, dentre elas destaca-se a mineração de dados, etapa onde são aplicadas técnicas para obtenção de conhecimento que não podem ser obtidas através de métodos tradicionais de análise. Além das técnicas, na etapa demineração de dados também é escolhida a tarefa de mineração que será utilizada. A mineração de dados geralmente produz grande quantidade de regras que muitas vezes não são importantes, relevantes ou interessantes para o usuário final. Isto torna necessária a análise do conhecimento descoberto no pós-processamento dos dados. Na etapa de pós-processamento são utilizadas medidas tanto de desempenho como também de grau de interesse com a finalidade de apontar as regras mais interessante, úteis e relevantes. Neste trabalho, utilizando-se de uma ferramenta chamada WEKA (Waikato Environment for Knowledge Analysis), foram aplicadas as técnicas de mineração de Árvore de Decisão e de Regras de Classificação através dos algoritmos de classificação J48.J48 e J48.PART respectivamente. No pós-processamento de dados foi implementado um pacote com funções e procedimentos para cálculo das medidas tanto de desempenho como também de grau de interesse de regras. Nesta etapa também foram desenvolvidas consultas (querys) para selecionar as regras mais importantes de acordo com as medidas de desempenho e de grau de interesse.Fundo Mackenzie de Pesquisaapplication/pdfROCHA, Mauricio Rêgo Mota da. Uso de medidas de desempenho e de grau de interesse para análise de regras descobertas nos classificadores. 2008. 118 f. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Presbiteriana Mackenzie, São Paulo, 2008.http://dspace.mackenzie.br/handle/10899/24405porUniversidade Presbiteriana Mackenziedescoberta de conhecimento em banco de dadosmineração de dadospós-processamentoclassificaçãomedidas de avaliação de regrasknowledge discovery in databasesdata miningpost-processingclassificationrule evaluation measuresCNPQ::ENGENHARIAS::ENGENHARIA ELETRICAhttp://tede.mackenzie.br/jspui/retrieve/3619/Mauricio%20Rego%20Mota%20da%20Rocha.pdf.jpgUso de medidas de desempenho e de grau de interesse para análise de regras descobertas nos classificadoresinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações do Mackenzieinstname:Universidade Presbiteriana Mackenzie (MACKENZIE)instacron:MACKENZIELima, Clodoaldo Aparecido de Moraeshttp://lattes.cnpq.br/3017337174053381Pimentel, Edson Pinheirohttp://lattes.cnpq.br/6163089025212520BREngenharia ElétricaUPMEngenharia ElétricaORIGINALMauricio Rego Mota da Rocha.pdfMauricio Rego Mota da Rocha.pdfapplication/pdf915128https://dspace.mackenzie.br/bitstreams/05a7b388-9acc-4576-9a26-9b9f9de22844/downloaded4572db1a30b2e1d7cfa5f65d885c86MD51TEXTMauricio Rego Mota da Rocha.pdf.txtMauricio Rego Mota da Rocha.pdf.txtExtracted texttext/plain213653https://dspace.mackenzie.br/bitstreams/1169df85-1e3c-4443-9450-0f21bb245647/download201d0af8d2afbd1c508a3f1d2e7bfc73MD52THUMBNAILMauricio Rego Mota da Rocha.pdf.jpgMauricio Rego Mota da Rocha.pdf.jpgGenerated Thumbnailimage/jpeg1250https://dspace.mackenzie.br/bitstreams/4726f365-8efc-4985-92a4-e1e17c2abb5d/download74b7276bdbc98783b665b4141c02758dMD5310899/244052022-03-14 17:04:07.284oai:dspace.mackenzie.br:10899/24405https://dspace.mackenzie.brBiblioteca Digital de Teses e Dissertaçõeshttp://tede.mackenzie.br/jspui/PRIhttps://adelpha-api.mackenzie.br/server/oai/repositorio@mackenzie.br||paola.damato@mackenzie.bropendoar:102772022-03-14T17:04:07Biblioteca Digital de Teses e Dissertações do Mackenzie - Universidade Presbiteriana Mackenzie (MACKENZIE)false |
dc.title.por.fl_str_mv |
Uso de medidas de desempenho e de grau de interesse para análise de regras descobertas nos classificadores |
title |
Uso de medidas de desempenho e de grau de interesse para análise de regras descobertas nos classificadores |
spellingShingle |
Uso de medidas de desempenho e de grau de interesse para análise de regras descobertas nos classificadores Rocha, Mauricio Rêgo Mota da descoberta de conhecimento em banco de dados mineração de dados pós-processamento classificação medidas de avaliação de regras knowledge discovery in databases data mining post-processing classification rule evaluation measures CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA |
title_short |
Uso de medidas de desempenho e de grau de interesse para análise de regras descobertas nos classificadores |
title_full |
Uso de medidas de desempenho e de grau de interesse para análise de regras descobertas nos classificadores |
title_fullStr |
Uso de medidas de desempenho e de grau de interesse para análise de regras descobertas nos classificadores |
title_full_unstemmed |
Uso de medidas de desempenho e de grau de interesse para análise de regras descobertas nos classificadores |
title_sort |
Uso de medidas de desempenho e de grau de interesse para análise de regras descobertas nos classificadores |
author |
Rocha, Mauricio Rêgo Mota da |
author_facet |
Rocha, Mauricio Rêgo Mota da |
author_role |
author |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/2067336430076971 |
dc.contributor.author.fl_str_mv |
Rocha, Mauricio Rêgo Mota da |
dc.contributor.advisor1.fl_str_mv |
Omar, Nizam |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/1929670521872849 |
contributor_str_mv |
Omar, Nizam |
dc.subject.por.fl_str_mv |
descoberta de conhecimento em banco de dados mineração de dados pós-processamento classificação medidas de avaliação de regras |
topic |
descoberta de conhecimento em banco de dados mineração de dados pós-processamento classificação medidas de avaliação de regras knowledge discovery in databases data mining post-processing classification rule evaluation measures CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA |
dc.subject.eng.fl_str_mv |
knowledge discovery in databases data mining post-processing classification rule evaluation measures |
dc.subject.cnpq.fl_str_mv |
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA |
description |
The process of knowledge discovery in databases has become necessary because of the large amount of data currently stored in databases of companies. They operated properly can help the managers in decision-making in organizations. This process is composed of several steps, among them there is a data mining, stage where they are applied techniques for obtaining knowledge that can not be obtained through traditional methods of analysis. In addition to the technical, in step of data mining is also chosen the task of data mining that will be used. The data mining usually produces large amount of rules that often are not important, relevant or interesting to the end user. This makes it necessary to review the knowledge discovered in post-processing of data. In the stage of post-processing is used both measures of performance but also of degree of interest in order to sharpen the rules more interesting, useful and relevant. In this work, using a tool called WEKA (Waikato Environment for Knowledge Analysis), were applied techniques of mining, decision trees and rules of classification by the classification algorithms J48.J48 and J48.PART respectively. In the post-processing data was implemented a package with functions and procedures for calculation of both measures of performance but also of the degree of interest rules. At this stage consultations have also been developed (querys) to select the most important rules in accordance with measures of performance and degree of interest. |
publishDate |
2008 |
dc.date.available.fl_str_mv |
2008-09-02 2020-05-28T18:08:43Z |
dc.date.issued.fl_str_mv |
2008-08-20 |
dc.date.accessioned.fl_str_mv |
2016-03-15T19:38:11Z 2020-05-28T18:08:43Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
ROCHA, Mauricio Rêgo Mota da. Uso de medidas de desempenho e de grau de interesse para análise de regras descobertas nos classificadores. 2008. 118 f. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Presbiteriana Mackenzie, São Paulo, 2008. |
dc.identifier.uri.fl_str_mv |
http://dspace.mackenzie.br/handle/10899/24405 |
identifier_str_mv |
ROCHA, Mauricio Rêgo Mota da. Uso de medidas de desempenho e de grau de interesse para análise de regras descobertas nos classificadores. 2008. 118 f. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Presbiteriana Mackenzie, São Paulo, 2008. |
url |
http://dspace.mackenzie.br/handle/10899/24405 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Presbiteriana Mackenzie |
publisher.none.fl_str_mv |
Universidade Presbiteriana Mackenzie |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações do Mackenzie instname:Universidade Presbiteriana Mackenzie (MACKENZIE) instacron:MACKENZIE |
instname_str |
Universidade Presbiteriana Mackenzie (MACKENZIE) |
instacron_str |
MACKENZIE |
institution |
MACKENZIE |
reponame_str |
Biblioteca Digital de Teses e Dissertações do Mackenzie |
collection |
Biblioteca Digital de Teses e Dissertações do Mackenzie |
bitstream.url.fl_str_mv |
https://dspace.mackenzie.br/bitstreams/05a7b388-9acc-4576-9a26-9b9f9de22844/download https://dspace.mackenzie.br/bitstreams/1169df85-1e3c-4443-9450-0f21bb245647/download https://dspace.mackenzie.br/bitstreams/4726f365-8efc-4985-92a4-e1e17c2abb5d/download |
bitstream.checksum.fl_str_mv |
ed4572db1a30b2e1d7cfa5f65d885c86 201d0af8d2afbd1c508a3f1d2e7bfc73 74b7276bdbc98783b665b4141c02758d |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações do Mackenzie - Universidade Presbiteriana Mackenzie (MACKENZIE) |
repository.mail.fl_str_mv |
repositorio@mackenzie.br||paola.damato@mackenzie.br |
_version_ |
1813820043477123072 |