Uso de medidas de desempenho e de grau de interesse para análise de regras descobertas nos classificadores

Detalhes bibliográficos
Autor(a) principal: Rocha, Mauricio Rêgo Mota da
Data de Publicação: 2008
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações do Mackenzie
Texto Completo: http://dspace.mackenzie.br/handle/10899/24405
Resumo: The process of knowledge discovery in databases has become necessary because of the large amount of data currently stored in databases of companies. They operated properly can help the managers in decision-making in organizations. This process is composed of several steps, among them there is a data mining, stage where they are applied techniques for obtaining knowledge that can not be obtained through traditional methods of analysis. In addition to the technical, in step of data mining is also chosen the task of data mining that will be used. The data mining usually produces large amount of rules that often are not important, relevant or interesting to the end user. This makes it necessary to review the knowledge discovered in post-processing of data. In the stage of post-processing is used both measures of performance but also of degree of interest in order to sharpen the rules more interesting, useful and relevant. In this work, using a tool called WEKA (Waikato Environment for Knowledge Analysis), were applied techniques of mining, decision trees and rules of classification by the classification algorithms J48.J48 and J48.PART respectively. In the post-processing data was implemented a package with functions and procedures for calculation of both measures of performance but also of the degree of interest rules. At this stage consultations have also been developed (querys) to select the most important rules in accordance with measures of performance and degree of interest.
id UPM_92e39dca38ee9eafaa9c13ced412c8d4
oai_identifier_str oai:dspace.mackenzie.br:10899/24405
network_acronym_str UPM
network_name_str Biblioteca Digital de Teses e Dissertações do Mackenzie
repository_id_str 10277
spelling http://lattes.cnpq.br/2067336430076971Rocha, Mauricio Rêgo Mota daOmar, Nizamhttp://lattes.cnpq.br/19296705218728492016-03-15T19:38:11Z2020-05-28T18:08:43Z2008-09-022020-05-28T18:08:43Z2008-08-20The process of knowledge discovery in databases has become necessary because of the large amount of data currently stored in databases of companies. They operated properly can help the managers in decision-making in organizations. This process is composed of several steps, among them there is a data mining, stage where they are applied techniques for obtaining knowledge that can not be obtained through traditional methods of analysis. In addition to the technical, in step of data mining is also chosen the task of data mining that will be used. The data mining usually produces large amount of rules that often are not important, relevant or interesting to the end user. This makes it necessary to review the knowledge discovered in post-processing of data. In the stage of post-processing is used both measures of performance but also of degree of interest in order to sharpen the rules more interesting, useful and relevant. In this work, using a tool called WEKA (Waikato Environment for Knowledge Analysis), were applied techniques of mining, decision trees and rules of classification by the classification algorithms J48.J48 and J48.PART respectively. In the post-processing data was implemented a package with functions and procedures for calculation of both measures of performance but also of the degree of interest rules. At this stage consultations have also been developed (querys) to select the most important rules in accordance with measures of performance and degree of interest.O processo de descoberta de conhecimento em banco de dados tem se tornado necessário devido à grande quantidade de dados atualmente armazenados nas bases de dados das empresas. Esses dados devidamente explorados podem auxiliar os gestores na tomada de decisões nas organizações. Este processo é composto de várias etapas, dentre elas destaca-se a mineração de dados, etapa onde são aplicadas técnicas para obtenção de conhecimento que não podem ser obtidas através de métodos tradicionais de análise. Além das técnicas, na etapa demineração de dados também é escolhida a tarefa de mineração que será utilizada. A mineração de dados geralmente produz grande quantidade de regras que muitas vezes não são importantes, relevantes ou interessantes para o usuário final. Isto torna necessária a análise do conhecimento descoberto no pós-processamento dos dados. Na etapa de pós-processamento são utilizadas medidas tanto de desempenho como também de grau de interesse com a finalidade de apontar as regras mais interessante, úteis e relevantes. Neste trabalho, utilizando-se de uma ferramenta chamada WEKA (Waikato Environment for Knowledge Analysis), foram aplicadas as técnicas de mineração de Árvore de Decisão e de Regras de Classificação através dos algoritmos de classificação J48.J48 e J48.PART respectivamente. No pós-processamento de dados foi implementado um pacote com funções e procedimentos para cálculo das medidas tanto de desempenho como também de grau de interesse de regras. Nesta etapa também foram desenvolvidas consultas (querys) para selecionar as regras mais importantes de acordo com as medidas de desempenho e de grau de interesse.Fundo Mackenzie de Pesquisaapplication/pdfROCHA, Mauricio Rêgo Mota da. Uso de medidas de desempenho e de grau de interesse para análise de regras descobertas nos classificadores. 2008. 118 f. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Presbiteriana Mackenzie, São Paulo, 2008.http://dspace.mackenzie.br/handle/10899/24405porUniversidade Presbiteriana Mackenziedescoberta de conhecimento em banco de dadosmineração de dadospós-processamentoclassificaçãomedidas de avaliação de regrasknowledge discovery in databasesdata miningpost-processingclassificationrule evaluation measuresCNPQ::ENGENHARIAS::ENGENHARIA ELETRICAhttp://tede.mackenzie.br/jspui/retrieve/3619/Mauricio%20Rego%20Mota%20da%20Rocha.pdf.jpgUso de medidas de desempenho e de grau de interesse para análise de regras descobertas nos classificadoresinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações do Mackenzieinstname:Universidade Presbiteriana Mackenzie (MACKENZIE)instacron:MACKENZIELima, Clodoaldo Aparecido de Moraeshttp://lattes.cnpq.br/3017337174053381Pimentel, Edson Pinheirohttp://lattes.cnpq.br/6163089025212520BREngenharia ElétricaUPMEngenharia ElétricaORIGINALMauricio Rego Mota da Rocha.pdfMauricio Rego Mota da Rocha.pdfapplication/pdf915128https://dspace.mackenzie.br/bitstreams/05a7b388-9acc-4576-9a26-9b9f9de22844/downloaded4572db1a30b2e1d7cfa5f65d885c86MD51TEXTMauricio Rego Mota da Rocha.pdf.txtMauricio Rego Mota da Rocha.pdf.txtExtracted texttext/plain213653https://dspace.mackenzie.br/bitstreams/1169df85-1e3c-4443-9450-0f21bb245647/download201d0af8d2afbd1c508a3f1d2e7bfc73MD52THUMBNAILMauricio Rego Mota da Rocha.pdf.jpgMauricio Rego Mota da Rocha.pdf.jpgGenerated Thumbnailimage/jpeg1250https://dspace.mackenzie.br/bitstreams/4726f365-8efc-4985-92a4-e1e17c2abb5d/download74b7276bdbc98783b665b4141c02758dMD5310899/244052022-03-14 17:04:07.284oai:dspace.mackenzie.br:10899/24405https://dspace.mackenzie.brBiblioteca Digital de Teses e Dissertaçõeshttp://tede.mackenzie.br/jspui/PRIhttps://adelpha-api.mackenzie.br/server/oai/repositorio@mackenzie.br||paola.damato@mackenzie.bropendoar:102772022-03-14T17:04:07Biblioteca Digital de Teses e Dissertações do Mackenzie - Universidade Presbiteriana Mackenzie (MACKENZIE)false
dc.title.por.fl_str_mv Uso de medidas de desempenho e de grau de interesse para análise de regras descobertas nos classificadores
title Uso de medidas de desempenho e de grau de interesse para análise de regras descobertas nos classificadores
spellingShingle Uso de medidas de desempenho e de grau de interesse para análise de regras descobertas nos classificadores
Rocha, Mauricio Rêgo Mota da
descoberta de conhecimento em banco de dados
mineração de dados
pós-processamento
classificação
medidas de avaliação de regras
knowledge discovery in databases
data mining
post-processing
classification
rule evaluation measures
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
title_short Uso de medidas de desempenho e de grau de interesse para análise de regras descobertas nos classificadores
title_full Uso de medidas de desempenho e de grau de interesse para análise de regras descobertas nos classificadores
title_fullStr Uso de medidas de desempenho e de grau de interesse para análise de regras descobertas nos classificadores
title_full_unstemmed Uso de medidas de desempenho e de grau de interesse para análise de regras descobertas nos classificadores
title_sort Uso de medidas de desempenho e de grau de interesse para análise de regras descobertas nos classificadores
author Rocha, Mauricio Rêgo Mota da
author_facet Rocha, Mauricio Rêgo Mota da
author_role author
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/2067336430076971
dc.contributor.author.fl_str_mv Rocha, Mauricio Rêgo Mota da
dc.contributor.advisor1.fl_str_mv Omar, Nizam
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/1929670521872849
contributor_str_mv Omar, Nizam
dc.subject.por.fl_str_mv descoberta de conhecimento em banco de dados
mineração de dados
pós-processamento
classificação
medidas de avaliação de regras
topic descoberta de conhecimento em banco de dados
mineração de dados
pós-processamento
classificação
medidas de avaliação de regras
knowledge discovery in databases
data mining
post-processing
classification
rule evaluation measures
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
dc.subject.eng.fl_str_mv knowledge discovery in databases
data mining
post-processing
classification
rule evaluation measures
dc.subject.cnpq.fl_str_mv CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
description The process of knowledge discovery in databases has become necessary because of the large amount of data currently stored in databases of companies. They operated properly can help the managers in decision-making in organizations. This process is composed of several steps, among them there is a data mining, stage where they are applied techniques for obtaining knowledge that can not be obtained through traditional methods of analysis. In addition to the technical, in step of data mining is also chosen the task of data mining that will be used. The data mining usually produces large amount of rules that often are not important, relevant or interesting to the end user. This makes it necessary to review the knowledge discovered in post-processing of data. In the stage of post-processing is used both measures of performance but also of degree of interest in order to sharpen the rules more interesting, useful and relevant. In this work, using a tool called WEKA (Waikato Environment for Knowledge Analysis), were applied techniques of mining, decision trees and rules of classification by the classification algorithms J48.J48 and J48.PART respectively. In the post-processing data was implemented a package with functions and procedures for calculation of both measures of performance but also of the degree of interest rules. At this stage consultations have also been developed (querys) to select the most important rules in accordance with measures of performance and degree of interest.
publishDate 2008
dc.date.available.fl_str_mv 2008-09-02
2020-05-28T18:08:43Z
dc.date.issued.fl_str_mv 2008-08-20
dc.date.accessioned.fl_str_mv 2016-03-15T19:38:11Z
2020-05-28T18:08:43Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv ROCHA, Mauricio Rêgo Mota da. Uso de medidas de desempenho e de grau de interesse para análise de regras descobertas nos classificadores. 2008. 118 f. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Presbiteriana Mackenzie, São Paulo, 2008.
dc.identifier.uri.fl_str_mv http://dspace.mackenzie.br/handle/10899/24405
identifier_str_mv ROCHA, Mauricio Rêgo Mota da. Uso de medidas de desempenho e de grau de interesse para análise de regras descobertas nos classificadores. 2008. 118 f. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Presbiteriana Mackenzie, São Paulo, 2008.
url http://dspace.mackenzie.br/handle/10899/24405
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Presbiteriana Mackenzie
publisher.none.fl_str_mv Universidade Presbiteriana Mackenzie
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações do Mackenzie
instname:Universidade Presbiteriana Mackenzie (MACKENZIE)
instacron:MACKENZIE
instname_str Universidade Presbiteriana Mackenzie (MACKENZIE)
instacron_str MACKENZIE
institution MACKENZIE
reponame_str Biblioteca Digital de Teses e Dissertações do Mackenzie
collection Biblioteca Digital de Teses e Dissertações do Mackenzie
bitstream.url.fl_str_mv https://dspace.mackenzie.br/bitstreams/05a7b388-9acc-4576-9a26-9b9f9de22844/download
https://dspace.mackenzie.br/bitstreams/1169df85-1e3c-4443-9450-0f21bb245647/download
https://dspace.mackenzie.br/bitstreams/4726f365-8efc-4985-92a4-e1e17c2abb5d/download
bitstream.checksum.fl_str_mv ed4572db1a30b2e1d7cfa5f65d885c86
201d0af8d2afbd1c508a3f1d2e7bfc73
74b7276bdbc98783b665b4141c02758d
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações do Mackenzie - Universidade Presbiteriana Mackenzie (MACKENZIE)
repository.mail.fl_str_mv repositorio@mackenzie.br||paola.damato@mackenzie.br
_version_ 1813820043477123072