INTERESSABILIDADE DE MODELOS DE REGRESSÃO EM MINERAÇÃO DE DADOS AGRÍCOLAS

Detalhes bibliográficos
Autor(a) principal: Estevam Junior, Valter Luís
Data de Publicação: 2015
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UEPG
Texto Completo: http://tede2.uepg.br/jspui/handle/prefix/121
Resumo: The interestingness area of data mining process aiming to reduce the amount of models to be analyzed for experts in the interpretation step of the knowledge discovery in databases. In this work, a method for analysis the interestingness of regression models was developed. This method combine probabilistic multivariate models with Pearson correlation test and Wilcoxon signed-rank test resulting in a new interestingness measure, named Impact. The developed method was applied over regression models found during a data mining process for estimating agricultural gypsum requirements. The results showed that the probabilistic multivariate filter was able to filter the best models according to a utility-based approach, in this case, for practical application on agriculture. Six models were considered interesting, with Impact score > 0.5, and only one was miscategorized. On the other hand, the combined statistical test filters were able to filter six models two of them were miscategorized. The attributes identified as most relevant to estimate gypsum rate were: time, Ca and its concentration on effective cation exchange capacity (CaCTCe), mainly in superficial layers.
id UEPG_f5e895b0d69ceb33839ddb0e68b2eded
oai_identifier_str oai:tede2.uepg.br:prefix/121
network_acronym_str UEPG
network_name_str Biblioteca Digital de Teses e Dissertações da UEPG
repository_id_str
spelling Guimarães, Alaine MargareteCPF:70608040991http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4705808J570608040991Caires, Eduardo FáveroCPF:07143754897http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4796865P7Pozo, Aurora Trinidad RamirezCPF:55168760953http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4728283P4Garbuio, Fernando JoséCPF:03350990924http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4700229A1CPF:06631127963http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4278255D3Estevam Junior, Valter Luís2017-07-21T14:19:22Z2015-07-032017-07-21T14:19:22Z2015-02-26ESTEVAM JUNIOR, Valter Luís. INTERESSABILIDADE DE MODELOS DE REGRESSÃO EM MINERAÇÃO DE DADOS AGRÍCOLAS. 2015. 82 f. Dissertação (Mestrado em Computação para Tecnologias em Agricultura) - UNIVERSIDADE ESTADUAL DE PONTA GROSSA, Ponta Grossa, 2015.http://tede2.uepg.br/jspui/handle/prefix/121The interestingness area of data mining process aiming to reduce the amount of models to be analyzed for experts in the interpretation step of the knowledge discovery in databases. In this work, a method for analysis the interestingness of regression models was developed. This method combine probabilistic multivariate models with Pearson correlation test and Wilcoxon signed-rank test resulting in a new interestingness measure, named Impact. The developed method was applied over regression models found during a data mining process for estimating agricultural gypsum requirements. The results showed that the probabilistic multivariate filter was able to filter the best models according to a utility-based approach, in this case, for practical application on agriculture. Six models were considered interesting, with Impact score > 0.5, and only one was miscategorized. On the other hand, the combined statistical test filters were able to filter six models two of them were miscategorized. The attributes identified as most relevant to estimate gypsum rate were: time, Ca and its concentration on effective cation exchange capacity (CaCTCe), mainly in superficial layers.A interessabilidade de regras é uma área da mineração de dados que tem por objetivo reduzir a quantidade de modelos a serem analisados por especialistas na etapa de interpretação do conhecimento descoberto em bases de dados. Embora existam várias medidas de interesse de regras voltadas para as tarefas de associação e classificação, observa-se uma falta de métodos consolidados para análise de interessabilidade de modelos de regressão. Neste trabalho foi desenvolvido um método para analisar a interessabilidade de modelos de regressão, o qual combina um filtro baseado em modelos probabilísticos multivariados com filtros baseados em testes estatísticos de correlação de Pearson e de postos de sinais de Wilcoxon, resultando em uma nova medida de interessabilidade denominada Impacto. O método desenvolvido foi aplicado sobre modelos de regressão encontrados no processo de mineração de dados para estimativa de gesso agrícola. Estes dados resultam de três experimentos sob Sistema Plantio Direto realizados na Região dos Campos Gerais, PR, nos quais foram medidos, em diferentes épocas, os teores dos nutrientes do solo após a aplicação de doses de gesso. Os resultados mostraram que o filtro probabilístico multivariado foi capaz de filtrar os melhores modelos segundo uma visão de utilidade, ou seja, de potencial de aplicação agronômica. Foram selecionados seis modelos com score de Impacto > 0,5, ou seja, considerados interessantes, e destes apenas um foi considerado incorretamente classificado. Por outro lado, os filtros baseados em testes estatísticos foram capazes de filtrar seis modelos sendo que dois deles podem ser considerados incorretamente classificados. Os atributos identificados como mais relevantes para o problema do gesso agrícola foram a época, o teor de Ca e a concentração de Ca em relação à capacidade de troca catiônica efetiva (CTCe), especialmente em camadas superficiais do solo.Made available in DSpace on 2017-07-21T14:19:22Z (GMT). No. of bitstreams: 1 Valter Luis.pdf: 3516533 bytes, checksum: d498d5c67dd1b9a837a128c20cabef67 (MD5) Previous issue date: 2015-02-26application/pdfporUNIVERSIDADE ESTADUAL DE PONTA GROSSAPrograma de Pós Graduação Computação AplicadaUEPGBRComputação para Tecnologias em Agriculturagesso agrícolaredes bayesianassensitividadeimpactogypsumbayesian networkssensitivityimpactCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOINTERESSABILIDADE DE MODELOS DE REGRESSÃO EM MINERAÇÃO DE DADOS AGRÍCOLASinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UEPGinstname:Universidade Estadual de Ponta Grossa (UEPG)instacron:UEPGORIGINALValter Luis.pdfapplication/pdf3516533http://tede2.uepg.br/jspui/bitstream/prefix/121/1/Valter%20Luis.pdfd498d5c67dd1b9a837a128c20cabef67MD51prefix/1212017-07-21 11:19:22.194oai:tede2.uepg.br:prefix/121Biblioteca Digital de Teses e Dissertaçõeshttps://tede2.uepg.br/jspui/PUBhttp://tede2.uepg.br/oai/requestbicen@uepg.br||mv_fidelis@yahoo.com.bropendoar:2017-07-21T14:19:22Biblioteca Digital de Teses e Dissertações da UEPG - Universidade Estadual de Ponta Grossa (UEPG)false
dc.title.por.fl_str_mv INTERESSABILIDADE DE MODELOS DE REGRESSÃO EM MINERAÇÃO DE DADOS AGRÍCOLAS
title INTERESSABILIDADE DE MODELOS DE REGRESSÃO EM MINERAÇÃO DE DADOS AGRÍCOLAS
spellingShingle INTERESSABILIDADE DE MODELOS DE REGRESSÃO EM MINERAÇÃO DE DADOS AGRÍCOLAS
Estevam Junior, Valter Luís
gesso agrícola
redes bayesianas
sensitividade
impacto
gypsum
bayesian networks
sensitivity
impact
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short INTERESSABILIDADE DE MODELOS DE REGRESSÃO EM MINERAÇÃO DE DADOS AGRÍCOLAS
title_full INTERESSABILIDADE DE MODELOS DE REGRESSÃO EM MINERAÇÃO DE DADOS AGRÍCOLAS
title_fullStr INTERESSABILIDADE DE MODELOS DE REGRESSÃO EM MINERAÇÃO DE DADOS AGRÍCOLAS
title_full_unstemmed INTERESSABILIDADE DE MODELOS DE REGRESSÃO EM MINERAÇÃO DE DADOS AGRÍCOLAS
title_sort INTERESSABILIDADE DE MODELOS DE REGRESSÃO EM MINERAÇÃO DE DADOS AGRÍCOLAS
author Estevam Junior, Valter Luís
author_facet Estevam Junior, Valter Luís
author_role author
dc.contributor.advisor1.fl_str_mv Guimarães, Alaine Margarete
dc.contributor.advisor1ID.fl_str_mv CPF:70608040991
dc.contributor.advisor1Lattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4705808J570608040991
dc.contributor.advisor-co1.fl_str_mv Caires, Eduardo Fávero
dc.contributor.advisor-co1ID.fl_str_mv CPF:07143754897
dc.contributor.advisor-co1Lattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4796865P7
dc.contributor.referee1.fl_str_mv Pozo, Aurora Trinidad Ramirez
dc.contributor.referee1ID.fl_str_mv CPF:55168760953
dc.contributor.referee1Lattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4728283P4
dc.contributor.referee2.fl_str_mv Garbuio, Fernando José
dc.contributor.referee2ID.fl_str_mv CPF:03350990924
dc.contributor.referee2Lattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4700229A1
dc.contributor.authorID.fl_str_mv CPF:06631127963
dc.contributor.authorLattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4278255D3
dc.contributor.author.fl_str_mv Estevam Junior, Valter Luís
contributor_str_mv Guimarães, Alaine Margarete
Caires, Eduardo Fávero
Pozo, Aurora Trinidad Ramirez
Garbuio, Fernando José
dc.subject.por.fl_str_mv gesso agrícola
redes bayesianas
sensitividade
impacto
topic gesso agrícola
redes bayesianas
sensitividade
impacto
gypsum
bayesian networks
sensitivity
impact
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.eng.fl_str_mv gypsum
bayesian networks
sensitivity
impact
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description The interestingness area of data mining process aiming to reduce the amount of models to be analyzed for experts in the interpretation step of the knowledge discovery in databases. In this work, a method for analysis the interestingness of regression models was developed. This method combine probabilistic multivariate models with Pearson correlation test and Wilcoxon signed-rank test resulting in a new interestingness measure, named Impact. The developed method was applied over regression models found during a data mining process for estimating agricultural gypsum requirements. The results showed that the probabilistic multivariate filter was able to filter the best models according to a utility-based approach, in this case, for practical application on agriculture. Six models were considered interesting, with Impact score > 0.5, and only one was miscategorized. On the other hand, the combined statistical test filters were able to filter six models two of them were miscategorized. The attributes identified as most relevant to estimate gypsum rate were: time, Ca and its concentration on effective cation exchange capacity (CaCTCe), mainly in superficial layers.
publishDate 2015
dc.date.available.fl_str_mv 2015-07-03
2017-07-21T14:19:22Z
dc.date.issued.fl_str_mv 2015-02-26
dc.date.accessioned.fl_str_mv 2017-07-21T14:19:22Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv ESTEVAM JUNIOR, Valter Luís. INTERESSABILIDADE DE MODELOS DE REGRESSÃO EM MINERAÇÃO DE DADOS AGRÍCOLAS. 2015. 82 f. Dissertação (Mestrado em Computação para Tecnologias em Agricultura) - UNIVERSIDADE ESTADUAL DE PONTA GROSSA, Ponta Grossa, 2015.
dc.identifier.uri.fl_str_mv http://tede2.uepg.br/jspui/handle/prefix/121
identifier_str_mv ESTEVAM JUNIOR, Valter Luís. INTERESSABILIDADE DE MODELOS DE REGRESSÃO EM MINERAÇÃO DE DADOS AGRÍCOLAS. 2015. 82 f. Dissertação (Mestrado em Computação para Tecnologias em Agricultura) - UNIVERSIDADE ESTADUAL DE PONTA GROSSA, Ponta Grossa, 2015.
url http://tede2.uepg.br/jspui/handle/prefix/121
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv UNIVERSIDADE ESTADUAL DE PONTA GROSSA
dc.publisher.program.fl_str_mv Programa de Pós Graduação Computação Aplicada
dc.publisher.initials.fl_str_mv UEPG
dc.publisher.country.fl_str_mv BR
dc.publisher.department.fl_str_mv Computação para Tecnologias em Agricultura
publisher.none.fl_str_mv UNIVERSIDADE ESTADUAL DE PONTA GROSSA
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UEPG
instname:Universidade Estadual de Ponta Grossa (UEPG)
instacron:UEPG
instname_str Universidade Estadual de Ponta Grossa (UEPG)
instacron_str UEPG
institution UEPG
reponame_str Biblioteca Digital de Teses e Dissertações da UEPG
collection Biblioteca Digital de Teses e Dissertações da UEPG
bitstream.url.fl_str_mv http://tede2.uepg.br/jspui/bitstream/prefix/121/1/Valter%20Luis.pdf
bitstream.checksum.fl_str_mv d498d5c67dd1b9a837a128c20cabef67
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UEPG - Universidade Estadual de Ponta Grossa (UEPG)
repository.mail.fl_str_mv bicen@uepg.br||mv_fidelis@yahoo.com.br
_version_ 1809460446246207488