INTERESSABILIDADE DE MODELOS DE REGRESSÃO EM MINERAÇÃO DE DADOS AGRÍCOLAS
Autor(a) principal: | |
---|---|
Data de Publicação: | 2015 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UEPG |
Texto Completo: | http://tede2.uepg.br/jspui/handle/prefix/121 |
Resumo: | The interestingness area of data mining process aiming to reduce the amount of models to be analyzed for experts in the interpretation step of the knowledge discovery in databases. In this work, a method for analysis the interestingness of regression models was developed. This method combine probabilistic multivariate models with Pearson correlation test and Wilcoxon signed-rank test resulting in a new interestingness measure, named Impact. The developed method was applied over regression models found during a data mining process for estimating agricultural gypsum requirements. The results showed that the probabilistic multivariate filter was able to filter the best models according to a utility-based approach, in this case, for practical application on agriculture. Six models were considered interesting, with Impact score > 0.5, and only one was miscategorized. On the other hand, the combined statistical test filters were able to filter six models two of them were miscategorized. The attributes identified as most relevant to estimate gypsum rate were: time, Ca and its concentration on effective cation exchange capacity (CaCTCe), mainly in superficial layers. |
id |
UEPG_f5e895b0d69ceb33839ddb0e68b2eded |
---|---|
oai_identifier_str |
oai:tede2.uepg.br:prefix/121 |
network_acronym_str |
UEPG |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UEPG |
repository_id_str |
|
spelling |
Guimarães, Alaine MargareteCPF:70608040991http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4705808J570608040991Caires, Eduardo FáveroCPF:07143754897http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4796865P7Pozo, Aurora Trinidad RamirezCPF:55168760953http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4728283P4Garbuio, Fernando JoséCPF:03350990924http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4700229A1CPF:06631127963http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4278255D3Estevam Junior, Valter Luís2017-07-21T14:19:22Z2015-07-032017-07-21T14:19:22Z2015-02-26ESTEVAM JUNIOR, Valter Luís. INTERESSABILIDADE DE MODELOS DE REGRESSÃO EM MINERAÇÃO DE DADOS AGRÍCOLAS. 2015. 82 f. Dissertação (Mestrado em Computação para Tecnologias em Agricultura) - UNIVERSIDADE ESTADUAL DE PONTA GROSSA, Ponta Grossa, 2015.http://tede2.uepg.br/jspui/handle/prefix/121The interestingness area of data mining process aiming to reduce the amount of models to be analyzed for experts in the interpretation step of the knowledge discovery in databases. In this work, a method for analysis the interestingness of regression models was developed. This method combine probabilistic multivariate models with Pearson correlation test and Wilcoxon signed-rank test resulting in a new interestingness measure, named Impact. The developed method was applied over regression models found during a data mining process for estimating agricultural gypsum requirements. The results showed that the probabilistic multivariate filter was able to filter the best models according to a utility-based approach, in this case, for practical application on agriculture. Six models were considered interesting, with Impact score > 0.5, and only one was miscategorized. On the other hand, the combined statistical test filters were able to filter six models two of them were miscategorized. The attributes identified as most relevant to estimate gypsum rate were: time, Ca and its concentration on effective cation exchange capacity (CaCTCe), mainly in superficial layers.A interessabilidade de regras é uma área da mineração de dados que tem por objetivo reduzir a quantidade de modelos a serem analisados por especialistas na etapa de interpretação do conhecimento descoberto em bases de dados. Embora existam várias medidas de interesse de regras voltadas para as tarefas de associação e classificação, observa-se uma falta de métodos consolidados para análise de interessabilidade de modelos de regressão. Neste trabalho foi desenvolvido um método para analisar a interessabilidade de modelos de regressão, o qual combina um filtro baseado em modelos probabilísticos multivariados com filtros baseados em testes estatísticos de correlação de Pearson e de postos de sinais de Wilcoxon, resultando em uma nova medida de interessabilidade denominada Impacto. O método desenvolvido foi aplicado sobre modelos de regressão encontrados no processo de mineração de dados para estimativa de gesso agrícola. Estes dados resultam de três experimentos sob Sistema Plantio Direto realizados na Região dos Campos Gerais, PR, nos quais foram medidos, em diferentes épocas, os teores dos nutrientes do solo após a aplicação de doses de gesso. Os resultados mostraram que o filtro probabilístico multivariado foi capaz de filtrar os melhores modelos segundo uma visão de utilidade, ou seja, de potencial de aplicação agronômica. Foram selecionados seis modelos com score de Impacto > 0,5, ou seja, considerados interessantes, e destes apenas um foi considerado incorretamente classificado. Por outro lado, os filtros baseados em testes estatísticos foram capazes de filtrar seis modelos sendo que dois deles podem ser considerados incorretamente classificados. Os atributos identificados como mais relevantes para o problema do gesso agrícola foram a época, o teor de Ca e a concentração de Ca em relação à capacidade de troca catiônica efetiva (CTCe), especialmente em camadas superficiais do solo.Made available in DSpace on 2017-07-21T14:19:22Z (GMT). No. of bitstreams: 1 Valter Luis.pdf: 3516533 bytes, checksum: d498d5c67dd1b9a837a128c20cabef67 (MD5) Previous issue date: 2015-02-26application/pdfporUNIVERSIDADE ESTADUAL DE PONTA GROSSAPrograma de Pós Graduação Computação AplicadaUEPGBRComputação para Tecnologias em Agriculturagesso agrícolaredes bayesianassensitividadeimpactogypsumbayesian networkssensitivityimpactCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOINTERESSABILIDADE DE MODELOS DE REGRESSÃO EM MINERAÇÃO DE DADOS AGRÍCOLASinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UEPGinstname:Universidade Estadual de Ponta Grossa (UEPG)instacron:UEPGORIGINALValter Luis.pdfapplication/pdf3516533http://tede2.uepg.br/jspui/bitstream/prefix/121/1/Valter%20Luis.pdfd498d5c67dd1b9a837a128c20cabef67MD51prefix/1212017-07-21 11:19:22.194oai:tede2.uepg.br:prefix/121Biblioteca Digital de Teses e Dissertaçõeshttps://tede2.uepg.br/jspui/PUBhttp://tede2.uepg.br/oai/requestbicen@uepg.br||mv_fidelis@yahoo.com.bropendoar:2017-07-21T14:19:22Biblioteca Digital de Teses e Dissertações da UEPG - Universidade Estadual de Ponta Grossa (UEPG)false |
dc.title.por.fl_str_mv |
INTERESSABILIDADE DE MODELOS DE REGRESSÃO EM MINERAÇÃO DE DADOS AGRÍCOLAS |
title |
INTERESSABILIDADE DE MODELOS DE REGRESSÃO EM MINERAÇÃO DE DADOS AGRÍCOLAS |
spellingShingle |
INTERESSABILIDADE DE MODELOS DE REGRESSÃO EM MINERAÇÃO DE DADOS AGRÍCOLAS Estevam Junior, Valter Luís gesso agrícola redes bayesianas sensitividade impacto gypsum bayesian networks sensitivity impact CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
title_short |
INTERESSABILIDADE DE MODELOS DE REGRESSÃO EM MINERAÇÃO DE DADOS AGRÍCOLAS |
title_full |
INTERESSABILIDADE DE MODELOS DE REGRESSÃO EM MINERAÇÃO DE DADOS AGRÍCOLAS |
title_fullStr |
INTERESSABILIDADE DE MODELOS DE REGRESSÃO EM MINERAÇÃO DE DADOS AGRÍCOLAS |
title_full_unstemmed |
INTERESSABILIDADE DE MODELOS DE REGRESSÃO EM MINERAÇÃO DE DADOS AGRÍCOLAS |
title_sort |
INTERESSABILIDADE DE MODELOS DE REGRESSÃO EM MINERAÇÃO DE DADOS AGRÍCOLAS |
author |
Estevam Junior, Valter Luís |
author_facet |
Estevam Junior, Valter Luís |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Guimarães, Alaine Margarete |
dc.contributor.advisor1ID.fl_str_mv |
CPF:70608040991 |
dc.contributor.advisor1Lattes.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4705808J570608040991 |
dc.contributor.advisor-co1.fl_str_mv |
Caires, Eduardo Fávero |
dc.contributor.advisor-co1ID.fl_str_mv |
CPF:07143754897 |
dc.contributor.advisor-co1Lattes.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4796865P7 |
dc.contributor.referee1.fl_str_mv |
Pozo, Aurora Trinidad Ramirez |
dc.contributor.referee1ID.fl_str_mv |
CPF:55168760953 |
dc.contributor.referee1Lattes.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4728283P4 |
dc.contributor.referee2.fl_str_mv |
Garbuio, Fernando José |
dc.contributor.referee2ID.fl_str_mv |
CPF:03350990924 |
dc.contributor.referee2Lattes.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4700229A1 |
dc.contributor.authorID.fl_str_mv |
CPF:06631127963 |
dc.contributor.authorLattes.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4278255D3 |
dc.contributor.author.fl_str_mv |
Estevam Junior, Valter Luís |
contributor_str_mv |
Guimarães, Alaine Margarete Caires, Eduardo Fávero Pozo, Aurora Trinidad Ramirez Garbuio, Fernando José |
dc.subject.por.fl_str_mv |
gesso agrícola redes bayesianas sensitividade impacto |
topic |
gesso agrícola redes bayesianas sensitividade impacto gypsum bayesian networks sensitivity impact CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
dc.subject.eng.fl_str_mv |
gypsum bayesian networks sensitivity impact |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
description |
The interestingness area of data mining process aiming to reduce the amount of models to be analyzed for experts in the interpretation step of the knowledge discovery in databases. In this work, a method for analysis the interestingness of regression models was developed. This method combine probabilistic multivariate models with Pearson correlation test and Wilcoxon signed-rank test resulting in a new interestingness measure, named Impact. The developed method was applied over regression models found during a data mining process for estimating agricultural gypsum requirements. The results showed that the probabilistic multivariate filter was able to filter the best models according to a utility-based approach, in this case, for practical application on agriculture. Six models were considered interesting, with Impact score > 0.5, and only one was miscategorized. On the other hand, the combined statistical test filters were able to filter six models two of them were miscategorized. The attributes identified as most relevant to estimate gypsum rate were: time, Ca and its concentration on effective cation exchange capacity (CaCTCe), mainly in superficial layers. |
publishDate |
2015 |
dc.date.available.fl_str_mv |
2015-07-03 2017-07-21T14:19:22Z |
dc.date.issued.fl_str_mv |
2015-02-26 |
dc.date.accessioned.fl_str_mv |
2017-07-21T14:19:22Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
ESTEVAM JUNIOR, Valter Luís. INTERESSABILIDADE DE MODELOS DE REGRESSÃO EM MINERAÇÃO DE DADOS AGRÍCOLAS. 2015. 82 f. Dissertação (Mestrado em Computação para Tecnologias em Agricultura) - UNIVERSIDADE ESTADUAL DE PONTA GROSSA, Ponta Grossa, 2015. |
dc.identifier.uri.fl_str_mv |
http://tede2.uepg.br/jspui/handle/prefix/121 |
identifier_str_mv |
ESTEVAM JUNIOR, Valter Luís. INTERESSABILIDADE DE MODELOS DE REGRESSÃO EM MINERAÇÃO DE DADOS AGRÍCOLAS. 2015. 82 f. Dissertação (Mestrado em Computação para Tecnologias em Agricultura) - UNIVERSIDADE ESTADUAL DE PONTA GROSSA, Ponta Grossa, 2015. |
url |
http://tede2.uepg.br/jspui/handle/prefix/121 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
UNIVERSIDADE ESTADUAL DE PONTA GROSSA |
dc.publisher.program.fl_str_mv |
Programa de Pós Graduação Computação Aplicada |
dc.publisher.initials.fl_str_mv |
UEPG |
dc.publisher.country.fl_str_mv |
BR |
dc.publisher.department.fl_str_mv |
Computação para Tecnologias em Agricultura |
publisher.none.fl_str_mv |
UNIVERSIDADE ESTADUAL DE PONTA GROSSA |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UEPG instname:Universidade Estadual de Ponta Grossa (UEPG) instacron:UEPG |
instname_str |
Universidade Estadual de Ponta Grossa (UEPG) |
instacron_str |
UEPG |
institution |
UEPG |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UEPG |
collection |
Biblioteca Digital de Teses e Dissertações da UEPG |
bitstream.url.fl_str_mv |
http://tede2.uepg.br/jspui/bitstream/prefix/121/1/Valter%20Luis.pdf |
bitstream.checksum.fl_str_mv |
d498d5c67dd1b9a837a128c20cabef67 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UEPG - Universidade Estadual de Ponta Grossa (UEPG) |
repository.mail.fl_str_mv |
bicen@uepg.br||mv_fidelis@yahoo.com.br |
_version_ |
1809460446246207488 |