Classificação binária para presença de ocorrência de cardiopatias usando características clássicas e novos parâmetros
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPE |
dARK ID: | ark:/64986/001300000b1df |
Texto Completo: | https://repositorio.ufpe.br/handle/123456789/35327 |
Resumo: | Essa dissertação tem como objetivo utilizar características cardíacas clássicas e os novos parâmetros introduzidos por Campello de Souza (2010) [O Apoio ao Diagnóstico Médico: o que se pode fazer com um tensiômetro e um relógio. 2. ed. Recife] no processo de classificação de indivíduos cardiopatas. Considerando distintos cenários de análise e baseados em quatro diferentes bancos de dados, os parâmetros de Campello de Souza foram incluídos no processo de seleção dos atributos mais informativos e no processo de classificação binária dos cardiopatas. Foram testados cinco classificadores bem consolidados na literatura a saber: Naive Bayes, Florestas Aleatórias, Regressão Logística, Adaboost e Máquinas de Vetores de Suporte. Os desempenhos destes classificadores foram avaliados com base nas acurácias e respectivos desvios padrões (DPs). Dada a alta dimensionalidade das matrizes de características contínuas usadas e sob ausência de ortogonalidade, as classificações foram também avaliadas utilizando Componentes Principais. Nessa fase é adicionando um sexto método de classificação: as Redes Neuronais Artificiais. Os resultados empíricos indicam que dentre os parâmetros introduzidos por Campello de Souza, a Pressão Arterial Média (PAM), que aparece em 8 dos 12 modelos selecionados pelo fator de inflação de variância VIF melhora o desempenho dos classificadores, apresentando acurácias que variaram entre 78.77% (DP = 4.54%) e 99.20% (DP = 1.17%), respectivamente. Considerando os classificadores, a Regressão Logística e o Adaboost foram os métodos com maiores médias de acurácias, cada classificador presente em um terço dos 12 modelos selecionados pelo VIF. Dominic, Gupta e Khare (2015) obtiveram 98% de acurácia com o classificador Adaboost, Umamaheswuari et al. (2017) obtiveram 91.89% com o classificador Stacking, enquanto que neste trabalho e para o mesmo banco de dados encontrou-se resultados mais competitivos na classificação dos cardiopatas, sendo a Regressão Logística o modelo contendo dentre suas variáveis explicativas a PAM, o Índice Pulsátil da Pressão Arterial (IPPA) e o parâmetro RC (Resistência _ Complacência), obtendo uma acurácia média nas bases de teste foi igual a 99.20% (DP = 1.17%). |
id |
UFPE_bd08fd7ea136b084e503d19bc83cb195 |
---|---|
oai_identifier_str |
oai:repositorio.ufpe.br:123456789/35327 |
network_acronym_str |
UFPE |
network_name_str |
Repositório Institucional da UFPE |
repository_id_str |
2221 |
spelling |
FERREIRA, Adenice Gomes de Oliveirahttp://lattes.cnpq.br/0919077943904831http://lattes.cnpq.br/6357960802605841OSPINA MARTÍNEZ, Raydonal2019-11-25T20:33:07Z2019-11-25T20:33:07Z2019-07-30FERREIRA, Adenice Gomes de Oliveira. Classificação binária para presença de ocorrência de cardiopatias usando características clássicas e novos parâmetros. 2019. Dissertação (Mestrado em Estatística) – Universidade Federal de Pernambuco, Recife, 2019.https://repositorio.ufpe.br/handle/123456789/35327ark:/64986/001300000b1dfEssa dissertação tem como objetivo utilizar características cardíacas clássicas e os novos parâmetros introduzidos por Campello de Souza (2010) [O Apoio ao Diagnóstico Médico: o que se pode fazer com um tensiômetro e um relógio. 2. ed. Recife] no processo de classificação de indivíduos cardiopatas. Considerando distintos cenários de análise e baseados em quatro diferentes bancos de dados, os parâmetros de Campello de Souza foram incluídos no processo de seleção dos atributos mais informativos e no processo de classificação binária dos cardiopatas. Foram testados cinco classificadores bem consolidados na literatura a saber: Naive Bayes, Florestas Aleatórias, Regressão Logística, Adaboost e Máquinas de Vetores de Suporte. Os desempenhos destes classificadores foram avaliados com base nas acurácias e respectivos desvios padrões (DPs). Dada a alta dimensionalidade das matrizes de características contínuas usadas e sob ausência de ortogonalidade, as classificações foram também avaliadas utilizando Componentes Principais. Nessa fase é adicionando um sexto método de classificação: as Redes Neuronais Artificiais. Os resultados empíricos indicam que dentre os parâmetros introduzidos por Campello de Souza, a Pressão Arterial Média (PAM), que aparece em 8 dos 12 modelos selecionados pelo fator de inflação de variância VIF melhora o desempenho dos classificadores, apresentando acurácias que variaram entre 78.77% (DP = 4.54%) e 99.20% (DP = 1.17%), respectivamente. Considerando os classificadores, a Regressão Logística e o Adaboost foram os métodos com maiores médias de acurácias, cada classificador presente em um terço dos 12 modelos selecionados pelo VIF. Dominic, Gupta e Khare (2015) obtiveram 98% de acurácia com o classificador Adaboost, Umamaheswuari et al. (2017) obtiveram 91.89% com o classificador Stacking, enquanto que neste trabalho e para o mesmo banco de dados encontrou-se resultados mais competitivos na classificação dos cardiopatas, sendo a Regressão Logística o modelo contendo dentre suas variáveis explicativas a PAM, o Índice Pulsátil da Pressão Arterial (IPPA) e o parâmetro RC (Resistência _ Complacência), obtendo uma acurácia média nas bases de teste foi igual a 99.20% (DP = 1.17%).CNPqThe aim of this work is to use classic cardiac characteristics and new parameters introduced by Campello de Souza (2010) [Support of Medical Diagnosis: what can be done with a tensiometer and a clock?. 2. Ed. Recife] in the process of classification of individuals with heart disease. Considering different scenarios, and based on four different databases, the parameters of Campello de Souza were included in the selection process of the most informative attributes and added in the binary classification process of the cardiac patients. Five well-consolidated classifiers were tested: Naive Bayes, Random Forests, Logistic Regression, Adaboost and Support Vector Machine. The performances of these classifiers were evaluated based on the accuracy and their respective standard deviations (SDs). Given the high dimensionality of the matrices of continuous features used and in the absence of orthogonality, the classifiers were also evaluated using Principal Components. In this phase, we are adding the Artificial Neural Networks as a sixth classification method. The empirical results indicate that among the parameters introduced by Campello de Souza, the mean arterial pressure (PAM), which appears in 8 of the 12 models selected by the VIF variance inflation factor, improves the performance of the classifiers, with accuracy ranging from 78.77% (SD = 4.54%) and 99.20% (SD = 1.17%), respectively. Considering the classifiers Logistic Regression and Adaboost were obtained the highest average of accuracy, each present in a third of the 12 models selected by FIV. Dominic, Gupta and Khare (2015) obtained 98% accuracy with the Adaboost classifier, Umamaheswuari et al. (2017) obtained 91.89% with the Stacking classifier, whereas in this study and for the same database, we found more competitive results in the classification of presence of heart diseases, with Logistic Regression are being the model containing, among its explanatory variables, the Pulsed Index (IPPA) and RC (Resistance x Complacency), where the mean accuracy of the test bases was 99.20% (SD = 1.17%).porUniversidade Federal de PernambucoPrograma de Pos Graduacao em EstatisticaUFPEBrasilAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/embargoedAccessEstatísticaClassificação bináriaCardiopatiaClassificação binária para presença de ocorrência de cardiopatias usando características clássicas e novos parâmetrosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesismestradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPEORIGINALDISSERTAÇÃO Adenice Gomes de Oliveira Ferreira.pdfDISSERTAÇÃO Adenice Gomes de Oliveira Ferreira.pdfapplication/pdf2000306https://repositorio.ufpe.br/bitstream/123456789/35327/1/DISSERTA%c3%87%c3%83O%20Adenice%20Gomes%20de%20Oliveira%20Ferreira.pdfcbd778394b672626d3f8c66b14836d87MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ufpe.br/bitstream/123456789/35327/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD53CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/35327/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52TEXTDISSERTAÇÃO Adenice Gomes de Oliveira Ferreira.pdf.txtDISSERTAÇÃO Adenice Gomes de Oliveira Ferreira.pdf.txtExtracted texttext/plain181882https://repositorio.ufpe.br/bitstream/123456789/35327/4/DISSERTA%c3%87%c3%83O%20Adenice%20Gomes%20de%20Oliveira%20Ferreira.pdf.txtf7ad25e04a8a72f0cd9fef5701990389MD54THUMBNAILDISSERTAÇÃO Adenice Gomes de Oliveira Ferreira.pdf.jpgDISSERTAÇÃO Adenice Gomes de Oliveira Ferreira.pdf.jpgGenerated Thumbnailimage/jpeg1228https://repositorio.ufpe.br/bitstream/123456789/35327/5/DISSERTA%c3%87%c3%83O%20Adenice%20Gomes%20de%20Oliveira%20Ferreira.pdf.jpgc9b5e37e802435247df0aa5cc7ec4da5MD55123456789/353272019-11-26 02:11:17.906oai:repositorio.ufpe.br:123456789/35327Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-11-26T05:11:17Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false |
dc.title.pt_BR.fl_str_mv |
Classificação binária para presença de ocorrência de cardiopatias usando características clássicas e novos parâmetros |
title |
Classificação binária para presença de ocorrência de cardiopatias usando características clássicas e novos parâmetros |
spellingShingle |
Classificação binária para presença de ocorrência de cardiopatias usando características clássicas e novos parâmetros FERREIRA, Adenice Gomes de Oliveira Estatística Classificação binária Cardiopatia |
title_short |
Classificação binária para presença de ocorrência de cardiopatias usando características clássicas e novos parâmetros |
title_full |
Classificação binária para presença de ocorrência de cardiopatias usando características clássicas e novos parâmetros |
title_fullStr |
Classificação binária para presença de ocorrência de cardiopatias usando características clássicas e novos parâmetros |
title_full_unstemmed |
Classificação binária para presença de ocorrência de cardiopatias usando características clássicas e novos parâmetros |
title_sort |
Classificação binária para presença de ocorrência de cardiopatias usando características clássicas e novos parâmetros |
author |
FERREIRA, Adenice Gomes de Oliveira |
author_facet |
FERREIRA, Adenice Gomes de Oliveira |
author_role |
author |
dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/0919077943904831 |
dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/6357960802605841 |
dc.contributor.author.fl_str_mv |
FERREIRA, Adenice Gomes de Oliveira |
dc.contributor.advisor1.fl_str_mv |
OSPINA MARTÍNEZ, Raydonal |
contributor_str_mv |
OSPINA MARTÍNEZ, Raydonal |
dc.subject.por.fl_str_mv |
Estatística Classificação binária Cardiopatia |
topic |
Estatística Classificação binária Cardiopatia |
description |
Essa dissertação tem como objetivo utilizar características cardíacas clássicas e os novos parâmetros introduzidos por Campello de Souza (2010) [O Apoio ao Diagnóstico Médico: o que se pode fazer com um tensiômetro e um relógio. 2. ed. Recife] no processo de classificação de indivíduos cardiopatas. Considerando distintos cenários de análise e baseados em quatro diferentes bancos de dados, os parâmetros de Campello de Souza foram incluídos no processo de seleção dos atributos mais informativos e no processo de classificação binária dos cardiopatas. Foram testados cinco classificadores bem consolidados na literatura a saber: Naive Bayes, Florestas Aleatórias, Regressão Logística, Adaboost e Máquinas de Vetores de Suporte. Os desempenhos destes classificadores foram avaliados com base nas acurácias e respectivos desvios padrões (DPs). Dada a alta dimensionalidade das matrizes de características contínuas usadas e sob ausência de ortogonalidade, as classificações foram também avaliadas utilizando Componentes Principais. Nessa fase é adicionando um sexto método de classificação: as Redes Neuronais Artificiais. Os resultados empíricos indicam que dentre os parâmetros introduzidos por Campello de Souza, a Pressão Arterial Média (PAM), que aparece em 8 dos 12 modelos selecionados pelo fator de inflação de variância VIF melhora o desempenho dos classificadores, apresentando acurácias que variaram entre 78.77% (DP = 4.54%) e 99.20% (DP = 1.17%), respectivamente. Considerando os classificadores, a Regressão Logística e o Adaboost foram os métodos com maiores médias de acurácias, cada classificador presente em um terço dos 12 modelos selecionados pelo VIF. Dominic, Gupta e Khare (2015) obtiveram 98% de acurácia com o classificador Adaboost, Umamaheswuari et al. (2017) obtiveram 91.89% com o classificador Stacking, enquanto que neste trabalho e para o mesmo banco de dados encontrou-se resultados mais competitivos na classificação dos cardiopatas, sendo a Regressão Logística o modelo contendo dentre suas variáveis explicativas a PAM, o Índice Pulsátil da Pressão Arterial (IPPA) e o parâmetro RC (Resistência _ Complacência), obtendo uma acurácia média nas bases de teste foi igual a 99.20% (DP = 1.17%). |
publishDate |
2019 |
dc.date.accessioned.fl_str_mv |
2019-11-25T20:33:07Z |
dc.date.available.fl_str_mv |
2019-11-25T20:33:07Z |
dc.date.issued.fl_str_mv |
2019-07-30 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
FERREIRA, Adenice Gomes de Oliveira. Classificação binária para presença de ocorrência de cardiopatias usando características clássicas e novos parâmetros. 2019. Dissertação (Mestrado em Estatística) – Universidade Federal de Pernambuco, Recife, 2019. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufpe.br/handle/123456789/35327 |
dc.identifier.dark.fl_str_mv |
ark:/64986/001300000b1df |
identifier_str_mv |
FERREIRA, Adenice Gomes de Oliveira. Classificação binária para presença de ocorrência de cardiopatias usando características clássicas e novos parâmetros. 2019. Dissertação (Mestrado em Estatística) – Universidade Federal de Pernambuco, Recife, 2019. ark:/64986/001300000b1df |
url |
https://repositorio.ufpe.br/handle/123456789/35327 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/embargoedAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
embargoedAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.publisher.program.fl_str_mv |
Programa de Pos Graduacao em Estatistica |
dc.publisher.initials.fl_str_mv |
UFPE |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco (UFPE) instacron:UFPE |
instname_str |
Universidade Federal de Pernambuco (UFPE) |
instacron_str |
UFPE |
institution |
UFPE |
reponame_str |
Repositório Institucional da UFPE |
collection |
Repositório Institucional da UFPE |
bitstream.url.fl_str_mv |
https://repositorio.ufpe.br/bitstream/123456789/35327/1/DISSERTA%c3%87%c3%83O%20Adenice%20Gomes%20de%20Oliveira%20Ferreira.pdf https://repositorio.ufpe.br/bitstream/123456789/35327/3/license.txt https://repositorio.ufpe.br/bitstream/123456789/35327/2/license_rdf https://repositorio.ufpe.br/bitstream/123456789/35327/4/DISSERTA%c3%87%c3%83O%20Adenice%20Gomes%20de%20Oliveira%20Ferreira.pdf.txt https://repositorio.ufpe.br/bitstream/123456789/35327/5/DISSERTA%c3%87%c3%83O%20Adenice%20Gomes%20de%20Oliveira%20Ferreira.pdf.jpg |
bitstream.checksum.fl_str_mv |
cbd778394b672626d3f8c66b14836d87 8a4605be74aa9ea9d79846c1fba20a33 e39d27027a6cc9cb039ad269a5db8e34 f7ad25e04a8a72f0cd9fef5701990389 c9b5e37e802435247df0aa5cc7ec4da5 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE) |
repository.mail.fl_str_mv |
attena@ufpe.br |
_version_ |
1815172774483722240 |