Classificação binária para presença de ocorrência de cardiopatias usando características clássicas e novos parâmetros

Detalhes bibliográficos
Autor(a) principal: FERREIRA, Adenice Gomes de Oliveira
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFPE
dARK ID: ark:/64986/001300000b1df
Texto Completo: https://repositorio.ufpe.br/handle/123456789/35327
Resumo: Essa dissertação tem como objetivo utilizar características cardíacas clássicas e os novos parâmetros introduzidos por Campello de Souza (2010) [O Apoio ao Diagnóstico Médico: o que se pode fazer com um tensiômetro e um relógio. 2. ed. Recife] no processo de classificação de indivíduos cardiopatas. Considerando distintos cenários de análise e baseados em quatro diferentes bancos de dados, os parâmetros de Campello de Souza foram incluídos no processo de seleção dos atributos mais informativos e no processo de classificação binária dos cardiopatas. Foram testados cinco classificadores bem consolidados na literatura a saber: Naive Bayes, Florestas Aleatórias, Regressão Logística, Adaboost e Máquinas de Vetores de Suporte. Os desempenhos destes classificadores foram avaliados com base nas acurácias e respectivos desvios padrões (DPs). Dada a alta dimensionalidade das matrizes de características contínuas usadas e sob ausência de ortogonalidade, as classificações foram também avaliadas utilizando Componentes Principais. Nessa fase é adicionando um sexto método de classificação: as Redes Neuronais Artificiais. Os resultados empíricos indicam que dentre os parâmetros introduzidos por Campello de Souza, a Pressão Arterial Média (PAM), que aparece em 8 dos 12 modelos selecionados pelo fator de inflação de variância VIF melhora o desempenho dos classificadores, apresentando acurácias que variaram entre 78.77% (DP = 4.54%) e 99.20% (DP = 1.17%), respectivamente. Considerando os classificadores, a Regressão Logística e o Adaboost foram os métodos com maiores médias de acurácias, cada classificador presente em um terço dos 12 modelos selecionados pelo VIF. Dominic, Gupta e Khare (2015) obtiveram 98% de acurácia com o classificador Adaboost, Umamaheswuari et al. (2017) obtiveram 91.89% com o classificador Stacking, enquanto que neste trabalho e para o mesmo banco de dados encontrou-se resultados mais competitivos na classificação dos cardiopatas, sendo a Regressão Logística o modelo contendo dentre suas variáveis explicativas a PAM, o Índice Pulsátil da Pressão Arterial (IPPA) e o parâmetro RC (Resistência _ Complacência), obtendo uma acurácia média nas bases de teste foi igual a 99.20% (DP = 1.17%).
id UFPE_bd08fd7ea136b084e503d19bc83cb195
oai_identifier_str oai:repositorio.ufpe.br:123456789/35327
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str 2221
spelling FERREIRA, Adenice Gomes de Oliveirahttp://lattes.cnpq.br/0919077943904831http://lattes.cnpq.br/6357960802605841OSPINA MARTÍNEZ, Raydonal2019-11-25T20:33:07Z2019-11-25T20:33:07Z2019-07-30FERREIRA, Adenice Gomes de Oliveira. Classificação binária para presença de ocorrência de cardiopatias usando características clássicas e novos parâmetros. 2019. Dissertação (Mestrado em Estatística) – Universidade Federal de Pernambuco, Recife, 2019.https://repositorio.ufpe.br/handle/123456789/35327ark:/64986/001300000b1dfEssa dissertação tem como objetivo utilizar características cardíacas clássicas e os novos parâmetros introduzidos por Campello de Souza (2010) [O Apoio ao Diagnóstico Médico: o que se pode fazer com um tensiômetro e um relógio. 2. ed. Recife] no processo de classificação de indivíduos cardiopatas. Considerando distintos cenários de análise e baseados em quatro diferentes bancos de dados, os parâmetros de Campello de Souza foram incluídos no processo de seleção dos atributos mais informativos e no processo de classificação binária dos cardiopatas. Foram testados cinco classificadores bem consolidados na literatura a saber: Naive Bayes, Florestas Aleatórias, Regressão Logística, Adaboost e Máquinas de Vetores de Suporte. Os desempenhos destes classificadores foram avaliados com base nas acurácias e respectivos desvios padrões (DPs). Dada a alta dimensionalidade das matrizes de características contínuas usadas e sob ausência de ortogonalidade, as classificações foram também avaliadas utilizando Componentes Principais. Nessa fase é adicionando um sexto método de classificação: as Redes Neuronais Artificiais. Os resultados empíricos indicam que dentre os parâmetros introduzidos por Campello de Souza, a Pressão Arterial Média (PAM), que aparece em 8 dos 12 modelos selecionados pelo fator de inflação de variância VIF melhora o desempenho dos classificadores, apresentando acurácias que variaram entre 78.77% (DP = 4.54%) e 99.20% (DP = 1.17%), respectivamente. Considerando os classificadores, a Regressão Logística e o Adaboost foram os métodos com maiores médias de acurácias, cada classificador presente em um terço dos 12 modelos selecionados pelo VIF. Dominic, Gupta e Khare (2015) obtiveram 98% de acurácia com o classificador Adaboost, Umamaheswuari et al. (2017) obtiveram 91.89% com o classificador Stacking, enquanto que neste trabalho e para o mesmo banco de dados encontrou-se resultados mais competitivos na classificação dos cardiopatas, sendo a Regressão Logística o modelo contendo dentre suas variáveis explicativas a PAM, o Índice Pulsátil da Pressão Arterial (IPPA) e o parâmetro RC (Resistência _ Complacência), obtendo uma acurácia média nas bases de teste foi igual a 99.20% (DP = 1.17%).CNPqThe aim of this work is to use classic cardiac characteristics and new parameters introduced by Campello de Souza (2010) [Support of Medical Diagnosis: what can be done with a tensiometer and a clock?. 2. Ed. Recife] in the process of classification of individuals with heart disease. Considering different scenarios, and based on four different databases, the parameters of Campello de Souza were included in the selection process of the most informative attributes and added in the binary classification process of the cardiac patients. Five well-consolidated classifiers were tested: Naive Bayes, Random Forests, Logistic Regression, Adaboost and Support Vector Machine. The performances of these classifiers were evaluated based on the accuracy and their respective standard deviations (SDs). Given the high dimensionality of the matrices of continuous features used and in the absence of orthogonality, the classifiers were also evaluated using Principal Components. In this phase, we are adding the Artificial Neural Networks as a sixth classification method. The empirical results indicate that among the parameters introduced by Campello de Souza, the mean arterial pressure (PAM), which appears in 8 of the 12 models selected by the VIF variance inflation factor, improves the performance of the classifiers, with accuracy ranging from 78.77% (SD = 4.54%) and 99.20% (SD = 1.17%), respectively. Considering the classifiers Logistic Regression and Adaboost were obtained the highest average of accuracy, each present in a third of the 12 models selected by FIV. Dominic, Gupta and Khare (2015) obtained 98% accuracy with the Adaboost classifier, Umamaheswuari et al. (2017) obtained 91.89% with the Stacking classifier, whereas in this study and for the same database, we found more competitive results in the classification of presence of heart diseases, with Logistic Regression are being the model containing, among its explanatory variables, the Pulsed Index (IPPA) and RC (Resistance x Complacency), where the mean accuracy of the test bases was 99.20% (SD = 1.17%).porUniversidade Federal de PernambucoPrograma de Pos Graduacao em EstatisticaUFPEBrasilAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/embargoedAccessEstatísticaClassificação bináriaCardiopatiaClassificação binária para presença de ocorrência de cardiopatias usando características clássicas e novos parâmetrosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesismestradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPEORIGINALDISSERTAÇÃO Adenice Gomes de Oliveira Ferreira.pdfDISSERTAÇÃO Adenice Gomes de Oliveira Ferreira.pdfapplication/pdf2000306https://repositorio.ufpe.br/bitstream/123456789/35327/1/DISSERTA%c3%87%c3%83O%20Adenice%20Gomes%20de%20Oliveira%20Ferreira.pdfcbd778394b672626d3f8c66b14836d87MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ufpe.br/bitstream/123456789/35327/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD53CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/35327/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52TEXTDISSERTAÇÃO Adenice Gomes de Oliveira Ferreira.pdf.txtDISSERTAÇÃO Adenice Gomes de Oliveira Ferreira.pdf.txtExtracted texttext/plain181882https://repositorio.ufpe.br/bitstream/123456789/35327/4/DISSERTA%c3%87%c3%83O%20Adenice%20Gomes%20de%20Oliveira%20Ferreira.pdf.txtf7ad25e04a8a72f0cd9fef5701990389MD54THUMBNAILDISSERTAÇÃO Adenice Gomes de Oliveira Ferreira.pdf.jpgDISSERTAÇÃO Adenice Gomes de Oliveira Ferreira.pdf.jpgGenerated Thumbnailimage/jpeg1228https://repositorio.ufpe.br/bitstream/123456789/35327/5/DISSERTA%c3%87%c3%83O%20Adenice%20Gomes%20de%20Oliveira%20Ferreira.pdf.jpgc9b5e37e802435247df0aa5cc7ec4da5MD55123456789/353272019-11-26 02:11:17.906oai:repositorio.ufpe.br:123456789/35327Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-11-26T05:11:17Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.pt_BR.fl_str_mv Classificação binária para presença de ocorrência de cardiopatias usando características clássicas e novos parâmetros
title Classificação binária para presença de ocorrência de cardiopatias usando características clássicas e novos parâmetros
spellingShingle Classificação binária para presença de ocorrência de cardiopatias usando características clássicas e novos parâmetros
FERREIRA, Adenice Gomes de Oliveira
Estatística
Classificação binária
Cardiopatia
title_short Classificação binária para presença de ocorrência de cardiopatias usando características clássicas e novos parâmetros
title_full Classificação binária para presença de ocorrência de cardiopatias usando características clássicas e novos parâmetros
title_fullStr Classificação binária para presença de ocorrência de cardiopatias usando características clássicas e novos parâmetros
title_full_unstemmed Classificação binária para presença de ocorrência de cardiopatias usando características clássicas e novos parâmetros
title_sort Classificação binária para presença de ocorrência de cardiopatias usando características clássicas e novos parâmetros
author FERREIRA, Adenice Gomes de Oliveira
author_facet FERREIRA, Adenice Gomes de Oliveira
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/0919077943904831
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/6357960802605841
dc.contributor.author.fl_str_mv FERREIRA, Adenice Gomes de Oliveira
dc.contributor.advisor1.fl_str_mv OSPINA MARTÍNEZ, Raydonal
contributor_str_mv OSPINA MARTÍNEZ, Raydonal
dc.subject.por.fl_str_mv Estatística
Classificação binária
Cardiopatia
topic Estatística
Classificação binária
Cardiopatia
description Essa dissertação tem como objetivo utilizar características cardíacas clássicas e os novos parâmetros introduzidos por Campello de Souza (2010) [O Apoio ao Diagnóstico Médico: o que se pode fazer com um tensiômetro e um relógio. 2. ed. Recife] no processo de classificação de indivíduos cardiopatas. Considerando distintos cenários de análise e baseados em quatro diferentes bancos de dados, os parâmetros de Campello de Souza foram incluídos no processo de seleção dos atributos mais informativos e no processo de classificação binária dos cardiopatas. Foram testados cinco classificadores bem consolidados na literatura a saber: Naive Bayes, Florestas Aleatórias, Regressão Logística, Adaboost e Máquinas de Vetores de Suporte. Os desempenhos destes classificadores foram avaliados com base nas acurácias e respectivos desvios padrões (DPs). Dada a alta dimensionalidade das matrizes de características contínuas usadas e sob ausência de ortogonalidade, as classificações foram também avaliadas utilizando Componentes Principais. Nessa fase é adicionando um sexto método de classificação: as Redes Neuronais Artificiais. Os resultados empíricos indicam que dentre os parâmetros introduzidos por Campello de Souza, a Pressão Arterial Média (PAM), que aparece em 8 dos 12 modelos selecionados pelo fator de inflação de variância VIF melhora o desempenho dos classificadores, apresentando acurácias que variaram entre 78.77% (DP = 4.54%) e 99.20% (DP = 1.17%), respectivamente. Considerando os classificadores, a Regressão Logística e o Adaboost foram os métodos com maiores médias de acurácias, cada classificador presente em um terço dos 12 modelos selecionados pelo VIF. Dominic, Gupta e Khare (2015) obtiveram 98% de acurácia com o classificador Adaboost, Umamaheswuari et al. (2017) obtiveram 91.89% com o classificador Stacking, enquanto que neste trabalho e para o mesmo banco de dados encontrou-se resultados mais competitivos na classificação dos cardiopatas, sendo a Regressão Logística o modelo contendo dentre suas variáveis explicativas a PAM, o Índice Pulsátil da Pressão Arterial (IPPA) e o parâmetro RC (Resistência _ Complacência), obtendo uma acurácia média nas bases de teste foi igual a 99.20% (DP = 1.17%).
publishDate 2019
dc.date.accessioned.fl_str_mv 2019-11-25T20:33:07Z
dc.date.available.fl_str_mv 2019-11-25T20:33:07Z
dc.date.issued.fl_str_mv 2019-07-30
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv FERREIRA, Adenice Gomes de Oliveira. Classificação binária para presença de ocorrência de cardiopatias usando características clássicas e novos parâmetros. 2019. Dissertação (Mestrado em Estatística) – Universidade Federal de Pernambuco, Recife, 2019.
dc.identifier.uri.fl_str_mv https://repositorio.ufpe.br/handle/123456789/35327
dc.identifier.dark.fl_str_mv ark:/64986/001300000b1df
identifier_str_mv FERREIRA, Adenice Gomes de Oliveira. Classificação binária para presença de ocorrência de cardiopatias usando características clássicas e novos parâmetros. 2019. Dissertação (Mestrado em Estatística) – Universidade Federal de Pernambuco, Recife, 2019.
ark:/64986/001300000b1df
url https://repositorio.ufpe.br/handle/123456789/35327
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/embargoedAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv embargoedAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.publisher.program.fl_str_mv Programa de Pos Graduacao em Estatistica
dc.publisher.initials.fl_str_mv UFPE
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
bitstream.url.fl_str_mv https://repositorio.ufpe.br/bitstream/123456789/35327/1/DISSERTA%c3%87%c3%83O%20Adenice%20Gomes%20de%20Oliveira%20Ferreira.pdf
https://repositorio.ufpe.br/bitstream/123456789/35327/3/license.txt
https://repositorio.ufpe.br/bitstream/123456789/35327/2/license_rdf
https://repositorio.ufpe.br/bitstream/123456789/35327/4/DISSERTA%c3%87%c3%83O%20Adenice%20Gomes%20de%20Oliveira%20Ferreira.pdf.txt
https://repositorio.ufpe.br/bitstream/123456789/35327/5/DISSERTA%c3%87%c3%83O%20Adenice%20Gomes%20de%20Oliveira%20Ferreira.pdf.jpg
bitstream.checksum.fl_str_mv cbd778394b672626d3f8c66b14836d87
8a4605be74aa9ea9d79846c1fba20a33
e39d27027a6cc9cb039ad269a5db8e34
f7ad25e04a8a72f0cd9fef5701990389
c9b5e37e802435247df0aa5cc7ec4da5
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1815172774483722240