Detecting important electrocardiogram characteristics for the diagnosis of Fabry disease via statistics and machine learning techniques

Detalhes bibliográficos
Autor(a) principal: Moura, Ana Rita Sousa
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: https://hdl.handle.net/1822/81532
Resumo: Dissertação de mestrado integrado em Engenharia Biomédica (especialização em Eletrónica Médica)
id RCAP_83bd866d770efbf810205e69931092a5
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/81532
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Detecting important electrocardiogram characteristics for the diagnosis of Fabry disease via statistics and machine learning techniquesDeteção de características do electrocardiograma importantes para o diagnóstico da doença de Fabry utilizando estatística e técnicas de machine learning.ClassificaçãoDoença de FabryEletrocardiogramaEstatísticaMachine LearningClassificationElectrocardiogramFabry diseaseStatisticsEngenharia e Tecnologia::Engenharia MédicaDissertação de mestrado integrado em Engenharia Biomédica (especialização em Eletrónica Médica)A doença de Fabry (DF) é uma doença genética rara de depósito lisossômico que afeta a qualidade de vida e pode mesmo levar à morte prematura. O diagnóstico ainda tardio reduz a eficiência da terapia de reposição enzimática. Assim, é extremamente importante identificar biomarcadores que possam auxiliar no diagnóstico precoce da DF. Apesar dos progressos nos últimos anos, a DF continua a ser mal compreen dida. Desta forma, esta dissertação teve como objetivo identificar características de electrocardiograma (ECG) importantes para o diagnóstico da DF, mais especificamente, para diferenciar os pacientes de DF com e sem lesões da matéria branca, e estes de pacientes com miocardiopatia hipertrófica sarcomérica. Para este fim, foram desenvolvidos e aplicados modelos estatísticos e de machine learning (ML). Quinze características de ECG foram avaliadas usando diversos métodos de inferência estatística, sobretudo para identificar diferenças significativas entre os grupos tendo em conta o sexo e a idade. Dois métodos de seleção de atributos foram aplicados, um baseado nos valores do fator de inflação da variância (VIF), e uma eliminação recursiva de atributos usando logistic regression, support vector machine (SVM) linear e random forest como classificadores. Depois, avaliou-se a performance de cinco algoritmos de ML - logistic regression, SVM com função de base radial (RBF), random forest e k-nearest neighbor (KNN) - a distinguir os diferentes grupos, para identificar o melhor modelo para cada problema de classificação. A idade revelou ser significativamente diferente entre os grupos e estar relacionada com as variáveis de ECG. Após subdividir em três faixas etárias, algumas características revelaram-se importantes para distinguir os grupos, não sendo afetadas pela idade. Com base nas características de ECG selecionadas, os resultados mostraram boa taxa de acerto, com os melhores resultados a variar de 80% a 85%, obtidos usando SVM RBF, random forest e KNN. Estas descobertas demonstram o potencial das técnicas de ML baseadas em características de ECG como ferramenta complementar ao diagnóstico da DF, com e sem lesões da matéria branca, o que pode ser útil para reduzir a demora no diagnóstico.Fabry disease (FD) is a rare genetic lysosomal storage disorder that affects life quality and may even lead to premature death. The mean delay between the onset of symptoms and the diagnosis is still very high, reducing enzyme replacement therapy’s efficiency. Therefore, it is extremely important to identify biomarkers that could assist in the early diagnosis of FD. Despite all the progress in recent years, FD remains misunderstood. Thus, this dissertation aimed to identify important electrocardiogram (ECG) characteristics for diagnosing FD, and more specifically, to differentiate FD with white matter lesions (WMLs) from FD without WMLs patients and these from patients with sarcomeric hypertrophic cardiomyopathy. To this end, statistics and machine learning (ML) models have been developed and applied. Fifteen ECG variables were evaluated using several statistical inference methods mainly to identify significant differences between groups, considering sex and age. Two feature selection methods were applied, one based on variance inflation factor (VIF) values, and a recursive feature elimination using logistic regression, linear support vector machine (SVM), and random forest classifiers. Then, the performance of five ML algorithms - logistic regression, linear SVM, radial basis function (RBF) SVM, random forest, and K-nearest neighbor (KNN) - at distinguishing the different groups were evaluated to identify the best model for each classification problem. Age was found to be significantly different between groups and to be related to the ECG variables values. After subdivision into three categories by age, some ECG characteristics were identified as important to distinguish the groups and unaffected by age. Based on selected ECG characteristics, the results showed good classification accuracies, with the best scores ranging from 80% to 85%, obtained using RBF SVM, random forest, or KNN. These findings demonstrate the potential of ML techniques based on ECG characteristics as a complementary tool for diagnosing FD with or without WMLs that could be useful to reduce the diagnosis delay.Bicho, EstelaFerreira, Flora José RochaUniversidade do MinhoMoura, Ana Rita Sousa2022-05-162022-05-16T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/81532eng203075498info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T12:50:33Zoai:repositorium.sdum.uminho.pt:1822/81532Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T19:49:17.052727Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Detecting important electrocardiogram characteristics for the diagnosis of Fabry disease via statistics and machine learning techniques
Deteção de características do electrocardiograma importantes para o diagnóstico da doença de Fabry utilizando estatística e técnicas de machine learning.
title Detecting important electrocardiogram characteristics for the diagnosis of Fabry disease via statistics and machine learning techniques
spellingShingle Detecting important electrocardiogram characteristics for the diagnosis of Fabry disease via statistics and machine learning techniques
Moura, Ana Rita Sousa
Classificação
Doença de Fabry
Eletrocardiograma
Estatística
Machine Learning
Classification
Electrocardiogram
Fabry disease
Statistics
Engenharia e Tecnologia::Engenharia Médica
title_short Detecting important electrocardiogram characteristics for the diagnosis of Fabry disease via statistics and machine learning techniques
title_full Detecting important electrocardiogram characteristics for the diagnosis of Fabry disease via statistics and machine learning techniques
title_fullStr Detecting important electrocardiogram characteristics for the diagnosis of Fabry disease via statistics and machine learning techniques
title_full_unstemmed Detecting important electrocardiogram characteristics for the diagnosis of Fabry disease via statistics and machine learning techniques
title_sort Detecting important electrocardiogram characteristics for the diagnosis of Fabry disease via statistics and machine learning techniques
author Moura, Ana Rita Sousa
author_facet Moura, Ana Rita Sousa
author_role author
dc.contributor.none.fl_str_mv Bicho, Estela
Ferreira, Flora José Rocha
Universidade do Minho
dc.contributor.author.fl_str_mv Moura, Ana Rita Sousa
dc.subject.por.fl_str_mv Classificação
Doença de Fabry
Eletrocardiograma
Estatística
Machine Learning
Classification
Electrocardiogram
Fabry disease
Statistics
Engenharia e Tecnologia::Engenharia Médica
topic Classificação
Doença de Fabry
Eletrocardiograma
Estatística
Machine Learning
Classification
Electrocardiogram
Fabry disease
Statistics
Engenharia e Tecnologia::Engenharia Médica
description Dissertação de mestrado integrado em Engenharia Biomédica (especialização em Eletrónica Médica)
publishDate 2022
dc.date.none.fl_str_mv 2022-05-16
2022-05-16T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1822/81532
url https://hdl.handle.net/1822/81532
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv 203075498
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799133073892179968