Detecting important electrocardiogram characteristics for the diagnosis of Fabry disease via statistics and machine learning techniques
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | https://hdl.handle.net/1822/81532 |
Resumo: | Dissertação de mestrado integrado em Engenharia Biomédica (especialização em Eletrónica Médica) |
id |
RCAP_83bd866d770efbf810205e69931092a5 |
---|---|
oai_identifier_str |
oai:repositorium.sdum.uminho.pt:1822/81532 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Detecting important electrocardiogram characteristics for the diagnosis of Fabry disease via statistics and machine learning techniquesDeteção de características do electrocardiograma importantes para o diagnóstico da doença de Fabry utilizando estatística e técnicas de machine learning.ClassificaçãoDoença de FabryEletrocardiogramaEstatísticaMachine LearningClassificationElectrocardiogramFabry diseaseStatisticsEngenharia e Tecnologia::Engenharia MédicaDissertação de mestrado integrado em Engenharia Biomédica (especialização em Eletrónica Médica)A doença de Fabry (DF) é uma doença genética rara de depósito lisossômico que afeta a qualidade de vida e pode mesmo levar à morte prematura. O diagnóstico ainda tardio reduz a eficiência da terapia de reposição enzimática. Assim, é extremamente importante identificar biomarcadores que possam auxiliar no diagnóstico precoce da DF. Apesar dos progressos nos últimos anos, a DF continua a ser mal compreen dida. Desta forma, esta dissertação teve como objetivo identificar características de electrocardiograma (ECG) importantes para o diagnóstico da DF, mais especificamente, para diferenciar os pacientes de DF com e sem lesões da matéria branca, e estes de pacientes com miocardiopatia hipertrófica sarcomérica. Para este fim, foram desenvolvidos e aplicados modelos estatísticos e de machine learning (ML). Quinze características de ECG foram avaliadas usando diversos métodos de inferência estatística, sobretudo para identificar diferenças significativas entre os grupos tendo em conta o sexo e a idade. Dois métodos de seleção de atributos foram aplicados, um baseado nos valores do fator de inflação da variância (VIF), e uma eliminação recursiva de atributos usando logistic regression, support vector machine (SVM) linear e random forest como classificadores. Depois, avaliou-se a performance de cinco algoritmos de ML - logistic regression, SVM com função de base radial (RBF), random forest e k-nearest neighbor (KNN) - a distinguir os diferentes grupos, para identificar o melhor modelo para cada problema de classificação. A idade revelou ser significativamente diferente entre os grupos e estar relacionada com as variáveis de ECG. Após subdividir em três faixas etárias, algumas características revelaram-se importantes para distinguir os grupos, não sendo afetadas pela idade. Com base nas características de ECG selecionadas, os resultados mostraram boa taxa de acerto, com os melhores resultados a variar de 80% a 85%, obtidos usando SVM RBF, random forest e KNN. Estas descobertas demonstram o potencial das técnicas de ML baseadas em características de ECG como ferramenta complementar ao diagnóstico da DF, com e sem lesões da matéria branca, o que pode ser útil para reduzir a demora no diagnóstico.Fabry disease (FD) is a rare genetic lysosomal storage disorder that affects life quality and may even lead to premature death. The mean delay between the onset of symptoms and the diagnosis is still very high, reducing enzyme replacement therapy’s efficiency. Therefore, it is extremely important to identify biomarkers that could assist in the early diagnosis of FD. Despite all the progress in recent years, FD remains misunderstood. Thus, this dissertation aimed to identify important electrocardiogram (ECG) characteristics for diagnosing FD, and more specifically, to differentiate FD with white matter lesions (WMLs) from FD without WMLs patients and these from patients with sarcomeric hypertrophic cardiomyopathy. To this end, statistics and machine learning (ML) models have been developed and applied. Fifteen ECG variables were evaluated using several statistical inference methods mainly to identify significant differences between groups, considering sex and age. Two feature selection methods were applied, one based on variance inflation factor (VIF) values, and a recursive feature elimination using logistic regression, linear support vector machine (SVM), and random forest classifiers. Then, the performance of five ML algorithms - logistic regression, linear SVM, radial basis function (RBF) SVM, random forest, and K-nearest neighbor (KNN) - at distinguishing the different groups were evaluated to identify the best model for each classification problem. Age was found to be significantly different between groups and to be related to the ECG variables values. After subdivision into three categories by age, some ECG characteristics were identified as important to distinguish the groups and unaffected by age. Based on selected ECG characteristics, the results showed good classification accuracies, with the best scores ranging from 80% to 85%, obtained using RBF SVM, random forest, or KNN. These findings demonstrate the potential of ML techniques based on ECG characteristics as a complementary tool for diagnosing FD with or without WMLs that could be useful to reduce the diagnosis delay.Bicho, EstelaFerreira, Flora José RochaUniversidade do MinhoMoura, Ana Rita Sousa2022-05-162022-05-16T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/81532eng203075498info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T12:50:33Zoai:repositorium.sdum.uminho.pt:1822/81532Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T19:49:17.052727Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Detecting important electrocardiogram characteristics for the diagnosis of Fabry disease via statistics and machine learning techniques Deteção de características do electrocardiograma importantes para o diagnóstico da doença de Fabry utilizando estatística e técnicas de machine learning. |
title |
Detecting important electrocardiogram characteristics for the diagnosis of Fabry disease via statistics and machine learning techniques |
spellingShingle |
Detecting important electrocardiogram characteristics for the diagnosis of Fabry disease via statistics and machine learning techniques Moura, Ana Rita Sousa Classificação Doença de Fabry Eletrocardiograma Estatística Machine Learning Classification Electrocardiogram Fabry disease Statistics Engenharia e Tecnologia::Engenharia Médica |
title_short |
Detecting important electrocardiogram characteristics for the diagnosis of Fabry disease via statistics and machine learning techniques |
title_full |
Detecting important electrocardiogram characteristics for the diagnosis of Fabry disease via statistics and machine learning techniques |
title_fullStr |
Detecting important electrocardiogram characteristics for the diagnosis of Fabry disease via statistics and machine learning techniques |
title_full_unstemmed |
Detecting important electrocardiogram characteristics for the diagnosis of Fabry disease via statistics and machine learning techniques |
title_sort |
Detecting important electrocardiogram characteristics for the diagnosis of Fabry disease via statistics and machine learning techniques |
author |
Moura, Ana Rita Sousa |
author_facet |
Moura, Ana Rita Sousa |
author_role |
author |
dc.contributor.none.fl_str_mv |
Bicho, Estela Ferreira, Flora José Rocha Universidade do Minho |
dc.contributor.author.fl_str_mv |
Moura, Ana Rita Sousa |
dc.subject.por.fl_str_mv |
Classificação Doença de Fabry Eletrocardiograma Estatística Machine Learning Classification Electrocardiogram Fabry disease Statistics Engenharia e Tecnologia::Engenharia Médica |
topic |
Classificação Doença de Fabry Eletrocardiograma Estatística Machine Learning Classification Electrocardiogram Fabry disease Statistics Engenharia e Tecnologia::Engenharia Médica |
description |
Dissertação de mestrado integrado em Engenharia Biomédica (especialização em Eletrónica Médica) |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-05-16 2022-05-16T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/1822/81532 |
url |
https://hdl.handle.net/1822/81532 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.relation.none.fl_str_mv |
203075498 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799133073892179968 |