Machine Learning techniques applied to identifying clinical factors regarding automated medical prognosis
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://www.teses.usp.br/teses/disponiveis/55/55134/tde-19012023-093014/ |
Resumo: | Machine Learning Algorithms have shown promising results in several areas of knowledge, including preventive medicine. While deep learning techniques have been shown to be effective for automated medical prognosis, they lack more transparency and interpretability. On the other hand, data clustering techniques and decision trees are promising for the identification of risk factors, characteristics in common, and trends among patients according to their respective clinical stories, described by their Electronic Health Records (EHRs). In this sense, this MSc thesis aimed to elaborate a machine learning framework composed of an Attentive EncoderDecoder neural network to predict patients next admissions diagnoses, a hierarchical clustering algorithm to phenotype these predictions, and finally, a decision tree aiming the phenotypes explicability; each step of our framework produced particular results: the Attentive EncoderDecoder obtained state-of-the-art results over the datasets MIMIC-III and MIMIC-IV-ED; the clustering algorithm produced consistent results of related diagnoses of one same phenotype and, also, neighboring phenotypes demonstrated to have similar diagnoses; and finally, the decision tree provided a visualization of the decision rules between diagnoses of phenotypes and demonstrated the irrelevance of patients demographic data in comparison to their diagnoses when identifying a phenotype. We summarize our contributions as follows: (i) Achievement of state-of-the-art results with a versatile model based on an Attentive Encoder-Decoder, named by us AttentionHCare (BARROS; RODRIGUES, 2022), (ii) Provision of a decision support tool to specialists as an explainable model, and (iii) Ability to identify patterns (e.g. risk factors, common diagnoses, bias, etc.) in patients with similar clinical trajectories by using the explainable model. |
id |
USP_5b74c9cab8085053c10910c2fc671b0a |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-19012023-093014 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Machine Learning techniques applied to identifying clinical factors regarding automated medical prognosisTécnicas de Aprendizado de Máquina aplicadas à identificação de fatores clínicos ligados ao prognóstico médico automatizadoÁrvores de decisãoAttention mechanismsClinical prediction explicabilityClinical trajectory predictionClusterização hierárquicaConstrução de cohorts de pacientesDecision treesElectronic Health RecordsEncoder- DecoderEncoder-DecoderExplicabilidade de predições clínicasFenotipação de pacientesHierarchical clusteringMecanismos de atençãoPatient cohort constructionPatient phenotypingPredição de trajetórias clínicasProntuários Médicos EletrônicosMachine Learning Algorithms have shown promising results in several areas of knowledge, including preventive medicine. While deep learning techniques have been shown to be effective for automated medical prognosis, they lack more transparency and interpretability. On the other hand, data clustering techniques and decision trees are promising for the identification of risk factors, characteristics in common, and trends among patients according to their respective clinical stories, described by their Electronic Health Records (EHRs). In this sense, this MSc thesis aimed to elaborate a machine learning framework composed of an Attentive EncoderDecoder neural network to predict patients next admissions diagnoses, a hierarchical clustering algorithm to phenotype these predictions, and finally, a decision tree aiming the phenotypes explicability; each step of our framework produced particular results: the Attentive EncoderDecoder obtained state-of-the-art results over the datasets MIMIC-III and MIMIC-IV-ED; the clustering algorithm produced consistent results of related diagnoses of one same phenotype and, also, neighboring phenotypes demonstrated to have similar diagnoses; and finally, the decision tree provided a visualization of the decision rules between diagnoses of phenotypes and demonstrated the irrelevance of patients demographic data in comparison to their diagnoses when identifying a phenotype. We summarize our contributions as follows: (i) Achievement of state-of-the-art results with a versatile model based on an Attentive Encoder-Decoder, named by us AttentionHCare (BARROS; RODRIGUES, 2022), (ii) Provision of a decision support tool to specialists as an explainable model, and (iii) Ability to identify patterns (e.g. risk factors, common diagnoses, bias, etc.) in patients with similar clinical trajectories by using the explainable model.Algoritmos de Aprendizado de Máquina têm apresentado resultados promissores em diversas áreas do conhecimento, entre elas a medicina preventiva. Ao passo que técnicas de aprendizado profundo têm se mostrado eficazes para o prognóstico médico automatizado, elas carecem de mais transparência e interpretabilidade. Por outro lado, técnicas de agrupamento de dados e árvores de decisão são promissoras para a identificação de fatores de risco, características em comum, e tendências dentre os pacientes de acordo com suas respectivas histórias clínicas, descritas por prontuários médicos eletrônicos (EHRs). Deste modo, esta dissertação de mestrado objetivou a elaboração de um framework de aprendizado de máquina composto de uma rede neural Attentive Encoder-Decoder com o objetivo de predizer os diagnósticos da próxima admissão de pacientes, um algoritmo de agrupamento hierárquico para fenotipar essas predições, e finalmente, uma árvore de decisão objetivando-se a explicabilidade desses fenótipos; cada passo do nosso framework produziu um resultado em particular: a rede Attentive Encoder-Decoder obteve resultados de estado da arte nos datasets MIMIC-III e MIMIC-IV-ED; o algoritmo de agrupamento produziu resultados consistentes de diagnósticos relacionados em um mesmo fenótipo e, também, fenótipos vizinhos demonstraram similaridade de diagnósticos; e finalmente, a árvore de decisão proporcionou a visualização das regras de decisão entre diagnósticos de fenótipos e demonstrou a irrelevância de dados demográficos de pacientes em comparação com seus respectivos diagnósticos na identificação de um fenótipo. Nós resumimos nossas contribuições como: (i) Obtenção de resultados de estado da arte com um modelo versátil baseado em uma arquitetura Attentive Encoder-Decoder, nomeado por nós como AttentionHCare (BARROS; RODRIGUES, 2022), (ii) Fornecimento de uma ferramenta de suporte a decisão para especialistas por meio de um modelo explicável, e (iii) Habilidade de identificar padrões (e.g. fatores de risco, diagnósticos em comum, bias, etc.) em pacientes com trajetórias clínicas semelhantes por meio de um modelo explicável.Biblioteca Digitais de Teses e Dissertações da USPRodrigues Junior, José FernandoBarros, Pedro Henrique Ferracini de2022-11-11info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55134/tde-19012023-093014/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesseng2023-01-19T11:39:26Zoai:teses.usp.br:tde-19012023-093014Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-01-19T11:39:26Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Machine Learning techniques applied to identifying clinical factors regarding automated medical prognosis Técnicas de Aprendizado de Máquina aplicadas à identificação de fatores clínicos ligados ao prognóstico médico automatizado |
title |
Machine Learning techniques applied to identifying clinical factors regarding automated medical prognosis |
spellingShingle |
Machine Learning techniques applied to identifying clinical factors regarding automated medical prognosis Barros, Pedro Henrique Ferracini de Árvores de decisão Attention mechanisms Clinical prediction explicability Clinical trajectory prediction Clusterização hierárquica Construção de cohorts de pacientes Decision trees Electronic Health Records Encoder- Decoder Encoder-Decoder Explicabilidade de predições clínicas Fenotipação de pacientes Hierarchical clustering Mecanismos de atenção Patient cohort construction Patient phenotyping Predição de trajetórias clínicas Prontuários Médicos Eletrônicos |
title_short |
Machine Learning techniques applied to identifying clinical factors regarding automated medical prognosis |
title_full |
Machine Learning techniques applied to identifying clinical factors regarding automated medical prognosis |
title_fullStr |
Machine Learning techniques applied to identifying clinical factors regarding automated medical prognosis |
title_full_unstemmed |
Machine Learning techniques applied to identifying clinical factors regarding automated medical prognosis |
title_sort |
Machine Learning techniques applied to identifying clinical factors regarding automated medical prognosis |
author |
Barros, Pedro Henrique Ferracini de |
author_facet |
Barros, Pedro Henrique Ferracini de |
author_role |
author |
dc.contributor.none.fl_str_mv |
Rodrigues Junior, José Fernando |
dc.contributor.author.fl_str_mv |
Barros, Pedro Henrique Ferracini de |
dc.subject.por.fl_str_mv |
Árvores de decisão Attention mechanisms Clinical prediction explicability Clinical trajectory prediction Clusterização hierárquica Construção de cohorts de pacientes Decision trees Electronic Health Records Encoder- Decoder Encoder-Decoder Explicabilidade de predições clínicas Fenotipação de pacientes Hierarchical clustering Mecanismos de atenção Patient cohort construction Patient phenotyping Predição de trajetórias clínicas Prontuários Médicos Eletrônicos |
topic |
Árvores de decisão Attention mechanisms Clinical prediction explicability Clinical trajectory prediction Clusterização hierárquica Construção de cohorts de pacientes Decision trees Electronic Health Records Encoder- Decoder Encoder-Decoder Explicabilidade de predições clínicas Fenotipação de pacientes Hierarchical clustering Mecanismos de atenção Patient cohort construction Patient phenotyping Predição de trajetórias clínicas Prontuários Médicos Eletrônicos |
description |
Machine Learning Algorithms have shown promising results in several areas of knowledge, including preventive medicine. While deep learning techniques have been shown to be effective for automated medical prognosis, they lack more transparency and interpretability. On the other hand, data clustering techniques and decision trees are promising for the identification of risk factors, characteristics in common, and trends among patients according to their respective clinical stories, described by their Electronic Health Records (EHRs). In this sense, this MSc thesis aimed to elaborate a machine learning framework composed of an Attentive EncoderDecoder neural network to predict patients next admissions diagnoses, a hierarchical clustering algorithm to phenotype these predictions, and finally, a decision tree aiming the phenotypes explicability; each step of our framework produced particular results: the Attentive EncoderDecoder obtained state-of-the-art results over the datasets MIMIC-III and MIMIC-IV-ED; the clustering algorithm produced consistent results of related diagnoses of one same phenotype and, also, neighboring phenotypes demonstrated to have similar diagnoses; and finally, the decision tree provided a visualization of the decision rules between diagnoses of phenotypes and demonstrated the irrelevance of patients demographic data in comparison to their diagnoses when identifying a phenotype. We summarize our contributions as follows: (i) Achievement of state-of-the-art results with a versatile model based on an Attentive Encoder-Decoder, named by us AttentionHCare (BARROS; RODRIGUES, 2022), (ii) Provision of a decision support tool to specialists as an explainable model, and (iii) Ability to identify patterns (e.g. risk factors, common diagnoses, bias, etc.) in patients with similar clinical trajectories by using the explainable model. |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-11-11 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/55/55134/tde-19012023-093014/ |
url |
https://www.teses.usp.br/teses/disponiveis/55/55134/tde-19012023-093014/ |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815257124845912064 |