Machine Learning techniques applied to identifying clinical factors regarding automated medical prognosis

Detalhes bibliográficos
Autor(a) principal: Barros, Pedro Henrique Ferracini de
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-19012023-093014/
Resumo: Machine Learning Algorithms have shown promising results in several areas of knowledge, including preventive medicine. While deep learning techniques have been shown to be effective for automated medical prognosis, they lack more transparency and interpretability. On the other hand, data clustering techniques and decision trees are promising for the identification of risk factors, characteristics in common, and trends among patients according to their respective clinical stories, described by their Electronic Health Records (EHRs). In this sense, this MSc thesis aimed to elaborate a machine learning framework composed of an Attentive EncoderDecoder neural network to predict patients next admissions diagnoses, a hierarchical clustering algorithm to phenotype these predictions, and finally, a decision tree aiming the phenotypes explicability; each step of our framework produced particular results: the Attentive EncoderDecoder obtained state-of-the-art results over the datasets MIMIC-III and MIMIC-IV-ED; the clustering algorithm produced consistent results of related diagnoses of one same phenotype and, also, neighboring phenotypes demonstrated to have similar diagnoses; and finally, the decision tree provided a visualization of the decision rules between diagnoses of phenotypes and demonstrated the irrelevance of patients demographic data in comparison to their diagnoses when identifying a phenotype. We summarize our contributions as follows: (i) Achievement of state-of-the-art results with a versatile model based on an Attentive Encoder-Decoder, named by us AttentionHCare (BARROS; RODRIGUES, 2022), (ii) Provision of a decision support tool to specialists as an explainable model, and (iii) Ability to identify patterns (e.g. risk factors, common diagnoses, bias, etc.) in patients with similar clinical trajectories by using the explainable model.
id USP_5b74c9cab8085053c10910c2fc671b0a
oai_identifier_str oai:teses.usp.br:tde-19012023-093014
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Machine Learning techniques applied to identifying clinical factors regarding automated medical prognosisTécnicas de Aprendizado de Máquina aplicadas à identificação de fatores clínicos ligados ao prognóstico médico automatizadoÁrvores de decisãoAttention mechanismsClinical prediction explicabilityClinical trajectory predictionClusterização hierárquicaConstrução de cohorts de pacientesDecision treesElectronic Health RecordsEncoder- DecoderEncoder-DecoderExplicabilidade de predições clínicasFenotipação de pacientesHierarchical clusteringMecanismos de atençãoPatient cohort constructionPatient phenotypingPredição de trajetórias clínicasProntuários Médicos EletrônicosMachine Learning Algorithms have shown promising results in several areas of knowledge, including preventive medicine. While deep learning techniques have been shown to be effective for automated medical prognosis, they lack more transparency and interpretability. On the other hand, data clustering techniques and decision trees are promising for the identification of risk factors, characteristics in common, and trends among patients according to their respective clinical stories, described by their Electronic Health Records (EHRs). In this sense, this MSc thesis aimed to elaborate a machine learning framework composed of an Attentive EncoderDecoder neural network to predict patients next admissions diagnoses, a hierarchical clustering algorithm to phenotype these predictions, and finally, a decision tree aiming the phenotypes explicability; each step of our framework produced particular results: the Attentive EncoderDecoder obtained state-of-the-art results over the datasets MIMIC-III and MIMIC-IV-ED; the clustering algorithm produced consistent results of related diagnoses of one same phenotype and, also, neighboring phenotypes demonstrated to have similar diagnoses; and finally, the decision tree provided a visualization of the decision rules between diagnoses of phenotypes and demonstrated the irrelevance of patients demographic data in comparison to their diagnoses when identifying a phenotype. We summarize our contributions as follows: (i) Achievement of state-of-the-art results with a versatile model based on an Attentive Encoder-Decoder, named by us AttentionHCare (BARROS; RODRIGUES, 2022), (ii) Provision of a decision support tool to specialists as an explainable model, and (iii) Ability to identify patterns (e.g. risk factors, common diagnoses, bias, etc.) in patients with similar clinical trajectories by using the explainable model.Algoritmos de Aprendizado de Máquina têm apresentado resultados promissores em diversas áreas do conhecimento, entre elas a medicina preventiva. Ao passo que técnicas de aprendizado profundo têm se mostrado eficazes para o prognóstico médico automatizado, elas carecem de mais transparência e interpretabilidade. Por outro lado, técnicas de agrupamento de dados e árvores de decisão são promissoras para a identificação de fatores de risco, características em comum, e tendências dentre os pacientes de acordo com suas respectivas histórias clínicas, descritas por prontuários médicos eletrônicos (EHRs). Deste modo, esta dissertação de mestrado objetivou a elaboração de um framework de aprendizado de máquina composto de uma rede neural Attentive Encoder-Decoder com o objetivo de predizer os diagnósticos da próxima admissão de pacientes, um algoritmo de agrupamento hierárquico para fenotipar essas predições, e finalmente, uma árvore de decisão objetivando-se a explicabilidade desses fenótipos; cada passo do nosso framework produziu um resultado em particular: a rede Attentive Encoder-Decoder obteve resultados de estado da arte nos datasets MIMIC-III e MIMIC-IV-ED; o algoritmo de agrupamento produziu resultados consistentes de diagnósticos relacionados em um mesmo fenótipo e, também, fenótipos vizinhos demonstraram similaridade de diagnósticos; e finalmente, a árvore de decisão proporcionou a visualização das regras de decisão entre diagnósticos de fenótipos e demonstrou a irrelevância de dados demográficos de pacientes em comparação com seus respectivos diagnósticos na identificação de um fenótipo. Nós resumimos nossas contribuições como: (i) Obtenção de resultados de estado da arte com um modelo versátil baseado em uma arquitetura Attentive Encoder-Decoder, nomeado por nós como AttentionHCare (BARROS; RODRIGUES, 2022), (ii) Fornecimento de uma ferramenta de suporte a decisão para especialistas por meio de um modelo explicável, e (iii) Habilidade de identificar padrões (e.g. fatores de risco, diagnósticos em comum, bias, etc.) em pacientes com trajetórias clínicas semelhantes por meio de um modelo explicável.Biblioteca Digitais de Teses e Dissertações da USPRodrigues Junior, José FernandoBarros, Pedro Henrique Ferracini de2022-11-11info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55134/tde-19012023-093014/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesseng2023-01-19T11:39:26Zoai:teses.usp.br:tde-19012023-093014Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-01-19T11:39:26Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Machine Learning techniques applied to identifying clinical factors regarding automated medical prognosis
Técnicas de Aprendizado de Máquina aplicadas à identificação de fatores clínicos ligados ao prognóstico médico automatizado
title Machine Learning techniques applied to identifying clinical factors regarding automated medical prognosis
spellingShingle Machine Learning techniques applied to identifying clinical factors regarding automated medical prognosis
Barros, Pedro Henrique Ferracini de
Árvores de decisão
Attention mechanisms
Clinical prediction explicability
Clinical trajectory prediction
Clusterização hierárquica
Construção de cohorts de pacientes
Decision trees
Electronic Health Records
Encoder- Decoder
Encoder-Decoder
Explicabilidade de predições clínicas
Fenotipação de pacientes
Hierarchical clustering
Mecanismos de atenção
Patient cohort construction
Patient phenotyping
Predição de trajetórias clínicas
Prontuários Médicos Eletrônicos
title_short Machine Learning techniques applied to identifying clinical factors regarding automated medical prognosis
title_full Machine Learning techniques applied to identifying clinical factors regarding automated medical prognosis
title_fullStr Machine Learning techniques applied to identifying clinical factors regarding automated medical prognosis
title_full_unstemmed Machine Learning techniques applied to identifying clinical factors regarding automated medical prognosis
title_sort Machine Learning techniques applied to identifying clinical factors regarding automated medical prognosis
author Barros, Pedro Henrique Ferracini de
author_facet Barros, Pedro Henrique Ferracini de
author_role author
dc.contributor.none.fl_str_mv Rodrigues Junior, José Fernando
dc.contributor.author.fl_str_mv Barros, Pedro Henrique Ferracini de
dc.subject.por.fl_str_mv Árvores de decisão
Attention mechanisms
Clinical prediction explicability
Clinical trajectory prediction
Clusterização hierárquica
Construção de cohorts de pacientes
Decision trees
Electronic Health Records
Encoder- Decoder
Encoder-Decoder
Explicabilidade de predições clínicas
Fenotipação de pacientes
Hierarchical clustering
Mecanismos de atenção
Patient cohort construction
Patient phenotyping
Predição de trajetórias clínicas
Prontuários Médicos Eletrônicos
topic Árvores de decisão
Attention mechanisms
Clinical prediction explicability
Clinical trajectory prediction
Clusterização hierárquica
Construção de cohorts de pacientes
Decision trees
Electronic Health Records
Encoder- Decoder
Encoder-Decoder
Explicabilidade de predições clínicas
Fenotipação de pacientes
Hierarchical clustering
Mecanismos de atenção
Patient cohort construction
Patient phenotyping
Predição de trajetórias clínicas
Prontuários Médicos Eletrônicos
description Machine Learning Algorithms have shown promising results in several areas of knowledge, including preventive medicine. While deep learning techniques have been shown to be effective for automated medical prognosis, they lack more transparency and interpretability. On the other hand, data clustering techniques and decision trees are promising for the identification of risk factors, characteristics in common, and trends among patients according to their respective clinical stories, described by their Electronic Health Records (EHRs). In this sense, this MSc thesis aimed to elaborate a machine learning framework composed of an Attentive EncoderDecoder neural network to predict patients next admissions diagnoses, a hierarchical clustering algorithm to phenotype these predictions, and finally, a decision tree aiming the phenotypes explicability; each step of our framework produced particular results: the Attentive EncoderDecoder obtained state-of-the-art results over the datasets MIMIC-III and MIMIC-IV-ED; the clustering algorithm produced consistent results of related diagnoses of one same phenotype and, also, neighboring phenotypes demonstrated to have similar diagnoses; and finally, the decision tree provided a visualization of the decision rules between diagnoses of phenotypes and demonstrated the irrelevance of patients demographic data in comparison to their diagnoses when identifying a phenotype. We summarize our contributions as follows: (i) Achievement of state-of-the-art results with a versatile model based on an Attentive Encoder-Decoder, named by us AttentionHCare (BARROS; RODRIGUES, 2022), (ii) Provision of a decision support tool to specialists as an explainable model, and (iii) Ability to identify patterns (e.g. risk factors, common diagnoses, bias, etc.) in patients with similar clinical trajectories by using the explainable model.
publishDate 2022
dc.date.none.fl_str_mv 2022-11-11
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/55/55134/tde-19012023-093014/
url https://www.teses.usp.br/teses/disponiveis/55/55134/tde-19012023-093014/
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815257124845912064