Aprendizado de máquina em tarefas prognósticas de COVID-19 : avaliação de algoritmos de classificação

Detalhes bibliográficos
Autor(a) principal: Kuhn, Daniel Matheus
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/255621
Resumo: Modelos preditivos na área da saúde têm sido investigados por inúmeros trabalhos visando o prognóstico e diagnóstico de pacientes. O cenário emergencial de saúde estabelecido pela pandemia da COVID-19 acentuou o interesse em utilizar modelos preditivos para apoiar a tomada de decisão no contexto clínico hospitalar. Esses modelos podem ser empregados nos mais variados desafios enfrentados pelos profissionais de saúde, promovendo um melhor atendimento, otimizando processos de gestão clínica e alocação de recursos. Este trabalho tem como principal objetivo avaliar algoritmos de Aprendizado de Máquina em três tarefas prognósticas a partir de exames disponíveis na admissão hospitalar. As tarefas avaliadas foram: (i) predição de mortalidade; (ii) predição de necessidade de internação em CTI; e (iii) predição de necessidade de recursos de ventilação mecânica invasiva (VMI). Para subsidiar o estudo, foram utilizados registros de 3795 pacientes internados em dois hospitais brasileiros. Avaliamos seis algoritmos de classificação nas três tarefas supracitadas e aplicamos técnicas de visualização de dados, bem como abordagens de explicabilidade para auxiliar na compreensão dos atributos levados em consideração pelos classificadores durante a predição. Além disso, desenvolvemos uma técnica de visualização baseada na abordagem de explicabilidade SHAP, com o intuito de extrair insights sobre a relação entre os atributos consideradas relevantes pelos modelos preditivos e suas previsões. Os resultados nas tarefas de classificação para os conjuntos de dados utilizados neste trabalho foram promissores. Os maiores escores de sensibilidade foram atingidos pelo algoritmo de regressão logística. As investigações acerca dos fatores levados em consideração pelos classificadores apontaram, recorrentemente, a idade avançada dos pa cientes como o principal fator relacionado à mortalidade. Para a predição de VMI e CTI, atributos relacionados à função respiratória dos pacientes, como baixos índices de satu ração de oxigênio e altos índices de pressão parcial de CO2, também foram elencados como relevantes durante a predição. Por fim, a avaliação cruzada utilizando pacientes de diferentes CTI mostrou que os classificadores são sensíveis às características das popu lações com as quais foram treinados, podendo não generalizar para diferentes unidades hospitalares.
id URGS_62e5574350f131ec47304cd961efaaf6
oai_identifier_str oai:www.lume.ufrgs.br:10183/255621
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Kuhn, Daniel MatheusMoreira, Viviane Pereira2023-03-11T03:30:11Z2022http://hdl.handle.net/10183/255621001163944Modelos preditivos na área da saúde têm sido investigados por inúmeros trabalhos visando o prognóstico e diagnóstico de pacientes. O cenário emergencial de saúde estabelecido pela pandemia da COVID-19 acentuou o interesse em utilizar modelos preditivos para apoiar a tomada de decisão no contexto clínico hospitalar. Esses modelos podem ser empregados nos mais variados desafios enfrentados pelos profissionais de saúde, promovendo um melhor atendimento, otimizando processos de gestão clínica e alocação de recursos. Este trabalho tem como principal objetivo avaliar algoritmos de Aprendizado de Máquina em três tarefas prognósticas a partir de exames disponíveis na admissão hospitalar. As tarefas avaliadas foram: (i) predição de mortalidade; (ii) predição de necessidade de internação em CTI; e (iii) predição de necessidade de recursos de ventilação mecânica invasiva (VMI). Para subsidiar o estudo, foram utilizados registros de 3795 pacientes internados em dois hospitais brasileiros. Avaliamos seis algoritmos de classificação nas três tarefas supracitadas e aplicamos técnicas de visualização de dados, bem como abordagens de explicabilidade para auxiliar na compreensão dos atributos levados em consideração pelos classificadores durante a predição. Além disso, desenvolvemos uma técnica de visualização baseada na abordagem de explicabilidade SHAP, com o intuito de extrair insights sobre a relação entre os atributos consideradas relevantes pelos modelos preditivos e suas previsões. Os resultados nas tarefas de classificação para os conjuntos de dados utilizados neste trabalho foram promissores. Os maiores escores de sensibilidade foram atingidos pelo algoritmo de regressão logística. As investigações acerca dos fatores levados em consideração pelos classificadores apontaram, recorrentemente, a idade avançada dos pa cientes como o principal fator relacionado à mortalidade. Para a predição de VMI e CTI, atributos relacionados à função respiratória dos pacientes, como baixos índices de satu ração de oxigênio e altos índices de pressão parcial de CO2, também foram elencados como relevantes durante a predição. Por fim, a avaliação cruzada utilizando pacientes de diferentes CTI mostrou que os classificadores são sensíveis às características das popu lações com as quais foram treinados, podendo não generalizar para diferentes unidades hospitalares.Predictive models in the health area have been investigated by numerous studies aimed at the prognosis and diagnosis of patients. The emergency health scenario established by the COVID-19 pandemic has heightened the interest in using predictive models to sup port decision-making in the hospital clinical context. These models can be used in the most varied challenges faced by health professionals, promoting better care, optimizing clinical management processes and resource allocation. The main objective of this work is to evaluate Machine Learning algorithms in three prognostic tasks based on exams available at patient’s admission. The tasks evaluated were: (i) prediction of hospitaliza tion outcome; (ii) prediction of need for ICU admission; and (iii) prediction of need for invasive mechanical ventilation (IMV). To support the study, records of 3795 patients ad mitted to two Brazilian hospitals were used. We evaluated six classification algorithms in the three aforementioned tasks and applied data visualization techniques, as well as explicability approaches to assist in understanding the attributes taken into account by the classifiers during prediction. In addition, we developed a visualization technique based on the SHAP explainability approach in order to extract insights into the relationship be tween the variables considered by the predictive models and their predictions. The results in the classification tasks for the datasets used in this work were promising. The highest sensitivity scores were achieved by the logistic regression algorithm. Investigations into the factors taken into account by the classifiers have repeatedly pointed to the advanced age of patients as the main factor related to mortality. For the prediction of IMV and ICU, attributes related to the respiratory function of patients, such as low levels of oxygen saturation and high levels of CO2 partial pressure, were also listed as relevant during the prediction. Finally, the cross-assessment using patients from different ICUs showed that the classifiers are sensitive to the characteristics of the populations with which they were trained and may not generalize to different hospital units.application/pdfengAprendizado de máquinaCOVID-19Modelos preditivosAlgorítmoClassificationAdmission InformationAprendizado de máquina em tarefas prognósticas de COVID-19 : avaliação de algoritmos de classificaçãoMachine learning in COVID-19 prognostic tasks : evaluation of classification algorithms info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2022mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001163944.pdf.txt001163944.pdf.txtExtracted Texttext/plain240205http://www.lume.ufrgs.br/bitstream/10183/255621/2/001163944.pdf.txt7511a652882392dd4cedc2e3bf83250fMD52ORIGINAL001163944.pdfTexto completoapplication/pdf9185812http://www.lume.ufrgs.br/bitstream/10183/255621/1/001163944.pdf481cb840c8804cbbaacf11c473d17b03MD5110183/2556212023-03-12 03:23:58.499214oai:www.lume.ufrgs.br:10183/255621Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532023-03-12T06:23:58Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Aprendizado de máquina em tarefas prognósticas de COVID-19 : avaliação de algoritmos de classificação
dc.title.alternative.pt.fl_str_mv Machine learning in COVID-19 prognostic tasks : evaluation of classification algorithms
title Aprendizado de máquina em tarefas prognósticas de COVID-19 : avaliação de algoritmos de classificação
spellingShingle Aprendizado de máquina em tarefas prognósticas de COVID-19 : avaliação de algoritmos de classificação
Kuhn, Daniel Matheus
Aprendizado de máquina
COVID-19
Modelos preditivos
Algorítmo
Classification
Admission Information
title_short Aprendizado de máquina em tarefas prognósticas de COVID-19 : avaliação de algoritmos de classificação
title_full Aprendizado de máquina em tarefas prognósticas de COVID-19 : avaliação de algoritmos de classificação
title_fullStr Aprendizado de máquina em tarefas prognósticas de COVID-19 : avaliação de algoritmos de classificação
title_full_unstemmed Aprendizado de máquina em tarefas prognósticas de COVID-19 : avaliação de algoritmos de classificação
title_sort Aprendizado de máquina em tarefas prognósticas de COVID-19 : avaliação de algoritmos de classificação
author Kuhn, Daniel Matheus
author_facet Kuhn, Daniel Matheus
author_role author
dc.contributor.author.fl_str_mv Kuhn, Daniel Matheus
dc.contributor.advisor1.fl_str_mv Moreira, Viviane Pereira
contributor_str_mv Moreira, Viviane Pereira
dc.subject.por.fl_str_mv Aprendizado de máquina
COVID-19
Modelos preditivos
Algorítmo
topic Aprendizado de máquina
COVID-19
Modelos preditivos
Algorítmo
Classification
Admission Information
dc.subject.eng.fl_str_mv Classification
Admission Information
description Modelos preditivos na área da saúde têm sido investigados por inúmeros trabalhos visando o prognóstico e diagnóstico de pacientes. O cenário emergencial de saúde estabelecido pela pandemia da COVID-19 acentuou o interesse em utilizar modelos preditivos para apoiar a tomada de decisão no contexto clínico hospitalar. Esses modelos podem ser empregados nos mais variados desafios enfrentados pelos profissionais de saúde, promovendo um melhor atendimento, otimizando processos de gestão clínica e alocação de recursos. Este trabalho tem como principal objetivo avaliar algoritmos de Aprendizado de Máquina em três tarefas prognósticas a partir de exames disponíveis na admissão hospitalar. As tarefas avaliadas foram: (i) predição de mortalidade; (ii) predição de necessidade de internação em CTI; e (iii) predição de necessidade de recursos de ventilação mecânica invasiva (VMI). Para subsidiar o estudo, foram utilizados registros de 3795 pacientes internados em dois hospitais brasileiros. Avaliamos seis algoritmos de classificação nas três tarefas supracitadas e aplicamos técnicas de visualização de dados, bem como abordagens de explicabilidade para auxiliar na compreensão dos atributos levados em consideração pelos classificadores durante a predição. Além disso, desenvolvemos uma técnica de visualização baseada na abordagem de explicabilidade SHAP, com o intuito de extrair insights sobre a relação entre os atributos consideradas relevantes pelos modelos preditivos e suas previsões. Os resultados nas tarefas de classificação para os conjuntos de dados utilizados neste trabalho foram promissores. Os maiores escores de sensibilidade foram atingidos pelo algoritmo de regressão logística. As investigações acerca dos fatores levados em consideração pelos classificadores apontaram, recorrentemente, a idade avançada dos pa cientes como o principal fator relacionado à mortalidade. Para a predição de VMI e CTI, atributos relacionados à função respiratória dos pacientes, como baixos índices de satu ração de oxigênio e altos índices de pressão parcial de CO2, também foram elencados como relevantes durante a predição. Por fim, a avaliação cruzada utilizando pacientes de diferentes CTI mostrou que os classificadores são sensíveis às características das popu lações com as quais foram treinados, podendo não generalizar para diferentes unidades hospitalares.
publishDate 2022
dc.date.issued.fl_str_mv 2022
dc.date.accessioned.fl_str_mv 2023-03-11T03:30:11Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/255621
dc.identifier.nrb.pt_BR.fl_str_mv 001163944
url http://hdl.handle.net/10183/255621
identifier_str_mv 001163944
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/255621/2/001163944.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/255621/1/001163944.pdf
bitstream.checksum.fl_str_mv 7511a652882392dd4cedc2e3bf83250f
481cb840c8804cbbaacf11c473d17b03
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1810085611426545664