Aprendizado de máquina em tarefas prognósticas de COVID-19 : avaliação de algoritmos de classificação

Kuhn, Daniel Matheus

Aprendizado de máquina em tarefas prognósticas de COVID-19 : avaliação de algoritmos de classificação

Detalhes bibliográficos
Autor(a) principal:	Kuhn, Daniel Matheus
Data de Publicação:	2022
Tipo de documento:	Dissertação
Idioma:	eng
Título da fonte:	Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo:	http://hdl.handle.net/10183/255621
Resumo:	Modelos preditivos na área da saúde têm sido investigados por inúmeros trabalhos visando o prognóstico e diagnóstico de pacientes. O cenário emergencial de saúde estabelecido pela pandemia da COVID-19 acentuou o interesse em utilizar modelos preditivos para apoiar a tomada de decisão no contexto clínico hospitalar. Esses modelos podem ser empregados nos mais variados desafios enfrentados pelos profissionais de saúde, promovendo um melhor atendimento, otimizando processos de gestão clínica e alocação de recursos. Este trabalho tem como principal objetivo avaliar algoritmos de Aprendizado de Máquina em três tarefas prognósticas a partir de exames disponíveis na admissão hospitalar. As tarefas avaliadas foram: (i) predição de mortalidade; (ii) predição de necessidade de internação em CTI; e (iii) predição de necessidade de recursos de ventilação mecânica invasiva (VMI). Para subsidiar o estudo, foram utilizados registros de 3795 pacientes internados em dois hospitais brasileiros. Avaliamos seis algoritmos de classificação nas três tarefas supracitadas e aplicamos técnicas de visualização de dados, bem como abordagens de explicabilidade para auxiliar na compreensão dos atributos levados em consideração pelos classificadores durante a predição. Além disso, desenvolvemos uma técnica de visualização baseada na abordagem de explicabilidade SHAP, com o intuito de extrair insights sobre a relação entre os atributos consideradas relevantes pelos modelos preditivos e suas previsões. Os resultados nas tarefas de classificação para os conjuntos de dados utilizados neste trabalho foram promissores. Os maiores escores de sensibilidade foram atingidos pelo algoritmo de regressão logística. As investigações acerca dos fatores levados em consideração pelos classificadores apontaram, recorrentemente, a idade avançada dos pa cientes como o principal fator relacionado à mortalidade. Para a predição de VMI e CTI, atributos relacionados à função respiratória dos pacientes, como baixos índices de satu ração de oxigênio e altos índices de pressão parcial de CO2, também foram elencados como relevantes durante a predição. Por fim, a avaliação cruzada utilizando pacientes de diferentes CTI mostrou que os classificadores são sensíveis às características das popu lações com as quais foram treinados, podendo não generalizar para diferentes unidades hospitalares.

Metadados do item

id	URGS_62e5574350f131ec47304cd961efaaf6
oai_identifier_str	oai:www.lume.ufrgs.br:10183/255621
network_acronym_str	URGS
network_name_str	Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str	1853
spelling	Kuhn, Daniel MatheusMoreira, Viviane Pereira2023-03-11T03:30:11Z2022http://hdl.handle.net/10183/255621001163944Modelos preditivos na área da saúde têm sido investigados por inúmeros trabalhos visando o prognóstico e diagnóstico de pacientes. O cenário emergencial de saúde estabelecido pela pandemia da COVID-19 acentuou o interesse em utilizar modelos preditivos para apoiar a tomada de decisão no contexto clínico hospitalar. Esses modelos podem ser empregados nos mais variados desafios enfrentados pelos profissionais de saúde, promovendo um melhor atendimento, otimizando processos de gestão clínica e alocação de recursos. Este trabalho tem como principal objetivo avaliar algoritmos de Aprendizado de Máquina em três tarefas prognósticas a partir de exames disponíveis na admissão hospitalar. As tarefas avaliadas foram: (i) predição de mortalidade; (ii) predição de necessidade de internação em CTI; e (iii) predição de necessidade de recursos de ventilação mecânica invasiva (VMI). Para subsidiar o estudo, foram utilizados registros de 3795 pacientes internados em dois hospitais brasileiros. Avaliamos seis algoritmos de classificação nas três tarefas supracitadas e aplicamos técnicas de visualização de dados, bem como abordagens de explicabilidade para auxiliar na compreensão dos atributos levados em consideração pelos classificadores durante a predição. Além disso, desenvolvemos uma técnica de visualização baseada na abordagem de explicabilidade SHAP, com o intuito de extrair insights sobre a relação entre os atributos consideradas relevantes pelos modelos preditivos e suas previsões. Os resultados nas tarefas de classificação para os conjuntos de dados utilizados neste trabalho foram promissores. Os maiores escores de sensibilidade foram atingidos pelo algoritmo de regressão logística. As investigações acerca dos fatores levados em consideração pelos classificadores apontaram, recorrentemente, a idade avançada dos pa cientes como o principal fator relacionado à mortalidade. Para a predição de VMI e CTI, atributos relacionados à função respiratória dos pacientes, como baixos índices de satu ração de oxigênio e altos índices de pressão parcial de CO2, também foram elencados como relevantes durante a predição. Por fim, a avaliação cruzada utilizando pacientes de diferentes CTI mostrou que os classificadores são sensíveis às características das popu lações com as quais foram treinados, podendo não generalizar para diferentes unidades hospitalares.Predictive models in the health area have been investigated by numerous studies aimed at the prognosis and diagnosis of patients. The emergency health scenario established by the COVID-19 pandemic has heightened the interest in using predictive models to sup port decision-making in the hospital clinical context. These models can be used in the most varied challenges faced by health professionals, promoting better care, optimizing clinical management processes and resource allocation. The main objective of this work is to evaluate Machine Learning algorithms in three prognostic tasks based on exams available at patient’s admission. The tasks evaluated were: (i) prediction of hospitaliza tion outcome; (ii) prediction of need for ICU admission; and (iii) prediction of need for invasive mechanical ventilation (IMV). To support the study, records of 3795 patients ad mitted to two Brazilian hospitals were used. We evaluated six classification algorithms in the three aforementioned tasks and applied data visualization techniques, as well as explicability approaches to assist in understanding the attributes taken into account by the classifiers during prediction. In addition, we developed a visualization technique based on the SHAP explainability approach in order to extract insights into the relationship be tween the variables considered by the predictive models and their predictions. The results in the classification tasks for the datasets used in this work were promising. The highest sensitivity scores were achieved by the logistic regression algorithm. Investigations into the factors taken into account by the classifiers have repeatedly pointed to the advanced age of patients as the main factor related to mortality. For the prediction of IMV and ICU, attributes related to the respiratory function of patients, such as low levels of oxygen saturation and high levels of CO2 partial pressure, were also listed as relevant during the prediction. Finally, the cross-assessment using patients from different ICUs showed that the classifiers are sensitive to the characteristics of the populations with which they were trained and may not generalize to different hospital units.application/pdfengAprendizado de máquinaCOVID-19Modelos preditivosAlgorítmoClassificationAdmission InformationAprendizado de máquina em tarefas prognósticas de COVID-19 : avaliação de algoritmos de classificaçãoMachine learning in COVID-19 prognostic tasks : evaluation of classification algorithms info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2022mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001163944.pdf.txt001163944.pdf.txtExtracted Texttext/plain240205http://www.lume.ufrgs.br/bitstream/10183/255621/2/001163944.pdf.txt7511a652882392dd4cedc2e3bf83250fMD52ORIGINAL001163944.pdfTexto completoapplication/pdf9185812http://www.lume.ufrgs.br/bitstream/10183/255621/1/001163944.pdf481cb840c8804cbbaacf11c473d17b03MD5110183/2556212023-03-12 03:23:58.499214oai:www.lume.ufrgs.br:10183/255621Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br\|\|lume@ufrgs.bropendoar:18532023-03-12T06:23:58Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv	Aprendizado de máquina em tarefas prognósticas de COVID-19 : avaliação de algoritmos de classificação
dc.title.alternative.pt.fl_str_mv	Machine learning in COVID-19 prognostic tasks : evaluation of classification algorithms
title	Aprendizado de máquina em tarefas prognósticas de COVID-19 : avaliação de algoritmos de classificação
spellingShingle	Aprendizado de máquina em tarefas prognósticas de COVID-19 : avaliação de algoritmos de classificação Kuhn, Daniel Matheus Aprendizado de máquina COVID-19 Modelos preditivos Algorítmo Classification Admission Information
title_short	Aprendizado de máquina em tarefas prognósticas de COVID-19 : avaliação de algoritmos de classificação
title_full	Aprendizado de máquina em tarefas prognósticas de COVID-19 : avaliação de algoritmos de classificação
title_fullStr	Aprendizado de máquina em tarefas prognósticas de COVID-19 : avaliação de algoritmos de classificação
title_full_unstemmed	Aprendizado de máquina em tarefas prognósticas de COVID-19 : avaliação de algoritmos de classificação
title_sort	Aprendizado de máquina em tarefas prognósticas de COVID-19 : avaliação de algoritmos de classificação
author	Kuhn, Daniel Matheus
author_facet	Kuhn, Daniel Matheus
author_role	author
dc.contributor.author.fl_str_mv	Kuhn, Daniel Matheus
dc.contributor.advisor1.fl_str_mv	Moreira, Viviane Pereira
contributor_str_mv	Moreira, Viviane Pereira
dc.subject.por.fl_str_mv	Aprendizado de máquina COVID-19 Modelos preditivos Algorítmo
topic	Aprendizado de máquina COVID-19 Modelos preditivos Algorítmo Classification Admission Information
dc.subject.eng.fl_str_mv	Classification Admission Information
description	Modelos preditivos na área da saúde têm sido investigados por inúmeros trabalhos visando o prognóstico e diagnóstico de pacientes. O cenário emergencial de saúde estabelecido pela pandemia da COVID-19 acentuou o interesse em utilizar modelos preditivos para apoiar a tomada de decisão no contexto clínico hospitalar. Esses modelos podem ser empregados nos mais variados desafios enfrentados pelos profissionais de saúde, promovendo um melhor atendimento, otimizando processos de gestão clínica e alocação de recursos. Este trabalho tem como principal objetivo avaliar algoritmos de Aprendizado de Máquina em três tarefas prognósticas a partir de exames disponíveis na admissão hospitalar. As tarefas avaliadas foram: (i) predição de mortalidade; (ii) predição de necessidade de internação em CTI; e (iii) predição de necessidade de recursos de ventilação mecânica invasiva (VMI). Para subsidiar o estudo, foram utilizados registros de 3795 pacientes internados em dois hospitais brasileiros. Avaliamos seis algoritmos de classificação nas três tarefas supracitadas e aplicamos técnicas de visualização de dados, bem como abordagens de explicabilidade para auxiliar na compreensão dos atributos levados em consideração pelos classificadores durante a predição. Além disso, desenvolvemos uma técnica de visualização baseada na abordagem de explicabilidade SHAP, com o intuito de extrair insights sobre a relação entre os atributos consideradas relevantes pelos modelos preditivos e suas previsões. Os resultados nas tarefas de classificação para os conjuntos de dados utilizados neste trabalho foram promissores. Os maiores escores de sensibilidade foram atingidos pelo algoritmo de regressão logística. As investigações acerca dos fatores levados em consideração pelos classificadores apontaram, recorrentemente, a idade avançada dos pa cientes como o principal fator relacionado à mortalidade. Para a predição de VMI e CTI, atributos relacionados à função respiratória dos pacientes, como baixos índices de satu ração de oxigênio e altos índices de pressão parcial de CO2, também foram elencados como relevantes durante a predição. Por fim, a avaliação cruzada utilizando pacientes de diferentes CTI mostrou que os classificadores são sensíveis às características das popu lações com as quais foram treinados, podendo não generalizar para diferentes unidades hospitalares.
publishDate	2022
dc.date.issued.fl_str_mv	2022
dc.date.accessioned.fl_str_mv	2023-03-11T03:30:11Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/10183/255621
dc.identifier.nrb.pt_BR.fl_str_mv	001163944
url	http://hdl.handle.net/10183/255621
identifier_str_mv	001163944
dc.language.iso.fl_str_mv	eng
language	eng
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS
instname_str	Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str	UFRGS
institution	UFRGS
reponame_str	Biblioteca Digital de Teses e Dissertações da UFRGS
collection	Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv	http://www.lume.ufrgs.br/bitstream/10183/255621/2/001163944.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/255621/1/001163944.pdf
bitstream.checksum.fl_str_mv	7511a652882392dd4cedc2e3bf83250f 481cb840c8804cbbaacf11c473d17b03
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv	lume@ufrgs.br\|\|lume@ufrgs.br
_version_	1810085611426545664

Aprendizado de máquina em tarefas prognósticas de COVID-19 : avaliação de algoritmos de classificação

Registros relacionados