Aprendizado de máquina em tarefas prognósticas de COVID-19 : avaliação de algoritmos de classificação
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/255621 |
Resumo: | Modelos preditivos na área da saúde têm sido investigados por inúmeros trabalhos visando o prognóstico e diagnóstico de pacientes. O cenário emergencial de saúde estabelecido pela pandemia da COVID-19 acentuou o interesse em utilizar modelos preditivos para apoiar a tomada de decisão no contexto clínico hospitalar. Esses modelos podem ser empregados nos mais variados desafios enfrentados pelos profissionais de saúde, promovendo um melhor atendimento, otimizando processos de gestão clínica e alocação de recursos. Este trabalho tem como principal objetivo avaliar algoritmos de Aprendizado de Máquina em três tarefas prognósticas a partir de exames disponíveis na admissão hospitalar. As tarefas avaliadas foram: (i) predição de mortalidade; (ii) predição de necessidade de internação em CTI; e (iii) predição de necessidade de recursos de ventilação mecânica invasiva (VMI). Para subsidiar o estudo, foram utilizados registros de 3795 pacientes internados em dois hospitais brasileiros. Avaliamos seis algoritmos de classificação nas três tarefas supracitadas e aplicamos técnicas de visualização de dados, bem como abordagens de explicabilidade para auxiliar na compreensão dos atributos levados em consideração pelos classificadores durante a predição. Além disso, desenvolvemos uma técnica de visualização baseada na abordagem de explicabilidade SHAP, com o intuito de extrair insights sobre a relação entre os atributos consideradas relevantes pelos modelos preditivos e suas previsões. Os resultados nas tarefas de classificação para os conjuntos de dados utilizados neste trabalho foram promissores. Os maiores escores de sensibilidade foram atingidos pelo algoritmo de regressão logística. As investigações acerca dos fatores levados em consideração pelos classificadores apontaram, recorrentemente, a idade avançada dos pa cientes como o principal fator relacionado à mortalidade. Para a predição de VMI e CTI, atributos relacionados à função respiratória dos pacientes, como baixos índices de satu ração de oxigênio e altos índices de pressão parcial de CO2, também foram elencados como relevantes durante a predição. Por fim, a avaliação cruzada utilizando pacientes de diferentes CTI mostrou que os classificadores são sensíveis às características das popu lações com as quais foram treinados, podendo não generalizar para diferentes unidades hospitalares. |
id |
URGS_62e5574350f131ec47304cd961efaaf6 |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/255621 |
network_acronym_str |
URGS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
repository_id_str |
1853 |
spelling |
Kuhn, Daniel MatheusMoreira, Viviane Pereira2023-03-11T03:30:11Z2022http://hdl.handle.net/10183/255621001163944Modelos preditivos na área da saúde têm sido investigados por inúmeros trabalhos visando o prognóstico e diagnóstico de pacientes. O cenário emergencial de saúde estabelecido pela pandemia da COVID-19 acentuou o interesse em utilizar modelos preditivos para apoiar a tomada de decisão no contexto clínico hospitalar. Esses modelos podem ser empregados nos mais variados desafios enfrentados pelos profissionais de saúde, promovendo um melhor atendimento, otimizando processos de gestão clínica e alocação de recursos. Este trabalho tem como principal objetivo avaliar algoritmos de Aprendizado de Máquina em três tarefas prognósticas a partir de exames disponíveis na admissão hospitalar. As tarefas avaliadas foram: (i) predição de mortalidade; (ii) predição de necessidade de internação em CTI; e (iii) predição de necessidade de recursos de ventilação mecânica invasiva (VMI). Para subsidiar o estudo, foram utilizados registros de 3795 pacientes internados em dois hospitais brasileiros. Avaliamos seis algoritmos de classificação nas três tarefas supracitadas e aplicamos técnicas de visualização de dados, bem como abordagens de explicabilidade para auxiliar na compreensão dos atributos levados em consideração pelos classificadores durante a predição. Além disso, desenvolvemos uma técnica de visualização baseada na abordagem de explicabilidade SHAP, com o intuito de extrair insights sobre a relação entre os atributos consideradas relevantes pelos modelos preditivos e suas previsões. Os resultados nas tarefas de classificação para os conjuntos de dados utilizados neste trabalho foram promissores. Os maiores escores de sensibilidade foram atingidos pelo algoritmo de regressão logística. As investigações acerca dos fatores levados em consideração pelos classificadores apontaram, recorrentemente, a idade avançada dos pa cientes como o principal fator relacionado à mortalidade. Para a predição de VMI e CTI, atributos relacionados à função respiratória dos pacientes, como baixos índices de satu ração de oxigênio e altos índices de pressão parcial de CO2, também foram elencados como relevantes durante a predição. Por fim, a avaliação cruzada utilizando pacientes de diferentes CTI mostrou que os classificadores são sensíveis às características das popu lações com as quais foram treinados, podendo não generalizar para diferentes unidades hospitalares.Predictive models in the health area have been investigated by numerous studies aimed at the prognosis and diagnosis of patients. The emergency health scenario established by the COVID-19 pandemic has heightened the interest in using predictive models to sup port decision-making in the hospital clinical context. These models can be used in the most varied challenges faced by health professionals, promoting better care, optimizing clinical management processes and resource allocation. The main objective of this work is to evaluate Machine Learning algorithms in three prognostic tasks based on exams available at patient’s admission. The tasks evaluated were: (i) prediction of hospitaliza tion outcome; (ii) prediction of need for ICU admission; and (iii) prediction of need for invasive mechanical ventilation (IMV). To support the study, records of 3795 patients ad mitted to two Brazilian hospitals were used. We evaluated six classification algorithms in the three aforementioned tasks and applied data visualization techniques, as well as explicability approaches to assist in understanding the attributes taken into account by the classifiers during prediction. In addition, we developed a visualization technique based on the SHAP explainability approach in order to extract insights into the relationship be tween the variables considered by the predictive models and their predictions. The results in the classification tasks for the datasets used in this work were promising. The highest sensitivity scores were achieved by the logistic regression algorithm. Investigations into the factors taken into account by the classifiers have repeatedly pointed to the advanced age of patients as the main factor related to mortality. For the prediction of IMV and ICU, attributes related to the respiratory function of patients, such as low levels of oxygen saturation and high levels of CO2 partial pressure, were also listed as relevant during the prediction. Finally, the cross-assessment using patients from different ICUs showed that the classifiers are sensitive to the characteristics of the populations with which they were trained and may not generalize to different hospital units.application/pdfengAprendizado de máquinaCOVID-19Modelos preditivosAlgorítmoClassificationAdmission InformationAprendizado de máquina em tarefas prognósticas de COVID-19 : avaliação de algoritmos de classificaçãoMachine learning in COVID-19 prognostic tasks : evaluation of classification algorithms info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2022mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001163944.pdf.txt001163944.pdf.txtExtracted Texttext/plain240205http://www.lume.ufrgs.br/bitstream/10183/255621/2/001163944.pdf.txt7511a652882392dd4cedc2e3bf83250fMD52ORIGINAL001163944.pdfTexto completoapplication/pdf9185812http://www.lume.ufrgs.br/bitstream/10183/255621/1/001163944.pdf481cb840c8804cbbaacf11c473d17b03MD5110183/2556212023-03-12 03:23:58.499214oai:www.lume.ufrgs.br:10183/255621Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532023-03-12T06:23:58Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Aprendizado de máquina em tarefas prognósticas de COVID-19 : avaliação de algoritmos de classificação |
dc.title.alternative.pt.fl_str_mv |
Machine learning in COVID-19 prognostic tasks : evaluation of classification algorithms |
title |
Aprendizado de máquina em tarefas prognósticas de COVID-19 : avaliação de algoritmos de classificação |
spellingShingle |
Aprendizado de máquina em tarefas prognósticas de COVID-19 : avaliação de algoritmos de classificação Kuhn, Daniel Matheus Aprendizado de máquina COVID-19 Modelos preditivos Algorítmo Classification Admission Information |
title_short |
Aprendizado de máquina em tarefas prognósticas de COVID-19 : avaliação de algoritmos de classificação |
title_full |
Aprendizado de máquina em tarefas prognósticas de COVID-19 : avaliação de algoritmos de classificação |
title_fullStr |
Aprendizado de máquina em tarefas prognósticas de COVID-19 : avaliação de algoritmos de classificação |
title_full_unstemmed |
Aprendizado de máquina em tarefas prognósticas de COVID-19 : avaliação de algoritmos de classificação |
title_sort |
Aprendizado de máquina em tarefas prognósticas de COVID-19 : avaliação de algoritmos de classificação |
author |
Kuhn, Daniel Matheus |
author_facet |
Kuhn, Daniel Matheus |
author_role |
author |
dc.contributor.author.fl_str_mv |
Kuhn, Daniel Matheus |
dc.contributor.advisor1.fl_str_mv |
Moreira, Viviane Pereira |
contributor_str_mv |
Moreira, Viviane Pereira |
dc.subject.por.fl_str_mv |
Aprendizado de máquina COVID-19 Modelos preditivos Algorítmo |
topic |
Aprendizado de máquina COVID-19 Modelos preditivos Algorítmo Classification Admission Information |
dc.subject.eng.fl_str_mv |
Classification Admission Information |
description |
Modelos preditivos na área da saúde têm sido investigados por inúmeros trabalhos visando o prognóstico e diagnóstico de pacientes. O cenário emergencial de saúde estabelecido pela pandemia da COVID-19 acentuou o interesse em utilizar modelos preditivos para apoiar a tomada de decisão no contexto clínico hospitalar. Esses modelos podem ser empregados nos mais variados desafios enfrentados pelos profissionais de saúde, promovendo um melhor atendimento, otimizando processos de gestão clínica e alocação de recursos. Este trabalho tem como principal objetivo avaliar algoritmos de Aprendizado de Máquina em três tarefas prognósticas a partir de exames disponíveis na admissão hospitalar. As tarefas avaliadas foram: (i) predição de mortalidade; (ii) predição de necessidade de internação em CTI; e (iii) predição de necessidade de recursos de ventilação mecânica invasiva (VMI). Para subsidiar o estudo, foram utilizados registros de 3795 pacientes internados em dois hospitais brasileiros. Avaliamos seis algoritmos de classificação nas três tarefas supracitadas e aplicamos técnicas de visualização de dados, bem como abordagens de explicabilidade para auxiliar na compreensão dos atributos levados em consideração pelos classificadores durante a predição. Além disso, desenvolvemos uma técnica de visualização baseada na abordagem de explicabilidade SHAP, com o intuito de extrair insights sobre a relação entre os atributos consideradas relevantes pelos modelos preditivos e suas previsões. Os resultados nas tarefas de classificação para os conjuntos de dados utilizados neste trabalho foram promissores. Os maiores escores de sensibilidade foram atingidos pelo algoritmo de regressão logística. As investigações acerca dos fatores levados em consideração pelos classificadores apontaram, recorrentemente, a idade avançada dos pa cientes como o principal fator relacionado à mortalidade. Para a predição de VMI e CTI, atributos relacionados à função respiratória dos pacientes, como baixos índices de satu ração de oxigênio e altos índices de pressão parcial de CO2, também foram elencados como relevantes durante a predição. Por fim, a avaliação cruzada utilizando pacientes de diferentes CTI mostrou que os classificadores são sensíveis às características das popu lações com as quais foram treinados, podendo não generalizar para diferentes unidades hospitalares. |
publishDate |
2022 |
dc.date.issued.fl_str_mv |
2022 |
dc.date.accessioned.fl_str_mv |
2023-03-11T03:30:11Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/255621 |
dc.identifier.nrb.pt_BR.fl_str_mv |
001163944 |
url |
http://hdl.handle.net/10183/255621 |
identifier_str_mv |
001163944 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
collection |
Biblioteca Digital de Teses e Dissertações da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/255621/2/001163944.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/255621/1/001163944.pdf |
bitstream.checksum.fl_str_mv |
7511a652882392dd4cedc2e3bf83250f 481cb840c8804cbbaacf11c473d17b03 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
lume@ufrgs.br||lume@ufrgs.br |
_version_ |
1810085611426545664 |