Interpretabilidade em modelos de avaliação de risco cardiovascular

Detalhes bibliográficos
Autor(a) principal: Figueiredo, Maria Inês Dias
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10400.26/40879
Resumo: Segundo a World Health Organization, as doenças cardiovasculares representam uma das principais causas de morte a nível mundial. Para tentar contrariar esta tendência, as medidas passam bastante pela prevenção. Neste campo, a análise de dados clínicos tendo por base vários modelos Machine learning de previsão de risco tem vindo a ser implementada, com o objetivo de prever o risco de ocorrência de um determinado evento (doença, morte, etc.). No entanto, os modelos apresentam algumas fragilidades, entre as quais é possível destacar a falta de interpretabilidade, pois alguns são modelos black-box. Estes, apesar dos elevados desempenhos que apresentam, nem sempre conseguem explicar as suas previsões ao utilizador final. No entanto, em áreas tão críticas como a da saúde, o aumento da interpretabilidade é fundamental para criar a confiança necessária nos clínicos e permitir a efetiva incorporação deste tipo de ferramentas na prática clínica. Desta forma, têm tentado desenvolver-se modelos cada vez mais white-box que, ao fornecerem explicações sobre os resultados que apresentam, transmitem essa confiança aos utilizadores. O objetivo principal do trabalho é analisar modelos Machine learning, de entre os selecionados, e o modelo GRACE, para perceber qual consegue transmitir o melhor compromisso entre interpretabilidade e performance. Escolheu-se o modelo GRACE por ser, atualmente, um modelo de previsão de risco bastante utilizado por profissionais da área clínica para avaliar pacientes com doenças cardíacas agudas. Os algoritmos escolhidos são Árvore de decisão, Naïve Bayes e Clustering. A Árvore de decisão é aplicada visto ser bastante interpretável e permitir facilmente a extração de regras. O modelo Bayesiano permite calcular relações probabilísticas entre classes, neste caso entre sintomas e possibilidade de morte ou sobrevivência. Por último o Clustering, dado que permite agrupar pacientes com caraterísticas semelhantes. Os modelos referidos são executados com um dataset composto por dados clínicos de pacientes dos Hospitais de Santa Cruz e de Leiria. Para cada um dos modelos são calculadas métricas demonstrativas da respetiva performance. Simultaneamente, são extraídas regras a partir de cada um deles e tenta-se verificar a veracidade das mesmas com recurso a dados reais. Por fim, todos os modelos são comparados em termos das performances obtidas, tendo-se concluído que o GRACE é o que consegue obter o melhor compromisso entre a performance e a interpretabilidade que fornece. Isto acaba por revelar um equilíbrio com a realidade, visto que este é um modelo bastante aplicado na prática clínica.
id RCAP_66ad72425c42a21e8f5e1a91208028ab
oai_identifier_str oai:comum.rcaap.pt:10400.26/40879
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Interpretabilidade em modelos de avaliação de risco cardiovascularDoenças cardiovascularesMachine learningGRACEÁrvore de decisãoModelo BayesianoClusteringInterpretabilidadePerformanceSegundo a World Health Organization, as doenças cardiovasculares representam uma das principais causas de morte a nível mundial. Para tentar contrariar esta tendência, as medidas passam bastante pela prevenção. Neste campo, a análise de dados clínicos tendo por base vários modelos Machine learning de previsão de risco tem vindo a ser implementada, com o objetivo de prever o risco de ocorrência de um determinado evento (doença, morte, etc.). No entanto, os modelos apresentam algumas fragilidades, entre as quais é possível destacar a falta de interpretabilidade, pois alguns são modelos black-box. Estes, apesar dos elevados desempenhos que apresentam, nem sempre conseguem explicar as suas previsões ao utilizador final. No entanto, em áreas tão críticas como a da saúde, o aumento da interpretabilidade é fundamental para criar a confiança necessária nos clínicos e permitir a efetiva incorporação deste tipo de ferramentas na prática clínica. Desta forma, têm tentado desenvolver-se modelos cada vez mais white-box que, ao fornecerem explicações sobre os resultados que apresentam, transmitem essa confiança aos utilizadores. O objetivo principal do trabalho é analisar modelos Machine learning, de entre os selecionados, e o modelo GRACE, para perceber qual consegue transmitir o melhor compromisso entre interpretabilidade e performance. Escolheu-se o modelo GRACE por ser, atualmente, um modelo de previsão de risco bastante utilizado por profissionais da área clínica para avaliar pacientes com doenças cardíacas agudas. Os algoritmos escolhidos são Árvore de decisão, Naïve Bayes e Clustering. A Árvore de decisão é aplicada visto ser bastante interpretável e permitir facilmente a extração de regras. O modelo Bayesiano permite calcular relações probabilísticas entre classes, neste caso entre sintomas e possibilidade de morte ou sobrevivência. Por último o Clustering, dado que permite agrupar pacientes com caraterísticas semelhantes. Os modelos referidos são executados com um dataset composto por dados clínicos de pacientes dos Hospitais de Santa Cruz e de Leiria. Para cada um dos modelos são calculadas métricas demonstrativas da respetiva performance. Simultaneamente, são extraídas regras a partir de cada um deles e tenta-se verificar a veracidade das mesmas com recurso a dados reais. Por fim, todos os modelos são comparados em termos das performances obtidas, tendo-se concluído que o GRACE é o que consegue obter o melhor compromisso entre a performance e a interpretabilidade que fornece. Isto acaba por revelar um equilíbrio com a realidade, visto que este é um modelo bastante aplicado na prática clínica.Paredes, Simão Pedro Mendes Cruz ReisRepositório ComumFigueiredo, Maria Inês Dias2022-06-02T16:07:55Z2022-01-072022-04-29T00:00:00Z2022-04-29T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.26/40879203015223porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2022-09-05T15:41:57Zoai:comum.rcaap.pt:10400.26/40879Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T15:17:35.826560Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Interpretabilidade em modelos de avaliação de risco cardiovascular
title Interpretabilidade em modelos de avaliação de risco cardiovascular
spellingShingle Interpretabilidade em modelos de avaliação de risco cardiovascular
Figueiredo, Maria Inês Dias
Doenças cardiovasculares
Machine learning
GRACE
Árvore de decisão
Modelo Bayesiano
Clustering
Interpretabilidade
Performance
title_short Interpretabilidade em modelos de avaliação de risco cardiovascular
title_full Interpretabilidade em modelos de avaliação de risco cardiovascular
title_fullStr Interpretabilidade em modelos de avaliação de risco cardiovascular
title_full_unstemmed Interpretabilidade em modelos de avaliação de risco cardiovascular
title_sort Interpretabilidade em modelos de avaliação de risco cardiovascular
author Figueiredo, Maria Inês Dias
author_facet Figueiredo, Maria Inês Dias
author_role author
dc.contributor.none.fl_str_mv Paredes, Simão Pedro Mendes Cruz Reis
Repositório Comum
dc.contributor.author.fl_str_mv Figueiredo, Maria Inês Dias
dc.subject.por.fl_str_mv Doenças cardiovasculares
Machine learning
GRACE
Árvore de decisão
Modelo Bayesiano
Clustering
Interpretabilidade
Performance
topic Doenças cardiovasculares
Machine learning
GRACE
Árvore de decisão
Modelo Bayesiano
Clustering
Interpretabilidade
Performance
description Segundo a World Health Organization, as doenças cardiovasculares representam uma das principais causas de morte a nível mundial. Para tentar contrariar esta tendência, as medidas passam bastante pela prevenção. Neste campo, a análise de dados clínicos tendo por base vários modelos Machine learning de previsão de risco tem vindo a ser implementada, com o objetivo de prever o risco de ocorrência de um determinado evento (doença, morte, etc.). No entanto, os modelos apresentam algumas fragilidades, entre as quais é possível destacar a falta de interpretabilidade, pois alguns são modelos black-box. Estes, apesar dos elevados desempenhos que apresentam, nem sempre conseguem explicar as suas previsões ao utilizador final. No entanto, em áreas tão críticas como a da saúde, o aumento da interpretabilidade é fundamental para criar a confiança necessária nos clínicos e permitir a efetiva incorporação deste tipo de ferramentas na prática clínica. Desta forma, têm tentado desenvolver-se modelos cada vez mais white-box que, ao fornecerem explicações sobre os resultados que apresentam, transmitem essa confiança aos utilizadores. O objetivo principal do trabalho é analisar modelos Machine learning, de entre os selecionados, e o modelo GRACE, para perceber qual consegue transmitir o melhor compromisso entre interpretabilidade e performance. Escolheu-se o modelo GRACE por ser, atualmente, um modelo de previsão de risco bastante utilizado por profissionais da área clínica para avaliar pacientes com doenças cardíacas agudas. Os algoritmos escolhidos são Árvore de decisão, Naïve Bayes e Clustering. A Árvore de decisão é aplicada visto ser bastante interpretável e permitir facilmente a extração de regras. O modelo Bayesiano permite calcular relações probabilísticas entre classes, neste caso entre sintomas e possibilidade de morte ou sobrevivência. Por último o Clustering, dado que permite agrupar pacientes com caraterísticas semelhantes. Os modelos referidos são executados com um dataset composto por dados clínicos de pacientes dos Hospitais de Santa Cruz e de Leiria. Para cada um dos modelos são calculadas métricas demonstrativas da respetiva performance. Simultaneamente, são extraídas regras a partir de cada um deles e tenta-se verificar a veracidade das mesmas com recurso a dados reais. Por fim, todos os modelos são comparados em termos das performances obtidas, tendo-se concluído que o GRACE é o que consegue obter o melhor compromisso entre a performance e a interpretabilidade que fornece. Isto acaba por revelar um equilíbrio com a realidade, visto que este é um modelo bastante aplicado na prática clínica.
publishDate 2022
dc.date.none.fl_str_mv 2022-06-02T16:07:55Z
2022-01-07
2022-04-29T00:00:00Z
2022-04-29T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10400.26/40879
203015223
url http://hdl.handle.net/10400.26/40879
identifier_str_mv 203015223
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799130037832646656