Interpretabilidade em modelos de avaliação de risco cardiovascular
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10400.26/40879 |
Resumo: | Segundo a World Health Organization, as doenças cardiovasculares representam uma das principais causas de morte a nível mundial. Para tentar contrariar esta tendência, as medidas passam bastante pela prevenção. Neste campo, a análise de dados clínicos tendo por base vários modelos Machine learning de previsão de risco tem vindo a ser implementada, com o objetivo de prever o risco de ocorrência de um determinado evento (doença, morte, etc.). No entanto, os modelos apresentam algumas fragilidades, entre as quais é possível destacar a falta de interpretabilidade, pois alguns são modelos black-box. Estes, apesar dos elevados desempenhos que apresentam, nem sempre conseguem explicar as suas previsões ao utilizador final. No entanto, em áreas tão críticas como a da saúde, o aumento da interpretabilidade é fundamental para criar a confiança necessária nos clínicos e permitir a efetiva incorporação deste tipo de ferramentas na prática clínica. Desta forma, têm tentado desenvolver-se modelos cada vez mais white-box que, ao fornecerem explicações sobre os resultados que apresentam, transmitem essa confiança aos utilizadores. O objetivo principal do trabalho é analisar modelos Machine learning, de entre os selecionados, e o modelo GRACE, para perceber qual consegue transmitir o melhor compromisso entre interpretabilidade e performance. Escolheu-se o modelo GRACE por ser, atualmente, um modelo de previsão de risco bastante utilizado por profissionais da área clínica para avaliar pacientes com doenças cardíacas agudas. Os algoritmos escolhidos são Árvore de decisão, Naïve Bayes e Clustering. A Árvore de decisão é aplicada visto ser bastante interpretável e permitir facilmente a extração de regras. O modelo Bayesiano permite calcular relações probabilísticas entre classes, neste caso entre sintomas e possibilidade de morte ou sobrevivência. Por último o Clustering, dado que permite agrupar pacientes com caraterísticas semelhantes. Os modelos referidos são executados com um dataset composto por dados clínicos de pacientes dos Hospitais de Santa Cruz e de Leiria. Para cada um dos modelos são calculadas métricas demonstrativas da respetiva performance. Simultaneamente, são extraídas regras a partir de cada um deles e tenta-se verificar a veracidade das mesmas com recurso a dados reais. Por fim, todos os modelos são comparados em termos das performances obtidas, tendo-se concluído que o GRACE é o que consegue obter o melhor compromisso entre a performance e a interpretabilidade que fornece. Isto acaba por revelar um equilíbrio com a realidade, visto que este é um modelo bastante aplicado na prática clínica. |
id |
RCAP_66ad72425c42a21e8f5e1a91208028ab |
---|---|
oai_identifier_str |
oai:comum.rcaap.pt:10400.26/40879 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Interpretabilidade em modelos de avaliação de risco cardiovascularDoenças cardiovascularesMachine learningGRACEÁrvore de decisãoModelo BayesianoClusteringInterpretabilidadePerformanceSegundo a World Health Organization, as doenças cardiovasculares representam uma das principais causas de morte a nível mundial. Para tentar contrariar esta tendência, as medidas passam bastante pela prevenção. Neste campo, a análise de dados clínicos tendo por base vários modelos Machine learning de previsão de risco tem vindo a ser implementada, com o objetivo de prever o risco de ocorrência de um determinado evento (doença, morte, etc.). No entanto, os modelos apresentam algumas fragilidades, entre as quais é possível destacar a falta de interpretabilidade, pois alguns são modelos black-box. Estes, apesar dos elevados desempenhos que apresentam, nem sempre conseguem explicar as suas previsões ao utilizador final. No entanto, em áreas tão críticas como a da saúde, o aumento da interpretabilidade é fundamental para criar a confiança necessária nos clínicos e permitir a efetiva incorporação deste tipo de ferramentas na prática clínica. Desta forma, têm tentado desenvolver-se modelos cada vez mais white-box que, ao fornecerem explicações sobre os resultados que apresentam, transmitem essa confiança aos utilizadores. O objetivo principal do trabalho é analisar modelos Machine learning, de entre os selecionados, e o modelo GRACE, para perceber qual consegue transmitir o melhor compromisso entre interpretabilidade e performance. Escolheu-se o modelo GRACE por ser, atualmente, um modelo de previsão de risco bastante utilizado por profissionais da área clínica para avaliar pacientes com doenças cardíacas agudas. Os algoritmos escolhidos são Árvore de decisão, Naïve Bayes e Clustering. A Árvore de decisão é aplicada visto ser bastante interpretável e permitir facilmente a extração de regras. O modelo Bayesiano permite calcular relações probabilísticas entre classes, neste caso entre sintomas e possibilidade de morte ou sobrevivência. Por último o Clustering, dado que permite agrupar pacientes com caraterísticas semelhantes. Os modelos referidos são executados com um dataset composto por dados clínicos de pacientes dos Hospitais de Santa Cruz e de Leiria. Para cada um dos modelos são calculadas métricas demonstrativas da respetiva performance. Simultaneamente, são extraídas regras a partir de cada um deles e tenta-se verificar a veracidade das mesmas com recurso a dados reais. Por fim, todos os modelos são comparados em termos das performances obtidas, tendo-se concluído que o GRACE é o que consegue obter o melhor compromisso entre a performance e a interpretabilidade que fornece. Isto acaba por revelar um equilíbrio com a realidade, visto que este é um modelo bastante aplicado na prática clínica.Paredes, Simão Pedro Mendes Cruz ReisRepositório ComumFigueiredo, Maria Inês Dias2022-06-02T16:07:55Z2022-01-072022-04-29T00:00:00Z2022-04-29T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.26/40879203015223porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2022-09-05T15:41:57Zoai:comum.rcaap.pt:10400.26/40879Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T15:17:35.826560Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Interpretabilidade em modelos de avaliação de risco cardiovascular |
title |
Interpretabilidade em modelos de avaliação de risco cardiovascular |
spellingShingle |
Interpretabilidade em modelos de avaliação de risco cardiovascular Figueiredo, Maria Inês Dias Doenças cardiovasculares Machine learning GRACE Árvore de decisão Modelo Bayesiano Clustering Interpretabilidade Performance |
title_short |
Interpretabilidade em modelos de avaliação de risco cardiovascular |
title_full |
Interpretabilidade em modelos de avaliação de risco cardiovascular |
title_fullStr |
Interpretabilidade em modelos de avaliação de risco cardiovascular |
title_full_unstemmed |
Interpretabilidade em modelos de avaliação de risco cardiovascular |
title_sort |
Interpretabilidade em modelos de avaliação de risco cardiovascular |
author |
Figueiredo, Maria Inês Dias |
author_facet |
Figueiredo, Maria Inês Dias |
author_role |
author |
dc.contributor.none.fl_str_mv |
Paredes, Simão Pedro Mendes Cruz Reis Repositório Comum |
dc.contributor.author.fl_str_mv |
Figueiredo, Maria Inês Dias |
dc.subject.por.fl_str_mv |
Doenças cardiovasculares Machine learning GRACE Árvore de decisão Modelo Bayesiano Clustering Interpretabilidade Performance |
topic |
Doenças cardiovasculares Machine learning GRACE Árvore de decisão Modelo Bayesiano Clustering Interpretabilidade Performance |
description |
Segundo a World Health Organization, as doenças cardiovasculares representam uma das principais causas de morte a nível mundial. Para tentar contrariar esta tendência, as medidas passam bastante pela prevenção. Neste campo, a análise de dados clínicos tendo por base vários modelos Machine learning de previsão de risco tem vindo a ser implementada, com o objetivo de prever o risco de ocorrência de um determinado evento (doença, morte, etc.). No entanto, os modelos apresentam algumas fragilidades, entre as quais é possível destacar a falta de interpretabilidade, pois alguns são modelos black-box. Estes, apesar dos elevados desempenhos que apresentam, nem sempre conseguem explicar as suas previsões ao utilizador final. No entanto, em áreas tão críticas como a da saúde, o aumento da interpretabilidade é fundamental para criar a confiança necessária nos clínicos e permitir a efetiva incorporação deste tipo de ferramentas na prática clínica. Desta forma, têm tentado desenvolver-se modelos cada vez mais white-box que, ao fornecerem explicações sobre os resultados que apresentam, transmitem essa confiança aos utilizadores. O objetivo principal do trabalho é analisar modelos Machine learning, de entre os selecionados, e o modelo GRACE, para perceber qual consegue transmitir o melhor compromisso entre interpretabilidade e performance. Escolheu-se o modelo GRACE por ser, atualmente, um modelo de previsão de risco bastante utilizado por profissionais da área clínica para avaliar pacientes com doenças cardíacas agudas. Os algoritmos escolhidos são Árvore de decisão, Naïve Bayes e Clustering. A Árvore de decisão é aplicada visto ser bastante interpretável e permitir facilmente a extração de regras. O modelo Bayesiano permite calcular relações probabilísticas entre classes, neste caso entre sintomas e possibilidade de morte ou sobrevivência. Por último o Clustering, dado que permite agrupar pacientes com caraterísticas semelhantes. Os modelos referidos são executados com um dataset composto por dados clínicos de pacientes dos Hospitais de Santa Cruz e de Leiria. Para cada um dos modelos são calculadas métricas demonstrativas da respetiva performance. Simultaneamente, são extraídas regras a partir de cada um deles e tenta-se verificar a veracidade das mesmas com recurso a dados reais. Por fim, todos os modelos são comparados em termos das performances obtidas, tendo-se concluído que o GRACE é o que consegue obter o melhor compromisso entre a performance e a interpretabilidade que fornece. Isto acaba por revelar um equilíbrio com a realidade, visto que este é um modelo bastante aplicado na prática clínica. |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-06-02T16:07:55Z 2022-01-07 2022-04-29T00:00:00Z 2022-04-29T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10400.26/40879 203015223 |
url |
http://hdl.handle.net/10400.26/40879 |
identifier_str_mv |
203015223 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799130037832646656 |