Transferring kowledge to improve classification of Tuberculosis in chest X-rays

Detalhes bibliográficos
Autor(a) principal: Neves, Fábio Miguel Simões
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10451/48553
Resumo: Tese de mestrado em Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2021
id RCAP_dc6419598e2f0d773e3bd0e8e2e617a5
oai_identifier_str oai:repositorio.ul.pt:10451/48553
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Transferring kowledge to improve classification of Tuberculosis in chest X-raysTuberculoseRaio-XRedes Neuronais ConvolucionaisTransferência de aprendizagemTeses de mestrado - 2021Domínio/Área Científica::Ciências Naturais::Ciências BiológicasTese de mestrado em Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2021A Tuberculose (TB) continua a ser um dos principais problemas de saúde global na actualidade, com especial incidência em países de terceiro mundo pertencentes a África e Sudoeste Asiático, que somam 84% dos 1.5 milhões de óbitos derivados de TB durante o ano de 2017. A interpretação de Raio-X é um indicador forte no diagnóstico de TB que, quando combinado com outros indicadores como tosse, febre ou outros sintomas suspeitos, pode levar a um diagnóstico bastante preciso. A interpretação de uma imagem de Raio-X requer a competência de um Médico Radiologista experiente, um requisito limitado especialmente considerando a incidência de TB em países de terceiro mundo. Esta interpretação pode ser facilitada através do uso de Redes Neuronais Convolucionais (CNN) que, quando treinadas correctamente, conseguem ultrapassar o desempenho de profissionais de saúde. No entanto, o correcto treino de CNN requer largas quantidades de imagens classificadas, um recurso inexistente no domínio público para TB. O uso de Aprendizagem por Transferência, de fácil implementação para CNNs, é uma solução bastante popular na implementação de CNNs para a interpretação de imagens médicas, contornando os largos requisitos de imagens. Contudo, a sua comum implementação tende a não usar uma abordagem eficaz, e poucos trabalhos exploram as vantagens do uso de Aprendizagem por Transferência. Este trabalho procura explorar o uso de Aprendizagem por Transferência para a optimização do treino de CNNs em conjuntos de dados de TB bastante limitados. A exploração passa pelo uso de Bases de Referência Aleatórias e treinadas no grande conjunto de dados ImageNet, de modo a explorar as vantagens do uso de Aprendizagem por Transferência. Além destes, cinco Bases de Referência adicionais são treinadas em dois conjuntos de Raio-X de larga escala, o ChestX-ray8 e o CheXpert, na tentativa de optimizar a transferência de conhecimento para a classificação de TB. O treino de modelos em TB faz uso do conjunto de dados \Shenzhen Hospital X-ray Set", no qual os modelos são treinados, validados e testados. O conjunto de dados \Montgomery Hospital X-ray Set" é usado apenas para teste. O resultado deste trabalho são 155 classificadores de TB, para os quais os melhores resultados são atingidos usando uma Base de Referência treinada no conjunto completo de CheXpert, atingindo um valor mediano de 0.65 de WAF, e 0.77 de AUROC, no conjunto de teste externo. Adicionalmente, este trabalho verifica resultados mais optimistas pelas medidas de AUROC. Esta diferença resulta do limite usado para sumarizar o output das redes, para o qual este trabalho sugere uma estimativa alternativa usando um número limitado de dados de teste que acaba por melhorar os resultados de WAF, aproximando-os das medidas de AUROC.Tuberculosis (TB) continues to be one of the main sources of global health concern, with increased incidence in third world countries in Africa and Southwest Asia, which account for 84% of the 1.5 million deaths due to TB during the year of 2017. The interpretation of X-ray is a strong indicator in the diagnosis of TB which, when combined with other indicators such as cough, fever or other suspicious symptoms, can lead to a very accurate diagnosis. The interpretation of an X-ray image requires the expertise of an experienced Radiologist, a limited resource emphasized by the incidence of TB in third world countries. This interpretation can be assisted through the use of Convolutional Neural Networks (CNN) which, when properly trained, can surpass the performance of health professionals. However, the correct training of CNN requires large amounts of classified images, a resource that does not exist in the public domain for TB. The use of Transfer Learning is a very popular solution when implementing CNNs for the interpretation of medical images, bypassing the wide requirements of images. However, its common implementation tends to not use an effective approach, and few studies explore the advantages of using Transfer Learning. This work seeks to explore the use of Transfer Learning for the optimization of CNN training in very limited TB datasets. Exploration involves the use of Random Baselines and Baselines trained on the large dataset ImageNet, exploring the advantages of Transfer Learning. In addition to these, five additional Baselines are trained on two large-scale X-ray sets, the ChestX-ray8 and the CheXpert, in an attempt to optimize the transfer of knowledge for the classification of TB. The training of models for TB uses the \Shenzhen Hospital X-ray Set" dataset for training, validation and testing. The \Montgomery Hospital X-ray Set" dataset is used for testing purposes only. The result of this work is 155 TB classifiers, for which the best results are achieved using a Baseline trained in the complete set of CheXpert, reaching a median value of 0.65 WAF, and 0.77 of AUROC, on the external test set. Additionally, this work verifies more optimistic results for AUROC measures. This difference results from the threshold used to summarize the output of the networks, for which this work suggests an alternative estimate using a limited number of test data that ends up improving the results of WAF, bringing them closer to the AUROC measures.Silva, Sara Guilherme Oliveira da,1972-Potgieter, AnetRepositório da Universidade de LisboaNeves, Fábio Miguel Simões2021-06-14T17:28:15Z202120212021-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10451/48553TID:202933318enginfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-08T16:51:54Zoai:repositorio.ul.pt:10451/48553Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T22:00:22.638389Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Transferring kowledge to improve classification of Tuberculosis in chest X-rays
title Transferring kowledge to improve classification of Tuberculosis in chest X-rays
spellingShingle Transferring kowledge to improve classification of Tuberculosis in chest X-rays
Neves, Fábio Miguel Simões
Tuberculose
Raio-X
Redes Neuronais Convolucionais
Transferência de aprendizagem
Teses de mestrado - 2021
Domínio/Área Científica::Ciências Naturais::Ciências Biológicas
title_short Transferring kowledge to improve classification of Tuberculosis in chest X-rays
title_full Transferring kowledge to improve classification of Tuberculosis in chest X-rays
title_fullStr Transferring kowledge to improve classification of Tuberculosis in chest X-rays
title_full_unstemmed Transferring kowledge to improve classification of Tuberculosis in chest X-rays
title_sort Transferring kowledge to improve classification of Tuberculosis in chest X-rays
author Neves, Fábio Miguel Simões
author_facet Neves, Fábio Miguel Simões
author_role author
dc.contributor.none.fl_str_mv Silva, Sara Guilherme Oliveira da,1972-
Potgieter, Anet
Repositório da Universidade de Lisboa
dc.contributor.author.fl_str_mv Neves, Fábio Miguel Simões
dc.subject.por.fl_str_mv Tuberculose
Raio-X
Redes Neuronais Convolucionais
Transferência de aprendizagem
Teses de mestrado - 2021
Domínio/Área Científica::Ciências Naturais::Ciências Biológicas
topic Tuberculose
Raio-X
Redes Neuronais Convolucionais
Transferência de aprendizagem
Teses de mestrado - 2021
Domínio/Área Científica::Ciências Naturais::Ciências Biológicas
description Tese de mestrado em Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2021
publishDate 2021
dc.date.none.fl_str_mv 2021-06-14T17:28:15Z
2021
2021
2021-01-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10451/48553
TID:202933318
url http://hdl.handle.net/10451/48553
identifier_str_mv TID:202933318
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134550929965056