Prostate cancer biochemical recurrence prediction after radical prostatectomy using machine learning analysis of histopathology

Detalhes bibliográficos
Autor(a) principal: Seabra, Carolina Alexandra Carrapiço
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10451/40425
Resumo: Tese de mestrado integrado, Engenharia Biomédica e Biofísica (Radiações em Diagnóstico e Terapia) Universidade de Lisboa, Faculdade de Ciências, 2019
id RCAP_c9e990f5244850ecc3a26e19be51fc1f
oai_identifier_str oai:repositorio.ul.pt:10451/40425
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Prostate cancer biochemical recurrence prediction after radical prostatectomy using machine learning analysis of histopathologyCancro da PróstataRecidiva BioquímicaPatologia DigitalDeep LearningTeses de mestrado - 2019Departamento de FísicaTese de mestrado integrado, Engenharia Biomédica e Biofísica (Radiações em Diagnóstico e Terapia) Universidade de Lisboa, Faculdade de Ciências, 2019O cancro de próstata é o segundo tipo de cancro com maior prevalência nos homens, em todo o mundo. A deteção inicial desta doença ocorre, geralmente, durante exames e consultas de rotina, quando níveis aumentados do antigénio prostático específico e/ou um exame retal anormal são descobertos. Contudo, apenas a avaliação histopatológica, inicialmente baseada em amostras extraídas através de uma biópsia, é capaz de fornecer um diagnóstico definitivo, permitindo não só orientar o tratamento do doente, assim como o processo de tomada de decisão associado. Após esta avaliação inicial, se o doente for diagnosticado com cancro da próstata localizado, ou seja, um tumor confinado à próstata, o tratamento mais adotado é a prostatectomia radical. Este último é o tratamento padrão utilizado quando se pretende uma terapia com curativa. A vantagem da técnica de prostatectomia radical é que, toda a próstata, onde o tumor se encontra confinado, é removida cirurgicamente, auxiliando na redução do risco de metástases. A posterior análise da peça prostática permite ao patologista avaliar diversas características tumorais, determinantes no prognóstico do doente. Para este fim, o microscópio tem sido a principal ferramenta utilizada, uma vez que proporciona imagens ao vivo com uma ótima resolução. No entanto, desde a introdução do primeiro sistema automatizado de digitalização de lâminas em imagens de alta resolução, o interesse da comunidade de anatomia patológica em explorar este tipo de métodos para diferentes aplicações tem crescido exponencialmente. O potencial desta nova área não é, todavia, a simples transferência de uma imagem da lâmina de vidro para um monitor, nem tão pouco a flexibilidade de distribuição e modificação da própria imagem digital, mas sim, a possibilidade de aprimorar a avaliação do patologista com informações e inteligência que não podem ser detetados pela análise humana. Por conseguinte, a implementação de algoritmos de aprendizagem automática capazes de executar tarefas como deteção, classificação e segmentação de imagens digitais histopatológicas é, finalmente, possível. Estes métodos de análise automatizada permitem explorar todo o panorama morfológico do tumor e dos seus elementos mais invasivos presentes, capturando, por exemplo, a orientação nuclear, a textura, a forma e a arquitetura. A complexidade e densidade inerente a este tipo de imagens, oferecem uma abundância de informação, ideal para estimular e promover o desenvolvimento de algoritmos baseados em deep learning. No que diz respeito ao cancro da próstata, os algoritmos desenvolvidos visam apoiar as avaliações efetuados pelos patologistas, nomeadamente, estadiamento e classificação, sendo, portanto, focados no sistema de classificação utilizada para a próstata - o Gleason score. Contudo, problemáticas alternativas podem também beneficiar da aplicação destas t´técnicas, nomeadamente métodos capazes de distinguir imagens que apenas contêm tecido benigno de imagens em que tumor esteja presente. Por outro lado, modelos capazes de prever a recidiva bioquímica de cancro da próstata permitiriam aos médicos modificar estratégias de tratamento e pós-tratamento, a fim de equilibrar benefícios e efeitos adversos de um terapia específica. A previsão de recidiva permite, também, que os pacientes escolham com responsabilidade os diferentes tratamentos e estratégias que lhes são propostos pelos médicos, possibilitando, em última análise, uma maior sua satisfação após o tratamento. Desta forma, com o objetivo de explorar os referidos problemas, a presente dissertação apresenta procedimentos de recolha, processamento e anotação de dados, que permitiram a criação de uma base digital de dados histológicos anotados da próstata. Com base nestes dados dois modelos distintos de deep learning, especificamente Convolutional Neural Networks foram desenvolvidos. O modelo I propõe a identificação de cancro da próstata e diferenciação entre tumor e tecido benigno. O modelo II pretende prever a condição de recidiva bioquímica do cancro de próstata, para um período de tempo posterior `a cirurgia em dois anos. Relativamente ao desenvolvimento da base de dados, 200 casos de cancro da próstata, tratados através de prostatectomia radical, foram selecionados. As lâminas correspondentes à lesão índice, ou seja, à lesão principal, foram identificadas e, apenas estas foram incluídas na amostra final. A adoção desta abordagem deveu-se ao facto de que cada peça origina entre 15-45 lâminas, sendo que a maioria não contém tumor. Por outro lado, dado o período de tempo para a realização de todo este projeto, seria inviável a utilização de todas as lâminas. Assim, as lâminas selecionadas foram digitalizadas e processadas. Uma t´técnica de normalização de contraste foi aplicada, de forma a uniformizar as cores das diferentes imagens digitais, evitando uma elevada variabilidade de contraste e cor que advém da utilização de diferentes protocolos de cor, bem como da própria digitalização da lâmina. As imagens histológicas digitalizadas e normalizadas foram posteriormente divididas em imagens mais pequenas, isto é, subimagens, uma vez que desta forma existe uma otimização da extração de características por parte dos algoritmos. Estas subimagens foram individualmente visualizadas e anotadas, originando um total de cerca de 160,000 subimagens, correspondentes aos 200 casos diferentes selecionados. Para o desenvolvimento do modelo de classificação do cancro de próstata, a arquitetura Inception v3 foi implementada e treinada utilizando as subimagens da base de dados. Este modelo foi capaz de identificar três classes distintas: negativa (tecido benigno), positiva (tecido maligno) e neoplasia intraepitelial da próstata, esta última, embora com menor precisão dada a quantidade reduzida de exemplos pertencentes a esta classe. Um valor de 93 % de precisão foi obtido, o que corresponde a valores equiparados ao estado da arte para este tipo de técnicas. Este valor, contudo, demonstra ainda potencial para otimização e melhoria, uma vez que as diferentes classes dos dados utilizados seguiam uma distribuição não equilibrada. A inclusão de mais casos clínicos e a aplicação de técnicas de aumento de dados, podem ser facilmente realizadas, o que culminará num modelo com ainda melhor precisão de classificação. Relativamente ao modelo referente à previsão de recidiva bioquímica, a mesma arquitetura foi utilizada, mas neste caso, treinada apenas com base nas subimagens positivas, isto ´e, as subimagens contendo tecido maligno da próstata. Os resultados obtidos revelaram que este modelo não tem a capacidade de extrair informação relevante correlacionada com o objetivo do estudo, e portanto, não consegue distinguir com sucesso casos não recorrentes de casos recorrentes, produzindo apenas uma precisão de 60 %. Contudo, apesar do referido modelo falhar na execução do objetivo estipulado, é fundamental notar que a tarefa de predição de recidiva bioquímica é de complexidade elevada, não sendo possível aos patologistas, através da observação das imagens histológicas, retirar nenhuma conclusão que diretamente se correlacione com esta condição. Diferentes abordagens, como por exemplo, o aumento da quantidade de dados utilizados, a introdução no modelo de características clínicas relevantes no prognóstico da doença poderão apresentar melhorias substanciais, no que diz respeito à capacidade preditiva deste modelo. Concluindo, a capacidade de algoritmos de deep learning para extrair informação relevante de imagens digitais da histopatologia da próstata foi demonstrada através do presente estudo. O desenvolvimento e o criação de uma base de dados anotados, fornece a base fundamental para o desenvolvimento de modelos adicionais, onde diversas questões podem ser exploradas. O desenvolvimento de uma interface que permita implementar o modelo de deteção de cancro da próstata desenvolvido é também uma possibilidade, uma vez que fornece eficiência e consistência, beneficiando a prática da patologia clinica.Prostate cancer is the second most prevalent cancer in men, worldwide. Histopathological assessment plays an indispensable role in understanding the disease mechanisms, providing definitive diagnosis to guide patient treatment and management decisions. The microscope has been the primary tool to this end, producing images at increased resolution. However, with the development of the first automated high resolution whole-slide imaging system, which allows the digitisation of glass slides, interest in using this system for different applications in pathology practice has steadily grown, giving rise to the digital pathology field. The promise of digital pathology is not, however, the simple transfer of an image from a glass slide to a monitor, not even the flexibility of distribution and modification of the image, but instead the potential to enhance the pathologist’s assessment with information and artificial intelligence that cannot be perceived by human examination. With the advent of digital pathology and the recent expert-level accuracy achieved by machine learning based algorithms in medical image detection, classification and segmentation, new possibilities to develop automated image analysis methods arise. As far as prostate cancer is concerned, these models have been aimed at supporting pathologist’s image descriptions such as staging and grading, being hence, focused on the Gleason grading system. In order to explore alternative problems, the present dissertation presents data collection, processing and annotation procedures, that allowed the creation of an annotated digital histology database of prostate resection cases. These data was used to develop deep learning models not only to classify prostate cancer, but also to predict prostate cancer biochemical recurrence. Inception v3 architecture was implemented and trained from scratch for the proposed assignments. The prostate cancer classification model yielded an accuracy of 93%, being able to identify three distinct classes: negative (benign tissue), positive (malignant tissue) and high-grade prostate intraepithelium neoplasia, the latter, although, with lower precision, given to unbalanced class distributions. The prostate cancer biochemical prediction model was not able to successfully distinguish between non-recurrent and recurrent cases, yielding an accuracy of 60%. This value was accomplished, nevertheless, due to the fact that the model was classifying all entries as negative, and therefore, the value of accuracy corresponds to the percentage of negative cases present in the dataset. Although not all models here developed achieved good results, the capacity of deep learning algorithms to harvest relevant features from prostate histopathology digital images has been demonstrated. The development and establishment of an annotated database provides the fundamental basis to further develop additional models, and mainly to improve the biochemical recurrence prediction model by applying more sophisticated methods, given the complexity of this problem.Conceição, Raquel Cruz daPapanikolaou, NickolasRepositório da Universidade de LisboaSeabra, Carolina Alexandra Carrapiço2019-12-09T15:20:10Z201920192019-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10451/40425TID:202387828enginfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-08T16:39:43Zoai:repositorio.ul.pt:10451/40425Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:54:07.878005Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Prostate cancer biochemical recurrence prediction after radical prostatectomy using machine learning analysis of histopathology
title Prostate cancer biochemical recurrence prediction after radical prostatectomy using machine learning analysis of histopathology
spellingShingle Prostate cancer biochemical recurrence prediction after radical prostatectomy using machine learning analysis of histopathology
Seabra, Carolina Alexandra Carrapiço
Cancro da Próstata
Recidiva Bioquímica
Patologia Digital
Deep Learning
Teses de mestrado - 2019
Departamento de Física
title_short Prostate cancer biochemical recurrence prediction after radical prostatectomy using machine learning analysis of histopathology
title_full Prostate cancer biochemical recurrence prediction after radical prostatectomy using machine learning analysis of histopathology
title_fullStr Prostate cancer biochemical recurrence prediction after radical prostatectomy using machine learning analysis of histopathology
title_full_unstemmed Prostate cancer biochemical recurrence prediction after radical prostatectomy using machine learning analysis of histopathology
title_sort Prostate cancer biochemical recurrence prediction after radical prostatectomy using machine learning analysis of histopathology
author Seabra, Carolina Alexandra Carrapiço
author_facet Seabra, Carolina Alexandra Carrapiço
author_role author
dc.contributor.none.fl_str_mv Conceição, Raquel Cruz da
Papanikolaou, Nickolas
Repositório da Universidade de Lisboa
dc.contributor.author.fl_str_mv Seabra, Carolina Alexandra Carrapiço
dc.subject.por.fl_str_mv Cancro da Próstata
Recidiva Bioquímica
Patologia Digital
Deep Learning
Teses de mestrado - 2019
Departamento de Física
topic Cancro da Próstata
Recidiva Bioquímica
Patologia Digital
Deep Learning
Teses de mestrado - 2019
Departamento de Física
description Tese de mestrado integrado, Engenharia Biomédica e Biofísica (Radiações em Diagnóstico e Terapia) Universidade de Lisboa, Faculdade de Ciências, 2019
publishDate 2019
dc.date.none.fl_str_mv 2019-12-09T15:20:10Z
2019
2019
2019-01-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10451/40425
TID:202387828
url http://hdl.handle.net/10451/40425
identifier_str_mv TID:202387828
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134479946612736