Aprendizado ativo efetivo e eficiente para análise de imagens em patologia utilizando aprendizado profundo
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UnB |
Texto Completo: | http://repositorio2.unb.br/jspui/handle/10482/46272 |
Resumo: | Tese (doutorado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2022. |
id |
UNB_be47b29a5f3c13390f7ab1d99295f56f |
---|---|
oai_identifier_str |
oai:repositorio.unb.br:10482/46272 |
network_acronym_str |
UNB |
network_name_str |
Repositório Institucional da UnB |
repository_id_str |
|
spelling |
Aprendizado ativo efetivo e eficiente para análise de imagens em patologia utilizando aprendizado profundoAprendizado ativoPatologiaConvolutional Neural Networks (CNNs)Tese (doutorado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2022.Modelos de aprendizado profundo demonstraram notável desempenho em tarefas de segmentação e classificação de imagens de patologia. Entretanto, esses modelos demandam grandes quantidades de dados anotados para seu treinamento. A geração dessa massa de dados em patologia é um processo intensivo em mão de obra, comprometendo muitas horas de trabalho por parte de patologistas experientes. O Aprendizado Ativo, ou Active Learning (AL), oferece uma abordagem iterativa para a geração dessas bases de dados, reduzindo o custo das anotações. Nesse trabalho, foi proposta uma nova solução de aprendizado ativo, denominada Diversity-Aware Data Acquisition (DADA), e foi avaliada sua efetividade na classificação baseada em patches de regiões de tecido de histopatologia. O DADA usa uma lógica de agrupamento que leva em consideração as características das imagens, extraídas de modelos de aprendizado profundo, e a incerteza preditiva desses modelos para selecionar exemplos de treinamento significativos. Além de produzir conjuntos de treinamento reduzidos, os custos de anotação também são diminuídos com ganhos de tempo de processamento, com o uso de uma solução de simplificação de CNNs também desenvolvida neste trabalho, o Network Auto-Reduction (NAR). Com o NAR, tanto o custo de cálculo das incertezas preditivas, quanto de treinamento de modelos, são fortemente reduzidos. Adicionalmente, para viabilizar a utilização da solução na prática, uma interface gráfica Web foi adaptada para uso com o DADA. O DADA e o NAR foram avaliados experimentalmente sobre uma coleção de imagens de tecido cancerígeno e demonstraram que: (i) são selecionados patches que aceleram o processo de treinamento ao reduzir o número deles necessários para se atingir um dado nível de Area Under the Curve (AUC); (ii) com o uso de subpooling o DADA apresenta significativa redução dos tempos de cada iteração de aquisição; e (iii) a combinação do DADA com NAR traz os tempos de execução de cada iteração a patamares práticos, mantendo a capacidade preditiva dos modelos de deep learning alvo. A generalização tanto do DADA quanto do NAR a outros contextos e aplicações são trabalhos futuros previstos, incluindo áreas como sensoriamento remoto e problemas de segmentação.Deep learning methods have demonstrated remarkable performance in pathology image segmentation and classification tasks. However, these models require a large amount of annotated training data. Training data generation is a labor intensive process in digital pathology, often requiring substantial time commitment from expert pathologists. Active learning (AL) offers an iterative approach to generate training data needed by deep learning models, reducing the cost of manual data annotation. In this work, a new AL acquisition method, named Diversity-Aware Data Aquisition (DADA), is proposed and evaluated regarding its effectiveness in patch-based detection and classification of tissue image regions. The proposed method uses a clustering logic that takes into account image features, extracted from the deep learning model being trained, and model prediction uncertainty to select meaningful training samples (image patches). Besides reducing training set sizes, annotation costs are also diminished by computation time gains using a CNN simplification solution also developed in this work, the Network Auto-Reduction (NAR). With NAR, both uncertainty calculation costs and model training times are strongly reduced. Additionally, to make these solutions viable in practice, a Web based graphical interface was adapted to be used with DADA. The DADA/NAR solutions were experimentally evaluated with a collection of cancer tissue images and are able to: (i) select image patches that accelerate the training process by reducing the number of patches required to attain a given Area Under the Curve (AUC) value; (ii) using a subpooling approach, DADA dramatically reduces iteration times needed to select a new annotation set; and (iii) the combination of DADA and NAR brings down the execution times even more, reaching practical levels while keeping the predictive capacity of models. The generalisation of both DADA and NAR to other contexts and applications are expected future work, including application in areas such as remote sensing and image segmentation problems.Teodoro, George Luiz Medeirosalsmeirelles@gmail.comMeirelles, André Lauar Sampaio2023-08-10T22:19:27Z2023-08-10T22:19:27Z2023-08-102022-10-14info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfMEIRELLES, André Lauar Sampaio. Aprendizado ativo efetivo e eficiente para análise de imagens em patologia utilizando aprendizado profundo. 2022. xv, 123 f., il. Tese (Doutorado em Informática) — Universidade de Brasília, Brasília, 2022.http://repositorio2.unb.br/jspui/handle/10482/46272porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2023-08-10T22:19:27Zoai:repositorio.unb.br:10482/46272Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2023-08-10T22:19:27Repositório Institucional da UnB - Universidade de Brasília (UnB)false |
dc.title.none.fl_str_mv |
Aprendizado ativo efetivo e eficiente para análise de imagens em patologia utilizando aprendizado profundo |
title |
Aprendizado ativo efetivo e eficiente para análise de imagens em patologia utilizando aprendizado profundo |
spellingShingle |
Aprendizado ativo efetivo e eficiente para análise de imagens em patologia utilizando aprendizado profundo Meirelles, André Lauar Sampaio Aprendizado ativo Patologia Convolutional Neural Networks (CNNs) |
title_short |
Aprendizado ativo efetivo e eficiente para análise de imagens em patologia utilizando aprendizado profundo |
title_full |
Aprendizado ativo efetivo e eficiente para análise de imagens em patologia utilizando aprendizado profundo |
title_fullStr |
Aprendizado ativo efetivo e eficiente para análise de imagens em patologia utilizando aprendizado profundo |
title_full_unstemmed |
Aprendizado ativo efetivo e eficiente para análise de imagens em patologia utilizando aprendizado profundo |
title_sort |
Aprendizado ativo efetivo e eficiente para análise de imagens em patologia utilizando aprendizado profundo |
author |
Meirelles, André Lauar Sampaio |
author_facet |
Meirelles, André Lauar Sampaio |
author_role |
author |
dc.contributor.none.fl_str_mv |
Teodoro, George Luiz Medeiros alsmeirelles@gmail.com |
dc.contributor.author.fl_str_mv |
Meirelles, André Lauar Sampaio |
dc.subject.por.fl_str_mv |
Aprendizado ativo Patologia Convolutional Neural Networks (CNNs) |
topic |
Aprendizado ativo Patologia Convolutional Neural Networks (CNNs) |
description |
Tese (doutorado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2022. |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-10-14 2023-08-10T22:19:27Z 2023-08-10T22:19:27Z 2023-08-10 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
MEIRELLES, André Lauar Sampaio. Aprendizado ativo efetivo e eficiente para análise de imagens em patologia utilizando aprendizado profundo. 2022. xv, 123 f., il. Tese (Doutorado em Informática) — Universidade de Brasília, Brasília, 2022. http://repositorio2.unb.br/jspui/handle/10482/46272 |
identifier_str_mv |
MEIRELLES, André Lauar Sampaio. Aprendizado ativo efetivo e eficiente para análise de imagens em patologia utilizando aprendizado profundo. 2022. xv, 123 f., il. Tese (Doutorado em Informática) — Universidade de Brasília, Brasília, 2022. |
url |
http://repositorio2.unb.br/jspui/handle/10482/46272 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UnB instname:Universidade de Brasília (UnB) instacron:UNB |
instname_str |
Universidade de Brasília (UnB) |
instacron_str |
UNB |
institution |
UNB |
reponame_str |
Repositório Institucional da UnB |
collection |
Repositório Institucional da UnB |
repository.name.fl_str_mv |
Repositório Institucional da UnB - Universidade de Brasília (UnB) |
repository.mail.fl_str_mv |
repositorio@unb.br |
_version_ |
1814508395016749056 |