Aprendizado ativo efetivo e eficiente para análise de imagens em patologia utilizando aprendizado profundo

Detalhes bibliográficos
Autor(a) principal: Meirelles, André Lauar Sampaio
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UnB
Texto Completo: http://repositorio2.unb.br/jspui/handle/10482/46272
Resumo: Tese (doutorado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2022.
id UNB_be47b29a5f3c13390f7ab1d99295f56f
oai_identifier_str oai:repositorio.unb.br:10482/46272
network_acronym_str UNB
network_name_str Repositório Institucional da UnB
repository_id_str
spelling Aprendizado ativo efetivo e eficiente para análise de imagens em patologia utilizando aprendizado profundoAprendizado ativoPatologiaConvolutional Neural Networks (CNNs)Tese (doutorado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2022.Modelos de aprendizado profundo demonstraram notável desempenho em tarefas de segmentação e classificação de imagens de patologia. Entretanto, esses modelos demandam grandes quantidades de dados anotados para seu treinamento. A geração dessa massa de dados em patologia é um processo intensivo em mão de obra, comprometendo muitas horas de trabalho por parte de patologistas experientes. O Aprendizado Ativo, ou Active Learning (AL), oferece uma abordagem iterativa para a geração dessas bases de dados, reduzindo o custo das anotações. Nesse trabalho, foi proposta uma nova solução de aprendizado ativo, denominada Diversity-Aware Data Acquisition (DADA), e foi avaliada sua efetividade na classificação baseada em patches de regiões de tecido de histopatologia. O DADA usa uma lógica de agrupamento que leva em consideração as características das imagens, extraídas de modelos de aprendizado profundo, e a incerteza preditiva desses modelos para selecionar exemplos de treinamento significativos. Além de produzir conjuntos de treinamento reduzidos, os custos de anotação também são diminuídos com ganhos de tempo de processamento, com o uso de uma solução de simplificação de CNNs também desenvolvida neste trabalho, o Network Auto-Reduction (NAR). Com o NAR, tanto o custo de cálculo das incertezas preditivas, quanto de treinamento de modelos, são fortemente reduzidos. Adicionalmente, para viabilizar a utilização da solução na prática, uma interface gráfica Web foi adaptada para uso com o DADA. O DADA e o NAR foram avaliados experimentalmente sobre uma coleção de imagens de tecido cancerígeno e demonstraram que: (i) são selecionados patches que aceleram o processo de treinamento ao reduzir o número deles necessários para se atingir um dado nível de Area Under the Curve (AUC); (ii) com o uso de subpooling o DADA apresenta significativa redução dos tempos de cada iteração de aquisição; e (iii) a combinação do DADA com NAR traz os tempos de execução de cada iteração a patamares práticos, mantendo a capacidade preditiva dos modelos de deep learning alvo. A generalização tanto do DADA quanto do NAR a outros contextos e aplicações são trabalhos futuros previstos, incluindo áreas como sensoriamento remoto e problemas de segmentação.Deep learning methods have demonstrated remarkable performance in pathology image segmentation and classification tasks. However, these models require a large amount of annotated training data. Training data generation is a labor intensive process in digital pathology, often requiring substantial time commitment from expert pathologists. Active learning (AL) offers an iterative approach to generate training data needed by deep learning models, reducing the cost of manual data annotation. In this work, a new AL acquisition method, named Diversity-Aware Data Aquisition (DADA), is proposed and evaluated regarding its effectiveness in patch-based detection and classification of tissue image regions. The proposed method uses a clustering logic that takes into account image features, extracted from the deep learning model being trained, and model prediction uncertainty to select meaningful training samples (image patches). Besides reducing training set sizes, annotation costs are also diminished by computation time gains using a CNN simplification solution also developed in this work, the Network Auto-Reduction (NAR). With NAR, both uncertainty calculation costs and model training times are strongly reduced. Additionally, to make these solutions viable in practice, a Web based graphical interface was adapted to be used with DADA. The DADA/NAR solutions were experimentally evaluated with a collection of cancer tissue images and are able to: (i) select image patches that accelerate the training process by reducing the number of patches required to attain a given Area Under the Curve (AUC) value; (ii) using a subpooling approach, DADA dramatically reduces iteration times needed to select a new annotation set; and (iii) the combination of DADA and NAR brings down the execution times even more, reaching practical levels while keeping the predictive capacity of models. The generalisation of both DADA and NAR to other contexts and applications are expected future work, including application in areas such as remote sensing and image segmentation problems.Teodoro, George Luiz Medeirosalsmeirelles@gmail.comMeirelles, André Lauar Sampaio2023-08-10T22:19:27Z2023-08-10T22:19:27Z2023-08-102022-10-14info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfMEIRELLES, André Lauar Sampaio. Aprendizado ativo efetivo e eficiente para análise de imagens em patologia utilizando aprendizado profundo. 2022. xv, 123 f., il. Tese (Doutorado em Informática) — Universidade de Brasília, Brasília, 2022.http://repositorio2.unb.br/jspui/handle/10482/46272porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2023-08-10T22:19:27Zoai:repositorio.unb.br:10482/46272Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2023-08-10T22:19:27Repositório Institucional da UnB - Universidade de Brasília (UnB)false
dc.title.none.fl_str_mv Aprendizado ativo efetivo e eficiente para análise de imagens em patologia utilizando aprendizado profundo
title Aprendizado ativo efetivo e eficiente para análise de imagens em patologia utilizando aprendizado profundo
spellingShingle Aprendizado ativo efetivo e eficiente para análise de imagens em patologia utilizando aprendizado profundo
Meirelles, André Lauar Sampaio
Aprendizado ativo
Patologia
Convolutional Neural Networks (CNNs)
title_short Aprendizado ativo efetivo e eficiente para análise de imagens em patologia utilizando aprendizado profundo
title_full Aprendizado ativo efetivo e eficiente para análise de imagens em patologia utilizando aprendizado profundo
title_fullStr Aprendizado ativo efetivo e eficiente para análise de imagens em patologia utilizando aprendizado profundo
title_full_unstemmed Aprendizado ativo efetivo e eficiente para análise de imagens em patologia utilizando aprendizado profundo
title_sort Aprendizado ativo efetivo e eficiente para análise de imagens em patologia utilizando aprendizado profundo
author Meirelles, André Lauar Sampaio
author_facet Meirelles, André Lauar Sampaio
author_role author
dc.contributor.none.fl_str_mv Teodoro, George Luiz Medeiros
alsmeirelles@gmail.com
dc.contributor.author.fl_str_mv Meirelles, André Lauar Sampaio
dc.subject.por.fl_str_mv Aprendizado ativo
Patologia
Convolutional Neural Networks (CNNs)
topic Aprendizado ativo
Patologia
Convolutional Neural Networks (CNNs)
description Tese (doutorado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2022.
publishDate 2022
dc.date.none.fl_str_mv 2022-10-14
2023-08-10T22:19:27Z
2023-08-10T22:19:27Z
2023-08-10
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv MEIRELLES, André Lauar Sampaio. Aprendizado ativo efetivo e eficiente para análise de imagens em patologia utilizando aprendizado profundo. 2022. xv, 123 f., il. Tese (Doutorado em Informática) — Universidade de Brasília, Brasília, 2022.
http://repositorio2.unb.br/jspui/handle/10482/46272
identifier_str_mv MEIRELLES, André Lauar Sampaio. Aprendizado ativo efetivo e eficiente para análise de imagens em patologia utilizando aprendizado profundo. 2022. xv, 123 f., il. Tese (Doutorado em Informática) — Universidade de Brasília, Brasília, 2022.
url http://repositorio2.unb.br/jspui/handle/10482/46272
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Repositório Institucional da UnB
collection Repositório Institucional da UnB
repository.name.fl_str_mv Repositório Institucional da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv repositorio@unb.br
_version_ 1810580912676536320