Redes neurais convolucionais aplicadas ao projeto de operadores de imagens

Detalhes bibliográficos
Autor(a) principal: Lopes, André Vinícius
Data de Publicação: 2017
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://teses.usp.br/teses/disponiveis/45/45134/tde-20230727-113151/
Resumo: O projeto de W-operadores de imagens requer a estimação de um operador local a partir de exemplos de treinamento e da indução de um classificador baseado em aprendizado de máquina para a classificação de exemplos pouco, ou nunca, observados no treinamento. Nos últimos anos, a ârea de aprendizado de máquina passou por um avanço muito grande devido às redes neurais convolucionais (CNN). Esse avanço é principalmente devido ao poder de representação das redes neurais e pelo fato das redes convolucionais serem efetivas na extração de características locais. Devido a isso, elas estão presentes em muitas soluções do estado da arte de diversos problemas de visão computacional [MPGC 17, HGC+17, FTM+17, MZY+17, CGW+17]. Neste trabalho, estudamos e exploramos o poder de representação das CNNs no contexto do projeto de W-operadores de imagens. Integramos implementações públicas e bastante maduras de CNN a uma biblioteca de projeto de W-operadores desenvolvida pelo nosso grupo (TRIOS) e testamos diversas estratégias para segmentar imagens de níveis de cinza ou, ainda, classificar os padrões de intensidades em níveis de cinza observados através de uma janela W em poucos rótulos (em geral, dois rótulos, ou O, ou 1). Para validar a proposta, usamos 2 conjuntos de dados de imagens de fundo de olho, chamados de DRIVE e STARE, os quais já são um padrão na área de imagens para a segmentação das veias da retina e também em um conjunto de dados chamado de STAFF (KFV+13, VKFJ13], o qual é uma variação do banco de dados CVC-MUSCIMA [FDGL12] e tem o objetivo de segmentar notas musicais em partituras. Os resultados obtidos mostram que, para uma janela razoavelmente grande, os resultados são satisfatórias ao se comparar com soluções específicas do estado da arte, as quais utilizam heurísticas de pré e pós-processamento.
id USP_8065bcd67c2aa7aa7e950d8a6fad268a
oai_identifier_str oai:teses.usp.br:tde-20230727-113151
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Redes neurais convolucionais aplicadas ao projeto de operadores de imagensConvolutional neural networks model applied to construction of image operatorsAprendizado ComputacionalImagem DigitalRedes NeuraisO projeto de W-operadores de imagens requer a estimação de um operador local a partir de exemplos de treinamento e da indução de um classificador baseado em aprendizado de máquina para a classificação de exemplos pouco, ou nunca, observados no treinamento. Nos últimos anos, a ârea de aprendizado de máquina passou por um avanço muito grande devido às redes neurais convolucionais (CNN). Esse avanço é principalmente devido ao poder de representação das redes neurais e pelo fato das redes convolucionais serem efetivas na extração de características locais. Devido a isso, elas estão presentes em muitas soluções do estado da arte de diversos problemas de visão computacional [MPGC 17, HGC+17, FTM+17, MZY+17, CGW+17]. Neste trabalho, estudamos e exploramos o poder de representação das CNNs no contexto do projeto de W-operadores de imagens. Integramos implementações públicas e bastante maduras de CNN a uma biblioteca de projeto de W-operadores desenvolvida pelo nosso grupo (TRIOS) e testamos diversas estratégias para segmentar imagens de níveis de cinza ou, ainda, classificar os padrões de intensidades em níveis de cinza observados através de uma janela W em poucos rótulos (em geral, dois rótulos, ou O, ou 1). Para validar a proposta, usamos 2 conjuntos de dados de imagens de fundo de olho, chamados de DRIVE e STARE, os quais já são um padrão na área de imagens para a segmentação das veias da retina e também em um conjunto de dados chamado de STAFF (KFV+13, VKFJ13], o qual é uma variação do banco de dados CVC-MUSCIMA [FDGL12] e tem o objetivo de segmentar notas musicais em partituras. Os resultados obtidos mostram que, para uma janela razoavelmente grande, os resultados são satisfatórias ao se comparar com soluções específicas do estado da arte, as quais utilizam heurísticas de pré e pós-processamento.The project of images W-operators requires the estimation of a local operator using training examples and the induction of a cla.55ifier based on machine learning to classify examples that are seldom or never seen during training. ln the last years, the area of machine learning advanced enormously due to the use of convolutional neural networks (CNN). This advance is caused mainly dueto the power of representation of the neural networks and due to the fact that the convolutional neural networks are effective in the extraction of local characteristics. Consequently, they are present in many state of the art solutions for problems of computer vision [MPGC 17, HGC+17, FTM+17, MZY+17, CGW+17]. ln this work we study and explore the power of representation of the CNN's in the context of images w-operators project. We integrate public implementations and very mature libraries of CNN and w-operators developed by our group (TRIOS) and test several strategies to segment gray-level images or to classify the gray-level intensity patterns observed through a window w in a few labels (in general, 2 labels, either O or 1). To validate this proposal we use 2 data sets of retina! images, called DRIVE and STARE which are commonly used for vessel segmentation of the retina and also in a data set called STAFF [KFV+13, VKFJ13], which is a variation of the database CVC-MUSCIMA [FDGL12] and has the objective of segmenting musical notes in partitures. The results have shown that, for a big window, the results are satisfactory when compared to specific state of the art solutions which use pre and post-processing.Biblioteca Digitais de Teses e Dissertações da USPHirata Júnior, RobertoLopes, André Vinícius2017-12-08info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://teses.usp.br/teses/disponiveis/45/45134/tde-20230727-113151/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2023-07-27T18:54:05Zoai:teses.usp.br:tde-20230727-113151Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-07-27T18:54:05Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Redes neurais convolucionais aplicadas ao projeto de operadores de imagens
Convolutional neural networks model applied to construction of image operators
title Redes neurais convolucionais aplicadas ao projeto de operadores de imagens
spellingShingle Redes neurais convolucionais aplicadas ao projeto de operadores de imagens
Lopes, André Vinícius
Aprendizado Computacional
Imagem Digital
Redes Neurais
title_short Redes neurais convolucionais aplicadas ao projeto de operadores de imagens
title_full Redes neurais convolucionais aplicadas ao projeto de operadores de imagens
title_fullStr Redes neurais convolucionais aplicadas ao projeto de operadores de imagens
title_full_unstemmed Redes neurais convolucionais aplicadas ao projeto de operadores de imagens
title_sort Redes neurais convolucionais aplicadas ao projeto de operadores de imagens
author Lopes, André Vinícius
author_facet Lopes, André Vinícius
author_role author
dc.contributor.none.fl_str_mv Hirata Júnior, Roberto
dc.contributor.author.fl_str_mv Lopes, André Vinícius
dc.subject.por.fl_str_mv Aprendizado Computacional
Imagem Digital
Redes Neurais
topic Aprendizado Computacional
Imagem Digital
Redes Neurais
description O projeto de W-operadores de imagens requer a estimação de um operador local a partir de exemplos de treinamento e da indução de um classificador baseado em aprendizado de máquina para a classificação de exemplos pouco, ou nunca, observados no treinamento. Nos últimos anos, a ârea de aprendizado de máquina passou por um avanço muito grande devido às redes neurais convolucionais (CNN). Esse avanço é principalmente devido ao poder de representação das redes neurais e pelo fato das redes convolucionais serem efetivas na extração de características locais. Devido a isso, elas estão presentes em muitas soluções do estado da arte de diversos problemas de visão computacional [MPGC 17, HGC+17, FTM+17, MZY+17, CGW+17]. Neste trabalho, estudamos e exploramos o poder de representação das CNNs no contexto do projeto de W-operadores de imagens. Integramos implementações públicas e bastante maduras de CNN a uma biblioteca de projeto de W-operadores desenvolvida pelo nosso grupo (TRIOS) e testamos diversas estratégias para segmentar imagens de níveis de cinza ou, ainda, classificar os padrões de intensidades em níveis de cinza observados através de uma janela W em poucos rótulos (em geral, dois rótulos, ou O, ou 1). Para validar a proposta, usamos 2 conjuntos de dados de imagens de fundo de olho, chamados de DRIVE e STARE, os quais já são um padrão na área de imagens para a segmentação das veias da retina e também em um conjunto de dados chamado de STAFF (KFV+13, VKFJ13], o qual é uma variação do banco de dados CVC-MUSCIMA [FDGL12] e tem o objetivo de segmentar notas musicais em partituras. Os resultados obtidos mostram que, para uma janela razoavelmente grande, os resultados são satisfatórias ao se comparar com soluções específicas do estado da arte, as quais utilizam heurísticas de pré e pós-processamento.
publishDate 2017
dc.date.none.fl_str_mv 2017-12-08
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://teses.usp.br/teses/disponiveis/45/45134/tde-20230727-113151/
url https://teses.usp.br/teses/disponiveis/45/45134/tde-20230727-113151/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1809090937517768704