Redes neurais convolucionais aplicadas ao projeto de operadores de imagens
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://teses.usp.br/teses/disponiveis/45/45134/tde-20230727-113151/ |
Resumo: | O projeto de W-operadores de imagens requer a estimação de um operador local a partir de exemplos de treinamento e da indução de um classificador baseado em aprendizado de máquina para a classificação de exemplos pouco, ou nunca, observados no treinamento. Nos últimos anos, a ârea de aprendizado de máquina passou por um avanço muito grande devido às redes neurais convolucionais (CNN). Esse avanço é principalmente devido ao poder de representação das redes neurais e pelo fato das redes convolucionais serem efetivas na extração de características locais. Devido a isso, elas estão presentes em muitas soluções do estado da arte de diversos problemas de visão computacional [MPGC 17, HGC+17, FTM+17, MZY+17, CGW+17]. Neste trabalho, estudamos e exploramos o poder de representação das CNNs no contexto do projeto de W-operadores de imagens. Integramos implementações públicas e bastante maduras de CNN a uma biblioteca de projeto de W-operadores desenvolvida pelo nosso grupo (TRIOS) e testamos diversas estratégias para segmentar imagens de níveis de cinza ou, ainda, classificar os padrões de intensidades em níveis de cinza observados através de uma janela W em poucos rótulos (em geral, dois rótulos, ou O, ou 1). Para validar a proposta, usamos 2 conjuntos de dados de imagens de fundo de olho, chamados de DRIVE e STARE, os quais já são um padrão na área de imagens para a segmentação das veias da retina e também em um conjunto de dados chamado de STAFF (KFV+13, VKFJ13], o qual é uma variação do banco de dados CVC-MUSCIMA [FDGL12] e tem o objetivo de segmentar notas musicais em partituras. Os resultados obtidos mostram que, para uma janela razoavelmente grande, os resultados são satisfatórias ao se comparar com soluções específicas do estado da arte, as quais utilizam heurísticas de pré e pós-processamento. |
id |
USP_8065bcd67c2aa7aa7e950d8a6fad268a |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-20230727-113151 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Redes neurais convolucionais aplicadas ao projeto de operadores de imagensConvolutional neural networks model applied to construction of image operatorsAprendizado ComputacionalImagem DigitalRedes NeuraisO projeto de W-operadores de imagens requer a estimação de um operador local a partir de exemplos de treinamento e da indução de um classificador baseado em aprendizado de máquina para a classificação de exemplos pouco, ou nunca, observados no treinamento. Nos últimos anos, a ârea de aprendizado de máquina passou por um avanço muito grande devido às redes neurais convolucionais (CNN). Esse avanço é principalmente devido ao poder de representação das redes neurais e pelo fato das redes convolucionais serem efetivas na extração de características locais. Devido a isso, elas estão presentes em muitas soluções do estado da arte de diversos problemas de visão computacional [MPGC 17, HGC+17, FTM+17, MZY+17, CGW+17]. Neste trabalho, estudamos e exploramos o poder de representação das CNNs no contexto do projeto de W-operadores de imagens. Integramos implementações públicas e bastante maduras de CNN a uma biblioteca de projeto de W-operadores desenvolvida pelo nosso grupo (TRIOS) e testamos diversas estratégias para segmentar imagens de níveis de cinza ou, ainda, classificar os padrões de intensidades em níveis de cinza observados através de uma janela W em poucos rótulos (em geral, dois rótulos, ou O, ou 1). Para validar a proposta, usamos 2 conjuntos de dados de imagens de fundo de olho, chamados de DRIVE e STARE, os quais já são um padrão na área de imagens para a segmentação das veias da retina e também em um conjunto de dados chamado de STAFF (KFV+13, VKFJ13], o qual é uma variação do banco de dados CVC-MUSCIMA [FDGL12] e tem o objetivo de segmentar notas musicais em partituras. Os resultados obtidos mostram que, para uma janela razoavelmente grande, os resultados são satisfatórias ao se comparar com soluções específicas do estado da arte, as quais utilizam heurísticas de pré e pós-processamento.The project of images W-operators requires the estimation of a local operator using training examples and the induction of a cla.55ifier based on machine learning to classify examples that are seldom or never seen during training. ln the last years, the area of machine learning advanced enormously due to the use of convolutional neural networks (CNN). This advance is caused mainly dueto the power of representation of the neural networks and due to the fact that the convolutional neural networks are effective in the extraction of local characteristics. Consequently, they are present in many state of the art solutions for problems of computer vision [MPGC 17, HGC+17, FTM+17, MZY+17, CGW+17]. ln this work we study and explore the power of representation of the CNN's in the context of images w-operators project. We integrate public implementations and very mature libraries of CNN and w-operators developed by our group (TRIOS) and test several strategies to segment gray-level images or to classify the gray-level intensity patterns observed through a window w in a few labels (in general, 2 labels, either O or 1). To validate this proposal we use 2 data sets of retina! images, called DRIVE and STARE which are commonly used for vessel segmentation of the retina and also in a data set called STAFF [KFV+13, VKFJ13], which is a variation of the database CVC-MUSCIMA [FDGL12] and has the objective of segmenting musical notes in partitures. The results have shown that, for a big window, the results are satisfactory when compared to specific state of the art solutions which use pre and post-processing.Biblioteca Digitais de Teses e Dissertações da USPHirata Júnior, RobertoLopes, André Vinícius2017-12-08info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://teses.usp.br/teses/disponiveis/45/45134/tde-20230727-113151/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2023-07-27T18:54:05Zoai:teses.usp.br:tde-20230727-113151Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-07-27T18:54:05Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Redes neurais convolucionais aplicadas ao projeto de operadores de imagens Convolutional neural networks model applied to construction of image operators |
title |
Redes neurais convolucionais aplicadas ao projeto de operadores de imagens |
spellingShingle |
Redes neurais convolucionais aplicadas ao projeto de operadores de imagens Lopes, André Vinícius Aprendizado Computacional Imagem Digital Redes Neurais |
title_short |
Redes neurais convolucionais aplicadas ao projeto de operadores de imagens |
title_full |
Redes neurais convolucionais aplicadas ao projeto de operadores de imagens |
title_fullStr |
Redes neurais convolucionais aplicadas ao projeto de operadores de imagens |
title_full_unstemmed |
Redes neurais convolucionais aplicadas ao projeto de operadores de imagens |
title_sort |
Redes neurais convolucionais aplicadas ao projeto de operadores de imagens |
author |
Lopes, André Vinícius |
author_facet |
Lopes, André Vinícius |
author_role |
author |
dc.contributor.none.fl_str_mv |
Hirata Júnior, Roberto |
dc.contributor.author.fl_str_mv |
Lopes, André Vinícius |
dc.subject.por.fl_str_mv |
Aprendizado Computacional Imagem Digital Redes Neurais |
topic |
Aprendizado Computacional Imagem Digital Redes Neurais |
description |
O projeto de W-operadores de imagens requer a estimação de um operador local a partir de exemplos de treinamento e da indução de um classificador baseado em aprendizado de máquina para a classificação de exemplos pouco, ou nunca, observados no treinamento. Nos últimos anos, a ârea de aprendizado de máquina passou por um avanço muito grande devido às redes neurais convolucionais (CNN). Esse avanço é principalmente devido ao poder de representação das redes neurais e pelo fato das redes convolucionais serem efetivas na extração de características locais. Devido a isso, elas estão presentes em muitas soluções do estado da arte de diversos problemas de visão computacional [MPGC 17, HGC+17, FTM+17, MZY+17, CGW+17]. Neste trabalho, estudamos e exploramos o poder de representação das CNNs no contexto do projeto de W-operadores de imagens. Integramos implementações públicas e bastante maduras de CNN a uma biblioteca de projeto de W-operadores desenvolvida pelo nosso grupo (TRIOS) e testamos diversas estratégias para segmentar imagens de níveis de cinza ou, ainda, classificar os padrões de intensidades em níveis de cinza observados através de uma janela W em poucos rótulos (em geral, dois rótulos, ou O, ou 1). Para validar a proposta, usamos 2 conjuntos de dados de imagens de fundo de olho, chamados de DRIVE e STARE, os quais já são um padrão na área de imagens para a segmentação das veias da retina e também em um conjunto de dados chamado de STAFF (KFV+13, VKFJ13], o qual é uma variação do banco de dados CVC-MUSCIMA [FDGL12] e tem o objetivo de segmentar notas musicais em partituras. Os resultados obtidos mostram que, para uma janela razoavelmente grande, os resultados são satisfatórias ao se comparar com soluções específicas do estado da arte, as quais utilizam heurísticas de pré e pós-processamento. |
publishDate |
2017 |
dc.date.none.fl_str_mv |
2017-12-08 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://teses.usp.br/teses/disponiveis/45/45134/tde-20230727-113151/ |
url |
https://teses.usp.br/teses/disponiveis/45/45134/tde-20230727-113151/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1809090937517768704 |