A performance increment strategy for semantic segmentation of low-resolution images from damaged roads
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Institucional da UFSC |
Texto Completo: | https://repositorio.ufsc.br/handle/123456789/247358 |
Resumo: | Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia de Automação e Sistemas, Florianópolis, 2022. |
id |
UFSC_7cee16be9258c1386a99c7549c16062b |
---|---|
oai_identifier_str |
oai:repositorio.ufsc.br:123456789/247358 |
network_acronym_str |
UFSC |
network_name_str |
Repositório Institucional da UFSC |
repository_id_str |
2373 |
spelling |
A performance increment strategy for semantic segmentation of low-resolution images from damaged roadsEngenharia de sistemasAutomaçãoAprendizado profundo (aprendizado do computador)EstradasVeículos autônomosDissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia de Automação e Sistemas, Florianópolis, 2022.Segmentação semântica é essencial para o entendimento de cenário de estradas e, consequentemente, para a realização de navegação autônoma. Entretanto, novos desafios surgem quando essas tarefas são postas em países emergentes dado a falta de uma infra-estrutura de qualidade ou a restrição a recursos computacionais. Recentemente, a Confederação Nacional de Transportes (CNT) reportou que 85% das estradas brasileiras apresentam algum dano como rachaduras, buracos, e remendos; normalmente, esses danos não são levados em conta pelos modelos de aprendizado profundo do estado da arte, os quais são treinados para atender a infra-estrutura de países desenvolvidos em conjunto de dados de alta-resolução como Cityscapes (2048x1024) e CamVid (920x720). Em 2019, o dataset Road Transverse Knowledge (RTK) foi projetado especialmente para atender a realidade de países emergentes; ele consiste de 701 imagens densamente anotadas de baixa-resolução (352x288) e 12 classes com diferentes categorias de estradas e danos como buracos, poças d?águas, e rachaduras. Baseado no dataset RTK, esse trabalho indica os principais desafios para estradas de países emergentes: 1) detecção de objetos pequenos dado a baixa-resolução da imagem, 2) objetos de múltiplas escalas dado a irregularidade da forma dos objetos, e 3) classes altamente desbalanceadas dado que as classes de danos são de tamanho pequeno. Em seguida, esse trabalho propõe a estratégia de incremento de performance para melhorar os resultados em conjuntos de dados de países emergentes; a estratégia consiste em uma série de 15 experimentos a fim de escolher a melhor opção para cada configuração de treinamento, como ampliação de dados, função perda e otimizador. Além desses, a estratégia sugere modificações na arquitetura como a remoção da camada max-pooling da ResNet e taxas de dilatação híbrida e digressiva. Ao final do trabalho, a estratégia alavancou o benchmark do RTK de 0.547 para 0.798 mIoU no conjunto de validação, e atingiu 0.688 mIoU no conjunto de teste do TAS500; os melhores resultados publicados até o momento.Abstract: Semantic segmentation is vital for understanding a road scene and, consequently, achieving autonomous driving. However, new challenges arise when attempting these tasks in emerging countries, given the lack of high-quality infrastructure or limited com- putational resources. Recently, the Brazilian National Transport Confederation (CNT) reported that 85% of the Brazilian roads present some damage like cracks, holes, and patches; these damages are usually not regarded by the state-of-the-art deep learn- ing models of road semantic segmentation, which are trained to meet the developed countries infra-structure in high-resolution datasets like Cityscapes (2048x1024) and CamVid (920x720). In 2019, the Road Transverse Knowledge (RTK) was specially de- signed to meet the emerging country reality; it consists of 701 fine-annotated images of low-resolution (352x288) and 12 classes with different road surfaces and damages like potholes, water puddles, and cracks. Based on the RTK dataset, this work points out the main challenges for emerging country roads: 1) small objects given low-resolution images, 2) multiscale objects given irregular-shaped objects, and 3) highly imbalanced classes given road-damages small size. Finally, this work proposes the performance increment strategy to enhance results in emerging country datasets; the strategy con- sists of a series of 15 experiments to choose the best option for each training setup like data augmentation, loss function, and optimizer. Furthermore, the strategy suggests architecture modifications such as the max-pooling layer removal from ResNet and hybrid and digressive dilation rates. In the end, the strategy raised the RTK benchmark from 0.547 to 0.798 mIoU on the validation set; and reached 0.688 mIoU in the TAS500 test set, the best results published so far.Antonelo, Eric AislanUniversidade Federal de Santa CatarinaToledo, Rafael de Souza2023-06-28T18:24:50Z2023-06-28T18:24:50Z2022info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis118 p.| il., gráfs.application/pdf380905https://repositorio.ufsc.br/handle/123456789/247358engreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccess2023-06-28T18:24:50Zoai:repositorio.ufsc.br:123456789/247358Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732023-06-28T18:24:50Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false |
dc.title.none.fl_str_mv |
A performance increment strategy for semantic segmentation of low-resolution images from damaged roads |
title |
A performance increment strategy for semantic segmentation of low-resolution images from damaged roads |
spellingShingle |
A performance increment strategy for semantic segmentation of low-resolution images from damaged roads Toledo, Rafael de Souza Engenharia de sistemas Automação Aprendizado profundo (aprendizado do computador) Estradas Veículos autônomos |
title_short |
A performance increment strategy for semantic segmentation of low-resolution images from damaged roads |
title_full |
A performance increment strategy for semantic segmentation of low-resolution images from damaged roads |
title_fullStr |
A performance increment strategy for semantic segmentation of low-resolution images from damaged roads |
title_full_unstemmed |
A performance increment strategy for semantic segmentation of low-resolution images from damaged roads |
title_sort |
A performance increment strategy for semantic segmentation of low-resolution images from damaged roads |
author |
Toledo, Rafael de Souza |
author_facet |
Toledo, Rafael de Souza |
author_role |
author |
dc.contributor.none.fl_str_mv |
Antonelo, Eric Aislan Universidade Federal de Santa Catarina |
dc.contributor.author.fl_str_mv |
Toledo, Rafael de Souza |
dc.subject.por.fl_str_mv |
Engenharia de sistemas Automação Aprendizado profundo (aprendizado do computador) Estradas Veículos autônomos |
topic |
Engenharia de sistemas Automação Aprendizado profundo (aprendizado do computador) Estradas Veículos autônomos |
description |
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia de Automação e Sistemas, Florianópolis, 2022. |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022 2023-06-28T18:24:50Z 2023-06-28T18:24:50Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
380905 https://repositorio.ufsc.br/handle/123456789/247358 |
identifier_str_mv |
380905 |
url |
https://repositorio.ufsc.br/handle/123456789/247358 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
118 p.| il., gráfs. application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSC instname:Universidade Federal de Santa Catarina (UFSC) instacron:UFSC |
instname_str |
Universidade Federal de Santa Catarina (UFSC) |
instacron_str |
UFSC |
institution |
UFSC |
reponame_str |
Repositório Institucional da UFSC |
collection |
Repositório Institucional da UFSC |
repository.name.fl_str_mv |
Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC) |
repository.mail.fl_str_mv |
|
_version_ |
1808652264877850624 |