Advances in 3D point cloud compression using deep learning
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10316/102906 |
Resumo: | Dissertação de Mestrado em Engenharia Eletrotécnica e de Computadores apresentada à Faculdade de Ciências e Tecnologia |
id |
RCAP_d3707c930d071fdac2ec685f023a85bb |
---|---|
oai_identifier_str |
oai:estudogeral.uc.pt:10316/102906 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Advances in 3D point cloud compression using deep learningAvanços na compressão de nuvens de pontos 3D usando aprendizagem profundaNuvens de pontosCompressãoAprendizagem profundaPoint cloudCompressionDeep learningDissertação de Mestrado em Engenharia Eletrotécnica e de Computadores apresentada à Faculdade de Ciências e TecnologiaÀ medida que nuvens de pontos 3D se tornam mais comuns como uma representação de conteúdo visual 3D, a necessidade de comprimir eficientemente estes dados torna-se cada vez maior. Investigações evidenciam que soluções baseadas em aprendizagem profunda para codificação de nuvens de pontos resultam num aumento no desempenho comparado com métodos mais tradicionais como os utilizados nos codificadores G-PCC e V-PCC desenvolvidos pela MPEG. No contexto de compressão de nuvens de pontos baseada em aprendizagem profunda, esta Dissertação examina e avalia o uso da arquitetura de aprendizagem profunda denominada Transformer, bem como entradas do modelo profundo baseadas em patches. Combinando estas técnicas com soluções estado da arte na literatura de compressão de nuvens de pontos usando aprendizagem profunda, são propostos e avaliados quatro novos codificadores. Os resultados obtidos demonstram, não só um aumento de desempenho comparado com o codificador base MPEG G-PCC Octree em termos da métrica D1 PSNR, mas também um aumento no desempenho comparado com o codificador base baseado em aprendizagem profunda PCC Geo v2. Esta Dissertação também apresenta um estudo que analisa o impacto no desempenho dos codificadores propostos de vários parâmetros, com o intuito de guiar investigações futuras no tópico de compressão de nuvens de pontos baseada em aprendizagem profunda. Finalmente, é realizado um estudo com o objetivo de extender a funcionalidade de soluções estado da arte em compressão de nuvens de pontos baseada em aprendizagem profunda para também comprimir informação da cor de cada ponto da nuvem de pontos. Em termos de espaço de cor na codificação, são realizados estudos usando os espaços de cor RGB, YCbCr, LAB e HSV para determinar qual deles é o mais adequado para comprimir as nuvens de pontos. Todas as soluções exploradas são também comparadas com o desempenho do codificador base V-PCC.As 3D point clouds become more common as a representation of three dimensional visual content, the need to efficiently compress this data grows ever stronger. Research has shown that deep learning based approaches to point cloud coding see an increase in performance when compared with more traditional methods like the MPEG Geometry Point Cloud Compression (G-PCC) and MPEG Video-based Point Cloud Compression (V-PCC) encoders developed by Moving Picture Experts Group. This Dissertation examines and evaluates the use of the deep learning Transformer architecture and patch-based inputs combined with well developed deep learning point cloud compression solutions described in the literature. To that end, we propose four new deep learning encoders. The obtained results show an improvement over the G-PCC Octree encoder in terms of the D1 PSNR metric, as well as an improvement over the baseline PCC Geo v2 codec. The Dissertation also presents an ablation study conducted to analyze the impact of several encoder related parameters and structures that can guide future research in deep learning point cloud compression. Finally, a study is conducted to extend current state-of-the-art deep learning point cloud compression solutions to also compress the color information of the point cloud. A detailed study is performed over the RGB, YCbCr, LAB and HSV color spaces to determine the best suited color space to compress the point clouds, while also comparing the reconstructed point clouds to the MPEG V-PCC codec baseline.2022-09-272024-03-20T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/10316/102906http://hdl.handle.net/10316/102906TID:203077695engMarques, Miguel Bruno dos Santosinfo:eu-repo/semantics/embargoedAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-10-27T11:09:25Zoai:estudogeral.uc.pt:10316/102906Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:19:48.387785Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Advances in 3D point cloud compression using deep learning Avanços na compressão de nuvens de pontos 3D usando aprendizagem profunda |
title |
Advances in 3D point cloud compression using deep learning |
spellingShingle |
Advances in 3D point cloud compression using deep learning Marques, Miguel Bruno dos Santos Nuvens de pontos Compressão Aprendizagem profunda Point cloud Compression Deep learning |
title_short |
Advances in 3D point cloud compression using deep learning |
title_full |
Advances in 3D point cloud compression using deep learning |
title_fullStr |
Advances in 3D point cloud compression using deep learning |
title_full_unstemmed |
Advances in 3D point cloud compression using deep learning |
title_sort |
Advances in 3D point cloud compression using deep learning |
author |
Marques, Miguel Bruno dos Santos |
author_facet |
Marques, Miguel Bruno dos Santos |
author_role |
author |
dc.contributor.author.fl_str_mv |
Marques, Miguel Bruno dos Santos |
dc.subject.por.fl_str_mv |
Nuvens de pontos Compressão Aprendizagem profunda Point cloud Compression Deep learning |
topic |
Nuvens de pontos Compressão Aprendizagem profunda Point cloud Compression Deep learning |
description |
Dissertação de Mestrado em Engenharia Eletrotécnica e de Computadores apresentada à Faculdade de Ciências e Tecnologia |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-09-27 2024-03-20T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10316/102906 http://hdl.handle.net/10316/102906 TID:203077695 |
url |
http://hdl.handle.net/10316/102906 |
identifier_str_mv |
TID:203077695 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/embargoedAccess |
eu_rights_str_mv |
embargoedAccess |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799134092045844480 |