Advances in 3D point cloud compression using deep learning

Marques, Miguel Bruno dos Santos

Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/102906

DC Field	Value	Language
dc.contributor.advisor	Cruz, Luís Alberto da Silva	-
dc.contributor.author	Marques, Miguel Bruno dos Santos	-
dc.date.accessioned	2022-10-17T22:01:25Z	-
dc.date.available	2022-10-17T22:01:25Z	-
dc.date.issued	2022-09-27	-
dc.date.submitted	2022-10-17	-
dc.identifier.uri	https://hdl.handle.net/10316/102906	-
dc.description	Dissertação de Mestrado em Engenharia Eletrotécnica e de Computadores apresentada à Faculdade de Ciências e Tecnologia	-
dc.description.abstract	À medida que nuvens de pontos 3D se tornam mais comuns como uma representação de conteúdo visual 3D, a necessidade de comprimir eficientemente estes dados torna-se cada vez maior. Investigações evidenciam que soluções baseadas em aprendizagem profunda para codificação de nuvens de pontos resultam num aumento no desempenho comparado com métodos mais tradicionais como os utilizados nos codificadores G-PCC e V-PCC desenvolvidos pela MPEG. No contexto de compressão de nuvens de pontos baseada em aprendizagem profunda, esta Dissertação examina e avalia o uso da arquitetura de aprendizagem profunda denominada Transformer, bem como entradas do modelo profundo baseadas em patches. Combinando estas técnicas com soluções estado da arte na literatura de compressão de nuvens de pontos usando aprendizagem profunda, são propostos e avaliados quatro novos codificadores. Os resultados obtidos demonstram, não só um aumento de desempenho comparado com o codificador base MPEG G-PCC Octree em termos da métrica D1 PSNR, mas também um aumento no desempenho comparado com o codificador base baseado em aprendizagem profunda PCC Geo v2. Esta Dissertação também apresenta um estudo que analisa o impacto no desempenho dos codificadores propostos de vários parâmetros, com o intuito de guiar investigações futuras no tópico de compressão de nuvens de pontos baseada em aprendizagem profunda. Finalmente, é realizado um estudo com o objetivo de extender a funcionalidade de soluções estado da arte em compressão de nuvens de pontos baseada em aprendizagem profunda para também comprimir informação da cor de cada ponto da nuvem de pontos. Em termos de espaço de cor na codificação, são realizados estudos usando os espaços de cor RGB, YCbCr, LAB e HSV para determinar qual deles é o mais adequado para comprimir as nuvens de pontos. Todas as soluções exploradas são também comparadas com o desempenho do codificador base V-PCC.	por
dc.description.abstract	As 3D point clouds become more common as a representation of three dimensional visual content, the need to efficiently compress this data grows ever stronger. Research has shown that deep learning based approaches to point cloud coding see an increase in performance when compared with more traditional methods like the MPEG Geometry Point Cloud Compression (G-PCC) and MPEG Video-based Point Cloud Compression (V-PCC) encoders developed by Moving Picture Experts Group. This Dissertation examines and evaluates the use of the deep learning Transformer architecture and patch-based inputs combined with well developed deep learning point cloud compression solutions described in the literature. To that end, we propose four new deep learning encoders. The obtained results show an improvement over the G-PCC Octree encoder in terms of the D1 PSNR metric, as well as an improvement over the baseline PCC Geo v2 codec. The Dissertation also presents an ablation study conducted to analyze the impact of several encoder related parameters and structures that can guide future research in deep learning point cloud compression. Finally, a study is conducted to extend current state-of-the-art deep learning point cloud compression solutions to also compress the color information of the point cloud. A detailed study is performed over the RGB, YCbCr, LAB and HSV color spaces to determine the best suited color space to compress the point clouds, while also comparing the reconstructed point clouds to the MPEG V-PCC codec baseline.	eng
dc.language.iso	eng	-
dc.rights	embargoedAccess	-
dc.rights.uri	http://creativecommons.org/licenses/by/4.0/	-
dc.subject	Nuvens de pontos	por
dc.subject	Compressão	por
dc.subject	Aprendizagem profunda	por
dc.subject	Point cloud	eng
dc.subject	Compression	eng
dc.subject	Deep learning	eng
dc.title	Advances in 3D point cloud compression using deep learning	eng
dc.title.alternative	Avanços na compressão de nuvens de pontos 3D usando aprendizagem profunda	por
dc.type	masterThesis	-
degois.publication.location	DEEC	-
degois.publication.title	Advances in 3D point cloud compression using deep learning	eng
dc.date.embargoEndDate	2024-03-20	-
dc.peerreviewed	yes	-
dc.date.embargo	2024-03-20	*
dc.identifier.tid	203077695	-
thesis.degree.discipline	Engenharia Electrotécnica e de Computadores	-
thesis.degree.grantor	Universidade de Coimbra	-
thesis.degree.level	1	-
thesis.degree.name	Mestrado em Engenharia Eletrotécnica e de Computadores	-
uc.degree.grantorUnit	Faculdade de Ciências e Tecnologia - Departamento de Eng. Electrotécnica e de Computadores	-
uc.degree.grantorID	0500	-
uc.contributor.author	Marques, Miguel Bruno dos Santos::0000-0003-0554-1132	-
uc.degree.classification	19	-
uc.date.periodoEmbargo	540	-
uc.degree.presidentejuri	Silva, Vítor Manuel Mendes da	-
uc.degree.elementojuri	Cruz, Luís Alberto da Silva	-
uc.degree.elementojuri	Gonçalves, Nuno Miguel Mendonça da Silva	-
uc.contributor.advisor	Cruz, Luís Alberto da Silva::0000-0003-1141-4404	-
item.openairetype	masterThesis	-
item.fulltext	Com Texto completo	-
item.languageiso639-1	en	-
item.grantfulltext	open	-
item.cerifentitytype	Publications	-
item.openairecristype	http://purl.org/coar/resource_type/c_18cf	-
Appears in Collections:	UC - Dissertações de Mestrado

Files in This Item:

File	Description	Size	Format
Dissertação_Miguel_Marques_2017254583.pdf		26.71 MB	Adobe PDF	View/Open

Show simple item record

Page view(s)

53

checked on Jul 16, 2024

Download(s)

9

checked on Jul 16, 2024

Google Scholar^TM

Check

This item is licensed under a Creative Commons License

Files in This Item:

Page view(s)

Download(s)

Google ScholarTM

Google Scholar^TM