Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/102906
DC FieldValueLanguage
dc.contributor.advisorCruz, Luís Alberto da Silva-
dc.contributor.authorMarques, Miguel Bruno dos Santos-
dc.date.accessioned2022-10-17T22:01:25Z-
dc.date.available2022-10-17T22:01:25Z-
dc.date.issued2022-09-27-
dc.date.submitted2022-10-17-
dc.identifier.urihttps://hdl.handle.net/10316/102906-
dc.descriptionDissertação de Mestrado em Engenharia Eletrotécnica e de Computadores apresentada à Faculdade de Ciências e Tecnologia-
dc.description.abstractÀ medida que nuvens de pontos 3D se tornam mais comuns como uma representação de conteúdo visual 3D, a necessidade de comprimir eficientemente estes dados torna-se cada vez maior. Investigações evidenciam que soluções baseadas em aprendizagem profunda para codificação de nuvens de pontos resultam num aumento no desempenho comparado com métodos mais tradicionais como os utilizados nos codificadores G-PCC e V-PCC desenvolvidos pela MPEG. No contexto de compressão de nuvens de pontos baseada em aprendizagem profunda, esta Dissertação examina e avalia o uso da arquitetura de aprendizagem profunda denominada Transformer, bem como entradas do modelo profundo baseadas em patches. Combinando estas técnicas com soluções estado da arte na literatura de compressão de nuvens de pontos usando aprendizagem profunda, são propostos e avaliados quatro novos codificadores. Os resultados obtidos demonstram, não só um aumento de desempenho comparado com o codificador base MPEG G-PCC Octree em termos da métrica D1 PSNR, mas também um aumento no desempenho comparado com o codificador base baseado em aprendizagem profunda PCC Geo v2. Esta Dissertação também apresenta um estudo que analisa o impacto no desempenho dos codificadores propostos de vários parâmetros, com o intuito de guiar investigações futuras no tópico de compressão de nuvens de pontos baseada em aprendizagem profunda. Finalmente, é realizado um estudo com o objetivo de extender a funcionalidade de soluções estado da arte em compressão de nuvens de pontos baseada em aprendizagem profunda para também comprimir informação da cor de cada ponto da nuvem de pontos. Em termos de espaço de cor na codificação, são realizados estudos usando os espaços de cor RGB, YCbCr, LAB e HSV para determinar qual deles é o mais adequado para comprimir as nuvens de pontos. Todas as soluções exploradas são também comparadas com o desempenho do codificador base V-PCC.por
dc.description.abstractAs 3D point clouds become more common as a representation of three dimensional visual content, the need to efficiently compress this data grows ever stronger. Research has shown that deep learning based approaches to point cloud coding see an increase in performance when compared with more traditional methods like the MPEG Geometry Point Cloud Compression (G-PCC) and MPEG Video-based Point Cloud Compression (V-PCC) encoders developed by Moving Picture Experts Group. This Dissertation examines and evaluates the use of the deep learning Transformer architecture and patch-based inputs combined with well developed deep learning point cloud compression solutions described in the literature. To that end, we propose four new deep learning encoders. The obtained results show an improvement over the G-PCC Octree encoder in terms of the D1 PSNR metric, as well as an improvement over the baseline PCC Geo v2 codec. The Dissertation also presents an ablation study conducted to analyze the impact of several encoder related parameters and structures that can guide future research in deep learning point cloud compression. Finally, a study is conducted to extend current state-of-the-art deep learning point cloud compression solutions to also compress the color information of the point cloud. A detailed study is performed over the RGB, YCbCr, LAB and HSV color spaces to determine the best suited color space to compress the point clouds, while also comparing the reconstructed point clouds to the MPEG V-PCC codec baseline.eng
dc.language.isoeng-
dc.rightsembargoedAccess-
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/-
dc.subjectNuvens de pontospor
dc.subjectCompressãopor
dc.subjectAprendizagem profundapor
dc.subjectPoint cloudeng
dc.subjectCompressioneng
dc.subjectDeep learningeng
dc.titleAdvances in 3D point cloud compression using deep learningeng
dc.title.alternativeAvanços na compressão de nuvens de pontos 3D usando aprendizagem profundapor
dc.typemasterThesis-
degois.publication.locationDEEC-
degois.publication.titleAdvances in 3D point cloud compression using deep learningeng
dc.date.embargoEndDate2024-03-20-
dc.peerreviewedyes-
dc.date.embargo2024-03-20*
dc.identifier.tid203077695-
thesis.degree.disciplineEngenharia Electrotécnica e de Computadores-
thesis.degree.grantorUniversidade de Coimbra-
thesis.degree.level1-
thesis.degree.nameMestrado em Engenharia Eletrotécnica e de Computadores-
uc.degree.grantorUnitFaculdade de Ciências e Tecnologia - Departamento de Eng. Electrotécnica e de Computadores-
uc.degree.grantorID0500-
uc.contributor.authorMarques, Miguel Bruno dos Santos::0000-0003-0554-1132-
uc.degree.classification19-
uc.date.periodoEmbargo540-
uc.degree.presidentejuriSilva, Vítor Manuel Mendes da-
uc.degree.elementojuriCruz, Luís Alberto da Silva-
uc.degree.elementojuriGonçalves, Nuno Miguel Mendonça da Silva-
uc.contributor.advisorCruz, Luís Alberto da Silva::0000-0003-1141-4404-
item.openairetypemasterThesis-
item.fulltextCom Texto completo-
item.languageiso639-1en-
item.grantfulltextopen-
item.cerifentitytypePublications-
item.openairecristypehttp://purl.org/coar/resource_type/c_18cf-
Appears in Collections:UC - Dissertações de Mestrado
Files in This Item:
File Description SizeFormat
Dissertação_Miguel_Marques_2017254583.pdf26.71 MBAdobe PDFView/Open
Show simple item record

Page view(s)

53
checked on Jul 16, 2024

Download(s)

9
checked on Jul 16, 2024

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons