Pseudo RGB-D Facial Image Processing - Towards Face Recognition and Facial Diagnosis

Jin, Bo

Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/114679

DC Field	Value	Language
dc.contributor.advisor	Cruz, Leandro Moraes Valle	-
dc.contributor.advisor	Gonçalves, Nuno Miguel Mendonça da Silva	-
dc.contributor.author	Jin, Bo	-
dc.date.accessioned	2024-04-04T22:00:25Z	-
dc.date.available	2024-04-04T22:00:25Z	-
dc.date.issued	2023-12-20	-
dc.date.submitted	2024-04-04	-
dc.identifier.uri	https://hdl.handle.net/10316/114679	-
dc.description	Tese de Doutoramento em Engenharia Electrotécnica e de Computadores apresentada à Faculdade de Ciências e Tecnologia	-
dc.description.abstract	Hoje em dia, aplicações baseadas em imagens faciais tornaram-se generalizadas em campos como segurança, medicina e entretenimento. Fatores como iluminação, pose e expressões faciais podem impactar o desempenho dessas aplicações. Na última década, o desenvolvimento e a acessibilidade de sensores RGB-D de baixo custo tornaram possível obter informações de profundidade de objetos, levando os pesquisadores a abordar problemas de reconhecimento facial capturando imagens faciais RGB-D. No entanto, devido a restrições de privacidade, a obtenção de dados de profundidade de rostos humanos permanece um desafio, e as imagens faciais RGB 2D ainda são predominantes.Seres inteligentes, como os humanos, podem usar sua vasta experiência para derivar informações espaciais 3D de cenas 2D. As metodologias de aprendizado de máquina visam resolver tais problemas treinando computadores para gerar respostas precisas. O objetivo de nossa pesquisa é melhorar o desempenho das tarefas de processamento facial subsequentes, como reconhecimento facial e diagnóstico facial, obtendo mapas de profundidade diretamente das imagens RGB correspondentes. Propomos uma estrutura de processamento de imagem facial pseudo RGB-D que substitui sensores de profundidade com mapas pseudo-profundidade gerados e oferece métodos orientados a dados para criar mapas de profundidade a partir de imagens faciais 2D.Especificamente, projetamos e implementamos um modelo de rede adversarial generativa chamado 'D+GAN' para tradução de imagem para imagem multi-condicional com atributos faciais. Validamos a abordagem de processamento de imagem facial pseudo RGB-D através de experimentos em reconhecimento facial e diagnóstico facial usando vários conjuntos de dados. A estrutura de processamento de imagem facial pseudo RGB-D trabalha em conjunto com algoritmos de fusão de imagens para melhorar o desempenho do reconhecimento facial e diagnóstico facial.Para explorar ainda mais as características pseudo-profundidade, propomos finalmente uma estrutura de processamento de imagem facial multimodal simulada que melhora significativamente o desempenho com uma probabilidade mais alta.	por
dc.description.abstract	Today, face image-based applications have become widespread in fields such as security, medicine, and entertainment. Factors like lighting, pose, and facial expressions can impact the performance of these applications. Over the past decade, the development and affordability of low-cost RGB-D sensors have made it possible to obtain depth information of objects, leading researchers to tackle face recognition problems by capturing RGB-D face images. However, due to privacy restrictions, acquiring depth data from human faces remains challenging, and 2D RGB face images are still prevalent.Intelligent beings, such as humans, can use their vast experience to derive 3D spatial information from 2D scenes. Machine learning methodologies aim to solve such problems by training computers to generate accurate answers. Our research's objective is to enhance the performance of subsequent face processing tasks, such as face recognition and facial diagnosis, by obtaining depth maps directly from corresponding RGB images. We propose a pseudo RGB-D facial image processing framework that replaces depth sensors with generated pseudo-depth maps and offers data-driven methods to create depth maps from 2D face images.Specifically, we design and implement a generative adversarial network model named 'D+GAN' for multi-conditional image-to-image translation with facial attributes. We validate the pseudo RGB-D facial image processing approach through experiments on face recognition and facial diagnosis using various datasets. The pseudo RGB-D facial image processing framework works in conjunction with image fusion algorithms to enhance face recognition and facial diagnosis performance.To further exploit pseudo-depth features, we ultimately propose a simulated multimodal facial image processing framework that significantly improves performance with a higher probability.	eng
dc.description.sponsorship	Universidade de Coimbra - Instituto de Sistemas e Robótica	-
dc.language.iso	eng	-
dc.rights	embargoedAccess	-
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/	-
dc.subject	Reconhecimento facial pseudo RGB-D	por
dc.subject	Diagnóstico facial profundo	por
dc.subject	Rede Adversarial Generativa com Profundidade Adicional (D+GAN)	por
dc.subject	Estimativa de profundidade facial monocular	por
dc.subject	Rostos específicos de doenças	por
dc.subject	Pseudo RGB-D face recognition	eng
dc.subject	Deep facial diagnosis	eng
dc.subject	Depth Plus Generative Adversarial Network (D+GAN)	eng
dc.subject	Monocular face depth estimation	eng
dc.subject	Disease-specific faces	eng
dc.title	Pseudo RGB-D Facial Image Processing - Towards Face Recognition and Facial Diagnosis	eng
dc.title.alternative	Processamento de Imagens Faciais Pseudo RGB-D para Reconhecimento Facial e Diagnóstico Facial	por
dc.type	doctoralThesis	-
degois.publication.location	DEEC	-
degois.publication.title	Pseudo RGB-D Facial Image Processing - Towards Face Recognition and Facial Diagnosis	eng
dc.date.embargoEndDate	2029-12-18	-
dc.peerreviewed	yes	-
dc.date.embargo	2029-12-18	*
dc.identifier.tid	101745303	-
dc.subject.fos	Ciências da engenharia e tecnologias::Engenharia electrotécnica, electrónica e informática	-
thesis.degree.discipline	Engenharia Electrotécnica e de Computadores	-
thesis.degree.grantor	Universidade de Coimbra	-
thesis.degree.name	Doutoramento em Engenharia Electrotécnica e de Computadores	-
uc.degree.grantorUnit	Faculdade de Ciências e Tecnologia - Departamento de Eng. Electrotécnica e de Computadores	-
uc.degree.grantorID	0500	-
uc.justificaEmbargo	Because I am preparing to apply for a patent or submit a portion of this research to an academic journal for publication. During this time, I do not want my thesis to be made available online.	-
uc.contributor.author	Bo, Jin::0000-0001-9255-5772	-
uc.degree.classification	Aprovado com Distinção	-
uc.date.periodoEmbargo	2190	-
uc.degree.presidentejuri	Batista, Jorge Manuel Moreira de Campos Pereira	-
uc.degree.elementojuri	Proença, Hugo Pedro Martins Carriço::0000-0003-2551-8570	-
uc.degree.elementojuri	Neves, António José Ribeiro::0000-0001-5433-6667	-
uc.degree.elementojuri	Neves, João Carlos Raposo::0000-0003-0139-2213	-
uc.degree.elementojuri	Domingues, Inês Campos Monteiro Sabino::0000-0002-2334-7280	-
uc.degree.elementojuri	Morgado, António Miguel Lino Santos::0000-0001-9455-1206	-
uc.degree.elementojuri	Gonçalves, Nuno Miguel Mendonça da Silva::0000-0002-1854-049X	-
uc.contributor.advisor	Cruz, Leandro Moraes Valle	-
uc.contributor.advisor	Gonçalves, Nuno Miguel Mendonça da Silva::0000-0002-1854-049X	-
uc.contributor.email	uc2015263684@student.uc.pt	-
item.fulltext	Com Texto completo	-
item.languageiso639-1	en	-
item.openairecristype	http://purl.org/coar/resource_type/c_18cf	-
item.openairetype	doctoralThesis	-
item.grantfulltext	embargo_20291218	-
item.cerifentitytype	Publications	-
crisitem.author.researchunit	ISR - Institute of Systems and Robotics	-
crisitem.author.parentresearchunit	University of Coimbra	-
crisitem.author.orcid	0000-0001-9255-5772	-
crisitem.advisor.researchunit	ISR - Institute of Systems and Robotics	-
crisitem.advisor.parentresearchunit	University of Coimbra	-
crisitem.advisor.orcid	0000-0003-3354-4007	-
Appears in Collections:	UC - Teses de Doutoramento

Files in This Item:

File	Size	Format	Login
UCTese_Jin.pdf	26.33 MB	Adobe PDF	Embargo Access Request a copy

Show simple item record

Page view(s)

62

checked on Jul 17, 2024

Download(s)

2

checked on Jul 17, 2024

Google Scholar^TM

Check

This item is licensed under a Creative Commons License

Files in This Item:

Page view(s)

Download(s)

Google ScholarTM

Google Scholar^TM