Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/114679
DC FieldValueLanguage
dc.contributor.advisorCruz, Leandro Moraes Valle-
dc.contributor.advisorGonçalves, Nuno Miguel Mendonça da Silva-
dc.contributor.authorJin, Bo-
dc.date.accessioned2024-04-04T22:00:25Z-
dc.date.available2024-04-04T22:00:25Z-
dc.date.issued2023-12-20-
dc.date.submitted2024-04-04-
dc.identifier.urihttps://hdl.handle.net/10316/114679-
dc.descriptionTese de Doutoramento em Engenharia Electrotécnica e de Computadores apresentada à Faculdade de Ciências e Tecnologia-
dc.description.abstractHoje em dia, aplicações baseadas em imagens faciais tornaram-se generalizadas em campos como segurança, medicina e entretenimento. Fatores como iluminação, pose e expressões faciais podem impactar o desempenho dessas aplicações. Na última década, o desenvolvimento e a acessibilidade de sensores RGB-D de baixo custo tornaram possível obter informações de profundidade de objetos, levando os pesquisadores a abordar problemas de reconhecimento facial capturando imagens faciais RGB-D. No entanto, devido a restrições de privacidade, a obtenção de dados de profundidade de rostos humanos permanece um desafio, e as imagens faciais RGB 2D ainda são predominantes.Seres inteligentes, como os humanos, podem usar sua vasta experiência para derivar informações espaciais 3D de cenas 2D. As metodologias de aprendizado de máquina visam resolver tais problemas treinando computadores para gerar respostas precisas. O objetivo de nossa pesquisa é melhorar o desempenho das tarefas de processamento facial subsequentes, como reconhecimento facial e diagnóstico facial, obtendo mapas de profundidade diretamente das imagens RGB correspondentes. Propomos uma estrutura de processamento de imagem facial pseudo RGB-D que substitui sensores de profundidade com mapas pseudo-profundidade gerados e oferece métodos orientados a dados para criar mapas de profundidade a partir de imagens faciais 2D.Especificamente, projetamos e implementamos um modelo de rede adversarial generativa chamado 'D+GAN' para tradução de imagem para imagem multi-condicional com atributos faciais. Validamos a abordagem de processamento de imagem facial pseudo RGB-D através de experimentos em reconhecimento facial e diagnóstico facial usando vários conjuntos de dados. A estrutura de processamento de imagem facial pseudo RGB-D trabalha em conjunto com algoritmos de fusão de imagens para melhorar o desempenho do reconhecimento facial e diagnóstico facial.Para explorar ainda mais as características pseudo-profundidade, propomos finalmente uma estrutura de processamento de imagem facial multimodal simulada que melhora significativamente o desempenho com uma probabilidade mais alta.por
dc.description.abstractToday, face image-based applications have become widespread in fields such as security, medicine, and entertainment. Factors like lighting, pose, and facial expressions can impact the performance of these applications. Over the past decade, the development and affordability of low-cost RGB-D sensors have made it possible to obtain depth information of objects, leading researchers to tackle face recognition problems by capturing RGB-D face images. However, due to privacy restrictions, acquiring depth data from human faces remains challenging, and 2D RGB face images are still prevalent.Intelligent beings, such as humans, can use their vast experience to derive 3D spatial information from 2D scenes. Machine learning methodologies aim to solve such problems by training computers to generate accurate answers. Our research's objective is to enhance the performance of subsequent face processing tasks, such as face recognition and facial diagnosis, by obtaining depth maps directly from corresponding RGB images. We propose a pseudo RGB-D facial image processing framework that replaces depth sensors with generated pseudo-depth maps and offers data-driven methods to create depth maps from 2D face images.Specifically, we design and implement a generative adversarial network model named 'D+GAN' for multi-conditional image-to-image translation with facial attributes. We validate the pseudo RGB-D facial image processing approach through experiments on face recognition and facial diagnosis using various datasets. The pseudo RGB-D facial image processing framework works in conjunction with image fusion algorithms to enhance face recognition and facial diagnosis performance.To further exploit pseudo-depth features, we ultimately propose a simulated multimodal facial image processing framework that significantly improves performance with a higher probability.eng
dc.description.sponsorshipUniversidade de Coimbra - Instituto de Sistemas e Robótica-
dc.language.isoeng-
dc.rightsembargoedAccess-
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/-
dc.subjectReconhecimento facial pseudo RGB-Dpor
dc.subjectDiagnóstico facial profundopor
dc.subjectRede Adversarial Generativa com Profundidade Adicional (D+GAN)por
dc.subjectEstimativa de profundidade facial monocularpor
dc.subjectRostos específicos de doençaspor
dc.subjectPseudo RGB-D face recognitioneng
dc.subjectDeep facial diagnosiseng
dc.subjectDepth Plus Generative Adversarial Network (D+GAN)eng
dc.subjectMonocular face depth estimationeng
dc.subjectDisease-specific faceseng
dc.titlePseudo RGB-D Facial Image Processing - Towards Face Recognition and Facial Diagnosiseng
dc.title.alternativeProcessamento de Imagens Faciais Pseudo RGB-D para Reconhecimento Facial e Diagnóstico Facialpor
dc.typedoctoralThesis-
degois.publication.locationDEEC-
degois.publication.titlePseudo RGB-D Facial Image Processing - Towards Face Recognition and Facial Diagnosiseng
dc.date.embargoEndDate2029-12-18-
dc.peerreviewedyes-
dc.date.embargo2029-12-18*
dc.identifier.tid101745303-
dc.subject.fosCiências da engenharia e tecnologias::Engenharia electrotécnica, electrónica e informática-
thesis.degree.disciplineEngenharia Electrotécnica e de Computadores-
thesis.degree.grantorUniversidade de Coimbra-
thesis.degree.nameDoutoramento em Engenharia Electrotécnica e de Computadores-
uc.degree.grantorUnitFaculdade de Ciências e Tecnologia - Departamento de Eng. Electrotécnica e de Computadores-
uc.degree.grantorID0500-
uc.justificaEmbargoBecause I am preparing to apply for a patent or submit a portion of this research to an academic journal for publication. During this time, I do not want my thesis to be made available online.-
uc.contributor.authorBo, Jin::0000-0001-9255-5772-
uc.degree.classificationAprovado com Distinção-
uc.date.periodoEmbargo2190-
uc.degree.presidentejuriBatista, Jorge Manuel Moreira de Campos Pereira-
uc.degree.elementojuriProença, Hugo Pedro Martins Carriço::0000-0003-2551-8570-
uc.degree.elementojuriNeves, António José Ribeiro::0000-0001-5433-6667-
uc.degree.elementojuriNeves, João Carlos Raposo::0000-0003-0139-2213-
uc.degree.elementojuriDomingues, Inês Campos Monteiro Sabino::0000-0002-2334-7280-
uc.degree.elementojuriMorgado, António Miguel Lino Santos::0000-0001-9455-1206-
uc.degree.elementojuriGonçalves, Nuno Miguel Mendonça da Silva::0000-0002-1854-049X-
uc.contributor.advisorCruz, Leandro Moraes Valle-
uc.contributor.advisorGonçalves, Nuno Miguel Mendonça da Silva::0000-0002-1854-049X-
uc.contributor.emailuc2015263684@student.uc.pt-
item.fulltextCom Texto completo-
item.languageiso639-1en-
item.openairecristypehttp://purl.org/coar/resource_type/c_18cf-
item.openairetypedoctoralThesis-
item.grantfulltextembargo_20291218-
item.cerifentitytypePublications-
crisitem.author.researchunitISR - Institute of Systems and Robotics-
crisitem.author.parentresearchunitUniversity of Coimbra-
crisitem.author.orcid0000-0001-9255-5772-
crisitem.advisor.researchunitISR - Institute of Systems and Robotics-
crisitem.advisor.parentresearchunitUniversity of Coimbra-
crisitem.advisor.orcid0000-0003-3354-4007-
Appears in Collections:UC - Teses de Doutoramento
Files in This Item:
File SizeFormat Login
UCTese_Jin.pdf26.33 MBAdobe PDFEmbargo Access    Request a copy
Show simple item record

Page view(s)

62
checked on Jul 17, 2024

Download(s)

2
checked on Jul 17, 2024

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons