Please use this identifier to cite or link to this item: http://hdl.handle.net/10316/94339
Title: Reconhecimento Facial - Comparação do Uso de Descritores Geométricos Heurísticos e Aprendizagem Profunda
Other Titles: Facial Recognition - Comparison of the Use of Geometric Heuristic Descriptors and Deep Learning
Authors: Abreu, Viviana Rubina Gonçalves
Orientador: Gonçalves, Nuno Miguel Mendonça da Silva
Keywords: Reconhecimento facial; Descritor de pontos; Pontos salientes da face; Aprendizagem Profunda; Redes convolucionais; Facial recognition; Point descriptor; Facial landmarks; Deep Learning; Convolutional networks
Issue Date: 26-Feb-2021
Serial title, monograph or event: Reconhecimento Facial - Comparação do Uso de Descritores Geométricos Heurísticos e Aprendizagem Profunda
Place of publication or event: DEEC
Abstract: The human face is one of the most used biometric characteristics as a way of identification because it composes a convenient passive and non-intrusive system for verifying personal identity. From the oldest identification documents to the most recent applications applied to mobile devices, its use has become a habit in the daily lives of millions of people, being therefore an area of great interest and the subject of constant evolution. A system based on the biometry of the face refers to the techniques used for extraction, selection and classification of characteristics through human face images. That said, this dissertation aims to study and compare two different techniques, one dedicated to a more traditional approach and the other to a modern perspective linked to pure deep learning, both applied to the context of facial recognition. The first method emerged from the adaptation of an authentication system, created as part of a project developed between the Institute of Systems and Robotics (ISR) of the University of Coimbra with the Portuguese Mint and Official Printing Office, called UniqueMark, where it was developed a mechanism capable of representing a set of points based on individual characteristics or relationships between them, based on global geometric characteristics which, due to the good results obtained, made it interesting to carry out its analysis in other contexts, highlighting the problems of biometrics. This algorithm then consists of a system that receives as input a set of keypoints belonging to certain structured dispersions obtained by detecting the facial landmarks of frontal images of faces, which through the study of heuristic geometric relationships between the detected points returns a histogram with information analyzed between the different points belonging to the same pattern. This histogram is later used in the validation process using the KNN and SVM classifiers. Following the current trends, the second method under study focuses on an approach associated with deep learning, which uses artificial neural networks, more specifically convolutional networks, in which the deep layers of the complex networks function as extractors of sets of characteristics, therefore having the ability to learn directly from the input images. Motivated by low computational complexity, were made attempts to optimize the network architecture chosen for this purpose, MobieleNetV2, through analysis of the trade-off between the number of features and the architecture width, as well as different loss functions (Softmax, CosFace, Sphereface and ArcFace). Therefore, the objective of this dissertation is to understand the drawbacks of the most classic methods in facial recognition, moving to a more recent approach that includes the testing and optimization of models, with special attention to the consumption of computational resources.
A face humana é uma das características biométricas mais utilizadas como forma de identificação por constituir um sistema passivo e não intrusivo, conveniente para verificação de identidade pessoal. Desde os mais antigos documentos de identificação às mais recentes aplicações interligadas com dispositivos móveis, a sua utilização tornou-se um hábito no quotidiano de milhões de pessoas, sendo por isso uma área de grande interesse e alvo de constante evolução. Um sistema baseado na biometria da face refere-se a técnicas utilizadas para extracção, selecção e classificação de características obtidas através de imagens de faces humanas. Posto isto, esta dissertação tem como objectivo o estudo e comparação de duas técnicas distintas, sendo uma dedicada a uma abordagem mais tradicional e outra a uma perspectiva mais moderna ligada à aprendizagem profunda, ambas aplicadas ao contexto de reconhecimento facial. O primeiro método surgiu da adaptação de um sistema de autenticação, criado no âmbito de um projecto desenvolvido pelo Instituto de Sistemas e Robótica (ISR) da Universidade de Coimbra juntamente com a Imprensa Nacional-Casa da Moeda (INCM), o UniqueMark, onde foi desenvolvido um mecanismo capaz de representar um conjunto de pontos a partir de características individuais ou relações entre eles, baseado em características geométricas globais que devido aos bons resultados obtidos tornou interessante fazer a sua análise noutros contextos, destacando-se os problemas de biometria. Este algoritmo consiste num sistema que recebe como entrada os pontos pertencentes a dispersões estruturadas obtidas por meio da detecção dos pontos salientes da face de imagens frontais, que através do estudo das relações geométricas heurísticas entre os pontos detectados devolve um histograma com as informações resultantes da análise dos diversos pontos pertencentes ao mesmo padrão. Este histograma é posteriormente utilizado no processo de validação com recurso aos classificadores KNN e SVM.Seguindo as tendências actuais, o segundo método sob estudo foca-se numa abordagem ligada à aprendizagem profunda que recorre à utilização de redes neuronais artificiais, mais especificamente redes convolucionais, em que as camadas profundas das redes complexas funcionam como extractores de conjuntos de características, possuindo por isso a capacidade de aprender directamente a partir das imagens de entrada. Tendo como motivação o baixo consumo computacional foram feitas tentativas de optimizações da arquitectura de rede escolhida para o efeito, MobieleNetV2, através da análise da relação de compromisso entre o número de \textit{features} e a arquitectura, assim como de diferentes funções de perda (Softmax, CosFace, Sphereface e ArcFace).Assim sendo, o propósito desta dissertação visa compreender as inconvenientes dos métodos mais clássicos em reconhecimento facial, passando para uma abordagem mais recente que inclui a testagem e optimização de modelos, com especial atenção ao consumo de recursos computacionais.
Description: Dissertação de Mestrado Integrado em Engenharia Electrotécnica e de Computadores apresentada à Faculdade de Ciências e Tecnologia
URI: http://hdl.handle.net/10316/94339
Rights: openAccess
Appears in Collections:UC - Dissertações de Mestrado

Files in This Item:
File Description SizeFormat
Dissertação_VivianaAbreu.pdf6.12 MBAdobe PDFView/Open
Show full item record

Page view(s)

138
checked on Aug 10, 2022

Download(s)

239
checked on Aug 10, 2022

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons