Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/86752
DC FieldValueLanguage
dc.contributor.advisorAraújo, Helder de Jesus-
dc.contributor.authorRodrigues, Diogo Manuel de Castro-
dc.date.accessioned2019-04-17T22:42:44Z-
dc.date.available2019-04-17T22:42:44Z-
dc.date.issued2018-09-24-
dc.date.submitted2019-04-17-
dc.identifier.urihttps://hdl.handle.net/10316/86752-
dc.descriptionDissertação de Mestrado Integrado em Engenharia Electrotécnica e de Computadores apresentada à Faculdade de Ciências e Tecnologia-
dc.description.abstractNesta dissertação, para criar um exemplo único de um sistema de face para texto e texto para face foi integrado visão por computador e processamento de linguagem natural. O propósito é fornecer uma solução que permita ajudar os seres humanos a realizar funções com maior qualidade e de forma mais rápida. Assim sendo pretende-se criar um sistema que possa ser usado, por exemplo, para descrever rostos para pessoas com deficiência visual ou para gerar rostos a partir de descrições para investigações criminais. No entanto trata-se apenas de uma versão preliminar, na medida em que o curto tempo disponível para a sua realização não permitiu alcançar a ambiciosa proposta. De forma a atingir este objectivo, foi criado um sistema com a capacidade de descrever textualmente imagens faciais e por outro lado, gerar automaticamente imagens faciais a partir de descrições textuais. O sistema é dividido em duas partes, a primeira tem como função prever atributos das imagens faciais através de uma rede neuronal convolucional. Estes são utilizados como base para o modelo de geração de linguagem natural, gerando descrições textuais numa metodologia baseada em regras. A segunda parte, usa uma técnica simples de extração de palavras chave para analisar o texto e identificar os atributos nessa descrição. Seguidamente, o sistema usa uma rede generativa adversarial para gerar uma imagem facial com o conjunto das características desejadas. Os atributos são usados como base no nosso método, uma vez que representam um identificador dominante que transmite características sobre um rosto com eficácia.Os resultados demonstraram, mais uma vez, que os métodos CNN e GAN são atualmente as melhores opções para, tarefas de reconhecimento e geração de imagens, respectivamente. Esta conclusão destá assente nos resultados convincentes. Por outro lado, os métodos de processamento de linguagem natural apesar de terem funcionado bem, de acordo com os objectivos, os seus resultados são menos notáveis, especialmente o modelo de geração de linguagem natural. Este trabalho propõe uma solução fiável e funcional para resolver este sistema complexo, no entanto é uma área que merece uma extensa investigação e desenvolvimento.por
dc.description.abstractIn this dissertation, computer vision and Natural Language Processing (NLP) are integrated to create a unique example of a face-to-text and text-to-face system. Its intention is to provide a solution that can help humans to perform their jobs with better quality and with a quick response. The aim is to create a system that can be used, for example, to describe faces for visually impaired people or to generate faces from descriptions for criminal investigations. However, this is a preliminary version as it is an ambitious goal to be achieved during the time available for its realization.To accomplish this motivation, a system was created with the capability of describing, textually, facial images, along with the ability to automatically generate face images from text descriptions. The system is divided into two sub-systems. The first part predicts attributes from the face images through a Convolutional Neural Network (CNN) method that are used, further, as a base to the Natural Language Generation (NLG) model. The descriptions are generated on a rule-based methodology. The second part of the system uses a simple keyword extraction technique to analyze the text and identify the attributes on that description. After that, it uses a conditional Generative Adversarial Network (GAN) to generate a facial image with a specific set of desired attributes. The reason why attributes are used as a base on the method is because they are a dominant identifier that can efficiently transmit characteristic about a face. The results demonstrate, once again, that either CNN and GAN methods are presently the best options for recognition and generation tasks, respectively. This conclusion is due to their convincing results. On the other hand, the NLP methods worked well for their purposes. However, its results are less remarkable, especially the NLG model. This work proposes a reliable and functional solution for solving this complex system. Nevertheless, this area needs an extensive investigation and development.eng
dc.language.isoeng-
dc.rightsopenAccess-
dc.rights.urihttp://creativecommons.org/licenses/by-sa/4.0/-
dc.subjectInteligência Artificialpor
dc.subjectAprendizagem Profundapor
dc.subjectRede Neuronal Convolucionalpor
dc.subjectRede Adversarial Generativapor
dc.subjectProcessamento de Linguagem Naturalpor
dc.subjectArtificial Intelligenceeng
dc.subjectDeep Learningeng
dc.subjectConvolutional Neural Networkeng
dc.subjectGenerative Adversarial Networkeng
dc.subjectNatural Language Processingeng
dc.titleIntegrating Vision and Language for Automatic Face Descriptionseng
dc.title.alternativeIntegrando Visão e Linguagem para Descrições Faciais Automáticaspor
dc.typemasterThesis-
degois.publication.locationDEEC-
degois.publication.titleIntegrating Vision and Language for Automatic Face Descriptionseng
dc.peerreviewedyes-
dc.identifier.tid202219380-
thesis.degree.disciplineEngenharia Electrotécnica e de Computadores-
thesis.degree.grantorUniversidade de Coimbra-
thesis.degree.level1-
thesis.degree.nameMestrado Integrado em Engenharia Electrotécnica e de Computadores-
uc.degree.grantorUnitFaculdade de Ciências e Tecnologia - Departamento de Eng. Electrotécnica e de Computadores-
uc.degree.grantorID0500-
uc.contributor.authorRodrigues, Diogo Manuel de Castro::0000-0001-6671-8531-
uc.degree.classification17-
uc.degree.presidentejuriBatista, Jorge Manuel Moreira de Campos Pereira-
uc.degree.elementojuriPerdigão, Fernando Manuel dos Santos-
uc.degree.elementojuriAraújo, Hélder de Jesus-
uc.contributor.advisorAraújo, Hélder de Jesus-
uc.controloAutoridadeSim-
item.grantfulltextopen-
item.fulltextCom Texto completo-
item.openairetypemasterThesis-
item.languageiso639-1en-
item.openairecristypehttp://purl.org/coar/resource_type/c_18cf-
item.cerifentitytypePublications-
crisitem.advisor.researchunitISR - Institute of Systems and Robotics-
crisitem.advisor.parentresearchunitUniversity of Coimbra-
crisitem.advisor.orcid0000-0002-9544-424X-
Appears in Collections:UC - Dissertações de Mestrado
Files in This Item:
File Description SizeFormat
Dissertação - Diogo Rodrigues.pdf2.59 MBAdobe PDFView/Open
Show simple item record

Page view(s) 50

409
checked on Apr 23, 2024

Download(s) 50

424
checked on Apr 23, 2024

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons