Human Emotion Recognition Through Speech Analysis on Convolutional Neural Networks

Assunção, Gustavo Miguel Santos

Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/87965

DC Field	Value	Language
dc.contributor.advisor	Perdigão, Fernando Manuel dos Santos	-
dc.contributor.advisor	Menezes, Paulo Jorge Carvalho	-
dc.contributor.author	Assunção, Gustavo Miguel Santos	-
dc.date.accessioned	2019-11-18T23:30:06Z	-
dc.date.available	2019-11-18T23:30:06Z	-
dc.date.issued	2019-06-05	-
dc.date.submitted	2019-11-18	-
dc.identifier.uri	https://hdl.handle.net/10316/87965	-
dc.description	Dissertação de Mestrado Integrado em Engenharia Electrotécnica e de Computadores apresentada à Faculdade de Ciências e Tecnologia	-
dc.description.abstract	A noção de reconhecer emoções humanas tem, recentemente, vindo a receber considerável atenção por parte da comunidade científica, devido às suas variadas aplicações forenses e potencial melhoramento de sistemas interactivos. Assim sendo, e seguindo a actual tendência de investigação, bastantes modelos de machine learning têm sido propostos com foco na questão de reconhecimento de emoções na fala (SER), o conceito de classificar o estado emocional de uma pessoa com base na análise da sua fala. Estes modelos já deveras ultrapassaram a performance de outras técnicas clássicas a eles precedentes. Não obstante, mesmo os modelos com mais sucesso incorporam um certo nível de défice em relação à adaptação a locutores e cenários específicos, fazendo com que sejam incapazes de atingir os padrões de performance real humana. Nesta dissertação, um modelo de machine learning de grande escala é avaliado para classificação de estados emocionais. Este modelo foi treinado para identificação de locutor mas é, ao invés, aqui usado como uma componente basilar para a extracção de características robustas de fala emocional. A hipótese aqui proposta é que a adaptação à prosódia emocional de um locutor pode seriamente melhorar a precisão de sistemas SER. Diversas experiências foram feitas usando vários classificadores de estado-da-arte, com recurso ao software Weka, de vista a avaliar a robustez das características extraídas. Foram observados melhoramentos consideráveis quando comparados os resultados obtidos com outras técnicas de SER de estado-da-arte, demonstrando então a importância de adaptação ao locutor nesta matéria.	por
dc.description.abstract	The idea of recognizing human emotion has recently received considerable attention from the research community, due to its many possible forensic applications and potential boosting of interactive systems. As such, and following the current trend of research, many machine learning models have been proposed addressing the interesting topic of speech emotion recognition (SER), the idea of classifying a person's emotional state based on speech analysis. These models have far surpassed the performance of previous classical techniques. Nevertheless, even the most successful methods are still rather lacking in terms of adaptation to specific speakers and scenarios, which causes them to be incapable of meeting real human performance standards. In this dissertation, a large scale machine learning model for classification of emotional states is evaluated. This model has previously been trained for speaker identification but is instead used here as a front-end for extracting robust features from emotional speech. The proposed hypothesis is that adaptation to a speaker's emotional prosody can greatly improve the accuracy of a SER system. Several experiments using various state-of-the-art classifiers were carried out, using the Weka software, in order to evaluate the robustness of the extracted features. Considerable improvement was observed when comparing the obtained results with other SER state-of-the-art techniques, which demonstrates the importance of speaker adaptation in this matter.	eng
dc.language.iso	eng	-
dc.rights	openAccess	-
dc.rights.uri	http://creativecommons.org/licenses/by/4.0/	-
dc.subject	reconhecimento de emoções na fala	por
dc.subject	CNN	por
dc.subject	VGG	por
dc.subject	processamento de sinal	por
dc.subject	machine learning	por
dc.subject	speech emotion recognition	eng
dc.subject	CNN	eng
dc.subject	VGG	eng
dc.subject	signal processing	eng
dc.subject	machine learning	eng
dc.title	Human Emotion Recognition Through Speech Analysis on Convolutional Neural Networks	eng
dc.title.alternative	Reconhecimento de Emoções Humanas por Análise da Fala em Redes Neuronais Convolucionais	por
dc.type	masterThesis	-
degois.publication.location	Instituto de Sistemas e Robótica, DEEC	-
degois.publication.title	Human Emotion Recognition Through Speech Analysis on Convolutional Neural Networks	eng
dc.peerreviewed	yes	-
dc.identifier.tid	202306194	-
thesis.degree.discipline	Engenharia Electrotécnica e de Computadores	-
thesis.degree.grantor	Universidade de Coimbra	-
thesis.degree.level	1	-
thesis.degree.name	Mestrado Integrado em Engenharia Electrotécnica e de Computadores	-
uc.degree.grantorUnit	Faculdade de Ciências e Tecnologia - Departamento de Eng. Electrotécnica e de Computadores	-
uc.degree.grantorID	0500	-
uc.contributor.author	Assunção, Gustavo Miguel Santos::0000-0003-4015-4111	-
uc.degree.classification	19	-
uc.degree.presidentejuri	Batista, Jorge Manuel Moreira de Campos Pereira	-
uc.degree.elementojuri	Menezes, Paulo Jorge Carvalho	-
uc.degree.elementojuri	Peixoto, Paulo José Monteiro	-
uc.contributor.advisor	Perdigão, Fernando Manuel dos Santos	-
uc.contributor.advisor	Menezes, Paulo Jorge Carvalho	-
item.openairecristype	http://purl.org/coar/resource_type/c_18cf	-
item.openairetype	masterThesis	-
item.cerifentitytype	Publications	-
item.grantfulltext	open	-
item.fulltext	Com Texto completo	-
item.languageiso639-1	en	-
crisitem.advisor.dept	Faculty of Sciences and Technology	-
crisitem.advisor.parentdept	University of Coimbra	-
crisitem.advisor.researchunit	IT - Institute of Telecommunications	-
crisitem.advisor.researchunit	ISR - Institute of Systems and Robotics	-
crisitem.advisor.parentresearchunit	University of Coimbra	-
crisitem.advisor.orcid	0000-0002-8980-1992	-
crisitem.advisor.orcid	0000-0002-4903-3554	-
Appears in Collections:	UC - Dissertações de Mestrado

Files in This Item:

File	Description	Size	Format
dissertacao_Gustavo_Assunção.pdf		2.83 MB	Adobe PDF	View/Open

Show simple item record

Page view(s)

219

checked on Apr 16, 2024

Download(s)

259

checked on Apr 16, 2024

Google Scholar^TM

Check

This item is licensed under a Creative Commons License

Files in This Item:

Page view(s)

Download(s)

Google ScholarTM

Google Scholar^TM