Coevolutionary Generative Adversarial Networks

Costa, Victor Franco

Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/114502

Title:	Coevolutionary Generative Adversarial Networks
Other Titles:	Co-Evolução de Redes Neuronais Generativas
Authors:	Costa, Victor Franco
Orientador:	Machado, Fernando Jorge Penousal Martins Correia, João Nuno Gonçalves Costa Cavaleiro Lourenço, Nuno António Marques
Keywords:	NeuroEvolução; Redes Neuronais Generativas; Aprendizagem Máquina; Co-Evolução; Computação Evolucionária; Evolutionary Computation; Generative Adversarial Network; Co-Evolution; Machine Learning; NeuroEvolution
Issue Date:	8-May-2023
Serial title, monograph or event:	Coevolutionary Generative Adversarial Networks
Place of publication or event:	DEI-FCTUC
Abstract:	Generative Adversarial Networks (GANs) became a hot topic, presenting impressive results in the field of generative Machine Learning (ML). The GAN model consists of two neural networks that are trained simultaneously as adversaries. Research has been conducted to improve the GAN model, but there are still open challenges, such as the training stability and the necessity to manually design the architectures.Evolutionary Algorithms (EAs) are a family of algorithms inspired by biological evolution, simulating the evolutionary mechanism found in nature. These algorithms are designed to use selective pressure to discover solutions for problems. In coevolution, more than one species are evolved simultaneously in a competitive or cooperative environment. The application of EAs in the evolution of neural networks is called neuroevolution, which can be used to automatically design the network architectures.Our main goal is to propose EAs that approximate ML and Evolutionary Computation (EC), developing a method that combines neuroevolution and coevolution in the coordination of the GAN training process. We hypothesize that using EAs to drive the training of GAN can improve the stability and provide the discovery of efficient network architectures. Therefore, new models are proposed in the context of this thesis. Our first contribution is a novel method called Coevolutionary Generative Adversarial Networks (COEGAN). This model combines neuroevolution and coevolution to guide the training of GANs and to discover efficient architectures. COEGAN is evaluated in different scenarios, using datasets commonly adopted to assess the performance of GANs and compared with other GAN proposals. We design a set of experiments to test our hypothesis by exploring the capacity of the model to improve the training stability and the automatic discovery of efficient network architectures. The results show that our models can overcome common issues in GANs and also outperform other non-evolutionary approaches.COEGAN was also improved with new mechanisms not only related to EAs but also concerning advances developed for GANs. Experimental results suggest that these proposals leverage the outcome quality, approximating the results with state-of-the-art proposals. An evaluation method is also designed for simultaneous visualization and quantification of the results. When applied to COEGAN and its variations, we demonstrate the evolutionary aspects of the model and the ability to avoid issues such as mode collapse. The results of this research are important to provide a robust solution to train GANs, with stable training and automatic discovery of network architectures, showing the potential of the application of EAs in GANs. With a stable solution, a broader range of applications can be explored without the cost of manual intervention in the design process of GANs. Redes Generativas Adversárias (RGA) tornaram-se um tema relevante, apresentando resultados impressionantes no campo dos modelos generativos de aprendizado de máquina (AM). O modelo RGA consiste em duas redes neuronais que são treinadas simultaneamente como adversárias. Pesquisas foram realizadas para melhorar as RGA, mas ainda existem desafios em aberto, como a estabilidade do treinamento e a necessidade de projetar manualmente as arquiteturas.Algoritmos Evolucionários (AE) são uma família de algoritmos inspirados na evolução biológica, simulando o mecanismo evolutivo encontrado na natureza. Esses algoritmos são projetados para usar pressão seletiva para descobrir soluções para problemas. Na coevolução, mais de uma espécie evolui simultaneamente em um ambiente competitivo ou cooperativo. A aplicação de AE na evolução das redes neuronais é chamada de neuroevolução, pondendo ser usada para projetar automaticamente as arquiteturas das redes.Nosso principal objetivo é propor AE que aproximem AM e Computação Evolutiva (CE), desenvolvendo um método que combine neuroevolução e coevolução na coordenação do processo de treinamento das RGA. Nossa hipótese é que o uso de AE para conduzir o treinamento das RGA pode melhorar a estabilidade e proporcionar a descoberta de arquiteturas de rede eficientes. Deste modo, novos modelos são propostos no contexto desta tese. Nossa primeira contribuição é um novo método chamado COEGAN (Redes Generativas Adversárias Coevolucionárias). Este modelo combina neuroevolução e coevolução para coordenar o treinamento das RGA e descobrir arquiteturas eficientes. COEGAN foi avaliado em diferentes cenários, usando conjuntos de dados comumente adotados para avaliar o desempenho das RGA e comparando com outras propostas. Experimentos foram projetados para testar a hipótese deste trabalho de modo a explorar a capacidade do modelo de melhorar a estabilidade do treinamento e a descoberta automática de arquiteturas de rede eficientes. Os resultados mostram que nossos modelos podem evitar problemas comuns em RGA e também superar outras abordagens não evolutivas.O COEGAN também foi aprimorado com novos mecanismos relacionados tanto ao AE quanto aos avanços desenvolvidos para RGA. Os resultados experimentais sugerem que essas melhorias alavancam a qualidade dos resultados, aproximando-os do estado da arte. Um método de avaliação foi proposto para promover a visualização e quantificação simultânea dos resultados. Quando aplicado ao COEGAN e suas variações, demonstramos os aspectos evolutivos do modelo e a capacidade de evitar problemas. Os resultados desta tese são importantes para fornecer uma solução robusta para treinar RGA, com treinamento estável e descoberta automática de arquiteturas de rede, mostrando o potencial da aplicação de AE em RGA. Com uma solução estável, uma gama mais ampla de aplicações pode ser explorada sem o custo de intervenção manual no processo de criação das RGA.
Description:	Tese de Programa de Doutoramento em Ciências e Tecnologias da Informação apresentada à Faculdade de Ciências e Tecnologia
URI:	https://hdl.handle.net/10316/114502
Rights:	openAccess
Appears in Collections:	UC - Teses de Doutoramento