Drug Discovery with Generative Adversarial Networks

Santos, Beatriz de Jesus Pereira

Utilize este identificador para referenciar este registo: https://hdl.handle.net/10316/96096

Campo DC	Valor	Idioma
dc.contributor.advisor	Ribeiro, Bernardete Martins	-
dc.contributor.advisor	Arrais, Joel Perdiz	-
dc.contributor.author	Santos, Beatriz de Jesus Pereira	-
dc.date.accessioned	2021-10-25T22:03:38Z	-
dc.date.available	2021-10-25T22:03:38Z	-
dc.date.issued	2021-09-16	-
dc.date.submitted	2021-10-25	-
dc.identifier.uri	https://hdl.handle.net/10316/96096	-
dc.description	Dissertação de Mestrado Integrado em Engenharia Biomédica apresentada à Faculdade de Ciências e Tecnologia	-
dc.description.abstract	A descoberta de novos fármacos é um processo extremamente demorado, complexo, dispendioso e que apresenta taxas de sucesso muito baixas que podem ser atribuídas à elevada dimensionalidade do espaço químico. Estudar e avaliar o espaço químico de forma integral é simplesmente imprativável pelo que é importante encontrar novas formas de restringir o espaço de pesquisa. A utilização de algoritmos de Deep Learning tem surgido como uma possível solução para mitigar os problemas acima mencionados já que diminuem consideravelmente o tempo dispendido e, por conseguinte, as despesas associadas a todo o processo. As redes neuronais recorrentes (RNNs) e adversariais generativas (GANs) encontram-se entre os métodos mais promissores no que se refere à geração de novos potenciais fármacos.O trabalho desenvolvido deu origem a duas contribuições independentes. Foi efetuado um estudo extensivo das arquiteturas e parâmetros associados às redes recorrentes do qual resultou um modelo otimizado capaz de gerar até 98.7% de moléculas válidas mantendo elevados níveis de diversidade.Este estudo permitiu ainda demonstrar que a informação estereoquímica, que é de extrema importância no desenvolvimento de fármacos mas frequentemente ignorada, pode ser incluída nestes modelos computacionais com elevado sucesso.Para além disso, foi desenvolvida uma estratégia baseada em GANs que inclui uma componente de otimização. Este método é composto por duas técnicas de Deep Learning: um modelo Encoder-Decoder responsável por converter as moléculas em vetores do espaço latente, criando, desta forma, um novo tipo de representação molecular; e uma GAN com a capacidade de aprender e replicar a distribuição dos dados de treino para, posteriormente, gerar novos compostos. De modo a gerar moléculas otimizadas para uma determinada característica, a GAN treinada é conectada a um mecanismo de feedback que avalia as moléculas geradas a cada época e substitui os compostos do conjunto de treino que apresentam menor pontuação pelas novas moléculas com propriedades mais desejáveis. Desta forma, a distribuição dos compostos gerados vai-se aproximando sucessivamente do espaço químico de interesse, o que resulta na geração de um maior número de moléculas relevantes para o problema em estudo.	por
dc.description.abstract	Drug discovery is a highly time-consuming, complex, and expensive process with low rates of success that can be mainly attributed to the high dimensionality of the chemical space. Evaluating the entire chemical space is prohibitively expensive, so it is of the utmost importance to find ways of narrowing down the search space. Deep Learning algorithms are emerging as a potential method to generate novel chemical structures since they can speed up the traditional process and decrease expenditure.Recurrent Neural networks (RNNs) and Generative Adversarial Networks (GANs) are two of the most promising methods for generating drug-like molecules from scratch.The proposed work resulted in two independent contributions. A comprehensive study on RNNs' architectures and parameters that resulted in an optimized model capable of generating up to 98.7% of valid non-specific drug-like molecules while maintaining high levels of diversity. This work also proved that stereo-chemical information, often overlooked in most works, can be successfully incorporated and learned by these models.Furthermore, a novel GAN-based framework that includes an optimization stage was developed. This approach incorporates two deep learning techniques: an Encoder-Decoder model that converts the string notations of molecules into latent space vectors, effectively creating a new type of molecular representation, and a GAN that is able to learn and replicate the training data distribution and, therefore, generate new compounds. In order to generate compounds with bespoken properties and once the GAN is replicating the chemical space, a feedback loop is incorporated that evaluates the generated molecules according to the desired property at every epoch of training and replaces the worst scoring entries in the training data by the best scoring generated molecules. This ensures a slow but steady shift of the generated distribution towards the space of the targeted property resulting in the generation of molecules that exhibit the desired characteristics.	eng
dc.description.sponsorship	Outro - This research has been funded by the Portuguese Research Agency FCT, through D4 - Deep Drug Discovery and Deployment (CENTRO-01-0145-FEDER029266). This work is funded by national funds through the FCT - Foundation for Science and Technology, I.P., within the scope of the project CISUC - UID/CEC/00326/2020 and by European Social Fund, through the Regional Operational Program Centro 2020.	-
dc.language.iso	eng	-
dc.rights	embargoedAccess	-
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/	-
dc.subject	Deep Learning	por
dc.subject	Geração de Novos Fármacos	por
dc.subject	Generative Adversarial Networks	por
dc.subject	Recurrent Neural Networks	por
dc.subject	SMILES	por
dc.subject	Deep Learning	eng
dc.subject	Drug Design	eng
dc.subject	Generative Adversarial Networks	eng
dc.subject	Recurrent Neural Networks	eng
dc.subject	SMILES	eng
dc.title	Drug Discovery with Generative Adversarial Networks	eng
dc.title.alternative	Drug Discovery with Generative Adversarial Networks	por
dc.type	masterThesis	-
degois.publication.location	CISUC	-
degois.publication.title	Drug Discovery with Generative Adversarial Networks	eng
dc.date.embargoEndDate	2023-09-16	-
dc.peerreviewed	yes	-
dc.date.embargo	2023-09-16	*
dc.identifier.tid	202778657	-
thesis.degree.discipline	Engenharia Biomédica	-
thesis.degree.grantor	Universidade de Coimbra	-
thesis.degree.level	1	-
thesis.degree.name	Mestrado Integrado em Engenharia Biomédica	-
uc.degree.grantorUnit	Faculdade de Ciências e Tecnologia - Departamento de Física	-
uc.degree.grantorID	0500	-
uc.justificaEmbargo	Publicação em curso.	-
uc.contributor.author	Santos, Beatriz de Jesus Pereira::0000-0002-7986-8421	-
uc.degree.classification	20	-
uc.date.periodoEmbargo	730	-
uc.degree.presidentejuri	Silvestre, Maria João Pedrosa Ferreira Moreno	-
uc.degree.elementojuri	Arrais, Joel Perdiz	-
uc.degree.elementojuri	Matos, Sérgio Guilherme Aleixo de	-
uc.contributor.advisor	Ribeiro, Bernardete Martins::0000-0002-9770-7672	-
uc.contributor.advisor	Arrais, Joel Perdiz	-
item.openairetype	masterThesis	-
item.fulltext	Com Texto completo	-
item.languageiso639-1	en	-
item.grantfulltext	open	-
item.cerifentitytype	Publications	-
item.openairecristype	http://purl.org/coar/resource_type/c_18cf	-
Aparece nas coleções:	UC - Dissertações de Mestrado

Ficheiros deste registo:

Ficheiro	Descrição	Tamanho	Formato
2021_Thesis_MSc_BeatrizSantos.pdf		10.06 MB	Adobe PDF	Ver/Abrir

Mostrar registo em formato simples

Visualizações de página

164

Visto em 16/jul/2024

Downloads

33

Visto em 16/jul/2024

Google Scholar^TM

Verificar

Este registo está protegido por Licença Creative Commons

Ficheiros deste registo:

Visualizações de página

Downloads

Google ScholarTM

Google Scholar^TM