Machine learning in structural biology and chemoinformatics : Driving drug discovery one epoch at a time

Author

Jiménez Luna, José

Director

De Fabritiis, Gianni

Date of defense

2019-10-24

Pages

188 p.



Department/Institute

Universitat Pompeu Fabra. Departament de Ciències Experimentals i de la Salut

Doctorate programs

Programa de doctorat en Biomedicina

Abstract

Deep learning approaches have become increasingly popular in the last years thanks to their state-of the-art performance in fields such as computer vision and natural language understanding. The first goal of this thesis was to adapt such approaches, and particularly those used in image recognition, to the domains of structural biology and chemoinformatics. We do so by the development of a novel three-dimensional biomolecular representation that can be used in conjunction with 3D-convolutional neural networks for a variety of tasks. We test the applicability of such methods in several relevant problems in the early drug discovery pipeline, such as protein binding site prediction, protein-ligand binding affinity prediction, drug selectivity elucidation and molecular generative models. The second goal of this thesis was to facilitate the use and accessibility of such tools by their implementation and deployment in an easy-to-use web application.


Els mètodes d’aprenentatge profund han guanyat molta popularitat en els últims anys gràcies al seu rendiment en camps com la visió per ordinador o l’aprenentatge del llenguatge natural. El primer objectiu de la tesi va ser adaptar aquests mètodes, particularment els utilitzats en el reconeixement d’imatges, als camps de la biologia estructural i la quimioinformàtica. L’adaptació s’ha fet mitjançant el desenvolupament d’una representació biomolecular tridimensional que pot ser utilitzada en conjunt amb xarxes neuronals convolucionals tridimensionals en diverses tasques. Hem testat l’aplicabilitat d’aquests mètodes en varis problemes rellevants per als primers estadis de desenvolupament de drogues, com la predicció de la zona d’unió de proteïnes, l’afinitat d’unió entre proteïna i lligand, la elucidació de selectivitat de drogues i models generatius de molècules. El segon objectiu de la tesi ha sigut el facilitar la utilització i l’accessibilitat d’aquestes eines mitjançant la seva implementació i desplegament en una aplicació web de fàcil ús.

Keywords

Machine-learning; Structural-biology; Chemioinformatics; Artificial-intelligence; Aprenentatge automàtic; Biologia-estructural; Quimioinformàtica; Intel.ligència artificial

Subjects

615 - Pharmacology. Therapeutics. Toxicology

Documents

tjjl.pdf

7.974Mb

 

Rights

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-sa/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-sa/4.0/

This item appears in the following Collection(s)