Enrichment of virtual screening results using induced-fit techniques

Author

Iglesias Fernández, Jelisa Maria

Director

Guallar Tasies, Victor

Codirector

Estrada Collado, Jorge

Date of defense

2020-01-16

Pages

167 p.



Department/Institute

Universitat Politècnica de Catalunya. Departament d'Enginyeria de Sistemes, Automàtica i Informàtica Industrial

Abstract

This thesis explains the design, development, test on the benchmarking dataset DUD-e and the application to an industrial virtual screening project of the PELE VS platform. The most common and quick tools used on virtual screening campaigns do not take into account the induced-fit effect, although there are some methodologies capable of reproducing this effect they are either time consuming or very limited on which transformations the protein may undergo. In this thesis with the development of the PELE VS platform we aim at using the simulation software PELE (Protein Energy Landscape Exploration) to account for the induced-fit effect. The PELE software uses a monte carlo algorithm coupled with an energy minimization step to explore the ligand conformations and model the protein. This approach allows the program to account for both big conformational changes and small local changes of the protein and to perform a good conformational search of the ligand, which coupled can account for the induced-fit effect with only a quick simulation. PELE has been traditionally, and successfully, used in the enzyme engineering field where only a few compounds per protein are usually tested and studied. In order to apply the program to the virtual screening field, where thousands of compounds are tested in silico, the first step was to automatize the whole procedure of preparing, launching and analyzing the simulations. Thus, during this thesis the PELE VS platform has been developed altogether with other auxiliary tools. Once the platform was developed, we wanted to test the behaviour of PELE on a well known benchmarking dataset, thus we tried our methodology on the DUD-e dataset. Since this dataset is formed by more than 100 proteins, we chose a few proteins for each of the families present in the dataset, reducing the number of proteins to 21 systems. Then, we tried to use a general protocol for all the chosen proteins in order to improve the results of currently used scoring functions in the field. After studying the simulations and trying several protocols on this subset we we observed that every protein (or at least family) that we want to study needs an specific simulation protocol in order to correctly reproduce the induced-fit effect and improve the results of the most used scoring function: glide from schrodinger. Finally we applied the platform and our previous hypothesis to an industrial virtual screening campaign, as part of the collaborative Retos project: Silicoderm. In this case we worked with only one protein and several compounds and we confirmed the need for a tailored simulation protocol for the receptor in order to improve results.


Esta tesis explica el diseño, desarrollo, testeo en el dataset de referencia DUD-e y la aplicación en un proyecto industrial de cribado virtual de la plataforma PELE VS. Las herramientas más rápidas usadas en campañas de cribado virtual no tienen en cuenta el efecto de ajuste inducido, y aunque hay metodologías capaces de reproducir este efecto o bien requieren de mucho tiempo de computación o son muy limitadas en cuanto a qué transformaciones pueden realizar.sobre la proteina. El objetivo de esta tesis es que gracias al desarrollo de la plataforma PELE VS podamos aplicar el programa de simulación PELE (Protein Energy Landscape Exploration) para reproducir el efecto del ajuste inducido. El programa de simulación PELE utiliza una combinación de un algoritmo de monte y una minimización energética para modelar la proteína. Esta aproximación nos permite realizar tanto grandes cambios conformacionales como pequeños ajustes locales de la proteina, a la vez que nos proporciona un buen muestreo conformacional del ligando. Esta combinación nos permite reproducir el efecto del ajuste inducido con una rápida simulación. Tradicionalmente PELE ha sido usado con éxito en el campo de la ingeniería de enzimas donde solo unos pocos compuestos por proteina son estudiados y probados. Para poder aplicar el programa al campo del cribado virtual, donde miles de compuestos son testeados in silico, el primer paso ha realizar es la automatización de todo el proceso de preparación, lanzamiento y análisis de las simulaciones. Es por eso que durante el transcurso de esta tesis la plataforma PELE VS ha sido desarrollada, junto con otros programas auxiliares. Una vez desarrollada la plataforma, quisimos comprobar el compportamiento de PELE en un conocido datase the referencia, así que lo probamos en el dataset DUD-e. Dado que este dataset contiene más de 100 proteinas, seleccionamos solo unas pocas proteinas de cada una de las familias que forman el dataset, reduciendo el numero de proteínas a 21 receptors. A continuación, probamos un protocolo de simulación genérico sobre los receptores seleccionados con el objetivo de mejorar los resultados de funciones de puntuacións utilizadas actualmente en el campo. Después de estudiar las simulaciones y probar diferentes protocolos de simulaciones en el subset seleccionado, concluimos que cada proteina (o al menos familia de proteínas) que deseemos estudiar requiere de un protocolo de simulación específico para porder reproducir correctamente el efecto del ajuste inducido y así mejorar los resultados de la función de puntuación más usada:: glide de Schrodinger. Finalmente, aplicamos la plataformar y nuestra hipóstesis previa a una campaña industrial de cribado virtual, como parte del proyecto RETOS colaborativo: SilicoDerm. En este caso trabajamos solo son una proteína y diversos compuestos. Durante esta apliación pudimos confirmar la necesidad de un protocolo de simulación adaptado al receptor que se quiere estudiar, para así poder mejorar los resultados de las metodologías actuales.

Subjects

615 - Pharmacology. Therapeutics. Toxicology; 68 - Industries, crafts and trades for finished or assembled articles

Knowledge Area

Àrees temàtiques de la UPC::Enginyeria biomèdica

Documents

TJMIF1d1.pdf

9.951Mb

 

Rights

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-sa/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-sa/4.0/

This item appears in the following Collection(s)