Universitat de Barcelona. Facultat de Farmàcia i Ciències de l'Alimentació
The study of the 3D structural details of protein interactions is essential to understand biomolecular functions at the molecular level. In this context, the limited availability of experimental structures of protein-protein complexes at atomic resolution is propelling the development of computational docking methods that aim to complement the current structural coverage of protein interactions. One of these docking approaches is pyDock, which uses van der Waals, electrostatics, and desolvation energy to score docking poses generated by a variety of sampling methods, typically FTDock or ZDOCK. The method has shown a consistently good prediction performance in community-wide assessment experiments like CAPRI or CASP, and has provided biological insights and insightful interpretation of experiments by modeling many biomolecular interactions of biomedical and biotechnological interest. Here, we describe our approach using pyDock for the structural modeling of protein assemblies and the application of its modules to different biomolecular recognition phenomena, such as modeling of binding mode, interface, and hot-spot prediction, use of restraints based on experimental data, the inclusion of low-resolution structural data, binding affinity estimation, or modeling of homo- and hetero-oligomeric assemblies. The integration of template-based and ab initio docking approaches is emerging as the optimal strategy for modeling protein complexes and multi-molecular assemblies. We will review the new methodological advances on ab initio docking and integrative modeling. The seventh CAPRI edition imposed new challenges to the modeling of protein-protein complexes, such as multimeric oligomerization, protein-peptide, and protein-oligosaccharide interactions. Many of the proposed targets needed the efficient integration of rigid-body docking, template-based modeling, flexible optimization, multi-parametric scoring, and experimental restraints. This was especially relevant for the multi-molecular assemblies proposed in the CASP13-CAPRI46 joint rounds. We will present the results for the 7th CAPRI edition and CAPRI Round 46, the third joint CASP-CAPRI protein assembly prediction challenge. One of the known potential effects of disease-causing amino acid substitutions in proteins is to modulate protein-protein interactions (PPIs). To interpret such variants at the molecular level and to obtain useful information for prediction purposes, it is important to determine whether they are located at protein-protein interfaces, which are composed of two main regions, core and rim, with different evolutionary conservation and physicochemical properties. Here we have performed a structural, energetics and computational analysis of interactions between proteins hosting mutations related to diseases detected in newborn screening. Interface residues were classified as core or rim, showing that the core residues contribute the most to the binding free energy of the PPI. Disease-causing variants are more likely to occur at the interface core region rather than at the interface rim (p < 0.0001). In contrast, neutral variants are more often found at the interface rim or at the non-interacting surface rather than at the interface core region. We also found that arginine, tryptophan, and tyrosine are over-represented among mutated residues leading to disease. These results can enhance our understanding of disease at the molecular level and thus contribute towards personalized medicine by helping clinicians to provide adequate diagnosis and treatments. The phenotypic effects of non-synonymous genetic variations leading or predisposing to disease can be rationalized on the basis of the functional and structural impact in the mutated protein, including the perturbation of the interaction network and molecular pathways in which such protein is involved. Therefore, understanding these effects at the molecular level is essential to build accurate disease models and to achieve higher precision in diagnosis and therapeutic intervention. In this context, we can computationally characterize the effect of pathological mutations on specific protein-protein interactions ("edgetic"), based on their protein structure, if available, or on docking models. Protein-protein interactions that are clearly stabilized or destabilized by these mutations can be potential targets for therapeutic intervention. We have analyzed the predicted energetical effect of mutations on PPIs by applying a variety of computing methods to model the mutation and compute the change in binding affinity (FoldX, mCSM, pyDock combined to SCWRL3). We validate the predictive energetical impact through experimental mutations contained in SKEMPI 2.0 and apply these approaches in pathological and neutral single amino acid variants (SAVs) afterward (from ClinVar/Humsavar and gnomAD). Based on this, we have identified pathological mutations that clearly affect the analyzed interactions by stabilizing or destabilizing them. As discussed above, protein-protein interactions are important for biological processes and pathological situations and are attractive targets for drug discovery. However, rational drug design targeting protein-protein interactions is still highly challenging. Hot-spot residues are seen as the best option to target such interactions, but their identification requires detailed structural and energetic characterization, which is only available for a tiny fraction of protein interactions. This thesis covers a variety of computational methods that have been reported for the energetic analysis of protein-protein interfaces in search of hot-spots, and the structural modeling of protein-protein complexes by docking. This can help to rationalize the discovery of small-molecule inhibitors of protein-protein interfaces of therapeutic interest. Computational analysis and docking can help to locate the interface, molecular dynamics can be used to find suitable cavities, and hot-spot predictions can focus the search for inhibitors of protein-protein interactions. A major difficulty for applying rational drug design methods to protein-protein interactions is that in the majority of cases the complex structure is not available. Fortunately, computational docking can complement experimental data. An interesting aspect to explore in the future is the integration of these strategies for targeting PPIs with large-scale mutational analysis.
El estudio de los detalles estructurales en 3D de las interacciones de proteínas es esencial para comprender las funciones biomoleculares a nivel molecular. En este contexto, la disponibilidad limitada de estructuras experimentales de complejos proteína-proteína en resolución atómica está impulsando el desarrollo de métodos de acoplamiento computacional que apuntan a complementar la cobertura estructural actual de interacciones de proteínas. Uno de estos enfoques de acoplamiento es pyDock, que utiliza van der Waals, electrostática y energía de desolvatación para puntuar las poses de acoplamiento generadas por una variedad de métodos de muestreo, generalmente FTDock o ZDOCK. El método ha demostrado un rendimiento de predicción consistentemente bueno en experimentos de evaluación de toda la comunidad como CAPRI o CASP, y ha proporcionado conocimientos biológicos e interpretación profunda de experimentos al modelar muchas interacciones biomoleculares de interés biomédico y biotecnológico. Aquí, describimos nuestro enfoque utilizando pyDock para el modelado estructural de ensamblajes de proteínas y la aplicación de sus módulos a diferentes fenómenos de reconocimiento biomolecular, como el modelado del modo de unión, la interfície y la predicción de puntos calientes, el uso de restricciones basadas en datos experimentales, la inclusión de datos estructurales de baja resolución, estimación de afinidad de unión o modelado de ensamblajes homo- y hetero- oligoméricos. La integración de enfoques de acoplamiento ab initio y basados en plantillas está emergiendo como la estrategia óptima para modelar complejos de proteínas y ensamblajes multimoleculares. Revisaremos los nuevos avances metodológicos sobre el acoplamiento ab initio y el modelado integrativo. La séptima edición de CAPRI impuso nuevos desafíos al modelado de complejos proteína-proteína, como la oligomerización multimérica, las interacciones proteína-péptido y proteína-oligosacárido. Muchos de los objetivos propuestos necesitaban la integración eficiente de acoplamiento de cuerpo rígido, modelado basado en plantillas, optimización flexible, puntuación multiparamétrica y restricciones experimentales. Esto fue especialmente relevante para los conjuntos multimoleculares propuestos en las rondas conjuntas CASP13-CAPRI46. Presentaremos los resultados para la séptima edición de CAPRI y la Ronda 46 de CAPRI, el tercer desafío de predicción del ensamblaje de proteínas CASP-CAPRI conjunto. Uno de los efectos potenciales conocidos de las sustituciones de aminoácidos que causan enfermedades en las proteínas es modular las interacciones proteína-proteína (PPI). Para interpretar tales variantes a nivel molecular y obtener información útil con fines de predicción, es importante determinar si están ubicadas en interfaces proteína-proteína, que se componen de dos regiones principales, núcleo y borde, con diferente conservación evolutiva y diferentes propiedades fisicoquímicas. En la tesis, hemos realizado un análisis estructural, energético y computacional de interacciones entre proteínas que albergan mutaciones relacionadas con enfermedades detectadas en el cribado neonatal. Los residuos de interfície se clasificaron como núcleo o borde, lo que demuestra que los residuos del núcleo son los que más contribuyen a la energía libre de unión del PPI. Es más probable que las variantes que causan enfermedades se produzcan en la región del núcleo de la interfície que en el borde de la interfície de la proteína (p <0,0001). Por el contrario, las variantes neutrales se encuentran más a menudo en el borde de la interfície o en la superficie que no interactúa en lugar de en la región del núcleo de la interfície. También encontramos que la arginina, el triptófano y la tirosina están sobrerrepresentados entre los residuos mutados que conducen a la enfermedad. Estos resultados pueden mejorar nuestra comprensión de las enfermedades a nivel molecular y, por lo tanto, contribuir a la medicina personalizada al ayudar a los médicos a proporcionar diagnósticos y tratamientos adecuados. Los efectos fenotípicos de variaciones genéticas no-sinónimas que conducen o predisponen a la enfermedad pueden racionalizarse sobre la base del impacto funcional y estructural en la proteína mutada, incluida la perturbación de la red de interacción y las vías moleculares en las que participa dicha proteína. Por lo tanto, comprender estos efectos a nivel molecular es esencial para construir modelos de enfermedad precisos y lograr una mayor precisión en el diagnóstico y la intervención terapéutica. En este contexto, podemos caracterizar computacionalmente el efecto de mutaciones patológicas en interacciones proteína-proteína específicas ("edgetic"), en base a su estructura proteica, si está disponible, o en modelos de acoplamiento. Las interacciones proteína-proteína que están claramente estabilizadas o desestabilizadas por estas mutaciones pueden ser objetivos potenciales para la intervención terapéutica. Hemos analizado el efecto energético predicho de las mutaciones en los PPI aplicando una variedad de métodos informáticos para modelar la mutación y calcular el cambio en la afinidad de unión (FoldX, mCSM, pyDock combinados con SCWRL3). Validamos el impacto energético predictivo a través de mutaciones experimentales contenidas en SKEMPI 2.0 y aplicamos estos enfoques en variantes patológicas y neutrales de un solo aminoácido (SAV en inglés) posteriormente (de ClinVar / Humsavar y gnomAD). En base a esto, hemos identificado mutaciones patológicas que inciden claramente en las interacciones analizadas estabilizándolas o desestabilizándolas. Como se ha discutido, las interacciones proteína-proteína son importantes para procesos biológicos y situaciones patológicas y son objetivos atractivos para el descubrimiento de fármacos. Sin embargo, el diseño racional de fármacos dirigidos a las interacciones proteína-proteína sigue siendo un gran desafío. Los residuos de puntos calientes se consideran la mejor opción para apuntar a tales interacciones, pero su identificación requiere una caracterización estructural y energética detallada, que solo está disponible para una pequeña fracción de interacciones de proteínas. Esta tesis doctoral cubre una variedad de métodos computacionales que han sido reportados para el análisis energético de interfícies proteína-proteína en la búsqueda de puntos calientes y el modelado estructural de complejos proteína-proteína por acoplamiento. Esto puede ayudar a racionalizar el descubrimiento de inhibidores de moléculas pequeñas de interfícies proteína-proteína de interés terapéutico. El análisis computacional y el acoplamiento pueden ayudar a localizar la interfície, la dinámica molecular se puede utilizar para encontrar cavidades adecuadas y las predicciones de puntos calientes pueden enfocar la búsqueda de inhibidores de interacciones proteína-proteína. Una dificultad importante para aplicar métodos racionales de diseño de fármacos a las interacciones proteína-proteína es que en la mayoría de los casos no se dispone de la estructura compleja. Afortunadamente, el acoplamiento computacional puede complementar los datos experimentales. Un aspecto interesante para explorar en el futuro es la integración de estas estrategias para apuntar a las interacciones proteína-proteína con análisis mutacionales a gran escala.
Enginyeria de proteïnes; Ingeniería de las proteínas; Protein engineering; Biomolècules; Biomoléculas; Biomolecules; Dinàmica molecular; Dinámica molecular; Molecular dynamics
577 - Bioquímica. Biología molecular. Biofísica
Ciències de la Salut
Programa de Doctorat en Biomedicina / Tesi realitzada al Barcelona Supercomputing Center (BSC)
ADVERTIMENT. Tots els drets reservats. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.