Calculations of water free energy in bulk and large biological systems

Author

Coronas Serna, Luis Enrique

Director

Franzese, Giancarlo

Tutor

Franzese, Giancarlo

Date of defense

2023-03-28

Pages

213 p.



Department/Institute

Universitat de Barcelona. Facultat de Física

Abstract

[eng] This thesis develops, validates, and explores applications of the Franzese-Stanley (FS) coarse-grained model for bulk water, ultimately intended to represent the solvent in large-scale simulations of biological systems. The model coarse-grains the positions of the water molecules through a discrete density field but keeps a detailed account of the hydrogen bond (HB) contributions to local density heterogeneity. It was initially proposed for hydrophobically confined water monolayers and is suitable for analytic calculations and Monte Carlo simulations. The FS monolayer displays dynamic and thermodynamic anomalies qualitatively consistent with experiments and atomistic calculations. Moreover, its extension to hydration water in protein solutions unveils the water contribution to protein folding, protein design, and protein aggregation, including effects arising from changes in temperature, pressure, salinity, and pH. Here, we extend to bulk the FS model. Although going from monolayer to bulk could drastically change the thermodynamic behavior of the model, we show that the bulk FS reproduces well the experimental data of water. Furthermore, we prove that the model is suitable for simulations of large biological systems in explicit solvent. On the one hand, we account for water interactions at the molecular level, at variance with commonly employed coarse-grained models. On the other hand, we equilibrate systems at length scales and times so large that it would be unaffordable for current atomistic simulations. First, we developed efficient parallel distributed algorithms for Metropolis and Swendsen-Wang Monte Carlo simulations. We benchmarked accessible size systems of 260³ ∼ 10⁷ water molecules using parallel Metropolis and 128³ ∼ 10⁶ with Swendsen-Wang. Second, we calibrated the model parameters according to ab initio calculations and experimental results. We found that the model fits the experimental data in a wide range of temperatures T and pressures P around ambient conditions. Third, we transferred the model to deep supercooled conditions and compared the model's predictions to those obtained from atomistic models. We found that the FS model displays a liquid-liquid critical point (LLCP) at TC = (192 ± 6) K and PC = (176 ± 2) MPa, consistent with estimates from the most accepted atomistic models. Finally, we investigated applications of the bulk FS model to hydrate large biological systems. More specifically, we developed a simulation approach to estimate the contribution of the solvent to the free energy of hydrated systems previously calculated with implicit solvent models. We considered two cases of application. First, we studied the unfolding upon increasing hydrodynamic stress of the globular domains A1, A2, and A3 of the von Willebrand factor (vWf). Here, we identify four characteristic states of the system and estimate the free energy barriers that separate them as a function of the shear rate. Second, we considered the SOD1 protein sequestration into FUS biocondensates and the anti-sequestration action of the BSA crowder, mimicking the high cytoplasm concentration. BSA are globular proteins, while FUS are intrinsically disordered proteins. Our results show that the decrease of the SOD1 partitioning coefficient into FUS biocondensates when BSA is present is a consequence of the increase in water's entropy. In both the vWf and SOD1 examples, we show that the explicit calculation of water contribution to the free energy is essential to interpret the phenomena' physics correctly. Within this approach, we overcome the intrinsic limitation of implicit solvent models that, by construction, average over the solvent degrees of freedom.


[spa] A lo largo de la presente tesis, extendemos a 3D el modelo coarse-grain Franzese-Stanley (FS) que, en su formulación original para monocapas líquidas confinadas (2D), reproduce de forma cualitativa las anomalías dinámicas y termodinámicas del agua. Aquí, lo validamos en 3D, demostrando que se ajusta en un amplio rango de presiones y temperaturas a los resultados experimentales, y lo aplicamos para calcular la contribución del agua a la energía libre de sistemas biológicos de gran extensión. El objetivo principal es demostrar que el modelo en 3D es aplicable a simulaciones de gran escala, calculando explícitamente las contribuciones del solvente. Para ello, el modelo debe reproducir las propiedades del agua a condiciones ambiente, y en otras condiciones relevantes para los procesos biológicos, y debe ser posible, mediante simulaciones, equilibrar sistemas de tamaño muy grande. Para reducir el coste de las simulaciones y aumentar el rango de tamaños accesibles, desarrollamos algoritmos Monte Carlo paralelizados. Con ello, logramos equilibrar sistemas del orden de 10⁷ moléculas. A continuación, calibramos los parámetros del modelo de manera que el modelo reproduzca cuantitativamente la ecuación de estado del agua experimental en una amplia región del diagrama de fases alrededor de las condiciones ambiente. En tercer lugar, estudiamos el comportamiento del modelo en la región sobreenfriada. Nuestros resultados muestran que el modelo reproduce una transición de fase líquido-líquido entre las fases líquido-de-alta-densidad y líquido-de-baja-densidad que termina en un punto crítico. Mediante un análisis de tamaño finito, encontramos que el punto crítico localizado en el modelo FS es consistente con las estimaciones de modelos atomísticos. A pesar que estas condiciones extremas sean menos relevantes para los procesos biológicos, la consistencia de los resultados de nuestro modelo con modelos atomísticos aceptados refuerza su validez. Finalmente, desarrollamos un método de simulación que permite calcular la contribución del agua a la energía libre de sistemas biológicos. El método toma la trayectoria del sistema (previamente calculada mediante un modelo de agua implícita) y mapea las configuraciones a su representación correspondiente en el modelo FS (agua explícita). Así, damos cuenta de la evolución de las configuraciones del agua a lo largo de la trayectoria del sistema. Mediante dos casos de aplicación, concluimos que es necesario incluir los grados de libertad del solvente para describir de forma adecuada la física del sistema y, en consecuencia, para calcular las barreras de energía libre que separan los estados característicos de los procesos examinados.

Keywords

Física estadística; Statistical physics; Matèria condensada; Materia condensada; Condensed matter; Transformacions de fase (Física estadística); Transformaciones de fase (Física estadística); Phase transformations (Statistical physics); Biofísica; Biophysics; Proteïnes; Proteínas; Proteins

Subjects

538.9 - Condensed matter physics

Knowledge Area

Ciències Experimentals i Matemàtiques

Note

Programa de Doctorat en Física

Documents

LECS_PhD_THESIS.pdf

8.331Mb

 

Rights

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/

This item appears in the following Collection(s)