High performance computing and artificial intelligence algorithms for dimensionality reduction of turbulent flows

llistat de metadades

Director/a

Rodríguez Pérez, Ivette María

Lehmkuhl Barba, Oriol

Data de defensa

2025-10-31

Pàgines

390 p.



Departament/Institut

Universitat Politècnica de Catalunya. Departament de Física

Programa de doctorat

DOCTORAT EN FÍSICA COMPUTACIONAL I APLICADA (Pla 2013)

Resum

(English) This thesis presents a suite of methodologies for the dimensionality reduction of turbulent flow data, with a focus on high-fidelity simulations of external aerodynamics in industrial contexts, such as flow around simplified road vehicles. These simulations, typically performed on unstructured meshes with hundreds of millions of degrees of freedom, require scalable tools for analysis and modeling. All developments are implemented in pyLOM, an open-source Python library designed for terabyte-scale reduced-order modeling. The work progresses in four main steps, all of them published and detailed in their corresponding peer-reviewed article. First, classical reduction techniques based on the singular value decomposition (SVD), such as proper orthogonal decomposition (POD), dynamic mode decomposition (DMD), and spectral POD (SPOD), are adapted for high-performance computing by exploiting parallel QR factorization. Strong and weak scalability tests demonstrate high efficiency, with communication during QR factorization identified as the main bottleneck. Such performance gains together with the parallel input/output capabilities of pyLOM helped to apply these algorithms to datasets which occupy several terabytes of data as the direct numerical simulation of the flow in the Stanford diffuser in 80 seconds. Second, a convolutional neural network (CNN) variational autoencoder ($VAE) is developed for nonlinear dimensionality reduction, successfully capturing the temporal dynamics of the Windsor body back pressure with only two latent variables. The model effectively compresses snapshots of back pressure taken at yaw angles of 2.5º, 5º, and 10º. The projection of the mean pressure coefficient to the latent space yields an increasing linear evolution of the two latent variables with the yaw angle. The mean pressure coefficient distribution at yaw angle 7.5º is predicted with a mean error of 3.13% when compared to the results obtained by means of wall-modeled large eddy simulations (WMLES) after computing the values of the latent space with linear interpolation. Both methodologies have been merged to create a novel method named Geometry-Agnostic Variational-autoencoder Integration (GAVI), replacing the SVD step with a VAE operating on QR-factorized data. GAVI provides compact latent spaces without requiring structured grids, achieving high energy recovery across diverse test cases: circular cylinder, Windsor body, and urban flows, with latent spaces of 3–6 variables recovering over 90% of flow energy. The only step involving high performance computing (HPC) in GAVI is the computation of the QR factorization. This operation is done in parallel using pyLOM and its economic cost for all cases tested is lower than 10€. The fit of the VAE to the R matrix can be done with a GPU that fits in a workstation or laptop. Finally, a transformer-based closure strategy is proposed to compensate for energy loss in reduced models. By learning the spatial distribution of unresolved fluctuations, it improves reconstruction accuracy for complex unstructured domains, outperforming approaches based on super resolution generative adversarial networks (SRGAN) in both vehicle wakes and urban wind scenarios. The transformer model learns the probability density function of the missing fluctuations conditioned to the fluctuations already recovered by the model. Adding these fluctuations closes the energy gap between the original and the reconstructed data and improves the accuracy on both the instantaneous fields and the root mean square value of the fluctuations.


(Català) Aquesta tesi presenta un conjunt de metodologies per a la reducció de la dimensionalitat de dades de fluxos turbulents, amb un enfocament en simulacions d’alta fidelitat d’aerodinàmica externa en contextos industrials, com ara el flux al voltant d'automòbils simplificats. Aquestes simulacions, normalment realitzades en malles no estructurades amb centenars de milions de graus de llibertat, requereixen eines escalables per a l’anàlisi i la modelització. Tots els desenvolupaments s’han implementat a pyLOM, una biblioteca de Python oberta dissenyada per a reduir dimensionalitat de dades de l'ordre de magnitud de terabytes. El treball avança en quatre etapes principals, totes elles publicades i detallades en el seu corresponent article. En primer lloc, les tècniques clàssiques de reducció basades en la descomposició en valors singulars (SVD), com la descomposició ortogonal pròpia (POD), descomposició en modes dinàmics (DMD) i POD espectral (SPOD), s’han adaptat a la computació d’altes prestacions aprofitant la factorització QR en paral·lel. Les proves d'escalabilitat demostren una alta eficiència, identificant la comunicació durant la factorització QR com el principal coll d’ampolla. Aquests guanys de rendiment, juntament amb les capacitats d’entrada i sortida de dades en paral·lel de pyLOM, han permès aplicar aquests algorismes a conjunts de dades de diversos terabytes, com la simulació numèrica directa del flux en el difusor de Stanford. En segon lloc, s’ha desenvolupat un autoencodificador variacional (VAE) basat en xarxes neuronals convolucionals (CNN) per a la reducció no lineal de la dimensionalitat. Aquesta estratègia és capaç de capturar amb èxit la dinàmica temporal de la pressió posterior del cotxe Windsor amb només dues variables latents. El model comprimeix de manera efectiva instantànies de la pressió a la superfície posterior del vehicle preses a angles de guinyada de 2.5º, 5º i 10º. La projecció del coeficient mitjà de pressió a l’espai latent mostra una evolució lineal creixent de les dues variables latents amb l’angle de guinyada. La distribució del coeficient mitjà de pressió a l’angle de guinyada 7.5º es prediu amb un error mitjà del 3.13% en comparació amb els resultats obtinguts mitjançant simulacions de grans escales amb model de paret (WMLES) després de calcular els valors de l’espai latent mitjançant interpolació lineal. Ambdues metodologies s’han combinat per crear un mètode nou anomenat Geometry-Agnostic Variational-autoencoder Integration (GAVI), substituint el pas SVD per un VAE que opera sobre dades factoritzades amb QR. GAVI proporciona espais latents compactes sense necessitat de malles estructurades, assolint una alta recuperació d’energia en diversos casos de prova: cilindre, cotxe Windsor i fluxos urbans, amb espais latents de 3–6 variables que recuperen més del 90% de l’energia del flux. L’únic pas que requereix computació d'altes prestacions (HPC) en el GAVI és el càlcul de la factorització QR. Aquesta operació es realitza en paral·lel amb pyLOM i el cost econòmic per a tots els casos provats és inferior a 10€. L’ajust del VAE a la matriu R es pot fer amb una GPU que càpiga en un ordinador de sobretaula o portàtil. Finalment, es proposa una estratègia basada en transformers per compensar la pèrdua d’energia en els models reduïts. Mitjançant l’aprenentatge de la distribució espacial de les fluctuacions no resoltes, millora l’exactitud de la reconstrucció en dominis no estructurats complexos, superant els enfocaments basats en xarxes generatives adverses de super resolució (SRGAN) tant en esteles de vehicles com en fluxes urbans. El model transformer aprèn la funció de densitat de probabilitat de les fluctuacions que falten condicionades a les fluctuacions ja recuperades pel model. Afegir aquestes fluctuacions tanca la bretxa energètica entre les dades originals i les reconstruïdes i millora l’exactitud tant dels camps instantanis com del valor quadràtic mitjà de les fluctuacions.


(Español) Esta tesis presenta un conjunto de metodologías para la reducción de la dimensionalidad de datos de flujos turbulentos, con un enfoque en simulaciones de alta fidelidad de aerodinámica externa en contextos industriales, como el flujo alrededor de automóviles simplificados. Estas simulaciones, normalmente realizadas en mallas no estructuradas con cientos de millones de grados de libertad, requieren herramientas escalables para su análisis y modelado. Todos los desarrollos se han implementado en pyLOM, una biblioteca de Python de código abierto diseñada para reducir dimensionalidad de datos del orden de terabytes. El trabajo avanza en cuatro etapas principales, todas publicadas y detalladas en su correspondiente artículo. En primer lugar, las técnicas clásicas de reducción basadas en descomposición en valores singulares (SVD), como la descomposición ortogonal propia (POD), descomposición en modos dinámicos (DMD) y POD espectral (SPOD), se han adaptado a la computación de altas prestaciones mediante la factorización QR en paralelo. Las pruebas de escalabilidad muestran alta eficiencia, identificando la comunicación durante la factorización QR como el principal cuello de botella. Estas mejoras en rendimiento, junto con las capacidades de entrada y salida de datos en paralelo de pyLOM, han permitido aplicar estos algoritmos a conjuntos de datos de varios terabytes, como la simulación numérica directa del flujo en el difusor de Stanford. En segundo lugar, se ha desarrollado un autoencoder variacional (VAE) basado en redes neuronales convolucionales (CNN) para la reducción no lineal de la dimensionalidad. Esta estrategia es capaz de capturar con éxito la dinámica temporal de la presión trasera del coche Windsor con solo dos variables latentes. El modelo comprime eficazmente instantáneas de la presión en la superficie posterior del vehículo tomadas a ángulos de guiñada de 2.5º, 5º y 10º. La proyección del coeficiente medio de presión en el espacio latente muestra una evolución lineal creciente de las dos variables latentes con el ángulo de guiñada. La distribución del coeficiente medio de presión al ángulo de 7.5º se predice con un error medio del 3.13% frente a los resultados de simulaciones de grandes escalas con modelo de pared (WMLES), tras calcular los valores del espacio latente mediante interpolación lineal. Ambas metodologías se han combinado para crear un nuevo método denominado Geometry-Agnostic Variational-autoencoder Integration (GAVI), sustituyendo el paso SVD por un VAE que opera sobre datos factorizados con QR. GAVI proporciona espacios latentes compactos sin necesidad de mallas estructuradas, alcanzando una alta recuperación de energía en diversos casos de prueba: cilindro, coche Windsor y flujos urbanos, con espacios latentes de 3–6 variables que recuperan más del 90% de la energía del flujo. El único paso que requiere computación de altas prestaciones (HPC) en GAVI es el cálculo de la factorización QR. Esta operación se realiza en paralelo con pyLOM y el coste económico para todos los casos probados es inferior a 10€. El ajuste del VAE a la matriz R puede hacerse con una GPU que cabe en un ordenador de sobremesa o portátil. Finalmente, se propone una estrategia basada en transformers para compensar la pérdida de energía en modelos reducidos. Mediante el aprendizaje de la distribución espacial de las fluctuaciones no resueltas, mejora la exactitud de la reconstrucción en dominios no estructurados complejos, superando los enfoques basados en redes generativas adversarias de superresolución (SRGAN), tanto en estelas de vehículos como en flujos urbanos. El modelo transformer aprende la función de densidad de probabilidad de las fluctuaciones faltantes condicionadas a las fluctuaciones ya recuperadas. Añadir estas fluctuaciones cierra la brecha energética entre los datos originales y los reconstruidos, y mejora la precisión tanto de los campos instantáneos como del valor cuadrático medio de las fluctuaciones.

Matèries

531/534 - Mecànica. Vibracions. Acústica; 004 - Informàtica

Nota

Tesi en modalitat de compendi de publicacions

Tesi amb menció de Doctorat Internacional

Citació recomanada
Aquesta citació s'ha generat automàticament.

Documents

Llistat documents

Aquest document conté fitxers embargats fins el dia 29-08-2027

Drets

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/

Aquest element apareix en la col·lecció o col·leccions següent(s)