Universitat Politècnica de Catalunya. Departament de Física
DOCTORAT EN CIÈNCIA I TECNOLOGIA AEROESPACIALS (Pla 2013)
(English) Motivated by recent advances in computational technology aiming at exascale capabilities, which implies a need for applications capable of taking advantage of these new supercomputing archit ectures, this work will present two algorithms aimed at implementing an efficient and low-dissipation algorithm focused on LES and DNS of turbulent compressible flows. The basis for the algorithms is the Continuous Galerkin method applied to elements whose nodes and quadrature points are formed from the Gauss-Lobatto-Legendre roots, resulting in a Spectral Elements Method. Throughout this work, it will be evidenced that this formulation leads to highly efficient kernels for discretizing the convective and diffusive terms of the compressible N avier-Stokes equations, with the added benefit that the order of the scheme is coupled with the order of the shape function polynomials employed by the elements themselves, significantly sim plifying the process of increasing the order of the scheme. To achieve a stable Total Variational Diminishing algorithm, the \acrshort{sem} scheme will be paired with an Entropy Viscosity-based stabilization model and a suitable splitting of the nonl inear convective terms will be employed to eliminate aliasing issues that occur in the \acrshort{sem} formulation. This spatial discretization is then coupled with both an explicit and a semi-implicit scheme to account for the temporal nature of the flow equations. The explicit version of the algorithm i s expected to be simple and efficient per time step, but due to its \acrshort{cfl} condition limitation, the semi-implicit version is also proposed to allow for better overall performance in cases where the time-step becomes overly limited, such as in wall-bounded flows. Considering the focus on producing a \acrshort{cfd} application towards the exascale future, an important aspect of this work is that both algorithms are proposed with a full \acrshort{gpu} implementation in mind: the use of accelerators is expected to be a key aspect of future supercomputing architectures, and thus it is important to design these algorithms with this in mind. Examples detailing the performance of both algorithms will be presented both in the case of a single device and when distributed architectures using multiple devices are employed.
(Català) Els recents avanços en tecnologia computacional que tenen com objectiu arribar a capacitats d'exaescala impliquen la necessitat de desenvolupar aplicacions capaces d'aprofitar les avantatges que comporten aquestes noves arquitectures de supercomputació. Amb aquesta motivació, aquest treball presenta dos algoritmes que tenen com objectiu desenvolupar codis eficients i de baixa disipació LES i DNS de fluxos compressibles turbulents. La base dels algoritmes és el mètode numèric Galerkin Continu aplicat a elements on els nodes i els punts de quadratura estan basats en les arrels de Gauss-Lobatto-Legendre, resultant en un Mètode d'Elements Espectrals. Al llarg d'aquest treball, es posarà de manifest que aquesta formulació condueix a kernels altament eficients a l'hora de discretitzar els termes convectius i difusius de les equacions de Navier-Stokes compressibles, amb el benefici addicional que l'ordre de l'esquema està acoblat amb l'ordre dels polinomis de funció de forma emprats pels mateixos elements, simplificant significativament el procés d'incrementar l'ordre de l'esquema. Per aconseguir un algoritme estable TVD, l'esquema SEM s'implementarà conjuntament amb un model d'estabilització basat en el mètode Entropy Viscosity, així com una formulació adient dels termes convectius no lineals que permeten eliminar problemes d'aliasing que apareixen en la formulació SEM degut a la distribució dels nodes. Aquesta discretització espacial serà utilitzada en dos esquemes d'integració temporal, un explícit i un semi-implícit, amb l'objectiu de tenir en compte la naturalesa temporal de les equacions del flux. S'espera que la versió explícita de l'algoritme sigui simple i eficient per pas de temps, però a causa de la seva limitació degut a la condició CFL, també es proposa la versió semi-implícita per permetre un millor rendiment general en casos on el pas de temps esdevé excessivament limitat, com en fluxos amb parets. Considerant que l'objectiu es desenvolupar una aplicació de CFD amb el paradigma de la computació en exaescala en ment, els algoritmes desenvolupats en el present treball es proposen amb una implementació per GPU, ja que s'espera que l'ús d'acceleradors sigui un aspecte clau de les futures arquitectures de supercomputació, i per tant, és un aspecte fonamental considerat en el desenvolupament dels algoritmes. Es presentaran exemples que detallen el rendiment de tots dos algoritmes, tant en el cas d'un sol accelerador així com quan s'empren arquitectures de computació distribuïdes amb múltiples dispositius.
(Español) Motivado por los recientes avances en tecnología computacional con miras a capacidades de exaescala, lo que implica una necesidad de aplicaciones capaces de aprovechar estas nuevas arquitecturas de supercomputación, este trabajo presentará dos algoritmos destinados a implementar un algoritmo eficiente y de baja disipación centrado en LES y DNS de flujos compresibles turbulentos. La base de los algoritmos es el método Galerkin Continuo aplicado a elementos cuyos nodos y puntos de cuadratura se forman a partir de las raíces de Gauss-Lobatto-Legendre, lo que resulta en un Método de Elementos Espectrales. A lo largo de este trabajo, se evidenciará que esta formulación conduce a "kernels" altamente eficientes para discretizar los términos convectivos y difusivos de las ecuaciones de Navier-Stokes compresibles, con el beneficio adicional de que el orden del esquema está acoplado con el orden de los polinomios de función de forma empleados por los propios elementos, simplificando significativamente el proceso de aumentar el orden del esquema. Para lograr un algoritmo estable de Disminución Total de la Variación, se emparejará el esquema SEM con un modelo de estabilización basado en Viscosidad de Entropía y se empleará una división adecuada de los términos convectivos no lineales para eliminar problemas de "aliasing" que ocurren en la formulación SEM. Esta discretización espacial se acoplará entonces tanto con un esquema explícito como con uno semi-implícito para tener en cuenta la naturaleza temporal de las ecuaciones del flujo. Se espera que la versión explícita del algoritmo sea simple y eficiente por paso de tiempo, pero debido a su limitación de condición CFL, también se propone la versión semi-implícita para permitir un mejor rendimiento general en casos donde el paso de tiempo se vuelve excesivamente limitado, como en flujos con paredes. Considerando el enfoque en producir una aplicación de CFD hacia el futuro de la exaescala, un aspecto importante de este trabajo es que ambos algoritmos se proponen con una implementación completa en GPU en mente: se espera que el uso de aceleradores sea un aspecto clave de las futuras arquitecturas de supercomputación, y por lo tanto es importante diseñar estos algoritmos con esto en mente. Se presentarán ejemplos que detallan el rendimiento de ambos algoritmos tanto en el caso de un solo dispositivo como cuando se emplean arquitecturas distribuidas utilizando múltiples dispositivos.
531/534 - Mecánica. Vibraciones. Acústica
Àrees temàtiques de la UPC::Aeronàutica i espai
ADVERTIMENT. Tots els drets reservats. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.