Sparse Linear System Solvers on GPUs: Parallel Preconditioning, Workload Balancing, and Communication Reduction

dc.contributor
Universitat Jaume I. Escola de Doctorat
dc.contributor.author
Flegar, Goran
dc.date.accessioned
2019-07-03T07:51:59Z
dc.date.available
2019-07-03T07:51:59Z
dc.date.issued
2019-06-21
dc.identifier.uri
http://hdl.handle.net/10803/667096
dc.description.abstract
With the breakdown of Dennard scaling in the mid-2000s and the end of Moore's law on the horizon, the high performance computing community is turning its attention towards unconventional accelerator hardware to ensure the continued growth of computational capacity. This dissertation presents several contributions related to the iterative solution of sparse linear systems on the most widely used general purpose accelerator - the Graphics Processing Unit (GPU). Specifically, it accelerates the major building blocks of Krylov solvers, and describes their realization as part of a software library of reusable building blocks. The first part of the dissertation focuses on the sparse matrix-vector product and effective load balancing in the presence of irregular sparsity patterns. The second part describes the design of high-performance preconditioners. Finally, the third part demonstrates the potential of adaptive precision techniques for constructing preconditioners with lower memory footprint, and accuracy comparable to their full precision equivalents.
dc.description.abstract
Con el final de la ley de Dennard y el cercano fin de la ley de Moore, la comunidad en computación de altas prestaciones se está centrando en tecnologías de aceleración no convencionales para asegurar el crecimiento exponencial de la capacidad de computación. Esta tesis contribuye a la solución iterativa de sistemas lineales dispersos en el acelerador más difundido: el procesador gráfico. Específicamente, el trabajo acelera los bloques fundamentales de los métodos de Krylov, y describe su implementación como parte de una biblioteca de bloques reutilizables. La primera parte del trabajo se centra en el producto matriz-vector disperso y el equilibrado de la carga ante patrones de dispersidad irregulares. La segunda parte describe el diseño de precondicionadores de alto rendimiento. Finalmente, la tercera parte demuestra el potencial de las técnicas de precisión adaptativa para construir precondicionadores con menor consumo de memoria, y fiabilidad comparable con las versiones de precisión completa.
dc.format.extent
146 p.
dc.format.mimetype
application/pdf
dc.language.iso
eng
dc.publisher
Universitat Jaume I
dc.rights.license
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by/4.0/
dc.rights.uri
http://creativecommons.org/licenses/by/4.0/
*
dc.source
TDX (Tesis Doctorals en Xarxa)
dc.subject
High Performance Computing
dc.subject
Graphics Processing Units
dc.subject
Adaptive Precision
dc.subject
Krylov Methods
dc.subject
Sparse Matrix-Vector Product
dc.subject
Preconditioning
dc.subject.other
Tecnologies de la informació i les comunicacions (TIC)
dc.title
Sparse Linear System Solvers on GPUs: Parallel Preconditioning, Workload Balancing, and Communication Reduction
dc.type
info:eu-repo/semantics/doctoralThesis
dc.type
info:eu-repo/semantics/publishedVersion
dc.subject.udc
004
dc.contributor.director
Quintana Ortí, Enrique S.
dc.contributor.director
Anzt, Hartwig
dc.embargo.terms
cap
dc.rights.accessLevel
info:eu-repo/semantics/openAccess
dc.identifier.doi
http://dx.doi.org/10.6035/14101.2019.709084
dc.description.degree
Programa de Doctorat en Informàtica


Documents

2019_Tesis_Flegar_Goran.pdf

3.004Mb PDF

Aquest element apareix en la col·lecció o col·leccions següent(s)