dc.contributor
Universitat de Lleida. Departament d'Informàtica i Enginyeria Industrial
dc.contributor.author
Montañola Lacort, Alberto
dc.date.accessioned
2016-06-08T11:41:41Z
dc.date.available
2017-02-01T06:45:12Z
dc.date.issued
2016-02-02
dc.identifier.uri
http://hdl.handle.net/10803/385282
dc.description.abstract
L'alineació múltiple de seqüencies (MSA), com a repte dins de la bioinformàtica, es un element
clau per entendre el funcionament del genoma. Aquest consisteix en alinear en un temps òptim
aquestes seqüencies garantint un nivell de qualitat. Aquest problema esdevé un repte de
computació de altes prestacions degut als requeriments de recursos de memòria i còmput.
S'han estudiat diferents implementacions, les quals es comparen i es presenten en aquesta
investigació. Hem contribuït en la millora dels primers passos del problema MSA de diverses
maneres.
Amb l'objectiu de reduir el temps de càlcul i l'ús de memòria, adaptem T-Coffee per treballar en
paral·lel amb ús de fils lleugers.
Seguidament, hem desenvolupat un mètode de alineació de parells paral·lel, amb una assignació
eficient de seqüències a nodes. Finalment es presenta un mètode per determinar la quantitat
mínima de recursos del sistema, necessaris per resoldre un problema d'una mida determinada, per
tal de configurar el sistema per un ús eficient.
cat
dc.description.abstract
El alineamiento múltiple de secuencias (MSA), como reto dentro de la bioinformática, es un
elemento clave para entender el funcionamiento del genoma. Este consiste en alinear en un
tiempo óptimo esta secuencias garantizando un nivel de calidad. Este problema es un reto de
computo de altas prestaciones debido a los altos requerimientos de memoria y computo.
Se han estudiado diferentes implementaciones, las cuales se comparan y se presentan en esta
investigación. Hemos contribuido en la mejora de los primeros pasos del problema MSA de
diversas formas.
Con el objetivo de reducir el tiempo de cálculo y el uso de memoria, adaptamos T-Coffee para
trabajar en paralelo con el uso de hilos ligeros.
Seguidamente, hemos desarrollado un método de alineación de pares en paralelo, con una
asignación eficiente de secuencias a nodos. Finalmente se presenta un método para determinar la
cantidad mínima de recursos del sistema, necesarios para resolver el problema de un tamaño
determinado, para poder configurar el sistema para un uso eficiente.
spa
dc.description.abstract
The multiple sequence alignment (MSA), as a challenge in bioinformatics, becomes a key
element for understanding the inner working of the genome. This consists on aligning these
sequences in an optimal time, with a good level of quality. This problem is a challenge for the
high performance computing, because of the high memory and processing requirements.
Different implementations were studied, which are being compared and presented on this thesis.
We have contributed in the improvement of the first steps of the MSA problem in different ways.
With the goal of reducing the computing time and the memory usage, we adapted T-Coffee for
working in parallel with the usage of threads.
Furthermore, we have developed a pair-wise sequence alignment method, with an efficient
mapping of sequences to nodes. Finally, we are presenting the method for determining the
minimal amount of resources, required for solving the problem of a determined size, in order to
configure the system for an efficient use.
eng
dc.format.extent
140 p.
cat
dc.format.mimetype
application/pdf
dc.publisher
Universitat de Lleida
dc.rights.license
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-sa/3.0/es/
dc.rights.uri
http://creativecommons.org/licenses/by-nc-sa/3.0/es/
*
dc.source
TDX (Tesis Doctorals en Xarxa)
dc.subject
Alineació múltiple de seqüencies
cat
dc.subject
Computació distribuïda
cat
dc.subject
Bioinformàtica
cat
dc.subject
Alineamiento múltiple de secuencias
cat
dc.subject
Computación distribuida
cat
dc.subject
Bioinformática
cat
dc.subject
Multiple sequence alignment
cat
dc.subject
Distributed computing
cat
dc.subject
Bioinformatics
cat
dc.subject.other
Arquitectura i tecnologia d'ordinadors
cat
dc.title
The pairwise problem with High Performance Computing Systems, contextualized as a key part to solve the Multiple Sequence Alignment problem
cat
dc.type
info:eu-repo/semantics/doctoralThesis
dc.type
info:eu-repo/semantics/publishedVersion
dc.contributor.director
Roig Mateu, Concepció
dc.contributor.director
Hernández Budé, Porfidio
dc.embargo.terms
12 mesos
cat
dc.rights.accessLevel
info:eu-repo/semantics/openAccess