Desarrollo y utilización de herramientas bioinformáticas en el estudio de datos de secuenciación masiva: Análisis genómicos en arácnidos.

dc.contributor
Universitat de Barcelona. Departament de Genètica, Microbiologia i Estadística
dc.contributor.author
Sánchez Herrero, José Francisco
dc.date.accessioned
2020-02-12T10:42:06Z
dc.date.available
2020-02-12T10:42:06Z
dc.date.issued
2019-12-13
dc.identifier.uri
http://hdl.handle.net/10803/668557
dc.description.abstract
Encontramos una gran cantidad de información genómica en bases de datos para numerosos organismos pero existe un sesgo hacia ciertos grupos taxonómicos por el interés económico, social o sanitario. Los avances y el abaratamiento de los costes de las tecnologías de secuenciación masiva han permitido aplicar estas técnicas en organismos no modelo pero aun así no resulta rutinario el poder generar recursos genómicos de buena calidad. Las arañas, grupo de estudio de esta tesis doctoral, son organismos no modelo infrarrepresentados en las bases de datos. La disponibilidad de un nuevo genoma favorecería el conocimiento de importantes aspectos como la presencia del veneno, seda o la adaptación a los procesos de terrestralización y la evolución del sistema quimiosensorial. Los objetivos principales de esta tesis doctoral son el desarrollar herramientas bioinformáticas y generar recursos genómicos en organismos no modelo, especialmente en arácnidos. Hemos implementado la herramienta DOMINO, para la búsqueda e identificación de marcadores moleculares en organismos no modelo mediante datos de secuenciación masiva. Permite generar marcadores a diferentes rangos taxonómicos que pueden ser empleados de forma directa, amplificados por PCR o empleados en el desarrollo de regiones para métodos de captura de secuencia. Hemos validado el software mediante simulaciones computacionales y datos empíricos para ajustar, configurar los parámetros y maximizar su sensibilidad y precisión. Además, hemos desarrollado una interfaz gráfica que permite el acceso a usuarios menos familiarizados con los entornos de programación. También hemos generado un ensamblaje genómico de un representante del género de arañas Dysdera, combinando diferentes librerías de secuenciación. Mediante diferentes estadísticas descriptivas determinamos la calidad y continuidad del ensamblaje y lo anotamos estructural y funcionalmente mediante predicciones ab initio y evidencias de bases de datos y de ARN. Obtuvimos un ensamblaje genómico con N50 de 38 kb, que no podía ser mejorado por la complejidad del genoma que incluía un alto número de repeticiones, aunque la calidad del genoma en cuanto a la integridad de los genes era bastante buena. Por tanto, hemos generado un recurso genómico muy útil no sólo para el análisis de características específicas del género pero también de otros arácnidos o artrópodos.
en_US
dc.description.abstract
There is a vast amount of information indexed in genomic databases from multiple species of organisms but there is a bias against some taxonomic groups for their relevance at social, sanitary and economical level. The progress and the reduction of sequencing technologies have allowed the implementation of these techniques in non-model organisms but still, it is neither straightforward nor cheap to obtain high quality genomic resources. Spiders, main group of interest of this thesis, are non-model organisms underrepresented in genomic databases. The availability of a new genome would shed light into relevant biological traits such as the presence of venom, silk or the adaptation to terrestrial ecosystems and the chemosensory system. The main objectives of this thesis are to develop bioinformatics methods and to generate genomic resources for non-model organisms, specifically, spiders. We have developed the tool DOMINO for the development of molecular markers in non-model organisms from next generation sequencing data. This tool allows identifying markers at different taxonomic ranges that could be employed directly, amplified using PCR in other related samples or for the generation of sequence capture strategies. We have validated the software using computer simulations and empirical data to adjust, configure and maximize its precision and sensitivity. Also, we have generated a graphical user interface to improve the usability of the software among those users with limited expertise in programming languages. We have also developed a genomic assembly of a representative spider of the genus Dysdera by combining multiple sequencing technologies. Using several descriptive statistics we determined the quality and completeness of the assembly and conducted the structural and functional annotation by ab initio and evidence-based predictions. We obtained a genome with a N50 of 38 kb, that it could not be improved because the complexity of the genome that include a high proportion of repetitive regions, nevertheless the quality of genome in terms of gene completeness was fairly good. Globally we have generated a very useful genomic resource not only for conducting studies of specific biological or evolutionary characteristics in this genus but also for other arachnids or arthropods.
en_US
dc.format.extent
287 p.
en_US
dc.format.mimetype
application/pdf
dc.language.iso
spa
en_US
dc.publisher
Universitat de Barcelona
dc.rights.license
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.uri
http://creativecommons.org/licenses/by-nc/4.0/
*
dc.source
TDX (Tesis Doctorals en Xarxa)
dc.subject
Bioinformàtica
en_US
dc.subject
Bioinformática
en_US
dc.subject
Bioinformatics
en_US
dc.subject
Genòmica
en_US
dc.subject
Genómica
en_US
dc.subject
Genomics
en_US
dc.subject
Aràcnids
en_US
dc.subject
Arácnidos
en_US
dc.subject
Arachnida
en_US
dc.subject.other
Ciències Experimentals i Matemàtiques
en_US
dc.title
Desarrollo y utilización de herramientas bioinformáticas en el estudio de datos de secuenciación masiva: Análisis genómicos en arácnidos.
en_US
dc.type
info:eu-repo/semantics/doctoralThesis
dc.type
info:eu-repo/semantics/publishedVersion
dc.subject.udc
575
en_US
dc.contributor.director
Rozas Liras, Julio A.
dc.contributor.director
Sánchez-Gracia, Alejandro
dc.contributor.tutor
Rozas Liras, Julio A.
dc.embargo.terms
cap
en_US
dc.rights.accessLevel
info:eu-repo/semantics/openAccess


Documents

JFSH_TESIS.pdf

15.87Mb PDF

Aquest element apareix en la col·lecció o col·leccions següent(s)