Unraveling the Genetic History of Northeastern Iberians

Autor/a

Ruiz De la Cuesta Aguirre, Daniel

Director/a

Malgosa Morera, Assumpció

Pereira dos Santos, Cristina Maria

Tutor/a

Malgosa Morera, Assumpció

Data de defensa

2025-06-27

Pàgines

300 p.



Programa de doctorat

Universitat Autònoma de Barcelona. Programa de Doctorat en Biodiversitat

Resum

L’estudi de l’ADN antic (aDNA) ha revolucionat la comprensió de la història evolutiva humana, ja que permet analitzar directament material genètic conservat en restes arqueològiques. No obstant això, la recerca amb aDNA presenta grans reptes a causa de la degradació molecular, la poca quantitat de material disponible i la contaminació moderna. En el cas de la cultura ibèrica de l’Edat del Ferro, el predomini de la cremació com a pràctica funerària suposa un obstacle afegit, limitant la disponibilitat de restes biològiques conservades. Com a conseqüència, els estudis genètics sobre poblacions ibèriques han estat escassos, fragmentaris i amb una cobertura geogràfica molt restringida. Aquesta tesi afronta aquestes limitacions combinant innovacions metodològiques amb una recerca paleogenòmica centrada en individus de l’Edat del Ferro del nord-est peninsular. Aprofitant els avenços recents en paleogenòmica, aquest treball contribueix tant al desenvolupament tècnic com a la reconstrucció de la història demogràfica de les poblacions ibèriques des del Ferro antic fins a la conquesta romana. La primera part es dedica al desenvolupament i validació d’eines per millorar l’anàlisi de l’ADN mitocondrial (mtDNA) en mostres degradades. Es va generar un perfil de dany molecular post-mortem utilitzant 427 seqüències antigues de mtDNA obtingudes mitjançant tècniques de captura i shotgun, i seqüenciades amb tecnologies de nova generació (NGS). L’anàlisi va identificar 2.933 punts calents de dany, 2.781 dels quals no s’havien descrit prèviament. Encara que alguns podrien derivar d’errors de seqüenciació, aquest perfil ofereix una referència útil per distingir entre dany autèntic i posicions amb alta probabilitat de mutació o heteroplasmies, millorant així la interpretació genètica. A més, es va desenvolupar un pipeline bioinformàtic senzill per analitzar seqüències de mtDNA obtingudes mitjançant mètodes NGS basats en amplicons, especialment útils per a mostres molt degradades. El pipeline automatitza passos clau com l’estimació de la contaminació, l’assignació d’haplotips i la determinació d’haplogrups. Es van optimitzar paràmetres crítics, com ara l’ús de fastp v0.23.2 per eliminar duplicats, i un llindar PMDS d’1 amb PMDtools v0.23.2, efectiu fins i tot en biblioteques amb només un 9,17% de lectures danyades. La segona part de la tesi aplica aquests mètodes a l’anàlisi d’individus perinatals ibèrics procedents de sis jaciments clau: la fortalesa dels Vilars d’Arbeca, Ullastret (Illa d’en Reixac i Puig de Sant Andreu), Sant Miquel d’Olèrdola, Castell de Besora, el poblat ibèric de Burriac i El Camp de les Lloses. Es va obtenir ADN nuclear de 22 individus i mtDNA de 50, representant tribus com els ilergets, indigets, cossetans, laietans, bergistans i ausetans. Aquests individus, sovint enterrats en contextos domèstics, ofereixen una visió única sobre l’estructura genètica de les comunitats ibèriques del nord-est peninsular. Les anàlisis genòmiques revelen una continuïtat majoritària amb les poblacions locals de l’Edat del Bronze, amb canvis graduals més que no pas substitucions sobtades. No obstant, també es detecten senyals de flux genètic procedent del Mediterrani central/oriental i del nord d’Àfrica, reflex del comerç, les migracions i els contactes culturals. El cas d’El Camp de les Lloses mostra una influència genètica mediterrània creixent durant el període romà. L’anàlisi mitocondrial de 73 individus mostra diferències subtils entre tribus, però sense una diferenciació clara. L’alta diversitat del mtDNA suggereix sistemes de residència patrilocal amb una mobilitat femenina limitada, la qual cosa hauria evitat divergències importants. La majoria d’haplogrups tenen arrels locals, tot i que alguns indiquen migracions femenines de llarg abast. En conclusió, aquesta tesi aporta noves eines metodològiques i la primera caracterització genòmica sistemàtica de les comunitats ibèriques del nord-est peninsular, integrant dades nuclears, mitocondrials i arqueològiques per reconstruir la seva història demogràfica.


El estudio del ADN antiguo (aDNA) ha revolucionado la comprensión de la historia evolutiva humana al permitir el análisis directo de material genético conservado en restos arqueológicos. No obstante, la investigación con aDNA enfrenta desafíos importantes debido a la degradación molecular, la escasez de material y la contaminación moderna. En el caso de la cultura ibera de la Edad del Hierro, el predominio de la cremación como práctica funeraria supone un obstáculo adicional, limitando la disponibilidad de restos biológicos preservados. Como consecuencia, los estudios genéticos sobre poblaciones iberas han sido escasos, fragmentarios y con una fuerte limitación geográfica. Esta tesis aborda estas limitaciones mediante la combinación de innovaciones metodológicas y una investigación paleogenómica centrada en individuos de la Edad del Hierro del nordeste peninsular. Aprovechando los avances recientes en paleogenómica, este trabajo contribuye tanto al desarrollo técnico como a la reconstrucción de la historia demográfica de las poblaciones iberas desde el Hierro antiguo hasta la conquista romana. La primera parte se dedica al desarrollo y validación de herramientas para mejorar el análisis del ADN mitocondrial (mtDNA) en muestras degradadas. Se generó un perfil de daño molecular post-mortem utilizando 427 secuencias antiguas de mtDNA obtenidas mediante técnicas de captura y shotgun, y secuenciadas con tecnologías de nueva generación (NGS). El análisis identificó 2.933 hotspots de daño, 2.781 de los cuales no habían sido reportados previamente. Aunque algunos podrían deberse a errores de secuenciación, este perfil ofrece una referencia valiosa para distinguir entre daño auténtico y posiciones con alta probabilidad de mutación o heteroplasmia, mejorando así la interpretación genética. Además, se desarrolló un pipeline bioinformático de uso sencillo para analizar secuencias de mtDNA obtenidas mediante métodos de NGS basados en amplicones, particularmente adecuados para muestras muy degradadas. El pipeline automatiza pasos clave como la estimación de contaminación, la asignación de haplotipos y la determinación de haplogrupos. Se optimizaron parámetros críticos, incluyendo el uso de fastp v0.23.2 para la eliminación de duplicados y un umbral PMDS de 1 con PMDtools v0.23.2, efectivos incluso en librerías con solo un 9,17% de lecturas dañadas. La segunda parte de la tesis aplica estos métodos al análisis de individuos perinatales iberos de seis yacimientos clave: La fortaleza de Els Vilars d'Arbeca, Ullastret (Illa d’en Reixac y Puig de Sant Andreu), Sant Miquel d’Olèrdola, Castell de Besora, el poblado ibro de Burriac y El Camp de les Lloses. Se obtuvo ADN nuclear de 22 individuos y mtDNA de 50, representando tribus como los ilergetes, indiketes, cesetanos, layetanos, bergistanos y ausetanos. Estos individuos, frecuentemente enterrados en contextos domésticos, ofrecen una visión única sobre la estructura genética de las comunidades iberas del nordeste peninsular. Los análisis genómicos revelan una continuidad mayoritaria desde las poblaciones locales de la Edad del Bronce, con cambios graduales en lugar de reemplazos abruptos. Sin embargo, también se detectaron señales de flujo génico desde el Mediterráneo central/oriental y el norte de África, reflejo del comercio, migración y contactos culturales. El caso de El Camp de les Lloses muestra una influencia genética mediterránea creciente durante el periodo romano. El análisis mitocondrial de 73 individuos mostró diferencias sutiles entre tribus, pero sin diferenciación clara. La alta diversidad del mtDNA sugiere sistemas de residencia patrilocal y movilidad femenina limitada, lo que habría evitado divergencias importantes. La mayoría de los haplogrupos tienen raíces locales, confirmando la continuidad materna, aunque algunos sugieren migraciones femeninas de larga distancia. En conclusión, esta tesis aporta nuevas herramientas metodológicas y la primera caracterización genómica sistemática de las comunidades iberas del nordeste peninsular, integrando datos nucleares, mitocondriales y contextos arqueológicos para reconstruir su historia demográfica.


The study of ancient DNA (aDNA) has transformed our understanding of human evolutionary history by enabling the direct analysis of genetic material preserved in archaeological remains. However, aDNA research is challenged by molecular degradation, scarcity, and contamination, especially in the case of the Iron Age Iberian culture, where cremation was the dominant funerary practice. As a result, genetic data from Iberian populations remain limited, geographically biased, and fragmentary despite extensive archaeological work. This thesis addresses these gaps by combining methodological innovations with a focused paleogenomic study of Iron Age individuals from northeastern Iberia. Leveraging recent advances in ancient DNA techniques, this work contributes both to methodological development and to reconstructing the demographic history of Iberian populations from the Early Iron Age to the Roman conquest. The first part of the thesis develops and validates tools to improve mitochondrial DNA (mtDNA) analysis from degraded samples. A post-mortem molecular damage profile was generated using 427 ancient mtDNA sequences obtained through shotgun and capture techniques and sequenced with Next Generation Sequencing (NGS). This analysis identified 2,933 damage hotspots, 2,781 of which had not been previously reported. While some may reflect sequencing error, this damage map provides a valuable reference to distinguish authentic damage from mutational hotspots or heteroplasmy, enhancing the reliability of downstream genetic interpretations. Additionally, a user-friendly bioinformatic pipeline was created for analyzing amplicon-based mtDNA sequences, optimized for highly degraded samples. The pipeline automates contamination estimation, haplogroup assignment, and haplotype determination. Key improvements included the use of fastp v0.23.2 for duplicate removal and a PMDS threshold of 1 with PMDtools v0.23.2, effective even for libraries with as little as 9.17% damaged reads. The second part of the thesis applies these approaches to the analysis of Iron Age newborns from six key archaeological sites: the fortress of Vilars, Ullastret (Illa d’en Reixac and Puig de Sant Andreu), Sant Miquel d’Olèrdola, Castell de Besora, el poblat Ibèric de Burriac, and El Camp de les Lloses. Nuclear data were recovered for 22 individuals, and mtDNA was reported for 50 newborns, representing tribes such as the Ilergetae, Indiketes, Cessetani, Layetani, Bergistani, and Ausetani. These individuals, often buried within domestic spaces, offer valuable insights into the genetic structure of northeastern Iberian populations. Genomic analyses showed that Iron Age communities in this region largely derived from local Bronze Age populations, indicating gradual continuity rather than abrupt replacement. However, gene flow from Central/Eastern Mediterranean and North African regions was also detected, reflecting the role of trade, migration, and cultural contact. The case of El Camp de les Lloses, dating to the Late Iron Age and early Roman period, illustrates increased Mediterranean influence linked to Roman expansion. Analysis of 73 mtDNA profiles, including newly sequenced and previously published data, revealed subtle tribal differences in haplogroup frequencies, but overall low differentiation. High mtDNA diversity across all groups supports patrilocal mating systems and limited female mobility, reducing genetic divergence between tribes. Most haplogroups had local prehistoric roots, confirming maternal continuity, while the presence of haplogroups linked to the Near East and North Africa indicates sporadic long-distance female migration. In conclusion, this thesis advances the field of paleogenomics by addressing key challenges in ancient DNA analysis and offering the first comprehensive genomic portrait of Iron Age northeastern Iberian populations. By integrating nuclear and mitochondrial data with archaeological and historical contexts, it reveals a complex demographic landscape shaped by local continuity and selective external interactions. The methodological tools developed and applied here provide a foundation for future studies of underrepresented or poorly preserved ancient populations worldwide.

Paraules clau

Paleogenòmica; Paleogenomics; Paleogenómica; Ibers; Iberians; Iberos

Matèries

572 - Antropologia

Àrea de coneixement

Ciències Experimentals

Documents

drca1de1.pdf

49.31Mb

Drets

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-sa/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-sa/4.0/

Aquest element apareix en la col·lecció o col·leccions següent(s)