Phylogenetic applications of ancient protein sequences

Author

Krüger, Johanna

Director

Marquès i Bonet, Tomàs

Alba, David M. ORCID

Date of defense

2024-11-11

Pages

288 p.



Department/Institute

Universitat Pompeu Fabra. Departament de Medicina i Ciències de la Vida

Doctorate programs

Programa de Doctorat en Biomedicina

Abstract

The resilience of proteins against degradation makes them the longest surviving resource for genomic information. Knowing how much information we can obtain from an ancient sample is crucial because most sampling strategies are destructive. However, we still lack a broad understanding of the potential and limitations of phylogenetic inference based on ancient protein sequences. This thesis investigates the utility of paleoproteomics for phylogenetic applications with a focus on dental enamel proteins. Simulated ancient protein sequence data from 232 extant primates shows that fragmented proteomes of ~600 - 1000 amino acids still produce trees that are accurate at family level, often even at genus level. However, the enamel proteome does not have sufficient information to separate species of the same genus. These findings were corroborated by examining 1 Ma - 10 ka protein remains from Iberian equids for their phylogenetic utility and amelogenin-based sex determination. The specimen’s broad age range also provides insight into mechanisms of protein degradation.


La resiliència de les proteïnes envers la degradació les converteix en el recurs més llongeu per a l’obtenció d’informació genòmica. Saber quina informació podem obtenir d’una mostra antiga és crucial perquè la majoria de les estratègies de mostreig són destructives. Tot i això, encara no coneixem a fons el potencial i les limitacions de la inferència filogenètica basada en seqüències de proteïnes antigues. Aquesta tesi investiga la utilitat de la paleoproteòmica per a aplicacions filogenètiques, amb un enfocament en les proteïnes de l'esmalt dental. Les dades simulades de seqüències de proteïnes antigues a partir de 232 primats actuals mostren que els fragments de proteomes de ~600 - 1000 aminoàcids encara produeixen arbres que són precisos a nivell familiar, i fins i tot a nivell de gènere. No obstant això, el proteoma de l'esmalt no té prou informació per separar espècies dins del mateix gènere. Aquestes troballes s’han corroborat examinant restes de proteïnes de 1 Ma - 10 ka d'èquids ibèrics per la seva utilitat filogenètica i la determinació del sexe basada en l'amelogenina. L'ampli rang d’antiguitat dels espècimens també ens proporciona informació sobre els mecanismes de degradació de proteïnes.

Keywords

Paleoproteomics; Phylogeny; Dental enamel; Equids; Mass Spectrometry; Paleoproteòmica; Filogènia; Esmalt dental; Èquids; Espectrometria de masses

Subjects

575 - General genetics. General cytogenetics. Immunogenetics. Evolution. Phylogeny

Documents

This document contains embargoed files until 2026-11-11

Rights

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-sa/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-sa/4.0/

This item appears in the following Collection(s)