Aplicació de models supervisats per a l’estudi de provinença arqueològica i certificació d'origen de ceràmiques

Autor/a

Anglisano Roca, Anna

Director/a

Casas Duocastella, Lluís

Fecha de defensa

2023-05-24

Páginas

89 p.



Programa de doctorado

Universitat Autònoma de Barcelona. Programa de Doctorat en Geologia

Resumen

Aquesta tesi doctoral se centra en l’ estudi de ceràmiques i argiles. Ara bé, aquesta caracterització es planteja amb una finalitat molt concreta: la distinció d’ argiles de jaciments amb contextos geològics similars i la transferència d’ aquesta distinció a les corresponents produccions ceràmiques. Inicialment es van abordar diverses estratègies de caracterització que van conduir cap a l’ aproximació geoquímica i el tractament estadístic de les dades; aquestes metodologies són les que varen resultar més efectives per classificar mostres (indistintament d’ argiles o ceràmica) segons el seu origen. En particular, la metodologia estadística que s’ ha demostrat més eficaç ha estat l’ ús de models de classificació d’ aprenentatge automàtic supervisat (supervised machine learning). L’ adjectiu supervisat fa referència al fet que s’ utilitzen dades geoquímiques de referència de les quals es coneix amb certesa l’ origen. En una primera fase s’ empren part de les mostres de referència (amb origen conegut) per entrenar els models de classificació. En una segona etapa es comprova si l’ aprenentatge ha estat efectiu comparant les assignacions d’ origen que fan els models a la resta de dades de referència amb el seu origen real. Cal destacar que les dades emprades en aquesta segona etapa no s’ ha fet servir durant la fase d’ entrenament. La tesi es presenta com a compendi de publicacions amb dos articles que exploten aquesta aproximació estadística de classificació supervisada. En el primer article publicat (l’ any 2020 a Minerals MDPI) es va treballar amb una base de dades de més de 200 anàlisis químiques d’ argiles i ceràmiques de 6 centres de producció ceràmica local catalana (Breda, Quart, La Bisbal d’ Empordà, Sant Julià de Vilatorta, Esparreguera i Verdú). En aquest treball es demostra la capacitat dels models entrenats de classificar correctament les mostres (amb taxes d’ èxit de l’ ordre del 80%). Es proposa l’ aplicació d’ aquesta capacitat de discriminació per certificar l’ ús d’ argiles locals i autentificar produccions ceràmiques. En el segon article (publicat l’ any 2022 a Sustainability MDPI) es va ampliar la base de dades amb un nou centre productor de referència (Barcelona), arribant a reunir gairebé 300 anàlisis químiques d’ argiles i ceràmiques. A l’ article s’ aplica la capacitat classificadora dels models a la determinació de la provinença (lloc de fabricació) de mostres arqueològiques de ceràmica. Es va treballar amb 38 mostres que conformen 5 grups tipològics: tres obtinguts al Castell de Montsoriu, un a Torre de la Mora (tots dos jaciments propers a Breda) i un altre grup recuperat a la Creueta (jaciment proper a Quart). Els models entrenats van coincidir a identificar un dels grups recuperats al Castell de Montsoriu com a producció barcelonina amb probabilitats de l’ ordre del 90%, confirmant així la hipòtesi arqueològica. En canvi els altres 4 grups estudiats no procedirien de cap dels centres productors que conformen la base de dades de referència. L’ aproximació estadística supervisada s’ ha demostrat efectiva per certificar l’ origen de produccions ceràmiques modernes i per a la investigació de provinença de ceràmica arqueològica. La complexitat dels algorismes que contenen els models de classificació i la seva implementació pot ser un factor que juga en contra de la seva popularització. Per això en aquesta tesi també s’ ha desenvolupat un codi de lliure distribució i fàcil de fer servir per afavorir l’ adopció d’ aquesta aproximació per part d’ usuaris sense coneixements avançats de programació. Es preveu continuar la recerca exportant aquesta metodologia a la investigació de provinença de mostres arqueològiques no ceràmiques, en particular marbres.


Esta tesis doctoral se centra en el estudio de cerámicas y arcillas. Sin embargo, esta caracterización se plantea con un propósito muy concreto: la distinción entre arcillas de yacimientos con contextos geológicos similares y la transferencia de esta distinción a las correspondientes producciones cerámicas. Inicialmente se abordaron diversas estrategias de caracterización que condujeron hacia la aproximación geoquímica y el tratamiento estadístico de los datos; estas metodologías son las que resultaron más efectivas para clasificar muestras (arcillas o cerámica indistintamente) según su origen. En particular, la aproximación estadística que se ha demostrado más eficaz ha sido el uso de modelos de clasificación de aprendizaje automático supervisado (supervised machine learning). El adjetivo supervisado hace referencia al hecho que se utilizan datos geoquímicos de referencia de los cuales se conoce con certeza el origen. En una primera etapa se usan parte de las muestras de referencia (con origen conocido) para entrenar los modelos de clasificación. En una segunda etapa se comprueba si el aprendizaje ha sido efectivo mediante la comparación de las asignaciones de origen que hacen los modelos sobre el resto de datos de referencia. Cabe destacar que los datos usados en esta segunda etapa no se han utilizado durante la fase de entrenamiento. La tesis se presenta como un compendio de publicaciones con dos artículos que explotan la aproximación estadística supervisada. En el primer artículo publicado (en el año 2020 en Minerals MDPI) se trabajó con una base de datos de más de 200 análisis químicos de arcillas y cerámicas de 6 centros de producción cerámica local catalana (Breda, Quart, La Bisbal d’Empordà, Sant Julià de Vilatorta y Verdú). En el artículo se demuestra la capacidad de los modelos entrenados de clasificar correctamente las muestras (con tasas de éxito del orden del 80%). Se propone la aplicación de esta capacidad de discriminación para certificar el uso de arcillas locales y autentificar producciones cerámicas. En el segundo artículo publicado (en el año 2022 en Sustainability MDPI) se amplió la base de datos con un nuevo centro productor de referencia (Barcelona), llegando a reunir casi 300 análisis químicos de arcillas y cerámicas. En el artículo se aplica la capacidad clasificadora- de los modelos para determinar la proveniencia (lugar de fabricación) de muestras arqueológicas de cerámica. Se trabajó con 38 muestras que conforman 5 grupos tipológicos (tres obtenidos en el Castell de Montsoriu, uno en Torre de la Mora, ambos yacimientos cercanos a Breda) y otro grupo recuperado en la Creueta (yacimiento cercano a Quart). Los modelos entrenados coincidieron en identificar uno de los grupos recuperados en el Castell de Montsoriu como una producción barcelonesa con probabilidades del orden del 90%, confirmando así la hipótesis arqueológica. En cambio, los otros 4 grupos estudiados no tendrían como origen ninguno de los centros productores que conforman la base de datos de referencia. La aproximación estadística supervisada se ha demostrado efectiva para certificar el origen de producciones cerámicas modernas y para la investigación de proveniencia de cerámica arqueológica. La complejidad de los algoritmos que contienen los modelos de clasificación y su implementación puede ser un factor que juega en contra de su popularización. Por eso, en esta tesis también se ha desarrollado un código de distribución libre y fácil de usar para favorecer la adopción de esta aproximación por parte de usuarios sin conocimientos avanzados de programación. Se prevé continuar la investigación iniciada para exportar esta metodología a la investigación de proveniencia de muestras arqueológicas no cerámicas, en particular mármoles.


This doctoral thesis focuses on the study of ceramics and clays. However, this characterization is approached with a very specific purpose: the distinction between clays bearing similar geological contexts and the transfer of this distinction to the corresponding ceramic productions. Initially, a number of different characterization strategies were attempted and progressively we have been directed towards a statistical approach based on geochemical data, as an effective methodology to classify the samples (either clays or ceramics) according to their origin. In particular, the statistical approach that has proven to be more successful is the use of supervised machine learning classification models. The term supervised refers to the fact that this approach uses geochemical samples from known origin as reference class-labelled samples. In a first step, the models are trained with part of the class-labelled samples. In a second step, the efficiency of the training process is verified using the rest of the reference samples by comparing the class assignments made by the models to their actual origin. It is worth to mention that the data that is used in the second step has not participated in the training process. The thesis is presented as a compendium of publications with two articles that exploit the supervised statistical approach. The first published article (in 2020 within Minerals MDPI) manages a database of over 200 chemical analyses of clays and pottery from 6 Catalan ceramic production centers (Breda, Quart, La Bisbal d'Empordà, Sant Julià de Vilatorta, and Verdú). The article demonstrates the ability of the trained models to classify samples correctly (with success rates of around 80%). The application of this discrimination capacity is proposed as a way to certify the use of local clays and authenticate ceramic productions. In the second published article (in 2022 within Sustainability MDPI) the database was expanded by adding a new reference production center (Barcelona) and reaching around 300 entries of pottery and clay chemical analyses. In this paper the ability to classify samples according to their provenience (place of manufacture) is applied to archaeological ceramic samples. A total of 38 samples from 5 typological groups were studied, three were retrieved in the Castell de Montsoriu, one in Torre de la Mora, both sites near Breda and another group was recovered in La Creueta (a site near Quart). The different trained models agreed to assign one of the groups from the Castell de Montsoriu to the Barcelona class with probabilities of around 90%, thus confirming the archaeological hypothesis. On the other hand, the other 4 groups studied would not belong to any of the classes (production centers) contained within the reference database. The supervised statistical approach has proven to be effective both to certify the provenance of modern ceramic productions and to explore the provenience of archaeological pottery. The complexity of the algorithms used by the classification models and their implementation can be a discouraging factor to their popularization. To counteract this, the thesis contains a freeware and easy-to-use code to help users without advanced programming knowledge to apply the supervised approach. We plan to pursue the developed research by exporting the supervised approach to provenance research on non-ceramic archaeological samples, in particular marbles.

Palabras clave

Arqueologia; Arqueología; Archaeology; Geologia; Geología; Geology

Materias

55 - Geología. Meteorología

Área de conocimiento

Ciències Socials

Documentos

aar1de1.pdf

14.43Mb

 

Derechos

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/

Este ítem aparece en la(s) siguiente(s) colección(ones)