La creació de bases de dades historicodemogràfiques: Procediments i aplicacions al canvi social (S. XVI-XIX)

Author

Valls Fígols, Miquel

Director

Cabré, Anna, 1943-

Pujadas Mora, Joana Maria

Date of defense

2021-04-16

Pages

150 p.



Doctorate programs

Universitat Autònoma de Barcelona. Programa de Doctorat en Demografia

Abstract

Aquesta tesi doctoral està realitzada mitjançant el compendi de 4 assajos, que es vertebren entorn als procediments per a la creació de grans bases de dades historicodemogràfiques de caràcter individual i la seva aplicabilitat en l’estudi del canvi social a llarg termini (segles XIV – XX). La construcció de bases de dades és una de les tasques primordials per a la investigació en Demografia Històrica encara que s’utilitzi l’ordinador. Malauradament, la recollida de dades sempre és una tasca costosa que necessita molta dedicació. Així, la reducció del temps de creació de les dades és un repte cabdal ja que permetrà construir bases de dades més àmplies amb la idea de què puguin abastar períodes cronològics llargs i aglutinar diferents fonts per tal de participar de la revolució del Big Data. Aquest repte de caràcter metodològic es correspon amb els dos primers assajos: “The Baix Llobregat (BALL) Demographic Database, between Historical Demography and Computer Vision (nineteenth – twentieth centuries)” i “Knowledge graph based methods for record linkage”. La ‘ALL database’ s’ha creat a partir dels padrons i censos de població de la comarca del Baix Llobregat amb l’aplicació d’algoritmes de visió per computador per a la lectura automàtica de les fonts, l’entrenament d’aquests algoritmes mitjançant la transcripció manual d’aquelles -crowdsourcing-, la seva validació a partir de videojocs i la vinculació automàtica dels individus al llarg del temps i del territori a partir de les anomenades string distances i de mètodes de knowledge graph. L’aplicació de totes aquestes metodologies han mostrat una reducció molt substanciosa en el temps de construcció de la base de dades mencionada. A més, aquestes han permès la complexitat de les bases a partir de la vinculació de diferents observacions demogràfiques i socioeconòmiques d’un mateix individu que fins i tot poden provenir de fonts diverses Pel que fa als assajos tres i quatre: “A tals pares, tals fills: Transmissió intergeneracional a Sabadell, segles XVI – XVII” i “What counted most for secularization: Politics, economy or family? Shifting seasonality of marriages in the Barcelona area, 1715-1880” representen dos exemples de temes d’interès demogràfic i històric que es poden estudiar a través de les dades anteriorment comentades i de la Barcelona Historical Marriage Database, una base de dades única creada en el marc del projecte ‘Five Centuries of Marriages’ dirigit per la Professora Cabré i finançat per l’European Research Council. L’anàlisi de la transmissió intergeneracional a l’Antic Règim permet observar una important perdurabilitat dels oficis en les famílies tot i que també es copsa una certa mobilitat, sobretot entre el sector pagès i artesà, que anteriorment s’havia tendit a pensar que aquesta era menor. També es detecta l’existència d’una segmentació important en el mercat matrimonial entre teixidors i paraires que recorda els seus conflictes gremials. L’anàlisi de l’estacionalitat del matrimoni representa una manera indirecta d’aproximar-se al procés de secularització de la societat occidental. A més, l’estudi de l’efecte del període polític i la influència familiar en el calendari nupcial constitueix dues novetats importants en la historiografia existent sobre aquest tema. Aquests anàlisis s’han realitzat a partir d’una aproximació quantitativa basada amb l’anàlisi descriptiu combinat amb una perspectiva multivariable.


Esta tesis doctoral se ha realizado mediante el compendio de 4 ensayos, que se estructuran entorno a los procedimientos para la creación de grandes bases de datos histórico-demográficas de carácter individual i su aplicabilidad en el estudio del cambio social a largo plazo (siglos XVI-XIX). La construcción de bases de datos es una de las tareas primordiales para la investigación en Demografía Histórica, aunque se utilice el ordenador. Desafortunadamente, la recogida de datos siempre es una tarea laboriosa que requiere mucha dedicación. Así, la reducción del tiempo de creación de los datos es un reto primordial para permitir construir grandes bases de datos con la idea de poder abastar periodos cronológicos largos y aglutinar diferentes fuentes para participar de la revolución del Big Data. Este reto de carácter metodológico se corresponde con los dos primeros ensayos: “The Baix Llobregat (BALL) Demographic Database, between Historical Demography and Computer Vision (nineteenth – twentieth centuries)” y “Knowledge graph based methods for record linkage”. La ‘BALL Database’ se ha creado a partir de los padrones y censos de población de la comarca del Baix Llobregat con la aplicación de algoritmos de visión por computador para la lectura automática de las fuentes, el aprendizaje de estos algoritmos mediante la transcripción manual – crowdsourcing -, su validación mediante videojuegos y la vinculación automática de los individuos a lo largo del tiempo y del territorio a partir de métodos de string distances y knowledge graph. La apliación de todas estas metodologías ha demostrado una reducción muy sustancial en el tiempo de construcción de la base de datos mencionada. A más a más, estas han permitido la complejidad de las bases mediante la vinculación de diferentes observaciones demográficas y socioeconómicas de un mismo individuo que hasta puede proceder de fuentes distintas. Respecto a los ensayos tres y cuatro: “A tals pares, tals fills: Transmissió intergeneracional a Sabadell, segles XVI – XVII” y “What counted most for secularization: Politics, economy or family? Shifting seasonality of marriages in the Barcelona area, 1715-1880”, representan dos ejemplos de temas de interés demográfico y histórico que se pueden estudiar mediante los datos anteriormente comentados y de la Barcelona Historical Marriage Database, una base de datos única creada en el marco del proyecto ‘Five Centuries of Marriages’ dirigido por la Profesora Cabré y financiado por el European Research Council. El análisis de la transmisión intergeneracional en el Antiguo Régim, permite observar una importante perdurabilidad de las ocupaciones en las familias todo y que también se observa una cierta movilidad, sobre todo entre el sector campesino y artesano, que anteriormente se creía que era menor. También se detecta la existencia de una segmentación importante en el mercado matrimonial entre tejedores y pelaires que recuerda sus conflictos gremiales. El análisis de la estacionalidad del matrimonio representa una forma indirecta de aproximación al proceso de secularización de la sociedad occidental. Así, el estudio del efecto del periodo político y la influencia familiar en el calendario nupcial constituyen dos novedades importantes en la historiografía existente sobre este tema. Estos análisis se han realizado a partir de una aproximación cuantitativa basada en el análisis descriptivo combinado con una perspectiva multivariable.


This doctoral dissertation has been carried out through the compendium of 4 essays on the procedures for the creation of large individual historical-demographic databases and their applicability to the study of long-term social change (16th - 19th centuries). Building databases is one of the key tasks in Historical Demography research. Unfortunately, data collection is always a costly task that requires a lot of dedication even using personal computers. Thus, reducing data creation time is a major challenge as it will allow for the construction of larger databases covering long periods and bringing together different sources in order to participate in the Big Data revolution. This methodological challenge has been addressed in the first two essays: “The Baix Llobregat (BALL) Demographic Database, between Historical Demography and Computer Vision (nineteenth - twentieth centuries)” and “Knowledge graph based methods for record linkage”. The ‘BALL database’ has been created from the population registers and national censuses of the Baix Llobregat region with the application of computer vision algorithms for the (automatic) handwriting recognition of original sources, the training of these algorithms through the manual transcription of sources –using crowdsourcing-, their validation using video games and the automatic linkage of individuals over time and territory using the so-called string distances and knowledge graph methods. The application of all these methodologies has shown a very substantial reduction in the construction time of the mentioned database. In addition, these have allowed the complexity of the bases linking different demographic and socioeconomic observations of the same individuals that can even come from different sources. Regarding the third and fourth essays: “A tals pares, tals fills: Transmissió intergeneracional a Sabadell, segles XVI – XVII” and “What counted most for secularization: Politics, economy or family? Shifting seasonality of marriages in the Barcelona area, 1715-1880”, they represent two examples of topics of demographic and historical interest that can be studied through the data mentioned above and the Barcelona Historical Marriage Database, a unique database created within the framework of the ‘Five Centuries of Marriages’ project leaded by Professor Cabré and funded by the European Research Council. The analysis of the intergenerational transmission in an Old Regime society allows us to observe an important durability of the trades in the families, although a certain mobility is also seen, especially between the farmers and artisans, which previously was considered almost immobile groups. The existence of an important segmentation in the marriage market between weavers and paraires is also detected, which recalls their guild conflicts. The analysis of the seasonality of marriage represents an indirect way of approaching the secularization process of Western society. Furthermore, the study of the effect of the political period and the family influence on the nuptial calendar constitutes two important novelties in the existing historiography on this subject. These analyzes have been carried out from a quantitative approach based on descriptive analysis combined with a multivariate perspective.

Keywords

Demografia; Demografía; Demography; Bases de dades; Bases de datos; Database; Història; Historia; History

Subjects

314 - Demography. Population studies

Knowledge Area

Ciències Humanes

Documents

mvf1de1.pdf

7.969Mb

 

Rights

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-sa/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-sa/4.0/

This item appears in the following Collection(s)