Universitat de Barcelona. Departament de Biblioteconomia, Documentació i Comunicació Audiovisual
[cat] La dialèctica sobre si l’objecte de la gestió documental ha d’incloure també la informació estructurada, o limitar-se només als documents, en tant que objectes discrets, es remunta a l’aparició de la tecnologia informàtica. En el segon DLM Forum on Electronic Records Stephen Harries plantejava la dicotomia entre una orientació basada en la gestió de documents (la perspectiva docucèntrica), i una orientació basada en la gestió d’informació estructurada (la perspectiva datacèntrica) (Harries, 2000). Era el moment de l’emergència de la gestió documental electrònica (EDMS), i diversos factors, que s’analitzen en aquesta tesi, es van combinar per donar preponderància dins l’arxivística a la perspectiva docucèntrica. Aquesta presa de posició va tenir com a conseqüència l’ajornament en el temps de la reflexió sobre la significació i el valor d’ús de les agrupacions documentals en els entorns de gestió basats en dades. Així doncs, quan en la dècada dels 2000 va tenir lloc la gran normalització de la gestió documental (ISO 15489 i derivats), es va assumir que les mateixes metodologies i conceptes eren aplicables tant a l’entorn paper com al digital. En paral·lel amb aquesta evolució, la tecnologia per a la gestió d’informació estructurada va fer un salt molt important, l’anomenada revolució del Big Data, i l’arquitectura amb la qual les organitzacions estructuraven els seus sistemes d’informació també va evolucionar cap a models més flexibles (Data Lake) i de gestió descentralitzada. La gestió documental ha reaccionat tard a la revolució del Big Data. Malgrat una certa recuperació de terreny, de la mà de la progressiva incorporació de datasets en els arxius digitals, i d’avenços en els plantejaments ontològics dels models de descripció, existeix un buit en les metodologies de la gestió documental que allunya la gestió documental del govern de la dada. Les agrupacions documentals són la base per l’aplicació de polítiques de gestió documental, i la pervivència de la gestió documental com a disciplina depèn en conseqüència del concepte d’agrupació documental. Aquest és l’objectiu que s’ha plantejat aquesta tesi: esbrinar quina part o manifestació d’un entorn de treball dadificat pot adquirir significació documental (d’agrupació) i ser objecte de l’aplicació de polítiques de gestió documental. Per analitzar les relacions que poden donar resposta a aquest objectiu calia disposar del mapa complet d’actius d’informació d’una organització fins al nivell de dada. L’estat de la qüestió ha posat de relleu que manquen referents metodològics que aportin una visió completament integrada, i que incorporin la visió al nivell de la dada, per la qual cosa s’ha optat en aquesta tesi per utilitzar una metodologia de desenvolupament propi, posant a prova un mètode de treball que pugui ser d’utilitat per a l’experimentació i la recerca en d’altres projectes i entorns similars. El primer pas ha estat fixar uns criteris metodològics amb l’elaboració de dues guies: la Guia d’inventari i mapatge (GMAP) i la Guia de dadificació de processos (GDAD). Juntament amb les guies, i amb l’objectiu d’estructurar la informació recollida, s’ha elaborat un model de descripció propi, una eina informàtica per al mapatge dels actius d’informació, i un conjunt de 83 indicadors per a la mesura i anàlisi del nivell de dadificació d’una organització, instruments que s’han aplicat a un cas d’estudi (un ens del sector públic català). Les conclusions, a partir d’una anàlisi de les característiques de la sèrie documental dadificada i de l’ecosistema tecnològic on aquesta sèrie habita, aprofundeixen en els diferents nivells d’equivalència entre la sèrie documental i el sistema d’informació, i entre les tipologies de sèries i de sistemes, com també en la significació de les visualitzacions de dades, tot proposant finalment un replantejament dels models de classificació arxivístics actuals per adaptar-los a la classificació de dades.
[spa] La dialéctica sobre si el objeto de la gestión documental debe incluir también la información estructurada, o limitarse sólo a los documentos, en tanto que objetos discretos, se remonta a la aparición de la tecnología informática. En el segundo DLM Forum on Electronic Records Stephen Harries planteaba la dicotomía entre una orientación basada en la gestión de documentos (la perspectiva docucéntrica), y una orientación basada en la gestión de información estructurada (la perspectiva datacéntrica) (Harries, 2000). Era el momento de la emergencia de la gestión documental electrónica (EDMS), y varios factores, que se analizan en esta tesis, se combinaron para dar preponderancia en la archivística a la perspectiva docucéntrica. Esta toma de posición tuvo como consecuencia el aplazamiento en el tiempo de la reflexión sobre la significación y valor de uso de las agrupaciones documentales en los entornos de gestión basados en datos. Así, cuando en la década de 2000 tuvo lugar la gran normalización de la gestión documental (ISO 15489 y derivados), se asumió que las mismas metodologías y conceptos eran aplicables tanto al entorno papel como al digital. En paralelo con esta evolución, la tecnología para la gestión de información estructurada dio un salto muy importante, la llamada revolución del Big Data, y la arquitectura con la que las organizaciones estructuraban sus sistemas de información también evolucionó hacia modelos más flexibles (Data Lake) y de gestión descentralizada. La gestión documental ha reaccionado tarde a la revolución del Big Data. A pesar de una cierta recuperación de terreno, de la mano de la progresiva incorporación de datasets en los archivos digitales, y de avances en los planteamientos ontológicos de los modelos de descripción, existe un vacío en las metodologías de la gestión documental que aleja la gestión documental del gobierno del dato. Las agrupaciones documentales son la base para la aplicación de políticas de gestión documental y la pervivencia de la gestión documental como disciplina depende en consecuencia del concepto de agrupación documental. Éste es el objetivo que se ha planteado esta tesis: averiguar qué parte o manifestación de un entorno de trabajo datificado puede adquirir significación documental (de agrupación) y ser objeto de la aplicación de políticas de gestión documental. Para analizar las relaciones que pueden dar respuesta a este objetivo era necesario disponer del mapa completo de activos de información de una organización hasta el nivel de dato. El estado de la cuestión ha puesto de relieve que faltan referentes metodológicos que aporten una visión completamente integrada, y que incorporen la visión al nivel del dato, por lo que se ha optado en esta tesis por utilizar una metodología de desarrollo propio , poniendo a prueba un método de trabajo que pueda ser de utilidad para la experimentación y la investigación en otros proyectos y entornos similares. El primer paso ha sido fijar unos criterios metodológicos con la elaboración de dos guías: la Guía de inventario y mapeo (GMAP) y la Guía de dadificación de procesos (GDAD). Junto con las guías, y con el objetivo de estructurar la información recogida, se ha elaborado un modelo de descripción propio, una herramienta informática para el mapeo de los activos de información, y un conjunto de 83 indicadores para la medida y análisis del nivel de datificación de una organización, instrumentos que se han aplicado a un caso de estudio (un ente del sector público catalán). Las conclusiones, a partir de un análisis de las características de la serie documental datificada y del ecosistema tecnológico donde esta serie habita, profundizan en los diferentes niveles de equivalencia entre la serie documental y el sistema de información, y entre las tipologías de series y sistemas, así como en la significación de las visualizaciones de datos, proponiendo finalmente un replanteamiento de los modelos de clasificación archivísticos actuales para adaptarlos a la clasificación de datos.
[eng] The dialectic about whether the object of records management should also include structured information, or be limited only to documents, as discrete objects, dates back to the emergence of computer technology. In the second DLM Forum on Electronic Records Stephen Harries raised the dichotomy between an orientation based on the management of documents (the docucentric perspective), and an orientation based on the management of structured information (the datacentric perspective) (Harries, 2000). It was the time of the emergence of electronic document management (EDMS), and several factors, which are analyzed in this thesis, combined to give preponderance to the docucentric perspective in the records management discipline. This position had, as a consequence, the postponement in time of the thinking about the significance and value of records aggregations in data-based management environments. Thus, when the great standardization of records management took place in the 2000s (ISO 15489 and derived standards), it was assumed that the same methodologies and concepts were applicable to both the paper and digital environments. In parallel with this evolution, the technology for data management took a very important leap, the so-called Big Data revolution, and the architecture with which organizations structured their information systems also evolved towards more flexible models (Data Lake) and decentralized management. Records management has reacted late to the Big Data revolution. Despite a certain recovery, hand in hand with the progressive transfer of datasets to digital archives, and advances in the ontological approaches of description models, there is a gap in records management methodologies that distances records management from data governance. Records aggregations are the basis for the application of records management policies, and the survival of records management as a discipline consequently depends on the concept of records aggregation. This is the objective of this thesis: to find out which part or manifestation of a data-based work environment can acquire records significance (be considered an aggregation) and be the subject of the application of records management policies. To analyze the relationships needed for this objective, it was necessary to build the complete map of an organization's information assets, down to data level. The state of the art highlighted that there is a lack of methodological references providing a completely integrated vision, and incorporating the vision at the data level. By this reason, I decided in this thesis to develop my own methodology, testing a working method that could be useful for experimentation and research in other similar projects and environments. The first step has been to establish methodological criteria with the development of two guides: the Inventory and Mapping Guide (GMAP) and the Process Datafication Guide (GDAD). Together with the guides, and with the objective of structuring the information collected, a description model has been developed, a computer tool for mapping information assets, and a set of 83 indicators for measuring and analyzing the level of datafication of an organization, instruments that have been applied to a case study (a Catalan public sector entity). The conclusions, based on an analysis of the characteristics of the datafied records series and the technological ecosystem where this series lives, delve into the different levels of equivalence between the records series and the information systems, and between the typologies of series and systems, as well as the significance of data visualizations, finally proposing a rethinking of current archival classification models to adapt them to the classification of data.
Gestió dels documents; Gestión documental; Records management; Arxivística; Archivística; Archive science; Tecnologia de la informació; Tecnología de la información; Information technology; Gestió de la informació; Gestión de la información; Information resources management; Sistemes d'informació; Sistemas de información; Information storage and retrieval systems; Gestió electrònica de documents; Gestión electrònica de documentos; Document imaging systems; Conjunts de dades; Conjuntos de datos; Data sets; Bases de dades; Bases de datos; Databases; Estructures de dades (Informàtica); Estructuras de datos (Informática); Data structures (Computer science); Xarxes semàntiques (Teoria de la informació); Redes semánticas (Teoría de la información); Semantic networks (Information theory); Bancs de dades; Bancos de datos; Data centers; Ontologies (Informàtica); Ontologías (Informática); Ontologies (Information retrieval)
02 - Librarianship
Ciències de l'Educació
Programa de Doctorat en Informació i Comunicació
ADVERTIMENT. Tots els drets reservats. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.