Aplicacions de visualització d'informació georeferenciada

Author

Lagonigro Bertran, Raymond

Director

Oller, Ramon

Codirector

Martori, Joan Carles

Date of defense

2021-02-16

Pages

89 p.



Department/Institute

Universitat de Vic - Universitat Central de Catalunya. Departament d'Economia i Empresa

Doctorate programs

Programa de Doctorat: Dret, Economia i Empresa

Abstract

En un context on les eines de geolocalització són cada vegada més habituals, els sistemes de recopilació i difusió de dades estadístiques poden integrar noves eines per publicar informació georeferenciada amb una resolució espacial molt precisa. Al mateix temps, aquesta precisió pot generar problemes de confidencialitat de les persones, llars o empreses a qui fan referència aquestes dades, perquè en pot facilitar la identificació. Ens trobem amb un conflicte entre la capacitat per publicar dades amb un nivell de precisió geogràfica molt acurat i, al mateix temps, complir les diferents normatives de confidencialitat en la difusió de dades estadístiques. Habitualment, les agències d’estadística utilitzen sistemes de recopilació basats en divisions espacials administratives que els permeten fer particions del territori orientades a una millor organització de les dades. Aquestes particions també permeten assegurar confidencialitat, però no sempre són la forma de difusió més adequada quan les dades han de ser utilitzades per realitzar determinades anàlisis espacials. En aquesta tesi proposem una metodologia alternativa per la distribució de dades que, a partir d’una quadrícula inicial de mida constant, divideix jeràrquicament l’espai per obtenir una quadrícula irregular que agrupa la informació balancejant criteris de confidencialitat i maximització de la precisió espacial. Les quadrícules generades amb aquesta metodologia es basen en un sistema de codificació de les caselles que segueix la nomenclatura proposada per la Oficina d’Estadística de la Unió Europea, per la creació d’un conjunt de dades de població únic per la UE en forma de quadrícula. Mesurar la importància dels efectes espacials requereix disposar de dades amb la precisió més acurada possible i, si és possible, a una escala espacial propera a la del fenomen estudiat. En aquest sentit, aquesta tesi també presenta dos estudis de dos fenòmens espacials utilitzant la informació disponible amb els sistemes actuals basats en seccions censals. En ambdós estudis els fenòmens investigats estan caracteritzats a una resolució espacial molt precisa, mentre que les dades disponibles per detectar-ne possibles correlacions espacials estan agregades en unitats espacials a molta menys resolució. Per tal de comparar els diferents processos cal transformar les dades per tenir-les a una mateixa escala. Aquestes transformacions poden esbiaixar els resultats de les anàlisis. La metodologia proposada està orientada a permetre realitzar aquests tipus d’estudis amb dades més precises. Aquesta metodologia està desenvolupada en una llibreria per l’entorn estadístic R, per tal de produir dades per a aquest entorn, però també exportables a formats estàndard per a qualsevol altre sistema d’informació geogràfica. Aquesta llibreria està publicada al repositori habitual de programari R i pot ser descarregada i instal·lada per publicar dades basades en quadrícula a partir de qualsevol conjunt de dades espacials. En el futur, aquesta llibreria permetrà que els instituts d’estadística publiquin informació amb una millor precisió geogràfica per la realització d’anàlisis espacials.


In a context where geolocation tools are becoming more common, statistical data collection and dissemination systems should include new tools to release georeferenced information with precise spatial resolution. At the same time, this accuracy may trigger confidentiality issues for individuals, households or companies to whom this data refers, because it can enable their re-identification. There is a conflict between the dissemination of data at an accurate level of geographical precision and, at the same time, fulfill the different confidentiality regulations on the distribution of statistical data. Statistical offices typically use collection systems based on administrative boundaries to divide the territory and assist data organization. These partitions are also useful to ensure confidentiality but may not be the most appropriate form of dissemination when data should be used to study spatial effects of different phenomena. In this thesis we propose an alternative methodology for data distribution which takes an initial constant size grid, and successively divides the space to obtain an irregular grid that groups the information balancing confidentiality and spatial resolution. Grids produced using this methodology are based on a cell coding system following the indications proposed by the Statistical Office of the European Union, to represent the main characteristics of the population on a unique constant grid. Measuring the importance of spatial effects requires having data at an accurate spatial resolution and, when possible, on a scale close to that of the phenomenon studied. In this regard, this thesis also presents two studies of spatial phenomena conducted with the information available using the current systems based on census tracts. In both studies the investigated phenomena are characterized at a very precise spatial resolution, while the available data to detect possible spatial correlations is aggregated in spatial units with much less resolution. In order to compare the different processes, data must be transformed to the same geographic scales. These transformations may have undesired effects on the results of the analyses. The proposed methodology undertakes the production of more accurate spatial datasets to avoid those possible skewing effects. The methodology is fully developed on a library in the statistical software R, in order to produce data for this environment, but it can also be exported to standard data formats for any other geographic information system. The library is published in the usual R software repository and can be downloaded and installed to publish grid-based datasets from any spatial point data. In the future, this library will allow statistical offices to provide more accurate spatial information to perform spatial analysis.

Keywords

Geolocalització, Serveis de; Estadística; Sistemes d'informació geogràfica; Dades geoespacials

Subjects

311 - Statistics as a science. Statistical theory

Knowledge Area

Estadística

Documents

tesdoc_a2021_lagonigro_raymond_aplicacions_visualitzacio.pdf

1.277Mb

 

Rights

ADVERTIMENT. Tots els drets reservats. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)