Co-Utile protocols for decentralized computing

Author

Manjón Paniagua, Jesús Alberto

Director

Domingo Ferrer, Josep

Blanco Justicia, Alberto

Date of defense

2023-11-20

Pages

160 p.



Department/Institute

Universitat Rovira i Virgili. Departament d'Enginyeria Informàtica i Matemàtiques

Abstract

La computació descentralitzada és un paradigma que distribueix les tasques informàtiques i la presa de decisions mitjançant una xarxa, oferint avantatges, com resistència, escalabilitat, privadesa i menor dependència d'entitats centrals. La computació descentralitzada permet abordar la tensió existent entre el RGPD i l'anàlisi de macrodades. El RGPD pretén protegir els drets de privadesa de les persones i garantir el tractament responsable de les dades personals. En canvi, l'anàlisi de macrodades requereix sovint recopilar i processar grans quantitats de dades personals per descobrir correlacions, tendències i models predictius. Protocols descentralitzats com l'Aprenentatge Federat o l'Aprenentatge Federat Totalment Descentralitzat ofereixen una solució a aquest dilema en eliminar la necessitat d'intercanviar dades des dels dispositius client als servidors globals. En el seu lloc, les dades dels dispositius perifèrics s'utilitzen per entrenar els models localment, cosa que augmenta la privadesa. Aquesta tesi es centra en una de les qüestions més importants en aquest tipus de protocols: com garantir que tots els agents implicats actuïn com s'espera. Els nodes que es desvien deliberadament podrien fer-ho per atacar el sistema o simplement per aprofitar-se'n sense contribuir. Basant-nos en la noció de coutilitat, hem dissenyat diversos protocols per resoldre el conflicte entre la privadesa i algunes propietats de seguretat en tres escenaris diferents de computació descentralitzada i preservadora de la privadesa: i) Aprenentatge federat; ii) Aprenentatge totalment descentralitzat; i iii) Computació multipart. Aquests tipus de protocols faciliten la col·laboració entre múltiples parts o entitats per assolir un objectiu comú i operen sota certs supòsits de confiança.


La computación descentralizada es un paradigma que distribuye las tareas informáticas y la toma de decisiones a través de una red, ofreciendo ventajas como resiliencia, escalabilidad, privacidad y una menor dependencia de autoridades centrales. La computación descentralizada permitir abordar la tensión existente entre el RGPD y el análisis de grandes volúmenes de datos. El RGPD tiene como objetivo proteger los derechos de privacidad de las personas y garantizar el manejo responsable de los datos personales. En cambio, el análisis de grandes volúmenes de datos requiere la recopilación y el procesamiento de grandes cantidades de datos personales para descubrir correlaciones, tendencias y modelos predictivos. Protocolos descentralizados como el Aprendizaje federado o el Aprendizaje Federado Totalmente Descentralizado ofrecen una solución a este dilema al eliminar la necesidad de intercambiar datos desde los dispositivos cliente a los servidores globales. En su lugar, los datos brutos de los dispositivos periféricos se utilizan para entrenar los modelos localmente, lo que aumenta la privacidad. Esta tesis se centra en una de las cuestiones más importantes en este tipo de protocolos: cómo garantizar que todos los agentes implicados actúen como se espera. Los nodos que se desvían deliberadamente podrían hacerlo para atacar al sistema o simplemente para aprovecharse de él sin contribuir. Basándonos en la noción de co-utilidad, hemos diseñado varios protocolos para resolver el conflicto entre la privacidad y algunas propiedades de seguridad en tres escenarios diferentes de computación descentralizada y preservadora de la privacidad: i) Aprendizaje federado; ii) Aprendizaje totalmente descentralizado; y iii) Computación multiparte. Estos tipos de protocolos facilitan la colaboración entre múltiples partes o entidades para alcanzar un objetivo común y operan bajo ciertos supuestos de confianza.


Decentralized computing is a paradigm that distributes computing tasks and decision-making across a network, offering benefits like resilience, scalability, privacy, and reduced reliance on central authorities. It can address the tension between GDPR and big data analytics, as GDPR aims to protect the privacy rights of individuals and ensure the responsible handling of personal data while big data analytics requires collecting and processing large amounts of personal data to uncover correlations, trends, and predictive models. Decentralized protocols such as Federated Learning or Fully Decentralized Federated Learning offer a solution to this dilemma by removing the need to exchange data from client devices to global servers. Instead, the raw data on edge devices are used to train the models locally, increasing data privacy. This thesis focuses on one of the most important issues in this type of protocol: how to ensure that all agents involved perform as expected. Nodes that deliberately deviate may do so to attack the system or simply to take advantage of it without contributing. Based on the notion of co-utility, we have designed several ethics-by-design frameworks to solve the conflict between privacy and some security properties in three different decentralized and privacy-preserving computing scenarios: i) Federated learning; ii) Fully decentralized learning; and iii) Multi-party computation. These types of protocols facilitate collaboration between multiple parties or entities to achieve a common goal and operate under certain trust assumptions.

Keywords

Computació descentralizada; Ètica per disseny; Aprenentatge Automàtic; Computación descentralizada; Ética por diseño; Aprendizaje Automático; Decentralized computing; Ethics-by-design; Machine Learning

Subjects

004 - Computer science

Knowledge Area

Enginyeria i arquitectura

Documents

TESI Jesús Alberto Manjón Paniagua.pdf

7.612Mb

 

Rights

ADVERTIMENT. Tots els drets reservats. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)