Outsourcing Computation on Non-Encrypted SensitiveData to Untrusted Clouds

Author

Ricci, Sara

Director

Domingo-Ferrer, Josep

Soria Comas, Jorge

Date of defense

2018-06-15

Pages

112 p.



Department/Institute

Universitat Rovira i Virgili. Departament d'Enginyeria Informàtica i Matemàtiques

Abstract

L’emmagatzematge i el processat de grans dades en entorns locals presenta certs inconvenients, però l’ús del núvol per emmagatzemar i processar les dades pot donar lloc a problemes de privadesa i seguretat. En aquesta tesi tractem la problemàtica associada a l’ús de núvols no confiables. En particular, volem que el núvol pugui fer dos operacions amb dades sensibles no xifrades de manera pràctica i que preservi la privadesa: productes escalars i productes de matrius. Aquestes operacions són útils per fer diferents tipus d’anàlisis de dades com ara el càlcul de correlacions entre atributs i el càlcul de taules de contingència. Els nostres protocols ens permeten usar el núvol no només per emmagatzemar dades sensibles no xifrades sinó també per processar-les. Les avaluacions experimentals amb dades categòriques fetes sobre el serveis de núvol d’Amazon mostren que, amb els nostres protocols, l’administrador de les dades pot reduir el temps d’execució de les computacions més exigents en més del 99.999%. També presentem una metodologia per comparar mètodes de control estadstic de la revelació (SDC, l’acrònim anglès) per microdades en termes del equilibri entre risc i utilitat resultant. Els estudis comparatius anteriors comencen habitualment per seleccionar alguns valors dels paràmetres per un conjunt de mètodes SDC i avaluen el risc de revelació i la pèrdua d’informació que produeixen aquests paràmetres. Aqu comencem per seleccionar un nivell de risc i busquem els valors dels paràmetres necessaris per obtenir aquest nivell de risc amb cadascun dels mètodes SDC s’avaluen. Finalment, avaluem la utilitat, cosa que permet ordenar els mètodes d’acord a la utilitat.


El almacenamiento i el procesado de grandes datos en entornos local presenta algunos inconvenientes, pero el uso de la nube para almacenar i procesar estos datos puede dar lugar a problemas de privacidad i de seguridad. En esta tesis tratamos la problemática asociada a el uso de nubes no confiables. En particular, queremos que la nube pueda hacer dos operaciones con datos sensibles no cifrados de forma práctica i que preserve la privacidad: productos escalares i productos de matrices. Nuestros protocolos nos permiten usar la nube no solo para almacenar datos sensibles no cifrados sino también para procesarlos. Las evaluaciones experimentales con datos categóricos que se han realizado sobre los servicios de nube de Amazon muestran que, con nuestros protocolos, el administrador de los datos puede reducir el tiempo de ejecución de las computaciones más exigentes en más del 99.999%. También presentamos una metodologa para comparar métodos de control estadstico de la revelación (SDC, acrónimo inglés) para microdatos en términos del equilibrio entre riesgo y utilidad que resulta. Los estudios comparativos anteriores empiezan habitualmente por seleccionar algunos valores de los parámetros para un conjunto de métodos SDC i evalúan el riesgo de revelación i perdida de información que producen estos parámetros. Aqu comenzamos por seleccionar un nivel de riesgo i buscamos los valores de los parámetros necesarios para obtener dicho nivel de riesgo con cada uno de los métodos SDC que se evalúan. Finalmente, una vez ja hemos conseguido un nivel de riesgo equivalente en los diferentes métodos SDC, evaluamos la utilidad, cosa que permite ordenar los métodos con respecto a la utilidad.


Storing and processing big data in local premises is increasingly inconvenient, but resorting to cloud storage and processing raises security and privacy issues. We tackle here the problem of outsourcing to untrusted clouds in a practical and privacy-preserving manner two basic operations on non-encrypted sensitive data: scalar products and matrix products. These operations are useful to perform data analyses such as correlations between attributes or contingency tables, among others. Our protocols allow using the cloud not only to store sensitive non-encrypted data, but also to process them. In addition to analyzing the security of the proposed protocols, we also evaluate their performance against a baseline consisting of downloading plus local computation. The experiments on categorical data that we report on the Amazon cloud service show that, with our protocols, the data controller can save more than 99.999% runtime for the most demanding computations. We also present here a methodology to compare statistical disclosure control (SDC) methods for microdata in terms of how they perform regarding the risk-utility trade-off. Previous comparative studies usually start by selecting some parameter values for a set of SDC methods and evaluate the disclosure risk and the information loss yielded by the methods for those parameterizations. In contrast, here we start by setting a certain risk level and then we find which parameter values are needed to attain that risk under different SDC methods. Finally, we evaluate the utility provided by each method, in order to rank methods according to their utility preservation.

Keywords

divisió de dades; computació en núvol; evaluació de riscos-utilitat; división de datos; computación en la nube; evaluación de riesgos-utilidad; data splitting; cloud computing; risk-utility assessment

Subjects

004 - Computer science and technology. Computing. Data processing; 51 - Mathematics

Knowledge Area

Ciències

Documents

TESI.pdf

3.031Mb

 

Rights

ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)