AlterID



Dataquitaine 2024 - SESSION 1.3 - Amphi 3 - 21/03/2024 11h50 > 12h20

Modern data architecture and privacy aware secondary uses of data

AlterID

Résumé

Introduction

Dans le monde numérique d'aujourd'hui, les architectures de données modernes jouent un rôle crucial dans la gestion, le stockage et l'analyse de volumes massifs d'informations. Ces architectures sont conçues pour être évolutives, flexibles et efficaces, permettant aux organisations de tirer des insights pertinents à partir de grandes quantités de données. Cependant, avec l'augmentation des préoccupations relatives à la vie privée des utilisateurs et la réglementation stricte comme le RGPD, la protection de la vie privée est devenue un aspect incontournable de ces architectures. Les solutions d'anonymisation et de chiffrement des données, ainsi que les politiques de gestion des données, doivent être intégrées pour assurer la confidentialité et la sécurité. La place de la protection de la vie privée dans les architectures de données modernes n'est pas seulement une exigence légale, mais aussi un impératif éthique, renforçant la confiance des utilisateurs et la responsabilité des entreprises. Ainsi, l'équilibre entre l'exploitation des données et la protection de la vie privée devient un pilier fondamental dans la conception et l'opération des systèmes de données contemporains.

Méthodologie

L'intégration d'une solution d'anonymisation des données dans une architecture de données moderne entraîne plusieurs modifications clés : En premier lieu, l'ajout d'une couche d'anonymisation pour transformer les données sensibles en un format anonyme. Notre module d'anonymisation préservant les formats, est capable de masquer ou de modifier les informations sensibles tout en conservant leur structure originale assurant la protection de la vie privée sans perturber la fonctionnalité des systèmes de données existants. Ce module permet par ailleurs, de générer des jeux de données spécifiques pour les différents usages secondaires de la données : e.g. Analytics, Machine Learning et Intelligence artificielle, partage de données, ... Notre méthode d'anonymisation par permutation permet de contrôler l'équilibre entre utilité et confidentialité en fonction des usages. Par ailleurs, le flux de données doit être adapté pour inclure les étapes d'anonymisation. Les données sensibles sont d'abord acheminées vers les systèmes d'anonymisation avant d'être stockées ou utilisées pour l'analyse. Pour minimiser l'impact sur le stockage nous proposons un système d'anonymisation variable des données où ne sont stockées qu'un version fortement anonymisée de la base originale ainsi qu'un ensemble de clés permettant de générer l'ensemble des jeux de données anonymisés pour les différents usages. Nous analyserons ensuite l'impact sur les performances de l'ajout d'étapes d'anonymisation. et nous expliquerons les amélioration qu'elle apporte à la conformité avec les réglementations sur la protection des données, comme le RGPD.

Originalité / perspective

Notre méthode d'anonymisation se démarque par son efficacité à protéger la confidentialité des données tout en étant moins invasive et plus facile à intégrer dans les environnements de données existants.
Références

[1] www.alterid.eu
[2] Ruiz, N. (2020) Privacy: A Composable Formulation of Privacy Guarantees for Data Publishing Based on Permutation. In: Domingo-Ferrer J.,
Muralidhar K. (eds) Privacy in Statistical Databases. PSD 2020. Lecture Notes in Computer Science, vol 12276. S.
[3] Matt Bornstein, Jennifer Li, and Martin Casado (2020). Emerging Architectures for Modern Data Infrastructure
[4] Joe Reis, Matt Housley (2022) Fundamentals of Data Engineering. O'Reilly Media, Inc.

Revoir la vidéo :






A propos de l'orateur



Adil EL-GHALI
CTO

Adil El Ghali est un professionnel expérimenté dans le domaine de la donnée et de l'intelligence artificielle. Avec une expertise notable en technologies de la voix et technologies sémantiques, il a piloté plusieurs équipes et projets de recherche et développement, dans des contextes académiques et industriels. En tant que co-fondateur et directeur technique d'AlterID depuis 2021, il se consacre à la protection de la vie privée et à la valorisation des données.

AlterID





S'inscrire !
Organisation

           

Avec le soutien de

              

              



Cet événement a bénéficié d'une aide de l’État gérée par l'Agence Nationale de la Recherche au titre du Plan France 2030, portant la référence ANR-21-EXES-0004

Avec la participation de

Partenaire OR & ARGENT


Partenaire PLATINE


                   

              
{\rtf1}