# Introduction

Rédaction de ce guide

Ce guide d'anonymisation est en cours de rédaction (juin 2022). La version présente pourra être enrichie en fonction de vos commentaires.

Il sera régulièrement et progressivement mis à jour.

# À quoi sert ce guide ?

Ce guide servira d'introduction à des techniques d'anonymisation de données tabulaires. Il vous propose un accompagnement méthodologique dans votre procédure d'anonymisation, afin de limiter les risques que des personnes issues de votre base anonymisée ne soient ré-identifiées par des analyses a posteriori.

Il est important de garder à l'esprit que la publication de données personnelles est encadrée légalement, et que le niveau d'occultation préalable à appliquer dépend de la nature des données, depuis le simple brouillage des éléments directement identifiants jusqu'à des techniques plus poussées visant à empêcher que des informations sensibles ne puissent être déduites a posteriori en analysant des corrélations sur votre base publiée.

Ce guide se contentera de proposer des méthodologies pour anonymiser des données. En particulier, ce guide ne constitue pas une référence légale permettant de caractériser le niveau minimal d'occultation requis pour chaque type de données.

# À qui s'adresse ce guide ?

Ce guide s'adresse à des personnes désireuses de traiter ou de publier des données tout en protégeant la confidentialité de données à caractère personnel ou de données jugées sensibles.

Ce guide intéressera également les équipes effectuant des traitements de données personnelles, et qui seraient dans l'obligation d'anonymiser ces bases tabulaires préalablement aux traitements.

# Sommaire

Ce guide est composé de trois parties :

  • une définition et des exemples de projets d'anonymisation ;
  • une revue de quelques méthodes d'anonymisation ;
  • une présentation non exhaustive de quelques logiciels et outils pouvant aider à l'anonymisation.

Ce que ce guide n'est pas

  • un guide juridique sur la protection des données à caractère personnel ;
  • un guide prêt à emploi sur l'anonymisation de données textuelles (qui doivent d'abord être transformées en données tabulaires) ;
  • un guide sur la sécurité des données et des systèmes d'information.

# Comment contribuer ?

Ce document est un outil évolutif et ouvert.

Si vous souhaitez faire des propositions pour le faire évoluer, vous êtes invités à proposer une modification sur GitHub ou en contactant directement l'équipe du Lab IA d'Etalab.

En particulier, le lab IA d'Etalab est preneur de tout retour d'expérience pour faire évoluer ce guide et mettre à jour nos bonnes pratiques.