Quelle est la différence entre anonymisation et pseudonymisation ?

L'anonymisation est irréversible et vise à rendre l'identification impossible en pratique. La pseudonymisation peut rester réversible et les données restent personnelles au sens du RGPD.

Pseudonymisation RGPD : définition, exemple, CNIL et méthode

Q: Qu'est-ce que la pseudonymisation ?

La pseudonymisation transforme des données personnelles pour qu'elles ne puissent plus être attribuées à une personne précise sans informations supplémentaires conservées séparément.

Définition de la pseudonymisation

La pseudonymisation consiste à transformer des données personnelles afin qu’elles ne puissent plus être attribuées à une personne précise sans information supplémentaire. Dans un document, cela revient par exemple à remplacer “Marie Dupont” par “PERSONNE_01”, un numéro de sécurité sociale par “NIR_01” ou une adresse par “ADRESSE_01”.

Le point important : les informations permettant de ré-identifier la personne doivent être conservées séparément et protégées par des mesures techniques et organisationnelles. Le CEPD/EDPB rappelle que les données pseudonymisées restent des données personnelles soumises au RGPD.

Anonymisation vs pseudonymisation

Critère	Pseudonymisation	Anonymisation
Objectif	Réduire l’identification directe et le risque en cas d’accès ou de partage.	Rendre l’identification impossible en pratique, par tout moyen raisonnable.
Réversibilité	Possible si la table de correspondance existe et est accessible.	Non : la transformation doit être irréversible.
Statut RGPD	Reste dans le champ du RGPD.	Sort du RGPD si l’anonymisation est correctement mise en œuvre.
Cas d’usage	Documents juridiques, RH, santé, comptables, usage IA avec ré-identification possible.	Statistiques, open data, conservation longue sans besoin de retour à l’identité.

Erreur fréquente

Retirer uniquement les noms ne suffit pas toujours. Un montant rare, une fonction unique, une date, une commune ou une formulation métier peuvent permettre de reconnaître une personne.

Ce que disent la CNIL et le CEPD

La CNIL distingue clairement pseudonymisation et anonymisation : la pseudonymisation remplace les données directement identifiantes par des données indirectement identifiantes, mais elle peut rester réversible et les données conservent un caractère personnel.

Le CEPD a adopté en janvier 2025 des lignes directrices sur la pseudonymisation. La CNIL en retient trois idées fortes : les données pseudonymisées restent personnelles, la mesure peut réduire les risques, et elle peut contribuer aux obligations de protection dès la conception, de sécurité et de respect des principes RGPD.

Comment pseudonymiser un document sensible

Définir la finalité : IA, relecture, extraction, partage interne, sous-traitance ou recherche.
Inventorier les données : personnes, organisations, adresses, e-mails, téléphones, identifiants, montants rares, dates.
Remplacer par des alias cohérents : garder le même alias pour une même entité afin de préserver le sens du document.
Séparer la table de correspondance : accès limité, durée définie, journalisation ou procédure claire.
Relire les indices indirects : métier, contexte, style, événements, localisation précise, petits effectifs.
Documenter la preuve : protocole, catégories masquées, limites connues et décision humaine finale.

Exemples de pseudonymisation

Donnée originale	Alias possible	Point de vigilance
Marie Dupont	PERSONNE_01	Conserver le même alias dans tout le dossier.
15 rue précise, petite commune	ADRESSE_01 ou “commune de 20 000 habitants”	L’adresse peut ré-identifier même sans nom.
Numéro de sécurité sociale	NIR_01	Identifiant très sensible, à masquer systématiquement.
IBAN d’un client	IBAN_01	Éviter la conservation dans des prompts ou exports IA.

Pseudonymisation et IA générative

L’usage d’une IA pour résumer, traduire ou reformuler un document crée un risque d’exposition des données saisies dans le prompt. La pseudonymisation préalable réduit ce risque, mais ne dispense pas d’évaluer le fournisseur, les transferts éventuels, la réutilisation des données, la base légale et la confidentialité.

C’est l’approche retenue par alpa·chat, avec un aller-retour complet : le document pseudonymisé est confié à l’IA, puis son résultat est ré-identifié dans votre navigateur. Les vrais noms reviennent dans le livrable, et la table de correspondance ne quitte pas votre poste.

À partir du 2 août 2026, la majorité des règles de l’AI Act commencent aussi à s’appliquer, notamment les règles de transparence de l’article 50 selon le AI Act Service Desk de la Commission européenne. Pour les organisations françaises, le duo RGPD + gouvernance IA devient donc un vrai sujet opérationnel.

FAQ pseudonymisation

Pseudonymisation définition : comment l’expliquer simplement ?

C’est le remplacement des informations qui identifient une personne par des alias, avec une clé de retour à l’identité gardée séparément et sécurisée.

Comment pseudonymiser des données de santé ?

Il faut masquer les identifiants directs, traiter les indices indirects, limiter les accès, vérifier les obligations sectorielles comme HDS si des données de santé sont hébergées, et relire chaque document.

Le hachage est-il une anonymisation ?

Pas nécessairement. Pour des données prévisibles ou à faible entropie, un hachage peut parfois être attaqué par dictionnaire. Il faut raisonner en risque de ré-identification, pas seulement en technique.

Passer à la pratique

Appliquez cette méthode sur vos propres documents : détection, relecture par vous, export préparé et ré-identification du résultat. Ou commencez par évaluer votre processus actuel.

Essayer alpa·chat Faire l’auto-diagnostic

Pseudonymisation RGPD : définition, exemples, CNIL et méthode pratique.

Définition de la pseudonymisation

Anonymisation vs pseudonymisation

Erreur fréquente

Ce que disent la CNIL et le CEPD

Comment pseudonymiser un document sensible

Exemples de pseudonymisation

Pseudonymisation et IA générative

FAQ pseudonymisation

Passer à la pratique