Guide pratique · mis à jour le 8 juin 2026

Pseudonymisation RGPD : définition, exemples, CNIL et méthode pratique.

La pseudonymisation (remplacer les noms et identifiants d’un document par des équivalents fictifs, de façon réversible par vous seul) est une mesure clé pour réduire les risques liés aux données personnelles. Elle est particulièrement utile avant analyse documentaire, sous-traitance, partage interne ou usage d’IA générative.

Définition de la pseudonymisation

La pseudonymisation consiste à transformer des données personnelles afin qu’elles ne puissent plus être attribuées à une personne précise sans information supplémentaire. Dans un document, cela revient par exemple à remplacer “Marie Dupont” par “PERSONNE_01”, un numéro de sécurité sociale par “NIR_01” ou une adresse par “ADRESSE_01”.

Le point important : les informations permettant de ré-identifier la personne doivent être conservées séparément et protégées par des mesures techniques et organisationnelles. Le CEPD/EDPB rappelle que les données pseudonymisées restent des données personnelles soumises au RGPD.

Anonymisation vs pseudonymisation

Critère Pseudonymisation Anonymisation
Objectif Réduire l’identification directe et le risque en cas d’accès ou de partage. Rendre l’identification impossible en pratique, par tout moyen raisonnable.
Réversibilité Possible si la table de correspondance existe et est accessible. Non : la transformation doit être irréversible.
Statut RGPD Reste dans le champ du RGPD. Sort du RGPD si l’anonymisation est correctement mise en œuvre.
Cas d’usage Documents juridiques, RH, santé, comptables, usage IA avec ré-identification possible. Statistiques, open data, conservation longue sans besoin de retour à l’identité.

Erreur fréquente

Retirer uniquement les noms ne suffit pas toujours. Un montant rare, une fonction unique, une date, une commune ou une formulation métier peuvent permettre de reconnaître une personne.

Ce que disent la CNIL et le CEPD

La CNIL distingue clairement pseudonymisation et anonymisation : la pseudonymisation remplace les données directement identifiantes par des données indirectement identifiantes, mais elle peut rester réversible et les données conservent un caractère personnel.

Le CEPD a adopté en janvier 2025 des lignes directrices sur la pseudonymisation. La CNIL en retient trois idées fortes : les données pseudonymisées restent personnelles, la mesure peut réduire les risques, et elle peut contribuer aux obligations de protection dès la conception, de sécurité et de respect des principes RGPD.

Comment pseudonymiser un document sensible

  1. Définir la finalité : IA, relecture, extraction, partage interne, sous-traitance ou recherche.
  2. Inventorier les données : personnes, organisations, adresses, e-mails, téléphones, identifiants, montants rares, dates.
  3. Remplacer par des alias cohérents : garder le même alias pour une même entité afin de préserver le sens du document.
  4. Séparer la table de correspondance : accès limité, durée définie, journalisation ou procédure claire.
  5. Relire les indices indirects : métier, contexte, style, événements, localisation précise, petits effectifs.
  6. Documenter la preuve : protocole, catégories masquées, limites connues et décision humaine finale.

Exemples de pseudonymisation

Donnée originale Alias possible Point de vigilance
Marie Dupont PERSONNE_01 Conserver le même alias dans tout le dossier.
15 rue précise, petite commune ADRESSE_01 ou “commune de 20 000 habitants” L’adresse peut ré-identifier même sans nom.
Numéro de sécurité sociale NIR_01 Identifiant très sensible, à masquer systématiquement.
IBAN d’un client IBAN_01 Éviter la conservation dans des prompts ou exports IA.

Pseudonymisation et IA générative

L’usage d’une IA pour résumer, traduire ou reformuler un document crée un risque d’exposition des données saisies dans le prompt. La pseudonymisation préalable réduit ce risque, mais ne dispense pas d’évaluer le fournisseur, les transferts éventuels, la réutilisation des données, la base légale et la confidentialité.

C’est l’approche retenue par alpa·chat, avec un aller-retour complet : le document pseudonymisé est confié à l’IA, puis son résultat est ré-identifié dans votre navigateur. Les vrais noms reviennent dans le livrable, et la table de correspondance ne quitte pas votre poste.

À partir du 2 août 2026, la majorité des règles de l’AI Act commencent aussi à s’appliquer, notamment les règles de transparence de l’article 50 selon le AI Act Service Desk de la Commission européenne. Pour les organisations françaises, le duo RGPD + gouvernance IA devient donc un vrai sujet opérationnel.

FAQ pseudonymisation

Pseudonymisation définition : comment l’expliquer simplement ?

C’est le remplacement des informations qui identifient une personne par des alias, avec une clé de retour à l’identité gardée séparément et sécurisée.

Comment pseudonymiser des données de santé ?

Il faut masquer les identifiants directs, traiter les indices indirects, limiter les accès, vérifier les obligations sectorielles comme HDS si des données de santé sont hébergées, et relire chaque document.

Le hachage est-il une anonymisation ?

Pas nécessairement. Pour des données prévisibles ou à faible entropie, un hachage peut parfois être attaqué par dictionnaire. Il faut raisonner en risque de ré-identification, pas seulement en technique.

Passer à la pratique

Appliquez cette méthode sur vos propres documents : détection, relecture par vous, export préparé et ré-identification du résultat. Ou commencez par évaluer votre processus actuel.