Pseudonymisation des données de santé : RGPD, HDS et IA

Pourquoi les données de santé demandent un niveau d’exigence supérieur

Les données de santé sont une « catégorie particulière » de données au sens de l’article 9 du RGPD : leur traitement est par principe interdit, sauf exceptions strictement encadrées. La prudence qui s’impose avec les outils d’IA générative grand public vaut donc doublement ici : un compte rendu ou un courrier patient ne devrait jamais partir tel quel vers un serveur que ni vous, ni votre établissement, ne maîtrisez.

La pseudonymisation peut réduire le risque, mais elle ne transforme pas un dossier patient en données anonymes : une pathologie rare, une petite commune ou un parcours de soin spécifique peuvent suffire à retrouver une personne. Sur cette différence, voir la page de la CNIL sur l’anonymisation de données personnelles.

Côté hébergement, l’écosystème français impose de vérifier les exigences HDS dès que des données de santé sont hébergées pour le compte de tiers : voir les ressources de l’ Agence du Numérique en Santé sur l’hébergement des données de santé. alpa·chat ne revendique aucune certification HDS : les documents y sont traités en mémoire, jamais stockés ni journalisés, mais l’applicabilité de ces obligations à votre situation reste à évaluer avec votre DPO.

Données à pseudonymiser

Nom, prénom, date de naissance, adresse, téléphone, e-mail, numéro de dossier.
Profession, lieu de soin, médecin, service, petite commune, événement rare.
Dates exactes, parcours spécifique, pathologie rare, antécédents identifiants.
Identifiants administratifs (dont NIR), assurance, organisme, correspondants médicaux.

Exemple de réduction du risque

Avant	Après pseudonymisation
« Jean Martin, 42 ans, vit à Saint-Loup, suivi par le Dr Durand depuis le 4 mars. »	« PATIENT_01, adulte, vit dans une commune rurale, suivi par MÉDECIN_01 depuis début mars. »

Points de contrôle avant IA ou recherche

Identifier si l’usage relève d’un soin, d’une recherche, d’un test ou d’une amélioration de service.
Limiter les données au strict nécessaire : c’est la minimisation.
Évaluer les risques de ré-identification indirecte, surtout pour les pathologies rares.
Séparer et protéger la table de correspondance.
Valider l’hébergement, les accès et les sous-traitants, avec votre DPO et votre RSSI.

Flux recommandé avec alpa·chat

Déposez le dossier (PDF, DOCX, TXT ou ZIP) : noms, coordonnées, identifiants (dont NIR) et adresses sont détectés, avec des alias cohérents sur toutes les pièces : le même patient garde le même équivalent fictif d’un document à l’autre.
Relisez et décidez : masquer, garder (un médicament, un acte, une classification), corriger ou ajouter : les cas ambigus vous sont signalés. Rien ne sort sans votre validation.
Exportez le dossier préparé, avec la table de correspondance et le rapport de conformité.
Travaillez librement sur cette copie avec ChatGPT, Claude ou Gemini.
Collez la réponse de l’IA dans alpa·chat : les vrais noms reviennent dans le résultat, directement sur votre poste. La table de correspondance, elle, ne sort pas.

Point de prudence

Pseudonymiser n’est pas anonymiser : le RGPD continue de s’appliquer, et les exigences propres aux données de santé avec lui. Les outils d’IA grand public ne doivent pas recevoir de données de santé identifiantes sans analyse juridique, contractuelle et de sécurité. La pseudonymisation réduit l’exposition ; elle n’est ni une autorisation automatique, ni une conformité HDS.

Tester sur un document représentatif

Le plus simple est de juger sur pièces : déposez un compte rendu ou un courrier type, relisez les masquages proposés et vérifiez la ré-identification du résultat. Vos documents sont traités en mémoire, jamais stockés.

Essayer alpa·chat Auto-diagnostic