Anonymisation

Les documents peuvent contenir des informations sensibles susceptibles de révéler l’identité des personnes, des lieux et des entreprises. Parfois, il est nécessaire de cacher cette information afin de permettre le transfert et la diffusion de ces documents. Un exemple typique est celui des dossiers médicaux, dans lesquels l’identité des personnes impliquées doit être protégée. Le même besoin existe dans le domaine juridique, dans le domaine de la finance, et dans tous les cas où le traitement des documents est externalisé et où la vie privée des parties mentionnées doit être protégée.

Notre anonymiseur, « Privacy Guardian », a été initialement développé pour une utilisation dans le domaine médical, où les politiques de protection de la vie privée les plus strictes doivent s’appliquer.  Il a depuis été étendu à différents domaines (financier et juridique) et porté à d’autres langues que le français (anglais et italien).

  • Intéractivité

    Outre sa modalité de bibliothèque standard Java, Privacy Guardian est livré avec une interface homme-machine interactive pour l’anonymisation (captures d’écran à venir). En quelques clics, l’utilisateur peut valider ou modifier les choix effectués par Privacy Guardian. L’interface interactive est particulièrement utile dans tous ces cas critiques où le besoin de perfection est tel que la supervision manuelle (humaine) est de toute façon nécessaire.

  • Conservation Sémantique

    L’anonymisation n’est pas seulement la suppression d’informations sensibles. Pour tout traitement ultérieur (que ce soit par des humains ou des systèmes d’information), le processus d’anonymisation doit préserver le sens de l’information anonyme. Avec le document anonymisé, Privacy Guardian conserve toutes les métadonnées concernant les entités anonymes, par exemple s’il s’agissait du nom d’une personne, d’une date, d’un lieu, etc. Dans certains cas particuliers, tels que les dates, il est également en mesure de préserver la séquence temporelle des événements en démarrant à partir d’un moment précis dans le temps (appelé « Temps 0 » ou « T0 »), le temps de référence à partir duquel les dates incomplètes sont calculées. En outre, dans des domaines spécifiques tels que le domaine médical, il peut fournir des informations très spécialisées, comme par exemple l’appartenance d’une entité anonyme à une catégorie particulière : si une personne correspond à un médecin ou à un patient, si une date précise correspond à une date de naissance ou à la date d’une intervention médicale, etc.

  • Configurabilité

    Privacy Guardian est basé sur un ensemble de règles linguistiques développées par des experts linguistiques sur la base des corpus disponibles. Les résultats du système sont, par conséquent, configurables par nos experts pour s’adapter à des domaines spécifiques et à des besoins d’applications spécifiques. En outre, le client peut personnaliser dans une certaine mesure les résultats du processus d’anonymisation en ajoutant des listes spécifiques de noms propres (personnes, lieux, etc.) Il peut également écrire des règles ad hoc pour assurer la mise en correspondance des identifiants dépendant de l’application qui ne sont pas inclus dans la configuration par défaut.

  • Réversibilité

    Grâce à une implémentation avancée du concept de « stand-off annotation », lorsque les documents anonymisés passent à l’intérieur de l’environnement opérationnel protégé, ils peuvent être automatiquement « désanonymisés ». En d’autres termes, les résultats du traitement externe peuvent être intégrés dans la version non anonyme du document.