Entrepôts de données de santé : la question de la sécurisation

19 juin 2018 - 11:42,

Tribune - Cédric Cartau

DécryptageDécryptage SécuritéSécurité E-santéE-santé

Un article(1) récent qui traite de la mise en place de l’entrepôt de données de santé (EDS) à l’AP-HP et rapporte les propos du Pr Lechat lors du 10e Colloque « Données de santé en vie réelle » du 7 juin dernier. Un certain nombre de difficultés et d’enjeux sont évoqués, parmi lesquels la constitution des EDS qui représente sans nul doute la prochaine révolution dans le monde médical et qui transformera autant la pratique dans ce domaine que l’ont changée l’apparition de l’anesthésie, de l’imagerie médicale ou des antibiotiques.

La mise en œuvre des EDS n’est cependant ni simple sur le plan technique, ni triviale sur le plan de la sécurisation de l’accès aux données. Le P^r Lechat rappelle que ces entrepôts sont nécessaires dans la mesure où il n’est pas envisageable de lancer des requêtes de masse sur une base de données de production tel un DPI ou une base de résultats de biologie – la moindre requête pouvant faire écrouler la base et ses performances. L’une des difficultés concerne la masse des données qu’il faut agréger : en effet, les données seules du DPI n’y suffisent pas – il faut aussi alimenter l’EDS avec les données de biologie, les comptes rendus d’imagerie, etc. Dans un CHU de grande taille, on imagine sans peine la masse de données que cela peut représenter.

La deuxième difficulté est de nature organisationnelle. Devant une telle masse de données et les possibilités qui en résultent, il convient en effet de poser des règles d’accès : même s’il est possible d’anonymiser le résultat de certaines requêtes, dans tous les cas, les données contenues et la plupart des résultats de recherche seront suffisamment identifiants pour qu’il faille cadrer les accès. Il y a plusieurs solutions à ce problème : passage des demandes d’accès et de recherche par un comité de validation, restriction des accès à une équipe réduite qui est seule habilitée à passer sur demande – préalablement qualifiée et validée – des requêtes sur la base, intervenants extérieurs, etc.

Quoi qu’il en soit, les enjeux sont de taille : traçabilité totale des accès à la base – ce qui suppose des accès strictement nominatifs –, formation préalable des personnels habilités (personnellement, je trouve que le Mooc de l’ANSSI(2) constitue un excellent point de départ), formalisation contractuelle des extractions de données (quand un jeu de données sortira de l’EDS, un minimum de garanties sur son devenir devra être prévu), etc. La problématique n’est pas nouvelle : tous les établissements publics ou privés réalisent déjà du « big data » ou du requêtage interne sur des bases RH, mais dans ces conditions, les données et les moulinettes sont à usage strictement interne à la DRH et n’agrègent pas des sources de données diverses ou hétérogènes. La demande de protéger spécifiquement les accès aux données médicales des patients qui sont en même temps des agents de l’établissement est un exemple classique de corrélation : il serait alors nécessaire d’interconnecter la base RH et le DPI, ce qui est bien entendu à proscrire totalement compte tenu des dérives qui pourraient en découler.

Enfin, il y a la question de la conformité au RGPD. Dans un article précédent(3), je proposais une analyse de la position du D^r Laurent Alexandre selon lequel le RGPD allait inexorablement freiner l’innovation, en entraînant une fuite massive des bases, des recherches et des cerveaux, ce qui est bien entendu archifaux, au même titre que la réglementation sur les routes en Europe (une des plus contraignantes au monde) n’a pas entravé l’innovation dans le secteur de l’automobile. Il n’empêche, dans l’esprit du RGPD, on ne peut plus faire n’importe quoi avec les données des gens sans se poser un minimum de questions et, surtout, le principe de minimisation – très sain en général – s’applique à plein pour les EDS. Le DPO va donc être fortement sollicité sur ce sujet, ce que, en tant que citoyen, je ne peux qu’apprécier. Pour l’avoir pratiquée, la minimisation – démontrez-moi que la totalité des champs collectés est strictement indispensable au traitement – est d’une redoutable efficacité, et pas seulement pour les EDS.

Le champ général des requêtes et des évaluations (dans le domaine RH, dans le domaine du soin, dans le domaine financier) est un cas à part dans la cartographie des traitements : par exemple, côté RH, il y a quasiment un traitement par requête, ce qui peut complexifier singulièrement la tâche du DPO, mais certaines des mesures susnommées sont indispensables. Et surtout, le RGPD arrive à point nommé dans le début de la constitution des EDS. Pour une fois, la sécurité n’arrivera pas après la bataille.

(1) http://www.ticsante.com/Premieres-negociations-en-cours-avec-des-industriels-pour-l-acces-aux-donnees-de-l-AP-HP-NS_4100.html

(2) https://secnumacademie.gouv.fr/

(3) /article/2825/le-rgpd-et-l-ia.html

# Rgpd # Entrepôt de données de santé # Conformité réglementaire # Sécurisation des données # Traitement des données # Accès aux données # Protection des données # Sécurité informatique

Avez-vous apprécié ce contenu ?

A lire également.

Le DLP, ou l’archétype du techno-solutionnisme béat

20 avril 2026 - 10:27,

Tribune

Cédric Cartau

On n’est pas exactement dans un matraquage publicitaire de haute intensité, mais cela revient tout de même assez régulièrement, comme la grippe de saison ou les allergies aux plastiques des tongs d’été. En tout cas, régulièrement, il se trouve un commercial lambda pour nous ressortir une offre préte...

La cyber face au défi des modèles mentaux

14 avril 2026 - 08:41,

Tribune

Cédric Cartau

Un modèle mental, c’est un prisme au travers duquel nous regardons la réalité. Des lunettes filtrantes si vous préférez.

Comment quantifier un risque

31 mars 2026 - 08:06,

Tribune

Cédric Cartau

Après avoir expliqué qu’une PSSI et une appréciation des risques ne servaient à rien (ici 1) -mais un peu quand même -, intéressons-nous à un autre sujet brûlant qui déchaîne les passions, pire que JR (2) et la fin du Prisonnier (3) : la quantification du risque.

Publication d’un corpus inédit de comptes rendus médicaux fictifs en open data pour accélérer l’IA en santé

26 mars 2026 - 19:08,

Actualité

- Rédaction, DSIH

Dans un contexte réglementaire européen exigeant, qui garantit un accès et un partage sécurisés des données de santé, le projet PARTAGES apporte une réponse opérationnelle aux défis posés à l’IA en santé. Coordonné par la Plateforme des données de santé (Health Data Hub) et réunissant 32 partenaires...

Entrepôts de données de santé : la question de la sécurisation

Avez-vous apprécié ce contenu ?

A lire également.

Le DLP, ou l’archétype du techno-solutionnisme béat

20 avril 2026 - 10:27,

Tribune

La cyber face au défi des modèles mentaux

14 avril 2026 - 08:41,

Tribune

Comment quantifier un risque

31 mars 2026 - 08:06,

Tribune

Publication d’un corpus inédit de comptes rendus médicaux fictifs en open data pour accélérer l’IA en santé

26 mars 2026 - 19:08,

Actualité

Lettre d'information.

Ne manquez rien de la e-santé et des systèmes d’informations hospitaliers !

A propos

Nous suivre

Contact

Special Partner

Publicité

Rédaction

Abonnement

Nos marques