Vous êtes dans : Accueil > Tribunes libres >

Entrepôts de données de santé : la question de la sécurisation

Cédric Cartau, MARDI 19 JUIN 2018 Soyez le premier à réagirSoyez le premier à réagir

Un article(1) récent qui traite de la mise en place de l’entrepôt de données de santé (EDS) à l’AP-HP et rapporte les propos du Pr Lechat lors du 10e Colloque « Données de santé en vie réelle » du 7 juin dernier. Un certain nombre de difficultés et d’enjeux sont évoqués, parmi lesquels la constitution des EDS qui représente sans nul doute la prochaine révolution dans le monde médical et qui transformera autant la pratique dans ce domaine que l’ont changée l’apparition de l’anesthésie, de l’imagerie médicale ou des antibiotiques.  

La mise en œuvre des EDS n’est cependant ni simple sur le plan technique, ni triviale sur le plan de la sécurisation de l’accès aux données. Le Pr Lechat rappelle que ces entrepôts sont nécessaires dans la mesure où il n’est pas envisageable de lancer des requêtes de masse sur une base de données de production tel un DPI ou une base de résultats de biologie – la moindre requête pouvant faire écrouler la base et ses performances. L’une des difficultés concerne la masse des données qu’il faut agréger : en effet, les données seules du DPI n’y suffisent pas – il faut aussi alimenter l’EDS avec les données de biologie, les comptes rendus d’imagerie, etc. Dans un CHU de grande taille, on imagine sans peine la masse de données que cela peut représenter.

La deuxième difficulté est de nature organisationnelle. Devant une telle masse de données et les possibilités qui en résultent, il convient en effet de poser des règles d’accès : même s’il est possible d’anonymiser le résultat de certaines requêtes, dans tous les cas, les données contenues et la plupart des résultats de recherche seront suffisamment identifiants pour qu’il faille cadrer les accès. Il y a plusieurs solutions à ce problème : passage des demandes d’accès et de recherche par un comité de validation, restriction des accès à une équipe réduite qui est seule habilitée à passer sur demande – préalablement qualifiée et validée – des requêtes sur la base, intervenants extérieurs, etc.

Quoi qu’il en soit, les enjeux sont de taille : traçabilité totale des accès à la base – ce qui suppose des accès strictement nominatifs –, formation préalable des personnels habilités (personnellement, je trouve que le Mooc de l’ANSSI(2) constitue un excellent point de départ), formalisation contractuelle des extractions de données (quand un jeu de données sortira de l’EDS, un minimum de garanties sur son devenir devra être prévu), etc. La problématique n’est pas nouvelle : tous les établissements publics ou privés réalisent déjà du « big data » ou du requêtage interne sur des bases RH, mais dans ces conditions, les données et les moulinettes sont à usage strictement interne à la DRH et n’agrègent pas des sources de données diverses ou hétérogènes. La demande de protéger spécifiquement les accès aux données médicales des patients qui sont en même temps des agents de l’établissement est un exemple classique de corrélation : il serait alors nécessaire d’interconnecter la base RH et le DPI, ce qui est bien entendu à proscrire totalement compte tenu des dérives qui pourraient en découler.

Enfin, il y a la question de la conformité au RGPD. Dans un article précédent(3), je proposais une analyse de la position du Dr Laurent Alexandre selon lequel le RGPD allait inexorablement freiner l’innovation, en entraînant une fuite massive des bases, des recherches et des cerveaux, ce qui est bien entendu archifaux, au même titre que la réglementation sur les routes en Europe (une des plus contraignantes au monde) n’a pas entravé l’innovation dans le secteur de l’automobile. Il n’empêche, dans l’esprit du RGPD, on ne peut plus faire n’importe quoi avec les données des gens sans se poser un minimum de questions et, surtout, le principe de minimisation – très sain en général – s’applique à plein pour les EDS. Le DPO va donc être fortement sollicité sur ce sujet, ce que, en tant que citoyen, je ne peux qu’apprécier. Pour l’avoir pratiquée, la minimisation – démontrez-moi que la totalité des champs collectés est strictement indispensable au traitement – est d’une redoutable efficacité, et pas seulement pour les EDS.

Le champ général des requêtes et des évaluations (dans le domaine RH, dans le domaine du soin, dans le domaine financier) est un cas à part dans la cartographie des traitements : par exemple, côté RH, il y a quasiment un traitement par requête, ce qui peut complexifier singulièrement la tâche du DPO, mais certaines des mesures susnommées sont indispensables. Et surtout, le RGPD arrive à point nommé dans le début de la constitution des EDS. Pour une fois, la sécurité n’arrivera pas après la bataille.


(1) http://www.ticsante.com/Premieres-negociations-en-cours-avec-des-industriels-pour-l-acces-aux-donnees-de-l-AP-HP-NS_4100.html 

(2) https://secnumacademie.gouv.fr/ 

(3) http://www.dsih.fr/article/2825/le-rgpd-et-l-ia.html  

données de santé, RGPD, dpi, biologie