Vous êtes dans : Accueil > Tribunes libres >

Informatique de santé, entropie et tueur en série

Cédric Cartau, MARDI 09 JUIN 2020

L’entropie, c’est la mesure du désordre. Une des lois fondamentales de la thermodynamique énonce que l’entropie d’un système fermé à une tendance inexorable à augmenter. C’est pourquoi au début de l’Univers, tout était beau et bien rangé dans une boule minuscule contenant toute la matière existante, et qu’après le Grand Boum (oui d’accord, on dit le Big Bang) la matière est tout en désordre, un foutoir sans nom, les planètes par ci, les soleils par là, la gravité qui te courbe l’espace, et tout le tralala.

Bon, de façon plus prosaïque, c’est aussi à cause de l’entropie que mon placard a une fâcheuse propension à ressembler à un terrain vague après une rave : si on ne nettoie jamais, si on ne fait jamais passer « la voiture-balai », tout système tend vers le désordre ou la complexité maximale, s’écroule sous son propre poids et autojustifie son existence par de la bureaucratie kafkaïenne.

Connaissez-vous Harold Shipman ? Son nom ne vous dira sans doute pas grand-chose, sachez juste que le bonhomme est considéré comme le pire tueur en série de l’histoire britannique (250 crimes imputés, la réalité étant plus proche de 400). En tant que médecin de famille, il administrait une dose létale à ses patients avant de falsifier le dossier médical et le certificat de décès, qu’il rédigeait lui-même : il a pu passer au travers des mailles du système car il évitait les points de contrôle évidents. Mais il y a un indicateur qu’il n’a pas pu falsifier, et c’est entre autres la raison pour laquelle les enquêteurs ont commencé de s’intéresser à lui : ce sont les données collectées par la chaîne aval de traitement (si j’ose dire), à savoir les pompes funèbres. Tenant compte de la moyenne annuelle de patients envoyés par leur médecin de famille aux pompes funèbres, Harold Shipman explosait totalement les compteurs. Autrement dit, l’assassin occasionnel peut passer sous le radar, mais le régulier n’échappe pas aux statistiques.

Sauf que les statistiques en question, encore faut-il que quelqu’un les exploite : notre système de santé est passé totalement à côté de l’affaire du Mediator, alors que les données étaient disponibles. La question suivante est évidemment de savoir si d’autres corrélations existent, pour lesquelles le gisement de données disponibles permettrait une détection rapide et facile ?

Pourquoi cette situation ? La réponse est facile : la totalité du système de santé – son volet administratif s’entend – a été conçue pour facturer, et rien que pour cela. On en revient au petit laïus ci-dessus sur l’entropie : le système s’est complexifié, stratifié à un tel point que je mets au défi quiconque ne baignant pas dedans 100 % de son temps d’expliquer au pied levé n’importe laquelle des règles qui régit la facturation du système de santé. C’est d’ailleurs à se demander comment on a pu en arriver là, même dérive que pour les impôts du reste.

Pour connaître le rapport coût/bénéfice de tel ou tel médicament, notre système de santé est très fort : il y a « coût » dans l’équation. Un ingénieur de mes amis a travaillé sur la modélisation par graphe de la fraude à l’assurance maladie : tout comme pour Harold, difficile d’échapper aux statistiques – le fraudeur régulier se fera certainement attraper –, mais là encore on parle de sous, et surtout de coûts directs. Les services fiscaux sont hyperforts pour pister les changements inhabituels de déclaration, les corrélations entre telles données déclarées et le risque de fraude, voire aller pister votre profil sur les réseaux sociaux juste histoire de voir si vous ne conduisez par une Porsche que vous n’avez pas les moyens d’acheter : encore des pépettes. Mais quid des interactions de protocole ? D’efficacité des traitements en fonction de l’âge du patient, de son poids, de son profil général ? Des effets secondaires à terme ? Des corrélations entre tel type de cancer et le lieu d’habitation des patients ?

La grande distribution a été capable il y a plus de 20 ans de déterminer que quand on achète des couches-culottes pour bébé on achète aussi souvent de la bière (authentique), et dans l’aviation civile on sait qu’un pilote qui n’effectue pas une remise de gaz à l’atterrissage (procédure d’urgence quand les choses ne se présentent pas comme elles le devraient) pèche au moins 3 % du temps par excès de confiance : l’accidentologie est connue. Les fondamentaux qui permettent de détecter des corrélations entre deux variables sont une branche des mathématiques qui est connue depuis plus d’un siècle ; il n’y a là aucune difficulté théorique. Les outils sont accessibles : BO (qui au passage est français), SaaS, et j’en passe. Les compétences aussi : il y a des tonnes de rapports, de thèses qui permettent de bâtir des entrepôts et de chercher des corrélations sans d’ailleurs savoir au départ ce que l’on cherche – certains appellent cela de l’IA, on ne va pas les contredire, ça leur fait plaisir. Non, c’est juste un problème de culture : dès qu’il n’y a pas la variable « fric » dans l’équation, il semble que pas grand monde soit intéressé.

Les hôpitaux ont mis en place la certification des comptes (et c’est une bonne chose), justement en analysant des masses de données financières pour chercher la mouche dans le lait, la loi de Benford permet d’attraper les Harold de la malversation financière. Mais nous démarrons à peine l’analyse statistique des données de santé (il y a bien entendu des projets en ce sens dans tous les CHU). C’est une bonne chose, on a juste dix ans de retard.

Bon, en même temps, le Health Data Hub est en train de se construire, et il est gentiment et sans aucune arrière-pensée hébergé par Microsoft, on est donc hyperrassurés.