Connectez-vous S'inscrire
MENU
SIS

Un entrepôt de données agile au Centre hospitalier public du Cotentin


Rédigé par Aurélie Pasquelin le Mardi 21 Octobre 2025 à 12:12 | Lu 98 fois


Développé en moins de trois mois, l’entrepôt de données de santé du Centre hospitalier public du Cotentin (CHPC) se distingue par sa légèreté, sa performance et sa facilité d’accès. Porté par une vision novatrice, le projet a rapidement évolué vers une plateforme intelligente et virtuelle, désormais intégrée aux outils de pilotage de l’établissement et au service de la recherche clinique. Le Docteur Jérémy Pasco, médecin de santé publique et directeur médical de la recherche, nous en raconte les coulisses.



Pourriez-vous revenir sur votre parcours et expliquer ce qui vous a conduit à initier ce projet au CHPC ? 

Dr Jérémy Pasco : Médecin de santé publique, j’ai effectué mon clinicat au CHU de Tours, où j’ai participé au déploiement de l’entrepôt de données eHOP, utilisé dans plusieurs CHU de l’Ouest. Ce projet m’a passionné, mais j’en ai aussi mesuré les limites : il s’agit d’une solution très puissante, mais aussi exigeante en termes de ressources pour son déploiement et sa maintenance. Cela m’a amené à m’interroger sur la capacité des hôpitaux plus modestes à se doter d’outils similaires. Or l’enjeu est crucial : pour que les études en vie réelle soient véritablement représentatives, il est essentiel qu’elles ne se limitent pas aux patients pris en charge dans les grands centres universitaires. Les établissements de plus petite taille accueillent une population aux profils différents et donc complémentaires. Leur absence des bases de données hospitalières limite la portée des recherches menées à partir de ces entrepôts.

Vous avez ensuite quitté l’hôpital… 

J’ai alors travaillé trois ans comme consultant en data, hors du champ médical. Cela m’a permis de découvrir comment de grands groupes industriels structuraient et exploitaient d’énormes volumes de données de manière très efficace, avec des approches bien différentes du monde hospitalier. Inspiré par ces méthodes, j’ai souhaité tester une solution plus agile dans un établissement aux ressources plus restreintes. C’est ainsi que j’ai intégré le CHPC avec le défi de créer un entrepôt de données fonctionnel en six mois, sans financement ni équipe dédiée au projet. Finalement, il a été opérationnel en seulement trois mois.

Comment avez-vous procédé ?  

Le projet a bénéficié d’un fort soutien institutionnel dès le départ, ce qui a facilité la collaboration, notamment avec la Direction des systèmes d’information (DSI) et les équipes techniques. Nous avons donc pu nous appuyer sur les bonnes personnes et obtenir immédiatement tous les accès nécessaires. Un autre atout réside dans la taille humaine du CHPC, qui permet un dialogue plus direct avec les différentes directions. 

Avez-vous dû mettre en place des dispositifs techniques spécifiques ?

Oui, nous avons fait un choix assez radical, en n’utilisant pas les standards classiques d’interopérabilité. À la place, nous avons développé nos propres connecteurs en interface directe avec les bases de données applicatives, ce qui nous a permis de contourner les limites traditionnelles imposées par les flux interapplicatifs, tels que les problèmes d’exhaustivité. Une fois les données extraites, nous avons mis en place un système de stockage conforme au référentiel EDS de la CNIL. L’entrepôt était prêt dès l’été 2022, mais nous avons attendu la déclaration règlementaire et la campagne de communication interne et externe, avant de lancer les premiers projets. Lors de la première commission en décembre 2022, nous avons réalisé que les porteurs de projets potentiels étaient ceux qui avaient participé à la conception de l’EDS. Contrairement aux CHU où la culture de la donnée est bien ancrée, il nous fallait entamer un travail de sensibilisation auprès des praticiens pour faire émerger une dynamique d’usage. 

Vous avez ensuite fait évoluer le projet avec la conception d’un deuxième entrepôt sous forme virtuelle. Pourquoi cette décision ?  

Nous avons rapidement compris que, grâce à nos connecteurs maison, nous pouvions extraire les données à la demande, sans alimenter en permanence une base de données massive. D’où l’idée d’un entrepôt virtuel : une structure vide, qui ne se remplit que lorsqu’un projet l’exige, avec uniquement les données nécessaires. Une telle approche combine les avantages d’un entrepôt classique – centralisation, accès unifié, conformité – tout en évitant ses inconvénients : complexité, lourdeur, exposition aux risques de sécurité. Cette évolution, non planifiée au départ, s’est révélée décisive.

L’EDS est-il aujourd’hui utilisé au quotidien ?

Absolument. Il est devenu un outil précieux pour le pilotage décisionnel, avec plusieurs dizaines de requêtes par jour. Nous avons d’ailleurs acquis un cluster de calcul pour intégrer des IA de type LLM, ce qui nous permet d’exploiter les données en interne, sans les envoyer à des tiers. Par exemple, sur plusieurs milliers de comptes-rendus médicaux non structurés, l’IA identifie en un instant des diagnostics qui n’auraient pas été codés dans le PMSI. Ce type d’analyse accélère la production de rapports, la préparation de dossiers pour l’ARS et les réflexions stratégiques. 

L’entrepôt sert-il aussi à la recherche ? 

Oui, même si le nombre de porteurs de projets scientifiques reste à renforcer. Mais notre Unité de Recherche clinique et Innovation s’étoffe : nous sommes passés de 5 à 8 personnes, avec des collaborations internationales, notamment avec des universités américaines. Un tiers des services de l’établissement sont désormais impliqués. Nous avons aussi développé des outils puissants, comme le screening automatique, qui détecte en temps réel les patients correspondants aux critères d’une étude. Cela nous a permis de multiplier par dix le nombre d’inclusions dans certains projets.

Un exemple concret ?  

Nous travaillons actuellement sur un système de prédiction de la tension hospitalière, c’est-à-dire la saturation des services. L’idée est d’utiliser l’IA pour analyser des données médicales et paramédicales textuelles, et ainsi anticiper les mouvements de patients jusqu’à 48 h à l’avance, pour simuler l’adéquation entre l’offre et la demande en lits. L’objectif est de prévenir les blocages avant qu’ils ne deviennent critiques, notamment en période épidémique. Notre preuve de concept est déjà opérationnelle : nous pouvons traiter 40 documents par seconde grâce à un cluster de calcul. Nous cherchons maintenant à renforcer cette capacité pour élargir notre champ d’action.

Avez-vous prévu d’autres évolutions de l’EDS pour les années à venir ?  

Nous réorientons notre stratégie. De notre point de vue, l’entrepôt de données, dans sa forme traditionnelle, perd progressivement de sa pertinence. Avec les nouveaux modèles d’IA de type LLM, désormais compacts, performants et peu coûteux, il est possible d’analyser directement les données brutes avec une précision sémantique inédite. Ce qui coûtait des millions il y a trois ans seulement, est aujourd’hui réalisable pour quelques milliers d’euros. Notre priorité est donc de concevoir un extracteur de données capable d’alimenter massivement ces IA, afin de gagner en performance par rapport aux entrepôts classiques. Cette évolution, née d’une contrainte de moyens, nous pousse vers des solutions plus agiles, plus simples à maintenir et mieux tournées vers l’avenir.

> Article paru dans Hospitalia #70, édition de septembre 2025, à lire ici 






Nouveau commentaire :
Facebook Twitter