Connectez-vous S'inscrire
SIS

Décryptage : terminologies et modèles d'information


Rédigé par Aurélie Pasquelin le Lundi 13 Juin 2022 à 12:05 | Lu 569 fois


Docteur en médecine, Olivier Bodenreider, s’est très tôt passionné pour le numérique et ses applications au secteur médical. Aujourd’hui directeur par intérim du Lister Hill National Center for Biomedical Communications de la National Library of Medicine (NLM), aux États-Unis, il concentre ses travaux sur les ontologies propres au monde de la santé. Rencontre.



Le Dr Olivier Bodenreider, directeur par intérim du Lister Hill National Center for Biomedical Communications de la National Library of Medicine aux États-Unis. ©DR
Le Dr Olivier Bodenreider, directeur par intérim du Lister Hill National Center for Biomedical Communications de la National Library of Medicine aux États-Unis. ©DR
Originaire de l’Est de la France, vous exercez aujourd’hui à la National Library of Medicine (NIH) des États-Unis. Pourriez-vous revenir sur votre parcours ?
Dr Olivier Bodenreider : Après un diplôme de médecine, obtenu en 1990 à l’Université de Strasbourg, j’ai intégré un diplôme d'études supérieures spécialisées (DESS) d’informatique à Nancy. Trois ans plus tard, j’ai complété ce cursus par une thèse en informatique médicale, un domaine alors en construction. J’ai ensuite exercé pendant quelques années comme assistant hospitalo-universitaire à Nancy, avant de souhaiter poursuivre mon parcours par une année de recherche à l'étranger, en l’occurrence aux États-Unis. Nous étions alors en 1996, année où j'ai entamé mes travaux à la National Library of Medicine (NLM), donc la Bibliothèque nationale de médecine, qui est l’un des instituts de l’agence gouvernementale américaine National Institutes of Health (NIH).

Vous y travaillez toujours aujourd’hui…
J’y ai en effet fait ma carrière, jusqu’à être aujourd’hui à la tête de la branche dans laquelle j'avais commencé il y a 25 ans : le Lister Hill National Center for Biomedical Communications (LHNCBC), soit le Centre national de communications biomédicales Lister Hill, qui est l’un des centres de recherche de la NLM, la plus grande bibliothèque médicale du monde. La NLM offre de nombreux services : elle accueille non seulement des centres de recherches, mais héberge également plusieurs outils tels que PubMed, un moteur de recherche spécialisé dans les articles biomédicaux et utilisé partout dans le monde, ou encore GenBank, une base de données de séquences d'ADN.

Sur quelles thématiques travaillez-vous ?
Mon programme de recherche porte sur les ontologies et les terminologies médicales, des éléments primordiaux pour l'interopérabilité des systèmes informatiques, et donc l'analyse des données médicales à large échelle. Pour schématiser, l'interopérabilité peut être résumée par la formule I=T+M, qui la positionne comme la somme des terminologies et des modèles d'information. Ce sont ces derniers qui permettent de la structurer. Si l’on prend une collection d'éléments de données tels que la date de naissance ou le nom de famille, pour prendre des exemples administratifs, le modèle d’information va nous apporter une structure. Nous pouvons, de la même manière, structurer les données d’un examen physique, d’une auscultation… À chaque fois, il faut imaginer des boîtes, et dans chaque boîte un terme qui correspondra à l'observation et à ses résultats. Il faut donc caractériser les deux : l'acte et son résultat. Et pour cela, il est nécessaire de se baser sur des terminologies fiables, qui renseignent correctement le modèle d'information.

Justement, comment travailler sur les terminologies ?
Vous l’avez compris, les terminologies donnent donc le vocabulaire qui permettra de décrire les éléments relatifs à un acte et aux valeurs qui en découlent. Il y a deux façons d’aborder la question. Soit en créant de nouvelles terminologies, ce que nous faisons déjà dans le cas d’une maladie rare, par exemple. Soit en se référant à celles qui existent déjà, et elles sont réellement nombreuses – le monde médical en est riche. Par exemple, l'Organisation mondiale de la santé (OMS) développe, depuis un siècle et demi, une classification internationale des maladies, utilisée comme standard mondial pour recueillir les causes de décès et de morbidité. Mais cette classification, qui n’est somme tout que l’une des terminologies médicales existantes, évolue en permanence : l’OMS a d’ailleurs déjà produit onze révisions.

Quelles sont les autres terminologies ?
Chaque terminologie est particulière et répond à un besoin : certaines sont spécialisées dans les médicaments, la biologie… Citons par exemple la nomenclature LOINC (Logical Observation Identifiers Names & Codes) utilisée pour les examens de laboratoire, ou le système MESH (Medical Subject Headings) pour l’indexation de la littérature biomédicale, ou encore le projet GO (Gene Ontology) créé il y a une quinzaine d’années pour l’annotation des protéines. Il existe par ailleurs des organisations chargées de développer des standards, et en particulier des standards de terminologie. Dites standards development organization (SDO), ou organismes de normalisation en français, elles sont pour certaines très connues, comme HL7 qui produit principalement des modèles d'information, ou SNOMED International, qui développe SNOMED CT, la terminologie clinique la plus grande au monde.

Faut-il former les professionnels de santé à ces terminologies ?
Il existe différents cas de figure, suivant les missions propres à chacun. Dans les lieux techniques, comme les laboratoires, des outils sophistiqués utilisent déjà les langages terminologiques : le code de l’examen et du résultat est directement inséré par la machine dans l’édition du compte-rendu. Dans ce cas-là, l’usage des terminologies est simple et ne nécessite pas de formation. La question se pose davantage dans le cas de l’examen clinique. Il y a ici plusieurs écoles. Certains émettent l’idée que les données doivent dès le départ être renseignées de manière structurée, en respectant les terminologies. Mais cela ralentirait terriblement la saisie des données, ce qui ne sera pas sans impact sur l’exercice même des professionnels de santé. L'autre approche consiste à adapter les outils numériques aux pratiques déjà en place. Le compte-rendu écrit ou oral passerait alors par des systèmes de traitement du langage naturel, qui en extraira les informations utiles pour compléter les modèles d'information que nous évoquions précédemment. Il y a actuellement de nombreux travaux en ce sens. En radiologie par exemple, une spécialité où les comptes-rendus sont relativement standardisés, l’on voit de plus en plus de pratiques associant déjà la reconnaissance vocale.

Comment assurer l’interopérabilité ici ?
Les comptes-rendus ne sont pas, en eux-mêmes, source d'interopérabilité : la machine sait transmettre du texte, mais pas forcément le comprendre. L’interopérabilité sémantique ne sera donc atteinte qu’une fois que l’on sera parvenu à en extraire de l’information, à la structurer. Et l’enjeu actuel est justement de faire en sorte que les structures qui utilisent l'un ou l'autre standard puissent échanger. Cela est valable pour les nomenclatures comme LOINC ou SNOMED CT, mais aussi pour des terminologies administratives et médicales, par exemple. Pouvoir passer facilement de l'une à l'autre est primordial pour garantir une interopérabilité réelle.

Mais comment faire le lien entre toutes ces différentes terminologies ?
C'est une tâche énorme. On peut tout d’abord créer des équivalences point à point entre deux terminologies. Concrètement, cela consiste à effectuer une table de correspondances entre toutes les entrées. C'est extrêmement long, mais cela peut être réalisé de manière ponctuelle pour des terminologies particulières. Une autre optique est celle qui a été développée par la NLM depuis une trentaine d'années. Constatant que l'interopérabilité est une problématique complexe, la NLM a créé le Unified Medical Language System (UMLS) qui, pour chaque concept médical, relie tous les termes existants. Pour résumer, le système regroupe toutes les terminologies décrivant une même notion. Mise en œuvre depuis 30 ans, cette pratique évolue constamment, pour s’adapter aux terminologies émergentes. Basé sur la linguistique et le traitement lexico-syntaxique des termes, UMLS automatisme partiellement la création des groupes terminologiques. Cette tâche est ensuite complétée par des experts.

Quel est impact de ces recherches pour les hôpitaux au quotidien ?
Les établissements de santé n'ont pas directement besoin de tout cela pour leur activité de soins. Ces travaux s’intègrent plutôt dans l’analyse rétrospective des données. Lorsqu’une étude est engagée à une certaine échelle, il est toujours utile d’y inclure plusieurs sources. On se rend alors rapidement compte des problématiques liées à l’interopérabilité, et de la nécessité d’uniformiser les terminologies. Les données issues de sources hétérogènes, et donc relevant de terminologies différentes, sont en effet difficilement compatibles en l’état. Passer par des systèmes d’harmonisation est nécessaire pour pouvoir les analyser.  

La crise sanitaire a-t-elle eu des conséquences particulières sur vos travaux ?
L’arrivée d’une nouvelle maladie et le déclenchement d’une pandémie ont eu un impact certain. Le recueil des données sur un domaine nouveau a engendré la création de nouveaux codes, pour désigner des examens ou des actes qui n’étaient pas réalisés auparavant. On peut citer par exemple ici la multiplication des tests PCR Covid. Cela dit, les créateurs de terminologies ont rapidement développé les termes qui manquaient, pour éviter que chacun n'en crée de son côté. Il y a donc eu une grande réactivité de la part des développeurs de nouvelles technologies pour s'assurer que le « vocabulaire » nécessaire à la description de cette nouvelle pathologie soit disponible au plus tôt, et permettre ainsi un recueil de données le plus standard possible. Je suis persuadé que ce mouvement perdurera à l’avenir. Plusieurs systèmes se mettent d’ailleurs en place, c’est encourageant. De telles initiatives offrent un excellent modèle pour investir et créer des systèmes à large échelle, de manière institutionnelle.
 
Article publié dans l'édition de mai 2022 d'Hospitalia à lire ici.
 






Nouveau commentaire :
Facebook Twitter







CONTACT

HOSPITALIA

Immeuble Newquay B / B35
13 rue Ampère
35800 Dinard 
Tél : 02 99 16 04 79
Email : contact@hospitalia.fr

Abonnement :
abonnement@hospitalia.fr

Siège social :
23/25 rue Jean-Jacques Rousseau 
75001 Paris