InCor utilise l'IA et le calcul intensif pour accroître ses capacités

Le projet en partenariat avec Intel élargit les possibilités de recherche en utilisant les résultats anonymes des tests d'imagerie.

En bref :

  • InCor est l'un des plus grands centres de cardiologie au monde en termes de nombre de visites et de sous-spécialités de cardiologie et de pneumologie. Il s'agit également d'une institution de référence en matière de recherche universitaire.

  • Un projet d'anonymisation automatisée des données a élargi les possibilités de recherche en partageant les résultats des tests d'imagerie avec les équipes de recherche. InCor, en partenariat avec Intel, utilise l'intelligence artificielle et une grande capacité de traitement pour identifier et anonymiser les données critiques et automatiser le processus.

author-image

Par

Créé en 1977, lnCor est aujourd'hui l'un des plus grands centres de cardiologie au monde en termes de nombre de visites et de sous-spécialités de cardiologie et de pneumologie. Il s'agit également d'une institution de référence en matière de recherche universitaire, soutenue par les résultats des centaines de milliers d'examens d'imagerie réalisés chaque année par l'institution.

Depuis 2012, l'équipe de recherche d'InCor travaille sur un projet d'anonymisation des données des patients afin de garantir la confidentialité des données, ce qui leur permettra d'utiliser de grands volumes d'examens dans leurs recherches. En 2017, Intel a commencé à appuyer ce projet, en intégrant l'intelligence artificielle (IA) et une grande capacité de traitement à la méthode qui traitera les examens d'imagerie et les mettra à la disposition des différentes équipes de recherche.

Défis

  • Automatiser le processus d'anonymisation des données des patients à partir d'examens d'imagerie
  • Augmenter le volume d'images mis à la disposition des groupes de recherche
  • Permettre la recherche à distance sans partager les données sensibles des patients

Solution

  • Utilisation de l'intelligence artificielle et d'une grande capacité de traitement pour identifier et anonymiser les données sensibles et automatiser le processus.

Impact

  • À l'issue de la première étape du projet, les taux de reconnaissance des données varient de 60 % à 100 %, selon le type d'examen d'imagerie.

Tout devrait être validé d'ici la fin de l'année, ce qui débouchera sur un processus qui prouvera scientifiquement la méthode d'identification des informations dans les examens », Marco Antonio Gutierrez, IT Chief chez lnCor

L'importance des résultats d'examens d'imagerie dans la recherche médicale

Chaque année, l'Institut de cardiologie de l'Université de São Paulo (lnCor) réalise environ 200 000 études d'imagerie, et chacune d'entre elles peut contenir de une à plusieurs milliers d'images. En plus de servir les centaines de milliers de patients qui visitent l'établissement chaque année, l'institution a constitué une base de données indispensable à la conduite de la recherche médicale.

lnCor est un centre de référence en cardiologie, mais également un centre important pour la recherche médicale, et beaucoup de ces études sont basées sur la collection d'examens de l'institution. Cependant, l'éthique médicale définit que les données sensibles des patients ne peuvent être divulguées par les chercheurs et doivent rester confidentielles.

Les données sensibles font référence aux informations qui permettent d'identifier le patient, telles que le nom, l'âge, la date de naissance. Ces données ne peuvent être partagées par les hôpitaux avec des tiers sans le consentement préalable du patient. Jusqu'à présent, l'anonymisation des données était extrêmement difficile en raison de l'absence de normes mises en œuvre à l'endroit où elles sont stockées dans les examens d'imagerie et en raison du format d'affichage de chaque examen (qui varie considérablement).

Aujourd'hui, la confidentialité des données est assurée par des accords de confidentialité signés par les chercheurs, qui s'engagent à ne pas divulguer de données critiques sur les cas étudiés et à ne les utiliser que de manière responsable. Mais ce modèle ne permet pas une utilisation massive des examens, qui doivent être évalués et dont les données doivent être anonymisées manuellement.

De ce fait, depuis 2012, l'équipe d'InCor Technology travaille sur un projet visant à éliminer ces informations de manière automatisée. Selon Marco Antonio Gutierrez, IT Chief chez lnCor, les équipements médicaux enregistrent déjà les données des patients dans le cadre de l'image elle-même. « Et cela se fait sans normalisation. Des informations telles que le poids, la taille, l'âge et la date de naissance peuvent être trouvées à différents endroits sur l'image », dit-il.

M. Gutierrez explique également que l'idée initiale était de développer un robot pour faire le travail. « Ensuite, nous avons créé un prototype permettant d'identifier et de brouiller les sections avec des informations textuelles. Cela a été notre premier effort pour résoudre ce problème », explique-t-il, en soulignant que le modèle devait être amélioré, car il brouillait toutes les informations textuelles.

« De nombreuses informations, telles que la date de l'examen et les mesures, par exemple, devaient être conservées. Nous avons dû relever le défi d'apprendre à notre robot à distinguer les données sensibles des données normales », précise-t-il. Selon M. Gutierrez, lors de cette première étape du projet en 2017, l'équipe d'lnCor Technology a divisé le processus en trois étapes : identification du texte dans les examens d'imagerie, conversion du texte en une séquence de caractères et brouillage des informations.

Augmentation de la capacité de traitement et utilisation de l'intelligence artificielle pour identifier les informations sensibles

En 2017, le projet de développement du robot a pris un nouvel élan. lnCor avait établi un partenariat avec Intel, qui a identifié l'IA comme l'un des domaines d'intérêt pour le développement de nouvelles solutions. Selon M. Gutierrez, l'effort conjoint avec Intel a ajouté une étape supplémentaire au processus : déployer un classificateur par le biais de l'intelligence artificielle.

« L'IA est utilisée dans une étape précédant le brouillage des informations. Elle permet d'identifier si l'information est sensible ou non. Pour cette raison, nous avons formé un réseau neuronal basé sur des annotations effectuées par une personne. Après cette formation, le réseau neuronal identifie ce qui est sensible dans le texte et le brouille, le rendant ainsi confidentiel », explique-t-il.

Dans le cadre de ce projet, Intel a affecté une équipe d'experts en logiciels qui, depuis 2018, fournissent des ressources spécialisées afin d'aider les clients dans leurs premiers développements liés à l'IA. « Nous avons analysé comment utiliser ce type de ressources pour répondre aux demandes d'lncor et identifié le besoin d'anonymisation des données issues des examens d'imagerie réalisés par l'hôpital. Cela permet de les utiliser en grande quantité dans la recherche », explique Andre Ribeiro, New Business director chez Intel Brésil.

La première étape a été un pilote mené au cours du dernier trimestre 2018, lorsqu'Intel a affecté des techniciens ayant une expérience dans le développement de solutions d'IA et qu'lnCor a affecté sa propre équipe technique. « Ensemble, nous avons créé ce prototype d'anonymisation des examens d'imagerie. Nous ne parlons pas seulement de rayons X, mais aussi de résonance magnétique, de tomographie et d'autres examens, chaque examen étant effectué dans une machine différente, provenant de fabricants différents », ajoute Andre.

Cela signifie que chaque examen comporte des informations diverses placées sur différentes parties de l'image. En pratique, le système d'IA prend un certain nombre d'examens divers générés dans différentes plateformes et les soumet à un système de machine learning, apprenant à l'ordinateur à reconnaître quelles données de cette image peuvent identifier une personne. Une fois que ces données sont identifiées, ces informations doivent être brouillées afin que les chercheurs ne puissent pas identifier le patient.

« Notre objectif est de développer quelque chose qui a un impact sur les soins aux patients, en permettant de les améliorer et de réaliser des études plus précises », Guilherme Rabello, Commercial and Market Intelligence manager chez InCor

Au total, 680 images ont été utilisées pour entraîner l'algorithme, et plus tard, 320 autres images ont été utilisées pour le tester, y compris différents types d'examens (certains contenant des tracés électrocardiographiques). Ce groupe de 1 000 images a constitué la première étape de l'apprentissage de l'algorithme, et les résultats ont été jugés positifs par l'équipe d'lnCor.

« Nous avons atteint une précision de 100 % pour les examens de ciné-angiocardiographie, d'environ 60 % pour les examens d'échographie cardiovasculaire et de plus de 50 % pour les électrocardiogrammes », révèle Gutierrez, soulignant que, chez l'être humain, la marge de précision dans l'identification des données sensibles est, en général, de 85 %.

Figure 1. Exemple d'anonymisation d'une étude utilisant la ciné-angiocoronarographie. Les textes contenant des informations sensibles ont été identifiés par une marque bleue.

Le système identifie non seulement les données sensibles des patients, mais il enregistre toutes les images selon la norme DICOM (Digital Imaging and Communications in Medicine), garantissant la compatibilité des informations entre les différents appareils.

Grâce à ces résultats, lnCor se prépare à mener en 2020 une nouvelle étape d'apprentissage des réseaux neuronaux, désormais avec un lot de 10 000 images. Cette nouvelle étape sera également appuyée par Intel. « C'est un travail à moyen et long termes qui doit être réalisé par lnCor avec notre appui. Au cours de cette deuxième étape, notre rôle est de fournir une prise en charge technique et de déterminer comment rendre les algorithmes plus efficaces afin qu'ils fonctionnent sur la plateforme lnCor », explique Andre Ribeiro.

« Tout devrait être validé d'ici la fin de l'année, aboutissant à un processus qui prouvera scientifiquement la méthode d'identification des informations dans les examens », précise Gutierrez, mettant l'accent sur le fait que l'effort consenti jusqu'à présent est axé sur la recherche et le développement.

Désormais, l'institution se concentre sur le domaine scientifique, ce qui produirait déjà des résultats impressionnants. Actuellement, lnCor réalise environ 200 000 examens d'imagerie chaque année, chaque examen contenant de une à plusieurs milliers d'images. « Nous avons plus d'un millier de projets de recherche en cours chez nous. Les sous-ensembles de ces études seront certainement utilisés dans ces projets », prédit Gutierrez.

Figure 2. Exemple d'anonymisation d'une étude en médecine nucléaire Gated-SPECT. Les textes contenant des informations sensibles ont été identifiés par une marque bleue.

En outre, l'institution dispose de 2 millions d'images de tous types stockées dans son système, avec des informations provenant de 1,4 million de personnes. « En anonymisant les données sensibles, nous avons la possibilité de mener des milliers d'analyses prédictives », dit-il.

Figure 3. Exemple d'anonymisation d'une étude en électrocardiographie. Les textes contenant des informations sensibles ont été identifiés par une marque bleue.

De plus, le système devrait encore accroître l'efficacité et la qualité du service d'lnCor. Selon Guilherme Rabello, Commercial and Market Intelligence Manager chez lnCor, le système va devenir plus robuste dans cette nouvelle étape. « Notre objectif est de développer quelque chose qui a un impact sur les soins aux patients, permettant de les améliorer et de réaliser des études plus précises », dit-il.

Ensemble, nous avons créé ce prototype d'anonymisation des examens d'imagerie. Il ne s'agit pas seulement de radiographies, mais aussi de résonance magnétique, de tomographie et d'autres examens, chacun d'entre eux étant réalisé dans une machine différente, de fabricants différents. » - André Ribeiro, New Business director chez Intel Brésil

À propos de l'Institut de cardiologie (InCor)

Fondé le 10 janvier 1977, lnCor est l'un des sept instituts qui composent le complexe Hospital das Clínicas, de la Faculté de médecine de l'Université de São Paulo (HCFMUSP). En 40 ans, l'Institut est devenu l'un des plus grands centres de cardiologie au monde en termes de nombre de visites et de sous-spécialités de cardiologie et de pneumologie. lnCor enregistre en moyenne 260 000 visites médicales par an, réalise 5 000 opérations chirurgicales, 2 millions d'examens cliniques et a déjà effectué plus de 1 000 transplantations cardiaques et pulmonaires.

Télécharger le PDF ›