...

Qui dit algorithmes d'IA et machine learning dit data d'apprentissage. Beaucoup de data. Et, dans le cas de données médicales, des données complexes. La protection de la vie privée et la sécurité constituent un défi évident. L'importante fuite de données du NHS britannique en 2018 avait suscité - à juste titre - beaucoup d'indignation. Techniquement, ce genre de chose peut certainement se résoudre aujourd'hui. Dans le cadre du federated learning, les infos sont partagées pour affiner un modèle d'IA, mais pas les données sources elles-mêmes. Problème de cette méthode, elle exige une grande compatibilité et comparabilité des données. Or, dans la pratique, la manière dont les hôpitaux, médecins et réseaux de soins gèrent, structurent et étiquettent leurs données varie considérablement. Cela s'explique par le fait qu'à l'origine, il n'y avait aucune intention de collaborer ou partager des données en dehors des murs de l'hôpital ou du cabinet. Aujourd'hui encore, on hésite à contribuer à un modèle d'IA non exclusivement propriété de son hôpital. Et si nous pouvions faire travailler ensemble différents modèles d'IA, chacun formé localement sur ses propres données, pour créer un meilleur modèle "agrégé"? Les chercheurs ont élaboré un modèle qui permet de combiner les connaissances et les données de différents hôpitaux sans travail d'homogénéisation préalable, mais en respectant la confidentialité des données des patients et en maintenant la propriété de chacun sur les sous-modèles individuels. Résultat: un supermodèle plus précis, qui devrait permettre d'améliorer les soins aux patients. La théorie est une chose, la mise en pratique nécessite la collaboration d'équipes multidisciplinaires et de tous les partenaires. En Flandre, nous avons acquis une expertise grâce au projet Athena (Augmenting THerapeutic Effectiveness through Novel Analytics), soutenu par le Vlaio. Les hôpitaux participants (UZ Leuven, UZ Gent, AZ Groeninge, CHU de Liège, hôpital Onze Lieve Vrouw à Alost et Ziekenhuis Oost-Limburg) ont examiné comment les données existantes pouvaient être réutilisées pour alimenter la recherche sur la meilleure thérapie pour le cancer de la vessie et le myélome multiple. Il s'agissait à la fois de données dites "omiques" (dépistage de l'ADN ou de l'ARN, par exemple) et de données "non omiques", telles que l'imagerie médicale. Résultat: nous pouvons diviser en sous-groupes une population de patients à grande échelle dans différents hôpitaux, ce qui permet de prédire avec plus de précision, pour chaque sous-groupe, quel traitement réussira et les effets secondaires. Un moyen de lutter contre le sous-traitement et le surtraitement (coûteux), de mieux adapter les traitements et les soins. Les défis à relever? Les supermodèles nécessitent des données qualitatives et une puissance de calcul très élevée. Cela pose des problèmes d'évolutivité. En particulier pour les études de population à grande échelle, nous avons besoin de méthodes et modèles encore plus efficaces. Autre défi, tout aussi important: l'adhésion de tous. Aussi fiable, efficace et convaincante une possibilité technologique soit-elle, si les médecins et les hôpitaux ne sont pas convaincus de sa valeur ajoutée, la cause est perdue d'avance. Ce qui est également apparu, c'est que les comités d'éthique doivent être encore plus convaincants pour autoriser les techniques de machine learning. Le fait d'être strict et critique se justifie, mais nous devons éviter que les réglementations censées protéger les patients ne repoussent l'innovation qui peut les aider. À l'avenir, l'IA deviendra un outil essentiel au cabinet, à l'instar du stéthoscope. Elle aidera le médecin, qu'il s'agisse de mieux comprendre des pathologies complexes, d'optimiser les traitements ou de poser plus vite le diagnostic. Dans le dernier imec.digimeter, on voit que la population a aussi des attentes quant au rôle de la technologie pour sa santé. Une proportion croissante (41%) utilise des dispositifs portables et des applis de santé et/ou de sport. Un grand nombre semble prêt à partager ces données avec les médecins. Ne serait-il pas sympa que les données de la smartwatch de votre voisin vous aident à proposer à vos patients une thérapie plus éclairée? Mais avant que cela ne soit possible, les data brutes de ces smartwatches doivent être disponibles pour alimenter les modèles d'IA (agrégés). Pas si évident... Un patient qui demande ses données à une entreprise qui vend des trackers ou des smartwatches obtient généralement quelques infos, mais pas les data brutes. Il serait préférable - et plus juste - que le patient ait accès à ses propres données et puisse les placer dans un coffre-fort de données personnelles, pour pouvoir ensuite décider avec qui il souhaite les partager. Tel est le principe de Solid, une nouvelle vision des données personnelles qui permet aux utilisateurs de mieux contrôler leurs données. La combinaison en or d'une somme de données - sécurisées via des coffres-forts et des modèles d'IA collaborant dans tous les environnements de soins de santé - peut faire passer les connaissances médicales à un niveau supérieur. Au profit, sans aucun doute, des patients.