France

Santé : l’IA peut amplifier des biais sans prévenir

L’intelligence artificielle, que l’on appelait le « Big Data » et le « machine learning » il y a quelques années, est un outil déjà connu qu’utilisent les « Contract research organization » (CRO), ces sous-traitants des laboratoires pharmaceutiques qui mènent les études cliniques avant la mise sur le marché d’un traitement. Le recours à des millions de données patients numérisées « permet de gagner un temps dont on ne pourrait plus se passer », résume Tiphaine Martin, bio-informaticienne de l’Icahn School of Medicine at

Mount Sinaï Institute, un regroupement de sept hôpitaux new-yorkais. A mesure que l’IA s’impose dans le champ médical, elle suscite autant d’espoirs que d’interrogations, souligne cette Française détachée du CNRS. Derrière la promesse d’une médecine plus précise et personnalisée, une réalité plus complexe se dessine : celle de modèles construits à partir de données imparfaites, parfois biaisées, « susceptibles d’influencer les résultats sans que l’on s’en rende compte », suggère cette scientifique formée à l’INSA Lyon, qui a travaillé au laboratoire d’informatique de Bordeaux et

en Angleterre. Des données robustes… mais fausses En cancérologie, ces outils sont déjà opérationnels. Pour garantir l’efficacité d’une chimiothérapie, Tiphaine Martin mobilise ainsi labio-informatique et la biostatistique pour analyser de vastes jeux de données biologiques et cliniques, afin d’améliorer l’identification des patients à risque et de mieux comprendre les liens entre les variations génétiques, le développement des tumeurs et la réponse aux traitements. Sur un cancer du sein par exemple (2,3 millions de nouveaux cas par an selon l’OMS), l’origine, l’alimentation, le mode de vie

et l’environnement influent sur la gravité de la maladie. Dans le cas du cancer du sein triple négatif, qui est très agressif, « il est plus prégnant chez des femmes d’origine africaine d’autant que leur exposition aux risques est majorée », explique Tiphaine Martin. Alors que ces données cliniques sont mêlées à d’autres catégories de population, l’IA a tendance à généraliser une solution. Elle apprend à partir de données existantes, elles-mêmes construites dans des contextes sociaux, économiques et scientifiques spécifiques, observe-t-elle. Réalités spécifiques, surtout aux

Etats-Unis Un autre cas de figure concerne des marqueurs biologiques pour détecter des maladies rénales (600 millions de patients dans le monde selon l’OMS). Pendant longtemps, les seuils n’étaient pas les mêmes selon les populations, notamment pour les patients afro-américains, sur la base d’hypothèses liées à la masse musculaire. Résultat : des diagnostics plus tardifs chez certains malades. «‌‌ Si on entraîne un modèle sur ces données, il va reproduire ce biais sans le questionner », constate Tiphaine Martin. Le risque est d’autant plus important

qu’une grande partie des bases de données médicales utilisées en recherche proviennent des Etats-Unis. Or, elles reflètent des réalités spécifiques : inégalités d’accès aux soins, fortes corrélations entre les conditions socio-économiques et l’origine des populations. «‌‌ On peut croire qu’un facteur biologique explique une maladie, alors qu’il s’agit en réalité d’un biais social », constate-t-elle. Ces effets de confusion sont bien connus en statistique, mais prennent une nouvelle ampleur avec l’IA. Plus les volumes de données sont importants, plus les corrélations semblent robustes… même lorsqu’elles

sont trompeuses.

intelligence artificielle, santé, biais, données patients, cancer du sein triple négatif, maladies rénales, CRO, biostatistique, labio-informatique, États-Unis

Leave a Reply

Your email address will not be published. Required fields are marked *

Are you human? Please solve:Captcha