Selon une nouvelle étude menée par des chercheurs du MIT, lorsqu'ils diagnostiquent des maladies de la peau uniquement à partir d'images de la peau d'un patient, les médecins ne sont pas aussi efficaces lorsque le patient a la peau plus foncée.
L'étude, qui comprenait plus de 1 000 dermatologues et médecins généralistes, a révélé que les dermatologues ont caractérisé avec précision environ 38 % des images qu'ils ont vues, mais seulement 34 % de celles montrant une peau plus foncée. Les médecins généralistes, qui étaient globalement moins précis, ont montré une diminution similaire de la précision avec une peau plus foncée.
L'équipe de recherche a également découvert que l'aide d'un algorithme d'intelligence artificielle pourrait améliorer la précision des médecins, bien que ces améliorations soient plus importantes lors du diagnostic de patients à la peau plus claire.
Bien qu’il s’agisse de la première étude démontrant les disparités diagnostiques des médecins selon le teint, d’autres études ont révélé que les images utilisées dans les manuels de dermatologie et les supports de formation présentent principalement des tons chair plus clairs. Selon l'équipe du MIT, cela pourrait être un facteur contribuant à cet écart, ainsi que la possibilité que certains médecins aient moins d'expérience dans le traitement des patients à la peau plus foncée.
« Aucun médecin n'a probablement l'intention de faire pire sur quelque type de personne que ce soit, mais il se peut que vous n'ayez pas toutes les connaissances et l'expérience, et donc sur certains groupes de personnes, vous pourriez faire pire », explique Matt. Groh PhD '23, professeur adjoint à la Kellogg School of Management de la Northwestern University. « C'est l'une de ces situations où vous avez besoin de preuves empiriques pour aider les gens à comprendre comment vous pourriez vouloir changer les politiques en matière d'enseignement en dermatologie. »
Groh est l'auteur principal de l'étude, qui paraît aujourd'hui dans Médecine naturelle. Rosalind Picard, professeur d'arts et de sciences médiatiques au MIT, est l'auteur principal de l'article.
Écarts de diagnostic
Il y a plusieurs années, un Étude du MIT dirigé par Joy Buolamwini PhD '22, a découvert que les programmes d'analyse faciale présentaient des taux d'erreur beaucoup plus élevés lors de la prédiction du sexe des personnes à la peau plus foncée. Cette découverte a inspiré Groh, qui étudie la collaboration homme-IA, à déterminer si les modèles d’IA, et éventuellement les médecins eux-mêmes, pourraient avoir des difficultés à diagnostiquer les maladies de la peau sur des peaux plus foncées – et si ces capacités de diagnostic pourraient être améliorées.
« Cela semblait être une excellente occasion d'identifier s'il existe un problème social et comment nous pourrions le résoudre, ainsi que de déterminer la meilleure façon d'intégrer l'assistance de l'IA dans la prise de décision médicale », explique Groh. « Je suis très intéressé par la façon dont nous pouvons appliquer l'apprentissage automatique à des problèmes du monde réel, en particulier pour aider les experts à améliorer leur travail. La médecine est un espace où les gens prennent des décisions vraiment importantes, et si nous pouvions améliorer leur prise de décision, nous pourrions améliorer les résultats pour les patients.
Pour évaluer l'exactitude du diagnostic des médecins, les chercheurs ont compilé une série de 364 images provenant de manuels de dermatologie et d'autres sources, représentant 46 maladies de la peau sur de nombreuses nuances de peau.
La plupart de ces images représentaient l'une des huit maladies inflammatoires de la peau, notamment la dermatite atopique, la maladie de Lyme et la syphilis secondaire, ainsi qu'une forme rare de cancer appelée lymphome cutané à cellules T (CTCL), qui peut ressembler à une affection cutanée inflammatoire. . Beaucoup de ces maladies, y compris la maladie de Lyme, peuvent se manifester différemment sur une peau foncée ou claire.
L'équipe de recherche a recruté des sujets pour l'étude via Sermo, un site de réseautage social destiné aux médecins. Le groupe d’étude total comprenait 389 dermatologues certifiés, 116 résidents en dermatologie, 459 médecins généralistes et 154 autres types de médecins.
Chacun des participants à l'étude a vu 10 des images et a demandé ses trois principales prédictions sur la maladie que chaque image pourrait représenter. On leur a également demandé s’ils orienteraient le patient vers une biopsie. Il a également été demandé aux médecins généralistes s'ils orienteraient le patient vers un dermatologue.
« Ce n'est pas aussi complet que le triage en personne, où le médecin peut examiner la peau sous différents angles et contrôler l'éclairage », explique Picard. « Cependant, les images cutanées sont plus évolutives pour le triage en ligne et elles sont faciles à saisir dans un algorithme d'apprentissage automatique, qui peut estimer rapidement les diagnostics probables. »
Les chercheurs ont constaté que, sans surprise, les spécialistes en dermatologie avaient des taux de précision plus élevés : ils ont classé correctement 38 pour cent des images, contre 19 pour cent pour les médecins généralistes.
Ces deux groupes ont perdu environ quatre points de pourcentage en précision lorsqu’ils ont tenté de diagnostiquer des affections cutanées sur la base d’images de peau plus foncée – une baisse statistiquement significative. Les dermatologues étaient également moins susceptibles de référer des images de peau plus foncée de CTCL pour une biopsie, mais plus susceptibles de les référer pour une biopsie pour des affections cutanées non cancéreuses.
« Cette étude démontre clairement qu’il existe une disparité dans le diagnostic des affections cutanées chez les peaux foncées. Cette disparité n’est pas surprenante ; cependant, je ne l'ai pas vu démontré dans la littérature de manière aussi robuste. Des recherches plus approfondies devraient être effectuées pour tenter de déterminer plus précisément quels pourraient être les facteurs causals et atténuants de cette disparité », déclare Jenna Lester, professeure agrégée de dermatologie et directrice du programme Skin of Color à l'Université de Californie à San Francisco, qui n’a pas participé à l’étude.
Un coup de pouce de l’IA
Après avoir évalué les performances des médecins par eux-mêmes, les chercheurs leur ont également donné des images supplémentaires à analyser à l’aide d’un algorithme d’IA développé par les chercheurs. Les chercheurs ont entraîné cet algorithme sur environ 30 000 images, en lui demandant de classer les images comme l’une des huit maladies représentées par la plupart des images, plus une neuvième catégorie « autres ».
Cet algorithme avait un taux de précision d'environ 47 pour cent. Les chercheurs ont également créé une autre version de l'algorithme avec un taux de réussite artificiellement gonflé de 84 pour cent, leur permettant d'évaluer si la précision du modèle influencerait la probabilité des médecins de suivre ses recommandations.
« Cela nous permet d'évaluer l'assistance de l'IA avec des modèles qui sont actuellement les meilleurs que nous puissions faire, et avec une assistance de l'IA qui pourrait être plus précise, peut-être dans cinq ans, avec de meilleures données et de meilleurs modèles », explique Groh.
Ces deux classificateurs sont tout aussi précis sur les peaux claires et foncées. Les chercheurs ont découvert que l’utilisation de l’un ou l’autre de ces algorithmes d’IA améliorait la précision à la fois pour les dermatologues (jusqu’à 60 %) et les médecins généralistes (jusqu’à 47 %).
Ils ont également constaté que les médecins étaient plus susceptibles d’accepter les suggestions de l’algorithme de plus grande précision après avoir fourni quelques réponses correctes, mais qu’ils intégraient rarement les suggestions de l’IA qui étaient incorrectes. Cela suggère que les médecins sont hautement qualifiés pour exclure les maladies et n'accepteront pas les suggestions de l'IA pour une maladie qu'ils ont déjà exclue, dit Groh.
« Ils savent très bien ne pas suivre les conseils de l'IA lorsque l'IA est erronée et que les médecins ont raison. C'est quelque chose qu'il est utile de savoir », dit-il.
Alors que les dermatologues utilisant l’IA ont montré une augmentation similaire de la précision lorsqu’ils regardaient des images de peau claire ou foncée, les médecins généralistes ont montré une plus grande amélioration sur les images de peau plus claire que sur les images de peau plus foncée.
« Cette étude nous permet de voir non seulement comment l'assistance de l'IA influence, mais aussi comment elle influence tous les niveaux d'expertise », explique Groh. « Ce qui se passe peut-être, c'est que les médecins praticiens n'ont pas autant d'expérience, donc ils ne savent pas s'ils doivent exclure une maladie ou non, car ils ne connaissent pas aussi bien les détails de la manière dont différentes maladies de peau peuvent survenir. regardez différentes nuances de peau.
Les chercheurs espèrent que leurs résultats contribueront à inciter les écoles de médecine et les manuels scolaires à intégrer davantage de formation sur les patients à la peau plus foncée. Les résultats pourraient également contribuer à orienter le déploiement de programmes d’assistance à l’IA en dermatologie, que de nombreuses entreprises développent actuellement.
La recherche a été financée par le MIT Media Lab Consortium et le Harold Horowitz Student Research Fund.