Les tests de l’IA co-clinicienne de DeepMind évaluent le diagnostic multimodal et la sécurité dans des simulations cliniques

CryptoFrontier

Google DeepMind a introduit un « co-clinicien » basé sur l’IA le 01 mai 2026. Il s’agit d’une initiative de recherche visant à examiner comment des systèmes d’IA multimodaux pourraient mieux soutenir les professionnels de santé et les patients. Le projet répond à la pression croissante exercée sur les systèmes de santé dans le monde afin d’améliorer les résultats, de réduire les coûts et d’étendre l’accès aux soins, dans un contexte de pénurie projetée de plus de 10 millions de travailleurs de la santé d’ici 2030, selon l’Organisation mondiale de la santé.

Modèle de soins triadique et capacités multimodales

Le nouveau système vise à explorer un modèle de « soins triadiques », dans lequel un agent d’IA travaille aux côtés d’un médecin et d’un patient, plutôt que de remplacer le jugement clinique. DeepMind a déclaré que l’objectif est de construire des outils capables d’étendre la portée des cliniciens tout en gardant les médecins aux commandes des décisions. La société a présenté l’effort comme l’étape suivante de sa recherche sur l’IA médicale, après des systèmes antérieurs tels que MedPaLM, axé sur des tests de connaissances médicales, et AMIE, qui effectuait des consultations simulées en texte.

Une caractéristique clé du co-clinicien est sa capacité à traiter davantage que du texte. Le système a été testé avec de l’audio et de la vidéo en direct, lui permettant d’observer des signaux physiques tels que la démarche, les schémas respiratoires et des changements visibles de la peau. Lors de simulations de télé-médecine, le modèle a pu guider les patients à travers des parties d’un examen physique et aider à des tâches comme la vérification de la technique d’utilisation d’un inhalateur ou l’identification d’une blessure à l’épaule. Ces capacités suggèrent que l’IA multimodale pourrait, à terme, soutenir des consultations à distance lorsque l’observation visuelle et auditive compte.

Conception de sécurité à double agent et références cliniques

DeepMind a mis en avant des garde-fous de sécurité intégrés au système. Le co-clinicien d’IA utilise une conception à double agent dans laquelle un « Planificateur » examine en continu l’échange et vérifie que le « Parleur » reste dans les limites cliniques. La société a indiqué que cette structure vise à réduire les sorties dangereuses et à améliorer la fiabilité en milieu médical, où la précision factuelle et la retenue sont essentielles.

L’équipe de recherche a évalué le système de plusieurs façons. Dans un test, elle a adapté le cadre de sécurité NOHARM pour mesurer à la fois les réponses incorrectes et les cas où des informations importantes ne sont pas mises en avant. Dans des comparaisons à l’aveugle portant sur 98 requêtes de médecine générale, le système a enregistré zéro erreur critique dans 97 cas et a été préféré à d’autres outils de synthèse de preuves par des médecins. DeepMind a déclaré que cela suggère que le modèle peut être utile pour les cliniciens qui recherchent une information clinique solide et de haute qualité.

L’étude a aussi examiné dans quelle mesure le système traitait des questions liées aux médicaments grâce à la référence OpenFDA RxQA, conçue pour tester les connaissances et le raisonnement sur les médicaments et les traitements. Lors d’évaluations ouvertes, le co-clinicien d’IA a surpassé d’autres modèles de pointe, indiquant des progrès dans un domaine particulièrement important pour la planification des soins au quotidien.

Comparaison des performances des médecins

Dans les simulations orientées patients, toutefois, les médecins humains ont encore mieux performé dans l’ensemble. En travaillant avec des médecins universitaires de Harvard et Stanford, l’équipe de recherche a mené une étude randomisée portant sur 20 scénarios cliniques synthétiques et 10 patient-acteurs médecins. Sur plus de 140 domaines évalués, les médecins ont surpassé l’IA pour détecter les signaux d’alerte et diriger les examens physiques, même si le système correspondait ou dépassait les performances des médecins dans 68 catégories, y compris le triage. Les résultats suggèrent que l’outil pourrait être plus utile comme système d’assistance que comme substitut à l’expertise clinique.

Collaborations de recherche en cours

DeepMind a déclaré que l’objectif plus large est de développer une IA capable d’aider les médecins de manière digne de confiance, solidement ancrée sur le plan clinique et adaptable aux environnements réels de soins. La société poursuit des collaborations de recherche dans plusieurs pays, dont les États-Unis, l’Inde, l’Australie, la Nouvelle-Zélande, Singapour et les Émirats arabes unis, alors qu’elle travaille à tester le système dans des contextes de santé plus diversifiés.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.
Commentaire
0/400
Aucun commentaire