Détection des polypes coliques: vers une supériorité de l’IA sur l’humain?

UEGW 2024

Position du problème

Le diagnostic des polypes colorectaux par des endoscopistes non experts n’atteint pas les seuils de qualité en Angleterre. Les études précédentes sur le système CADx se limitent à des systèmes d’IA évalués par des endoscopistes experts. CADDIE est un système CADx basé sur le cloud qui reçoit le flux d’images en temps réel sur l’écran d’endoscopie via le réseau Internet de l’hôpital, où l’algorithme d’IA traite les images et émet son diagnostic (adénome, non-adénome ou incertain).
Ce système n’a pas encore été évalué en pratique courante.

Méthode

739 patients inclus entre avril 2021 et décembre 2022, examinés par 32 endoscopistes dans 9 hôpitaux britanniques (60 coloscopies max / opérateur)
Les patients ont été randomisés en 1:1 entre les soins standard (SOC) et l’intervention (CADDIE), stratifiés par endoscopiste et par indication. La précision de la détection des humains seuls (bras SOC) et des humains assistés par CADDIE (bras CADDIE + humain) a été comparée à la performance du système CADDIE seul dans le bras CADDIE.

Résultat

Il y avait 615 patients évaluables. Il y avait 523 polypes éligibles (270 dans le groupe SOC, 253 dans le groupe CADDIE). Le système CADDIE a diagnostiqué 17,8 % des polypes (45/253) comme étant « incertains ».
Pour les polypes de ≤10 mmL, le taux de détection humaine seule (SOC) était de 75,9 %, la détection humaine assistée par CADDIE était de 80,2 %, tandis que le système CADDIE autonome était significativement plus élevé que les deux, à 87,5 % (p=0,005 et p=0,04, respectivement).
La précision diagnostique CADDIE était significativement plus élevée (87,9 %) que les humains seuls (78,4 %;p=0,04), sans différence avec les humains + AI.

Conclusion

Cette étude montre une preuve de faisabilité d’utilisation en temps réel d’un système d’intelligence artificielle basé sur un cloud, avec des résultats robustes. Des recherches supplémentaires sont justifiées dans le domaine de l’interaction homme-machine afin d’optimiser les performances des endoscopistes non experts en matière de détection par rapport à celles des systèmes d’intelligence artificielle CADx.
La principale limite de cette étude est liée à la faible représentativité des gastroentérologues (42% des opérateurs) vs 31% de chirurgiens et 27% d’infirmières de pratique avancée.