Projet de recherche doctoral numero :8232

Description

Date depot: 10 novembre 2021
Titre: Détection de lésions dans des images médicales à l’aide de méthodes d’apprentissage automatique “intelligentes”
Directeur de thèse: Thierry GERAUD (LRE)
Directrice de thèse: Isabelle BLOCH (LIP6)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Images et vision

Resumé: Contexte : L'efficacité des réseaux neuronaux en imagerie médicale n'est aujourd'hui plus à prouver. Néanmoins, ces réseaux souffrent de certaines limites bien connues, comme la faible robustesse à la variabilité des bases d'images (les images provenant d'une base de données qui n'a pas été vue lors de la phase d'entraı̂nement par exemple), la lenteur ou la lourdeur des calculs en termes de ressources, la taille de la base de données, les indices de confiance aberrants, etc. De plus, dans le contexte de la détection de lésions en imagerie médicale, certaines lésions sont plus difficilement segmentables par les réseaux. C'est le cas des lésions très petites, présentant une grande variabilité entre les patients, ou encore diffuses. L'idée générale de la thèse est de développer des méthodes de détection et segmentation de lésions qui soient légères, rapides, robustes et justifiables pour une utilisation clinique (critères de prise de décision). Objectifs scientifiques et pistes de recherche : Les objectifs ne sont pas de développer une énième architecture de réseau neuronal, mais de se baser sur les réseaux ayant fait leurs preuves (UNet[2] et nnU-Net[1] par exemple), d'étudier leurs failles afin de comprendre les résultats les moins bons et être capable de les corriger. Parmi les pistes d'amélioration envisagées, on citera ces 4 principales : 1. Incertitude et explicabilité. Si les performances des réseaux de neurones ne sont plus à démontrer, les justifications associées à ces résultats restent elles assez floues. Depuis quelques années, le domaine d'étude de l'explicabilité de ces réseaux se développe. Une meilleure compréhension du fonctionnement des réseaux pourra permettre d'améliorer les résultats et surtout la fiabilité des réseaux. En effet, un réseau peut aujourd'hui faire une erreur tout en ayant une certitude élevée en sa prédiction. 2. Injection d'informations a priori anatomiques dans les réseaux de neurones. Certaines connaissances d'ordre anatomique par exemple pourraient grandement améliorer la qualité de détection et de segmentation des lésions en question. L'idée serait d'injecter les connaissances médicales dans les réseaux (en entrée ou à l'intérieur), en suivant le raisonnement des médecins qui établissent les diagnostics. Dans le cadre de certaines lésions du cerveau, celles de la matière blanche par exemple, l'idée serait de ne prendre en compte que les lésions qui sont présentes dans la matière blanche, qui apparaissent dans certaines modalités, qui répondent à certains critères définis par le médecin, etc. 3. Pré et post-traitements. Si la nécessité d'un pré-traitement des données n'est plus à démontrer, encore faut-il trouver le pré-traitement optimal en fonction du problème rencontré (variabilité de la base de données, techniques d'attention, etc.) Ce problème n'est aujourd'hui pas résolu, et sera l'un des axes d'étude de la thèse. Le post-traitement est également une technique répandue dans le monde des réseaux de neurones, en particulier lorsque la segmentation d'un volume 3D est effectuée coupe par coupe afin de régulariser le résultat en 3D. Ici aussi, de nombreux problèmes restent sans solution et seront étudiés pendant la thèse (comme par exemple l'utilisation des connaissances a priori anatomiques pour régulariser les formes en sortie). 4. Contrôle des ressources en mémoire et du coût de calcul. Le dernier point d'étude envisagé pour la thèse est celui du contrôle des ressources en mémoire et des coûts de calcul. En effet, à partir du moment où l'on travaille sur des images médicales en 3D, les méthodes développées peuvent devenir très gourmandes si aucune attention n'est portée à ces questions. Cela induit des méthodes qui peuvent être performantes en matière de résultats mais inutilisables et difficilement reproductibles par manque de ressources. L'idée serait donc ici de toujours contrôler les ressources nécessaires à la mise en place de la méthode afin de garantir la reproductibilité des résultats, et son utilisation par des médecins. Bases de données : La validation des méthodes développées s'effectuera dans un premier temps sur des bases de données publiques afin de garantir la reproductibilité de la recherche et de permettre des comparaison avec d'autres méthodes appliquées à ces mêmes bases, puis sur des données privées de l'hôpital du Kremlin-Bicêtre provenant du service de radiopédiatrie pour les lésions diffuses principalement. References : [1] F. Isensee, J. Petersen, A. Klein, D. Zimmerer, P. F Jaeger, S. Kohl, J. Wasserthal, G. Koehler, T. Norajitra, S. Wirkert, et al. nnu-net: Self-adapting framework for u-net-based medical image segmentation. arXiv preprint arXiv:1809.10486, 2018. [2] O. Ronneberger, P. Fischer, and T. Brox. U-net: Convolutional networks for biomedical image segmentation. In International Conference on Medical image computing and computer assisted intervention, pages 234–241. Springer, 2015.

Doctorant.e: Buatois Thibault