Computer-aided diagnosis methods for cervical cancer screening on liquid-based Pap smears using convolutional neural networks : design, optimization and interpretability - Equipe Image, Modélisation, Analyse, GEométrie, Synthèse Accéder directement au contenu
Thèse Année : 2021

Computer-aided diagnosis methods for cervical cancer screening on liquid-based Pap smears using convolutional neural networks : design, optimization and interpretability

Méthodes de diagnostic assisté par ordinateur pour le dépistage du cancer du col de l’utérus sur lames de frottis vaginal en milieu liquide basées sur les réseaux de neurones à convolutions : conception, optimisation et interprétabilité

Résumé

Cervical cancer is the second most important cancer for women after breast cancer. In 2012, the number of cases exceeded 500,000 worldwide, among which half turned to be deadly.Until today, primary cervical cancer screening is performed by a regular visual analysis of cells, sampled by pap-smear by cytopathologists under brightfield microscopy in pathology laboratories. In France, about 5 millions of cervical screening are performed each year and about 90% lead to a negative diagnosis (i.e. no pre-cancerous changes detected). Yet, these analyses under microscope are extremely tedious and time-consuming for cytotechnicians and can require the joint opinion of several experts. This process has an impact on the capacity to tackle this huge amount of cases and to avoid false negatives that are the main cause of treatment delay. The lack of automation and traceability of screening is thus becoming more critical as the number of cyto-pathologists decreases. In that respect, the integration of digital tools in pathology laboratories is becoming a real public health stake for patients and the privileged path for the improvement of these laboratories. Since 2012, deep learning methods have revolutionized the computer vision field, in particular thanks to convolutional neural networks that have been applied successfully to a wide range of applications among which biomedical imaging. Along with it, the whole slide imaging digitization process has opened the opportunity for new efficient computer-aided diagnosis methods and tools. In this thesis, after motivating the medical needs and introducing the state-of-the-art deep learning methods for image processing and understanding, we present our contribution to the field of computer vision tackling cervical cancer screening in the context of liquid-based cytology. Our first contribution consists in proposing a simple regularization constraint for classification model training in the context of ordinal regression tasks (i.e. ordered classes). We prove the advantage of our method on cervical cells classification using Herlev dataset. Furthermore, we propose to rely on explanations from gradient-based explanations to perform weakly-supervised localization and detection of abnormality. Finally, we show how we integrate these methods as a computer-aided tool that could be used to reduce the workload of cytopathologists.The second contribution focuses on whole slide classification and the interpretability of these pipelines. We present in detail the most popular approaches for whole slide classification relying on multiple instance learning, and improve the interpretability in a context of weakly-supervised learning through tile-level feature visualizations and a novel manner of computing explanations of heat-maps. Finally, we apply these methods for cervical cancer screening by using a weakly trained “abnormality” detector for region of interest sampling that guides the training.
Le cancer du col de l’utérus est le deuxième cancer le plus important pour les femmes après le cancer du sein. En 2012, le nombre de cas recensés dépasse 500,000 à travers le monde, dont la moitié se sont révélés mortels. Jusqu'à maintenant, le dépistage primaire du cancer du col de l’utérus est réalisé par l’inspection visuelle de cellules, prélevées par frottis vaginal, par des cytopathologistes utilisant la microscopie en fond clair dans des laboratoires de pathologie. En France, environ 5 millions de dépistage sont réalisés chaque année et environ 90% mènent à un diagnostic négatifs (i.e. pas de changements précancereux détectés). Pourtant, ces analyses au microscope sont extrêmement fastidieuses et coûteuses en temps pour le cytotechniciens et peut nécessiter l’avis conjoint de plusieurs experts. Ce processus impacte la capacité à traiter cette immense quantité de cas et à éviter les faux négatifs qui sont la cause principale des retards de traitements médicaux. Le manque d’automatisation et de traçabilité des dépistage deviennent ainsi de plus en plus critique à mesure que le nombre d’experts diminue. En ce sens, l’intégration d’outils numériques dans les laboratoires de pathologie devient une réelle problématique de santé publique et la voie privilégiée pour l’amélioration de ces laboratoires. Depuis 2012, l’apprentissage profond a révolutionné le domaine de la vision par ordinateur, en particulier grâce aux réseaux de neurones convolutionnels qui se sont montrés fructueux sur un large panel d’applications parmi lesquelles plusieurs en imagerie biomédicale. Parallèlement, le processus de digitalisation de lames entières a ouvert l’opportunité pour de nouveaux outils et de nouvelles méthodes de diagnostic assisté par ordinateur. Dans cette thèse, après avoir motivé le besoin médical et introduit l’état de l’art en terme de méthodes d’apprentissage profond pour le traitement de l’image, nous présentons nos contributions au domaine de la vision par ordinateur traitant le dépistage du cancer du col de l’utérus dans un contexte de cytologie en milieu liquide. Notre première contribution consiste à proposer une méthode simple de régularisation pour l’entrainement de modèles dans le contexte d’une classification ordinale (i.e. classes suivant un ordre). Nous démontrons l’avantage de notre méthode pour la classification de cellules utérines en utilisant sur le jeu de données Herlev. De plus, nous proposons de nous appuyer sur des explications basées sur le gradient pour réaliser une localisation faiblement supervisée et plus généralement une détection d’anormalité. Finalement, nous montrons comment nous intégrons ces méthodes pour créer un outil assisté par ordinateur qui pourrait être utilisé afin de réduire la charge de travail des cytopathologistes. La seconde contribution se concentre sur la classification de lames entières et l’interprétabilité de ces approches. Nous présentons en détails les méthodes de classification de lames entières s’appuyant sur l’apprentissage multi-instances, et améliorons l’interprétabilité dans un contexte d’apprentissage faiblement supervisé via des visualizations de caractéristiques au niveau de la tuile et une nouvelle manière de calculer des cartes de chaleur explicatives. Finalement, nous appliquons ces méthodes pour le dépistage du cancer du col de l’utérus en utilisant un detecteur d’ “anormalité” qui guide l’entrainement pour l’échantillonnages de régions d’intérêt.
Fichier principal
Vignette du fichier
98765_PIROVANO_2021_archivage.pdf (43.38 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03335365 , version 1 (06-09-2021)

Identifiants

  • HAL Id : tel-03335365 , version 1

Citer

Antoine Pirovano. Computer-aided diagnosis methods for cervical cancer screening on liquid-based Pap smears using convolutional neural networks : design, optimization and interpretability. Artificial Intelligence [cs.AI]. Institut Polytechnique de Paris, 2021. English. ⟨NNT : 2021IPPAT011⟩. ⟨tel-03335365⟩
229 Consultations
11 Téléchargements

Partager

Gmail Facebook X LinkedIn More