MISE EN ŒUVRE DE LA DETECTION AUTOMATIQUE DES FILES CELLULAIRES 

Les clades et espèces : essences de travail

   Depuis que les végétaux ont commencé à coloniser la terre ferme, il y a environ 500 millions d’années (cf. figure 4), ils se sont fortement diversifiés, de sorte qu’on compte aujourd’hui plus de 260 000 espèces, dont certaines occupent les milieux les plus hostiles, tels les pics montagneux, les régions désertiques et polaires. Cette phylogenèse représente une hypothèse sur les liens de parenté entre les groupes de végétaux. Les lignes pointillées indiquent que la phylogénie fait toujours l’objet de débats. Pendant la thèse nous nous intéressons aux plantes vasculaires à graines. Notre étude portera plus particulièrement sur les clades des plantes vasculaires à graines modernes, les Gymnospermes et les Angiospermes, car elles représentent 90% des plantes terrestres. Les Gymnospermes sont des plantes faisant partie d’un sous-embranchement paraphylétique des spermaphytes. Gymnospermes vient du grec “gymnos” qui veut dire “nue” et “sperma” qui veut dire graine. Ils ne possèdent pas d’ovaire. Mais les Gymnospermes constituent un groupe en voie de disparition. En effet, ce groupe n’a fait que régresser et compte aujourd’hui moins de 1 000 espèces. La plupart des Gymnospermes sont des conifères, et nous avons choisi des représentants présents dans le sud de la France en raison de leur accessibilité qui sont le pin (Pinus nigra, Pinus caribensis et Pinus brutia) et le sapin (Abies alba). La division des Angiospermes regroupe les plantes à fleurs, et donc les végétaux qui portent des fruits. Angiosperme vient du grec “angios” qui veut dire récipient. Ils regroupent la majeure partie des espèces végétales terrestres, avec environ 250 000 espèces. Les Angiospermes comprennent les dicotylédones et les monocotylédones. Ce groupe est particulièrement important pour les humains et leur survie. En foresterie et en agriculture, il constitue les sources essentielles de nourriture, de combustible, de produits du bois et de médicaments… En raison de cette dépendance, il est indispensable de préserver la diversité de ces plantes (Angiospermes et Gymnospermes compris). Nous avons choisi de travailler sur les essences de chêne vert (Quercus ilex) et d’acajou (Pycnanthus sp.) comme représentant des Angiospermes dicotylédones.

Protocole 2. Ponçage de rondelles de bois

  La préparation de rondelles de bois adaptées pour la numérisation est d’un grand intérêt pour l’étude de grandes zones du plan ligneux. Avec un tel procédé, il n’y a pas de problème de raccord. La taille d’acquisition est limitée par la taille du plateau de la polisseuse et par le déplacement maximal de la platine de 10×10 cm². Pour notre étude nous avons mis en place un protocole dont les grandes lignes sont résumées ci-dessous (pour plus d’information se référer à l’article II.AOB’14 §Method). Les rondelles de bois prélevées au centre des unités de croissance présentent une hauteur maximum de 2,5 cm afin de passer sous le microscope. Séchées pendant 3 mois à l’abri du soleil et de l’humidité elles sont ensuite poncées et polies à l’aide d’une polisseuse semi-automatique (cf. figure 8) afin d’obtenir deux faces parfaitement parallèles et une face parfaitement polie sans destruction des structures pour la numérisation. La fragilité de la surface, notamment sa forte sensibilité à la poussière, nécessite des précautions particulières lors de la manipulation et de la conservation des rondelles. Dès le polissage effectué, il est nécessaire de réaliser la numérisation de la rondelle, car, sans contrôle très précis de l’hygrométrie et de la température de la zone de stockage, la rondelle se dessèche et sa surface se déforme. Ces micros déformations compromettent la netteté des images produites lors de la phase de numérisation.

Généralités sur les méthodes de segmentation

  À ce jour, il existe de nombreuses méthodes de segmentation, que l’on peut regrouper en trois catégories (Davies 2005) :
1. La segmentation par régions (en anglais : region-based segmentation) correspond aux algorithmes d’accroissement de régions. Ce type de segmentation consiste à prendre un ensemble de petites régions uniformes dans l’image et à regrouper les régions adjacentes de même critère (couleur, intensité, critères géométriques…) jusqu’à ce qu’aucun regroupement ne soit plus possible. On y trouve par exemple les algorithmes de regiongrowing (Verma et al. 2011) ou split and merge (Damiand and Resch 2003).
2. La segmentation par contours (en anglais : edge-based segmentation) s’intéresse aux contours des objets dans l’image c’est-à-dire une transition détectable entre deux régions connexes. La transition est souvent un ajustement brutal de l’intensité au niveau des frontières des régions. On y trouve par exemple les algorithmes tels que le filtre de Canny (Canny 1986), le watershed ou encore les snakes qui produisent un modèle déformable local attiré ou repoussé par des points particulier de l’image (maximum ou minimum locaux, ligne de crête…).
3. La segmentation par classification : la plus connue (et la plus simple) est sans doute le seuillage qui consiste à binariser l’image en la réduisant à deux régions à partir d’un seuil donné : la première est constituée des points de l’image dont la valeur est inférieure au seuil donné, la seconde des points dont la valeur est supérieure ou égale au seuil donné. Ce mécanisme peut être compliqué à souhait en utilisant simultanément plusieurs seuils (multi-seuillage). Mais dans les faits, le seuillage n’est qu’un cas particulier de classification : ces méthodes, largement développées pour la fouille de données, sont utilisé autant par les banques pour repérer les « bons » clients sans facteur de risque (« scoring »), que pour l’analyse du génome pour repérer de nouveaux gènes ou qu’en image pour classer les pixels. Elles présentent l’avantage de regrouper les points en régions homogènes (selon un ou plusieurs critères donnés et un estimateur statistique ou mathématique prédéfini). Par exemple, la méthode des k-moyennes (Duda 2001) (ou ses adaptations à la binarisation d’images connues sous les noms de seuillage d’Otsu, Huang…) (Otsu 1979) minimise la variance intra-classe et maximise la variance interclasse en utilisant le plus souvent un estimateur de distance (euclidienne, de Manhattan, de Mahalanobis…). La différence majeure : la classification est réalisée soit en fonction d’un nombre de classes donné a priori, soit le nombre optimal de classes évalué à partir d’analyses bayésiennes (C-means) (Dunn 1973) ou en fonction de limites préfixées d’étalement des classes (Paiva’s classification) (Paiva and Tasdizen 2010). La segmentation de l’image est de facto obtenue par la classification des valeurs de ses points.
N.B. : Il existe d’autres types de segmentation, comme par exemple des algorithmes mobilisant les 3 catégories décrites. La profusion des méthodes illustre la difficulté à segmenter des images : il n’y a pas de consensus sur une méthode, car une bonne segmentation dépend du contenu, de la dynamique, du système de description (i.e. le système de couleurs) de l’image et de la nature des zones à segmenter et de ce que l’on cherche à obtenir (Busin et al. 2009). Dans les cellules végétales, la lamelle moyenne est l’espace intercellulaire, c’est-à-dire une séparation physique entre deux cellules adjacentes. Elle contient essentiellement des composés pectiques, ce qui lui donne une intensité différente de coloration par rapport à la paroi cellulaire. La segmentation de ces cellules doit être continue, c’est-à-dire produire des contours fermés et correspondre à la lamelle moyenne. L’algorithme du watershed (Najman and Schmitt 1994) possède toute les caractéristiques pour produire une bonne segmentation des cellules végétales. Il existe 3 méthodes différentes pour faire un watershed : les algorithmes par inondation simulent une montée progressive du niveau d’eau à partir des minima du relief. Les algorithmes par ruissellement suivent, à partir de chaque pixel de l’image, la ligne de plus grande pente jusqu’à atteindre un minimum. Et finalement, les algorithmes topologiques proposent une déformation progressive du relief, préservant certaines caractéristiques topologiques, jusqu’à ce que le relief soit réduit à une structure fine correspondant à la ligne de partage des eaux. Ces trois méthodes donnent des résultats sensiblement différents, mais toujours avec les mêmes caractéristiques. La définition des images ne permet pas de dire expérimentalement quelle méthode est la meilleure car les différences sont de l’ordre du pixel et on ne peut pas déterminer quels sont le(s) pixel(s) de la lamelle moyenne. Aussi, nous avons choisi l’algorithme par inondation, car son initialisation par minima locaux permet d’envisager de les filtrer (voir plus bas). Dans les chaînes de traitement d’images, la segmentation est une étape primordiale car elle permet d’extraire les zones d’intérêt dont la qualité influence directement les résultats finaux tels que les mesures des objets. Elle est souvent précédée d’une phase de prétraitement visant à nettoyer l’image (par exemple en supprimant le bruit ou en normalisant la dynamique du signal induit par les capteurs optiques), à rehausser les contrastes en ré-étalant ou compressant la dynamique du signal (par exemple en utilisant des combinaisons de différents lissages de l’image pour accentuer des traits caractéristiques), etc. En raison de la multitude de sources de bruits, et surtout de la multitude d’effets de ces bruits sur une image, il n’existe pas de technique générique, adaptée à toutes les situations. La segmentation est généralement suivie d’une phase de calcul ou de modélisation des objets. Par exemple en imagerie médicale, les neurones sont segmentés avant d’être mesurés

Application de la segmentation aux cellules

   Comme nous venons de le voir, le nettoyage du watershed permet d’éliminer les arêtes surnuméraires. La méthode proposée consiste à analyser le profil d’intensité de chaque ligne du watershed pour vérifier son homogénéité. Cette méthode convient bien aux images de files cellulaires car elles présentent un contraste marqué entre le lumen et la paroi. Mais pour d’autres images, cette méthode ne sera pas suffisante. Il existe des variantes du watershed permettant à la construction des lignes d’atténuer voire de supprimer la sur-segmentation. On peut citer la méthode du waterfall (Beucher 2012) qui va fusionner les bassins adjacents reversants. La difficulté de cette méthode est de déterminer d’une part les critères de fusion idéale et d’autre part les conditions d’arrêt, car si les critères permettent une fusion à chaque étape, il n’y aura à la fin qu’un bassin résultant comprenant toute l’image. Les études que nous avons effectuées sur le waterfall et sur le filtrage des minima locaux (germes) du watershed n’ont pas permis d’obtenir de meilleurs résultats que la méthode actuelle. Cela est dû à la complexité des critères et au nombre de niveaux de fusion. Nous pensons cependant que l’utilisation de variantes de watershed telles que le waterfall ou le P-algorithme (Beucher and Marcotegui 2009) serait une alternative satisfaisante pour la suppression de la sur-segmentation. Une étude a été menée sur l’effet du flou optique souvent présent dans les images du fait des déformations périphériques dues à la lentille du microscope ou au défaut de planéité de l’échantillon. Des acquisitions d’une même zone de l’image avec des mises au point différentes ont été réalisées pour évaluer la stabilité algorithmique de notre méthode. Nous avons conduit une étude statistique sur la variabilité du détourage des cellules. Nous avons mis en évidence que les lignes intercellulaires obtenues par l’algorithme de partage des eaux sont globalement invariantes au floutage de l’image. En effet, elles correspondent aux courbes d’inversion des pentes d’intensité : le lissage de l’image produit par le flou optique réduit la dynamique d’intensités de l’image sans toutefois supprimer les changements de variation d’intensité et les lignes de crête restent globalement inchangées (cf. figure 18).

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela clepfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

0 ETAT DE L’ART 
1 MATERIEL 
1.1 LE MATERIEL VEGETAL 
1.1.1 LES CLADES ET ESPECES : ESSENCES DE TRAVAIL
1.1.2 LA CROISSANCE ET L’ANATOMIE DES VEGETAUX
1.2 PROTOCOLES DE PREPARATION ET D’ACQUISITION DES ECHANTILLONS 
1.2.1 LES PREPARATIONS DU PLAN LIGNEUX
1.2.2 PROTOCOLE 1. LES COUPES HISTOLOGIQUES COLOREES
1.2.3 PROTOCOLE 2. PONÇAGE DE RONDELLES DE BOIS
1.2.4 LA NUMERISATION DES ECHANTILLONS
1.3 RESULTATS DES ACQUISITIONS & DISCUSSIONS 
2 METHODES 
2.1 SEGMENTATION DES IMAGES 
2.1.1 GENERALITES SUR LES METHODES DE SEGMENTATION
2.1.2 CHAINE DE TRAITEMENT : DE L’IMAGE A L’ELEMENT STRUCTURANT
2.1.3 APPLICATION DE LA SEGMENTATION AUX CELLULES
2.1.4 BILAN DE MISE EN ŒUVRE DE LA SEGMENTATION
2.2 MODELISATION DES ARRANGEMENTS 
2.2.1 DEFINITION DE LA MODELISATION DANS LE CADRE DES FILES CELLULAIRES
2.2.2 PROCESSUS D’IDENTIFICATION DES ARRANGEMENTS
2.2.3 MISE EN ŒUVRE DE L’IDENTIFICATION DES FILES CELLULAIRES
2.2.4 CONCLUSION SUR LA MISE EN ŒUVRE DE LA MODELISATION
2.3 FUSION DES DONNEES 
2.3.1 MOSAÏQUES DES RESULTATS
2.3.2 PRESENTATION D’UNE METHODE GENERIQUE DE FUSION DE GRAPHE
2.3.3 AGREGATION DES RESULTATS DE FILES CELLULAIRES
2.3.4 CONCLUSION
2.4 MESURES ET FIABILITES 
2.4.1 RESULTATS NUMERIQUES
2.4.1.1 Mesure des paramètres
2.4.1.1.1 La circularité
2.4.1.1.2 La surface
2.4.1.1.3 Le périmètre
2.4.1.2 Séparations des composants
2.4.2 FIABILITE
2.4.2.1 Niveau global
2.4.2.2 Niveau des composants
2.4.2.3 Niveau de l’élément
2.4.2.3.1 Le périmètre
2.4.2.3.2 La surface
2.4.2.3.3 La circularité
2.4.3 CONCLUSION SUR LA MISE EN ŒUVRE DE LA FIABILITE DES MESURES
2.5 TYPAGE CELLULAIRE 
2.5.1 DESCRIPTION DE LA METHODE
2.5.2 ETUDES PROSPECTIVES
2.5.3 CONCLUSION SUR LA MISE EN ŒUVRE DU TYPAGE CELLULAIRE
3 APPLICATION ET RESULTATS 
3.1 IMPLEMENTATION 
3.2 APPLICATION AUX FILES CELLULAIRES 
3.2.1 JEU D’ESSAI
3.2.2 MISE EN ŒUVRE DE LA DETECTION AUTOMATIQUE DES FILES CELLULAIRES
3.2.3 LIMITES
3.2.4 PERFORMANCES
3.3 AUTRES APPLICATIONS 
3.3.1 LA ROBUSTESSE DE LA METHODE DE SEGMENTATION
3.3.2 EVALUATION QUANTITATIVE DE LA SEGMENTATION
3.3.3 INTERET DES APPROCHES MULTI-ECHELLES POUR MAITRISER LA SUR-SEGMENTATION DU WATERSHED
3.3.4 GENERICITE DE LA METHODE POUR LA DETECTION DE CELLULES
3.4 UTILISATION DANS UN QUESTIONNEMENT BIOLOGIQUE 
3.4.1 CONTEXTE D’ETUDE
3.4.2 METHODOLOGIE
3.4.3 AUTOMATISATION DES PROCESSUS
3.4.4 CONCLUSION SUR L’AUTOMATISATION DANS LE CADRE D’UN QUESTIONNEMENT BIOLOGIQUE
4 CONTRIBUTIONS ET PERSPECTIVES 
5 REFERENCES BIBLIOGRAPHIQUES 
6 ANNEXES 
7 INDEX 
8 PUBLICATIONS

Rapport PFE, mémoire et thèse PDFTélécharger le rapport complet

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *