Télécharger le fichier pdf d’un mémoire de fin d’études
Visualisation de Classifications
Visualisation de classes sous forme de résumés
Visualisation des caractéristiques d’une seule variable.
On calcule donc pour chaque individu la moyenne de ses valeurs. Ainsi, il est nécessaire que les variables soient toutes de même nature ou bien standardisées (centrées-réduites par exemple). Ensuite, les individus sont réordonnés selon leur moyenne.
Cette méthode très simple n’est efficace que lorsque toutes les variables sont corrélées positivement. Dans notre exemple, on voit que les Régions sont bien triées pour certaines variables (Artisan, Ouvrier, …) mais pas pour d’autres (Intermédiaire, SansActivite, Retraite,…). Cette méthode n’est donc pas idéale.
L’exemple suivant donne les coefficients de la variable synthétique ayant la plus grande explication, il s’agit du « axe_1 ».
Nous verrons ensuite les méthodes de rééquilibrage qui permettent d’optimiser une sectorisation existante. En effet, il est parfois plus intéressant d’améliorer une sectorisation existante que d’en calculer une nouvelle. Nous verrons en détails les techniques de rééquilibrage qui se décomposent en deux étapes : le calcul de tous les transferts à effectuer entre les secteurs, puis la mise en œuvre des transferts.
Il existe de nombreuses méthodes de partitionnement de graphe pour réaliser une sectorisation équilibrée [SKK03]. Nous ne les présenterons pas ici, car nous allons seulement présenter l’une des méthodes les plus efficaces, ainsi que ses évolutions. Il s’agit de la bipartition récursive. Cette méthode découpe itérativement le territoire en morceaux de plus en plus petits. Par exemple, pour une partition en 5 secteurs d’un territoire de taille 100, l’algorithme procède d’abord à un partage entre un grand secteur A de taille 40 et un autre secteur B de taille 60. Puis le secteur A est découpé à nouveau en deux secteurs A1 et A2 de tailles 20. On procède de même pour le secteur B. Le schéma suivant montre les ce partitionnement récursive.
|
Table des matières
Introduction
1. État de l’art
Introduction
1 Classification de Données
1.1 Méthodes de classification sur les grands volumes de données
1.2 Similarités, dissimilarités et distances
2 Visualisation de Classifications
2.1 Visualisation de classes sous forme de résumés
2.2 Visualisation de classes sous forme de tableau
2.3 Optimisation de l’ordre des variables et des individus
3 Lissage spatial
3.1 Méthodes de lissage
3.2 Fonctions d’interaction spatiale
3.3 Fonctions de lissage spatial
4 Sectorisation
4.1 Sectorisation équilibrée
4.2 Rééquilibrage des secteurs
Conclusions
2. Contributions
Introduction
1 Classification de Données pour de grands volumes de données mixtes
1.1 Dissimilarité utilisée
1.2 Méthode de la Classification Ascendante Approximative (CAA)
1.3 Conclusion
2 Visualisation de Classifications
2.1 Hiérarchie évoluée des profils de classes
2.2 Tableau évolué des profils de classes
2.3 Optimisation de l’ordre des variables et des classes
2.4 Conclusion
3 Détermination et Hiérarchisation de pôles
3.1 Détermination de pôles
3.2 Hiérarchisation des pôles
3.3 Conclusion
4 Sectorisation
4.1 Méthodes communes aux deux types de sectorisation
4.2 Sectorisation équilibrée
4.3 Sectorisation à partir de centres
4.4 Rééquilibrage des secteurs
4.5 Conclusion
Conclusions
3. Expérimentations et Applications
Introduction
1 Classification de Données & Visualisation de Classifications
1.1 Expérimentations et Comparaison avec les K- moyennes
1.2 Autre application : la Classification de Variables
1.3 Analyse des données socioprofessionnelles de Paris et de sa Petite Couronne
1.4 Autre application : la Classification Hiérarchique Spatiale
1.5 Conclusion
2 Lissage Spatial, Détermination et Hiérarchisation de Pôles
2.1 Analyse spatiale de la population pour la France entière
2.2 Utilisation du Lissage Spatial en prétraitement de la Classification de Données
2.3 Conclusion
3 Sectorisation
3.1 Sectorisation équilibrée de la population française en 22 secteurs
3.2 Sectorisation de la population française à partir de 9 centres
3.3 Rééquilibrage de la sectorisation précédente
3.4 Conclusion
Conclusions
Conclusion générale et Perspectives
Annexe
Introduction
1 Contributions à la méthode de l’Arbre de Décision
1.1 Rappels
1.2 Recherche du meilleur partitionnement binaire pour une variable qualitative
1.3 Facteur de correction avantageant la création de partitions pures
1.4 Conclusion
2 Contributions à l’amélioration des coefficients d’Autocorrélation Spatiale
2.1 Etat de l’art
2.2 Amélioration des coefficients
2.3 Conclusion
3 Contributions à l’amélioration de la Modélisation des Flux
3.1 Etat de l’art
3.2 Amélioration
3.3 Application pour l’analyse des migrations des entreprises à l’intérieur du département de la Loire-Atlantique
3.4 Conclusion
Bibliographie
Télécharger le rapport complet
