Fonctionnement de l'outil Cluster and Outlier Analysis (Anselin Local Moran's I)
Etant donné un ensemble d'entités pondérées, l'outil Cluster and Outlier Analysis (Anselin Local Moran's I) identifie des agrégats spatiaux d'entités présentant des valeurs d'attribut de même magnitude. L'outil identifie également des points spatiaux aberrants. Pour cela, l'outil calcule la valeur d'indice local de Moran, un score z, une valeur p et un code qui représente le type d'agrégat pour chaque entité. Les scores z et les valeurs p représentent la signification statistique des valeurs d'indice calculées.
Interprétation
Une valeur positive pour I indique qu'une entité est voisine d'entités présentant des valeurs d'attribut similaires (hautes ou basses) ; cette entité fait partie d'un agrégat. Une valeur négative pour I indique qu'une entité est voisine d'entités présentant des valeurs dissemblables ; cette entité est un point aberrant. Dans l'un et l'autre instance, la valeur de p pour l'entité doit être petite assez pour l'agrégat ou point aberrant à considérer comme statistiquement significatif. Pour plus d'informations sur la façon de déterminer la signification d'une statistique, reportez-vous à la rubrique Qu'est-ce qu'un score z ? Qu'est-ce qu'une valeur p ?. Notez que l'indice I local de Moran (I) est une mesure relative et peut uniquement être interprété dans le contexte de son score z ou de sa valeur p calculée.
Le champ en sortie, Type agrégat-point aberrant (COType), distingue entre un agrégat statistiquement significatif (niveau 0,05) de valeurs hautes (HH) et de valeurs basses (LL), entre un point aberrant dans lequel une valeur haute est entourée principalement par des valeurs basses (HL), et un point aberrant dans lequel une valeur basse est entourée principalement par des valeurs hautes (LH).
Sortie
Cet outil crée, pour chaque entité dans la classe d'entités en entrée, une classe d'entités en sortie avec les attributs suivants : indice I local de Moran, score z, valeur p et COType. Les noms de champ de ces attributs sont renvoyés également, en tant que sorties dérivées de la chaîne d'outils pour une utilisation potentielle dans les modèles ou les scripts personnalisés.
Lorsque l'outil s'exécute dans ArcMap, la classe d'entités en sortie est ajoutée automatiquement à la table des matières et le rendu par défaut est appliqué au champ COType. Le rendu appliqué est défini par un fichier de couches dans <ArcGIS>/ArcToolbox/Templates/Layers. Vous pouvez appliquer à nouveau le rendu par défaut, si nécessaire, en important la symbologie des couches modèle.
Pratiques conseillées
- Les résultats sont uniquement fiables si la classe d'entités en entrée contient 30 entités au moins.
- Cet outil nécessite un champ en entrée tel qu'un nombre, un taux, ou une autre mesure numérique. Si vous analysez des données ponctuelles, où chaque point représente un événement ou un incident unique, vous pouvez ne pas avoir d'attribut numérique spécifique à évaluer (une échelle de gravité, un nombre ou une autre mesure). Si vous vous intéressez aux emplacements présentant beaucoup d'incidents (hot spots) et/ou aux emplacements présentant très peu d'incidents (cold spots), vous devrez agréger vos données d'incident avant l'analyse. L'outil Hot Spot Analysis (Getis-Ord Gi*) est également efficace pour identifier les hot spots et les cold spots. Toutefois, seul l'outil Cluster and Outlier Analysis (Anselin Local Moran's I) identifiera des points spatiaux aberrants statistiquement significatifs (valeur haute entourée par des valeurs basses ou valeur basse entourée par des valeurs hautes).
- Sélection d'une conceptualisation de relations spatiales.
- Sélection d'une valeur de canal distance ou de distance seuil.
- Toutes les entités doivent avoir au moins un voisin.
- Aucune entité ne doit être voisine de l'ensemble des autres entités.
- Surtout si les valeurs du champ en entrée sont désaxées, il est préférable que les entités aient approximativement huit voisines chacune.
Applications possibles
L'outil Cluster and Outlier Analysis (Anselin Local Moran's I) identifie les concentrations de valeurs hautes, de valeurs basses et les points spatiaux aberrants. Il peut aider à répondre à des questions telles que :
- Où se situent les limites les plus nettes entre abondance et pauvreté dans une zone d'étude ?
- La zone d'étude contient-elle des emplacements présentant des modèles de dépense anormaux ?
- Où existe-t-il des taux de diabète anormalement élevés dans la zone d'étude ?
Les applications touchent à de nombreux domaines, notamment l'économie, la gestion des ressources, la biogéographie, la géographie politique et la démographie.
Ressources supplémentaires
Anselin, Luc. "Local Indicators of Spatial Association—LISA," Geographical Analysis 27(2): 93–115, 1995.
Mitchell, Andy. The ESRI Guide to GIS Analysis, Volume 2.ESRI Press, 2005.