Desktop Help 10.0 - High/Low Clustering (Getis-Ord General G) (Statistiques spatiales)

Récapitulatif

Mesure le degré d'agrégation des valeurs élevées ou des valeurs faibles à l'aide de la statistique Getis-Ord General G.

You can access the results of this tool (including the optional report file) from the Results window. If you disable background processing, results will also be written to the Progress dialog box.

Pour en savoir plus sur le fonctionnement de l'outil High/Low Clustering (Getis-Ord General G)

Illustration

Utilisation

L'outil High/Low Clustering (Getis-Ord General G) renvoie cinq valeurs : General G observé, General G attendu, Variance, score z et valeur p. Ces valeurs sont disponibles dans la fenêtre Résultats et sont transmises en tant que valeurs en sortie dérivées pour utilisation potentielle dans les modèles ou les scripts. Cet outil peut également créer un fichier HTML contenant un récapitulatif graphique des résultats. Double-cliquez sur le fichier HTML dans la fenêtre Résultats pour ouvrir le fichier HTML dans le navigateur Internet par défaut. Cliquez avec le bouton droit sur l'entrée Messages dans la fenêtre Résultats et sélectionnez Afficher pour consulter les résultats dans une boîte de dialogue de message.
Remarque :
- Si cet outil fait partie d'un outil de modèle personnalisé, le lien HTML apparaît seulement dans la fenêtre Résultats s'il est défini en tant que paramètre du modèle avant l'exécution de l'outil.
- Pour un meilleur affichage des graphiques HTML, assurez-vous que votre moniteur est défini pour une résolution de 96 PPP.
Le Champ en entrée doit contenir différentes valeurs non négatives. Si le Champ en entrée contient des valeurs négatives, un message d'erreur s'affiche. En outre, les formules mathématiques de cette statistique requièrent que la variable analysée fluctue quelque peu ; elle ne peut pas aboutir si toutes les valeurs en entrée sont 1, par exemple. Si vous souhaitez utiliser cet outil pour analyser le modèle spatial de données d'incident, vous devrez peut-être agréger les données d'incident.
Le score z et la valeur p sont des mesures de signification statistique qui indiquent si l'on peut rejeter l'hypothèse nulle. Pour cet outil, l'hypothèse nulle suppose que les valeurs associées aux entités sont distribuées aléatoirement.
Le score z est basé sur le calcul d'hypothèse nulle aléatoire. Pour plus d'informations sur les scores z, reportez-vous à la rubrique Qu'est-ce qu'un score z ? Qu'est-ce qu'une valeur p ?
Plus le score z est élevé, plus l'intensité de l'agrégation est importante. Un score z proche de zéro indique qu'il n'y a aucune agrégation apparente dans la zone d'étude. Un score z positif indique l'agrégation de valeurs élevées. Un score z négatif indique l'agrégation de valeurs faibles.
Les calculs basés sur la distance euclidienne ou de Manhattan nécessitent des données projetées afin de pouvoir mesurer précisément les distances.
Pour les entités linéaires et surfaciques, les centroïdes d'entité sont utilisés dans les calculs de distance. Pour les multi-points, les polylignes ou les polygones comprenant plusieurs parties, le centroïde est calculé à l'aide du centre moyen pondéré de toutes les parties d'entité. La pondération pour les entités ponctuelles est de 1 ; pour les entités linéaires, elle correspond à la longueur et pour les entités surfaciques, à la superficie.
Dans ArcGIS 10, la sortie graphique facultative n'est plus affichée automatiquement. A la place, un fichier HTML récapitulant les résultats est créé. Pour afficher les résultats, double-cliquez sur le fichier HTML dans la fenêtre Résultats. Les scripts personnalisés ou les outils de modèle créés avant ArcGIS 10 et qui utilisent cet outil peuvent devoir être régénérés. Pour régénérer ces outils personnalisés, ouvrez-les, supprimez le paramètre Afficher les résultats de manière graphique, puis ré-enregistrez.
This tool will optionally create an HTML file summarizing results. HTML files will not automatically appear in the Catalog window. If you want HTML files to be displayed in Catalog, open the ArcCatalog application, select the Customize menu option, click ArcCatalog Options, and select the File Types tab. Click on the New Type button and specify HTML for File Extension.
Le choix du paramètre Conceptualisation de relations spatiales doit refléter les relations inhérentes entre les entités que vous analysez. Plus la modélisation de l'interaction des entités dans l'espace est réaliste, plus les résultats sont précis. Des recommandations sont présentées dans la section Sélection d'une conceptualisation de relations spatiales : meilleures pratiques. Voici quelques conseils supplémentaires :
- Une structure de pondération binaire est recommandée pour cette statistique : distance fixe, contiguïté polygonale, K voisins les plus proches ou triangulation de Delaunay. Sélectionnez Aucun pour le paramètre Standardisation.
- FIXED_DISTANCE_BAND
  The default Distance Band or Threshold Distance will ensure each feature has at least one neighbor, and this is important. But often, this default will not be the most appropriate distance to use for your analysis. Additional strategies for selecting an appropriate scale (distance band) for your analysis are outlined in Selecting a fixed distance band value.
- INVERSE_DISTANCE ou INVERSE_DISTANCE_SQUARED (non recommandé)
  Lorsque une valeur nulle (0) est entrée pour le paramètre Canal distance ou distance seuil, toutes les entités sont considérées voisines de toutes les autres entités ; lorsque ce paramètre n'est pas défini, la distance seuil par défaut est appliquée.
  Les pondérations pour les distances inférieures à 1 deviennent instables. La pondération des entités séparées par moins d'une unité de distance (ce qui arrive souvent avec les projections du système de coordonnées géographiques), se voit affecter la valeur 1.
  Attention :
  
  L'analyse des entités associées à une projection de système de coordonnées géographiques n'est pas recommandée lorsque vous sélectionnez une méthode de conceptualisation spatiale fondée sur l'inverse de la distance (INVERSE_DISTANCE, INVERSE_DISTANCE_SQUARED ou ZONE_OF_INDIFFERENCE).
  
  Pour les options basées sur l'inverse de la distance (non recommandées pour cet outil), une pondération de 1 est attribuée chaque fois que deux points sont coïncidents pour éviter une division par zéro. Ainsi, aucune entité n'est exclue de l'analyse.
Des options supplémentaires pour le paramètre Conceptualisation de relations spatiales sont disponibles avec les outils Générer la matrice de pondérations spatiales ou Générer les pondérations spatiales de réseau. Pour pouvoir bénéficier de ces options supplémentaires, utilisez l'un de ces outils afin de construire le Fichier de matrice de pondérations spatiales avant l'analyse ; sélectionnez GET_SPATIAL_WEIGHTS_FROM_FILE pour le paramètre Conceptualisation de relations spatiales ; et pour le Fichier de matrice de pondérations, spécifiez le chemin d'accès au fichier de matrice de pondérations spatiales que vous avez créé.
Les couches peuvent permettre de définir la Classe d'entités en entrée. Lors de l'utilisation d'une couche avec une sélection, seules les entités sélectionnées sont incluses dans l'analyse.

Remarque :

Si cet outil fait partie d'un outil de modèle personnalisé, le lien HTML apparaît seulement dans la fenêtre Résultats s'il est défini en tant que paramètre du modèle avant l'exécution de l'outil.
Pour un meilleur affichage des graphiques HTML, assurez-vous que votre moniteur est défini pour une résolution de 96 PPP.

Si vous fournissez un Fichier de matrice de pondérations avec une extension .SWM ou .swm, l'outil suppose que le fichier de matrice de pondérations spatiales a été créé à l'aide des outils Générer la matrice de pondérations spatiales ou Générer les pondérations spatiales de réseau. Sinon, cet outil suppose qu'il s'agit d'un fichier de matrice de pondérations spatiales ASCII. Dans certains cas, le comportement peut varier selon le type de fichier de matrice de pondérations spatiales que vous utilisez :

Fichiers de matrice de pondérations spatiales ASCII :
- Les pondérations sont utilisées en l'état. Les relations entité à entité manquantes sont supposées nulles.
- Si les pondérations sont standardisées par lignes, le résultats des analyses portant sur les ensembles de sélection seront vraisemblablement incorrects. Si vous devez exécuter votre analyse sur un ensemble de sélection, convertissez le fichier de pondérations spatiales ASCII en fichier .swm en lisant les données ASCII dans une table, puis en utilisant l'option CONVERT_TABLE de l'outil Générer la matrice de pondérations spatiales.
Fichier de matrice de pondérations spatiales avec mise en forme .SWM
- Si les pondérations sont standardisées par lignes, elles seront standardisées à nouveau pour les ensembles de sélection. Sinon, les pondérations sont utilisées en l'état.

L'exécution de votre analyse avec un fichier de matrice de pondérations spatiales ASCII sollicite beaucoup de mémoire. Pour les analyses portant sur plus de 5 000 entités, envisagez de convertir votre fichier de matrice de pondérations spatiales ASCII en fichier avec mise en forme .swm. En premier lieu, placez vos pondérations ASCII dans une table avec mise en forme (à l'aide d'Excel, par exemple). Exécutez ensuite l'outil Générer la matrice de pondérations spatiales à l'aide de CONVERT_TABLE pour le paramètre Conceptualisation de relations spatiales. La sortie sera un fichier de matrice de pondérations spatiales avec mise en forme .swm.
La rubrique d'aide Modélisation de relations spatiales fournit des informations supplémentaires à propos des paramètres de cet outil.

Attention :

Lorsque vous utilisez des fichiers de formes, n'oubliez pas qu'ils ne peuvent pas stocker de valeurs Null. Les outils ou d'autres procédures qui créent des fichiers de formes à partir des entrées autres que des fichiers de formes peuvent stocker ou interpréter des valeurs Null comme zéro. Cela peut aboutir à des résultats inattendus. Reportez-vous également à Remarques concernant le géotraitement pour la sortie de fichiers de formes.

Héritage :

Dans ArcGIS 9.2, l'option de standardisation globale a été supprimée. La standardisation globale aboutit aux mêmes résultats que si aucune standardisation n'est appliquée. Les modèles créés avec les versions précédentes d'ArcGIS et qui utilisent l'option de standardisation globale devront peut-être être régénérés.

Syntaxe

HighLowClustering_stats (Input_Feature_Class, Input_Field, Generate_Report, Conceptualization_of_Spatial_Relationships, Distance_Method, Standardization, Distance_Band_or_Threshold_Distance, {Weights_Matrix_File})

Paramètre	Explication	Type de données
Input_Feature_Class	Classe d'entités pour laquelle la statistique General G est calculée.	Feature Layer
Input_Field	Champ numérique à évaluer.	Field
Generate_Report	NO_REPORT —Aucun récapitulatif graphique n'est créé (valeur par défaut). GENERATE_REPORT —Un récapitulatif graphique est créé en tant que fichier HTML.	Boolean
Conceptualization_of_Spatial_Relationships	Indique la façon dont les relations spatiales sont conceptualisées parmi les entités. INVERSE_DISTANCE —Les entités voisines proches ont une plus grande influence sur les calculs pour une entité cible que les entités plus éloignées. INVERSE_DISTANCE_SQUARED —Identique à INVERSE_DISTANCE, mais la pente est plus prononcée et l'influence chute donc plus rapidement. De plus, les voisins les plus proches d'une seule entité cible exercent une influence notable sur les calculs de cette entité. FIXED_DISTANCE_BAND —Chaque entité est analysée dans le contexte d'entités voisines. Les entités voisines à l'intérieur de la distance critique spécifiée reçoivent une pondération de 1 et exercent une influence sur les calculs de l'entité cible. Les entités voisines à l'extérieur de la distance critique reçoivent une pondération de zéro et n'ont aucune influence sur les calculs d'une entité cible. ZONE_OF_INDIFFERENCE —Les entités dans la distance critique spécifiée d'une entité cible reçoivent une pondération de 1 et influencent les calculs de cette entité. Une fois que la distance critique a été dépassée, les pondérations (et l'influence qu'une entité voisine exerce sur les calculs de l'entité cible) diminuent avec la distance. POLYGON_CONTIGUITY_(FIRST_ORDER) —Seules les entités surfaciques voisines qui partagent une limite influenceront les calculs de l'entité surfacique cible. (Nécessite une licence ArcInfo) GET_SPATIAL_WEIGHTS_FROM_FILE —Les relations spatiales sont définies dans un fichier de pondérations spatiales. Le chemin d'accès au fichier de pondérations spatiales est spécifié par le paramètre Fichier de matrice des pondérations.	String
Distance_Method	Spécifie le mode de calcul des distances de chaque entité avec les entités voisines. EUCLIDEAN_DISTANCE —Distance en ligne droite entre deux points (à vol d'oiseau). MANHATTAN_DISTANCE —Distance entre deux points mesurés le long des axes à angles droits (îlot) ; calculée en additionnant la différence (absolue) entre les coordonnées x et y	String
Standardization	La standardisation par lignes est recommandée chaque fois que la répartition de vos entités est potentiellement influencée par la conception de l'échantillonnage ou un plan d'agrégation imposé. NONE —Aucune standardisation de pondérations spatiales n'est appliquée. ROW —Les pondérations spatiales sont standardisées ; chaque pondération est divisée par la somme des lignes (la somme des pondérations de toutes les entités voisines).	String
Distance_Band_or_Threshold_Distance	Spécifie une distance limite pour les options Inverse Distance et Fixed Distance. Les entités se trouvant à l'extérieur de la limite spécifiée pour une entité cible ne sont pas prises en compte dans les analyses pour cette entité. Cependant, pour Zone of Indifference, l'influence des entités situées hors de la distance donnée est réduite avec la distance, tandis que les entités se trouvant dans le seuil de distance sont considérées à part égale. La valeur entrée doit correspondre à celles du système de coordonnées en sortie. Pour les conceptualisations basées sur l'inverse de la distance de relations spatiales, une valeur de 0 indique qu'aucune distance seuil n'est appliquée ; lorsque ce paramètre n'est pas défini, une valeur de seuil par défaut est calculée et appliquée. Cette valeur par défaut correspond à la distance euclidienne permettant de garantir que chaque entité présente au moins un voisin. Ce paramètre n'a aucun effet lorsque les conceptualisations spatiales de contiguïté polygonale ou d'extraction des pondérations spatiales à partir du fichier sont sélectionnées.	Double
Weights_Matrix_File (Facultatif)	Chemin d'accès à un fichier contenant les pondérations spatiales qui définissent les relations spatiales parmi les entités.	File

Exemple de code

Exemple 1 d'utilisation de l'outil HighLowClustering (fenêtre Python)

Le script de fenêtre Python ci-dessous illustre l'utilisation de l'outil High/Low Clustering (Getis-Ord General G).

import arcpy
arcpy.env.workspace = r"C:\data"
arcpy.HighLowClustering_stats("911Count.shp", "ICOUNT","false", "GET_SPATIAL_WEIGHTS_FROM_FILE","EUCLIDEAN_DISTANCE", "NONE","#", "euclidean6Neighs.swm")

Exemple 2 d'utilisation de l'outil HighLowClustering (script Python autonome)

Le script Python autonome ci-dessous illustre l'utilisation de l'outil High/Low Clustering (Getis-Ord General G).

# Analyze the spatial distribution of 911 calls in a metropolitan area
# using the High/Low Clustering (Getis-Ord General G) tool
 
# Import system modules
import arcpy
 
# Set the geoprocessor object property to overwrite existing outputs
arcpy.gp.overwriteOutput = True
 
# Local variables...
workspace = r"C:\Data"

try:
    # Set the current workspace (to avoid having to specify the full path to the feature classes each time)
    arcpy.env.workspace = workspace

    # Copy the input feature class and integrate the points to snap
    # together at 500 feet
    # Process: Copy Features and Integrate
    cf = arcpy.CopyFeatures_management("911Calls.shp", "911Copied.shp",
                         "#", 0, 0, 0)

    integrate = arcpy.Integrate_management("911Copied.shp #", "500 Feet")

    # Use Collect Events to count the number of calls at each location
    # Process: Collect Events
    ce = arcpy.CollectEvents_stats("911Copied.shp", "911Count.shp", "Count", "#")

    # Add a unique ID field to the count feature class
    # Process: Add Field and Calculate Field
    af = arcpy.AddField_management("911Count.shp", "MyID", "LONG", "#", "#", "#", "#",
                     "NON_NULLABLE", "NON_REQUIRED", "#",
                     "911Count.shp")
    
    cf = arcpy.CalculateField_management("911Count.shp", "MyID", "[FID]", "VB")

    # Create Spatial Weights Matrix for Calculations
    # Process: Generate Spatial Weights Matrix... 
    swm = arcpy.GenerateSpatialWeightsMatrix_stats("911Count.shp", "MYID",
                        "euclidean6Neighs.swm",
                        "K_NEAREST_NEIGHBORS",
                        "#", "#", "#", 6,
                        "NO_STANDARDIZATION") 

    # Cluster Analysis of 911 Calls
    # Process: High/Low Clustering (Getis-Ord General G)
    hs = arcpy.HighLowClustering_stats("911Count.shp", "ICOUNT", 
                        "false", 
                        "GET_SPATIAL_WEIGHTS_FROM_FILE",
                        "EUCLIDEAN_DISTANCE", "NONE",
                        "#", "euclidean6Neighs.swm")

except:
    # If an error occurred when running the tool, print out the error message.
    print arcpy.GetMessages()

Environnements

Espace de travail courant, Espace de travail temporaire, Système de coordonnées en sortie

Rubriques connexes

Présentation générale du jeu d'outils Analyse de modèles

Modélisation de relations spatiales

Qu'est-ce qu'un score z ? Qu'est-ce qu'une valeur de p ?

Utilisation de la fenêtre Résultats

Spatial Autocorrelation (Global Moran's I)

Hot Spot Analysis (Getis-Ord Gi*)

Pondérations spatiales

Fonctionnement de l'outil High/Low Clustering (Getis-Ord General G)

Informations de licence

ArcView : Obligatoire V

ArcEditor : Obligatoire V

ArcInfo : Obligatoire V

7/10/2012