Fonctionnement de l'outil Hot Spot Analysis (Getis-Ord Gi*)

L'outil Hot Spot Analysis (Getis-Ord Gi*) calcule la statistique Getis-Ord Gi* (prononcé G-i-étoile) pour chaque entité dans un jeu de données. Les scores z et valeurs p résultants indiquent les points d'agrégation spatiale des entités présentant des valeurs hautes ou basses. Cet outil fonctionne en examinant chaque entité dans le contexte des entités voisines. Une entité présentant une valeur élevée est intéressante mais peut ne pas être un hot spot statistiquement significatif. Pour constituer un hot spot statistiquement significatif, une entité doit avoir une valeur élevée et être entourée par d'autres entités également associées à des valeurs élevées. La somme locale d'une entité et de ses voisins est proportionnellement comparée à la somme de toutes les entités ; lorsque la somme locale est sensiblement différente de la somme locale attendue et que cette différence est trop importante pour être un résultat aléatoire, le score z peut être considéré comme statistiquement significatif.

Calculs

Formules mathématiques de la statistique Gi*

Interprétation

La statistique Gi* renvoyée pour chaque entité dans le jeu de données est un score z. Pour les scores z positifs statistiquement significatifs, plus le score z est élevé, plus l'agrégation de valeurs élevées est intense (hot spot). Pour les scores z négatifs statistiquement significatifs, plus le score z est faible, plus l'agrégation de valeurs faibles est intense (cold spot). Pour plus d'informations sur la façon de déterminer la signification d'une statistique, reportez-vous à la rubrique Qu'est-ce qu'un score z ? Qu'est-ce qu'une valeur p ?).

Sortie

Cet outil crée une nouvelle Classe d'entités en sortie avec un score z et une valeur p pour chaque entité de la Classe d'entités en entrée. Si un ensemble de sélection s'applique à la Classe d'entités en entrée, seules les entités sélectionnées sont analysées et apparaissent dans la Classe d'entités en sortie. Cet outil renvoie également le nom des champs de score z et de valeur p en tant que valeurs en sortie dérivées pour utilisation éventuelle dans les modèles et les scripts personnalisés.

Lorsque l'outil s'exécute dans ArcMap, la Classe d'entités en sortie est ajoutée automatiquement à la table des matières et le rendu par défaut est appliqué au champ de score z. Le rendu de type chaud à froid appliqué est défini par un fichier de couches dans <ArcGIS>/ArcToolbox/Templates/Layers. Vous pouvez appliquer à nouveau le rendu par défaut, si nécessaire, en important la symbologie des couches modèle.

Considérations sur l'analyse Hot Spot

Il y a trois choses à prendre en compte lorsque on entreprend une analyse Hot Spot :

  1. Quel est le champ d'analyse (Champ en entrée) ? L'outil Hot Spot Analysis (Getis-Ord Gi*) évalue si des valeurs hautes ou basses (nombre de délits, gravité des accidents ou montants dépensés dans les magasins de sport, par exemple) s'agrègent spatialement. Le champ qui contient ces valeurs est votre champ d' analyse. Pour les données d'incident ponctuelles, toutefois, vous pouvez préférer évaluer l'intensité d'incidence que d'analyser l'agrégation spatiale d'une valeur particulière associée aux incidents. Dans ce cas, vous devez agréger vos données d'incident avant l'analyse. Il existe plusieurs manières d'y parvenir :
    • Si vous avez des entités surfaciques dans votre zone d'étude, vous pouvez utiliser l'outil Jointure spatiale pour compter le nombre d'événements dans chaque polygone. Le champ résultant qui contient le nombre d'événements dans chaque polygone devient le Champ en entrée pour l'analyse.
    • Utilisez l'outil Créer un quadrillage pour construire un quadrillage de polygone sur vos entités ponctuelles. Utilisez ensuite l'outil Jointure spatiale pour compter le nombre d'événements contenus dans chaque polygone du quadrillage. Supprimez les polygones du quadrillage situés à l'extérieur de votre zone d'étude. En outre, au cas où beaucoup des polygones de quadrillage situés dans la zone d'étude ne contiennent pas d'événement, augmentez la taille de grille de quadrillage ou supprimez ces polygones de quadrillage avant l'analyse.
    • Si vous avez plusieurs points coïncidents ou des points situés à une courte distance l'un de l'autre, vous pouvez également utiliser l'outil Intégrer avec l'outil Collect Events pour (1) capturer les entités situées à une distance spécifique l'une de l'autre, puis (2) créer une nouvelle classe d'entités qui contient un point à chaque emplacement unique, associée à un attribut de comptage qui indique le nombre d'événements/de points capturés. Utilisez le champ ICOUNT résultant en tant que Champ en entrée pour l'analyse.
      RemarqueRemarque :

      si vous ne souhaitez pas que les points coïncidents donnent lieu à des enregistrements redondants, l'outil Rechercher l'élément identique peut vous aider à localiser et à supprimer les doublons.

    Agrégation des données d'incident
    Stratégies pour agréger des données d'incident.
  2. Quelle Conceptualisation de relations spatiales est approprié ? Quelle valeur de Canal distance ou distance seuil est la plus pertinente ?

    Le type de Conceptualisation de relations spatiales recommandé (également valeur par défaut) pour l'outil Hot Spot Analysis (Getis-Ord Gi*) est Canal de distance constante. Les options Zone d'indifférence, Contiguïté, K voisin le plus proche et Triangulation de Delaunay peuvent aussi s'avérer efficaces. Pour une discussion de pratiques conseillées et stratégies pour la détermination d'une valeur de distance d'analyse, voyez Selecting a Conceptualization of Spatial Relationships et Selecting a Fixed Distance.

  3. Quelle est la question ?

    Cela peut paraître évident, mais la façon dont vous créez le Champ en entrée pour l'analyse détermine le type de question que vous pouvez vous poser. Voulez-vous déterminer les zones où surviennent beaucoup d'incidents ou celles où les valeurs élevées ou faibles s'agrègent spatialement pour un attribut particulier ? Si tel est le cas, exécutez l'outil Hot Spot Analysis (Getis-Ord Gi*) sur les valeurs brutes ou sur le nombre d'incidents brut. Ce type d'analyse est particulièrement utile pour les problèmes de type allocation de ressources. Vous pouvez également vous intéresser à la localisation de zones comportant des valeurs plus élevées que prévu, liées à d'autres variables. Par exemple, si vous analysez le phénomène des saisies, vous vous attendez probablement à ce que le nombre de saisies soit plus important dans les zones plus peuplées (autrement dit, vous vous attendez à ce que le nombre de saisies soit fonction du nombre de maisons). Si vous divisez le nombre de saisies par le nombre de domiciles, puis exécutez l'outil Hot Spot Analysis (Getis-Ord Gi*) sur ce ratio, la question n'est plus de rechercher les zones où il y a beaucoup de saisies mais celles où le nombre de saisies est anormalement élevé, étant donné le nombre de domiciles ? En créant un taux ou un ratio avant l'analyse, vous pouvez vérifier certaines relations attendues (par exemple, le nombre de délits est une fonction relative à la population et le nombre de saisies est une fonction relative au parc immobilier) et identifier des hot spots ou cold spots inattendus.

Pratiques conseillées

Applications possibles

Les applications de cette statistique peuvent concerner la délinquance, l'épidémiologie, les modèles électoraux, la géographie économique, la vente au détail, la circulation routière et les données démographiques. Voici quelques exemples :

Ressources supplémentaires

Mitchell, Andy. The ESRI Guide to GIS Analysis, Volume 2.ESRI Press, 2005.

Getis, A. et Aldstadt, J. (2004). Ord. 1992. "The Analysis of Spatial Association by Use of Distance Statistics" dans Geographical Analysis 24(3).

Getis, A. et Aldstadt, J. (2004). 1995. "Local Spatial Autocorrelation Statistics: Distributional Issues and an Application" dans Geographical Analysis 27(4).

Brefs clips vidéos sur l'analyse de semis de points

Scott, L. et N. Warmerdam. Extend Crime Analysis with ArcGIS Spatial Statistics Tools dans ArcUser Online, avril/juin 2005.


7/10/2012