Cluster and Outlier Analysis (Anselin Local Moran's I) (Räumliche Statistiken)
Zusammenfassung
Dieses Werkzeug identifiziert in einem Satz gewichteter Features mithilfe der Anselin Local Morans I-Statistik statistisch signifikante Hot Spots, Cold Spots und räumliche Ausreißer.
Weitere Informationen zur Funktionsweise der Cluster- und Ausreißeranalyse (Anselin Local Morans I)
Abbildung
Verwendung
-
Mit diesem Werkzeug wird eine neue Ausgabe-Feature-Class einem Z-Ergebnis und p-Wert anhand der folgenden Attribute für jedes Feature in der Eingabe-Feature-Class erstellt: Local Moran's I-Index, Z-Ergebnis, p-Wert und Cluster-/Ausreißer-Typ (COType). Die Feldnamen dieser Attribute sind ebenfalls abgeleitete Ausgabewerte des Werkzeugs für die mögliche Verwendung in benutzerdefinierten Modellen und Skripten.
-
Die Z-Ergebnisse und p-Werte sind Werte von statistischer Bedeutung, die Aufschluss darüber geben, ob Sie die Nullhypothese auf Feature-Ebene ablehnen können oder nicht. Genau genommen, geben Sie an, ob die scheinbare Ähnlichkeit (eine räumliche Cluster-Bildung von hohen oder niedrigen Werten) oder die Unterschiede (ein räumlicher Ausreißer) auffälliger sind als bei einer zufälligen Verteilung.
-
Ein hohes positives Z-Ergebnis für ein Feature deutet darauf hin, dass die umgebenden Features ähnliche Werte (hohe oder niedrige Werte) aufweisen. Das COType-Feld in der Ausgabe-Feature-Class ist HH für ein statistisch signifikantes (Niveau von 0,05) Cluster mit hohen Werten und LL für ein statistisch signifikantes (Niveau von 0,05) Cluster mit niedrigen Werten.
-
Ein niedriges negatives Z-Ergebnis (beispielsweise < -1.96) für ein Feature deutet auf einen statistisch signifikanten (Niveau von 0,05) räumlichen Ausreißer hin. Das COType-Feld in der Ausgabe-Feature-Class gibt an, ob das Feature einen hohen Wert aufweist und von Features mit niedrigen Werten umgeben ist (HL), oder ob das Feature einen niedrigen Wert aufweist und von Features mit hohen Werten umgeben ist (LH) .
-
Das Z-Ergebnis basiert auf der Berechnung per Zufallsnullhypothese. Weitere Informationen zu Z-Ergebnissen finden Sie unter Was ist ein Z-Ergebnis? Was ist ein p-Wert?
-
Für Berechnungen, die auf der euklidischen Entfernung oder der Manhattan-Distanz basieren, sind zur genauen Messung von Entfernungen projizierte Daten erforderlich.
-
Für Linien- und Polygon-Features werden bei Entfernungsberechnungen Feature-Schwerpunkte verwendet. Für Multipoints, Polylinien oder Polygone mit mehreren Teilen wird der Schwerpunkt mithilfe des gewichteten arithmetischen Mittelpunkts aller Feature-Teile berechnet. Die Gewichtung für Punkt-Features ist 1, für Linien-Features "Länge" und für Polygon-Features "Fläche".
-
Das Eingabefeld sollte eine Vielzahl von Werten aufweisen. Für diese Statistikberechnung ist es erforderlich, dass nicht alle Variablen den gleichen Wert aufweisen; eine Berechnung ist z. B. nicht möglich, wenn alle Eingabewerte 1 lauten. Wenn Sie mit diesem Werkzeug das räumliche Muster von Ereignisdaten analysieren möchten, können Sie dazu die Ereignisdaten zusammenfassen.
-
Ihre Auswahl für den Parameter Konzeptualisierung von räumlichen Beziehungen sollte inhärente Beziehungen unter den Features, die analysiert werden, widerspiegeln. Je realistischer Sie modellieren können, wie Features im Raum interagieren, desto genauer werden die Ergebnisse. Empfehlungen. Weitere Tipps:
-
FIXED_DISTANCE_BAND
Der Standardwert für den Parameter Entfernungsband oder Schwellenwertentfernung stellt sicher, dass jedes Feature mindestens über einen Nachbarn verfügt. Dies ist wichtig. Häufig ist dieser Standardwert jedoch nicht die am besten geeignete Entfernung für die Analyse.
Klicken Sie hier, um weitere Informationen zum Parameter Entfernungsband oder Schwellenwertentfernung zu erhalten.
- INVERSE_DISTANCE oder INVERSE_DISTANCE_SQUARED
Wenn für den Parameter Entfernungsband oder Schwellenwertentfernung der Wert 0 eingegeben wird, werden alle Features als Nachbarn aller anderen Features angesehen. Falls der Parameter leer gelassen wird, wird die standardmäßige Schwellenwertentfernung angewendet.
Gewichtungen für Entfernungen mit einem Wert von unter 1 sind instabil. Die Gewichtung für Features, die durch weniger als eine Entfernungseinheit (z. B. häufig bei Projektionen mit geographischen Koordinatensystemen) getrennt sind, ist 1.
Vorsicht:Die Analyse von Features mit einer Projektion per geographischem Koordinatensystem ist nicht zu empfehlen, wenn Sie eine Methoden der räumlichen Konzeptualisierung mit inverser Entfernung auswählen (INVERSE_DISTANCE, INVERSE_DISTANCE_SQUARED oder ZONE_OF_INDIFFERENCE).
Bei diesen Optionen mit inverser Entfernung erhalten zwei lagegleiche Punkte jeweils eine Gewichtung von 1, um das Dividieren durch 0 zu vermeiden. Auf diese Weise wird sichergestellt, dass Features nicht von der Analyse ausgeschlossen werden.
-
FIXED_DISTANCE_BAND
-
Zusätzliche Optionen für den Parameter Konzeptualisierung von räumlichen Beziehungen sind bei Verwendung der Werkzeuge Räumliche Gewichtungsmatrix erstellen oder Räumliche Gewichtung des Netzwerkes generieren verfügbar. Um diese zusätzlichen Optionen zu nutzen, verwenden Sie eines dieser Werkzeuge zum Konstruieren der Datei mit der räumlichen Gewichtungsmatrix vor der Analyse. Wählen Sie GET_SPATIAL_WEIGHTS_FROM_FILE als Parameter Konzeptualisierung von räumlichen Beziehungen aus, und geben Sie für den Parameter Gewichtungsmatrix-Datei den Pfad zur erstellten Datei mit der räumlichen Gewichtung an.
-
Sie können Karten-Layer verwenden, um die Eingabe-Feature-Class zu definieren. Beim Verwenden eines Layers mit einer Auswahl sind nur die ausgewählten Features in der Analyse enthalten.
- Falls dieses Werkzeug Teil eines benutzerdefinierten Modellwerkzeugs ist, wird der HTML-Link nur im Ergebnisfenster angezeigt, wenn er vor dem Ausführen des Werkzeugs als Modellparameter festgelegt wird.
- Um die bestmögliche Anzeige von HTML-Grafiken zu erzielen, müssen Sie sicherstellen, dass der Monitor auf 96 DPI eingestellt ist.
- Dateien mit der räumlichen Gewichtungsmatrix im ASCII-Format:
- Gewichtungen werden unverändert verwendet. Fehlende Feature-zu-Feature-Beziehungen werden als Nullen behandelt.
- Wenn die Gewichtungen zeilenstandardisiert sind, sind die Ergebnisse für Analysen von Auswahlsätzen mit hoher Wahrscheinlichkeit fehlerhaft. Falls Sie eine Analyse für einen Auswahlsatz durchführen müssen, konvertieren Sie die Datei mit der räumlichen Gewichtung im ASCII-Format in eine SWM-Datei, indem Sie die ASCII-Daten in eine Tabelle einlesen. Verwenden Sie dann die Option CONVERT_TABLE in Verbindung mit dem Werkzeug Räumliche Gewichtungsmatrix erstellen.
- Datei mit der räumlichen Gewichtungsmatrix im SWM-Format
- Wenn die Gewichtungen zeilenstandardisiert sind, werden sie für Auswahlsätze neu standardisiert. Andernfalls werden Gewichtungen unverändert verwendet.
Das Ausführen der Analyse mit einer Datei mit der räumlichen Gewichtungsmatrix im ASCII-Format erfordert mehr Arbeitsspeicher. Für Analysen von mehr als ca. 5.000 Features sollten Sie erwägen, die Datei mit der räumlichen Gewichtungsmatrix im ASCII-Format in eine Datei im SWM-Format zu konvertieren. Fügen Sie als Erstes die ASCII-Gewichtungen in eine formatierte Tabelle ein (z. B. eine Excel-Tabelle). Führen Sie als Nächstes das Werkzeug Räumliche Gewichtungsmatrix erstellen mit der Option CONVERT_TABLE für den Parameter Konzeptualisierung von räumlichen Beziehungen aus. Die Ausgabe ist eine Datei mit der räumlichen Gewichtungsmatrix im SWM-Format.
-
Bei Ausführung dieses Werkzeugs in ArcMap wird dem Inhaltsverzeichnis automatisch die Ausgabe-Feature-Class mit Standard-Rendering für das COType-Feld hinzugefügt. Das Hot-to-Cold-Rendering wird durch eine Layer-Datei in <ArcGIS>/Desktop10.x/ArcToolbox/Templates/Layers definiert. Sie können das Standard-Rendering nach Bedarf erneut anwenden, indem Sie die Vorlagen-Layer-Symbologie importieren.
The Output Feature Class includes a SOURCE_ID field which allows you to Join it to the Input Feature Class, if needed.
-
Das Hilfethema Modellierungen räumlicher Beziehungen enthält weitere Informationen zu den Parametern dieses Werkzeugs.
Beim Bereitstellen einer Gewichtungsmatrix-Datei mit der Erweiterung .SWM oder .swm erwartet dieses Werkzeug eine Datei mit der räumlichen Gewichtungsmatrix, die entweder mit dem Werkzeug Räumliche Gewichtungsmatrix erstellen oder Räumliche Gewichtung des Netzwerkes generieren erstellt wurde. Andernfalls erwartet dieses Werkzeug eine Datei mit der räumlichen Gewichtungsmatrix im ASCII-Format. Das Verhalten variiert in Abhängigkeit davon, welche Art von Datei mit der räumlichen Gewichtungsmatrix Sie verwenden:
Denken Sie beim Verwenden von Shapefiles daran, dass diese keine Nullwerte speichern können. Werkzeuge oder andere Verfahren, die Shapefiles aus Nicht-Shapefile-Eingaben erstellen, speichern bzw. interpretieren Nullwerte ggf. als Wert 0. Dies kann zu unerwarteten Ergebnissen führen. Weitere Informationen finden Sie unter Überlegungen zur Geoverarbeitung für die Shapefile-Ausgabe.
Bei Vorversionen von ArcGIS 10.0 war die Ausgabe-Feature-Class ein Duplikat der Eingabe-Feature-Class mit hinzugefügtem COType-, Z-Ergebnis- und p-Wert-Feld. Bei den Versionen ab ArcGIS 10.0 beinhaltet die Ausgabe-Feature-Class nur die in der Analyse verwendeten Ergebnisse und Felder.
Syntax
Parameter | Erläuterung | Datentyp |
Input_Feature_Class |
Die Feature-Class, für die Cluster-/Ausreißer-Analyse durchgeführt wird. | Feature Layer |
Input_Field |
Das Zahlenfeld, das ausgewertet werden soll. | Field |
Output_Feature_Class |
Die Ausgabe-Feature-Class zum Empfangen der Ergebnisfelder. | Feature Class |
Conceptualization_of_Spatial_Relationships |
Gibt an, wie räumliche Beziehungen zwischen Features konzeptualisiert werden.
| String |
Distance_Method |
Gibt an, wie Entfernungen von den einzelnen Features zu benachbarten Features berechnet werden.
| String |
Standardization |
Eine Zeilenstandardisierung wird immer dann empfohlen, wenn die Verteilung der Features aufgrund einer Referenzpunkterfassung oder eines auferlegten Zusammenfassungsschemas möglicherweise verzerrt ist.
| String |
Distance_Band_or_Threshold_Distance |
Gibt einen Entfernungsgrenzwert für Optionen mit inverser Entfernung und Optionen mit fester Entfernung an. Features außerhalb des angegebenen Grenzwerts für ein Ziel-Feature werden in Analysen für dieses Feature ignoriert. Mit der Indifferenzzone wird jedoch der Einfluss von Features außerhalb der angegebenen Entfernung in Abhängigkeit der Entfernung reduziert, während die Features innerhalb des Entfernungsschwellenwerts gleichmäßig berücksichtigt werden. Der eingegebene Wert sollte dem Wert des Ausgabe-Koordinatensystems entsprechen. Bei Konzeptualisierungen von räumlichen Beziehungen mit inverser Entfernung gibt der Wert 0 an, dass keine Schwellenwertentfernung angewendet wird. Wenn dieser Parameter leer gelassen wird, wird ein Standardschwellenwert berechnet und angewendet. Dieser Standardwert ist die euklidische Entfernung, bei der sichergestellt wird, dass jedes Feature mindestens einen Nachbarn hat. Dieser Parameter hat keine Auswirkung, wenn räumliche Konzeptualisierungen vom Typ "Polygonnachbarschaft" oder "Abrufen von räumlichen Gewichtungen aus Datei" ausgewählt werden. | Double |
Weights_Matrix_File (optional) |
Der Pfad zu einer Datei mit räumlichen Gewichtungen, die räumliche Beziehungen zwischen Features definieren. | File |
Codebeispiel
Das folgende Skript im Python-Fenster veranschaulicht, wie Sie das Werkzeug "ClusterandOutlierAnalysis" verwenden.
import arcpy arcpy.env.workspace = "c:/data/911calls" arcpy.ClustersOutliers_stats("911Count.shp", "ICOUNT","911ClusterOutlier.shp","GET_SPATIAL_WEIGHTS_FROM_FILE","EUCLIDEAN_DISTANCE", "NONE","#", "euclidean6Neighs.swm")
Das folgende eigenständige Python-Skript veranschaulicht, wie Sie das Werkzeug "ClusterandOutlierAnalysis" verwenden.
# Analyze the spatial distribution of 911 calls in a metropolitan area # using the Cluster-Outlier Analysis Tool (Anselin's Local Moran's I) # Import system modules import arcpy # Set geoprocessor object property to overwrite outputs if they already exist arcpy.gp.OverwriteOutput = True # Local variables... workspace = r"C:\Data\911Calls" try: # Set the current workspace (to avoid having to specify the full path to the feature classes each time) arcpy.env.workspace = workspace # Copy the input feature class and integrate the points to snap # together at 500 feet # Process: Copy Features and Integrate cf = arcpy.CopyFeatures_management("911Calls.shp", "911Copied.shp", "#", 0, 0, 0) integrate = arcpy.Integrate_management("911Copied.shp #", "500 Feet") # Use Collect Events to count the number of calls at each location # Process: Collect Events ce = arcpy.CollectEvents_stats("911Copied.shp", "911Count.shp", "Count", "#") # Add a unique ID field to the count feature class # Process: Add Field and Calculate Field af = arcpy.AddField_management("911Count.shp", "MyID", "LONG", "#", "#", "#", "#", "NON_NULLABLE", "NON_REQUIRED", "#", "911Count.shp") cf = arcpy.CalculateField_management("911Count.shp", "MyID", "[FID]", "VB") # Create Spatial Weights Matrix for Calculations # Process: Generate Spatial Weights Matrix... swm = arcpy.GenerateSpatialWeightsMatrix_stats("911Count.shp", "MYID", "euclidean6Neighs.swm", "K_NEAREST_NEIGHBORS", "#", "#", "#", 6) # Cluster/Outlier Analysis of 911 Calls # Process: Local Moran's I clusters = arcpy.ClustersOutliers_stats("911Count.shp", "ICOUNT", "911ClusterOutlier.shp", "GET_SPATIAL_WEIGHTS_FROM_FILE", "EUCLIDEAN_DISTANCE", "NONE", "#", "euclidean6Neighs.swm") except: # If an error occurred when running the tool, print out the error message. print arcpy.GetMessages()
Umgebungen
- Ausgabe-Koordinatensystem
Die Feature-Geometrie wird vor der Analyse in das Ausgabe-Koordinatensystem projiziert, sodass die Werte für den Parameter Entfernungsband oder Entfernungsschwellenwert zu jenen passen sollten, die im Ausgabe-Koordinatensystem angegeben sind. Alle mathematischen Berechnungen basieren auf dem Raumbezug des Ausgabe-Koordinatensystems.