Análisis de punto caliente (Gi* de Getis-Ord) (Estadística espacial)
Resumen
Dado un conjunto de entidades ponderadas, identifica puntos calientes y puntos fríos estadísticamente significativos mediante la estadística Gi* de Getis-Ord.
Más información sobre cómo funciona el Análisis de punto caliente (Gi* de Getis-Ord)
Ilustración
Uso
-
Esta herramienta identifica clusters espaciales estadísticamente significativos de valores altos (puntos calientes) y valores bajos (puntos fríos). Crea una nueva Clase de entidad de salida con una puntuación z y un valor P para cada entidad en la Clase de entidad de entrada. También devuelve los nombres de los campos de puntuación z y valor P como valores de salida derivados para su uso potencial en modelos y secuencias de comandos personalizados.
-
Las puntuaciones z y los valores p son medidas de significancia estadística que indican si se rechazará la hipótesis nula, entidad por entidad. En efecto, indican si el clustering espacial de valores altos o bajos observado es más marcado de lo que se espera en una distribución aleatoria de esos mismos valores.
-
Una puntuación z alta y un valor P pequeño para una entidad indican un clustering espacial de valores altos. Una puntuación z negativa baja y un valor P pequeño indican un clustering espacial de valores bajos. Mientras más alta (o más baja) sea la puntuación z, más intenso será el clustering. Una puntuación z cercana a cero indica que no hay un clustering espacial evidente.
-
La puntuación z está basada en el cálculo de la hipótesis nula de aleatorización. Para obtener más información sobre las puntuaciones z, consulte ¿Qué es una puntuación z? ¿Qué es un valor P?
-
Los cálculos basados en la distancia euclidiana o de Manhattan requieren datos proyectados para medir distancias correctamente.
-
Los centroides de entidad se utilizan en los cálculos de distancia para las entidades de línea y polígono. Para multipuntos, polilíneas o polígonos con varias partes, el centroide se calcula utilizando el centro medio ponderado de todas las partes de entidad. La ponderación para las entidades de punto es 1, para las entidades de línea es longitud y para las entidades de polígono es área.
-
El Campo de entrada debe contener una variedad de valores. La operación matemática para esta estadística requiere cierta variación en la variable analizada; no puede resolver si todos los valores de entrada son 1, por ejemplo. Si desea utilizar esta herramienta para analizar el patrón espacial de los datos de incidentes, considere agregar los datos de incidentes.
-
Su elección del parámetro Conceptualización de relaciones espaciales deberá reflejar relaciones inherentes entre las entidades que analiza. Cuanto más realista sea el modelado de cómo interactúan mutuamente las entidades en el espacio, más precisos serán sus resultados. Explore estas recomendaciones. Aquí le presentamos algunas sugerencias adicionales:
-
FIXED_DISTANCE_BAND
El valor predeterminado para el parámetro Banda de distancia o distancia de umbral garantiza que cada entidad tenga como mínimo un vecino, lo cual es importante. Sin embargo, generalmente, este valor predeterminado no es la distancia más apropiada que se debe utilizar para el análisis.
Haga clic aquí para obtener más información sobre el parámetro Banda de distancia o distancia de umbral.
- INVERSE_DISTANCE o INVERSE_DISTANCE_SQUARED
Cuando se introduce 0 para el parámetro Banda de distancia o distancia de umbral, se considera que todas las entidades son vecinas de las demás entidades; cuando este parámetro se deja en blanco, se aplica la distancia de umbral predeterminada.
Los pesos de las distancias menores que 1 se vuelven inestables. El peso para las entidades separadas por menos de una unidad de distancia (común con las proyecciones del sistema de coordenadas geográficas) es 1.
Precaución:No se recomienda el análisis de entidades con una proyección del sistema de coordenadas geográficas cuando se selecciona un método de conceptualización espacial basado en la distancia inversa (INVERSE_DISTANCE, INVERSE_DISTANCE_SQUARED o ZONE_OF_INDIFFERENCE).
Para estas opciones de Distancia inversa, a dos puntos coincidentes cualesquiera se les otorga un peso de 1 para evitar la división por cero. Esto garantiza que no se excluyan entidades del análisis.
-
FIXED_DISTANCE_BAND
-
Las opciones adicionales para el parámetro Conceptualización de relaciones espaciales están disponibles mediante las herramientas Generar matriz de ponderaciones espaciales o Generar pesos espaciales de red. Para aprovechar estas opciones adicionales, utilice una de estas herramientas para crear el archivo de matriz de ponderaciones espaciales antes del análisis; seleccione GET_SPATIAL_WEIGHTS_FROM_FILE para el parámetro Conceptualización de relaciones espaciales; y, para el parámetro Archivo de matriz de ponderaciones, especifique la ruta al archivo de ponderaciones espaciales que creó.
-
Las capas del mapa se pueden utilizar para definir la Clase de entidad de entrada. Cuando se utiliza una capa con una selección, sólo las entidades seleccionadas se incluyen en el análisis.
Si proporciona un Archivo de matriz de ponderaciones con una extensión SWM o .swm, esta herramienta espera un archivo de matriz de ponderaciones espaciales creado utilizando las herramientas Generar matriz de ponderaciones espaciales o Generar ponderaciones espaciales de red; de lo contrario, esta herramienta espera un archivo de matriz de ponderaciones espaciales con formato ASCII. En algunos casos, el comportamiento es diferente según el tipo de archivo de matriz de ponderaciones espaciales que se utiliza:
- Archivos de matriz de ponderaciones espaciales con formato ASCII:
- Las ponderaciones se utilizan como están. Las relaciones de entidad a entidad que faltan se tratan como ceros.
- La ponderación predeterminada para el potencial automático es cero, a menos que especifique un valor de Campo potencial automático o incluya explícitamente las ponderaciones automáticas potenciales.
- Si los pesos están estandarizados por fila, es probable que los resultados sean incorrectos para el análisis en los conjuntos de selección. Si necesita ejecutar el análisis en un conjunto de selección, convierta el archivo de ponderaciones espaciales ASCII a un archivo SWM leyendo los datos ASCII en una tabla y utilizando después la opción CONVERT_TABLE con la herramienta Generar matriz de ponderaciones espaciales.
- Archivo de matriz de ponderaciones espaciales con formato SWM:
- Si las ponderaciones están estandarizadas en filas, se volverán a estandarizar para los conjuntos de selección; de lo contrario, las ponderaciones se utilizan tal cual.
- El peso predeterminado para auto potencial es uno, a menos que especifique un valor del Campo auto potencial.
- Archivos de matriz de ponderaciones espaciales con formato ASCII:
La ejecución del análisis con un archivo de matriz de ponderaciones espaciales con formato ASCII consume muchos recursos de memoria. Para los análisis de más de 5000 entidades aproximadamente, considere convertir el archivo de matriz de ponderaciones espaciales con formato ASCII a un archivo con formato .swm. Primero coloque los pesos ASCII en una tabla con formato (por ejemplo, por medio de Excel). A continuación, ejecute la herramienta Generar matriz de ponderaciones espaciales utilizando CONVERT_TABLE para el parámetro Conceptualización de relaciones espaciales. El resultado será un archivo de matriz de ponderaciones espaciales con formato .swm.
-
Cuando esta herramienta se ejecuta en ArcMap, la Clase de entidad de salida se agrega automáticamente a la tabla de contenido con una representación predeterminada aplicada al campo de puntuación z. La representación cálida a fría aplicada está definida en un archivo de capa en <ArcGIS>/Desktop10.x/ArcToolbox/Templates/Layers. Puede volver a aplicar la representación predeterminada, de ser necesario, al importar la simbología de capa de plantilla.
The Output Feature Class includes a SOURCE_ID field which allows you to Join it to the Input Feature Class, if needed.
-
El tema de ayuda Modelado de relaciones espaciales ofrece información adicional sobre los parámetros de esta herramienta.
Al utilizar shapefiles tenga en cuenta que no pueden almacenar valores nulos. Las herramientas u otros procedimientos que crean shapefiles a partir de entradas sin shapefiles pueden almacenar o interpretar valores nulos como cero. Esto puede ocasionar resultados inesperados. Consulte también Consideraciones de geoprocesamiento para la salida de shapefiles.
Prior to ArcGIS 10.0, the output feature class was a duplicate of the input feature class with the z-score and p-value results fields added. After ArcGIS 10.0, the output feature class only includes the z-score and p-value fields as well as the fields input for the analysis. To join other input fields to the output feature class, use the SOURCE_ID field to join the fields using tools in the Joins toolset.
Sintaxis
Parámetro | Explicación | Tipo de datos |
Input_Feature_Class |
La clase de entidad para la que se realizará el análisis de punto caliente. | Feature Layer |
Input_Field |
El campo numérico de cantidad (número de víctimas, delitos, trabajos, etc.) que se va a evaluar. | Field |
Output_Feature_Class |
La clase de entidad de salida que recibirá los resultados de la puntuación z y el valor P. | Feature Class |
Conceptualization_of_Spatial_Relationships |
Especifica cómo se conceptualizan las relaciones espaciales entre las entidades.
| String |
Distance_Method |
Especifica cómo se calculan las distancias desde cada entidad hasta las entidades vecinas.
| String |
Standardization |
Se recomienda la estandarización de filas siempre que la distribución de las entidades esté potencialmente influenciada debido al diseño de muestreo o a un esquema de agregación impuesto.
| String |
Distance_Band_or_Threshold_Distance |
Especifica una distancia de valor límite para las opciones Distancia inversa y Distancia fija. Las entidades que están fuera del valor límite especificado para una entidad de destino se ignoran en el análisis de esa entidad. Sin embargo, para la Zona de indiferencia, la influencia de las entidades que están fuera de la distancia dada se reduce con la distancia, mientras que aquellas que están dentro del umbral de distancia se consideran por igual. El valor introducido debe coincidir con el del sistema de coordenadas de salida. Para las conceptualizaciones de relaciones espaciales de la Distancia inversa, un valor de 0 indica que no se aplica una distancia de umbral; cuando este parámetro se deja en blanco, se calcula y se aplica un valor de umbral predeterminado. Este valor predeterminado es la distancia euclidiana que garantiza que cada entidad tenga como mínimo un vecino. Este parámetro no tiene efecto cuando se seleccionan las conceptualizaciones espaciales Contigüidad de polígono u Obtener ponderaciones espaciales a partir del archivo. | Double |
Self_Potential_Field (Opcional) |
El campo que representa el autopotencial: la distancia o el peso entre una entidad y ella misma. | Field |
Weights_Matrix_File (Opcional) |
La ruta a un archivo que contiene las ponderaciones espaciales que definen las relaciones espaciales entre las entidades. | File |
Ejemplo de código
La siguiente secuencia de comandos de la ventana de Python muestra cómo utilizar la herramienta HotSpotAnalysis.
import arcpy arcpy.env.workspace = "C:/data" arcpy.HotSpots_stats("911Count.shp", "ICOUNT", "911HotSpots.shp","GET_SPATIAL_WEIGHTS_FROM_FILE","EUCLIDEAN_DISTANCE", "NONE","#", "#", "euclidean6Neighs.swm")
La siguiente secuencia de comandos de Python independiente muestra cómo utilizar la herramienta HotSpotAnalysis.
# Analyze the spatial distribution of 911 calls in a metropolitan area # using the Hot-Spot Analysis Tool (Local Gi*) # Import system modules import arcpy # Set geoprocessor object property to overwrite existing output, by default arcpy.gp.overwriteOutput = True # Local variables... workspace = "C:/Data" try: # Set the current workspace (to avoid having to specify the full path to the feature classes each time) arcpy.env.workspace = workspace # Copy the input feature class and integrate the points to snap # together at 500 feet # Process: Copy Features and Integrate cf = arcpy.CopyFeatures_management("911Calls.shp", "911Copied.shp", "#", 0, 0, 0) integrate = arcpy.Integrate_management("911Copied.shp #", "500 Feet") # Use Collect Events to count the number of calls at each location # Process: Collect Events ce = arcpy.CollectEvents_stats("911Copied.shp", "911Count.shp", "Count", "#") # Add a unique ID field to the count feature class # Process: Add Field and Calculate Field af = arcpy.AddField_management("911Count.shp", "MyID", "LONG", "#", "#", "#", "#", "NON_NULLABLE", "NON_REQUIRED", "#", "911Count.shp") cf = arcpy.CalculateField_management("911Count.shp", "MyID", "[FID]", "VB") # Create Spatial Weights Matrix for Calculations # Process: Generate Spatial Weights Matrix... swm = arcpy.GenerateSpatialWeightsMatrix_stats("911Count.shp", "MYID", "euclidean6Neighs.swm", "K_NEAREST_NEIGHBORS", "#", "#", "#", 6, "NO_STANDARDIZATION") # Hot Spot Analysis of 911 Calls # Process: Hot Spot Analysis (Getis-Ord Gi*) hs = arcpy.HotSpots_stats("911Count.shp", "ICOUNT", "911HotSpots.shp", "GET_SPATIAL_WEIGHTS_FROM_FILE", "EUCLIDEAN_DISTANCE", "NONE", "#", "#", "euclidean6Neighs.swm") except: # If an error occurred when running the tool, print out the error message. print arcpy.GetMessages()
Entornos
- Sistema de coordenadas de salida
La geometría de la entidad se proyecta al Sistema de coordenadas de salida antes del análisis, por lo tanto los valores introducidos para el parámetro Banda de distancia o distancia de umbral deben coincidir con los que se especificaron en el Sistema de coordenadas de salida. Todos los cálculos matemáticos se basan en la referencia espacial del sistema de coordenadas de salida.