Desktop Help 10.0 - Clustering alto/bajo (G general de Getis-Ord) (Estadística espacial)

Resumen

Mide el grado de clustering para valores altos o bajos mediante la estadística G general de Getis-Ord.

You can access the results of this tool (including the optional report file) from the Results window. If you disable background processing, results will also be written to the Progress dialog box.

Más información sobre cómo funciona el Clustering alto/bajo: G general de Getis-Ord

Ilustración

High/Low Clustering (Getis-Ord General G) illustration

Uso

La herramienta Clustering alto/bajo devuelve cinco valores: G general observada, G general esperada, Varianza, puntuación z y valor P. Se puede acceder a estos valores en la ventana Resultados y los mismos también se transmiten como valores de salida derivados para uso potencial en modelos o secuencias de comandos. Opcionalmente, esta herramienta creará un archivo HTML con un resumen gráfico de los resultados. Haga doble clic en el archivo HTML de la ventana Resultados para abrir el archivo HTML en el navegador de Internet predeterminado. Haga clic con el botón derecho del ratón en la entrada Mensajes de la ventana Resultados y seleccione Ver para mostrar los resultados en el cuadro de diálogo Mensaje.
Nota:
- Si esta herramienta es parte de una herramienta de modelo personalizado, el vínculo HTML sólo aparece en la ventana Resultados si se establece como un parámetro de modelo antes de ejecutar la herramienta.
- Para obtener una mejor visualización de gráficos HTML, asegúrese de que su monitor esté configurado para 96 DPI.
El Campo de entrada debe contener una variedad de valores que no sean negativos. Si el Campo de entrada contiene valores negativos, aparecerá un mensaje de error. Además, la operación matemática para esta estadística requiere cierta variación en la variable analizada; no se puede resolver si todos los valores de entrada son 1, por ejemplo. Si desea utilizar esta herramienta para analizar el patrón espacial de los datos de incidentes, considere agregar los datos de incidentes.
Los resultados de la puntuación z y el valor p son medidas de significancia estadística que indican si se debe rechazar o no la hipótesis nula. Para esta herramienta, la hipótesis nula establece que los valores asociados con entidades están distribuidos en forma aleatoria.
La puntuación z está basada en el cálculo de la hipótesis nula de aleatorización. Para obtener más información sobre las puntuaciones z, consulte ¿Qué es una puntuación z? ¿Qué es un valor P?
Mientras más alta (o más baja) sea la puntuación z, mayor será la intensidad del clustering. Una puntuación z cercana a cero indica que no hay un clustering evidente dentro del área de estudio. Una puntuación z positiva indica que hay un clustering de valores altos. Una puntuación z negativa indica que hay un clustering de valores bajos.
Los cálculos basados en la distancia euclidiana o de Manhattan requieren datos proyectados para medir distancias correctamente.
Los centroides de entidad se utilizan en los cálculos de distancia para las entidades de línea y polígono. Para multipuntos, polilíneas o polígonos con varias partes, el centroide se calcula utilizando el centro medio ponderado de todas las partes de entidad. La ponderación para las entidades de punto es 1, para las entidades de línea es longitud y para las entidades de polígono es área.
En ArcGIS 10, el resultado gráfico opcional ya no se muestra automáticamente. En cambio, se crea un archivo HTML que resume los resultados. Para ver los resultados, haga doble clic en el archivo HTML de la ventana Resultados. Es posible que sea necesario reconstruir las secuencias de comandos o las herramientas de modelo personalizadas anteriores a ArcGIS 10 que utilizan esta herramienta. Para reconstruir estas herramientas personalizadas, ábralas, quite el parámetro Mostrar resultados de forma gráfica y vuelva a guardarlas.
This tool will optionally create an HTML file summarizing results. HTML files will not automatically appear in the Catalog window. If you want HTML files to be displayed in Catalog, open the ArcCatalog application, select the Customize menu option, click ArcCatalog Options, and select the File Types tab. Click on the New Type button and specify HTML for File Extension.
Su elección del parámetro Conceptualización de relaciones espaciales deberá reflejar relaciones inherentes entre las entidades que analiza. Cuanto más pueda modelar de manera realista cómo interactúan mutuamente las entidades en el espacio, más precisos serán sus resultados. Las recomendaciones se describen en Seleccionar una conceptualización de relaciones espaciales: Mejor prácticas. Aquí le presentamos algunas sugerencias adicionales:
- Para esta estadística se recomienda un esquema de pesos binarios: Distancia fija, contiguidad de polígonos, vecinos más próximos K o triangulación de Delaunay. Seleccione NINGUNO para el parámetro Estandarización.
- FIXED_DISTANCE_BAND
  The default Distance Band or Threshold Distance will ensure each feature has at least one neighbor, and this is important. But often, this default will not be the most appropriate distance to use for your analysis. Additional strategies for selecting an appropriate scale (distance band) for your analysis are outlined in Selecting a fixed distance band value.
- INVERSE_DISTANCE o INVERSE_DISTANCE_SQUARED (no recomendado)
  Cuando se introduce 0 para el parámetro Banda de distancia o distancia de umbral, se considera que todas las entidades son vecinas de las demás entidades; cuando este parámetro se deja en blanco, se aplica la distancia de umbral predeterminada.
  Los pesos de las distancias menores que 1 se vuelven inestables. El peso para las entidades separadas por menos de una unidad de distancia (común con las proyecciones del sistema de coordenadas geográficas) es 1.
  Precaución:
  
  No se recomienda el análisis de entidades con una proyección del sistema de coordenadas geográficas cuando se selecciona un método de conceptualización espacial basado en la distancia inversa (INVERSE_DISTANCE, INVERSE_DISTANCE_SQUARED o ZONE_OF_INDIFFERENCE).
  
  Para las opciones de distancia inversa (no se recomienda para esta herramienta), dos puntos que son coincidentes recibirán una ponderación de uno para evitar la división por cero. Esto garantiza que las entidades no sean excluidas del análisis.
Las opciones adicionales para el parámetro Conceptualización de relaciones espaciales están disponibles mediante las herramientas Generar matriz de ponderaciones espaciales o Generar pesos espaciales de red. Para aprovechar estas opciones adicionales, utilice una de estas herramientas para crear el archivo de matriz de ponderaciones espaciales antes del análisis; seleccione GET_SPATIAL_WEIGHTS_FROM_FILE para el parámetro Conceptualización de relaciones espaciales; y, para el parámetro Archivo de matriz de ponderaciones, especifique la ruta al archivo de ponderaciones espaciales que creó.
Las capas del mapa se pueden utilizar para definir la Clase de entidad de entrada. Cuando se utiliza una capa con una selección, sólo las entidades seleccionadas se incluyen en el análisis.

Nota:

Si esta herramienta es parte de una herramienta de modelo personalizado, el vínculo HTML sólo aparece en la ventana Resultados si se establece como un parámetro de modelo antes de ejecutar la herramienta.
Para obtener una mejor visualización de gráficos HTML, asegúrese de que su monitor esté configurado para 96 DPI.

Si proporciona un Archivo de matriz de ponderaciones con una extensión .SWM o .swm, se espera que esta herramienta cree un archivo de matriz de ponderaciones espaciales mediante las herramientas Generar matriz de ponderaciones espaciales o Generar pesos espaciales de red. De lo contrario, esta herramienta espera un archivo de matriz de ponderaciones espaciales con formato ASCII. En algunos casos, el comportamiento es diferente según el tipo de archivo de matriz de ponderaciones espaciales que se utiliza:

Archivos de matriz de ponderaciones espaciales con formato ASCII:
- Los pesos se utilizan "tal cual están". Las relaciones de entidad a entidad que faltan se tratan como ceros.
- Si los pesos están estandarizados por fila, es probable que los resultados sean incorrectos para el análisis en los conjuntos de selección. Si necesita ejecutar el análisis en un conjunto de selección, convierta el archivo de ponderaciones espaciales ASCII a un archivo .swm leyendo los datos ASCII en una tabla y utilizando después la opción CONVERT_TABLE con la herramienta Generar matriz de ponderaciones espaciales.
Archivo de matriz de ponderaciones espaciales con formato .SWM
- Si los pesos están estandarizados en filas, se volverán a estandarizar para los conjuntos de selección. De lo contrario, los pesos se utilizan "tal cual están".

La ejecución del análisis con un archivo de matriz de ponderaciones espaciales con formato ASCII consume muchos recursos de memoria. Para los análisis de más de 5000 entidades aproximadamente, considere convertir el archivo de matriz de ponderaciones espaciales con formato ASCII a un archivo con formato .swm. Primero coloque los pesos ASCII en una tabla con formato (por ejemplo, por medio de Excel). A continuación, ejecute la herramienta Generar matriz de ponderaciones espaciales utilizando CONVERT_TABLE para el parámetro Conceptualización de relaciones espaciales. El resultado será un archivo de matriz de ponderaciones espaciales con formato .swm.
El tema de ayuda Modelado de relaciones espaciales ofrece información adicional sobre los parámetros de esta herramienta.

Precaución:

Al utilizar shapefiles tenga en cuenta que no pueden almacenar valores nulos. Las herramientas u otros procedimientos que crean shapefiles a partir de entradas sin shapefiles pueden almacenar o interpretar valores nulos como cero. Esto puede ocasionar resultados inesperados. Consulte también Consideraciones de geoprocesamiento para la salida de shapefiles.

Legado:

En ArcGIS 9.2, se quitó la opción de Estandarización global. La estandarización global devuelve los mismos resultados que se obtienen sin estandarización. Es probable que sea necesario reconstruir los modelos creados con versiones anteriores de ArcGIS que utilizan la opción Estandarización global.

Sintaxis

HighLowClustering_stats (Input_Feature_Class, Input_Field, Generate_Report, Conceptualization_of_Spatial_Relationships, Distance_Method, Standardization, Distance_Band_or_Threshold_Distance, {Weights_Matrix_File})

Parámetro	Explicación	Tipo de datos
Input_Feature_Class	La clase de entidad para la cual se calculará la estadística G general.	Feature Layer
Input_Field	El campo numérico que se evaluará.	Field
Generate_Report	NO_REPORT —No se crea un resumen gráfico (predeterminado). GENERATE_REPORT —Se crea un resumen gráfico como un archivo HTML.	Boolean
Conceptualization_of_Spatial_Relationships	Especifica cómo se conceptualizan las relaciones espaciales entre las entidades. INVERSE_DISTANCE —Las entidades vecinas tienen mayor influencia sobre los cálculos de una entidad de destino que las entidades que están alejadas. INVERSE_DISTANCE_SQUARED —Es igual que INVERSE_DISTANCE excepto que la pendiente es más nítida, de modo que la influencia cae en forma más rápida y sólo los vecinos más cercanos de la entidad de destino ejercerán una influencia sustancial en los cálculos de esa entidad. FIXED_DISTANCE_BAND —Cada entidad se analiza dentro del contexto de las entidades vecinas. Las entidades vecinas dentro de la distancia crítica especificada reciben un peso de 1, y ejercen influencia sobre los cálculos de la entidad de destino. Las entidades vecinas fuera de la distancia crítica reciben un peso de cero y no tienen influencia sobre los cálculos de una entidad de destino. ZONE_OF_INDIFFERENCE —Las entidades dentro de la distancia crítica especificada de una entidad de destino reciben un peso de 1 y ejercen influencia sobre los cálculos de esa entidad. Una vez que se excede la distancia crítica, los pesos (y la influencia que una entidad vecina tiene sobre los cálculos de una entidad de destino) disminuyen con la distancia. POLYGON_CONTIGUITY_(FIRST_ORDER) —Sólo las entidades de polígono vecinas que comparten un límite tendrán influencia sobre los cálculos de la entidad poligonal de destino. (Se requiere una licencia de ArcInfo) GET_SPATIAL_WEIGHTS_FROM_FILE —Las relaciones espaciales se definen en un archivo de ponderaciones espaciales. La ruta al archivo de ponderaciones espaciales se especifica en el parámetro Archivo de matriz de ponderaciones.	String
Distance_Method	Especifica cómo se calculan las distancias desde cada entidad hasta las entidades vecinas. EUCLIDEAN_DISTANCE —La distancia en línea recta entre dos puntos MANHATTAN_DISTANCE —La distancia entre dos puntos medida a lo largo de los ejes en ángulos rectos (manzana); se calcula al sumar la diferencia (absoluta) entre las coordenadas x e y	String
Standardization	Se recomienda la estandarización de filas siempre que la distribución de las entidades esté potencialmente influenciada debido al diseño de muestreo o a un esquema de agregación impuesto. NINGUNO —No se aplica la estandarización de ponderaciones espaciales. ROW —Las ponderaciones espaciales se estandarizan; cada peso se divide por la suma de su fila (la suma de los pesos de todas las entidades vecinas).	String
Distance_Band_or_Threshold_Distance	Especifica una distancia de valor límite para las opciones Distancia inversa y Distancia fija. Las entidades que están fuera del valor límite especificado para una entidad de destino se ignoran en el análisis de esa entidad. Sin embargo, para la Zona de indiferencia, la influencia de las entidades que están fuera de la distancia dada se reduce con la distancia, mientras que aquellas que están dentro del umbral de distancia se consideran por igual. El valor introducido debe coincidir con el del sistema de coordenadas de salida. Para las conceptualizaciones de relaciones espaciales de la Distancia inversa, un valor de 0 indica que no se aplica una distancia de umbral; cuando este parámetro se deja en blanco, se calcula y se aplica un valor de umbral predeterminado. Este valor predeterminado es la distancia euclidiana que garantiza que cada entidad tenga como mínimo un vecino. Este parámetro no tiene efecto cuando se seleccionan las conceptualizaciones espaciales Contigüidad de polígono u Obtener ponderaciones espaciales a partir del archivo.	Double
Weights_Matrix_File (Opcional)	La ruta a un archivo que contiene las ponderaciones espaciales que definen las relaciones espaciales entre las entidades.	File

Ejemplo de código

Ejemplo 1 de HighLowClustering (ventana de Python)

La siguiente secuencia de comandos de la ventana de Python muestra cómo utilizar la herramienta Clustering alto/bajo.

import arcpy arcpy.env.workspace = r"C:\data" arcpy.HighLowClustering_stats("911Count.shp", "ICOUNT","false", "GET_SPATIAL_WEIGHTS_FROM_FILE","EUCLIDEAN_DISTANCE", "NONE","#", "euclidean6Neighs.swm")

Ejemplo 2 de HighLowClustering (secuencia de comandos de Python independiente)

La siguiente secuencia de comandos independiente de la ventana de Python muestra cómo utilizar la herramienta Clustering alto/bajo.

 # Analyze the spatial distribution of 911 calls in a metropolitan area # using the High/Low Clustering (Getis-Ord General G) tool   # Import system modules import arcpy   # Set the geoprocessor object property to overwrite existing outputs arcpy.gp.overwriteOutput = True   # Local variables... workspace = r"C:\Data"  try:     # Set the current workspace (to avoid having to specify the full path to the feature classes each time)     arcpy.env.workspace = workspace      # Copy the input feature class and integrate the points to snap     # together at 500 feet     # Process: Copy Features and Integrate     cf = arcpy.CopyFeatures_management("911Calls.shp", "911Copied.shp",                          "#", 0, 0, 0)      integrate = arcpy.Integrate_management("911Copied.shp #", "500 Feet")      # Use Collect Events to count the number of calls at each location     # Process: Collect Events     ce = arcpy.CollectEvents_stats("911Copied.shp", "911Count.shp", "Count", "#")      # Add a unique ID field to the count feature class     # Process: Add Field and Calculate Field     af = arcpy.AddField_management("911Count.shp", "MyID", "LONG", "#", "#", "#", "#",                      "NON_NULLABLE", "NON_REQUIRED", "#",                      "911Count.shp")          cf = arcpy.CalculateField_management("911Count.shp", "MyID", "[FID]", "VB")      # Create Spatial Weights Matrix for Calculations     # Process: Generate Spatial Weights Matrix...      swm = arcpy.GenerateSpatialWeightsMatrix_stats("911Count.shp", "MYID",                         "euclidean6Neighs.swm",                         "K_NEAREST_NEIGHBORS",                         "#", "#", "#", 6,                         "NO_STANDARDIZATION")       # Cluster Analysis of 911 Calls     # Process: High/Low Clustering (Getis-Ord General G)     hs = arcpy.HighLowClustering_stats("911Count.shp", "ICOUNT",                          "false",                          "GET_SPATIAL_WEIGHTS_FROM_FILE",                         "EUCLIDEAN_DISTANCE", "NONE",                         "#", "euclidean6Neighs.swm")  except:     # If an error occurred when running the tool, print out the error message.     print arcpy.GetMessages()

Entornos

Espacio de trabajo actual, Espacio de trabajo temporal, Sistema de coordenadas de salida

Temas relacionados

Vista general del conjunto de herramientas Análisis de patrones

Modelado de relaciones espaciales

¿Qué es una puntuación z? ¿Qué es un valor P?

Utilizar la ventana Resultados

Autocorrelación espacial (I de Moran global)

Análisis de punto caliente (Gi* de Getis-Ord)

Ponderaciones espaciales

Cómo funciona Clustering alto/bajo (G general de Getis-Ord)

Información de licencia

ArcView: Sí

ArcEditor: Sí

ArcInfo: Sí

7/11/2012