Cómo funciona Análisis de punto caliente (Gi* de Getis-Ord)
La herramienta Análisis de punto caliente calcula la estadística Gi* de Getis-Ord (que se pronuncia G-i-estrella) para cada entidad en un dataset. Las puntuaciones z y los valores P resultantes indican dónde se agrupan espacialmente las entidades con valores altos o bajos. Esta herramienta funciona mediante la búsqueda de cada entidad dentro del contexto de entidades vecinas. Una entidad con un valor alto es interesante, pero es posible que no sea un punto caliente estadísticamente significativo. Para ser un punto caliente estadísticamente significativo, una entidad debe tener un valor alto y también estar rodeada por otras entidades con valores altos. La suma local para una entidad y sus vecinos se compara proporcionalmente con la suma de todas las entidades; cuando la suma local es muy diferente de la esperada, y esa diferencia es demasiado grande como para ser el resultado de una opción aleatoria, se obtiene como consecuencia una puntuación z estadísticamente significativa.
Cálculos
Interpretación
La estadística Gi* devuelta para cada entidad en el dataset es una puntuación z. Para las puntuaciones z positivas que son estadísticamente significativas, mientras más grande es la puntuación z, más intenso es el clustering de valores altos (punto caliente). Para las puntuaciones z negativas que son estadísticamente significativas, mientras más pequeña es la puntuación z, más intenso es el clustering de valores bajos (punto frío). Para obtener más información sobre cómo determinar la significancia estadística, consulte ¿Qué es una puntuación z? ¿Qué es un valor P?.
Salida
Esta herramienta crea una nueva Clase de entidad de salida con una puntuación z y un valor P para cada entidad en la Clase de entidad de entrada. Si hay un conjunto de selección aplicado a la Clase de entidad de entrada, sólo se analizarán las entidades seleccionadas y sólo ellas aparecerán en la Clase de entidad de salida. Esta herramienta también devuelve los nombres de los campos de puntuación z y de valor P como valores de salida derivados para su uso potencial en modelos y secuencias de comandos personalizados.
Cuando esta herramienta se ejecuta en ArcMap, la Clase de entidad de salida se agrega automáticamente a la tabla de contenido con una representación predeterminada aplicada al campo de puntuación z. La representación cálida a fría aplicada está definida en un archivo de capa en <ArcGIS>/ArcToolbox/Templates/Layers. Puede volver a aplicar la representación predeterminada, de ser necesario, al importar la simbología de capa de plantilla.
Consideraciones del Análisis de punto caliente
Se deben considerar tres factores al realizar un análisis de punto caliente:
- ¿Cuál es el Campo de análisis (Campo de entrada)? La herramienta de análisis de punto caliente evalúa si los valores altos o bajos (por ejemplo, la cantidad de delitos, la gravedad de los accidentes o el dinero utilizado en la exportación de productos) se agrupan espacialmente. El campo que contiene esos valores es el Campo de análisis. Sin embargo, para los datos de incidentes de punto, puede estar más interesado en evaluar la intensidad del incidente que en analizar el clustering espacial de cualquier valor en particular asociado con los incidentes. En ese caso, deberá agregar los datos del incidente antes del análisis. Hay varias maneras de realizar esto:
- Si tiene entidades de polígono para el área de estudio, puede utilizar la herramienta Unión espacial para contar el número de eventos de cada polígono. El campo resultante que contiene el número de eventos de cada polígono se convierte en el Campo de entrada para el análisis.
- Utilice la herramienta Crear red para construir una cuadrícula de polígonos sobre las entidades de punto. A continuación, utilice la herramienta Unión espacial para contar el número de eventos que caen dentro de cada polígono de la cuadrícula. Quite los polígonos de la cuadrícula que estén fuera del área de estudio. Además, en los casos en los que varios de los polígonos de la cuadrícula dentro del área de estudio contienen cero para el número de eventos, aumente el tamaño de la cuadrícula de polígonos, si es apropiado, o quite los polígonos de la cuadrícula que tienen cero antes del análisis.
- Como alternativa, si tiene un número de puntos coincidentes o puntos que están a una corta distancia entre sí, puede utilizar Integrar con la herramienta Adquirir eventos para (1) alinear entre sí entidades que están dentro de una distancia especificada y después, (2) crear una nueva clase de entidad que contenga un punto en cada ubicación única con un atributo de cantidad asociado que indique el número de eventos/puntos alineados. Utilice el campo ICOUNT resultante como Campo de entrada para el análisis. Nota:
Si le preocupa que los puntos coincidentes puedan ser registros redundantes, la herramienta Buscar idéntico le puede ayudar a localizar y eliminar los duplicados.
- ¿Qué Conceptualización de relaciones espaciales es adecuada? ¿Cuál es el mejor valor de Banda de distancia o distancia de umbral?
La Conceptualización de relaciones espaciales recomendada (y predeterminada) para la herramienta Análisis de punto caliente (Gi* de Getis-Ord) es la Banda de distancia fija. También pueden funcionar bien Zona de indiferencia, Contigüidad, Vecino más próximo K y Triangulación de Delaunay. Para ver un análisis sobre las mejores prácticas y estrategias para determinar un valor de distancia del análisis, consulte Seleccionar una conceptualización de relaciones espaciales y Seleccionar una distancia fija.
- ¿Cuál es la pregunta?
Esto puede parecer obvio, pero el modo en que construye el Campo de entrada para el análisis determina los tipos de preguntas que puede realizar. ¿Le interesa más determinar los lugares donde hay muchos incidentes o dónde se agrupan espacialmente los valores altos/bajos para un atributo en particular? Si es así, ejecute Análisis de punto caliente en los conteos de valores o incidentes originales. Este tipo de análisis es útil particularmente para el tipo de problema de asignación de recursos. Como alternativa (o también), puede estar interesado en localizar áreas con valores altos inesperados en relación con alguna otra variable. Por ejemplo, si analiza ejecuciones hipotecarias, es probable que espere que haya más ejecuciones hipotecarias en lugares donde hay más viviendas (dicho de otra forma, de algún modo espera que la cantidad de ejecuciones hipotecarias sea una función de la cantidad de viviendas). Si divide la cantidad de ejecuciones hipotecarias por la cantidad de viviendas, y después ejecuta la herramienta Análisis de punto caliente en esta relación, ya no pregunta ¿dónde hay muchas ejecuciones hipotecarias?, sino ¿dónde hay una gran cantidad inesperada de ejecuciones hipotecarias, dada la cantidad de viviendas? Al crear una tasa o relación antes del análisis, puede controlar ciertas relaciones esperadas (por ejemplo, la cantidad de delitos es una función de la población; la cantidad de ejecuciones hipotecarias es una función del total de viviendas) e identificar los puntos calientes/fríos inesperados.
Pautas de mejores prácticas
- ¿La Clase de entidad de entrada contiene al menos 30 entidades? Los resultados no son fiables con menos de 30 entidades.
- ¿Es adecuada la Conceptualización de relaciones espaciales que seleccionó? Para esta herramienta, se recomienda el método Banda de distancia fija. Vea Seleccionar una conceptualización de relaciones espaciales.
- ¿Es adecuada la Banda de distancia o distancia de umbral? Consulte Seleccionar una distancia fija.
- Todas las entidades deben tener al menos un vecino.
- Ninguna entidad debe tener todas las demás entidades como un vecino.
- Especialmente si los valores para el Campo de entrada están sesgados, querrá que las entidades tengan aproximadamente ocho vecinos cada una.
Potenciales aplicaciones
Se pueden encontrar aplicaciones en el análisis de delitos, la epidemiología, el análisis del patrón de votación, la geografía económica, el análisis de venta minorista, el análisis de incidentes de tráfico y la información demográfica. A continuación presentamos algunos ejemplos:
- ¿Dónde se concentra el brote de la enfermedad?
- Los incendios de cocina, ¿dónde constituyen una proporción de incendios residenciales mayor que la esperada?
- ¿Dónde se deben ubicar los sitios de evacuación?
- ¿Dónde/cuándo ocurren las máximas intensidades?
Recursos adicionales
Mitchell, Andy. La Guía de ESRI para el análisis SIG, Volumen 2.ESRI Press, 2005.
Getis, A. y J.K. Ord. 1992. "The Analysis of Spatial Association by Use of Distance Statistics" en Geographical Analysis 24(3).
Ord, J.K. y A. Getis. 1995. "Local Spatial Autocorrelation Statistics: Distributional Issues and an Application" en Geographical Analysis 27(4).
Vídeos breves de Análisis de punto caliente
- Parte 1: Choosing a Conceptualization of Spatial Relationships
- Parte 2: Choosing an Appropriate Distance Band
- Parte 3: Understanding Your Results
- Hot Spot Analysis of 911 Emergency Call Data (seleccione Using Spatial Statistics Tools)
Scott, L. y N. Warmerdam. Extend Crime Analysis with ArcGIS Spatial Statistics Tools en ArcUser Online, abril a junio de 2005.