Cómo funciona Generar matriz de ponderaciones espaciales
El uso de la estadística espacial no implica la aplicación de métodos estadísticos tradicionales (no espaciales) a datos que son espaciales por casualidad (que tienen coordenadas x e y). La estadística espacial integra el espacio y las relaciones espaciales directamente en sus cálculos matemáticos (área, distancia, longitud, etc.). Para muchas estadísticas espaciales, estas relaciones espaciales se especifican formalmente a través de un archivo o una tabla de matriz de ponderaciones espaciales.
Una matriz de ponderaciones espaciales es una representación de la estructura espacial de los datos. Es una cuantificación de las relaciones espaciales que existen entre las entidades del dataset (o, al menos, una cuantificación del modo en el que se conceptualizan esas relaciones). Debido a que la matriz de ponderaciones espaciales impone una estructura en los datos, debe seleccionar una conceptualización que refleje lo mejor posible el modo en que las entidades realmente interactúan entre sí (teniendo en cuenta, por supuesto, qué es lo que intenta medir). Si mide el clustering de una especie de árbol en particular que se reproduce mediante la semilla en el bosque, por ejemplo, alguna forma de distancia inversa probablemente sea la más apropiada. Sin embargo, si evalúa la distribución geográfica de los viajeros de una región, el tiempo de viaje o el coste de viaje pueden ser mejores opciones.
Mientras que se implementa físicamente de diversas maneras, conceptualmente, la matriz de ponderaciones espaciales es una tabla NxN (N es el número de entidades en el dataset). Hay una fila y una columna para cada entidad. El valor de la celda para cualquier combinación de fila/columna dada es la ponderación que cuantifica la relación espacial entre dichas entidades de fila y columna.
En el nivel más básico, existen dos estrategias para crear pesos que cuantifiquen las relaciones entre las entidades de datos: ponderaciones binarias y variables. Para las estrategias binarias (distancia fija, K vecinos más próximos o contigüidad) una entidad es un vecino (1) o no lo es (0). Para las estrategias ponderadas (distancia inversa o zona de indiferencia), las entidades vecinas tienen un impacto (o influencia) que varía y los pesos se calculan para reflejar esa variación.
En base a las especificaciones del parámetro, la herramienta Generar matriz de ponderaciones espaciales crea un archivo (.swm) de matriz de ponderaciones espaciales en formato binario little endian. Los valores de las relaciones espaciales en ese archivo se almacenan mediante técnicas de matriz dispersa para minimizar el espacio en disco, la memoria del equipo y la cantidad de cálculos requeridos. Estos valores de relación se utilizan en los cálculos matemáticos de varias herramientas de estadística espacial, incluidas Autocorrelación espacial (I de Moran global), Análisis de punto caliente (Gi* de Getis-Ord) y Análisis de cluster y de valor atípico (I Anselin local de Moran). Mientras que el archivo de matriz de ponderaciones espaciales puede almacenar relaciones espaciales NxN, en la mayoría de los casos, cada entidad sólo debe estar relacionada con un grupo pequeño de entidades. La metodología dispersa aprovecha esta situación al almacenar sólo relaciones distintas de cero.
Es posible que la memoria sea insuficiente cuando se utiliza un archivo .swm. Por lo general, esto sucede cuando selecciona una Conceptualización de relaciones espaciales o una Banda de distancia o distancia de umbral, que genera entidades con una gran cantidad de vecinos que niegan la naturaleza dispersa del archivo .swm. Generalmente, no desea crear una matriz de ponderaciones espaciales donde cada entidad tiene miles de vecinos. Desea que todas las entidades tengan como mínimo un vecino y que casi todas las entidades tengan como mínimo ocho vecinos. Puede garantizar que cada entidad tenga una cantidad mínima de vecinos especificada al precisar ese valor mínimo para el parámetro Cantidad de vecinos.
Recursos adicionales
Mitchell, Andy. La Guía de Esri para el análisis SIG, Volumen 2. Esri Press, 2005.
Getis, Arthur y Jared Aldstadt. Constructing the spatial weights matrix using a local statistic. Geographical Analysis, 36(2): 90–104, 2004.