Modelado de relaciones espaciales
Este documento proporciona información adicional sobre los parámetros de la herramienta pero además introduce vocabulario y conceptos esenciales que son importantes cuando analiza los datos mediante las Herramientas de estadística espacial.
Siempre que la distancia sea un componente de su análisis, que es casi siempre el caso con las Herramientas de estadística espacial, proyecte los datos con un sistema de coordenadas proyectadas (en lugar de un sistema de coordenadas geográficas basado en grados, minutos, segundos).
Conceptualización de relaciones espaciales
Una diferencia importante entre las estadísticas espaciales y tradicionales (no espaciales) es que las estadísticas espaciales integran relaciones espaciales y espacio directamente en sus operaciones matemáticas. Por consiguiente, muchas de las herramientas en la caja de herramientas de estadística espacial requieren que el usuario seleccione un valor para el parámetro Conceptualización de relaciones espaciales antes del análisis. Las conceptualizaciones comunes incluyen distancia inversa, tiempo de viaje, distancia fija, vecinos K más próximos y contigüidad. La conceptualización de las relaciones espaciales que utiliza dependerá de lo que mida. Si mide el clustering de una especie de planta en particular que se reproduce mediante la semilla, por ejemplo, la distancia inversa probablemente sea la más apropiada. Sin embargo, si evalúa la distribución geográfica de los viajeros de una región, el tiempo de viaje o el coste de viaje pueden ser mejores opciones para describir esas relaciones espaciales. Para algunos análisis, el espacio y el tiempo pueden ser menos importante que los conceptos más abstractos como la familiaridad (cuanto más familiar sea algo, más cerca estará funcionalmente) o la interacción espacial (hay muchas más llamadas telefónicas, por ejemplo, entre Los Ángeles y Nueva York que entre Nueva York y una ciudad más pequeña cercana a Nueva York, como Poughkeepsie; algunos pueden sostener que Los Ángeles y Nueva York están más cerca funcionalmente).
A continuación, se describen las opciones para el parámetro Conceptualización de relaciones espaciales. La opción que selecciona determina las relaciones de vecino para las herramientas que evalúan cada entidad dentro del contexto de las entidades vecinas. Estas herramientas incluyen las herramientas Autocorrelación espacial (I de Moran global), Análisis de punto caliente (Gi* de Getis-Ord) y Análisis de cluster y de valor atípico (I Anselin local de Moran). Tenga en cuenta que algunas de estas opciones sólo están disponibles si utiliza las herramientas Generar matriz de ponderaciones espaciales o Generar pesos espaciales de red.
Distancia inversa, distancia inversa cuadrada (Impedancia)
Con las opciones de Distancia inversa, el modelo conceptual de las relaciones espaciales es uno de impedancia o disminución de la distancia. Todas las entidades afectan/influyen en todas las otras entidades, pero cuanto más lejos esté algo, menor impacto tendrá. Por lo general deseará especificar un valor Banda de distancia o distancia de umbral cuando utiliza una conceptualización de distancia inversa para reducir el número de cómputos requeridos, especialmente con grandes datasets. Cuando no se especifica banda de distancia o distancia de umbral, se calcula un valor de umbral predeterminado. Puede forzar todas las entidades para que sean vecinas de las demás entidades al configurar la Banda de distancia o distancia de umbral en cero.
La distancia euclidiana inversa es apropiada para modelar datos continuos como, por ejemplo, variaciones de temperatura. La distancia de Manhattan inversa puede funcionar mejor cuando el análisis involucra las ubicaciones de tiendas de hardware u otras instalaciones urbanas fijas, en el caso donde los datos de red de carreteras no están disponibles. El modelo conceptual cuando utiliza la opción Distancia inversa cuadrada es el mismo que con Distancia inversa excepto que la pendiente es más nítida para que el vecino influya en la caída en forma más rápida y sólo los vecinos más cercanos de la entidad de destino ejercerán una influencia sustancial en los cálculos de esa entidad.
Banda de distancia (esfera de influencia)
Para algunas herramientas, como Análisis de punto caliente, una banda de distancia fija es la conceptualización predeterminada de las relaciones espaciales. Con la opción Banda de distancia fija, impone una "esfera de influencia" o modelo conceptual de la ventana en movimiento de las interacciones espaciales en los datos. Cada entidad se analiza dentro del contexto de esas entidades vecinas ubicadas dentro de la distancia que especifica para la Banda de distancia o distancia de umbral. Los vecinos dentro de la distancia especificada se ponderan por igual. Las entidades fuera de la distancia especificada no influyen en los cálculos (su peso es cero). Utilice el método Banda de distancia fija cuando desee evaluar las propiedades estadísticas de sus datos en una escala espacial (fija) particular. Si estudia los patrones de viajes y sabe que el viaje promedio para trabajar es de 15 millas, por ejemplo, es posible que desee utilizar una distancia fija de 15 millas para su análisis. Consulte Seleccionar una distancia fija.
Zona de indiferencia
La opción Zona de indiferencia para el parámetro Conceptualización de relaciones espaciales combina los modelos Distancia inversa y Banda de distancia fija. Las entidades dentro de la banda de distancia o distancia de umbral se incluyen en los análisis para la entidad de destino. Una vez que se excede la distancia crítica, el nivel de influencia (la ponderación) cae rápidamente. Supongamos que está buscando trabajo y tiene la opción entre un trabajo a 5 millas y otro trabajo a 6 millas. Probablemente no pensará mucho sobre la distancia al tomar la decisión sobre qué trabajo tomar. Ahora, supongamos que tiene la opción entre un trabajo a 5 millas y otro a 20 millas. En este caso, la distancia se convierte más en una impedancia y puede contribuir a la toma de la decisión. Utilice este método cuando desea mantener la escala de análisis fija pero no desea imponer límites nítidos en las entidades vecinas incluidas en los cálculos de la entidad de destino.
Contigüidad de polígono (primer orden)
Para las clases de entidad poligonal, puede elegir contigüidad de primer orden. Los polígonos que comparten un borde (tienen límites coincidentes) se incluyen en los cálculos para el polígono de destino. Los polígonos que no comparten un borde se excluyen de los cálculos de la entidad de destino. Esta opción también se denomina Bordes de contigüidad de polígono solamente. Los bordes y esquinas de contigüidad de polígono (disponibles mediante la herramienta Generar matriz de ponderaciones espaciales) construyen vecinos a partir de polígonos que comparten un límite (borde) o una esquina (nodo). Utilice una de estas conceptualizaciones de contigüidad con entidades poligonales en casos donde modela algún tipo de proceso contagioso o trata con datos continuos representados como polígonos.
K vecinos más próximos
Las relaciones de vecino también se pueden construir de manera que cada entidad se evalúe dentro del contexto espacial de un número fijo de vecinos más cercanos. Si K (el número de vecinos) es 8, los ocho vecinos más cercanos a la entidad de destino se incluirán en los cálculos para esa entidad. En las ubicaciones donde la densidad de la entidad es alta, el contexto espacial del análisis será más pequeño. Del mismo modo, en las ubicaciones donde la densidad de la entidad es escasa, el contexto espacial para el análisis será más grande. Una ventaja para este modelo de relaciones espaciales es que asegura que habrá algunos vecinos para cada entidad de destino, aún cuando las densidades de la entidad varían ampliamente en el área de estudio. Este método está disponible con la herramienta Generar matriz de ponderaciones espaciales.
Triangulación de Delaunay (vecinos naturales)
La opción Triangulación de Delaunay construye vecinos al crear triángulos de Voronoi a partir de entidades de puntos o centroides de la entidad ya que cada punto/centroide es un nodo de triángulo. Los nodos conectados mediante un borde de triángulo se consideran vecinos. Utilizar la triangulación de Delaunay garantiza que cada entidad tendrá al menos un vecino aún cuando los datos incluyan islas o densidades de entidades que varían ampliamente. Este método está disponible con la herramienta Generar matriz de ponderaciones espaciales.
Obtener ponderaciones espaciales a partir del archivo (relaciones espaciales definidas por el usuario)
También puede proporcionar una ruta al archivo de texto con formato ASCII que define su propia conceptualización personalizada de relaciones espaciales (basado en la interacción espacial, por ejemplo). Si desea definir relaciones espaciales mediante el tiempo de viaje o los costes de viaje que derivan de un dataset de red, cree un archivo de matriz de ponderaciones espaciales con la herramienta Generar pesos espaciales de red, después utilice el archivo .swm resultante para su análisis. También puede construir un archivo de matriz de ponderaciones espaciales con la herramienta Generar matriz de ponderaciones espaciales. Si las relaciones espaciales para las entidades se definen en una tabla, puede utilizar la herramienta Generar matriz de ponderaciones espaciales para convertir esa tabla en un archivo (.swm) de matriz de ponderaciones espaciales. Se requieren Campos particulares para convertir una tabla en un archivo .swm.
Seleccionar una conceptualización de relaciones espaciales: Mejores prácticas
Cuanto más pueda modelar de manera realista cómo interactúan mutuamente las entidades en el espacio, más precisos serán sus resultados. Su elección del parámetro Conceptualización de relaciones espaciales deberá reflejar relaciones inherentes entre las entidades que analiza. A veces, la elección también estará influenciada por características de los datos.
Por ejemplo, los métodos distancia inversa son más apropiados con datos continuos o para modelar procesos en los que cuanto más cerca estén dos entidades en el espacio, más probabilidad hay de que interactúen/se influencien una con otra. Con esta conceptualización espacial, cada entidad es potencialmente vecina de la otra entidad, y con grandes datasets, el número de cálculos involucrados será enorme. Siempre debería tratar de incluir un valor Banda de distancia o distancia de umbral cuando utilice las conceptualizaciones de distancia inversa. Esto es particularmente importante para datasets grandes. Si deja el parámetro Banda de distancia o distancia de umbral vacío, se calculará una distancia de umbral, pero ésta probablemente no sea la distancia más apropiada para el análisis; el umbral de distancia predeterminado será la distancia mínima que garantiza que cada entidad tenga al menos un vecino.
El método banda de distancia fija funciona bien para los datos de polígono donde hay una gran variación en el tamaño del polígono (polígonos muy grandes en el borde del área de estudio y polígonos muy pequeños en el centro del área de estudio, por ejemplo). También se recomienda Banda de distancia fija para los datos de punto cuando se ejecuta el Análisis de punto caliente (Gi* de Getis-Ord). Consulte Seleccionar una distancia fija a continuación para ver las estrategias que lo ayudan a determinar una banda de distancia apropiada para su análisis.
La conceptualización zona de indiferencia funciona bien cuando la Distancia fija es apropiada, pero imponer límites nítidos en las relaciones de vecindad no es una representación precisa de los datos. Tenga en cuenta que el modelo conceptual Zona de indiferencia considera que cada entidad es vecina de la otra entidad. Esta opción no es apropiada para grandes datasets ya que el valor Banda de distancia o distancia de umbral suministrado no limita el número de vecinos pero sólo especifica dónde comienza a disminuir la intensidad de las relaciones espaciales.
Las conceptualizaciones de contigüidad de polígono son efectivas cuando los polígonos son similares en tamaño y distribución y cuando las relaciones espaciales son una función de la proximidad del polígono (la idea de que si dos polígonos comparten un límite, la interacción espacial entre ellos aumenta). Cuando selecciona una conceptualización de contigüidad de polígono, casi siempre deseará seleccionar estandarización de filas para las herramientas que tienen el parámetro Estandarización de filas.
La opción K vecinos más cercanos es efectiva cuando desea asegurarse de que tiene un número mínimo de vecinos para el análisis. Especialmente cuando los valores asociados con sus entidades están sesgados (no están distribuidos normalmente), es importante que cada entidad se evalúe dentro del contexto de al menos ocho vecinos (esta es solamente una regla general). Cuando la distribución de los datos varía en el área de estudio de manera que algunas entidades están lejos de las demás entidades, este método funciona bien. Sin embargo, tenga en cuenta que el contexto espacial del análisis cambia según las variaciones en la escasez/densidad de las entidades. Cuando fijar la escala de análisis es menos importante que fijar la cantidad de vecinos, el método K vecinos más próximos es apropiado.
Algunos analistas consideran que la triangulación de Delaunay es una forma de construir vecinos naturales para un conjunto de entidades. Este método es una buena opción cuando los datos incluyen polígonos de isla (polígonos aislados que no comparten ningún límite con otros polígonos) o en casos donde hay una distribución espacial muy despareja de entidades. Similar al método K vecinos más próximos, la triangulación de Delaunay garantiza que cada entidad tenga al menos un vecino pero utiliza la distribución de los datos para determinar cuántos vecinos tiene cada una.
Para algunas aplicaciones, la interacción espacial se modela mejor en términos del tiempo de viaje o de la distancia de viaje. Si modela la accesibilidad a los servicios urbanos, por ejemplo, o busca los puntos calientes de delitos urbanos, una buena opción es modelar las relaciones espaciales en términos de una red. Utilice la herramienta Generar pesos espaciales de red para crear un archivo de matriz de ponderaciones espaciales (.swm) antes del análisis; seleccione GET_SPATIAL_WEIGHTS_FROM_FILE para el valor Conceptualización de relaciones espaciales; a continuación, para el parámetro Archivo de matriz de ponderaciones, proporcione la ruta completa del archivo .swm que creó.
Esri Data & Maps, gratuito para los usuarios de ArcGIS, contiene datos del mapa de calle que incluyen un dataset de red creado previamente en el formato SDC. Este dataset tiene cobertura en los Estados Unidos y Canadá. Estos datasets de red se pueden utilizar directamente mediante la herramienta Generar pesos espaciales de red.
Si ninguna de las opciones del parámetro Conceptualización de relaciones espaciales funciona bien para el análisis, puede crear un archivo de texto ASCII o una tabla con las relaciones de entidad a entidad y utilizar éstas para crear un archivo de matriz de ponderaciones espaciales. También es posible editar los archivos de matriz de ponderaciones espaciales.
Seleccionar un valor de banda de distancia fija
Considere la banda de distancia fija que selecciona como una ventana en movimiento que momentáneamente se establece en la parte superior de cada entidad y observa esa entidad dentro del contexto de sus vecinos. Hay varias pautas para ayudarlo a identificar una banda de distancia apropiada para el análisis:
- Seleccione una distancia basado en lo que sabe sobre la extensión geográfica de los procesos espaciales que promocionan el clustering para los fenómenos que está estudiando. Por lo general, no lo sabrá, pero si lo sabe, debe utilizar su conocimiento para seleccionar un valor de distancia. Supongamos, por ejemplo, que sabe que la distancia de viaje promedio al trabajo es de 15 millas. Utilizar 15 millas para la banda de distancia es una buena estrategia para analizar los datos de viajes.
- Utilice una banda de distancia que sea lo suficientemente grande para garantizar que todas las entidades tendrán al menos un vecino. Especialmente si los datos de entrada están sesgados (no crean una buena curva de campana cuando traza los valores como un histograma), deseará asegurarse de que la banda de distancia no sea ni demasiado pequeña (la mayoría de las entidades sólo tienen uno o dos vecinos) ni demasiado grande (varias entidades incluyen todas las demás entidades como vecinos), ya que eso haría que las puntuaciones z resultantes sean menos confiables. Las puntuaciones z son confiables (aún con datos sesgados) siempre y cuando la banda de distancia sea lo suficientemente grande para garantizar varios vecinos (aproximadamente 8) para cada entidad.
- Utilice una banda de distancia que refleje una autocorrelación espacial máxima. Siempre que vea clustering espacial en el apaisado, ve evidencia de procesos espaciales subyacentes en el trabajo. La banda de distancia que exhibe clustering máximo, medida con las herramientas Autocorrelación espacial (I de Moran global) o Análisis cluster espacial de distancia múltiple (Función K de Ripley), es la distancia donde esos procesos espaciales son más "activos" o más marcados. Ejecute la herramienta Autocorrelación espacial en múltiples distancias (0,5; 1,0; 1,5 millas, y así sucesivamente) y observe dónde parece alcanzar el nivel más alto la puntuación z resultante. Utilice la distancia asociada con el valor máximo para el análisis. Alternativamente, si trabaja con datos de incidentes, ejecute el Análisis cluster espacial de distancia múltiple (Función K de Ripley) en los incidentes no agregados para obtener un rango de distancias e identificar dónde alcanza el nivel más alto la diferencia entre los valores K observados y esperados (el campo DiffK). Utilice la distancia asociada con la diferencia más grande para el análisis. Nota: Los valores de distancia se deben introducir con las mismas unidades que se especificaron mediante el sistema de coordenadas de salida del entorno de geoprocesamiento.
- Cada pico representa una distancia donde se marcan los procesos que promocionan el clustering espacial. Los picos múltiples son comunes. Por lo general, los picos asociados con distancias más grandes reflejan amplias tendencias (una amplia tendencia de Este a Oeste, por ejemplo, donde el Oeste es un punto caliente gigante y el Este es un punto frío gigante); en general, le interesarán más los picos asociados con distancias más pequeñas.
- Un pico que pasa desapercibido por lo general significa que hay varios procesos espaciales diferentes que operan en una variedad de escalas espaciales. Probablemente desee buscar otros criterios para determinar qué distancia fija utilizar para el análisis (quizás la distancia más efectiva para la solución).
- Si la puntuación z nunca alcanza el nivel más alto (en otras palabras, sigue aumentando) y si utiliza datos agregados (por ejemplo, condados), por lo general significa que el esquema de agregación es demasiado grueso; los procesos espaciales de interés operan en una escala que es menor que la escala de las unidades de agregación. Si puede pasar a una escala de análisis más pequeña (pasar de condados a distritos, por ejemplo), esto puede ayudar a encontrar un distancia máxima.
- Trate de no estancarse en la idea de que hay solamente una banda de distancia correcta. La realidad nunca es tan simple. Es más probable que haya procesos espaciales múltiples/que interactúan, que promocionan el clustering observado. En lugar de pensar que necesita una banda de distancia, piense en las herramientas de análisis de patrón como métodos efectivos para explorar las relaciones espaciales en múltiples escalas espaciales. Tenga en cuenta que cuando cambia la escala (cambia el valor de banda de distancia), puede hacer una pregunta diferente. Supongamos que observa los datos de ingresos. Con pequeñas bandas de distancia, puede examinar patrones de ingresos de vecinos, las distancias de escala media pueden reflejar patrones de ingresos de la comunidad o la cuidad, y las bandas de distancia más grandes resaltarían patrones de ingresos regionales amplios.
Método de distancia
Varias de las herramientas en la caja de herramientas Estadística espacial utilizan distancia en los cálculos. Estas herramientas le brindan la opción de la distancia euclidiana o de Manhattan.
- La distancia euclidiana se calcula como
D = sq root [(x1–x2)**2.0 + (y1–y2)**2.0]
donde (x1,y1) es la coordenada para el punto A, (x2,y2) es la coordenada para el punto B, y D es la distancia en línea recta entre los puntos A y B.
- La distancia de Manhattan se calcula como
D = abs(x1–x2) + abs(y1–y2)
donde (x1,y1) es la coordenada para el punto A, (x2,y2) es la coordenada para el punto B, y D es la diferencia vertical y horizontal entre los puntos A y B. Es la distancia que debe recorrer si está limitado al recorrido de Norte a Sur y de Este a Oeste solamente. Este método por lo general es más apropiado que la distancia euclidiana cuando el recorrido se limita a una red de calles y donde los costes de viaje de la red de calles real no están disponibles.
Auto potencial (campo que brinda un peso intrazonal)
Varias herramientas en la caja de herramientas Estadística espacial le permiten proporcionar un campo que representa el peso a utilizar para el auto potencial. La distancia o el peso entre una entidad y ella misma se denomina auto potencial. A veces este peso es cero, pero en algunos casos, es posible que desee especificar otro valor fijo o un valor diferente para cada entidad. Por ejemplo, si la conceptualización de relaciones espaciales se basa en distancias recorridas dentro y entre los distritos censales, puede decidir modelar el auto potencial para reflejar los costes de viaje intrazonales promedio basados en el tamaño del polígono:
dii = 0.5*[(Ai / π)**0.5]
donde dii es el coste de viaje asociado con el viaje intrazonal para la entidad de polígonoi, y Ai es el área asociada con la entidad de polígonoi.
Estandarización
Se recomienda la estandarización de filas siempre que la distribución de las entidades esté potencialmente influenciada debido al diseño de muestreo o a un esquema de agregación impuesto. Cuando se selecciona la estandarización de filas, cada peso se divide por la suma de las filas (la suma de los pesos de todas las entidades vecinas). Los pesos estandarizados de filas se utilizan con frecuencia con vecindades de distancia fija y casi siempre se utilizan para vecindades basadas en la contigüidad de polígono. Esto sirve para mitigar la influencia debido a las entidades que tienen distintas cantidades de vecinos. La estandarización de filas aumentará todos los pesos para que estén entre 0 y 1, lo que crea un esquema de peso relativo en lugar de absoluto. En cualquier momento que trabaje con entidades de polígono que representen límites administrativos, probablemente deseará elegir la opción Estandarización de filas.
Banda de distancia o distancia de umbral
Banda de distancia o distancia de umbral establece la escala de análisis para la mayoría de las conceptualizaciones de relaciones espaciales (por ejemplo, Distancia inversa, Banda de distancia fija). Es un valor numérico positivo que representa una distancia de valor límite. Las entidades que están fuera del valor límite especificado para una entidad de destino se ignoran en el análisis de esa entidad. Sin embargo, con Zona de indiferencia, la influencia de las entidades que están fuera de la distancia dada se reduce en relación a la proximidad, mientras que aquellas que están dentro del umbral de distancia se consideran por igual.
Elegir una distancia apropiada es importante. Algunas estadísticas espaciales requieren que cada entidad tenga al menos un vecino para que el análisis sea confiable. Si el valor que establece para la Banda de distancia o distancia de umbral es demasiado pequeño (de manera que algunas entidades no tienen vecinos), aparece un mensaje de advertencia que sugiere que vuelva a intentarlo con un valor de distancia más grande. La herramienta Calcular banda de distancia a partir de recuento de vecindad evaluará las distancias mínimas, promedio y máximas para una cantidad de vecinos especificada y puede ayudarle a determinar un valor de banda de distancia apropiada para utilizar para el análisis. Para obtener pautas adicionales, consulte también Seleccionar un valor de banda de distancia fija.
Cuando no se especifica ningún valor, se calcula una distancia de umbral predeterminada. La tabla a continuación indica cómo se comportan las distintas opciones del parámetro Conceptualización de relaciones espaciales para cada uno de los tres tipos de entradas posibles (los valores negativos no son válidos):
Distancia inversa, distancia inversa cuadrada |
Banda de distancia fija, zona de indiferencia |
Contigüidad de polígono, triangulación de Delaunay, K vecinos más próximos |
|
0 |
No se aplica umbral ni valor límite; cada entidad es vecina de la otra entidad. |
No válido. Se generará un error de runtime. |
Se ignora |
en blanco |
Se calcula una distancia predeterminada. Este valor predeterminado será la distancia mínima para garantizar que cada entidad tenga al menos un vecino. |
Se calcula una distancia predeterminada. Este valor predeterminado será la distancia mínima para garantizar que cada entidad tenga al menos un vecino. |
Se ignora |
número positivo |
El valor positivo especificado que no equivale a cero se utilizará como una distancia de valor límite; las relaciones de vecino sólo existirán entre las entidades dentro de esta distancia de una a otra. |
Para la Banda de distancia fija, sólo las entidades dentro de este valor límite especificado entre sí serán vecinos. Para la Zona de indiferencia, las entidades dentro de este valor límite especificado entre sí serán vecinos; las entidades fuera del valor límite también son vecinos, pero se les asigna un peso/influencia más pequeña a medida que aumenta la distancia. |
Se ignora. |
Cantidad de vecinos
Especifique un entero positivo para representar la cantidad de vecinos a incluir en el análisis para cada entidad de destino. Cuando el valor elegido para la conceptualización de relaciones espaciales es K vecinos más próximos, cada entidad de destino se evaluará dentro del contexto de las entidades K más cercanas (donde K es la cantidad de vecinos especificada). Para Distancia inversa o Banda de distancia fija, especificar un valor para el parámetro Cantidad de vecinos garantizará que cada entidad tenga un mínimo de K vecinos. Para la Contigüidad de polígono, el valor especificado para la Cantidad de vecinos sólo se aplica a polígonos de isla: los K polígonos más próximos a cada polígono de isla de destino se considerarán vecinos para el análisis.
Archivo de matriz de ponderaciones
Varias herramientas le permiten definir relaciones espaciales entre las entidades al proporcionar una ruta a un archivo de matriz de ponderaciones espaciales. Ponderaciones espaciales son números que reflejan la distancia, el tiempo u otro coste entre cada entidad y las demás entidades en el dataset. El archivo de matriz de ponderaciones espaciales se puede crear mediante la herramienta Generar matriz de ponderaciones espaciales o la herramienta Generar pesos espaciales de red, o puede ser un simple archivo ASCII.
Cuando el archivo de matriz de ponderaciones espaciales es un simple archivo de texto ASCII, la primera línea debe ser el nombre de un campo de Id. único. Esto le brinda la flexibilidad para utilizar cualquier campo numérico en su dataset como el Id. al generar este archivo; sin embargo, el campo de Id. debe ser tipo ENTERO y tener valores únicos para cada entidad. Después de la primera línea, se debe dar formato al archivo de ponderaciones espaciales en tres columnas:
- Desde ID de entidad
- Hasta ID de entidad
- Peso
Por ejemplo, supongamos que tiene tres gasolineras. El campo que utiliza como el campo de Id. se llama StationID, y los ID de entidad son 1, 2 y 3. Debe modelar las relaciones espaciales entre estas tres gasolineras mediante el tiempo de viaje en minutos. Puede crear un archivo ASCII que se vea de la siguiente manera:
StationID 1 1 0 1 2 1/10 1 3 1/7 2 1 1/10 2 3 1/20 3 1 1/6 3 2 1/15 3 3 0
Por lo general, cuando los pesos representan distancia o tiempo, se invierten (por ejemplo, 1/10 cuando la distancia es 10 milla ó 10 minutos) de manera que las entidades más cercanas tengan un peso mayor que las entidades que están más lejos. Observe en los pesos de arriba que la gasolinera 1 está a 10 minutos de la gasolinera 2. Tenga en cuenta también que el tiempo de viaje no es simétrico en este ejemplo (el viaje desde la gasolinera 1 a la gasolinera 3 dura 7 minutos, pero el viaje desde la gasolinera 3 a la gasolinera 1 sólo dura 6 minutos). Tenga en cuenta que el peso entre la gasolinera 1 y ella misma es cero y que no hay entrada para la gasolinera 2. Se supone que las entradas que faltan tienen un peso de 0.
Introducir los valores para el archivo de matriz de ponderaciones espaciales puede ser un trabajo tedioso, aún para los datasets pequeños. Un mejor método es utilizar la herramienta Generar matriz de ponderaciones espaciales o escribir una secuencia de comandos de Python rápida para realizar esta tarea.
Archivo de matriz de ponderaciones espaciales (.swm)
La herramienta Generar matriz de ponderaciones espaciales o Generar pesos espaciales de red creará un archivo de matriz de ponderaciones espaciales binario (.swm) que define las relaciones espaciales entre todas las entidades en el dataset basado en los parámetros que especifica.
Si tiene una tabla que define las relaciones espaciales entre las entidades en una clase de entidad, utilice la herramienta Generar matriz de ponderaciones espaciales para convertir la tabla en un archivo de matriz de ponderaciones espaciales (.swm). La tabla necesitará los siguientes campos:
Nombre de campo |
Descripción |
---|---|
<Nombre de campo de Id. único> |
Un campo de entero que existe en la clase de entidad de entrada con un Id. único para cada entidad. Esto es desde el Id. de entidad. |
NID |
Un campo de entero que contiene Id. de entidades vecinas. Esto es a Id. de entidad. |
PESO |
Este es el peso numérico que cuantifica la relación espacial entre desde y hasta las entidades. Los valores más grandes reflejan pesos más grandes y una influencia o interacción mas fuerte entre dos entidades. |
Compartir archivos de matriz de ponderaciones espaciales
La salida de las herramientas Generar matriz de ponderaciones espaciales y Generar pesos espaciales de red es un archivo .swm. Este archivo se vincula a la configuración de la clase de entidad de entrada, del campo de Id. único y del sistema de coordenadas de salida cuando se crea el archivo .swm. Otras personas pueden duplicar las relaciones espaciales que define para el análisis al utilizar el archivo .swm y la clase de entidad de entrada. Especialmente si desea compartir sus archivos .swm con otros, trate de evitar la situación donde el sistema de coordenadas de salida difiere de la referencia espacial asociada con su clase de entidad de entrada. Una mejor estrategia es proyectar la clase de entidad de entrada y, a continuación, establecer el sistema de coordenadas de salida en Igual que la clase de entidad de entrada antes de crear archivos de matriz de ponderaciones espaciales.