“生成空间权重矩阵”的工作原理

空间统计并不意味着将传统(非空间)统计方法应用于恰巧是空间数据(有 x 和 y 坐标)的数据。空间统计将空间和非空间关系直接整合到数学计算中(面积、距离、长度等)。对于许多空间统计,这些空间关系是通过空间权重矩阵文件或表正式指定。

空间权重矩阵是数据空间结构的一种表现形式。它是对数据集要素之间存在的空间关系的一种量化(或者,至少是对此类关系的概念化方法的一种量化)。因为空间权重矩阵要对数据强加一种结构,所以应选择可最恰当地反映要素彼此间实际交互方式的概念化(当然,还需考虑要尝试测量的对象)。例如,如果要测量森林中某种特定种类的种子繁殖树种的聚类,使用某种形式的反距离可能最适合。但是,如果要评估某一地区通勤者的地理分布,行程时间和行程成本可能是更好的选择。

虽然是依靠各种方法物理实现的,但从概念上讲,空间权重矩阵是 NxN 表(N 表示数据集中的要素数)。每个要素只有一行和一列。任意给定行/列组合的像元值即为权重,用于量化这些行要素和列要素之间的关系。

在最基本的层面上,通过创建权重来量化数据要素之间的关系的策略有两种:二进制或可变权重。对于二进制策略(固定距离、K 最近邻域或邻接),要素或者是邻域 (1),或者不是 (0)。对于权重策略(反距离或无差别的区域),邻近要素有不同量级的作用(或影响),并通过计算权重来反映该变化。

根据您所指定的参数,生成空间权重矩阵工具创建小字节二进制格式的空间权重矩阵 (.swm) 文件。该文件中的空间关系值使用稀疏矩阵法进行存储,以便将磁盘空间和计算机内存的占用以及所需计算的次数降至最低。这些关系值用于多种空间统计工具的数学计算,包括空间自相关(Global Moran's I)热点分析(Getis-Ord Gi*)聚类和异常值分析(Anselin Local Moran's I)。虽然空间权重矩阵文件或许可以存储 NxN 个空间关系,但在多数情况下,每个要素应仅与其他几个要素相关。稀疏方法通过只存储非零关系来利用此功能。

注注:

使用 .swm 文件时可能会发生内存不足的情况。这通常发生在以下情况:您选择空间关系的概念化距离范围/距离阈值,导致要素有许多许多的相邻点,进而改变了 .swm 文件的稀疏本质。在每个要素都有成千上万个相邻点的情况下,您通常不想创建空间权重矩阵。您希望所有要素至少具有一个相邻点,几乎所有要素至少具有八个相邻点。您可通过为相邻点的数目参数指定最小值,来确保每个要素都有指定数目的最小相邻点。

其他资源

Mitchell, Andy。ESRI GIS 分析手册,第 2 卷。ESRI 出版社,2005。

Getis, Arthur 和 Jared Aldstadt。使用本地统计数据构建空间权重矩阵。地理分析,36(2): 90–104, 2004.


7/10/2012