“聚类和异常值分析(Anselin Local Moran's I)”的工作原理
给定一组加权要素,聚类和异常值分析(Anselin Local Moran's I) 工具可标识在模中具有相似属性值的要素的空间聚类。该工具还可标识空间异常值。为此,该工具计算 local Moran's I 值、z 得分、p 值和表示每个要素的聚类类型的编码。z 得分和 p 值表示计算出的指数值的统计显著性。
解释
正值 I 表示要素具有包含同样高或同样低的属性值的邻近要素;该要素是聚类的一部分。负值 I 表示要素具有包含不同值的邻近要素;该要素是异常值。在任何一个实例中,要被视为具有统计学上的显著性的聚类和异常值,要素的 p 值必须足够小。有关确定统计显著性的详细信息,请参阅什么是 z 得分?什么是 p 值?请注意,Local Moran's I 指数 (I) 是相对测量,只能在其计算出的 z 得分或 p 值环境中进行说明。
输出字段(聚类/异常值类型 (COType))可区分具有统计学上的显著性(0.05 水平)的高值 (HH) 聚类、低值 (LL) 聚类、高值主要由低值围绕的异常值 (HL) 以及低值主要由高值围绕的异常值 (LH)。
输出
该工具可使用输入要素类中的每个要素的以下属性来创建新的输出要素类:Local Moran's I 指数、z 得分、p 值和 COType。这些属性的字段名称还会作为可能在自定义模型或脚本中使用的派生工具字符串输出值而返回。
在 ArcMap 中运行此工具时,输出要素类会自动添加到内容列表 (TOC),同时对 COType 字段应用默认渲染。所应用的渲染由 <ArcGIS>/ArcToolbox/Templates/Layers 中的图层文件定义。如果需要,可通过导入模板图层符号系统重新应用默认渲染。
最佳做法准则
- 结果仅在输入要素类至少包含 30 个要素时可靠。
- 该工具需要输入字段,如计数、速率或其他数值测量。如果正在分析点数据,只要每个点表示一个事件或事件点,您就不必计算特定数值属性(严重性等级、计数或其他测量)。如果想要查找存在许多事件点(热点)和/或存在很少事件点(冷点)的位置,则在分析之前需要聚合事件数据。热点分析(Getis-Ord Gi*) 工具也是查找热点和冷点位置的有效工具。但是,只有聚类和异常值分析(Anselin Local Moran's I) 工具可以标识具有统计学上的显著性的空间异常值(高值由低值围绕或低值由高围绕的值)。
- 选择适当的空间关系概念化。
- 选择适当的距离范围或阈值距离。
- 所有要素都应至少具有一个相邻要素。
- 应将所有其他要素作为其相邻要素的要素不存在。
- 特别是在忽略输入字段值时,每个要素都应具有大约八个相邻要素。
潜在应用
聚类和异常值分析(Anselin Local Moran's I) 工具可标识高值密度、低值密度和空间异常值。还可帮助您解决如下问题:
- 研究区域中的富裕区和贫困区之间的最清晰边界在哪里?
- 研究区域中存在可以找到异常消费模式的位置吗?
- 研究区域中意想不到的糖尿病高发地在哪里?
可在经济学、资源管理、生物地理学、政治地理学和人口统计等许多领域中应用此工具。
其他资源
Anselin, Luc."空间关联的局部指示器 - LISA," 地理分析 27(2):93–115, 1995.
Mitchell, Andy.ESRI GIS 分析手册, 第 2 卷.ESRI 出版社, 2005.