常态得分变换

某些插值方法和模拟方法需要正态分布的输入数据(有关这些方法的列表,请参阅检查数据的分布)。常态得分变换 (NST) 旨在通过变换数据集来使数据集的分布接近标准正态分布。常态得分变换会对数据集从最低值到最高值进行分级,并将这些级别与正态分布中产生的同等级别匹配。变换中的步骤如下:首先对数据集进行排序和分级,然后为数据集中每个级别找到标准正态分布中的同等对应级别,再用与这些级别关联的正态分布值构成变换后的数据集。可使用数据集的频率分布或累积分布来完成分级过程。

展示应用常态得分变换前后的直方图和累积分布的示例如下所示:

应用常态得分变换前后的直方图
应用常态得分变换前后的直方图

应用常态得分变换前后的累积分布
应用常态得分变换前后的累积分布

近似方法

在 Geostatistical Analyst 中,存在三种近似方法:直接近似法、线性近似法和高斯核近似法。直接法使用所观测的累积分布,线性法在累积分布的每个步骤之间对线进行拟合,高斯核方法通过拟合各部分累积正态分布的一种线性组合来逼近累积分布。在“地统计向导”对变换的比例做出预测后,会自动将其变换回原始比例。

选择哪种近似方法取决于您要做的假设以及近似的平滑度。直接方法的平滑度最低并且假设也最少;线性方法具有中等的平滑度和中等数量的假设;高斯核方法具有最平滑的反向变换,但它假设数据分布可通过正态分布的有限混合来逼近。当假设有效时,高斯核方法将产生最好的结果。


7/10/2012