执行交叉验证和验证

在生成最终表面之前,应该了解模型对未知位置的值所做预测的准确程度。交叉验证和验证有助于您准确地判断哪个模型提供了最佳预测。这些计算的统计数据可用作指示模型和/或其相关参数值是否合理的诊断信息。

交叉验证和验证使用以下方法 – 移除一个或多个数据位置,然后使用其他位置的数据来预测与其相关联的数据。这样,您可将预测值与实测值相比较并且获得关于克里金模型质量的有用信息(例如,半变异函数参数和搜索邻域)。

交叉验证

交叉验证使用所有数据对趋势和自相关模型进行估计。它会每次移除一个数据位置,然后预测关联的数据值。例如,下图显示了 10 个数据点。交叉验证会省略一个点(红色点),然后使用剩余的 9 个点(蓝色点)计算此位置的值。将省略点位置的预测值与实际值相比较。然后对第二个点重复此过程,以此类推。交叉验证会对所有点的测量值和预测值进行比较。在某种意义上,通过使用所有数据估计趋势和自相关模型,交叉验证有点“欺骗性”。完成交叉验证后,一些数据位置可能被作为异常搁置,这时需要重新拟合趋势模型和自相关模型。

交叉验证

交叉验证自动执行,并且在“地统计向导”的最后一步中显示结果。也可以通过交叉验证地理处理工具手动执行交叉验证。

验证

验证首先会移除部分数据(称为测试数据集),然后使用其他数据(称为训练数据集)来开发要用于预测的趋势和自相关模型。在 Geostatistical Analyst 中,使用“创建子集”工具创建测试数据集和训练数据集。除上述差异外,验证和交叉验证中用于比较预测和真实值的图形类型和汇总统计类型都是相似的。验证创建的模型仅针对数据的子集,因此不能直接检查包含所有可用数据的最终模型。验证检查决策“协议”是否有效(例如,半变异函数模型的选择、步长大小的选择、搜索邻域的选择)。如果决策协议适用于验证,则该协议也同样适用于整个数据集。

可以使用 GA 图层至点地理处理工具执行模型验证。有关如何验证模型的详细信息,请参阅使用验证评估模型

Geostatistical Analyst 提供了几个测量值和预测值的图表和汇总。给出了预测值与真实值的散点图。您可能预期这些点应该散布在 1:1 线(下图中的黑色虚线)的附近。但是,坡度通常小于 1。克里金方法的特点是倾向于大值预测过低,小值预测过高,如下图所示。

散点图插图

穿过分散点的拟合线显示为蓝色,并在图的下方给出方程。误差图与预测图相同,只是在预测值基础上减去了测量值。对于标准化误差图,要先用预测值减去测量值,然后再除以估计的克里金标准误差。所有三个图都显示了克里金法预测的准确程度。如果所有数据都是独立的(无自相关性),则所有预测均相同(每一个预测值都是测量数据的平均值),因此蓝线为水平线。如果拥有自相关性且使用的是理想的克里金模型,则蓝线应更接近于 1:1(黑色虚线)线。

最后一个图是 QQ 图。该图显示预测值和测量值的差值的分位数以及标准正态分布中对应的分位数。如果预测值与真实值之间的误差为正态分布,则这些点应大致沿灰色线分布。如果误差呈正态分布,则可放心使用依赖正态性的方法(例如,简单克里金法中的分位数图)。

QQ 图

预测误差统计

最后,在下面给出了克里金预测误差的一些汇总统计数据。这些数据可用作诊断信息。

预测误差的克里金汇总统计数据


7/10/2012