正态 QQ 图和普通 QQ 图
分位数-分位数 (QQ) 图是两种分布的分位数相对于彼此进行绘制的图。
如何构建正态 QQ 图
首先,数据值经过排序,且累积分布值按照公式 (i– 0.5)/n 进行计算,其中字母表示总数为 n 的值中的第 i 个值(累积分布值给出了某个特定值以下的值所占的数据比例)。累积分布图通过以比较方式绘制有序数据和累积分布值得到(如下图中左上角的图表所示)。标准正态分布(平均值为 0 标准方差为 1 的高斯分布,如下图的中右上角的图表所示)的绘制过程与此相同。生成这两个累积分布图后,对与指定分位数相对应的数据值进行配对并绘制在 QQ 图中(见下图的底图所示)。
如何构建普通 QQ 图
普通 QQ 图用于评估两个数据集的分布的相似程度。这些图的创建和所述的正态 QQ 图的过程类似,不同之处在于第二个数据集不一定要服从正态分布,使用任何数据集均可。如果两个数据集具有相同的分布,普通 QQ 图中的点将落在 45 度直线上。
使用 QQ 图检查数据分布
正态 QQ 图上的点可指示数据集的单变量分布的正态性。如果数据是正态分布的,点将落在 45 度参考线上。如果数据不是正态分布的,点将会偏离参考线。
在下图中,标准正态分布的分位数值绘制在正态 QQ 图中的 x 轴上,数据集的相应分位数值绘制在 y 轴上。可以看到点落在 45 度参考线附近。与此线的主要偏离发生在高臭氧浓度值处。
正态 QQ 图工具可用于选择未落在参考线附近的点。所选的点的位置将高亮显示在 ArcMap 数据视图中。如下所示,这些点集中在圣弗朗西斯科湾区域附近(以下地图中粉红色阴影点)。
使用数据变换的示例
示例数据集的正态 QQ 图如下所示:
请注意点如何偏离直线。
但是,当将对数变换应用于数据集时,点更接近 45 度参考线,如下图所示。
还可对正态 QQ 图工具中的数据应用 Box-Cox 和反正弦变换,以评估它们对分布的正态性的影响。