空間ウェイト マトリックスの作成(Generate Spatial Weights Matrix)の詳細
空間統計とは、伝統的な(非空間的)統計手法を、たまたま空間的である(X 座標と Y 座標を持つ)データに適用することではありません。空間統計は、空間と空間リレーションシップを直接、数式に組み込みます(面積、距離、長さなど)。多くの空間統計では、このような空間リレーションシップは空間ウェイト マトリックス ファイルまたはテーブルを介して形式的に指定されます。
空間ウェイト マトリックスは、データの空間構造を表しています。データセットのフィーチャ間に存在する空間リレーションシップを定量化したものです(少なくとも、そのようなリレーションシップを概念化した方法の定量化です)。空間ウェイト マトリックスは、データに構造をもたらすため、フィーチャ相互の実際の関係を最もよく反映したコンセプトを選択する必要があります(もちろん、計測対象も考慮します)。たとえば、森の中で種で増える特定の種類の樹木のクラスタ化を計測する場合は、何らかの形の逆距離がおそらく最適です。しかし、地域の通勤客の地理的分布を評価する場合は、通勤時間または通勤費用を選択するほうが優れています。
物理的にはさまざまな方法で実装されますが、概念的には空間ウェイト マトリックスは NxN のテーブルです(N はデータセットのフィーチャ数)。フィーチャごとに 1 行、フィーチャごとに 1 列が割り当てられます。ある行と列を組み合わせたセルの値は、その行と列のフィーチャの間の空間リレーションシップを定量化したウェイトです。
最も基本的なレベルで、データ フィーチャ間のリレーションシップを定量化するウェイトを作成する方法は、二値加重と可変加重の 2 種類があります。二値加重の場合(fixed distance、K nearest neighbors、contiguity)、フィーチャは近傍であるか(1)、近傍でないか(0)のどちらかです。可変加重の場合(inverse distance 、zone of indifference)、近傍フィーチャは異なる量のインパクト(影響)を与え、ウェイトはその変動を反映するように計算されます。
指定したパラメータに基づいて、[空間ウェイト マトリックスの作成(Generate Spatial Weights Matrix)] ツールは空間ウェイト マトリックス(*.swm)ファイルをリトル エンディアンのバイナリ形式で作成します。そのファイルの空間リレーションシップ値は、使用するディスク容量とメモリ、必要な計算の数を最小限に抑えるために、疎行列の手法によって格納されます。このような関係の値は、[空間的自己相関分析(Spatial Autocorrelation(Morans I))]、[ホット スポット分析(Hot Spot Analysis(Getis-Ord Gi*))]、[クラスタ/外れ値分析(Cluster and Outlier Analysis(Anselin Local Morans I))] など、いくつかの空間統計ツールの数式で活用されます。空間ウェイト マトリックス ファイルは、理論上、N x N の空間リレーションシップを格納できますが、ほとんどの場合、各フィーチャはごく一部のフィーチャとだけ関連しています。疎行列の手法はこの点を利用して、非ゼロのリレーションシップだけを格納します。
*.swm ファイルを使用すると、メモリ不足に陥る可能性があります。これは一般に、[空間リレーションシップのコンセプト] または [距離バンドまたは距離の閾値] を選択したときに、フィーチャが非常に大量の近傍フィーチャを持つ結果となって、*.swm ファイルの疎という性質を無駄にした場合に発生します。一般に、すべてのフィーチャが数千個の近傍を持つような場合に空間ウェイト マトリックスを作成しようとは思いません。すべてのフィーチャが少なくとも 1 つ近傍を持ち、ほぼすべてのフィーチャが少なくとも 8 つの近傍を持つことが理想です。[近傍数] パラメータで最小限の値を指定することで、各フィーチャが指定した最小限の数の近傍を持つことを保証できます。
参考資料
Mitchell, Andy『The Esri Guide to GIS Analysis, Volume 2』Esri Press、2005 年
Getis, Arthur、Jared Aldstadt 共著、「Constructing the spatial weights matrix using a local statistic」(『Geographical Analysis,』36(2): 90 – 104、2004)