高/低クラスタ分析(High/Low Clustering(Getis-Ord General G))の詳細

[高/低クラスタ分析 (High/Low Clustering)] ツールでは、指定された分析範囲について、集中の度合いの高/低が計測されます。

計算式

General G 統計の計算

General G 統計の付加的な計算を表示する

分子と分母の違いは加重(wij)だけであることに注目してください。高/低クラスタ分析は正の値にしか使用できません。このため、ウェイトがバイナリ(0/1)の場合や、常に 1 未満である場合は、General G の範囲が 0 から 1 になります。この統計には、バイナリ加重方式の使用をお勧めします。[空間リレーションシップのコンセプト] パラメータには、[Fixed Distance Band]、[K Nearest Neighbors、または [Delaunay Triangulation] を選択してください。[標準化] パラメータには、[NONE] を選択してください。

解釈

[高/低クラスタ分析(High/Low Clustering(Getis-Ord General G))] ツールは推測統計です。つまり、分析結果が、帰無仮説との関係で解釈されます。高/低クラスタ(General G)統計の帰無仮説は、フィーチャ値に空間クラスタが存在しないというものです。このツールから返される p 値が小さく、統計的に有意である場合は、帰無仮説を棄却することができます(「Z スコアとは、p 値とは」をご参照ください)。帰無仮説が棄却されると、Z スコアの符号が重要になります。Z スコアの値が正の場合、観測 General G インデックスが期待 General G インデックスよりも大きく、分析範囲内で高い値で属性がクラスタリングしていることを示します。Z スコアの値が負の場合、観測された General G インデックスが期待される General G インデックスよりも小さく、分析範囲内で低い値で属性クラスタリングしていることを示します。

[高/低クラスタ分析(High/Low Clustering(Getis-Ord General G))] ツールが最適なのは、値がほとんど等しく分布しているときに、高い値で空間的に予期せぬ急上昇を特定する場合です。残念ながら、高い値と低い値の両方がクラスタとなっている場合は、互いに相殺する傾向にあります。高い値と低い値の両方がクラスタリングしているときに空間クラスタを計測する場合は、[空間的自己相関分析 (Spatial Autocorrelation (Morans I))] ツールを使用します。

[高/低クラスタ分析(High/Low Clustering(Getis-Ord General G))] ツールと [空間的自己相関分析 (Spatial Autocorrelation (Morans I))] ツールの帰無仮説はどちらも、全くのランダム空間(CSR)です。つまり、対象の空間的プロセスがランダムであることを反映して、値がデータセット内のフィーチャ間でランダムに分布している状態です。ただし、[高/低クラスタ分析 (High/Low Clustering(Getis-Ord General G))] ツールの Z スコアの解釈は、[空間的自己相関分析 (Spatial Autocorrelation (Morans I))] ツールの Z スコアの解釈とは大きく異なります。

結果

高/低クラスタ

空間的自己相関分析

p 値が統計的に有意ではない

帰無仮説を棄却することはできません。フィーチャ属性値の空間分布は、かなり高い確率でランダムな空間プロセスの結果です。つまり、観測された空間パターンの値は、完全に空間的に偶発的な場合にとり得る場合の 1 つにすぎない可能性が十分にあります。

p 値が統計的に有意であり、Z スコアが正である。

帰無仮説を棄却することができます。根底にある空間プロセスが真にランダムである場合、データセット内の高い値を示す空間分布は、期待されるよりも空間的にクラスタリングしています。

帰無仮説を棄却することができます。根底にある空間プロセスが真にランダムである場合、データセット内の高い値や低い値の空間分布は、期待されるよりも空間的にクラスタリングしています。

p 値が統計的に有意であり、Z スコアが負である。

帰無仮説を棄却することができます。根底にある空間プロセスが真にランダムである場合、データセット内の低い値を示す空間分布は、期待されるよりも空間的にクラスタリングしています。

帰無仮説を棄却することができます。根底にある空間プロセスが真にランダムである場合、データセットの高い値や低い値の空間分布は、期待されるよりも空間的に分散しています。空間的に分散したパターンは、ある種の競合プロセスを反映していることが少なくありません。高い値をもつフィーチャは、高い値をもつ他のフィーチャに反発し、同様に、低い値をもつフィーチャは低い値をもつ他のフィーチャに反発します。

出力

[高/低クラスタ分析] ツールは、観測 General G、期待 General G、差異、Z スコア、p 値という 5 つの値を返します。これらの値には、結果ウィンドウからアクセスできます。また、これらの値は、モデルやスクリプトで使用できるように生成出力として渡されます。このツールでは、結果を概要図にした HTML ファイルを作成することもできます。結果ウィンドウの HTML ファイルをダブルクリックすると、デフォルトのインターネット ブラウザに HTML ファイルを表示できます。

また、結果ウィンドウのメッセージ エントリを右クリックして、[表示] を選択すると、結果が [メッセージ] ダイアログ ボックスに表示されます。

ツール出力には、結果ウィンドウからアクセスできます。

よくある質問

Q: [ホット スポット分析 (Hot Spot Analysis (Getis-Ord Gi*))] ツールからの結果は、統計的に有意なホット スポットを示しています。[高/低クラスタ分析(High/Low Clustering(Getis-Ord General G))] ツールからの結果が統計的に有意になっていないのはなぜですか?

A: [高/低クラスタ分析(High/Low Clustering(Getis-Ord General G))] ツールのようなグローバル統計では、対象データの全体的なパターンと傾向が評価されます。これは、分析範囲全体で空間パターンが一貫している場合に最も効果的な統計です。ローカル統計(ホット スポット分析など)では、各フィーチャが、近隣のフィーチャとの関係で評価され、ローカルな状況がグローバルの状況と比較されます。次の例を考えてみてください。一連の値についての中間や平均を計算する場合には、グローバル統計の計算も行うことになります。すべての値が 20 付近であれば、平均も 20 付近になり、結果はデータセット全体を非常に適切に表したサマリになります。一方、値の半数が 1 付近で、残りの半数が 100 付近である場合の平均は 50 付近になります。50 付近のデータは存在しないかもしれないため、平均値はデータセット全体を適切に表したサマリとはいえません。ただし、データ値のヒストグラムを作成すると、二山分布になっていることがわかります。同様に、[高/低クラスタ (High/Low Clustering(Getis-Ord General G))] ツールなどのグローバル統計は、分析範囲全体にわたって計測対象の空間プロセスが一貫している場合に最も効果的です。この場合には、結果は全体的な空間パターンを適切に表したサマリになります。詳細については、以下に引用した Getis と Ord(1992 年)のものと、彼らの提示する SIDS の分析をご参照ください。

 

Q: [高/低クラスタ分析(High/Low Clustering(Getis-Ord General G))] ツールからの結果と [空間的自己相関分析 (Spatial Autocorrelation (Morans I))] ツールからの結果が異なるのはなぜですか?

A: 上の表をご参照ください。これらのツールは、別の空間パターンを計測するものです。

 

Q: このツールで得た Z スコアや p 値を別の分析範囲の分析結果と比較することはできますか?

A: 結果を比較できるのは、分析範囲と分析に使用するパラメータが固定されている(比較の対象となるすべての分析で同一である)場合だけです。ただし、分析範囲が一式の固定されたポリゴンで構成されており、分析パラメータが固定されている場合は、特定の属性について時間の経過に伴う Z スコアの変化を比較できます。たとえば、特定の国の地域レベルで市販薬(OTC)購入のクラスタについて傾向分析する場合を考えてみます。この場合、各期間について [高/低クラスタ分析(High/Low Clustering(Getis-Ord General G))] を実行してから、結果を線グラフにまとめることができます。Z スコアが統計的に有意であり、上昇している場合、高い OTC 購入の空間クラスタの程度が上昇していると結論付けることができます。

 

Q: フィーチャのサイズは分析に影響を与えますか?

A: フィーチャのサイズは結果に影響することがあります。たとえば、大きいポリゴンが低い値をもつ傾向にあり、小さいポリゴンが高い値をもつ傾向にある場合は、高低の集中が同等であっても、指定した距離の範囲内により多くの小さいポリゴンのペアがあるために、観測 General G インデックスが、期待 General G インデックスよりも高くなることがあります。

適用例

参考資料

Getis, Arthur および J. K. Ord『The Analysis of Spatial Association by Use of Distance Statistics』Geographical Analysis 24、no. 3、1992 年

Mitchell, Andy『The Esri Guide to GIS Analysis, Volume 2』Esri Press、2005 年


7/10/2012