Funktionsweise von "Dendrogram"

Ein Dendrogramm ist ein Diagramm, das die Attributentfernungen zwischen jedem Paar sequentiell zusammengeführter Klassen anzeigt. Um zu vermeiden, dass Linien geschnitten werden, wird das Diagramm grafisch so dargestellt, dass Elemente jedes zusammenzuführenden Klassenpaares Nachbarn im Diagramm sind.

Das Werkzeug Dendrogram verwendet einen hierarchischen Cluster-Algorithmus. Das Programm berechnet zuerst die Entfernungen zwischen jedem Paar von Klassen in der Eingabesignaturdatei. Dann führt es das nächste Paar Klassen iterativ zusammen und führt sukzessive das nächste Paar von Klassen und die nachfolgend nächsten zusammen, bis die Klassen alle zusammengeführt wurden. Nach jeder Zusammenführung werden die Entfernungen zwischen allen Paaren von Klassen aktualisiert. Die Entfernungen, mit denen die Signaturen von Klassen zusammengeführt werden, werden verwendet, um ein Dendrogramm zu erstellen.

Wenn die Option Use variance in distance calculations deaktiviert ist (NO_STD), wird die Entfernung d-mn zwischen einem Paar Klassen m und n als Entfernung zwischen ihren Mittelwerten gemessen:

Formel für die Entfernung zwischen Mittelwerten

Wenn die Varianzoption aktiviert wird (STD), misst das Werkzeug Dendrogram Entfernungen zwischen Paaren von Klassen auf Grundlage ihres Mittelwertes und der Varianzen anhand der folgenden Formel:

Gleichung zum Messen von Entfernungen zwischen Paaren von Klassen

Die neuen Statistiken (Mittelwert und Varianzen), die die zusammengeführte Klasse beschreiben, basieren auf dem ursprünglichen Mittelwert und der Varianz der Beispiele, die die zusammengeführte Klasse umfassen. Daher wird die zusammengeführte Klasse mit dem Mittelwert und der Varianz in einem Pool erzeugt. Die zwei Signaturen, mit denen die zusammengeführte Klasse erstellt wird, werden durch eine einzelne Signatur der kombinierten Klasse ersetzt. Die neue mittlere Signatur wird auf Grundlage der Positionen im mehrdimensionalen Attributraum aller Elementzellen der zusammengeführten Klasse berechnet. Die neue Signatur behält die niedrigere Anzahl der zwei Eingabeklassen der zusammengeführten Klassen-ID bei.

Die Wertebenen, oder die Entfernungen, bei denen jedes Paar Klassen zusammengeführt wird, können mit den Maßstabsleisten des Dendrogrammdiagramms interpoliert werden. Aufgrund der Einschränkung der Größe eines Zeichens (die grobe Auflösung der Grafik) werden die Ebenen der Zusammenführung zur Anzeige gerundet. Die präzisen Werte der Ebenen der Zusammenführung werden jedoch in der mit dem Dendogramm verknüpften Tabelle als DISTANCE repräsentiert.

Varianzen, nicht Kovarianzen, werden zur Entfernungsberechnung verwendet, nachdem ein Paar Klassen zusammengeführt wurde. Der von Dendrogram verwendete Algorithmus bestimmt die Entfernung zwischen Klassen nicht mithilfe der Mahalanobis-Entfernung. Daher passen die Entfernungen zwischen Klassen und den zusammengeführten Klassen möglicherweise nicht zu den Ergebnissen jener Gitterwerkzeuge, die auf Mahalanobis-Entfernung basieren, z. B. Edit Signatures, Maximum-Likelihood-Klassifizierung und Klassenwahrscheinlichkeit.

Mithilfe des Dendogramms kann die statistische Fehlklassifikation in der Analyse reduziert werden, indem die erforderlichen Informationen zum Kombinieren oder Separieren von Datenklassen bereitgestellt werden. Liegen die Klassen innerhalb Ihrer Analyse statistisch gesehen zu dicht aneinander (d. h. wenn es schwierig werden kann, die beiden Klassen statistisch zu unterscheiden), kann es zu einer Fehlklassifikation kommen. In diesem Fall sollten Sie erwägen, die Klassen zusammenzuführen. Es gibt keine festen Regeln, die vorgeben, in welchem Fall Klassen zusammenzuführen sind und in welchem nicht. Wann sollten Sie Klassen zusammenführen? Diese Entscheidung ist von der Heterogenität Ihres Untersuchungsgebiets und Ihrer Daten, der Anzahl Klassen, in die Sie die Daten unterteilen möchten, und von Ihren Zielen abhängig. Wenn Sie beispielsweise über ein ausgesprochen heterogenes Untersuchungsgebiet verfügen, haben Sie die Möglichkeit, zahlreiche einzelne, separate Klassen zu erstellen, sodass möglicherweise auf das Zusammenführen der Klassen verzichtet werden kann. Eine andere denkbare Situation ist, dass Ihre Daten relativ homogen sind, und Sie diese in zu viele Klassen unterteilen möchten. In dem Fall liegen die Klassen möglicherweise statistisch zu eng aneinander, sodass das Zusammenführen einiger Klassen sinnvoll sein kann.

Falls Ihre Analyse keine ausführlichen Klassen verlangt, können Sie die Klassen in allgemeinere Kategorien zusammenführen, um die Gefahr einer Fehlklassifikation zu minimieren. Das Dendrogramm identifiziert die Klassen, die sich statistisch am ähnlichsten sind. Es liegt jedoch an Ihnen, basierend auf Ihrem Wissen zum Untersuchungsgebiet und Ihren Zielen, zu entscheiden, ob das Zusammenführen von Klassen angebracht ist.

Das Zusammenführen von zwei Klassen macht beispielsweise Sinn, wenn Sie eine Klasse als allgemeines Sumpfgebiet und eine andere als Moorgebiet festgelegt haben. Die Statistikdaten, die sich aus dem Trainingsgebiet ableiten lassen, sind für beide Klassen recht ähnlich. In dem sich ergebenden Dendogramm werden daher beide Klassen eng nebeneinander liegen. Wenn es Ihnen lediglich darum geht, Feuchtgebiete zu identifizieren, können Sie die Moorgebiete mit der Klasse für allgemeine Sumpfgebiete zusammenführen.

Das Dendogramm identifiziert nicht nur diejenigen Klassen, die potenziell zusammengeführt werden können, sondern weist auch auf Situationen hin, in denen das Hinzufügen von Klassen von Vorteil sein kann. Liegen etwa zwei Klassen statistisch gesehen weit auseinander, können Sie weitere Klassen hinzufügen, um die Klassifizierung zu verfeinern. Angenommen, Sie haben eine Klasse für Feldfrüchte und eine andere Klasse für Gras festgelegt. In dem sich ergebenden Dendogramm liegen diese beiden Klassen möglicherweise weit auseinander. Nehmen wir weiter an, Sie verfügen über ein Multiband-Raster mit hoher Auflösung. Wenn Sie nun die landwirtschaftliche Ausgabe für das Gebiet analysieren, können Sie aufgrund der höheren Datenauflösung die Klassen für Feldfrüchte und für Gras weiter verfeinern in Klassen für bestimmte Ertragstypen.

Beispiel

Im folgenden Beispiel sind Klassen 3 und 5 die nächsten Nachbarn im Attributraum; daher werden sie auf Ebene 3,443 zusammengeführt. Dieser Wert gibt den relativen Grad Ähnlichkeit an, der auch als Entfernung im mehrdimensionalen Raum angesehen werden kann. Die zwei Klassen werden zusammengeführt und als einzelne Klasse behandelt. Die Statistiken für die zusammengeführte Klasse und die Entfernungen von der zusammengeführten Klasse zu den anderen Klassen werden berechnet. Dann werden die folgenden zwei nächsten Klassen identifiziert. Die zwei Kandidaten sind Klassen 4 und 6. Die Entfernung zwischen ihnen beträgt 3,609 und sie werden zusammengeführt. Der Prozess wiederholt sich. Alle Klassen werden sequenziell zu größeren Klassen zusammengeführt, bis alle Klassen zu einer einzelnen Klasse zusammengeführt wurden.

Die Ausgabe-Dendrogrammdatei wäre wie folgt:

Distances between pairs of combined classes (in the sequence of merging):

Remaining   Merged   Between-Class
Class      Class      Distance
----------------------------------
  3         5        3.442680
  4         6        3.608904
  7         9        3.899360
  2         7        3.795288
  3         4        4.883098
  2         8        6.073256
  1         3        6.257798
  1         2        9.350019
----------------------------------

Dendrogram of /discb/topdir/myspace/isoclust12.gsg

C       DISTANCE
L
A
S   0      1.0     2.1     3.1     4.1     5.2     6.2     7.2     8.3     9.3
S   |-------|-------|-------|-------|-------|-------|-------|-------|------
   
   5 -------------------------|
                              |----------|
   3 -------------------------|          |
                                         |----------|
   6 ---------------------------|        |          |
                                |--------|          |-------------------|
   4 ---------------------------|                   |                   |
                                                    |                   |
   1 -----------------------------------------------|                   |
                                                                        |-
   9 -----------------------------|                                     |
                                  |                                     |
   7 ---------------------------------------------|                     |
                                   |              |                     |
   2 ------------------------------|              |---------------------|
                                                  |
   8 ---------------------------------------------|
   
    |-------|-------|-------|-------|-------|-------|-------|-------|------
    0      1.0     2.1     3.1     4.1     5.2     6.2     7.2     8.3     9.3

Verwandte Themen


7/10/2012