Fonctionnement de l'outil Iso cluster

L'outil Iso Cluster utilise une optimisation itérative modifiée, également appelée migration de moyennes. L'algorithme sépare toutes les cellules dans le nombre spécifié par l'utilisateur dans les groupes distincts dans l'espace multidimensionnel des canaux en entrée. Cet outil est utilisé le plus souvent pour effectuer une classification non assistée.

Le préfixe iso de l'algorithme d'agrégation isodata est l'acronyme de "Iterative Self Organizing" (auto-organisation itérative), c'est-à-dire une méthode qui permet d'effectuer l'agrégation. Ce type d'agrégation repose sur un processus qui, au cours d'une itération, attribue tous les échantillons à des centres d'agrégation existants et recalcule les moyennes de chaque classe. En général, le nombre optimal de classes à spécifier n'est pas connu. Il est donc préférable de saisir un nombre élevé, d'analyser les agrégats obtenus et de relancer la fonction avec un nombre de classes restreint.

L'algorithme iso cluster est un procédé itératif permettant de calculer la distance euclidienne minimale lorsque vous attribuez une cellule à un agrégat. Le processus démarre avec des moyennes arbitraires qui sont attribuées par le logiciel, une pour chaque agrégat (vous devez indiquer le nombre d'agrégats). Chaque cellule est attribuée à la moyenne la plus proche (dans l'espace attributaire multidimensionnel). Le système recalcule les nouvelles moyennes pour chaque agrégat, compte tenu des distances attributaires associées à l'agrégat après la première itération. Ce processus est renouvelé : chaque cellule est attribuée à la moyenne la plus proche dans l'espace attributaire multidimensionnel. Les nouvelles moyennes sont calculées pour chaque agrégat en fonction de l'appartenance des cellules issues de l'itération. Vous pouvez spécifier le nombre d'itérations du processus via l'outil Nombre d'itérations. Cette valeur doit être suffisante pour que la migration d'un agrégat à l'autre soit minimale lorsque vous avez traité le nombre d'itérations spécifié. Les agrégats deviennent donc tous stables. Lors de l'augmentation du nombre d'agrégats, le nombre d'itérations également s'accroître.

La valeur Nombre de classes spécifiée est le nombre maximal des agrégats qui peuvent résulter du processus d'agrégation. Toutefois, le nombre d'agrégats dans le fichier de signatures en sortie ne peut pas être le même que le nombre spécifié pour le nombre de classes. Cette situation se présente dans les cas suivants :

Exemple

A titre d'exemple, voici un fichier de signatures créé par Iso cluster. Le fichier débute avec un en-tête qui fait l'objet de commentaires. Il décrit les valeurs des paramètres employés pour effectuer une agrégation.

Les noms de classes sont facultatifs. Vous ne devez les indiquez qu'après avoir créé le fichier via un éditeur de texte. Chaque nom de classe doit être une chaîne de caractères distincte qui n'excède pas 14 caractères alphanumériques en longueur.

# Signatures Produced by Clustering of 
#    Stack redlands
#    number_of_classes=6   max_iterations=20   min_class_size=20
#    sampling interval=10
#    Number of selected grids
/*           3
#    Layer-Number   Grid-name
/*           1      redlands1
/*           2      redlands2
/*           3      redlands3

# Type  Number of Classes   Number of Layers  Number of Parametric
                                                   Layers
   1             4                 3                 3
# ===============================================================

# Class ID     Number of Cells      Class Name
       1              1843 
# Layers   1             2             3
# Means 
        22.8817       60.7656       34.8893
# Covariance
1      169.3975      -69.7444      179.0808
2      -69.7444      714.7072       10.7889
3      179.0808       10.7889      284.0931
# ---------------------------------------------------------------

# Class ID     Number of Cells      Class Name
       2              2495 
# Layers   1             2             3
# Means 
         38.4894      132.9775       61.8104
# Covariance
1       414.9621      -19.0732      301.0267
2       -19.0732      510.8439      102.8931
3       301.0267      102.8931      376.5450
# ---------------------------------------------------------------
# Class ID     Number of Cells      Class Name
       3              2124 
# Layers   1             2             3
# Means 
         70.3983       82.9576       89.2472
# Covariance
1       264.2680      100.6966       39.3895
2       100.6966      523.9096       75.5573
3        39.3895       75.5573      279.7387
# ------------------------------------------------------------

# Class ID     Number of Cells      Class Name
       4              2438 
# Layers   1             2             3
# Means 105.8708      137.6645      130.0886
# Covariance
1       651.0465      175.1060      391.6028
2       175.1060      300.8853      143.2443
3       391.6028      143.2443      647.7345

Bibliographie

Ball, G. H. et D. J. Hall. 1965. A Novel Method of Data Analysis and Pattern Classification. Menlo Park, California : Stanford Research Institute.

Richards, J. A. 1986. Remote Sensing Digital Image Analysis : présentation.. Berlin : Springer-Verlag.

Rubriques connexes


7/10/2012