Fonctionnement de l’outil Classification de vraisemblance maximale
L'algorithme utilisé par l'outil Classification de vraisemblance maximale repose sur deux principes :
- Les cellules dans chaque exemple de classe dans l'espace multidimensionnel sont réparties normalement
- Le théorème de Bayes de prise de décision
L'outil tient compte à la fois des variances et des covariances des signatures de classe lors de l’attribution de chaque cellule à l'une des classes représentées dans le fichier de signatures. En supposant que la distribution d'un exemple de classe est normale, une classe peut être caractérisée par le vecteur moyen et la matrice de covariance. Compte tenu de ces deux caractéristiques pour chaque valeur de cellule, la probabilité statistique est calculée pour chaque classe. Elle permet de connaître l’appartenance des cellules en fonction de la classe. Lorsque l'option Pondération de probabilité à priori EGALE par défaut est spécifiée, chaque cellule est affectée à la classe dont elle est le plus susceptible d’être membre.
Lorsque la probabilité de quelques classes est supérieure (ou inférieure) à la moyenne, vous devez utiliser l’option a priori FICHIER avec un Fichier de probabilité à priori en entrée. Les pondérations des classes avec les probabilités spéciales sont spécifiées dans ce fichier. Dans ce cas, un fichier a priori permet d’attribuer des cellules qui figurent dans la superposition entre deux classes. Ces cellules sont affectées plus correctement à la classe appropriée pour obtenir une meilleure classification. Cette pondération relève de la méthode bayésienne.
Lorsque vous choisissez l’option a priori ECHANTILLON, les probabilités associées aux classes échantillonnées dans le fichier de signatures sont proportionnelles au nombre de cellules associées à chaque signature. Par conséquent, les classes qui ont moins de cellules que la moyenne dans l'exemple reçoivent des pondérations au-dessous de la moyenne. Celles qui ont plus de cellules reçoivent des pondérations supérieures à la moyenne. En conséquence, ces classes sont associées à plus ou moins de cellules.
Lorsqu'une classification de probabilité maximale est effectuée, vous pouvez également obtenir un raster de confiance en sortie facultatif. Ce raster affiche les niveaux de confiance de classification. Le nombre de niveaux de confiance est 14, mis directement en rapport avec le nombre de valeurs de la fraction des rebuts autorisés. Le premier niveau de confiance (codé dans un raster 1) comprend des cellules dont la distance la plus courte par rapport au vecteur moyen est enregistrée dans le fichier de signatures. La pertinence de la classification de ces cellules est donc optimale. Les cellules qui comprennent le deuxième niveau de confiance seraient classées (valeur de la cellule 2 dans le raster de confiance) uniquement si la fraction du rebut est 0,99 ou inférieure. Le niveau de confiance le plus bas a une valeur de 14 sur le raster de confiance. Il affiche les cellules qui seraient très probablement classées de manière aléatoire. A ce stade, les cellules ne sont pas classées lorsque la fraction est de 0,005 ou plus.
Exemple
L'exemple suivant montre la classification d'un raster multicanal avec trois canaux dans cinq classes. Les cinq classes sont les suivantes : lit de rivière sec, forêt, lac, résidentiel/bosquet et rangeland. Le système crée également un raster de confiance en sortie. Les canaux du raster en entrée sont affichés ci-dessous.
L'outil Classification de vraisemblance maximale permet de classer le raster en cinq classes.
- Paramètres utilisés dans la boîte de dialogue de l'outil Classification de vraisemblance maximale :
Canaux du raster en entrée : redlands
Fichier de signatures en entrée: wedit.gsg
Raster multicanal en sortie : mlclass_1
Fraction de rejet : 0,01
Pondération de probabilité à priori: EGAL
Fichier de probabilité à priori en entrée : apriori_file_1
Raster de confiance en sortie : reject_ras
Le raster classé apparaît comme indiqué :
Les surfaces affichées en rouge sont des cellules qui ont moins d’un pour cent de chance d’être correctement classées. La valeur NoData est attribuée à ces cellules, puisque vous utilisez une fraction de rejet de 0,01. La classe du lit de rivière asséché s’affiche en blanc, celle de la forêt en vert, celle du lac en bleu, celle de la classe résidentiel/bosquet en jaune, et la classe rangeland en orange.
La liste suivante est la table attributaire des valeurs du raster de confiance en sortie. Elle indique le nombre de cellules classée selon le degré de confiance. La valeur 1 a 100 pour cent de chances d’être correcte. Il existe 3,033 cellules classées avec ce niveau de confiance. La valeur 5 a 95 pour cent de chances d’être correcte. Nous avions auparavant 10 701 cellules avec 0,005 pour cent de chances et la valeur 14.
RECORD VALUE COUNT 1 1 3033 2 2 3061 3 3 9187 4 4 16717 5 5 37361 6 6 136420 7 7 269592 8 8 250863 9 9 105001 10 10 23598 11 11 11190 12 12 11546 13 13 3621 14 14 10701