¿Cómo funciona la Clasificación de máxima verosimilitud?

El algoritmo que utiliza la herramienta Clasificación de máxima verosimilitud se basa en dos principios:

La herramienta tiene en cuenta las varianzas y covarianzas de las firmas de clases cuando asigna cada celda a una de las clases representadas en el archivo de firma. Si se asume que la distribución de una muestra de clases es normal, una clase puede estar caracterizada por el vector del valor medio y la matriz de covarianza. Dadas estas dos características para cada valor de celda, se calcula la probabilidad estadística para cada clase a fin de determinar la pertenencia de las celdas a la clase. Cuando se especifica la opción Ponderación de la probabilidad a priori EQUAL, cada celda se asigna a la clase a la que tiene mayor probabilidad de pertenecer como miembro.

Si la probabilidad de ocurrencia de algunas clases es mayor (o menor) que el promedio, se debe usar la opción FILE a priori con un Archivo de probabilidades a priori de entrada. Los pesos de las clases con probabilidades especiales se especifican en el archivo a priori. En este caso, un archivo a priori ayuda a asignar las celdas que se superponen estadísticamente entre dos clases. Estas celdas se asignan con mayor exactitud a la clase adecuada, dando como resultado una mejor clasificación. Este enfoque de ponderación para la clasificación se conoce como el clasificador bayesiano.

Al elegir la opción SAMPLE a priori, las probabilidades a priori asignadas a todas las muestras de clases en el archivo de firma de entrada son proporcionales a la cantidad de celdas capturadas en cada firma. Por consiguiente, las clases que tienen menos celdas que el promedio en la muestra reciben pesos menores que el promedio, y las que tienen más celdas reciben pesos mayores que el promedio. Como resultado, las clases respectivas tienen más o menos celdas asignadas.

Cuando se realiza una clasificación de máxima verosimilitud, también se puede producir un ráster de confianza de salida opcional. Este ráster muestra los niveles de confianza de la clasificación. La cantidad de niveles de confianza es 14, que se relaciona directamente con la cantidad de valores de fracción de rechazo válidos. El primer nivel de confianza, codificado en el ráster de confianza como 1, comprende celdas con la menor distancia hasta cualquier vector de valor medio almacenado en el archivo de firma de entrada; por lo tanto, la clasificación de estas celdas tiene una mayor certeza. Las celdas que constituyen el segundo nivel de confianza (valor de celda 2 en el ráster de confianza) se clasificarán sólo si la fracción de rechazo es 0,99 o menor. El nivel de confianza más bajo tiene un valor de 14 en el ráster de confianza, y muestra las celdas que posiblemente estén mal clasificadas. Las celdas de este nivel no se clasificarán cuando la fracción de rechazo sea 0,005 o mayor.

Ejemplo

El siguiente ejemplo muestra la clasificación de un ráster multibanda con tres bandas en cinco clases. Las cinco clases incluyen lecho seco, forestal, lago, residencial/bosquecillo y pradera. También se producirá un ráster de confianza de salida. Las bandas del ráster de entrada se muestran a continuación.

Ejemplo de clasificación de máxima verosimilitud: entradas
Ejemplos de entradas para la Clasificación de máxima verosimilitud

La herramienta Clasificación de máxima verosimilitud se utiliza para clasificar el ráster en cinco clases.

El ráster clasificado aparece como se muestra a continuación:

Ejemplo de salida de Clasificación de máxima verosimilitud
Ejemplo de salida de Clasificación de máxima verosimilitud

Las áreas que se muestran en color rojo son las celdas que tienen una probabilidad menor al 1 por ciento de tener una clasificación correcta. A estas celdas se les otorga un valor de NoData debido a la fracción de rechazo de 0,01 utilizada. La clase de lecho seco se muestra en blanco, con la clase forestal en verde, la clase de lago en azul, la clase residencial/bosquecillo en amarillo y la clase de pradera en naranja.

La lista que se muestra a continuación es la tabla de atributos de valores para el ráster de confianza de salida. Muestra la cantidad de celdas clasificadas y la cantidad de confianza con la que se clasificaron. El valor 1 tiene una probabilidad del 100 por ciento de ser correcto. Hay 3.033 celdas que se clasificaron con ese nivel de confianza. El valor 5 tiene una probabilidad del 95 por ciento de ser correcto. Habían 10.701 celdas que tenían una probabilidad del 0,005 por ciento de ser correctas con un valor de 14.

RECORD    VALUE    COUNT 1             1     3033 2             2     3061 3             3     9187 4             4    16717 5             5    37361 6             6   136420 7             7   269592 8             8   250863 9             9   105001 10           10    23598 11           11    11190 12           12    11546 13           13     3621 14           14    10701

Temas relacionados


7/11/2012