Cómo funciona Componentes principales
La herramienta Componentes principales se utiliza para transformar los datos en las bandas de entrada desde el espacio de atributos multivariante de entrada en un nuevo espacio de atributos multivariante cuyos ejes se rotan con respecto al espacio original. Los ejes (atributos) en el nuevo espacio no están correlacionados. La principal razón para transformar los datos en un análisis de componentes principales es comprimir los datos mediante la eliminación de la redundancia.
Un ejemplo de redundancia de datos evidente se da en un ráster multibanda que está constituido por elevación, pendiente y orientación (en una escala continua). Debido a que la pendiente y la orientación generalmente se derivan de la elevación, la mayoría de las varianzas dentro del área de estudio se pueden explicar solamente mediante la elevación.
El resultado de la herramienta es un ráster multibanda con la misma cantidad de bandas que la cantidad de componentes especificado (una banda por eje o componente en el nuevo espacio multivariante). El primer componente principal tendrá la varianza más grande, el segundo mostrará la segunda varianza más grande no descrita por el primero y así sucesivamente. Por lo general, los primeros tres o cuatro rásteres del ráster multibanda resultante de la herramienta de componentes principales describirán más del 95 por ciento de la varianza. Las bandas de ráster individuales restantes se pueden eliminar. Debido a que el nuevo ráster multibanda contiene menos bandas, y más del 95 por ciento de la varianza del ráster multibanda original está intacto, los cómputos serán más rápidos, y la exactitud se mantendrá.
Componentes principales requiere que se identifiquen las bandas de entrada, la cantidad de componentes principales en los que se transformarán los datos, el nombre del archivo de estadísticas de salida y el nombre del ráster de salida. El ráster de salida contendrá la misma cantidad de bandas que la cantidad de componentes especificada. Cada banda representará un componente.
Conceptos del análisis de componentes principales
Conceptualmente, cuando se utiliza un ráster de dos bandas, los cambios y las rotaciones de los ejes y la transformación de los datos se realizan de la siguiente manera:
- Los datos se grafican en un diagrama de dispersión.
- Se calcula una elipse para vincular los puntos en el diagrama de dispersión (vea la siguiente figura).
- Se determina el eje mayor de la elipse (vea la siguiente figura). El eje mayor se convierte en el nuevo eje x, el primer componente principal (PC1). PC1 representa la mayor variación ya que es el corte transversal más grande que se puede dibujar en la elipse. La dirección de PC1 es el vector eigen, y su magnitud es el valor eigen. El ángulo del eje x para PC1 es el ángulo de rotación que se utiliza en la transformación.
- Se calcula una línea ortogonal perpendicular a PC1. Esta línea es el segundo componente principal (PC2) y el nuevo eje para el eje y original (vea la siguiente figura). El nuevo eje describe la variación mayor no descrita por PC1.
Mediante el uso de los vectores eigen, los valores eigen y la matriz de covarianza calculada de la entrada del ráster multibanda, se crea una fórmula lineal que define los cambios y la rotación. Esta fórmula se aplica para transformar cada valor de celda en relación al nuevo eje.
Ejemplo
El siguiente es un ejemplo del archivo de datos de salida que se creó para los tres componentes principales:
COVARIANCE MATRIX # Layer 1 2 3 # ----------------------------------------------------------- 1 34.1763 31.2377 51.8100 2 31.2377 212.6159 99.9540 3 51.8100 99.9540 118.8057 # =========================================================== # CORRELATION MATRIX # Layer 1 2 3 # ----------------------------------------------------------- 1 1.0000 0.3665 0.8131 2 0.3665 1.0000 0.6289 3 0.8131 0.6289 1.0000 # =========================================================== # EIGENVALUES AND EIGENVECTORS # Number of Input Layers Number of Principal Component Layers 3 3 # PC Layer 1 2 3 # ----------------------------------------------------------- # Eigen Values 287.8278 69.8781 7.8920 # Eigen Vectors # Input Layer 1 0.2112 0.4718 0.8560 2 0.8116 -0.5727 0.1154 3 0.5447 0.6704 -0.5039 # ===========================================================
Referencias
Campbell, James B. Introduction to Remote Sensing. The Guilford Press. 1987.
Jensen, John R. Introductory Digital Image Processing: A Remote Sensing Perspective. Prentice-Hall. 1986.
Lillesand, Thomas M. y Ralph W. Kiefer. Remote Sensing and Image Processing. John Wiley e hijos. 1987.
Richards, John A. Remote Sensing Digital Image Analysis: An Introduction. Berlín: Springer-Verlag. 1986.