Almacenar datos ráster en una geodatabase
Almacene los datos ráster en la geodatabase cuando desee administrar los rásteres, agregar comportamiento y controlar el esquema; cuando desee administrar un conjunto bien definido de datasets ráster como parte del DBMS; y cuando necesite una arquitectura de datos para administrar todo el contenido. Hay tres tipos principales de geodatabases: de ArcSDE, personales y de archivos.
El comportamiento funcional de cada geodatabase es básicamente el mismo; no obstante, al algunas excepciones para herramientas o procedimientos específicos. Para obtener información sobre las diferencias en el comportamiento de una herramienta o procedimiento, consulte la herramienta o el procedimiento específico con este sistema de ayuda.
Una de las pocas diferencias que hay con las geodatabases de archivos tiene que ver con las consultas SQL en catálogos de ráster. Para obtener más información sobre esto, vea Migrar a la geodatabase de archivos.
Almacenar datos ráster en una geodatabase de archivos
El modelo de almacenamiento de las geodatabases de archivos es un híbrido entre la geodatabase de ArcSDE y la geodatabase personal, donde los datos de ráster administrados siguen el modelo de la geodatabase de ArcSDE y los datos de ráster no administrados siguen el modelo de almacenamiento de la geodatabase personal. Las geodatabases de archivos también se asemejan a las personales, porque están diseñadas para ser editadas por un solo usuario y no son compatibles con el control de versiones. Residen en el directorio del sistema de archivos, así que no necesitan contraseña para el acceso. Las geodatabases de archivos y las geodatabases de ArcSDE comparten el mismo esquema de almacenamiento básico.
Una geodatabase de archivos tiene varias ventajas sobre el uso de una geodatabase personal. Como ArcSDE, la geodatabase de archivos almacena datos en bloques. Esto proporciona un acceso más eficaz a los datos, especialmente durante la operación de mosaico. Al crear un mosaico de datos en una geodatabase de archivos, solo se actualizan los bloques superpuestos. Si no existe un bloque superpuesto, se inserta un bloque nuevo. Los bloques parciales se rellenan con píxeles NoData. Además, el modelo de almacenamiento de geodatabase de archivos (y ArcSDE) emplea actualizaciones de pirámide parciales, lo que ahorra tiempo. Dado que la estructura de datos de la geodatabase de archivos es igual que la de ArcSDE, se utiliza tecnología de copia rápida para copiar y pegar los datos entre la geodatabase de archivos y una geodatabase de ArcSDE.
La geodatabase de archivos acepta también palabras clave de configuración pero, a diferencia de ArcSDE, las palabras clave de configuración tienen un valor estándar predefinido. Para obtener más información sobre las palabras clave de configuración, vea Palabras clave de configuración para geodatabases de archivos.
De forma predeterminada, la geodatabase de archivos tiene un límite de 1 terabyte (TB) por dataset. Cada dataset de la geodatabase de archivos puede tener un tamaño máximo de 1 TB, pero puede tener varios datasets de 1 TB dentro de cualquier geodatabase de archivos concreta. Puede aumentar este límite para cada dataset mediante la palabra clave de configuración MAX_FILE_SIZE_256TB.
El esquema básico de geodatabase de archivos se compone de cinco tablas dispuestas en una jerarquía: la tabla de negocios se encuentra en la cima de la jerarquía, mientras otras cuatro tablas subordinadas almacenan los metadatos ráster y los datos de píxel. La tabla de negocios también contiene una columna de entidades, que mantiene el sobre del ráster. La columna de entidades se combina con una tabla de entidades que almacena realmente los sobres de entidad. La tabla de bloques ráster, que es la más grande, almacena la información de píxel real y las pirámides. Todas estas tablas se almacenan en un formato de archivo nativo oculto y, en consecuencia, no es posible acceder a ellas directamente. La tabla de bloques de ráster almacena los datos de píxel como una columna BLOB, una fila por bloque por banda y por nivel de pirámide.
Las bandas están ordenadas en mosaico en bloques de píxeles según una dimensión definida por el usuario: el valor predeterminado es 128 por 128 píxeles. Ordenar en teselas los datos de bandas de ráster permite un almacenamiento y una recuperación eficaces de los datos ráster. La información de la pirámide se almacena según una resolución en descenso. De manera predeterminada, la altura de la pirámide está definida por el número de niveles, ya sea por la aplicación o automáticamente por el sistema.
Un catálogo de ráster se almacena como varias filas en la tabla de negocios, mientras que un dataset ráster se mantiene como una fila única. El esquema de tabla del dataset ráster es igual que el del catálogo de ráster. Cada fila de un catálogo de ráster almacena realmente un dataset ráster. La extensión de cada dataset ráster dentro de un catálogo de ráster se mantiene en la columna de entidades de la tabla de negocios del catálogo.
Un dataset de mosaico se almacena como una colección de hasta nueve tablas. Las tablas de catálogo, límite, registro y tipo de ráster se crean cuando se crea un dataset de mosaico. Las tablas de niveles, vistas generales, corrección de color, línea de unión y estéreo se crean bajo demanda. Por ejemplo, la tabla de niveles se crea cuando se calcula el tamaño de las celdas del dataset de mosaico.
Un campo de ráster agregado a una tabla o clase de entidad se llama atributo de ráster. Los atributos de ráster y los catálogos de ráster tienen el mismo esquema. Cada registro de la tabla o clase de entidad que tenga un campo ráster tendrá un valor de atributo para la columna de tipo RASTER que lo combina con sus tablas de esquema ráster asociadas.
Los datasets de mosaico, los catálogos de ráster relacionados y los atributos de ráster no administrados no almacenan los datos ráster en las tablas ráster constitutivas. En su lugar, cada valor de la columna ráster de la tabla de negocios hacer referencia a las imágenes almacenadas en disco. La eliminación de una fila de un catálogo de ráster relacionado o de un dataset de mosaico provoca la eliminación de la referencia al archivo de imagen; el propio archivo de imagen permanece intacto.
Almacenar datos ráster en una geodatabase de ArcSDE
El almacenamiento de datos ráster en la geodatabase de ArcSDE ofrece un nivel de funcionalidad de empresa, por ejemplo seguridad, acceso multiusuario y uso compartido de datos. A continuación se explican las tres razones principales para almacenar datos ráster en ArcSDE:
- No se actualizarán con mucha regularidad (por ejemplo, cada dos o tres años o más).
- Se accederá a ellos en casos de uso de solo lectura (por ejemplo, utilizándolos como datos de mapa base bajo datos vectoriales).
- Cientos de usuarios (o más) tendrán acceso a ellos como un mapa base.
Debido a su estructura de almacenamiento, se dice que los datos ráster son administrados, o totalmente controlados, por la geodatabase. Las geodatabases de ArcSDE siempre almacenan toda la información de ráster (píxeles, referencia espacial, cualquier tabla asociada y otros metadatos) de los datasets ráster, catálogos de ráster y atributos de ráster en la base de datos relacional asociada (por ejemplo, Oracle, SQL Server, DB2 o Informix). Esto significa que toda la información de ráster de entrada se carga en la base de datos y se puede considerar una conversión de formato.
Al almacenar un dataset ráster en ArcSDE, puede haber hasta siete tablas constitutivas. La tabla principal es la tabla de negocios, que tendrá, como mínimo, una columna de ráster y una columna de ID de fila. En el caso de un atributo de ráster, esa columna de ráster podría ser la única otra columna además de la columna de ID de fila requerida en una tabla de negocios.
Para todos los otros modelos ráster, incluidos el dataset de mosaico, dataset ráster y catálogo de ráster, la tabla de negocios incluye una columna de geometría que contiene la huella de ráster. También habrá una columna de geometría en la tabla de negocios si se agrega un atributo de ráster a una clase de entidad. La columna de geometría puede tener dos tablas asociadas. Una es la tabla de entidades que almacena los datos de geometría reales. La tabla de entidades, también conocida como tabla F, está presente si el tipo de almacenamiento de geometría es ESRI binario. La tabla de entidades estará ausente si se emplea un tipo de almacenamiento relacional de objetos como ESRI o IBM ST_GEOMETRY o un tipo Oracle SDO_GEOMETRY. La columna de geometría también tendrá una tabla de índice espacial, también conocida como una tabla S, asociada, a menos que se emplee un índice de árbol-R. Informix, PostgreSQL y Oracle Spatial emplean un índice de árbol-R.
Otra tabla que siempre está presente y asociada a la columna de ráster es la tabla de bloques de ráster. Almacena los datos ráster de todos los modelos ráster, excepto el dataset de mosaico. En el caso del dataset de mosaico, esta tabla se mantiene vacía, dado que los datos ráster de un dataset de mosaico no se almacena en el DBMS; los datos ráster se relacionan con un archivo de imagen.
Si la tabla de bloques de ráster almacena datos ráster, será la más grande de todas las tablas de una geodatabase de ArcSDE y, en función del tamaño del ráster, podría necesitar un manejo del almacenamiento especial, como una configuración DBTUNE dedicada. El tipo de almacenamiento de ráster Oracle SDO_GEORASTER tiene una tabla de bloques de ráster, pero no tiene ninguna otra tabla de rásteres asociada a ella.
La tabla auxiliar de rásteres almacena metadatos de bandas de ráster opcionales que incluyen estadísticas de ráster, transformación de coordenadas y un mapa de color. En el caso de los datasets de mosaico, la tabla auxiliar de rásteres también contiene el ráster de función.
La columna de ráster también tiene una tabla de rásteres asociada y una tabla de bandas de ráster si se utiliza el tipo de almacenamiento de ráster predeterminado ESRI binario. Sin embargo, si se utiliza el tipo de almacenamiento relacional de objetos ST_RASTER opcional, estas dos tablas están ausentes.
La tabla de entidades contiene la huella del dataset ráster, que es la misma que cuando se tiene una clase de entidad: una tabla almacena la geometría y las demás la información de índice espacial. Para cada dataset ráster, hay una fila en la tabla de entidades que almacena el continente de entidades.
Las tablas de almacenamiento de rásteres incluyen:
- Tabla de negocios: almacena atributos así como columnas de ráster y geometría
- Tabla auxiliar de rásteres (AUX): almacena metadatos opcionales, como estadísticas de ráster, un mapa de color o información de transformación de coordenadas
- Tabla de bloques de ráster (tipos BLK para ESRI y RDT para Oracle SDO_GEORASTER): almacena los píxeles de cada bloque de una banda de ráster
La tabla de bloques es la mayor y la que almacena la información de píxel real y las pirámides.
- Tabla de bandas de ráster (BND): almacena información de bandas
- Tabla de rásteres (RAS): almacena un registro de cada dataset ráster
ArcSDE ordena uniformemente en tesela las bandas en bloques de píxeles según una dimensión definida por el usuario (el valor predeterminado es 128 por 128). Ordenar en teselas los datos de bandas de ráster permite un almacenamiento y una recuperación eficaces de los datos ráster. La información de la pirámide se almacena según una resolución en descenso. El número de niveles especificado por la aplicación o el usuario determina la altura de la pirámide.
La tabla de bloques de ráster almacena una fila por bloque (tesela) por banda en un dataset ráster y por nivel de pirámide. Por ejemplo, un ráster de tres bandas dividido en 12 bloques sin pirámides generadas tendrá 36 filas en la tabla BLK: 12 bloques independientes para cada una de las bandas. La columna que contiene los datos de píxel del bloque es un objeto binario grande (BLOB).
El dataset de mosaico y el catálogo de ráster se almacenan en ArcSDE como varias filas en la tabla de negocios, mientras que un dataset ráster es solo una fila única en la tabla de negocios. El esquema de tabla es igual que el de un dataset ráster. La única diferencia es que la tabla de entidades tendrá muchas filas, mientras que en el catálogo de ráster cada fila representa la extensión de un dataset ráster. Además, un dataset de mosaico puede contener un puntero al dataset ráster almacenado fuera de la geodatabase de ArcSDE.
Al almacenar un dataset ráster como un atributo, su arquitectura de almacenamiento es la misma que para los catálogos de ráster. Cada registro de la tabla de negocios tendrá un valor de atributo para la columna de tipo de RÁSTER. Este atributo se utilizará para relacionar la tabla de negocios con las tablas de rásteres auxiliares. Al cargar la imagen, se convertirá en un formato ráster de ArcSDE y los píxeles se almacenarán en la tabla de bloques de ráster.
Almacenar datos ráster en una geodatabase personal
En una geodatabase personal, el dataset ráster se convierte en un archivo Imagine (.img) y se almacena dentro de una carpeta de base de datos de imágenes (IDB). La carpeta IDB se encuentra en el directorio situado junto a la geodatabase personal. Al eliminar un dataset ráster, el ráster de la carpeta IDB se elimina de forma permanente.
Al almacenar un dataset de mosaico o un catálogo de ráster en una geodatabase personal, el dataset de mosaico o el catálogo de ráster es una tabla que apunta a los datasets ráster almacenados que contiene. En un dataset de mosaico, los datasets ráster se almacenan como relacionados, mientras que en un catálogo de ráster, los datasets ráster se pueden almacenar como administrados o relacionados. Si están administrados, la entrada de la tabla del catálogo de ráster apunta a la ubicación en el archivo IDB donde está almacenado el dataset ráster. La carpeta IDB se organiza de modo que se pueda relacionar con una fila de un catálogo de ráster. En un caso relacionado, el dataset de mosaico o el catálogo de ráster contiene la ubicación de ruta donde están almacenados los datasets ráster. Cada fila de la tabla de negocios del catálogo de ráster apunta al dataset ráster almacenado. Las operaciones en un dataset de mosaico o catálogo de ráster relacionado no afectan a los archivos de ráster almacenados; por tanto, si elimina los datasets ráster de un dataset de mosaico o catálogo de ráster, solo se eliminarán del catálogo de ráster y no del disco.
Al almacenar un dataset ráster como un atributo, el ráster se almacena como un archivo IMG en la ubicación definida por el sistema o tal cual en el sistema de archivos; esto depende de si está administrado o no. El almacenamiento es similar al de un catálogo de ráster.
Comparación del almacenamiento de rásteres en geodatabases de archivos, personales y de ArcSDE
Característica de almacenamiento de ráster |
Geodatabase de archivos |
Geodatabase personal |
Geodatabase de ArcSDE |
---|---|---|---|
Límite de tamaño |
1 TB para cada dataset ráster o catálogo de ráster |
2 gigabytes (GB) por geodatabase (éste es un límite de tamaño de tabla, no un límite de tamaño de dataset ráster) |
Sin límite; el límite depende de los límites del DBMS |
Formato de archivo de dataset ráster |
Dataset ráster de geodatabase de archivos |
ERDAS IMAGINE, JPEG o JPEG 2000 |
Dataset ráster de ArcSDE |
Almacenamiento |
|
|
|
Se almacena en el sistema de archivos |
Se almacena en Microsoft Access |
Se almacena en un RDBMS |
|
Compresión |
LZ77, JPEG, JPEG 2000 o ninguna |
LZ77, JPEG, JPEG 2000 o ninguna |
LZ77, JPEG, JPEG 2000 o ninguna |
Pirámides |
Admite la piramidación parcial |
Regenera la pirámide completa |
Admite la piramidación parcial |
Mosaico |
Permite anexar a un dataset ráster al disponer en mosaico |
Reescribe un nuevo dataset cada vez que se dispone en mosaico a un dataset ráster |
Permite anexar a un dataset ráster al disponer en mosaico |
Actualización |
Permite la actualización incremental |
Permite la actualización incremental |
|
Número de usuarios |
Un único usuario y grupos de trabajo pequeños; algunos lectores y un escritor |
Un único usuario y grupos de trabajo pequeños; algunos lectores y un escritor |
Multiusuario; muchos usuarios y muchos escritores |
Datos ráster administrados frente a relacionados
Hay dos formas de almacenar los datos ráster en una geodatabase, de forma administrada o de relacionada. Las geodatabases siempre almacenan los datasets ráster como un origen administrado.
Los catálogos de ráster y los rásteres como atributos pueden utilizar los orígenes administrados o relacionados.
Los datasets de mosaico siempre se almacenan como relacionados.
En una geodatabase de ArcSDE, los datasets ráster y los catálogos de ráster siempre se almacena como administrados.
Los datos ráster de geodatabases de archivos administrados se almacenan en disco en un formato en tesela propio directamente compatible con el almacenamiento de ArcSDE de datos ráster (incluidos los tipos de compresión de ráster de ArcSDE). Esto convierte a la geodatabase de archivos, solución de ráster administrada, en una opción excelente para la transferencia de datos entre las instancias de ArcSDE (que no tienen conectividad de red entre ellas). Esta funcionalidad sustituye a los flujos de trabajo de transferencia de datos anteriores como exportación o importación de SDE y exportación o importación de base de datos (por ejemplo, espacios de tabla transportables y bases de datos aisladas).
Los datos ráster de geodatabases personales administrados se almacenan en disco como uno de tres formatos de ráster basados en archivos comunes que ArcGIS puede escribir: ERDAS IMAGINE, JPEG o JPEG 2000. El formato de archivo de ráster utilizado para almacenar los datos es seleccionado internamente por ArcGIS y se basa en el tipo de compresión empleado; por tanto, si selecciona una compresión JPEG, el archivo se almacena mediante el formato JPEG, mientras que si selecciona ninguna compresión o LZ77, el ráster se almacena mediante el formato ERDAS IMAGINE. Los datasets ráster de entrada se convierten de su formato original y se almacenan en una carpeta especial (IDB) que reside junto al archivo .mdb de la geodatabase personal. La geodatabase personal administra estos archivos de ráster en función de las acciones del usuario. (Ninguna de la información de píxel se almacena dentro de la base de datos de Microsoft Access subyacente).
Las implementaciones de ráster de geodatabases de archivos y personales relacionadas simplemente apuntan a los archivos de ráster existentes en disco que ArcGIS puede leer. En estos escenarios, la geodatabase no administra los archivos de ráster, sino solo las tablas relacionadas con ellos. Los datasets de mosaico de geodatabases de archivos y personales relacionados, los catálogos de ráster y los rásteres como atributos son los más rápidos de generar, ya que no se produce ninguna conversión de formato de ráster ni copia de datos de píxel.
Compresión, pirámides y tamaño de tesela
Hay otras estructuras de almacenamiento a considerar al almacenar datos en una geodatabase, como la compresión, las pirámides y el tamaño de tesela.
Los tres tipos de geodatabases pueden almacenar datos ráster mediante una de tres técnicas de compresión: LZ77 (sin pérdida de información), JPEG (con pérdida de información) o JPEG 2000 (con pérdida de información). Una compresión sin pérdida de información significa que los valores de píxeles del dataset ráster no se modifican, mientras que la compresión con pérdida de información produce valores de píxel alterados. La cantidad de compresión depende del tipo de datos de píxel; cuanto más homogénea sea la imagen, más alta será la tasa de compresión. Debería almacenar los datos que se vayan a utilizar para el análisis, no solo para mostrar, mediante una compresión sin pérdida de información. La principal ventaja de comprimir los datos es que se necesita menos espacio de almacenamiento; la cantidad de ahorro depende del método de compresión y la redundancia de los datos. Una ventaja adicional es la impresionante mejora de rendimiento debido a la transferencia de menos paquetes de datos. Por ejemplo, al acceder a datos ráster a través de una red con un ancho de banda bajo, el uso de compresión puede ofrecer un rendimiento mejorado porque la cantidad de información que se va a transferir se reduce considerablemente, lo que permite almacenar datasets ráster sin uniones grandes y catálogos de ráster (hasta de varios terabytes) y proporcionarlos rápidamente a un cliente para su visualización.
Más información sobre compresión de ráster
Las pirámides son representaciones de resolución reducida de un dataset que se almacenan junto a los datos. Siempre se recomienda generar pirámides. Las pirámides pueden acelerar la visualización de datos ráster porque ArcGIS solo necesita procesar la extensión y la resolución necesarias para la visualización en lugar de remuestrear el dataset completo. Al agrandar desde la extensión completa, se utilizan pirámides con resolución más detallada para mostrar la imagen.
Las pirámides se crean al remuestrear los datos originales en varias capas diferentes, cada una de las cuales representa una resolución mayor. Los métodos de remuestreo indican al servidor cómo remuestrear los datos para generar las pirámides. Se debería utilizar el vecino más próximo para datos discretos (nominales) o datasets ráster con mapas de color, como uso del suelo o imágenes de pseudocolor. Se debería utilizar la interpolación bilineal o la convolución cúbica para datos continuos, como imágenes de satélite o fotografías aéreas. Se recomienda crear prototipos de la técnica de remuestreo más adecuada para sus datos. Recuerde que el remuestreo de la pirámide solo afecta a la visualización, no a los datos originales.
Más información sobre pirámides de ráster
Al trabajar con geodatabases de archivos y de ArcSDE, ArcGIS permite seleccionar el número de niveles y la técnica de remuestreo, ajustando las pirámides de una manera que optimiza el rendimiento de la visualización de su aplicación. Al actualizar parte de un dataset ráster en una geodatabase de archivos o de ArcSDE, tiene que actualizar únicamente la parte de la pirámide que contiene los cambios. Como resultado, puede finalizar la actualización en una fracción del tiempo que llevan otras implementaciones, ya que no tiene que reescribir el dataset ráster completo ni todas sus pirámides. Además, durante una actualización, otros usuarios pueden seguir accediendo al dataset ráster con solo una pequeña disminución del rendimiento.
En la geodatabase de ArcSDE, los datos ráster se almacenan en una estructura donde están ordenados en tesela, indizados, piramidados y, muy frecuentemente, comprimidos. Debido al ordenamiento en teselas, la indización y la piramidación, cada vez que se consultan los datos ráster, solo se devuelven las teselas necesarias para satisfacer la extensión y resolución de la consulta, en lugar de todo el dataset. El tamaño de tesela controla el número de píxeles que desea almacenar en cada bloque de memoria de base de datos. Se especifica como un número de píxeles en X e Y. El tamaño de tesela predeterminado es 128 por 128 píxeles y la mayoría de las aplicaciones no garantiza la desviación de estos valores predeterminados. En la geodatabase de ArcSDE, las teselas de datos ráster se comprimen antes del almacenamiento en la geodatabase.
Importar rásteres
Los datos ráster se importan a una geodatabase a través de la interfaz de usuario de varias maneras. Los datos ráster se pueden importar a una geodatabase mediante el menú de acceso directo Importar al hacer clic en una geodatabase. Los datos también se pueden cargar en un dataset ráster o catálogo de ráster de una geodatabase con el comando Cargar datos de ArcCatalog. Se pueden utilizar varias herramientas de geoprocesamiento para cargar o importar datos a la geodatabase, por ejemplo, la herramienta Copiar ráster se puede utilizar para importar datasets ráster, la herramienta Espacio de trabajo a dataset ráster carga y dispone en mosaico todos los datasets ráster almacenados en el espacio de trabajo especificado en un dataset ráster y la herramienta Espacio de trabajo a catálogo de ráster carga todos los datasets ráster almacenados en el mismo espacio de trabajo en un catálogo de ráster existente. La herramienta Agregar rásteres a dataset de mosaico solo agrega punteros a los datos de origen de un dataset de mosaico y no mueve ni carga los datos ráster a la ubicación del dataset de mosaico.
Más información sobre la carga e importación de dataset ráster