Notions de base du géoréférencement d'un jeu de données raster
Les données raster sont généralement obtenues par numérisation de cartes ou acquisition de photographies aériennes et d'images satellite. Les jeux de données des cartes numérisées ne contiennent généralement pas d'informations de références spatiales (incorporées au fichier ou dans un fichier séparé). Avec la photographie aérienne et l'imagerie par satellite, il arrive que les informations de localisation fournies soient inadéquates et que les données ne s'alignent pas correctement avec certaines de vos données. Ainsi, pour pouvoir utiliser certains jeux de données raster avec d'autres données spatiales, vous devrez peut-être les aligner (ou les géoréférencer) en fonction d'un système de coordonnées cartographiques. Un système de coordonnées est défini par une projection cartographique (méthode par laquelle la surface courbe de la Terre est représentée sur une surface plane).
Lorsque vous géoréférencez un jeu de données raster, vous définissez sa localisation à l'aide de coordonnées cartographiques et lui affectez le système de coordonnées du bloc de données. Le géoréférencement de données raster permet de les visualiser, de les interroger et de les analyser avec d'autres données géographiques.
Pour géoréférencer un jeu de données raster, suivez les étapes ci-dessous :
- Dans ArcMap, ajoutez le jeu de données raster que vous souhaitez aligner avec les données projetées.
- Ajoutez les points de contrôle qui lient les positions connues du jeu de données raster aux positions connues des coordonnées géographiques.
- Enregistrez les informations de géoréférencement lorsque le résultat de l'alignement (désigné également sous le nom d'inscription) vous convient.
- Vous pouvez, éventuellement, transformer le jeu de données raster de manière permanente.
Pour accéder à une démonstration de géoréférencement d'un jeu de données raster, consultez le Centre de ressources ArcGIS ArcGIS Resource Center.
Alignement du raster sur les points de contrôle
En général, un jeu de données raster est géoréférencé à l'aide de données spatiales existantes (données cible), telles qu'une classe d'entités vectorielles résidant dans le système de coordonnées cartographiques approprié. Ce processus implique l'identification d'une série de points de contrôle au sol (coordonnées x,y connues) qui relient des emplacements du jeu de données raster aux emplacements des données référencées spatialement (données cibles). Les points de contrôle sont des emplacements qui peuvent être identifiés avec précision sur le jeu de données raster et à l'aide de coordonnées du monde réel. Différents types d'entités peuvent être utilisés comme emplacements identifiables : intersections de routes ou de cours d'eau, embouchure d'une rivière, affleurements rocheux, extrémité d'une jetée, coin d'un champ établi, coins de rues ou intersection de deux haies.
Les points de contrôle permettent de créer une transformation polynomiale qui déplace le jeu de données raster de son emplacement actuel vers l'emplacement correct. La connexion entre un point de contrôle sur le jeu de données raster (point de départ) et le point de contrôle correspondant sur les données cible alignées (point d'arrivée) est appelée lien.
L'exemple ci-dessous illustre un point de contrôle de départ (croix jaune) placé sur les données cible vectorielles au niveau d'un carrefour et le point de contrôle associé (croix verte) placé sur le jeu de données raster. Le lien associé est représenté par la ligne bleue qui relie les points de contrôle.
Le nombre de liens que vous devez créer dépend de la complexité de la transformation que vous envisagez d'utiliser pour transformer le jeu de données raster en coordonnées cartographiques. Toutefois, l'ajout de liens supplémentaires ne produit pas nécessairement un meilleur résultat. Si possible, vous devez répartir les liens sur la totalité du jeu de données raster plutôt que les concentrer sur une seule zone. Généralement, la présence d'au moins un lien près de chaque angle du jeu de données raster et de quelques-uns à l'intérieur produit les meilleurs résultats.
Dans l'ensemble, plus la zone de superposition entre le jeu de données raster et les données cible est grande, meilleurs sont les résultats de l'alignement puisque vous disposez de points plus largement espacés pour le géoréférencement du jeu de données raster. Par exemple, si les données cible n'occupent qu'un quart de la surface du jeu de données raster, les points à utiliser pour aligner le jeu de données raster sont confinés dans cette surface de superposition. Dès lors, les zones situées hors de la surface de recouvrement risquent de ne pas être correctement alignées.
N'oubliez pas que vos données géoréférencées ne sont pas plus précises que celles sur lesquelles elles sont alignées. Pour réduire les erreurs, vous devez effectuer le géoréférencement sur des données ayant la résolution la plus élevée et avec la plus grande échelle possible.
Transformation du raster
Après avoir créé suffisamment de liens, vous pouvez transformer (ou déformer) le jeu de données raster pour le faire correspondre de façon permanente aux coordonnées géographiques des données cibles. Vous avez le choix entre une transformation polynomiale, par spline ou par ajustement pour déterminer l'emplacement correct des coordonnées cartographiques pour chaque cellule du raster.
La transformation polynomiale utilise une fonction polynomiale axée sur des points de contrôle et un algorithme LSF (Least Square Fitting). Elle est optimisée pour une précision globale, mais ne garantit pas une précision locale. La transformation polynomiale génère deux formules : l'une pour le calcul de la coordonnée x en sortie d'un emplacement (x,y) en entrée et une autre pour le calcul de la coordonnée y d'un emplacement (x,y) en entrée. L'objectif de l'algorithme LSF est d'obtenir une formule générale applicable à tous les points, généralement aux dépens d'un léger mouvement des positions d'arrivée des points de contrôle. Le nombre de points de contrôle non corrélés requis pour cette méthode doit être de 3 pour un premier ordre, 6 pour un deuxième ordre et 10 pour un troisième ordre. La transformation polynomiale de premier ordre est fréquemment utilisée pour géoréférencer une image.
L'équation ci-dessous permet de transformer un jeu de données raster à l'aide de la transformation polynomiale (premier ordre). Dans cet exemple, vous pouvez voir comment six paramètres définissent la transformation des lignes et colonnes d'un raster sur des coordonnées cartographiques.
Utilisez une transformation de premier ordre ou affine pour le déplacement, la mise à l'échelle et la rotation d'un jeu de données raster. Ceci se traduit généralement par le fait que les lignes droites du jeu de données raster sont transposées en lignes droites dans le jeu de données raster déformé. Ainsi, les carrés et rectangles du jeu de données raster sont généralement remplacés par des parallélogrammes dont la mise à l'échelle et l'orientation des angles sont arbitraires.
Avec un minimum de trois liens, l'équation mathématique utilisée avec une transformation de premier ordre peut exactement transposer chaque point du raster sur l'emplacement cible. Un nombre de liens supérieur à trois introduit des erreurs, ou résidus, qui sont distribués sur tous les liens. Toutefois, il est recommandé d'ajouter plus de trois liens car si le positionnement de l'un d'entre eux est incorrect, l'impact sur la transformation est beaucoup plus important. Ainsi, même si l'erreur de transformation mathématique peut augmenter avec la création de liens supplémentaires, la précision générale de la transformation augmente également.
Plus l'ordre de transformation est élevé, plus la déformation pouvant être corrigée est complexe. Toutefois, des transformations supérieures à un troisième ordre sont rarement nécessaires. Des transformations d'ordre plus élevé nécessitent un plus grand nombre de liens et impliquent, par conséquent, une durée de traitement progressivement plus importante. En général, si le jeu de données raster doit faire l'objet d'un étirement, d'une mise à l'échelle et d'une rotation, utilisez une transformation de premier ordre. En revanche, si le jeu de données raster doit être courbé ou incurvé, utilisez une transformation de deuxième ou de troisième ordre.
La transformation par spline est une méthode d'étirement caoutchouté réel qui optimise la précision locale mais pas la précision globale. Cette transformation s'appuie sur une fonction de spline, une fonction polynomiale segmentée qui garantit la continuité et le lissage entre des polynômes adjacents. Le spline transforme les points de contrôle source en points de contrôle cible ; la précision des pixels éloignés des points de contrôle n'est pas garantie. Ce type de transformation s'avère utile lorsque les points de contrôle sont importants et doivent être inscrits avec précision. L'ajout de points de contrôle supplémentaires peut augmenter la précision globale de la transformation par spline. Un spline nécessite au moins dix points de contrôle.
La transformation par ajustement optimise la précision locale et l'algorithme des moindres carrés (LSF) global. Elle repose sur un algorithme qui combine une transformation polynomiale et des techniques d'interpolation de réseau triangulé irrégulier (TIN). La transformation par ajustement effectue une transformation polynomiale à l'aide de deux jeux de points de contrôle et ajuste les points de contrôle localement pour qu'ils correspondent mieux aux points de contrôle cible, à l'aide d'une technique d'interpolation de TIN. Ce type de transformation nécessite au moins trois points de contrôle.
Interprétation de l'erreur quadratique moyenne
Lorsque la formule générale est calculée et appliquée au point de contrôle, une mesure d'erreur (erreur résiduelle) est renvoyée. L'erreur correspond à la différence entre la position finale du point d'origine par rapport à l'emplacement réel spécifié (point de destination). L'erreur totale se calcule en prenant la somme des erreurs quadratiques moyennes (EQM) de tous les résidus pour le calcul de l'erreur EQM. Cette valeur décrit l'homogénéité de la transformation entre les différents points de contrôle (liens). Lorsque l'erreur est particulièrement importante, vous pouvez supprimer et ajouter des points de contrôle pour la corriger.
Bien que l'erreur EQM soit une bonne évaluation de la précision de la transformation, ne confondez pas une erreur EQM faible avec un résultat précis. Par exemple, la transformation peut encore contenir des erreurs significatives, dues à un point de contrôle saisi incorrectement. La précision de la conversion des données en entrée en coordonnées en sortie par la transformation polynomiale augmente avec le nombre de points de contrôle de qualité équivalente utilisés. Généralement, les transformations par ajustement et par spline produisent une erreur EQM nulle ou proche de zéro ; cela ne garantit toutefois pas un géoréférencement parfait de l'image.
Rééchantillonnage du jeu de données raster
Lorsque vous rectifiez, transformez, projetez, rééchantillonnez un jeu de données raster, que vous le convertissez d'une projection vers une autre ou que vous modifiez la taille de cellule, vous effectuez en réalité une transformation géométrique. Ce type de transformation consiste à modifier la géométrie d'un jeu de données raster d'un espace de coordonnées vers un autre. Il existe plusieurs types de transformation géométrique : étirement caoutchouté (utilisé généralement pour le géoréférencement), projection (utilisation des informations de projection pour transformer les données d'une projection vers une autre), translation (décalage de toutes les coordonnées d'une égale distance), rotation (rotation de toutes les coordonnées selon un certain angle) et modification de la taille de cellule du jeu de données.
Une fois la transformation géométrique appliquée au raster en entrée, le centre des cellules de ce raster s'aligne rarement sur celui du raster en sortie ; des valeurs doivent toutefois être affectées aux centres.
Vous pensez peut-être que chaque cellule d'un jeu de données raster est transformée en son nouvel emplacement de coordonnée cartographique ; en réalité, le processus fonctionne dans le sens inverse. Au cours du géoréférencement, une matrice de cellules "vides" est calculée en utilisant les coordonnées cartographiques. Chaque cellule vide reçoit une valeur sur la base du processus de ré-échantillonnage.
Les trois techniques de ré-échantillonnage les plus fréquentes sont les suivantes : voisin le plus proche, interpolation linéaire et convolution cubique. Ces techniques affectent une valeur à chaque cellule vide en examinant les cellules dans le jeu de données raster non géoréférencé.
L'affectation par le voisin le plus proche est la technique de ré-échantillonnage la plus rapide et la mieux adaptée aux données catégorielles ou thématiques car elle ne modifie pas la valeur des cellules en entrée. Lorsque l'emplacement du centre de la cellule sur un jeu de données raster en sortie est localisé sur le raster en entrée, l'affectation par le voisin le plus proche détermine l'emplacement du centre de la cellule la plus proche sur le raster en entrée et attribue la valeur de cette cellule à la cellule sur le raster en sortie.
L'affectation par le voisin le plus proche ne modifie aucune des valeurs des cellules du jeu de données raster en entrée. La valeur 2 dans le raster en entrée restera la valeur 2 dans le raster en sortie et ne sera jamais 2.2 ou 3. Comme les valeurs des cellules en sortie restent inchangées, l'affectation par voisin le plus proche doit être utilisée pour les données nominales ou ordinales où chaque valeur représente une classe, un membre ou une classification (il peut s'agir de données catégorielles, telles que l'occupation des sols ou d'un type de sol ou de forêt).
L'interpolation bilinéaire utilise la valeur du centre des quatre cellules en entrée les plus proches pour déterminer la valeur du raster en sortie. La nouvelle valeur pour la cellule en sortie correspond à la moyenne pondérée de ces quatre valeurs, ajustée pour tenir compte de la distance les séparant du centre de la cellule en sortie dans le raster en entrée. Cette méthode d'interpolation crée une surface à l'aspect plus lisse qu'avec l'affectation par le voisin le plus proche.
Puisque les valeurs des cellules en sortie sont calculées en fonction de la position relative et de la valeur des cellules en entrée, l'interpolation bilinéaire est préférable pour les données où l'emplacement à partir d'un point ou phénomène connu définit la valeur attribuée à la cellule (c'est-à-dire, des surfaces continues). L'altitude, la pente, l'intensité du bruit d'un aéroport et la salinité de l'eau près d'un estuaire sont tous des phénomènes représentés sous la forme de surfaces continues et qui sont ré-échantillonnés à l'aide de l'interpolation bilinéaire.
La convolution cubique est semblable à l'interpolation bilinéaire, si ce n'est que la moyenne pondérée est calculée à partir des centres des 16 cellules en entrée les plus proches et de leurs valeurs. La convolution cubique a tendance à davantage affiner les données que l'interpolation bilinéaire car le calcul de la valeur en sortie intègre plus de cellules. Cette méthode est donc utilisée le plus souvent lors du rééchantillonnage d'images, telles que des photographies aériennes et des images satellite.
L'interpolation bilinéaire ou la convolution cubique ne doivent pas être utilisées sur des données catégorielles, puisque les catégories ne sont pas conservées dans le jeu de données raster en sortie. Cependant, les trois techniques peuvent s'appliquer aux données continues, le voisin le plus proche produisant la sortie la plus rugueuse, l'interpolation bilinéaire la sortie la plus lisse et la convolution cubique les résultats les plus fins. Lorsque vous entreprenez un vaste projet de ré-échantillonnage, il est conseillé de créer un prototype, en utilisant plusieurs techniques de ré-échantillonnage pour évaluer avec précision la méthode la mieux adaptée pour vos données.
Pertinence de la rectification d'un raster
Vous pouvez transformer définitivement votre jeu de données raster après l'avoir géoréférencé à l'aide de la commande Rectifier de la barre d'outils Géoréférencement ou de l'outil Déformation. Vous pouvez également stocker les informations de transformation séparément dans un nouveau fichier à l'aide de la commande Mettre à jour le géoréférencement de la barre d'outils Géoréférencement.
La rectification ou la déformation crée un nouveau jeu de données raster qui est géoréférencé à l'aide des coordonnées cartographiques et de la référence spatiale. Vous pouvez l'enregistrer aux formats BIL, BIP, BMP, BSQ, DAT, GIF, GRID, IMG, JPEG, JPEG 2000, PNG ou TIFF. ArcGIS n'oblige pas à transformer définitivement le jeu de données raster pour l'afficher avec d'autres données spatiales. Cependant, il est recommandé de procéder ainsi si vous souhaitez l'utiliser dans des analyses ou avec un autre progiciel ne reconnaissant pas les informations de géoréférencement externes créées dans le fichier de géoréférencement.
La mise à jour du géoréférencement stocke les informations de transformation dans des fichiers externes ; aucun nouveau jeu de données raster n'est créé, ce qui se passe habituellement lorsque vous transformez définitivement votre jeu de données raster. Dans le cas d'un jeu de données raster basé sur un fichier (TIFF, par exemple), la transformation est généralement stockée dans un fichier XML externe, avec une extension .AUX.XML. Si le jeu de données raster est une image brute, telle qu'un fichier BMP, et si la transformation est affine, il sera écrit dans un fichier de géoréférencement. Dans le cas d'un jeu de données raster situé dans une géodatabase, la commande Mettre à jour le géoréférencement stocke la transformation des géodonnées dans un fichier auxiliaire interne du jeu de données raster.
Une licence ArcEditor ou ArcInfo est obligatoire pour rectifier ou mettre à jour le géoréférencement dans une base de données ArcSDE.