Analyse et gestion des tables

Presque toutes les données SIG sont stockées ou représentées sous la forme d'une simple table de base de données. Par exemple, les classes d'entités sont des tables possédant un attribut de forme (un attribut dans une table est aussi désigné par le terme champ ou colonne), les rasters peuvent être affichés sous la forme de tables d'attributs, et la plupart des bases de données SIG dynamiques ont des tables autonomes qui contiennent des attributs pouvant être reliés à d'autres tables par un attribut commun. Lorsque vous créez une base de données ou que vous effectuez une analyse, vous passez une grande partie de votre temps à gérer des tables, à ajouter et à calculer de nouveaux attributs, à copier des tables ou leurs lignes d'un emplacement vers un autre, à convertir des tables contenant des chaînes de texte de valeurs de coordonnées en entités, à relier une table à une autre, ou à calculer des résumés statistiques.

Certaines analyses nécessitent que les données SIG soient extraites sous la forme de tables pour une autre application, ou les données tabulaires provenant d'une autre application peuvent devenir une entrée pour le SIG. Souvent, plusieurs étapes du géotraitement modifient et associent des ensembles de données, ce qui donne une classe d'entités comptant de nombreux attributs dérivés d'autres données, qui peuvent être sélectionnés ou résumés pour produire des résultats tabulaires.

Création de données SIG à partir de tables

Jointure de tables

Une technique courante consiste à joindre une table de données, telles que des statistiques démographiques ou médicales, à un ensemble d'entités géographiques pour les visualiser. Cette opération nécessite que la table et les entités géographiques partagent un champ clé, tel qu'un nom ou un code d'identification.

Ci-dessous, vous trouverez un exemple de la façon dont des attributs supplémentaires peuvent être donnés aux entités de SIG en joignant des données provenant d'une autre table. Cette classe d'entités des comtés de l'Iowa possède des attributs de nom et code FIPS qui pourraient servir de champs clé pour une jointure de table.

Entités avec un champ clé code ou nom

Cette table autonome contient des informations sur la récolte de graines de soja pour chaque comté de l'Iowa. Elle possède également des attributs de nom et code FIPS, et l'un ou l'autre peut être utilisé pour la joindre aux entités de comté.

Table avec un champ clé nom ou code

Une fois les données de récolte jointes aux entités de comté, vous pouvez utiliser les champs de la table de récolte pour symboliser, étiqueter ou sélectionner les entités de comté.

Entités symbolisées à l'aide de données jointes

Quand vous joignez des données provenant de sources différentes, il est important que les types de données et les valeurs des champs clé correspondent exactement. Si un champ est de type numérique et l'autre de type texte, il ne sera pas possible de faire une jointure à l'aide de ces champs. Pour contourner ce problème, vous pouvez créer un champ dans l'une des tables qui correspond au type de données de l'autre table et calculer les valeurs du champ ne correspondant pas au type du premier champ dans le nouveau champ. Aussi, si une valeur de clé est mal orthographiée, a des orthographes différentes ou contient une erreur typographique ou des caractères superflus (par exemple, un caractère d'espace de fin), les enregistrements contenant des clés sans correspondants ne seront pas joints.

Création d'entités à partir de tables

Une autre technique courante consiste à créer des informations spatiales à partir de données tabulaires.

Evénements XY

La méthode la plus simple pour cela est peut-être d'utiliser l'outil Générer une couche d'événements XY qui crée une couche à partir d'une table contenant un champ de coordonnée x et un champ de coordonnée y. Ci-dessous, vous trouverez un exemple de la façon dont une simple table de coordonnées et d'autres données peut être convertie en événements ponctuels.

Table simple avec coordonnées X et Y et quelques attributs Mise en correspondance d'événements XY à partir d'une table simple

Les événements ponctuels créés à partir de la table se comportent comme une classe d'entités et peuvent être symbolisés et étiquetés à l'aide d'attributs de la table.

Géocodage

Vous pouvez aussi créer des points en appariant des valeurs d'une table par rapport à une classe d'entités de référence. Vous pouvez pour cela recourir au géocodage ; la table contenant les informations d'adresse et la classe d'entités de référence contenant les informations de rue et de surface.

Ci-dessous, vous trouverez un exemple de point créé à partir d'une adresse, en géocodant l'adresse par rapport aux données de rue de référence.

Point géocodé à partir des informations d'adresse dans la table

Référencement linéaire,

Une autre méthode consiste à faire correspondre des emplacements d'après la distance le long d'une ligne, cette méthode est appelée référencement linéaire. Cette méthode permet de créer des événements ponctuels à une distance donnée le long d'une ligne ou des événements linéaires qui suivent la ligne d'un emplacement donné vers un autre.

Ci-dessous, vous trouverez un exemple d'ensemble d'événements ponctuels généré en faisant correspondre une table de mesures de distance et d'identifiants d'itinéraire avec une classe d'entités linéaires contenant des entités d'itinéraire avec les mesures.

Evénements ponctuels créés à une distance le long d'un ensemble d'entités linéaires

Ci-dessous, vous trouverez un exemple d'ensemble d'événements linéaires généré en faisant correspondre une table de mesures depuis et vers et d'identifiants d'itinéraire avec une classe d'entités linéaires contenant des entités d'itinéraire avec les mesures.

Evénements linéaires créés à une distance le long d'un ensemble d'entités linéaires

Analyse de données tabulaires

L'analyse de données tabulaires implique souvent de savoir combien d'éléments appartiennent à une catégorie donnée ou d'examiner la distribution de valeurs pour un ensemble d'éléments. Souvent les choses particulières auxquelles vous vous intéressez sont entourées de beaucoup d'autres qui sont légèrement (ou très) différentes. La recherche d'entités selon ces différences implique souvent d'associer des données provenant de sources différentes en joignant des tables ou par jointure spatiale et superposition, puis en sélectionnant et calculant des valeurs dans les champs.

Recherche d'un nombre

Quelquefois les entités dans vos SIG possèdent des attributs que vous voulez analyser, en trouvant la somme de certains champs pour des entités sélectionnées ou la fréquence d'un type d'entités particulier. Les outils Résumés statistiques et Fréquence de la boîte à outils Statistiques vous permettent de calculer ces statistiques sur un champ ou sur plusieurs champs et de récapituler les résultats d'après les valeurs d'un autre champ. Cela peut être utile pour le reporting aussi bien que pour l'analyse.

Calculer la fréquence avec l'outil Fréquence est un bon moyen de connaître le nombre d'éléments se trouvant dans une catégorie donnée. Par exemple, vous pouvez exécuter l'outil sur un ensemble de parcelles pour voir combien d'entre elles appartiennent à chaque catégorie d'utilisation du sol. L'examen de la distribution de la fréquence de vos données catégorielles est une première étape importante de nombre d'analyses.

Vous pouvez exécuter l'outil Fréquence pour savoir combien de parcelles appartiennent à chaque catégorie

Cette table de fréquence indique presque cinq fois plus de parcelles résidentielles que de parcelles de bureau. Elle indique également qu'une petite minorité de parcelles appartient aux catégories de service public ou institutionnelles.

Vous pouvez aussi recevoir des informations liées à la fréquence d'un champ dans une table d'ArcMap en cliquant avec le bouton droit sur l'en-tête du champ dans la fenêtre de table et en cliquant sur Statistiques.

Examen de la distribution de valeurs

L'outil Résumés statistiques permet de quantifier la quantité d'éléments appartenant à un ensemble d'entités. Par exemple, plutôt que d'utiliser simplement Fréquence pour savoir combien de parcelles de chaque type existent, vous pouvez utiliser l'outil Résumés statistiques sur les parcelles pour calculer la surface totale (somme) de parcelles de chaque catégorie ou pour connaître la taille moyenne des parcelles de chaque type.

Les résumés statistiques vous permettent d'observer la distribution des valeurs numériques

Cette table de résumés statistiques indique que, bien qu'il y ait un plus grand nombre de parcelles industrielles que de parcelles institutionnelles, chaque catégorie couvre une surface semblable de la ville. Elle suggère que les parcelles institutionnelles et de services publics ont tendance à être plus grandes que les parcelles de bureau, résidentielles ou industrielles.

Vous pouvez aussi utiliser l'outil Résumés statistiques pour examiner la distribution de valeurs pour un ensemble d'entités. Par exemple, vous pouvez comparer les valeurs d'altitude minimales et maximales pour plusieurs espèces de plante dans une zone d'étude, les prix des maisons d'un type donné dans une zone ou la différence entre le prix moyen des maisons de ce type et le prix moyen (l'écart type).

Vous pouvez également résumer des tables dans ArcMap, il vous suffit pour cela de cliquer avec le bouton droit sur l'en-tête de colonne du champ dans la fenêtre de la table et de cliquer sur Récapituler.

Pour plus d'informations sur l'utilisation de statistiques dans les SIG, reportez-vous à la rubrique Analyse statistique.

Comptage d'enregistrements

Il est quelquefois important de savoir combien d'enregistrements se trouvent dans une table ou une sélection. Vous pouvez utiliser ces informations dans un modèle ou un script qui automatise une analyse ou un processus de reporting. L'outil Compter renvoie le nombre d'entités ou de lignes dans une classe d'entités, une table ou une couche. L'outil respecte les sélections, les vues tabulaires et les couches basées sur des requêtes. Vous pouvez utiliser l'outil Compter dans un script de boucle qui bufferise une localisation avec une distance progressivement supérieure et sélectionne les entités dans la zone tampon jusqu'à ce qu'un nombre donné d'entités soit sélectionné.

Gestion des données tabulaires

Calcul de valeurs

L'outil Calculer un champ permet d'associer mathématiquement ou de manipuler des valeurs dans un ou plusieurs champs. Ces calculs peuvent être aussi simples que calculer la valeur 23 pour un champ donné pour toutes les entités ou la valeur true pour toutes les entités sélectionnées, ou associer des valeurs dans plusieurs champs. Par exemple, vous pouvez diviser un champ de population par un champ de surface pour obtenir des valeurs de densité de population ou lier le texte des champs numéro de maison, nom de rue et type de rue dans un champ d'adresse unique. Mais en général, vous pouvez simplement ajouter un nouveau champ à l'aide de l'outil Ajouter un champ pour contenir les résultats de votre calcul.

Jointure de tables

L'outil Ajouter une jointure permet souvent d'associer des données tabulaires dérivées au cours d'une étape de l'analyse à d'autres données. Si les tables partagent une valeur clé (un identifiant d'entité ou un nom par exemple), elles peuvent être jointes. Les données des deux tables pourront alors être analysées simultanément. Cet outil fonctionne uniquement sur les couches d'entité ou les vues tabulaires dans la table des matières d'ArcMap ou créées par les outils Générer une couche et Générer une vue tabulaire. La jointure est temporaire et dure seulement le temps de la session. Vous pouvez enregistrer les résultats joints dans une nouvelle classe d'entités ou table à l'aide des outils Copier des entités et Copier des enregistrements ou en exportant les données dans ArcMap.

Index attributaires

L'indexation d'un champ peut augmenter l'efficacité du processus de sélection de lignes avec cet attribut. Vous pouvez pour cela utiliser l'outil Ajouter un index attributaire.

Sous-types et domaines attributaires

Quand votre table est stockée dans une géodatabase, vous pouvez créer des sous-types pour vos entités et attributs. Les sous-types fournissent une méthode de division des classes d'entités ou tables en groupements logiques basés sur une valeur attributaire et vous permettent d'utiliser un sous-ensemble d'entités dans une classe d'entités ou des lignes dans une table. Les sous-types permettent d'attribuer des attributs logiques et un comportement cohérents à ces sous-ensembles.

Pour en savoir plus sur les outils qui créent et gèrent des sous-types

Les domaines sont un moyen de définir une plage de valeurs pouvant être utilisées pour plusieurs champs attributaires. L'utilisation des domaines assure l'intégrité des données en limitant le choix de valeurs pour un champ particulier.

Pour en savoir plus sur les outils qui créent et gèrent des domaines

Vues tabulaires

Une table est une table physique sur le disque ou dans une base de données. Une vue tabulaire est une table temporaire contenue dans la mémoire de l'ordinateur que vous pouvez utiliser tout comme une table physique. En règle générale, la création d'une vue tabulaire s'effectue avec une requête, telle qu'une instruction SQL SELECT, pour que seul un sous-ensemble d'enregistrements de la table physique se trouve dans la vue tabulaire.

L'outil Générer une vue tabulaire crée une vue tabulaire à partir d'une table en entrée, tandis que l'outil Générer une table de requête crée une vue tabulaire à partir de plusieurs tables en entrée qui peuvent être jointes.

Si vous voulez enregistrer une vue tabulaire dans une table physique, utilisez l'outil Copier des enregistrements.

Table croisée

L'outil Table croisée vous permet de réduire la redondance dans une grande table. Cela est utile pour convertir certaines structures de données DAO en entités SIG ou pour convertir une longue liste délimitée par des virgules de postes de mesure et de valeurs en une table. Les valeurs uniques dans un champ (le champ Pivoter) deviennent des en-têtes de colonnes dans la table en sortie.

Tables raster

Il n'est pas rare que les valeurs de pixel de rasters contiennent des valeurs entières discrètes qui classent ses données, telles que le type de végétation. Par exemple, la valeur de pixel 1 correspond à une forêt alors que la valeur de pixel 2 représente des marécages. Pour de tels rasters, il est préférable de disposer d'une table attributaire de raster qui décrit chaque valeur de pixel unique et qui permet d'effectuer plusieurs des opérations sur les tables décrites ci-dessus. L'outil Créer la table attributaire d'un raster permet de créer ou de mettre à jour des tables attributaires de raster.

Outils de table

Il existe des dizaines d'outils qui gèrent et manipulent les tables et leurs attributs. La plupart de ces outils sont disponibles dans la boîte à outils Gestion des données.

Boite à outils

Description

Boîte à outils Analyse/Jeu d'outils Statistiques

Contient les outils Fréquence et Résumés statistiques.

Boîte à outils Conversion

Convertit les données dans les formats ArcGIS.

Boîte à outils de géocodage

Permet la conversion de tables d'adresses en entités points.

Boîte à outils Référencement linéaire

Permet la conversion de tables qui contiennent des coordonnées [itinéraire, mesure] en entités points.

Opérations sur les tables

Rubriques connexes


7/10/2012