Moindres carrés ordinaires (Statistiques spatiales)
Récapitulatif
Exécute une régression linéaire globale par les moindres carrés ordinaires pour générer des prévisions ou modéliser une variable dépendante en fonction de ses relations à un ensemble de variables explicatives.
You can access the results of this tool (including the optional report file) from the Results window. If you disable background processing, results will also be written to the Progress dialog box.
Pour en savoir plus sur la fonction de régression par les moindres carrés ordinaires
Illustration
Utilisation
-
Les résultats de régression par les moindres carrés ordinaires ne sont fiables que si les données et le modèle de régression satisfont à toutes les postulats inhérents requis par cette méthode. Consultez le tableau, Problèmes de régression courants, conséquences et solutions dans la rubrique Principes de base de l'analyse de régression pour vous assurez que votre modèle est correctement spécifié.
-
Les variables dépendantes et explicatives doivent être des champs numériques contenant diverses valeurs. Le modèle des moindres carrés ordinaires ne peut pas s'exécuter lorsque les variables ont toute la même valeur (toutes les valeurs d'un champ sont égales à 9,0, par exemple). Les méthodes de régression linéaire, comme celle des moindres carrés ordinaires, ne sont pas appropriées pour prévoir les résultats binaires (par exemple, toutes les valeurs pour la variable dépendante sont 1 ou 0).
-
Le champ ID unique lie les prévisions de modèle à chaque entité. Par conséquent, les valeurs d'ID unique doivent être uniques pour chaque entité et, en général, ce champ est associé de façon permanente à la classe d'entités. Si vous n'avez pas de champ d'ID unique, il est facile d'en créer un en ajoutant un nouveau champ de nombre entier à votre table de classes d'entités et en calculant les valeurs du champ de sorte qu'elles soient égales à celles du champ FID/OID. Vous ne pouvez pas utiliser directement le champ FID/OID comme paramètre d'ID unique.
-
A chaque fois qu'il y a auto-corrélation spatiale statistiquement significative des valeurs résiduelles de régression, le modèle des moindres carrés ordinaires est considéré comme mal spécifié et, par conséquent, les résultats de régression par les moindres carrés ordinaires sont peu fiables. Veillez à exécuter l'outil Spatial Autocorrelation (Morans I) sur les valeurs résiduelles de régression pour évaluer ce problème potentiel. L'auto-corrélation spatiale de valeurs résiduelles de régression statistiquement significative indique presque toujours qu'il manque une variable explicative clé.
-
Vous devez inspecter visuellement les surestimations et les sous-estimations évidentes dans les valeurs résiduelles de régression pour trouver des indices de variables manquantes dans votre modèle de régression. Il peut être profitable d'exécuter l'outil Hot Spot Analysis (Getis-Ord Gi*) sur les valeurs résiduelles pour mieux visualiser l'agrégation spatiale des surestimations et des sous-estimations.
-
Lorsqu'une spécification incorrecte est le résultat d'une tentative de modélisation des variables non stationnaires à l'aide d'un modèle global (le modèle des moindres carrés ordinaires est un modèle global), utilisez l'outil Régression pondérée géographiquement pour améliorer les prévisions et mieux comprendre la non stationnarité (variation régionale) inhérente dans vos variables explicatives.
-
Lorsque le résultat d'un calcul est l'infini ou indéfini, le résultat pour les fichiers qui ne sont pas des fichiers de formes sera nul ; pour les fichiers de formes, le résultat sera - DBL_MAX = -1.7976931348623158e+308.
Le récapitulatif des diagnostics du modèle est enregistré dans le rapport récapitulatif des moindres carrés ordinaires et dans la table en sortie des diagnostics (générée uniquement si vous le souhaitez). Ces deux documents incluent des diagnostics pour le critère d'information d'Akaike corrigé (AICc), le coefficient de détermination, la statistique F de jointure, la statistique Wald, la statistique Breusch-Pagan de Koenker et la statistique Jarque-Bera. La table des diagnostics inclut également des valeurs "AIC non corrigé" et "Sigma carré".
-
Les tables en sortie de coefficients et/ou de diagnostic facultatives, si elles existent, seront remplacées lorsque l'option de géotraitement Remplacer les résultats des opérations de géotraitement est activée.
This tool will optionally create a PDF report summarizing results. PDF files do not automatically appear in the Catalog window. If you want PDF files to be displayed in Catalog, open the ArcCatalog application, select the Customize menu option, click ArcCatalog Options, and select the File Types tab. Click on the New Type button and specify PDF, as show below, for File Extension.
-
Les couches peuvent permettre de définir la Classe d'entités en entrée. Lors de l'utilisation d'une couche avec une sélection, seules les entités sélectionnées sont incluses dans l'analyse.
La sortie principale de cette outil est le rapport récapitulatif des moindres carrés ordinaires, affiché dans la fenêtre Résultats ou, si vous le souhaitez, enregistré dans le Fichier de rapport en sortie que vous spécifiez (notez que ce fichier contient des graphiques supplémentaires). Double-cliquez sur le fichier PDF du rapport dans la fenêtre Résultats afin de l'ouvrir. Il est également possible d'afficher le rapport récapitulatif de l'outil Moindres carrés ordinaires dans une boîte de dialogue Message. Pour ce faire, cliquez avec le bouton droit de la souris sur l'entrée Messages dans la fenêtre Résultats et sélectionnez Afficher.
L'outil Moindres carrés ordinaires génère également une classe d'entités en sortie et des tables facultatives contenant des données de coefficient et de diagnostic. Tous ces éléments sont disponibles dans la fenêtre Résultats. La classe d'entités en sortie est ajoutée automatiquement à la table des matières et un rendu de type chaud/froid (hot/cold) est appliqué aux valeursrésiduellesdu modèle. Une explication complète de chaque résultat en sortie est fournie à la rubrique Interprétation des résultats de régression des moindres carrés ordinaires.
Si cet outil fait partie d'un outil de modèle personnalisé, les tables facultatives s'affichent dans la fenêtre Résultats uniquement si elles sont définies en tant que paramètres de modèle avant d'exécuter l'outil.
Lorsque vous utilisez des fichiers de formes, n'oubliez pas qu'ils ne peuvent pas stocker de valeurs Null. Les outils ou d'autres procédures qui créent des fichiers de formes à partir des entrées autres que des fichiers de formes peuvent stocker ou interpréter des valeurs Null comme zéro. Cela peut aboutir à des résultats inattendus. Reportez-vous également à Remarques concernant le géotraitement pour la sortie de fichiers de formes.
Syntaxe
Paramètre | Explication | Type de données |
Input_Feature_Class |
Classe d'entités qui contient les variables dépendantes et indépendantes pour l'analyse. | Feature Layer |
Unique_ID_Field |
Champ de nombre entier qui contient une valeur différente pour chaque entité dans la classe d'entités en entrée. | Field |
Output_Feature_Class |
Classe d'entités en sortie pour recevoir des estimations de variable dépendante et des résiduels. | Feature Class |
Dependent_Variable |
Champ numérique qui contient des valeurs pour la modélisation. | Field |
Explanatory_Variables [Explanatory_Variables,...] |
Liste des champs qui représentent des variables explicatives dans votre modèle de régression. | Field |
Coefficient_Output_Table (Facultatif) |
Chemin d'accès complet à une table facultative qui recevra des coefficients de modèle, des erreurs standard et des probabilités pour chaque variable explicative. | Table |
Diagnostic_Output_Table (Facultatif) |
Chemin d'accès complet à une table facultative qui recevra les diagnostics récapitulatives du modèle. | Table |
Output_Report_File (Facultatif) |
Chemin d'accès au fichier PDF facultatif qui sera généré par l'outil. Ce fichier de rapport comprend des diagnostics de modèle, des diagrammes et des notes qui vous permettront de mieux interpréter les résultats obtenus à l'aide de l'outil Moindres carrés ordinaires. | File |
Exemple de code
Le script de fenêtre Python ci-dessous illustre l'utilisation de l'outil OrdinaryLeastSquares.
import arcpy arcpy.env.workspace = r"c:\data" arcpy.OrdinaryLeastSquares_stats("USCounties.shp", "MYID","olsResults.shp", "GROWTH","LOGPCR69;SOUTH;LPCR_SOUTH;PopDen69","olsCoefTab.dbf","olsDiagTab.dbf")
Le script Python autonome ci-dessous illustre l'utilisation de l'outil OrdinaryLeastSquares.
# Analyze the growth of regional per capita incomes in US # Counties from 1969 -- 2002 using Ordinary Least Squares Regression # Import system modules import arcpy # Set the geoprocessor object property to overwrite existing outputs arcpy.gp.overwriteOutput = True # Local variables... workspace = r"C:\Data" try: # Set the current workspace (to avoid having to specify the full path to the feature classes each time) arcpy.workspace = workspace # Growth as a function of {log of starting income, dummy for South # counties, interaction term for South counties, population density} # Process: Ordinary Least Squares... ols = arcpy.OrdinaryLeastSquares_stats("USCounties.shp", "MYID", "olsResults.shp", "GROWTH", "LOGPCR69;SOUTH;LPCR_SOUTH;PopDen69", "olsCoefTab.dbf", "olsDiagTab.dbf") # Create Spatial Weights Matrix (Can be based off input or output FC) # Process: Generate Spatial Weights Matrix... swm = arcpy.GenerateSpatialWeightsMatrix_stats("USCounties.shp", "MYID", "euclidean6Neighs.swm", "K_NEAREST_NEIGHBORS", "#", "#", "#", 6) # Calculate Moran's Index of Spatial Autocorrelation for # OLS Residuals using a SWM File. # Process: Spatial Autocorrelation (Morans I)... moransI = arcpy.SpatialAutocorrelation_stats("olsResults.shp", "Residual", "NO_REPORT", "GET_SPATIAL_WEIGHTS_FROM_FILE", "EUCLIDEAN_DISTANCE", "NONE", "#", "euclidean6Neighs.swm") except: # If an error occurred when running the tool, print out the error message. print arcpy.GetMessages()