Mínimos cuadrados ordinarios (OLS) (Estadística espacial)
Resumen
Realiza una regresión lineal global de Mínimos cuadrados ordinarios (OLS) para generar una predicción o modelar una variable dependiente en términos de sus relaciones con un conjunto de variables explicativas.
You can access the results of this tool (including the optional report file) from the Results window. If you disable background processing, results will also be written to the Progress dialog box.
Más información sobre cómo funciona la regresión de Mínimos cuadrados ordinarios
Ilustración
Uso
-
Los resultados de la regresión OLS son fiables sólo si los datos y el modelo de regresión satisfacen todas las presuposiciones que este método requiere inherentemente. Consulte la tabla Problemas, consecuencias y soluciones comunes de regresión en Conceptos básicos del análisis de regresión para asegurarse de que el modelo esté especificado correctamente.
-
Las variables dependientes y explicativas deben ser campos numéricos que contengan una variedad de valores. OLS no puede proporcionar soluciones cuando todas las variables tienen el mismo valor (por ejemplo, todos los valores de un campo son 9,0). Los métodos de regresión lineal, como OLS, no son adecuados para prever resultados binarios (por ej., todos los valores para la variable dependiente son 1 o 0).
-
El campo de Id. único vincula las predicciones del modelo con cada entidad. Como consecuencia, los valores de Id. único deben ser únicos para cada entidad y, por lo general, deben ser un campo que se mantiene unido a la clase de entidad. Si no tiene un campo de Id. único, puede crear uno fácilmente al agregar un nuevo campo de entero a la tabla de clase de entidad y calcular los valores de campo para que sean iguales a los del campo FID/OID. No puede utilizar el campo FID/OID directamente para el parámetro Id. único.
-
Cuando haya una autocorrelación espacial estadísticamente significativa de los residuales de la regresión, se considerará que el modelo OLS está mal especificado y, por lo tanto, los resultados de la regresión OLS no serán fiables. Asegúrese de ejecutar la herramienta Autocorrelación espacial en los residuales de la regresión para evaluar este problema potencial. La autocorrelación espacial estadísticamente significativa de los residuales de regresión casi siempre indica la ausencia de una variable explicativa clave.
-
Debe inspeccionar visualmente las sobrepredicciones y las subpredicciones que sean evidentes en los residuales de regresión para ver si proporcionan pistas acerca de las posibles variables que están ausentes en el modelo de regresión. Por lo general, esto ayuda a ejecutar el Análisis de punto caliente en los residuales para visualizar el clustering espacial de las sobrepredicciones y las subpredicciones.
-
Cuando se produce una especificación incorrecta como resultado del intento de modelar variables no estacionarias con un modelo global (OLS es un modelo global), se puede utilizar una Regresión ponderada geográficamente para mejorar las predicciones y comprender mejor la no estacionariedad (variación regional) inherente en las variables explicativas.
-
Cuando el resultado de un cálculo es infinito o indefinido, la salida para los no shapefiles será Nulo; para los shapefiles la salida será -DBL_MAX = -1,7976931348623158e+308.
Los diagnósticos del resumen del modelo se escriben en el informe de resumen de OLS y en la tabla de salida de diagnóstico opcional. Ambos incluyen diagnósticos para el Criterio de información de Akaike corregido (AICc), el Coeficiente de determinación, el índice estadístico F conjunto, el índice estadístico de Wald, el índice estadístico Breusch-Pagan de Koenker y el índice estadístico de Jarque-Bera. La tabla de diagnóstico también incluye valores AIC y Sigma cuadrado sin corregir.
-
Las tablas de salida de coeficiente y diagnóstico opcionales se sobrescribirán, si ya existen, cuando está marcada la Opción de geoprocesamiento sobrescribir los resultados de las operaciones de geoprocesamiento.
This tool will optionally create a PDF report summarizing results. PDF files do not automatically appear in the Catalog window. If you want PDF files to be displayed in Catalog, open the ArcCatalog application, select the Customize menu option, click ArcCatalog Options, and select the File Types tab. Click on the New Type button and specify PDF, as show below, for File Extension.
-
Las capas del mapa se pueden utilizar para definir la Clase de entidad de entrada. Cuando se utiliza una capa con una selección, sólo las entidades seleccionadas se incluyen en el análisis.
La principal salida para esta herramienta es el informe de resumen de OLS, que se escribe en la ventana de Resultados o que se escribe opcionalmente, con gráficos adicionales, al Archivo de informe de salida que especifique. Si hace doble clic en el archivo del informe en PDF en la ventana Resultados lo abrirá. Al hacer clic con el botón derecho del ratón en la entrada Mensajes de la ventana Resultados y seleccionar Ver, también se mostrará el informe del resumen de OLS en un cuadro de diálogo Mensaje.
La herramienta OLS también produce una clase de entidad de salida y tablas opcionales con diagnósticos e información de coeficiente. Se puede acceder a todo esto en la ventana Resultados. La clase de entidad de salida se agrega automáticamente a la Tabla de contenido con un esquema de representación cálido/frío que se aplica a los residuales del modelo. En Interpretar_los_resultados_de_OLS se proporciona una explicación completa de cada salida.
Si esta herramienta es parte de una herramienta de modelo personalizado, las tablas opcionales sólo aparecerán en la ventana Resultados si se configuran como parámetros de modelo antes de ejecutar la herramienta.
Al utilizar shapefiles tenga en cuenta que no pueden almacenar valores nulos. Las herramientas u otros procedimientos que crean shapefiles a partir de entradas sin shapefiles pueden almacenar o interpretar valores nulos como cero. Esto puede ocasionar resultados inesperados. Consulte también Consideraciones de geoprocesamiento para la salida de shapefiles.
Sintaxis
Parámetro | Explicación | Tipo de datos |
Input_Feature_Class |
La clase de entidad que contiene las variables dependientes e independientes para el análisis. | Feature Layer |
Unique_ID_Field |
Un campo entero que contiene un valor diferente para cada entidad en la Clase de entidad de entrada. | Field |
Output_Feature_Class |
La clase de entidad de salida que recibirá estimaciones y residuales de variables dependientes. | Feature Class |
Dependent_Variable |
El campo numérico que contiene los valores de aquello que intenta modelar. | Field |
Explanatory_Variables [Explanatory_Variables,...] |
Una lista de campos que representan variables explicativas en el modelo de regresión. | Field |
Coefficient_Output_Table (Opcional) |
La ruta de acceso completa a una tabla opcional que recibirá los coeficientes del modelo, los errores estándar y las probabilidades para cada variable explicativa. | Table |
Diagnostic_Output_Table (Opcional) |
La ruta de acceso completa a una tabla opcional que recibirá los diagnósticos del resumen del modelo. | Table |
Output_Report_File (Opcional) |
La ruta al archivo PDF opcional que desea que la herramienta cree. Este archivo de informe incluye diagnóstico del modelo, gráficos y notas para ayudarle a interpretar los resultados de OLS. | File |
Ejemplo de código
La siguiente secuencia de comandos de la ventana de Python muestra cómo utilizar la herramienta OrdinaryLeastSquares.
import arcpy arcpy.env.workspace = r"c:\data" arcpy.OrdinaryLeastSquares_stats("USCounties.shp", "MYID","olsResults.shp", "GROWTH","LOGPCR69;SOUTH;LPCR_SOUTH;PopDen69","olsCoefTab.dbf","olsDiagTab.dbf")
La siguiente secuencia de comandos de Python independiente muestra cómo utilizar la herramienta OrdinaryLeastSquares.
# Analyze the growth of regional per capita incomes in US # Counties from 1969 -- 2002 using Ordinary Least Squares Regression # Import system modules import arcpy # Set the geoprocessor object property to overwrite existing outputs arcpy.gp.overwriteOutput = True # Local variables... workspace = r"C:\Data" try: # Set the current workspace (to avoid having to specify the full path to the feature classes each time) arcpy.workspace = workspace # Growth as a function of {log of starting income, dummy for South # counties, interaction term for South counties, population density} # Process: Ordinary Least Squares... ols = arcpy.OrdinaryLeastSquares_stats("USCounties.shp", "MYID", "olsResults.shp", "GROWTH", "LOGPCR69;SOUTH;LPCR_SOUTH;PopDen69", "olsCoefTab.dbf", "olsDiagTab.dbf") # Create Spatial Weights Matrix (Can be based off input or output FC) # Process: Generate Spatial Weights Matrix... swm = arcpy.GenerateSpatialWeightsMatrix_stats("USCounties.shp", "MYID", "euclidean6Neighs.swm", "K_NEAREST_NEIGHBORS", "#", "#", "#", 6) # Calculate Moran's Index of Spatial Autocorrelation for # OLS Residuals using a SWM File. # Process: Spatial Autocorrelation (Morans I)... moransI = arcpy.SpatialAutocorrelation_stats("olsResults.shp", "Residual", "NO_REPORT", "GET_SPATIAL_WEIGHTS_FROM_FILE", "EUCLIDEAN_DISTANCE", "NONE", "#", "euclidean6Neighs.swm") except: # If an error occurred when running the tool, print out the error message. print arcpy.GetMessages()