Cómo interpretar los resultados de ARIMA

Para analizar los resultados de ARIMA, debe determinar si el modelo cumple con los supuestos utilizando las estadísticas de chi-cuadrado de Jlung-Box y la autocorrelación de residuos; comprenda si cada término es significativo usando valores p y reconozca si su modelo se ajusta bien usando el error cuadrático medio.

Comprender los resultados de ARIMA

Después de crear un modelo autorregresivo, verifique los resultados para ver si su modelo tiene sentido y qué tan bien funciona. El uso de statsmodels o cualquier otra biblioteca imprimirá algo como lo siguiente.

La mejor manera de entender es con el ejemplo. Revisaremos los resultados de un modelo AR simple que intenta predecir los resultados futuros de Bitcoin siguiendo estos pasos:

  • Revisar información general
  • Determinar el significado del término
  • Analizar los supuestos del modelo
  • Compara modelos y mejora el ajuste
  • Revisaremos cada elemento de línea dentro de cada paso para que tenga una comprensión clara de sus resultados.

    1. Revisar información general

    Lo primero que debe hacer es revisar la información general.

    Además, statsmodels usa el mismo módulo para todos los modelos autorregresivos, por lo que el encabezado muestra los resultados de SARIMAX cuando su modelo solo puede ser una autorregresión estándar.

    SARIMAX significa Media Móvil Integrada AutoRegresiva Estacional con regresores eXógenos.

    La información básica se explica por sí misma:

    • dep. Variable: lo que estamos tratando de predecir.
    • Modelo: el tipo de modelo que estamos usando. AR, MA, ARIMA.
    • Fecha: la fecha en que ejecutamos el modelo.
    • Hora: la hora en que finalizó el modelo.
    • Muestra: el rango de los datos.
    • No. Observaciones – El número de observaciones

    La variable dependiente es el cierre, que estamos tratando de predecir. Las variables independientes son la beta constante. El término de error es sigma2 o épsilon en nuestra ecuación anterior. Nuestras variables de retraso son ar.L1, ar.L2 y ar.L3.

    Después de revisar que no cometimos ningún error básico con nuestro modelo, podemos pasar al siguiente paso y analizar la importancia del término.

    2. Determinar la importancia del término

    Queremos asegurarnos de que cada término de nuestro modelo sea estadísticamente significativo. El nulo de esta sección es que cada coeficiente NO es estadísticamente significativo. Por lo tanto, queremos que cada término tenga un valor de p menor que 0,05, por lo que podemos rechazar la hipótesis nula con valores estadísticamente significativos.

    En nuestro ejemplo, Ll y L2 no son estadísticamente significativos ya que sus valores de p están por encima del umbral de 0,05.

    3. Suposiciones de revisión

    A continuación, queremos asegurarnos de que nuestro modelo cumpla con el supuesto de que los residuos son independientes, conocido como ruido blanco.

    Si los residuos no son independientes, podemos extraer la no aleatoriedad para hacer un mejor modelo.

    Caja Ljung

    La prueba de Ljung Box, pronunciada «Young» y a veces llamada prueba Box-Pierce modificada, prueba que los errores son ruido blanco.

    El Ljung-Box (L1) (Q) es el estadístico de prueba LBQ en el desfase 1, el Prob(Q) es 0,01 y el valor p es 0,94. Dado que la probabilidad está por encima de 0,05, no podemos rechazar la nulidad de que los errores son ruido blanco.

    Si está interesado en ver todas las estadísticas de prueba de Ljung-Box y los valores p para los retrasos, puede usar una función de diagnóstico de Ljung-Box.

    from statsmodels.stats.diagnostic import acorr_ljungbox
    mod = ARIMA(endog=train, order=order)
    res = mod.fit()
    jlung = acorr_ljungbox(res.resid)
    

    heterocedasticidad

    La heterocedasticidad prueba que los residuos de error son homocedásticos o tienen la misma varianza. El resumen realiza la prueba de White. Nuestras estadísticas de resumen muestran una estadística de prueba de 1,64 y un valor p de 0,00, lo que significa que rechazamos la hipótesis nula y nuestros residuos muestran varianza.

    Esta variación plantea problemas de pronóstico y, si no sabe por qué, este video es un excelente repaso sobre el tema.

    Jarque Bera

    Pruebas de Jarque-Bera para la normalidad de los errores. Prueba el nulo de que los datos se distribuyen normalmente contra una alternativa de otra distribución. Vemos un estadístico de prueba de 4535.14 con una probabilidad de 0, lo que significa que rechazamos la hipótesis nula y los datos no se distribuyen normalmente. Además, como parte de la prueba de Jarque-Bera, vemos que la distribución tiene una ligera asimetría negativa y una gran curtosis.

    4. Análisis de ajuste

    Log-Likelihood, AIC, BIC y HQIC ayudan a comparar un modelo con otro.

    Log-Verosimilitud

    La función de probabilidad logarítmica identifica una distribución que se ajusta mejor a los datos muestreados. Si bien es útil, AIC y BIC castigan el modelo por su complejidad, lo que ayuda a que nuestro Modelo ARIMA parsimonioso.

    Criterio de información de Akaike

    El criterio de información de Akaike (AIC) ayuda a determinar la fuerza del modelo de regresión lineal. El AIC penaliza a un modelo por agregar parámetros ya que agregar más parámetros siempre aumentará el valor de máxima verosimilitud.

    Criterio de información bayesiano

    El Criterio de Información Bayesiano (BIC), al igual que el AIC, también castiga a un modelo por su complejidad, pero también incorpora el número de filas en los datos.

    Criterio de información de Hannan-Quinn

    El criterio de información de Hannan-Quinn (HQIC), como AIC y BIC, es otro criterio para la selección de modelos; sin embargo, es no se usa con tanta frecuencia en la práctica.

    La línea de fondo

    Es esencial comprender cómo analizar los resultados de ARIMA. En esta publicación, aprendió primero a examinar la información general, revisar los coeficientes para determinar su importancia, comprender cómo determinar si nuestros resultados cumplen con los supuestos del modelo y luego comparar varios modelos.

    Deja un comentario