Próbuję wyjaśnić sobie wynik prognozowania, od zastosowania modelu ARIMA do zbioru danych z serii czasowych. Dane pochodzą z konkursu M1, seria to MNB65. Próbuję dopasować dane do modelu ARIMA (1,0,0) i uzyskać prognozy. Używam R. Oto niektóre fragmenty wyjściowe:Wyjaśnienie prognoz z modelu ARIMA
> arima(x, order = c(1,0,0))
Series: x
ARIMA(1,0,0) with non-zero mean
Call: arima(x = x, order = c(1, 0, 0))
Coefficients:
ar1 intercept
0.9421 12260.298
s.e. 0.0474 202.717
> predict(arima(x, order = c(1,0,0)), n.ahead=12)
$pred
Time Series:
Start = 53
End = 64
Frequency = 1
[1] 11757.39 11786.50 11813.92 11839.75 11864.09 11887.02 11908.62 11928.97 11948.15 11966.21 11983.23 11999.27
Mam kilka pytań:
(1) W jaki sposób można wyjaśnić, że chociaż zbiór danych wykazuje wyraźną tendencję spadkową, prognoza z tego modelu trendy w górę. Tak samo dzieje się w przypadku ARIMA (2,0,0), który jest najlepszym dopasowaniem ARIMA do danych przy użyciu auto.arima (pakiet prognozy) i modelu ARIMA (1,0,1).
(2) Wartość przecięcia dla modelu ARIMA (1,0,0) to 12260.298. Czy punkt przecięcia nie spełnia równania: C = średnia * (1 - suma (współczynniki AR)), w którym to przypadku wartość powinna wynosić 715,52. Muszę tu pomijać coś podstawowego.
(3) Jest to wyraźnie seria ze średnią niestacjonarną. Dlaczego model AR (2) jest nadal wybrany jako najlepszy model przez auto.arima? Czy może istnieć intuicyjne wyjaśnienie?
Dzięki.
Głosowałem, aby to zamknąć, ponieważ nie jest to pytanie programistyczne. –