iv_l, iv_u
podaje ograniczenia przedziału prognozy dla każdego punktu.
patrz pierwsza fabuła tutaj http://statsmodels.sourceforge.net/devel/examples/generated/example_ols.html
przedział Przewidywanie jest przedział ufności dla obserwacji i zawiera oszacowanie błędu.
Myślę, że przedział ufności dla średniej prognozy nie jest jeszcze dostępny w statsmodels. (Rzeczywiście, przedział ufności dla dopasowanych wartości ukrywa się w podsumowaniu_tablicy wpływów, ale muszę to zweryfikować.)
Właściwe metody przewidywania dla modeli statystyk znajdują się na liście TODO.
Dodawanie
Przedziały ufności są dla OLS ale dostęp jest nieco niezdarny.
Aby zostać włączone po uruchomieniu skryptu:
from statsmodels.stats.outliers_influence import summary_table
st, data, ss2 = summary_table(re, alpha=0.05)
fittedvalues = data[:,2]
predict_mean_se = data[:,3]
predict_mean_ci_low, predict_mean_ci_upp = data[:,4:6].T
predict_ci_low, predict_ci_upp = data[:,6:8].T
# check we got the right things
print np.max(np.abs(re.fittedvalues - fittedvalues))
print np.max(np.abs(iv_l - predict_ci_low))
print np.max(np.abs(iv_u - predict_ci_upp))
plt.plot(x, y, 'o')
plt.plot(x, fittedvalues, '-', lw=2)
plt.plot(x, predict_ci_low, 'r--', lw=2)
plt.plot(x, predict_ci_upp, 'r--', lw=2)
plt.plot(x, predict_mean_ci_low, 'r--', lw=2)
plt.plot(x, predict_mean_ci_upp, 'r--', lw=2)
plt.show()
To powinno dać takie same wyniki jak SAS, http://jpktd.blogspot.ca/2012/01/nice-thing-about-seeing-zeros.html
Jedną z kwestii związanych z tą metodą jest to, że jeśli punkty są rzadkie, 'predict_mean_ci_low' i' predict_mean_ci_upp' będą postrzępione/spiczaste po wykreśleniu, ponieważ istnieją tylko w dopasowanych wartościach, zamiast w zakresie punktów. Jednak linia dopasowania jest zdefiniowana dla wszystkich punktów. Istnieje komentarz, który mówi, że użycie "hat_matrix działa tylko dla dopasowanych wartości" w https://github.com/statsmodels/statsmodels/blob/master/statsmodels/stats/outliers_influence.py#L693 - jakikolwiek pomysł na obejście że? –
Mam problem ze stosowaniem tej odpowiedzi do mojego zestawu danych, Wysłany jako oddzielny tutaj pytanie: http://stackoverflow.com/questions/34998772/plotting-confidence-and-prediction-intervals-with-repeated-entries. Każda rada bardzo doceniona! – PJW