2015-05-31 12 views
6

Przeszukałem API statsmodels.regression.linear_model.RegressionResults i odkryłem, jak odzyskać różne smaki standardowych poprawionych błędów heteroskedastyczności (poprzez właściwości takie jak HC0_se itp.). Nie mogę się dowiedzieć, jak uzyskać testy współczynników, aby użyć poprawionych błędów standardowych. Czy istnieje sposób na to w API, czy muszę to zrobić ręcznie? Jeśli to drugie, czy możesz zasugerować jakieś wskazówki, jak to zrobić z wynikami statsmodels?Uzyskiwanie statsmodeli do użycia poprawionych standardowych błędów standardowych w t-testach współczynników heteroskedastyczności

Odpowiedz

10

fit Sposób modelach liniowych dyskretne modeli i GLM wziąć cov_type i cov_kwds argumentu do określania stabilnych macierzy kowariancji. Zostanie on dołączony do instancji wyników i użyty do wszystkich wniosków i statystyk raportowanych w tabeli podsumowania.

Niestety, dokumentacja nie pokazuje tego jeszcze we właściwy sposób. Sposób pomocniczy, który w rzeczywistości wybiera kanapki, w oparciu o możliwości przedstawia opcje oraz wymagane parametry: http://statsmodels.sourceforge.net/devel/generated/statsmodels.regression.linear_model.OLS.fit.html

na przykład, szacowania modelu ole i za pomocą HC3 macierzy kowariancji mogą być wykonane z

model_ols = OLS(...) 
result = model_ols.fit(cov_type='HC3') 
result.bse 
result.t_test(....) 

Niektóre Kanapki wymagają dodatkowych argumentów, na przykład klaster odporne na błędy standardowe, można wybrać w następujący sposób, zakładając, że mygroups jest tablicą zawierającą etykiety grup:

results = OLS(...).fit(cov_type='cluster', cov_kwds={'groups': mygroups} 
results.bse 
... 

Niektóre silne macierze kowariancji przyjmują dodatkowe założenia dotyczące danych bez sprawdzania. Na przykład, heteroscedastyczność i autokorelacja solidnych standardowych błędów lub Newey-West, HAC, standardowe błędy przyjmują sekwencyjną strukturę szeregów czasowych. Niektóre wiarygodne standardowe błędy danych panelowych również zakładają układanie szeregów czasowych przez poszczególne osoby.

Dostępna jest oddzielna opcja use_t, aby określić, czy t i F, czy też rozkład normalny i kwadratowy powinny być używane domyślnie dla testów Wald i przedziałów ufności.

+1

Dzięki! Mam nadzieję, że wkrótce pojawi się w dokumentach. –

+0

Przepraszam, że znowu ci przeszkadzam, ale czy jest to wezwanie do 'result.bse' potrzebne dla solidnych reszt z' HC * 'do użycia w * t * -testach i do pojawienia się w' result.resid'? Lub jest "model_ols.fit (cov_type =" HC3 ")' wszystko, czego potrzebuję? –

+1

Nie, po nazwie "fit" nie trzeba wywoływać niczego innego. 'bse' i' t_test' były tylko dwoma przykładami, w których użyto podanego 'cov_type'. Solidna kowariancja kanapkowa jest przechowywana w 'cov_params_default' i używana wszędzie tam, gdzie potrzebujemy kowariancji estymacji parametrów. Prostym sposobem zweryfikowania jest utworzenie dwóch wyników instancji z różnymi 'cov_types' i sprawdzenie, czy wyniki zależne od macierzy kowariancji są różne, np. w 'summary()'. – user333700

Powiązane problemy