Regresja krokowa w języku Python

Jak wykonać regresji krokowej w python? Istnieją metody OLS w SCIPY, ale nie jestem w stanie zrobić krok po kroku. Jakakolwiek pomoc w tym zakresie byłaby wielką pomocą. Dzięki.Regresja krokowa w języku Python

Edytuj: Próbuję zbudować model regresji liniowej. Mam 5 zmiennych niezależnych i używając regresji krokowej do przodu, staram się wybierać zmienne tak, aby mój model miał najniższą wartość p. Poniższy link wyjaśnia cel:

https://www.google.co.in/url?sa=t&rct=j&q=&esrc=s&source=web&cd=4&ved=0CEAQFjAD&url=http%3A%2F%2Fbusiness.fullerton.edu%2Fisds%2Fjlawrence%2FStat-On-Line%2FExcel%2520Notes%2FExcel%2520Notes%2520-%2520STEPWISE%2520REGRESSION.doc&ei=YjKsUZzXHoPwrQfGs4GQCg&usg=AFQjCNGDaQ7qRhyBaQCmLeO4OD2RVkUhzw&bvm=bv.47244034,d.bmk

Dzięki jeszcze raz.

Źródło

2013-03-15 user2174063

'scikits.learn' ma LARS/Lasso, jeśli to jest jakiekolwiek użycie: http://scikit-learn.org/dev/modules/linear_model.html#lars-lasso – NPE

Czy możesz rozwinąć, jakie kryteria chcesz chcesz użyć do wyboru zmiennych predykcyjnych? A jeśli chcesz podać przykład, możesz opublikować lub połączyć się z przykładowymi danymi? – BKay

Nie zaleca się opierać modelu na wartościach p. Są bardziej sprawdzianem poczytalności, a inne kryterium, takie jak AIC lub BIC, są bardziej odpowiednie. –

Statsmodels ma dodatkowe metody regresji: http://statsmodels.sourceforge.net/devel/examples/generated/example_ols.html. Myślę, że pomoże ci wdrożyć regresję krokową.

Źródło

2013-03-24 08:37:07

Trevor Smith i ja napisaliśmy małą funkcję selekcji do przodu dla regresji liniowej z modelami statmodels: http://planspace.org/20150423-forward_selection_with_statsmodels/ Można ją łatwo modyfikować, aby zminimalizować wartość p, lub wybrać na podstawie beta-wartości p przy odrobinie więcej pracy.

Źródło

2015-04-23 22:59:30

"""Importing the api class from statsmodels""" 
import statsmodels.formula.api as sm 

"""X_opt variable has all the columns of independent variables of matrix X 
in this case we have 5 independent variables""" 
X_opt = X[:,[0,1,2,3,4]] 

"""Running the OLS method on X_opt and storing results in regressor_OLS""" 
regressor_OLS = sm.OLS(endog = y, exog = X_opt).fit() 
regressor_OLS.summary()

Stosując metodę skróconą, można sprawdzić w jądrze wartości p swoimi zmiennych pisane jako „P> | t |”. Następnie sprawdź, czy zmienna ma najwyższą wartość p . Załóżmy, że x3 ma najwyższą wartość np. 0,956. Następnie usuń tę kolumnę ze swojej tablicy i powtórz wszystkie kroki.

X_opt = X[:,[0,1,3,4]] 
regressor_OLS = sm.OLS(endog = y, exog = X_opt).fit() 
regressor_OLS.summary()

Powtarzaj te metody, dopóki nie usuniesz wszystkich kolumn, które mają wartość p wyższą niż wartość istotności (np. 0.05). W końcu twoja zmienna X_opt będzie miała wszystkie optymalne zmienne z wartościami p niższymi niż poziom istotności.

Źródło

2017-10-10 14:08:16

Można dokonać wyboru do przodu i do tyłu w oparciu o model statsmodels.api.OLS, jak pokazano in this answer.

Jednak, this answer opisuje, dlaczego nie należy w pierwszej kolejności stosować wyboru krokowego dla modeli ekonometrycznych.

Źródło

2017-11-07 10:55:16

Regresja krokowa w języku Python

Odpowiedz

Powiązane problemy