2013-01-07 11 views
6

Interesuje mnie zrozumienie, w jaki sposób oszacowania prawdopodobieństwa są obliczane przez losowe lasy, zarówno ogólnie, jak i konkretnie w bibliotece nauki w języku Python (gdzie oszacowane prawdopodobieństwo są zwracane przez funkcję predict_proba).Losowe lasy - szacunki prawdopodobieństwa (+ scikit-learn specific)

Dzięki Guy

+0

Myślę, że będziesz musiał być bardziej konkretny, w szczególności, jakie jest twoje pytanie? – DuckMaestro

Odpowiedz

11

Prawdopodobieństwa zwracane przez las są średnie prawdopodobieństwo zwracane przez drzewa w zespole (docs). Prawdopodobieństwa zwracane przez jednego drzewa są znormalizowane klasy histogramy liścia ląduje Przykładowe In.

+0

Czy wiesz, gdzie w dokumentacji mogę znaleźć więcej informacji o tym, jak prawdopodobieństwa są szacowane przez jedno drzewo? – dukebody

+0

Nie widzę go obecnie, dodamy go. Można go znaleźć w literaturze. Jest to tylko część próbek w tym samym liście należących do pewnej klasy (jak powiedziałem innymi słowami w mojej odpowiedzi powyżej) –

+0

Dzięki Andreas! Odnośnie sposobu szacowania prawdopodobieństwa ... wszelkie przemyślenia na temat http://stackoverflow.com/questions/28002991/how-to-use-whole-training-example-to-estimate-class-probabilities-in-sklearn-ran ? – dukebody

2

Oprócz co Andreas/Dougal powiedział kiedy pociąg RF turn on compute_importances=True. Następnie sprawdź classifier.feature_importances_, aby zobaczyć, które funkcje występują wysoko w drzewach RF.

+1

Krótka notka: "compute_importances" zostało usunięte w scikit-learn 0.14+, import funkcji został obliczony po wykonaniu 'feature_importances_' (cf, https://github.com/scikit-learn/scikit-learn/commit/f7f54244643f68c8ff2640ca0c6c7f0822463a96) – oliverguenther

+0

Dzięki @oliverguenther – smci