2015-07-07 5 views
7

Wierzę, że metoda "rf"() w caret ustawia domyślną liczbę drzew na 500. Niestety, powoduje to, że złożoność czasu wzrasta poza kontrolą w przypadku większych zestawów danych. Czy istnieje jakiś szybki sposób na zmniejszenie liczby drzew bez tworzenia niestandardowej metody? Wiem, że jedynym dostrajalnym parametrem dla rf jest mtry.Jak zmniejszyć domyślny parametr ntree = 500 przekazany do RF z karetki?

Po prostu wyjaśnić: Nie zamierzam stroić na liczbę drzew. Po prostu chcę go naprawić na niższą wartość, aby móc uruchomić rf w rozsądnym czasie.

Odpowiedz

11

można określić parametr ntree kiedy zadzwonić pociąg tak:

rf <- train(X, y, method="rf", preProcess=c("center","scale"), ntree=100, trControl=fitControl) 
0

Jedną z sugestii jest użycie biblioteki randomForest. Zawsze uważałem, że jest prostszy w użyciu niż ten w caret i ma parametr do ustawienia liczby drzew.

+0

zgodził, ale staram się używać metod daszka jak już zbudowali doborowej metoda przepływu pracy, który korzysta z jednolitego interfejsu to zapewnia caret. –

+0

Dlaczego nie możesz po prostu zmodyfikować kodu wtedy :) –

+1

Ah, widzę lepsze sugestie powyżej .... –

Powiązane problemy