Strona pomoc dla randomforest::randomforest()
mówi:Co oznacza parametr "classwt" w funkcji RandomForest w pakiecie RandomForest w języku R?
„classwt - Przeorzy klas nie muszą sumować się do jednego ignorowana dla regresji.”.
Czy ustawienie parametru classwt
może pomóc w przypadku dużych niewyważonych danych, np. priors klas różni się mocno?
Jak ustawić classwt
podczas szkolenia modelu na zestawie danych z 3 klasami z wektorem wektorów równym (p1, p2, p3), a w zestawach testowych priors to (q1, q2, q3)?
Nie jestem pewien co do twojego drugiego pytania, ale 'classwt' uważam, że jest używany podczas próbkowania z twoich danych, tak, że każda próbka dla każdego drzewa jest pobierana z twoich klas z tymi prawdopodobieństwami (po normalizacji). – joran
warstwy dają taką samą wydajność jak classwt i są łatwiejsze do kontrolowania, sprawdź ten przewodnik na stronie SO: http://stats.stackexchange.com/questions/157714/r-package-for-weighted-random-forest-classwt-option/158030 # 158030 –
@joran to stratafikacja, którą opisujesz. Classwt służy do ważenia próbek, kiedy można znaleźć optymalny punkt przerwania dla podziału węzłów i określić predykcję węzła podczas treningu. –