2010-04-08 6 views
5

Jeśli zmienną czynnikową jest Klimat, z 4 możliwymi wartościami: Tropikalny, Suchy, Umiarkowany, Śnieg i węzeł w moim drzewie rpart jest oznaczony jako "Klimat: ab", jaki jest podział?Jak interpretować podzielniki rpart na zmiennych czynnikowych podczas budowania drzew klasyfikacyjnych w R?

+0

To należy do stats.stackexchange.com i powinno być zamknięte. –

+0

@Joris Nie zgadzam się. Pytanie dotyczy interpretacji odpowiedzi programu i nie ma nic wspólnego ze statycznym tłem podziału drzew i statystyką. – Marek

+0

@ Marek Jak inaczej nazwałbyś interpretację analizy statystycznej? –

Odpowiedz

6

Zakładam użyć standardowego sposobu na działce drzewa, które jest

plot(f) 
text(f) 

Jak można przeczytać w pomocy do text.rpart argument pretty na domyślnych zmiennych czynników są przedstawione jako litery, więc a oznacza levels(Climate)[1] a to oznacza, że na lewym węźle są obserwacje z Climate==levels(Climate)[1], a po prawej pozostałe.

Można drukować bezpośrednio z poziomu

plot(f) 
text(f, pretty=1) 

Created by rpart

ale zalecamy korzystanie draw.tree z maptree package:

require(maptree) 
draw.tree(f) 

Created by maptree

Kiedyś fałszywe dane do wykonania działek:

X <- data.frame(
    y=rep(1:4,25), 
    Climate=rep(c("Tropical", "Arid", "Temperate", "Snow"),25) 
) 
f <- rpart(y~Climate, X) 
Powiązane problemy