2015-04-05 12 views
14

TłoGBM :: interact.gbm porównaniu dismo :: gbm.interactions

Instrukcja odniesienia dla gbm package stanów funkcja interact.gbm oblicza Friedmana statystyki H w celu oceny wytrzymałości zmiennych oddziaływań. H-statystyka jest w skali [0-1].

Instrukcja referencyjna dla dismo package nie zawiera odniesienia do żadnej literatury dotyczącej tego, jak funkcja gbm.interactions wykrywa i modeluje interakcje. Zamiast tego podaje listę ogólnych procedur używanych do wykrywania i modelowania interakcji. Winieta dismo "Zwiększone drzewa regresji do modelowania ekologicznego" stwierdza, że ​​pakiet dismo rozszerza funkcje w pakiecie gbm.

Pytanie

Jak dismo::gbm.interactions faktycznie wykryć i modelu interakcji?

Dlaczego

Zadaję to pytanie, ponieważ gbm.interactions w dismo package wyników plony> 1, co mówi instrukcja gbm package odniesienia nie jest możliwe.

Sprawdziłem tar.gz dla każdego z pakietów, aby sprawdzić, czy kod źródłowy był podobny. Jest na tyle odmienny, że nie mogę stwierdzić, czy te dwa pakiety używają tej samej metody do wykrywania i modelowania interakcji.

Odpowiedz

3

Podsumowując, różnica między tymi dwoma podejściami sprowadza się do oszacowania "funkcji zależności cząstkowej" obu czynników prognostycznych.

Pakiet dismo oparty jest na kodzie oryginalnym podanym w Elith et al., 2008 i można znaleźć oryginalne źródło w materiale uzupełniającym. Artykuł bardzo krótko opisuje procedurę. Zasadniczo prognozy modelu są uzyskiwane na siatce dwóch predyktorów, ustawiając wszystkie inne predyktory na ich wartości. Prognozy modelu są następnie cofane do siatki. Średnie kwadratowe błędy tego modelu są następnie mnożone przez 1000. Statystyka ta wskazuje odejścia przewidywań modelu z liniowej kombinacji predyktorów, wskazując możliwą interakcję.

Z pakietu dismo możemy również uzyskać odpowiedni kod źródłowy dla gbm.interactions. Badanie interakcji sprowadza się do następujących poleceń (kopiowane bezpośrednio ze źródła):

interaction.test.model <- lm(prediction ~ as.factor(pred.frame[,1]) + as.factor(pred.frame[,2])) 

interaction.flag <- round(mean(resid(interaction.test.model)^2) * 1000,2) 

pred.frame zawiera siatkę z dwóch do przewidywania pytanie, prediction jest predykcja z oryginalnego gbm wyposażona modelu, w którym z wyjątkiem dwóch predykcyjne pod uwagę są ustalane w ich środkach.

Różni się ona od statystyk H Friedmana H (Friedman & Popescue, 2005), oszacowanych za pomocą wzoru (44) dla dowolnej pary predyktorów. Zasadniczo jest to odejście od addytywności dla dowolnych dwóch predyktorów, które uśredniają wartości innych zmiennych, NIE ustawiając innych zmiennych w ich środkach. Wyraża się ją jako procent całkowitej wariancji funkcji zależności cząstkowej dwóch zmiennych (lub przewidywanych przewidywań modelu), więc zawsze będzie między 0-1.

Powiązane problemy