W jaki sposób implementacja R drzew wzmocnionych regresji (pakiet gbm) domyślnie zajmuje się brakującymi wartościami zmiennych predykcyjnych? Czy są one przypisane, a jeśli tak, to według którego algorytmu?R: W jaki sposób wzmocnione drzewa regresji radzą sobie z brakującymi danymi?
Kontekst mojego pytania: Zrobiłem analizę prawie rok temu i wykorzystałem skrypty dostarczone przez Elith i in. 2008 (Przewodnik po ulepszonych drzewach regresji, Journal of Animal Ecology 77, 802-813) w celu wywołania gbm. Teraz zdałem sobie sprawę, że mam pewne NA dla niektórych zmiennych predykcyjnych i zastanawiam się, jak radzą sobie z nimi wzmocnione drzewa regresji. Przeglądając różne podręczniki i artykuły stwierdziłem, że stwierdzenia takie jak "wzmocnione drzewa regresji mogą pomieścić brakujące wartości" i podobne, ale nie mogłem znaleźć dokładnego opisu, co robi gbm z brakującymi wartościami. Sama analiza przebiegła bezproblemowo, więc gbm musiał poradzić sobie z nimi w taki czy inny sposób. W podręczniku gbm znajduje się nawet przykład, w którym celowo wprowadzono NAs, aby wykazać, że gbm działa bez problemów. Teraz chciałbym wiedzieć, co gbm dokładnie robi z NA (pomiń je, przypisz, ...?).
To pytanie wydaje się być nie na temat, ponieważ jest o realizacji algorytmu statystycznego. Być może lepiej pasuje do Cross Validated. –
@ SimonO101: Wątpiłem, który z nich będzie właściwym forum. Opublikuję go w Crossvalidated. – user7417
Zostawię to na jakiś czas - strona jest uruchamiana przez społeczność. Jeśli jest zgoda co do tego, że nie jest to tematem, to pytanie zostanie zamknięte, a Ty będziesz pytać o CV. W tej chwili to tylko ja, który uważa, że lepiej nadaje się do CV! –