Pracuję nad regularnym data.frame
, który wygląda na duży dla funkcji glm
, więc zdecydowałem, że będę pracował nad rzadką represantacją matrycy modelu, więc mogę umieścić to rzadkie macierz do funkcji glmnet
. Ale sparse.model.matrix
wygląda jak upuścić niektóre wiersze z oryginalnej macierzy. Jakiś pomysł, dlaczego tak się dzieje, i jakiekolwiek rozwiązanie, jak tego uniknąć? Kod poniżej:sparse.model.matrix traci wiersze w R
> mm <- sparse.model.matrix(~clicks01+kl_tomek*bc1+hours+plec+1,
data = daneOst)
> dim(mm)
[1] 1253223 292
> dim(daneOst)
[1] 1258836 6
Należy zauważyć, że używam tego dla modeli opartych na drzewach, które mogą obsługiwać wartości NA. YMMV – Bar
Myślę, że to najlepsze rozwiązanie, jak dotąd. Dlatego akceptuję to jako odpowiedź. –