2012-07-31 21 views
26

Próbuję dodać kolumny do mojego data.table, gdzie nazwy są dynamiczne. Oprócz tego potrzebuję użyć argumentu by podczas dodawania tych kolumn. Na przykład:Dynamiczne nazwy kolumn w data.table

test_dtb <- data.table(a = sample(1:100, 100), b = sample(1:100, 100), id = rep(1:10,10)) 
cn <- parse(text = "blah") 
test_dtb[ , eval(cn) := mean(a), by = id] 

# Error in `[.data.table`(test_dtb, , `:=`(eval(cn), mean(a)), by = id) : 
# LHS of := must be a single column name when with=TRUE. When with=FALSE the LHS may be a vector of column names or positions. 

Kolejna próba:

cn <- "blah" 
test_dtb[ , cn := mean(a), by = id, with = FALSE] 
# Error in `[.data.table`(test_dtb, , `:=`(cn, mean(a)), by = id, with = FALSE) : 'with' must be TRUE when 'by' or 'keyby' is provided 

aktualizacja od Mateusza:

to teraz działa w v1.8.3 na R-Forge. Dziękujemy za wyróżnienie!
Zobacz to podobne pytanie dla nowych przykładów:

Assign multiple columns using data.table, by group

Odpowiedz

22

Od data.table 1.9.4, można po prostu to zrobić:

## A parenthesized symbol, `(cn)`, gets evaluated to "blah" before `:=` is carried out 
test_dtb[, (cn) := mean(a), by = id] 
head(test_dtb, 4) 
#  a b id blah 
# 1: 41 19 1 54.2 
# 2: 4 99 2 50.0 
# 3: 49 85 3 46.7 
# 4: 61 4 4 57.1 

Zobacz Szczegóły w ?:=:

DT[i, (colvector) := val]

[...] NOW PREFEROWANA [...] składnia. Pareny są wystarczające, aby powstrzymać LHS jako symbol; tak samo jak c(colvector)


odpowiedź oryginalny:

Byłaś dokładnie na właściwej drodze: konstruowania wyrażenia być oceniane w ramach wezwania do [.data.table jest data.table sposób zrobić tego rodzaju rzeczy. Idąc dalej, czemu nie skonstruować wyrażenia, które oceniałoby cały argument (a nie tylko jego lewą stronę)?

Coś jak to powinno załatwić sprawę:

## Your code so far 
library(data.table) 
test_dtb <- data.table(a=sample(1:100, 100),b=sample(1:100, 100),id=rep(1:10,10)) 
cn <- "blah" 

## One solution 
expr <- parse(text = paste0(cn, ":=mean(a)")) 
test_dtb[,eval(expr), by=id] 

## Checking the result 
head(test_dtb, 4) 
#  a b id blah 
# 1: 30 26 1 38.4 
# 2: 83 82 2 47.4 
# 3: 47 66 3 39.5 
# 4: 87 23 4 65.2 
+0

fantastycznie, dziękuję. mógłbym przysiąc, próbowałem tej odmiany, ale oczywiście nie. pomóc bardzo docenić. – Alex

+0

+1 Dodany link do tego pytania do [FR # 2120] (https://r-forge.r-project.org/tracker/index.php?func=detail&aid=2120&group_id=240&atid=978). Wydaje się, że nadchodzi całkiem sporo. –

15

Wyrażenie może być zbudowana z bquote.

cn <- "blah" 
expr <- bquote(.(as.name(cn)):=mean(a)) 
test_dtb[,eval(expr), by=id] 
+1

O wiele ładniejsze niż robienie "dynamic data.tabling". – Juancentro

+0

Świetna odpowiedź, bardzo użyteczne i elastyczne podejście. +1! – marbel