mam df, która ma dane jak poniżej:poszerzenia dataframe uzyskać miesięczne sumy dochodów wszystkich unikalnych wartościach catogorical kolumn w R
sub = c("X001","X002", "X001","X003","X002","X001","X001","X003","X002","X003","X003","X002")
month = c("201506", "201507", "201506","201507","201507","201508", "201508","201507","201508","201508", "201508", "201508")
tech = c("mobile", "tablet", "PC","mobile","mobile","tablet", "PC","tablet","PC","PC", "mobile", "tablet")
brand = c("apple", "samsung", "dell","apple","samsung","apple", "samsung","dell","samsung","dell", "dell", "dell")
revenue = c(20, 15, 10,25,20,20, 17,9,14,12, 9, 11)
df = data.frame(sub, month, brand, tech, revenue)
chcę użyć sub i miesiąc jako klucz i dostać jeden wiersz dla każdego abonenta miesięcznie, który wyświetla sumę przychodów dla unikalnych wartości w technologii i marce dla tego abonenta za ten miesiąc. Ten przykład jest uproszczony iz mniejszą ilością kolumn, ponieważ mam ogromny zestaw danych, postanowiłem spróbować zrobić to z data.table
.
udało mi się zrobić to za jednym catagorical kolumnie, albo tech lub marki za pomocą tego:
df1 <- dcast(df, sub + month ~ tech, fun=sum, value.var = "revenue")
ale chcę to zrobić dla dwóch lub więcej caqtogorical kolumn, tak daleko Próbowałem to:
df2 <- dcast(df, sub + month ~ tech+brand, fun=sum, value.var = "revenue")
i to właśnie Łączy unikalne wartości obu catogorical kolumn i sum na to, ale nie chcę tego. I wan oddzielne kolumny dla każdej niepowtarzalnej wartości wszystkich kolumn katogorycznych.
Jestem nowy dla R i byłbym wdzięczny za każdą pomoc.
Jaki byłby oczekiwany wynik? – Haboryme