2013-02-28 19 views
5

Mam plik .csv w następującym formacie:Jak pogrupować data.frame według daty?

Date  ,  Time , Value 
1899-01-01 , 4:00:00 , 1 
1899-01-01 , 4:01:00 , 2 
1899-01-01 , 4:02:00 , 3 
1899-01-01 , 4:03:00 , 4 
1899-01-01 , 4:04:00 , 5 
1900-08-22 , 22:00:00 , 101 
1900-08-22 , 22:01:00 , 102 
2013-08-29 , 4:00:00 , 1000 
2013-02-29 , 4:02:00 , 1001 
2013-02-29 , 4:03:00 , 1002 

jest to możliwe do group by date do wytworzenia data.table w następującym formacie:

Date  , Vector(variable length) 
1899-02-28, c(1,2,3,4,5) 
1900-08-22, c(101,102) 
1900-08-22, c(1000,1001,1002) 

to jest najlepsze, że mam tak pory (po dniu próby)

raw <- read.csv(pathName, header = TRUE, stringsAsFactors = FALSE) 
groupedByDate <- split(raw, raw$Date) 

wydaje się to jednak w celu uzyskania bardzo szeroki stół jedną kolumnę dla każdego d zjadłem, co nie jest bardzo zbliżone do tego, co chcę.

Odpowiedz

8

Co na temat korzystania aggregate na data.frame nazwie „mydf” w następujący sposób:

> temp <- aggregate(Value ~ Date, mydf, as.vector) 
> temp 
     Date   Value 
1 1899-01-01 1, 2, 3, 4, 5 
2 1900-08-22  101, 102 
3 2013-02-29  1001, 1002 
4 2013-08-29   1000 

„wartość” kolumna jest obecnie list który zawiera swoje wektory.

> temp$Value 
$`0` 
[1] 1 2 3 4 5 

$`1` 
[1] 101 102 

$`2` 
[1] 1001 1002 

$`3` 
[1] 1000 

czego prawdopodobnie szuka z split jest:

> split(mydf$Value, mydf$Date) 
$`1899-01-01 ` 
[1] 1 2 3 4 5 

$`1900-08-22 ` 
[1] 101 102 

$`2013-02-29 ` 
[1] 1001 1002 

$`2013-08-29 ` 
[1] 1000 
+0

Dzięki, działa to absolutnie genialnie! Zaznaczę twoją odpowiedź jako pierwszą. – Contango

3

Zastosowanie aggregate i paste0

> aggregate(Value ~ Date, data=DF, FUN=paste0) 
     Date   Value 
1 1899-01-01 1, 2, 3, 4, 5 
2 1900-08-22  101, 102 
3 2013-02-29  1001, 1002 
4 2013-08-29   1000 
+0

Dziękuję bardzo za tę odpowiedź, bardzo doceniam. p.s. Tak naprawdę chciałem wektor liczb, więc jego "c" zamiast "wklej". – Contango