Mam zestaw danych z około 3 miliony wierszy i następującą strukturę:Najszybsza droga do przekształcenia wartości zmiennych jako kolumny
PatientID| Year | PrimaryConditionGroup
---------------------------------------
1 | Y1 | TRAUMA
1 | Y1 | PREGNANCY
2 | Y2 | SEIZURE
3 | Y1 | TRAUMA
Będąc całkiem nowy, R, mam pewien problem ze znalezieniem właściwej drogi do przekształcania danych w strukturę przedstawiono poniżej:
PatientID| Year | TRAUMA | PREGNANCY | SEIZURE
----------------------------------------------
1 | Y1 | 1 | 1 | 0
2 | Y2 | 0 | 0 | 1
3 | Y1 | 1 | 0 | 1
Moje pytanie brzmi: Co jest najszybszym/najbardziej elegancki sposób, aby utworzyć data.frame, gdzie wartości PrimaryConditionGroup stać kolumny, pogrupowanych według ID_Pacjenta i rok (licząc liczbę occurences)?
+1 'ddply' nie będzie o wiele mniej pisanie, naprawdę, i będzie oczywiście dużo wolniej. – joran
Dlaczego miałbyś nawet wziąć pod uwagę ddply na ten problem? – hadley
Cześć Josh, dziękuję, działa to zgodnie z oczekiwaniami i ładnie działa. Jaki byłby najbardziej zwięzły/idiomatyczny sposób przekształcania danych (jeśli wydajność nie była problemem)? – Matt