2015-08-21 12 views
6

Mają szereg czasowy (TS) indeksowane przez DatatimeIndex, chcesz grupy go przez 10 minutJak pogrupować szeregi czasowe przez 10 minut za pomocą pand?

index x y z 

ts1  .... 
ts2  .... 
... 

wiem jak grupa przez 1 minutę

def group_by_minute(timestamp): 
    year = timestamp.year 
    month = timestamp.month 
    day = timestamp.day 
    hour = timestamp.hour 
    minute = timestamp.minute 
    return datetime.datetime(year, month, day, hour, minute) 

następnie

ts.groupby(group_by_minute, axis=0) 

moja dostosowana funkcja (z grubsza)

def my_function(group): 
    first_latitude = group['latitude'].sort_index().head(1).values[0] 
    last_longitude = group['longitude'].sort_index().tail(1).values[0] 
    return first_latitude - last_longitude 

więc DataFrame ts powinien zdecydowanie zawiera 'szerokości geograficznej' i kolumny 'długości geograficznej'

Podczas korzystania TimeGrouper

ts.groupby(pd.TimeGrouper(freq='100min')).apply(my_function) 

mam następujące błędy,

TypeError: cannot concatenate a non-NDFrame object 
+0

Czy próbowałeś 'resample'? Na przykład. 'df.resample ('1min', 'mean')' Jaka agregacja robisz – JoeCondron

+0

@JoeCondron Używam dostosowanych funkcji z funkcją APPLY. Wydaje mi się, że resample lub TimeGrouper wypełnia lukę automatycznie, nawet jeśli istnieje luka czasowa jednego roku. Czy istnieje sposób, aby temu zapobiec? Wielkie dzięki –

+0

Możesz przekazać swoją niestandardową funkcję, taką jak: 'df.resample ('10min', how = my_func)'. Nie wypełni luk, chyba że im to powiesz. Może powinieneś opublikować funkcję, którą chcesz przekazać i pożądany wynik. Alternatywnie możesz ustawić ostatnią linię swojej funkcji na "minute = 10 * (minute/10)". – JoeCondron

Odpowiedz

10

Jest pandas.TimeGrouper dla Tego rodzaju rzeczy, które opisałeś, mogą być następujące:

agg_10m = df.groupby(pd.TimeGrouper(freq='10Min')).aggregate(numpy.sum) #or other function 
+1

thx za odpowiedź. Wygląda na to, że pd.TimeGrouper istnieje, ale nie jest tutaj udokumentowany http://pandas.pydata.org/pandas-docs/stable/api.html –

+0

Oops, masz rację. Nigdy nie zauważ, że jest to nieudokumentowane. –

+0

uzyskać "TypeError: nie można połączyć obiektu nie-NDFrame" przez zastosowanie TimeGrouper –

2

wiem, że to jest stary, ale pd.Grouper() będzie również osiągnąć ten cel:

agg_10m = df.groupby(pd.Grouper(freq='10Min')).aggregate(numpy.sum) 
Powiązane problemy