Mam serię danych z kilkudniowymi danymi 1-minutowymi i chciałbym ją uśrednić przez wszystkie dni według pory dnia.Szybszy sposób grupowania według pory dnia w pandach
Jest to bardzo powolny:
from datetime import datetime
from pandas import date_range, Series
time_ind = date_range(datetime(2013, 1, 1), datetime(2013, 1, 10), freq='1min')
all_data = Series(randn(len(time_ind)), time_ind)
time_mean = all_data.groupby(lambda x: x.time()).mean()
trwa prawie minutę do uruchomienia!
ile coś takiego:
time_mean = all_data.groupby(lambda x: x.minute).mean()
trwa tylko ułamek sekundy.
Czy istnieje szybszy sposób grupowania według pory dnia?
Każdy pomysł, dlaczego jest tak powolny?
dt.time nie jest zoptymalizowany przez pandy. Wymaga to dużo czasu na przekształcenie pandy TimeSeries w tablicę datetime.time. – waitingkuo