panda rok kalendarzowy indeks roku przez dekadę

załóżmy, że mam ramkę danych z indeksem jako miesięczny czas, wiem, że mogę używać dataframe.groupby(lambda x:x.year) do grupowania danych miesięcznych na rok i stosowania innych operacji. Czy jest jakiś sposób, abym mógł je szybko pogrupować, powiedzmy przez dekadę?panda rok kalendarzowy indeks roku przez dekadę

dzięki za wszelkie wskazówki.

Źródło

2013-07-20 wiswit

Aby uzyskać dekadę można liczbami całkowitymi podzielić przez 10 lat, a następnie pomnożyć przez 10. Na przykład, jeśli począwszy od

>>> dates = pd.date_range('1/1/2001', periods=500, freq="M") 
>>> df = pd.DataFrame({"A": 5*np.arange(len(dates))+2}, index=dates) 
>>> df.head() 
      A 
2001-01-31 2 
2001-02-28 7 
2001-03-31 12 
2001-04-30 17 
2001-05-31 22

Można grupować przez rok, jak zwykle (tutaj mamy DatetimeIndex więc to naprawdę łatwe):

>>> df.groupby(df.index.year).sum().head() 
     A 
2001 354 
2002 1074 
2003 1794 
2004 2514 
2005 3234

czy można zrobić (x//10)*10 trick:

>>> df.groupby((df.index.year//10)*10).sum() 
      A 
2000 29106 
2010 100740 
2020 172740 
2030 244740 
2040 77424

Jeśli nie masz czegoś, na którym możesz użyć numeru .year, nadal możesz wykonać numer lambda x: (x.year//10)*10).

Źródło

2013-07-20 17:24:52 DSM

Użyj atrybutu letnią index:

df.groupby(df.index.year)

Źródło

2013-07-20 17:25:47 waitingkuo

powiedzmy, data kolumna idzie o nazwie Date, następnie można grupować się

dataframe.set_index('Date').ix[:,0].resample('10AS', how='count')

Uwaga: ix - tutaj wybiera pierwszą kolumnę w ramce danych

Otrzymujesz różne przesunięcia: http://pandas.pydata.org/pandas-docs/stable/timeseries.html#offset-aliases

Źródło

2016-02-10 17:20:27

panda rok kalendarzowy indeks roku przez dekadę

Odpowiedz

Powiązane problemy