2014-11-20 11 views
9

Mam dataframe pandy:Jak poprawnie ustawić wartość Datetime Index dla obiektu datetime Pand w ramce danych?

lat   lng   alt days    date  time 
0 40.003834 116.321462 211 39745.175405  2008-10-24 04:12:35 
1 40.003783 116.321431 201 39745.175463 2008-10-24  04:12:40 
2 40.003690 116.321429 203 39745.175521  2008-10-24  04:12:45 
3 40.003589 116.321427 194 39745.175579  2008-10-24  04:12:50 
4 40.003522 116.321412 190 39745.175637  2008-10-24  04:12:55 
5 40.003509 116.321484 188 39745.175694  2008-10-24  04:13:00 

Dla który próbuję przekonwertować DF [ 'data'] [ 'i DF czas'] kolumny do datetime. Mogę zrobić:

df['Datetime'] = pd.to_datetime(df['date']+df['time']) 
df = df.set_index(['Datetime']) 
del df['date'] 
del df['time'] 

I otrzymujemy:

    lat   lng   alt days 
Datetime        
2008-10-2404:12:35 40.003834 116.321462 211 39745.175405  
2008-10-2404:12:40 40.003783 116.321431 201 39745.175463 
2008-10-2404:12:45 40.003690 116.321429 203 39745.175521  
2008-10-2404:12:50 40.003589 116.321427 194 39745.175579  
2008-10-2404:12:55 40.003522 116.321412 190 39745.175637 

ale gdy próbuję:

df.between_time(time(1),time(22,59,59))['lng'].std() 

pojawia się błąd - 'Błąd typu: Wskaźnik musi być DatetimeIndex'

Tak, próbowałem również ustawić DatetimeIndex:

df['Datetime'] = pd.to_datetime(df['date']+df['time']) 
#df = df.set_index(['Datetime']) 
df = df.set_index(pd.DatetimeIndex(df['Datetime'])) 
del df['date'] 
del df['time'] 

I to zgłasza błąd także - 'DateParseError: nieznany format string'

Jak utworzyć kolumnę datetime i DatetimeIndex prawidłowo, tak aby df.between_time() działa dobrze?

Dzięki za pomoc!

Odpowiedz

16

Aby uprościć odpowiedź Kirubaharan trochę:

df['Datetime'] = pd.to_datetime(df['date'] + ' ' + df['time']) 
df = df.set_index('Datetime') 

I żeby dostać przejażdżkę niechcianych kolumn (podobnie jak PO, ale nie określił per se na pytanie):

df = df.drop(['date','time'], axis=1) 
+0

Dziękuję Kracitowi za jeszcze bardziej uproszczoną odpowiedź. To również działa świetnie i jest to, co zrobię z uwagi na prostotę. – user3654387

11

Nie tworzymy indeks datetime poprawnie

format = '%Y-%m-%d %H:%M:%S' 
df['Datetime'] = pd.to_datetime(df['date'] + ' ' + df['time'], format=format) 
df = df.set_index(pd.DatetimeIndex(df['Datetime'])) 
+0

Dobrze, to działa dobrze. Brakujący zamknięty cytat z pierwszej linii, BTW. – user3654387

Powiązane problemy