2016-01-09 20 views
7

Załadowałem pliki CSV z indeksem datetime, który jest ostatnim dniem miesięcy w roku. Chciałem wypełnić brakujące daty pustymi wartościami jako wiersze.Dodaj brakujący indeks daty w ramce danych

Poniżej mój plik CSV struktura

Date Australia China 
2011-01-31 4.75 5.81 
2011-02-28 4.75 5.81 
2011-03-31 4.75 6.06 
2011-04-30 4.75 6.06 

Chcę, aby wypełnić wszystkie daty w miesiącu z pustymi kolumnami.

Próbowałem następujący kod, ale nie działa.

import pandas as pd 
df = pd.read_csv("data.csv", index_col="Date") 
df.reindex(pd.date_range("2011-01-01", "2011-10-31"), fill_value="NaN") 

Odpowiedz

6

Musisz ustawić DatetimeIndex na swoim dataframe, więc chciałbym zmodyfikować kod do:

import pandas as pd 
df = pd.read_csv("data.csv", index_col="Date") 
df.index = pd.DatetimeIndex(df.index) 
df = df.reindex(pd.date_range("2011-01-01", "2011-10-31"), fill_value="NaN") 
df.to_csv('test.csv') 

to powinno działać.

EDIT: dodaj przykładowy wyjście testowe:

... 
2011-01-24,NaN,NaN 
2011-01-25,NaN,NaN 
2011-01-26,NaN,NaN 
2011-01-27,NaN,NaN 
2011-01-28,NaN,NaN 
2011-01-29,NaN,NaN 
2011-01-30,NaN,NaN 
2011-01-31,4.75,5.81 
2011-02-01,NaN,NaN 
2011-02-02,NaN,NaN 
2011-02-03,NaN,NaN 
2011-02-04,NaN,NaN 
2011-02-05,NaN,NaN 
2011-02-06,NaN,NaN 
... 
+0

Dzięki za pomoc! działa idealnie dla mnie. – Unnikrishnan

+0

@Unnikrishnan nie ma za co, proszę rozważyć przegłosowanie odpowiedzi, jeśli działa dobrze dla twoich celów. –

+0

Zawsze miło, gdy jedna dodatkowa linia rozwiązuje problem. –