stworzyłem Series
z DataFrame
, kiedy resampled niektóre dane o liczbie tak: gdzie H2
jest DataFrame
:Pandy zresetować indeks serii usunąć multiindex
H3=H2[['SOLD_PRICE']]
H5=H3.resample('Q',how='count')
H6=pd.rolling_mean(H5,4)
Otrzymano serię, która wygląda tak:
1999-03-31 SOLD_PRICE NaN
1999-06-30 SOLD_PRICE NaN
1999-09-30 SOLD_PRICE NaN
1999-12-31 SOLD_PRICE 3.00
2000-03-31 SOLD_PRICE 3.00
z indeksem, który wygląda tak:
MultiIndex
[(1999-03-31 00:00:00, u'SOLD_PRICE'), (1999-06-30 00:00:00, u'SOLD_PRICE'), (1999-09-30 00:00:00, u'SOLD_PRICE'), (1999-12-31 00:00:00, u'SOLD_PRICE'),.....
Nie chcę drugiej kolumny jako indeksu. Idealnie byłoby mieć DataFrame
z kolumną 1 jako "Data" i kolumną 2 jako "Sprzedaż" (spadek drugiego poziomu indeksu). Nie bardzo wiem, jak zmienić konfigurację indeksu.
tylko ogólne komentarz: nazywania zmiennych o numery wskazujące kolejność, w jakiej używasz ich jest przepis na katastrofę. Zastanów się nad patologicznym przypadkiem, w którym 'pandy' nie ma' DataFrame' lub 'Series' i zostały one po prostu nazwane' DataStructure1' i 'DataStructure2', a wszystkie ich metody zostały po prostu nazwane' method1', 'method2', i tak dalej . Nadanie zmiennym znaczących nazw sprawi, że twój kod będzie czytelny dla innych czytających go po raz pierwszy. Nadanie wymownym nazwom zmiennych pozwala również * użytkownikowi * powrócić do kodu w ciągu miesiąca i szybko wrócić do prędkości. –
Dobra rada, jeszcze raz dziękuję – dartdog