Mam kolumnę w DataFrame pandy, którą chciałbym podzielić na pojedynczym miejscu. Podział jest dość prosty z DataFrame.str.split(' ')
, ale nie mogę utworzyć nowej kolumny z ostatniego wpisu. Kiedy I .str.split()
kolumna otrzymuję listę tablic i nie wiem jak to manipulować, aby uzyskać nową kolumnę dla mojej DataFrame.Pobierz ostatnią kolumnę po operacji .str.split() na kolumnie w pandach DataFrame
Oto przykład. Każdy wpis w kolumnie zawiera "cenę danych symbol" i chciałbym oddzielić cenę (i ostatecznie usunąć "p" ... lub "c" w połowie przypadków).
import pandas as pd
temp = pd.DataFrame({'ticker' : ['spx 5/25/2001 p500', 'spx 5/25/2001 p600', 'spx 5/25/2001 p700']})
temp2 = temp.ticker.str.split(' ')
który daje
0 ['spx', '5/25/2001', 'p500']
1 ['spx', '5/25/2001', 'p600']
2 ['spx', '5/25/2001', 'p700']
Ale temp2[0]
prostu daje tablicę jednej liście startowej i temp2[:][-1]
zawiedzie. Jak mogę przekonwertować ostatni wpis w każdej tablicy na nową kolumnę? Dzięki!
To właśnie pomogło mi dodać plik dziennika w pandach, które były zbyt przerażające i niechlujne, aby dotykać wcześniej (pojedyncza kolumna danych z dużą ilością informacji w rzędzie). – trench
Wszystkie te podejścia mają fatalną skuteczność w porównaniu z odpowiedzią Wesa McKinneya. –
@JohnZwinck: wow, downstream na temat wydajności tylko na pięcioletnią odpowiedź na temat funkcjonalności, która została wprowadzona tylko około [dwa miesiące wcześniej] (https://github.com/pandas-dev/pandas/issues/1656)? To jest ... rygorystyczne, dam ci to! – DSM