Mam plik .csv zawierający informacje kontaktowe, które importuję jako ramkę danych pandy.Python/Pandy: Upuszczanie wierszy z ramki danych na dopasowaniu ciągów z listy
>>> import pandas as pd
>>>
>>> df = pd.read_csv('data.csv')
>>> df.head()
fName lName email title
0 John Smith [email protected] CEO
1 Joe Schmo [email protected] Bagger
2 Some Person [email protected] Clerk
Po zaimportowaniu danych, chciałbym upuścić wiersze, w których jedno pole zawiera jeden z wielu podciągów na liście. Na przykład:
to_drop = ['Clerk', 'Bagger']
for i in range(len(df)):
for k in range(len(to_drop)):
if to_drop[k] in df.title[i]:
# some code to drop the rows from the data frame
df.to_csv("results.csv")
Jaki jest preferowany sposób na zrobienie tego w Pandach? Czy powinien to być nawet etap przetwarzania końcowego, czy też preferuje się go najpierw przefiltrować przed zapisaniem w ramce danych? Myślałem, że łatwiej będzie manipulować raz w obiekcie ramki danych.
http: // chrisalbon. com/python/pandas_drop_column_containing_certain_string.html sprawdź to – FirebladeDan