Chcę policzyć liczbę wystąpień określonych słów w ramce danych. Wiem, że używanie "str.contains"Liczba wystąpień niektórych słów w ramce danych pandy
a = df2[df2['col1'].str.contains("sample")].groupby('col2').size()
n = a.apply(lambda x: 1).sum()
Obecnie używam powyższego kodu. Czy istnieje metoda dopasowania wyrażenia regularnego i uzyskania liczby wystąpień? W moim przypadku mam dużą ramkę danych i chcę dopasować około 100 ciągów znaków.
To jest o wiele starsze i prawdopodobnie szybciej, eliminując potrzebę "get". –
@Andy Hayden: Powiedzmy, że chcę 'hello' liczyć i "słowo" liczyć i drukować "" hello "count = 1 ','" słowo "count = 1 '? Czy mogę to zrobić w jednym wierszu kodu? –
A co z 'word_regexs = [r'he ', r'wo']' a następnie utwórz Serię z 'pd.Series ((df.words.str.contains (r) .sum() dla r w word_regexs), word_regexs, name = 'count') '? –