Jak usunąć wartości z kolumny z pandas.DataFrame
, która występuje rzadko, tzn. Z małą częstotliwością? Przykład:Usuwanie wartości niskiej częstotliwości z pandas.dataframe
In [4]: df[col_1].value_counts()
Out[4]: 0 189096
1 110500
2 77218
3 61372
...
2065 1
2067 1
1569 1
dtype: int64
Więc moje pytanie brzmi: jak usunąć wartości jak 2065, 2067, 1569
i innych? I jak mogę to zrobić dla WSZYSTKICH kolumn, które zawierają w ten sposób .value_counts()
?
UPDATE: o wartościach 'niski' mam na myśli 2065
. Ta wartość występuje w col_1
1 (jeden) razy i chcę usunąć takie wartości.
Co masz na myśli mówiąc "spotykaj się rzadko"? Czy mógłbyś to sprecyzować? Pomocne może być dodanie kodu, który już wypróbowałeś. – guaka
Nie mogę zrozumieć, jak może być "bardziej szczegółowe"? W '' 'col_1''' wartość jak' '0''' spotyka' '' 189096''' razy. A wartość jak "1569" "spotyka się JEDNO razy. Chcę usunąć '' '1569''' i inne podobne wartości w' '' col_1'''. –
Aha! Masz na myśli "występuje", a nie "spełnia". – guaka