Mam dużą ramkę danych z wieloma kolumnami (np. 1000). Mam listę kolumn (generowanych przez skrypt ~ 10). Chciałbym zaznaczyć wszystkie wiersze w oryginalnej ramce danych, w której co najmniej jedna z moich kolumn nie ma wartości null.Wybierz wiersze, w których co najmniej jedna wartość z listy kolumn nie jest pusta.
Więc jeśli chciałbym znać liczbę moich kolumn wcześniej, mógłby zrobić coś takiego:
list_of_cols = ['col1', ...]
df[
df[list_of_cols[0]].notnull() |
df[list_of_cols[1]].notnull() |
...
df[list_of_cols[6]].notnull() |
]
Mogę również iteracyjne nad listą przełęcze i utworzyć maskę, która to chciałbym zwrócić się do df
, ale jego wygląd jest zbyt nużący. Wiedząc, jak potężne są pandy w odniesieniu do radzenia sobie z nan, spodziewam się, że jest łatwiejszy sposób osiągnięcia tego, co chcę.
Jak mógłbym zatrudnić tego się nie patrzeć na null, ale liczyć wystąpień określonej wartości? Na przykład, biorąc pod uwagę ramkę danych z 10 kolumnami, chcę policzyć liczbę wierszy, w których wartość w pięciu z tych kolumn to "Brakujący/niekompletny". Znalazłem dziesiątki wątków, jak zliczać WSZYSTKIE wartości w każdym wierszu lub kolumnie, ale chcę tylko liczbę, w której wartość dokładnie pasuje do tego ciągu. – Korzak