Pracuję z danymi ankietowymi załadowanymi z pliku h5 jako hdf = pandas.HDFStore('Survey.h5')
przez pakiet pand. W ramach tego DataFrame
wszystkie wiersze są wynikiem pojedynczej ankiety, natomiast kolumny są odpowiedziami na wszystkie pytania w ramach jednej ankiety.Panda segmentów DataFrame według wierszy
Mam zamiar zmniejszyć ten zbiór danych do mniejszego DataFrame
, w tym tylko wierszy z pewną przedstawioną odpowiedzią na pewne pytanie, tj. Z całą tą samą wartością w tej kolumnie. Jestem w stanie określić wartości indeksu wszystkich wierszy z tym warunkiem, ale nie mogę znaleźć, jak usunąć tego wiersza lub utworzyć nowy plik df tylko z tych wierszy.
jest możliwe pokroić dataframe i powiedzieć (c = c = 5 lub 6) tak: ---> df [((df.A == 0) i (df.B ==2) i (df.C == 5 lub 6) i (df.D == 0))] – yoshiserry
df [((df.A = = 0) & (df.B == 2) & df.C.isin ([5, 6]) & (df.D == 0))] lub df [((df.A == 0) i (df.B == 2) & ((df.C == 5) | (df.C == 6)) & (df.D == 0))] –