Funkcja pandy factorize
przypisuje każdą unikatową wartość w szeregu do kolejnego, opartego na 0 indeksowaniu, i oblicza, do którego indeksu należy każdy wpis z serii.Wielokolumnowy faktoryzacja w pandach
chciałbym osiągnąć równowartość pandas.factorize
na wielu kolumnach:
import pandas as pd
df = pd.DataFrame({'x': [1, 1, 2, 2, 1, 1], 'y':[1, 2, 2, 2, 2, 1]})
pd.factorize(df)[0] # would like [0, 1, 2, 2, 1, 0]
Oznacza to, że chcę, aby określić każdą wyjątkową krotki wartości w kilku kolumnach ramki danych, przypisać indeks do sekwencyjnego każdy i obliczyć indeks, do którego należy każdy wiersz w ramce danych.
Factorize
działa tylko na pojedynczych kolumnach. Czy w pandach istnieje funkcja podobna do wielu kolumn?
Jaki jest twój oczekiwany wynik? – waitingkuo
Lista w komentarzu - unikalny, sekwencyjny indeks dla każdej odrębnej wartości (x, y). – ChrisB