Konwertuję ciągi znaków do wartości kategorycznych w moim zestawie danych za pomocą następującego fragmentu kodu.Jakikolwiek sposób na odwzorowanie enkodera etykiet w pandach Pythona?
data['weekday'] = pd.Categorical.from_array(data.weekday).labels
Dla np,
index weekday
0 Sunday
1 Sunday
2 Wednesday
3 Monday
4 Monday
5 Thursday
6 Tuesday
Po kodującego tygodnia, mój zestaw danych wygląda następująco:
index weekday
0 3
1 3
2 6
3 1
4 1
5 4
6 5
Czy jest jakiś sposób mogę wiedzieć, że niedziela została odwzorowana do 3, Środa do 6 i tak dalej?
W przypadku, gdy nie wiem, co odrębne wartości idą w danych, tworząc listę twardych zakodowanych wartości może przeciekać. Jednak LabelEncoder() radzi sobie z tym, co wchodzi w drogę. – Himanshu