Jestem całkiem nowy dla potoków w sklearn i wpadam na ten problem: mam zbiór danych, który ma mieszankę tekstu i liczb, tj. Niektóre kolumny mają tylko tekst i odpoczynek mają liczby całkowite (lub liczby zmiennoprzecinkowe).sklearn pipeline - jak zastosować różne transformacje na różnych kolumnach
Zastanawiam się, czy możliwe było zbudowanie potoku, w którym mogę na przykład zadzwonić pod numer LabelEncoder()
w funkcjach tekstowych i MinMaxScaler()
w kolumnach liczb. Przykłady, które widziałem w Internecie, najczęściej wskazują na użycie LabelEncoder()
w całym zestawie danych, a nie w kolumnach wyboru. czy to możliwe? Jeśli tak, wszelkie wskazówki byłyby bardzo mile widziane.
Każdy pomysł, dlaczego otrzymuję "TypeError: Wszystkie estymatory powinny stosować dopasowanie i transformację". jeśli uruchomię twój kod? scikit-learn 0.19.1 –
Nieważne, podpis został zmieniony widocznie - przesłałem zmianę –