6
mają dwie kolumny:matryca pyspark ze zmiennych binarnych
ID Text
1 a
2 b
3 c
Jak mogę stanie stworzyć macierz zmiennych binarnych tak:
ID a b c
1 1 0 0
2 0 1 0
3 0 0 1
wykorzystaniem biblioteki pyspark i jego możliwości?
Traceback (najnowsza wezwanie ostatni): Plik "", linia 2, w NameError: nazwa 'F' nie jest zdefiniowane –
Co jest tutaj F? –
from pyspark.sql importuje funkcje jako F –