Dostaję następujący błąd próbując zbudować ML Pipeline
:Jak przekonwertować ArrayType na DenseVector w PySpark DataFrame?
pyspark.sql.utils.IllegalArgumentException: 'requirement failed: Column features must be of type [email protected] but was actually ArrayType(DoubleType,true).'
Moja features
kolumna zawiera tablicę zmiennoprzecinkowych. Wygląda na to, że muszę je przekonwertować do jakiegoś wektora (nie jest rzadki, więc DenseVector?). Czy istnieje sposób, aby to zrobić bezpośrednio w DataFrame lub czy muszę przekonwertować na RDD?