jak zmienić kolumnę Dataframe z typu String na Double type w pyspark

Mam ramkę danych z kolumną jako String. Chciałem zmienić typ kolumny na Podwójny typ w pyspark.jak zmienić kolumnę Dataframe z typu String na Double type w pyspark

Po to droga, zrobiłem, -

toDoublefunc = UserDefinedFunction(lambda x: x,DoubleType()) 
changedTypedf = joindf.withColumn("label",toDoublefunc(joindf['show']))

Chciałem tylko wiedzieć, czy to jest właściwy sposób, aby to zrobić, jak podczas biegu przez regresja logistyczna, ja dostaję jakiś błąd, więc Zastanawiam się, jest to powód kłopotów.

Źródło

2015-08-29 Abhishek Choudhary

Nie ma potrzeby na UDF tutaj. Column już zapewnia cast method z DataType przykład:

from pyspark.sql.types import DoubleType 

changedTypedf = joindf.withColumn("label", joindf["show"].cast(DoubleType()))

lub krótki łańcuch:

changedTypedf = joindf.withColumn("label", joindf["show"].cast("double"))

Źródło

2015-08-29 13:15:11 zero323

rozwiązanie było proste -

toDoublefunc = UserDefinedFunction(lambda x: float(x),DoubleType()) 
changedTypedf = joindf.withColumn("label",toDoublefunc(joindf['show']))

Źródło

2015-08-29 10:31:10

Zachowaj nazwę kolumny i uniknąć dodatkowego dodanie kolumny stosując taką samą nazwę jak kolumna danych wejściowych:

changedTypedf = joindf.withColumn("show", joindf["show"].cast(DoubleType()))

Źródło

2016-07-12 02:16:36 Disha

Dzięki szukałem jak zachować oryginalną nazwę kolumny – javadba

jest jakaś lista gdzieś od Spark typy danych krótki ciąg wskaże? – alfredox

Podane odpowiedzi wystarczą, aby poradzić sobie z problemem, ale chcę podzielić się innym sposobem, który może zostać wprowadzony do nowej wersji. f Spark (Nie mam pewności co do tego) więc podana odpowiedź go nie złapała.

Możemy dotrzeć kolumny w oświadczeniu zapłonowej z col("colum_name") słowa kluczowego:

from pyspark.sql.functions import col , column 
changedTypedf = joindf.withColumn("show", col("show".cast("double"))

Źródło

2017-10-24 12:13:54

Otrzymałem komunikat o błędzie: Obiekt "str" nie ma atrybutu "rzut" – Jie

jak zmienić kolumnę Dataframe z typu String na Double type w pyspark

Odpowiedz

Powiązane problemy