2015-04-06 10 views

Odpowiedz

11

Zakładając chcesz dodać kolumnę o nazwie new do DataFrame df skonstruowanego przez wywołanie wielokrotnie numpy.random.normal, można zrobić:

import numpy 
from pyspark.sql.functions import UserDefinedFunction 
from pyspark.sql.types import DoubleType 

udf = UserDefinedFunction(numpy.random.normal, DoubleType()) 

df_with_new_column = df.withColumn('new', udf()) 
Powiązane problemy