Spark - Group by HAVING ze składnią danych?

Jaka jest składnia korzystania z groupby-have w Spark bez sql/hiveContext? Wiem, że mogę zrobićSpark - Group by HAVING ze składnią danych?

DataFrame df = some_df 
df.registreTempTable("df");  
df1 = sqlContext.sql("SELECT * FROM df GROUP BY col1 HAVING some stuff")

ale jak mam to zrobić za pomocą składni jak

df = df.select(df.col("*")).groupBy(df.col("col1")).having("some stuff")? Ten .having() wydaje się nie istnieć.

2016-08-09 lte__

Tak, to nie istnieje. Wyrażasz tę samą logikę, używając agg, a następnie where:

df.groupBy(someExpr).agg(somAgg).where(somePredicate)

2016-08-09 11:40:36 zero323

Odpowiedz