Chcę znaleźć parametry ParamGridBuilder
które sprawiają, że najlepszy model w CrossValidator w Spark 1.4.x,Jak wyodrębnić najlepsze parametry z CrossValidatorModel
W Pipeline Example w dokumentacji Spark, dodają różne parametry (numFeatures
, regParam
) przy użyciu ParamGridBuilder
w potoku. Następnie za pomocą następującego wiersza kodu robią najlepszego modelu:
val cvModel = crossval.fit(training.toDF)
Teraz chcę wiedzieć, jakie są parametry (numFeatures
, regParam
) od ParamGridBuilder
która produkuje najlepszy model.
już stosowane następujące polecenia bez powodzenia:
cvModel.bestModel.extractParamMap().toString()
cvModel.params.toList.mkString("(", ",", ")")
cvModel.estimatorParamMaps.toString()
cvModel.explainParams()
cvModel.getEstimatorParamMaps.mkString("(", ",", ")")
cvModel.toString()
Każda pomoc?
Dzięki z góry,
Najlepsze parametry to [zrzucane na logowanie] (https://github.com/apache/spark/blob/a721ee52705100dbd7852f80f92cde4375517e48/mllib/src/main/scala/org/apache/spark/ml/tuning/CrossValidator.scala# L104), ale bije mnie, jak uzyskać dostęp do tej informacji z instancji 'CrossValidatorModel'. – zero323
To naprawdę frustrujące. Nawet nie logują się w PySpark. Tak mała, ale ważna rzecz, której brakuje ... zastanawiam się, czy ktoś faktycznie używa tej funkcji. –
ludzie, jakiekolwiek rozwiązanie tego problemu w najnowszych wersjach Spark? – Rami