Funkcja takeSample() w Spark

Próbuję użyć funkcji takeSample() w Spark, a parametry są - dane, liczba próbek do pobrania i nasiona. Ale nie chcę używać nasion. Za każdym razem chcę mieć inną odpowiedź. Nie jestem w stanie wymyślić, jak to zrobić. Próbowałem użyć System.nanoTime jako wartości początkowej, ale spowodowało błąd, ponieważ myślę, że typ danych nie pasuje. Czy jest jakaś inna funkcja podobna do takeSample(), która może być używana bez nasion? Czy istnieje inna implementacja, której mogę użyć z takeSample(), aby za każdym razem uzyskać inny wynik.Funkcja takeSample() w Spark

Źródło

2013-02-04 Prateek Kulkarni

System.nanoTime jest typu long, ziarno oczekiwane przez takeSample jest typu Int. Dlatego powinien działać takeSample(..., System.nanoTime.toInt).

Źródło

2013-02-04 13:56:20

W scala '.toInt' powinno być preferowane przez' .intValue' –

@ RégisJean-Gilles Dzięki, poprawione. –

System.nanoTime zwraca Long, natomiast takeSample oczekuje wartości Int.
Możesz podać scala.util.Random.nextInt jako wartość początkową do funkcji takeSample.

Źródło

2013-02-04 13:54:50

Od wersji 1.0.0 Sparka parametr seed jest opcjonalny. Zobacz https://issues.apache.org/jira/browse/SPARK-1438.

Źródło

2014-12-08 14:27:59

Funkcja takeSample() w Spark

Odpowiedz

Powiązane problemy