2014-07-08 8 views
6

ja konfigurowania Spark 0.9 na AWS i jestem stwierdzenia, że ​​przy uruchamianiu interaktywną Pyspark skorupę, moi wykonawcy/zdalne pracownicy uprzedniego zarejestrowany:Spark - Zdalne Akka Client Oddzielone

14/07/08 22:48:05 INFO cluster.SparkDeploySchedulerBackend: Registered executor: 
Actor[akka.tcp://[email protected]:54110/user/ 
Executor#-862786598] with ID 0 

a następnie odciął niemal natychmiast , zanim będę mógł uruchomić cokolwiek:

14/07/08 22:48:05 INFO cluster.SparkDeploySchedulerBackend: Executor 0 disconnected, 
so removing it 
14/07/08 22:48:05 ERROR scheduler.TaskSchedulerImpl: Lost an executor 0 (already 
removed): remote Akka client disassociated 

Czy masz pojęcie, co może być nie tak? Próbowałem dostosować opcje JVM spark.akka.frameSize i spark.akka.timeout, ale jestem prawie pewien, że to nie jest problem, ponieważ (1) nic nie zaczynam od początku i (2) mój Executory odłączają się kilka sekund po starcie, co mieści się w domyślnym limicie czasu wynoszącym 100s.

Dzięki!

Jack

+1

Gdzie uruchamiasz powłokę? Spróbuj uruchomić go na węźle głównym w AWS, aby się upewnić, że nie jest to problem z konfiguracją sieci. Spróbuj także 'bin/spark-shell', aby wyeliminować Pythona jako przyczynę. –

+0

Już robię pierwszy, a powłoka Scala zwraca ten sam błąd. – Jack

+0

Czy jest jakiś ślad w dziennikach pracownika lub executora? Lub na 'http: // : 4040/executors /? (Tak, w zasadzie nie mam pojęcia, przepraszam!) –

Odpowiedz

1

miałem bardzo podobny problem, jeśli nie takie same. Zaczęło działać dla mnie, gdy pracownicy łączyli się z mistrzem, używając tego samego nazwiska, co mistrz, który myślał.

Moje wiadomości dziennika było coś jak:

ERROR remote.EndpointWriter: AssociationError [akka.tcp://[email protected]:7078] -> [akka.tcp://[email protected]:7077]: Error [Association failed with [akka.tcp://[email protected]:7077]]. ERROR remote.EndpointWriter: AssociationError [akka.tcp://[email protected]:7078] -> [akka.tcp://[email protected]:7077]: Error [Association failed with [akka.tcp://[email protected]:7077]]

WARN util.Utils: Your hostname, idc1-hrm1 resolves to a loopback address: 127.0.0.1; using 192.168.121.187 instead (on interface eth0)

Więc sprawdź dziennik kapitana i zobaczyć, co to myśli, że nazwa ma. Następnie użyj tego samego imienia na robotnikach.