Apache Spark na EC2 "Zabity"

Mój program, który wielokrotnie kręciłem na różnych klastrach nagle się zatrzymuje. Dziennik:Apache Spark na EC2 "Zabity"

15/04/20 19:19:59 INFO scheduler.TaskSetManager: Finished task 12.0 in stage 15.0 (TID 374) in 61 ms on ip-XXX.compute.internal (16/24) 
15/04/20 19:19:59 INFO storage.BlockManagerInfo: Added rdd_44_14 in memory on ip-XXX.compute.internal:37999 (size: 16.0 B, free: 260.6 MB) 
Killed

Co oznacza słowo "Killed" i dlaczego ono występuje? Nie ma innych błędów.

Źródło

2015-04-20 monster

"Zabity" zwykle oznacza, że system operacyjny zakończył proces, wysyłając sygnał SIGKILL. Jest to sygnał niemożliwy do zablokowania, który natychmiast kończy proces. Jest często wykorzystywany jako zabójca procesu OOM (poza pamięcią) - jeśli system operacyjny zdecyduje, że zasoby pamięci są niebezpiecznie niskie, może wybrać proces do zabicia, aby spróbować zwolnić trochę pamięci.

Bez dodatkowych informacji nie można stwierdzić, czy proces został zabity z powodu problemów z pamięcią, czy z innego powodu. Rodzaj informacji, które możesz podać, aby pomóc zdiagnozować, co się dzieje, to: jak długo trwa proces, zanim został zabity? czy możesz włączyć i dostarczyć bardziej szczegółowe wyniki debugowania z procesu? Czy zakończenie procesu jest powiązane z jakimkolwiek określonym wzorcem komunikacji lub przetwarzania?

Źródło

2015-04-20 19:38:38

Proces ten był uruchamiany wiele razy przez wiele godzin. Teraz jednak zatrzymuje się po około 20 sekundach. Mówi, że jest około 255 MB wolnej pamięci na węzeł. Jeśli uruchomię nowy klaster, znów będzie działać poprawnie. – monster

ustawienie Spróbuj yarn.nodemanager.vmem sprawdzić obsługą false Twojego programu Spark config, coś takiego:

val conf = new SparkConf().setAppName("YourProgramName").set("yarn.nodemanager.vmem-check-enabled","false") 
val sc = new SparkContext(conf)

http://apache-spark-user-list.1001560.n3.nabble.com/How-to-avoid-being-killed-by-YARN-node-manager-td22199.html

Źródło

2015-09-03 21:21:33 user1045085

może problem VM

zapewnić masz partycję swap.
zapewnić, że vm.swappiness nie jest zero.

Źródło

2016-07-21 03:32:50

Apache Spark na EC2 "Zabity"

Odpowiedz

Powiązane problemy