Jestem od klastra zapłonowej AWS, z jednego podstawowego i 60 rdzeni:Spark: konfiguracja sterownika/pracownika. Czy sterownik działa na węźle głównym?
Oto polecenie uruchomienia, zasadniczo 2 wykonawcy na rdzeń, całkowicie 120 wykonawcy:
spark-submit --deploy-mode cluster --master yarn-cluster --driver-memory 180g --driver-cores 26 --executor-memory 90g --executor-cores 13 --num-executors 120
jednak w trackerze pracy, jest tylko 119 wykonawców:
Myślałem, że powinienem mieć 1 sterownik + 120 wykonawców robotów. Jednak zobaczyłem 119 wykonawców, w tym 1 kierowca + 118 wykonawców robót.
Czy to oznacza, że mój węzeł nadrzędny nie był używany? Czy sterownik działa w węźle głównym lub węźle głównym? Czy mogę sprawić, by sterownik działał na węźle nadrzędnym i pozwalał na 60 rdzeni zawierających 120 działających executorów?
Dzięki!
Czy to oznacza, że główny węzeł nie jest częścią klastra? Więc co robi węzeł nadrzędny? – Edamame
Master w iskrowym trybie (menedżer zasobów w YARN) jest używany tylko do delegowania zadań do pracowników i śledzenia stanu klastra itp. Można wdrożyć pracownika w tym samym polu, co wzorzec, ale jeśli węzeł główny jest tylko usługa, nie będzie tam uruchomionych executorów. Pod postem Ravindry znajduje się dokładny diagram architektury. –
Jeśli węzeł, na którym działa aplikacja sterownika iskrzenia, zostanie uruchomiony lub zrestartowany, czy aplikacja sterownika iskry zostanie uruchomiona automatycznie w innym węźle roboczym w klastrze w trybie klastra przędzy? – girip11