2013-08-27 9 views

Odpowiedz

11

MRv1 wykorzystuje JobTracker do tworzenia i przydzielania zadań węzłom danych, które mogą stać się wąskim gardłem zasobów, gdy klaster skaluje się wystarczająco daleko (zwykle około 4000 węzłów).

MRv2 (alias YARN, "Jeszcze inny Negocjator zasobów") ma Menedżera zasobów dla każdego klastra, a każdy węzeł danych uruchamia menedżera węzłów. Dla każdego zadania, jeden węzeł podrzędny będzie działać jako Master stosowania, monitorowania zasobów/zadania, itp

+1

Cloudera ma wideo, które zapewnia wizualne wyjaśnienie, aby wesprzeć to tutaj. (Http://university.cloudera.com/certification/prep/ccdh.html) ... '(16:06 do filmu wideo do 22 : 15) ' –

+0

Link jest uszkodzony – vumaasha

3

MRv1 który nazywany jest również jako Hadoop 1 gdzie HDFS (zarządzanie zasobami i planowania) i MapReduce (programowanie Framework) są ściśle powiązane. Z tego powodu aplikacje niebędące wsadowymi nie mogą być uruchamiane na module 1.Moil. Ma on jedno naimode, więc nie zapewnia wysokiej dostępności systemu i skalowalności.

MRv2 (aka Hadoop 2) w tej wersji Hadoop zarządzanie zasobami i planowania zadań są oddzielone od MapReduce, która jest oddzielona od przędzy (Yet Another Zasobami Negocjator). Warstwa zarządzania zasobami i harmonogramu znajduje się pod warstwą MapReduce. Zapewnia również wysoką dostępność systemu i skalowalność, ponieważ możemy tworzyć redundantne NameNodes. Nowa funkcja migawki, dzięki której możemy wykonać kopię zapasową systemów plików, która pomaga w odzyskiwaniu danych po awarii.

Powiązane problemy