Wiem, że liczba programów odwzorowujących można ustawić na podstawie rozmiaru podzielonego pliku dfs, ustawiając mapred.min.split.size na dfs.block.size.Jak ustawić liczbę reduktorów w sposób dynamiczny w zależności od mojego rozmiaru wyjściowego mapera?
Podobieństwo w jaki sposób ustawić I liczbę reduktorów na podstawie mojego rozmiaru wyjściowego mapera?
PS: Wiem, że poniższe opcje mogą być używane do manipulowania liczbą reduktora. mapred.tasktracker.reduce.tasks.maximum mapred.reduce.tasks
@Merla: Dzięki za odpowiedź. Ale nadal sugestie nie dają opcji, aby zmienić je dynamicznie podczas pracy w przypadku różnicy w objętości podczas przetwarzania danych. – Makubex
Nie sądzę, że możesz dynamicznie zmieniać liczbę reduktorów po rozpoczęciu zadania zmniejszania mapy. O ile mi wiadomo, nie byłoby żadnych ludzkich interakcji dostarczania wartości podczas wykonywania zadania. Powinno to być wstępnie skonfigurowane. Mapa Zredukuj zlecenie to proces wsadowy (działa długo), więc trudno jest zorientować się, kiedy użytkownik poprosi o liczbę reduktorów i nie jest zaprojektowany, aby był interaktywny podczas tego procesu! Mam nadzieję, że masz odpowiedź !! –