W licznikach zleceń hadoop, jaka jest różnica między "zmaterializowanymi bajtami wyjściowymi mapy" a "bajtami wyjściowymi map"? Nie widzę tego pierwszego, gdy wyłączam kompresję wyjściową mapy, więc domyślam się, że jest to rzeczywisty bajt wyjściowy (skompresowany), podczas gdy drugi jest nieskompresowanym bajtem?"Mapowanie danych wyjściowych zmaterializowanych bajtów" w porównaniu do "bajtów wyjściowych map"
Odpowiedz
Myślę, że masz rację. Od http://hadoop.apache.org/docs/r1.0.4/releasenotes.html:
MAPREDUCE-2365. Nowe liczniki dla FileInputFormat (BYTES_READ) i FileOutputFormat (BYTES_WRITTEN). Nowy licznik MAP_OUTPUT_MATERIALIZED_BYTES dla skompresowanego MapOutputSize. (Siddharth Seth)
(Zmiany Ponieważ Hadoop 0.20.2)
.............................. .................................................. .................................................. .................
Oto cytat z Tom White'a "Hadoop Definitive Guide", wydanie 3 (tabela 8-2, strona 261):
"Map output materialized bytes" - Liczba bajtów danych map faktycznie zapisanych na dysku. Jeśli włączona jest kompresja mapy, jest to odzwierciedlone w wartości licznika.
"Mapuj bajty wyjściowe" - liczba bajtów nieskompresowanych danych wyjściowych generowanych przez wszystkie mapy w zadaniu. Inkrementowane za każdym razem, gdy metoda collect()
jest wywoływana na mapie OutputCollector
.
- 1. Zapisywanie danych wyjściowych vimdiff?
- 2. wyrównywanie danych wyjściowych
- 3. Zmiana danych wyjściowych Getdate
- 4. Brak danych wyjściowych w konsoli
- 5. Przechwytywanie danych wyjściowych w Groovy
- 6. Dołączanie do danych wyjściowych procesów do wyświetlenia
- 7. Wyjaśnienie wyjściowych danych wyjściowych po pomnożeniu 2 stałych wartości stałych
- 8. Zrozumienie danych wyjściowych -XX: + PrintCompilation
- 9. Przypisywanie danych wyjściowych polecenia do zmiennej powłoki
- 10. Kopiowanie danych wyjściowych zmiennej JavaScript do schowka
- 11. Ignorowanie danych wyjściowych z podprocesu.Popen
- 12. Brak danych wyjściowych z DebugView
- 13. Do bajtów []
- 14. Przekierowywanie danych wyjściowych polecenia w docker
- 15. Warunkowe buforowanie danych wyjściowych w środowisku ASP.NET
- 16. Uzyskiwanie danych wyjściowych procesu w środowisku wykonawczym
- 17. Woocommerce: pomoc w wymianie danych wyjściowych html
- 18. Zapisywanie danych wyjściowych konsoli w przeglądarce Chrome
- 19. Aktywuj zapisywanie danych wyjściowych w studio xamarin
- 20. IntelliJ 14.1 zapisywanie danych wyjściowych w xml
- 21. Zaokrąglanie danych wyjściowych z funkcji w R
- 22. ftp wysyłając strumień bajtów bajtów
- 23. Uzyskiwanie danych wyjściowych za pomocą IPython Notebook
- 24. pytest + xdist bez przechwytywania danych wyjściowych?
- 25. Zbieranie danych wyjściowych IO na listę
- 26. Nie można zakodować/odkodować danych wyjściowych pprint
- 27. Przechwytywanie danych wyjściowych podprocesu.Popen() z nosem
- 28. Dlaczego fork() powoduje duplikowanie danych wyjściowych?
- 29. Podział ramek danych na wiele plików wyjściowych
- 30. Interpretowanie danych wyjściowych --ptxas-options = -v
Wygląda na to, że na stronie szczegółów zadania nie widzę "Map output materialized bytes". Używam Hadoop 2.0.0-mr1-cdh4.2.1. Czy muszę dokonać pewnych zmian ustawień. –