Zmniejszyłem współczynnik replikacji z 3 na 1, ale nie widzę żadnej aktywności z nazwy identyfikacyjnej lub między datanodami, aby usunąć nadmiernie zreplikowane bloki plików HDFS. Czy istnieje sposób monitorowania lub wymuszania zadania replikacji?Zredukowany współczynnik replikacji HDFS
Odpowiedz
Zmiana dfs.replication
będzie dotyczyć tylko nowych plików, które utworzysz, ale nie zmodyfikuje współczynnika replikacji dla już istniejących plików.
Aby zmienić współczynnik replikacji plików, które już istnieją, można uruchomić następujące polecenie, które ma zostać uruchomiony rekursywnie na wszystkich plikach w HDFS:
hadoop dfs -setrep -w 1 -R/
Może można napisać funkcję mapy, aby usunąć bloki plików!
Po zmianie domyślnego czynnika replikacji od 3 do powiedzmy 2 od menedżera cloudera
Cloudera Manager(CDH 5.0.2) -> HDFS -> Configuration -> View and Edit -> Service-Wide -> Replication -> Replication Factor (dfs.replication) -> 2
wtedy tylko nowe zapisane dane będą miały 2 repliki dla każdego bloku.
Proszę używać
hdfs dfs -setrep 2/
na linii poleceń (zazwyczaj z HDFS węzła bramy Role), jeśli chcesz zmienić współczynnik replikacji wszystkich istniejących danych. To polecenie rekursywnie zmienia współczynnik replikacji wszystkich plików w katalogu głównym /.
Składnia:
hdfs dfs -setrep [-R] [-w] <numReplicas> <path>
where
-w flag requests that the command wait for the replication to complete and can take a very long time
-R flag is just for backwards compatibility and has no effect
referencyjny:
Nowy czynnik replikacji wpływa tylko nowe pliki. Aby zmienić współczynnik replikacji na istniejące pliki uruchomić w skorupkach (na węźle z punktu wejścia Hadoop)
hadoop fs -setrep -w <replication factor> -R/
Ale tylko „HDFS” może zapisywać/(„HDFS” jest superużytkownikiem, a nie „root”). Być może będziesz musiał to uruchomić:
sudo -u hdfs hadoop fs -setrep -w <replication factor> -R/
- 1. Jak uzyskać współczynnik replikacji klastra C *?
- 2. Cassandra: większy współczynnik replikacji = szybsze odczyty?
- 3. Błąd podczas tworzenia tematów Kafki - Współczynnik replikacji większy niż dostępne brokery
- 4. Problem replikacji Cassandra Data
- 5. obsługuje uwierzytelnianie replikacji clojure?
- 6. Dekodowanie protokołu replikacji AirPlay
- 7. Jak obliczyć współczynnik klikalności
- 8. Wykryj współczynnik kompresji JPG?
- 9. Optymalny współczynnik pracy bcryptu
- 10. Szachy: wysoki współczynnik rozgałęzienia
- 11. Wdrażanie kontrolera replikacji w Kubernetes
- 12. Artykuły o schematach replikacji/algorytmach?
- 13. Obserwator plików HDFS
- 14. Odmowa uprawnień na hdfs
- 15. CloudStore vs. HDFS
- 16. Przechodzenie przez katalogi hdfs
- 17. ścieżka pliku w hdfs
- 18. ggplot2 transformacji przez stały współczynnik
- 19. Podzbiór współczynnik przez poziomy NA
- 20. C#: Jak obliczyć współczynnik proporcji
- 21. Jednostki rzutni, zachowując współczynnik kształtu?
- 22. Współczynnik zachowania uniwersalnego nośnika obrazu
- 23. Współczynnik korelacji Seaborn na PairGrid
- 24. Jak uzyskać współczynnik skali urządzenia?
- 25. Współczynnik inbredu/algorytm wrights/genetyka
- 26. Internet Explorer - Współczynnik proporcji Flexbox
- 27. Pobieranie plików ze zdalnego HDFS
- 28. Jak działa HDFS z dołączaniem?
- 29. Różnica między HDFS i NFS?
- 30. Zmień nazwę katalogu w hdfs
Czy nie powinien to być 'hadoop fs -setrep -w 1 -R /'? – zeekvfu
Idealnie powinno być 'hadoop fs'. Ale chociaż 'hadoop dfs' jest przestarzałe to nadal działa. – daemon12
@zeekvfu, w efekcie, z ostatnią wersją apache hdfs musi to być: hdfs dfs -setrep -w 2 -R / –