To, co widziałem na interfejsie internetowym niedawnoCo dokładnie oznacza Non DFS Used?
Configured Capacity : 232.5 GB
DFS Used : 112.44 GB
Non DFS Used : 119.46 GB
DFS Remaining : 613.88 MB
DFS Used% : 48.36 %
DFS Remaining% : 0.26 %
i jestem tak zdezorientowany, że nie-DFS Używane zajmuje ponad połowę pojemności,
który myślę oznacza połowę przechowywania Hadoop jest jest marnowany
Po spędzeniu bezsensownych poszukiwań, po prostu sformatowałem NodeNode i zacząłem od zera.
A potem skopiowałem jeden ogromny plik tekstowy (około 19 gigabajtów) z lokalnego do HDFS (z powodzeniem).
Teraz UI mówi
Configured Capacity : 232.5 GB
DFS Used : 38.52 GB
Non DFS Used : 45.35 GB
DFS Remaining : 148.62 GB
DFS Used% : 16.57 %
DFS Remaining% : 63.92 %
przed kopiowaniem, DFS Samochody dla DFS Używane były zarówno 0.
Ponieważ DFS Używany jest w przybliżeniu dwukrotnie oryginalny rozmiar pliku tekstowego i skonfigurowane 2 kopie,
Domyślam się, że DFS Used składa się z 2 kopii oryginału i meta.
Ale nadal nie mam pojęcia, skąd pochodzi Non DFS Używane i dlaczego to zajmuje tyle capcity więcej niż DFS Used.
Co się stało? Czy popełniłem błąd?
Czy mogę opróżniać dane inne niż dfs? Jeśli tak, to w jaki sposób? – Mahesha999
@ Mahesha999: spróbuj ponownie uruchomić datanode. – kholis