2014-07-22 8 views
9

mam skupisko 4 datanodes i HDFS struktury na każdym węźle jest poniżejco to jest katalog/tmp w hadoopach hdfs?

enter image description here

Jestem stoi miejsca na dysku problem, jak widać /tmp folder z HDFS zajmuje więcej miejsca (217 GB). Próbowałem więc sprawdzić dane z folderu /tmp. Znalazłem następujące pliki tymczasowe. Udostępniłem te foldery tymczasowe, z których każda zawiera pliki części o rozmiarze od 10 gb do 20 gb. Chcę wyczyścić ten katalog/tmp. Czy ktoś może dać mi znać konsekwencje usunięcia tych folderów lub plików części. Czy wpłynie to na moją gromadę?

enter image description here

Odpowiedz

14

HDFS katalog/tmp stosowany głównie jako tymczasowego magazynowania w czasie pracy MapReduce. Artefakty mapreduce, dane pośrednie itp. Będą przechowywane w tym katalogu. Pliki te zostaną automatycznie usunięte po ukończeniu operacji mapowania. Jeśli usuniesz te pliki tymczasowe, może to wpłynąć na aktualnie uruchomione zadania mapreduce.

Pliki tymczasowe są tworzone przez świni. Tymczasowe usuwanie plików dzieje się na końcu. Pig nie obsługuje usuwania plików tymczasowych, jeśli wykonanie skryptu zakończyło się niepowodzeniem lub zostało zabite. Wtedy musisz poradzić sobie z tą sytuacją. Lepiej zajmij się działaniem związanym z czyszczeniem plików tymczasowych w samym skrypcie.

następujący artykuł daje dobre zrozumienie

http://www.lopakalogic.com/articles/hadoop-articles/pig-keeps-temp-files/

+0

Cześć, te pliki w katalogu/tmp nie trafiają automatycznie usunięte. możesz udostępnić nazwy plików, w których możemy ustawić opcję automatycznego usuwania plików. A jeśli te pliki są operacji mapreduce, to dlaczego rozmiar/tmp wynosi 217 Gb. –

+0

Czy możesz opublikować dane wyjściowe następującego polecenia? hadoop fs -lsr/tmp/temp-2050991966/tmp-184805992 – sachin

+0

'1) 2014-07-21 11:09/tmp/temp-2050991966/tmp-184805992/_SUCCESS 2) 2014-07-21 11: 07/tmp/temp-2050991966/tmp-184805992/_logs 3) 2014-07-21 11:09/tmp/temp-2050991966/tmp-184805992/_logs/historia 4) 2014-07-21 11: 09 /tmp/temp-2050991966/tmp-184805992/_logs/history/job_201405161515_15124_1405921062606_ocuser_PigLatin%3AOC_Generate_Connect_Strength.pig 5) 278029 2014-07-21 11:07/tmp/temp-2050991966/tmp-184805992/_logs/historia/job_201405161515_15124_conf .xml 6) 2014-07-21 11:08/tmp/temp-2050991966/tmp-184805992/część-m-00000 7) 2014-07 -21 11:08/tmp/temp-2050991966/tmp-184805992/part-m-00001' –