Aby skonfigurować prosty projekt Hadoop Obserwuję ten tutorial: http://ebiquity.umbc.edu/Tutorials/Hadoop/23%20-%20create%20the%20project.htmlPierwszy błąd projekt Hadoop: „ścieżka wejścia nie istnieje”
Moja Hadoop pojedynczy węzeł wydaje się być poprawnie uruchomiony.
Kiedy określić folder In
przy użyciu tego kodu:
FileInputFormat.setInputPaths(conf, new Path("In"));
otrzymuję ten błąd:
13/03/03 22:05:27 ERROR security.UserGroupInformation: PriviledgedActionException as:DEVUSER cause:org.apache.hadoop.mapred.InvalidInputException: Input path does not exist: hdfs://localhost:9100/user/DEVUSER/In
Obecnie folder In
jest tworzony na C:\homedir\hadoop-1.0.4\In
Gdzie muszę utwórz folder "In", aby pojawił się w hdfs://localhost:9100/user/DEVUSER/In
? Czy muszę zaktualizować plik xml, aby wskazywał na folder w moim lokalnym systemie plików?
droga gdzie te pliki są fizycznie przechowywane w systemie plików? więc mogę usunąć katalog wyjściowy? –
Masz na myśli pliki przechowywane w HDFS? HDFS to rozproszony system plików. Pliki są więc przechowywane na wielu hostach. Nie można uzyskać bezpośredniego dostępu do plików fizycznych ani ich modyfikować. Musisz użyć poleceń HDFS, aby je usunąć. Zadaj pytanie jako nowe pytanie i podaj wystarczająco dużo szczegółów. – harpun
Mam odpowiedź od twoich informacji, że musimy zmodyfikować katalog HDFS za pomocą poleceń, dzięki za informacje –