2012-06-21 7 views
6

Próbuję wykonać "clusterdump" na wyjściu z przykładu klastrowania przykład (przykład control_control). Ale ja doznaję następujący błąd:czy jest jakaś opcja seqFileDir dla "clusterdump" w najnowszej bibliotece "apache mahout"?

> ~/MAHOUT/trunk/bin/mahout clusterdump --seqFileDir clusters-10-final --pointsDir clusteredPoints --output a1.txt 

MAHOUT_LOCAL is not set; adding HADOOP_CONF_DIR to classpath. 
Running on hadoop, using /usr/lib/hadoop/bin/hadoop and HADOOP_CONF_DIR=/usr/lib/hadoop/conf/ 
MAHOUT-JOB: /home/<username>/MAHOUT/trunk/examples/target/mahout-examples-0.8-SNAPSHOT-job.jar 

12/06/21 22:43:18 WARN conf.Configuration: DEPRECATED: hadoop-site.xml found in the classpath. Usage of hadoop-site.xml is deprecated. Instead use core-site.xml, mapred-site.xml and hdfs-site.xml to override properties of core-default.xml, mapred-default.xml and hdfs-default.xml respectively 

12/06/21 22:43:25 ERROR common.AbstractJob: Unexpected --seqFileDir while processing Job-Specific Options: 
usage: <command> [Generic Options] [Job-Specific Options] 
..... 

Więc myślę, że nie ma opcji „seqFileDir” dla clusterdump ale wszystkie samouczki online (np https://cwiki.apache.org/MAHOUT/cluster-dumper.html) odnoszą tę opcję. Czy możesz zaproponować mi środek zaradczy lub to, czego mi brakuje?

Odpowiedz

2

Czy próbowałeś podać ją jako opcję --input?

+1

tak, zrobiłem. Kiedy zastąpiłem --seqFileDir przez --input, plik wyjściowy został wygenerowany , ale to było PUSTE! Czy wiesz, dlaczego samouczki mówią o opcji --seqFileDir? –

+2

Pracowałem nad tym problemem. W magiczny sposób znalazłem rozwiązanie !!! Dzięki za Twoją sugestię - włączyliśmy opcję --seqFileDir. To, co robiłem źle, to, że nie zdawałem sobie sprawy, że clusterdump (z zestawem HADOOP_HOME) czyta z HDFS i zapisuje wyjście do lokalnego systemu plików. W każdym razie wszystko działa dobrze! –

Powiązane problemy