muszę uzyskać dostęp do indeksu Lucene (utworzony przez indeksowania kilka stron internetowych za pomocą siatkowe), ale daje pokazany błąd powyżej:żadne segmenty plik * znaleziono
java.io.FileNotFoundException: no segments* file found in [email protected]/home/<path>: files:
at org.apache.lucene.index.SegmentInfos$FindSegmentsFile.run(SegmentInfos.java:516)
at org.apache.lucene.index.IndexReader.open(IndexReader.java:185)
at org.apache.lucene.index.IndexReader.open(IndexReader.java:148)
at DictionaryGenerator.generateDict(DictionaryGenerator.java:24)
at DictionaryGenerator.main(DictionaryGenerator.java:56)
google ale z powodów podanych nie pasujący do wymagania. Fakt, że pliki są wyświetlane (ścieżka) prawdopodobnie oznacza, że katalog nie jest pusty.
Dzięki
Zrobiłem wszystkie z nich oprócz wersji Nutch i Lucene. Nie wiedziałem, że musi istnieć kompatybilność między Lucene i Nutch. Jeśli to pomaga, wersja luceńska ma 2.2. Mogę uzyskać dostęp do plików. W rzeczywistości, uruchamiam program java w tym samym katalogu co indeks. Ponadto sprawdziłem indeks używając Luke'a i jego zdecydowanie w porządku. Poza tym po prostu stałem się częścią projektu. Indeks jest wynikiem obszernego indeksowania przez Nutch. Więc nie mam żadnego kodu indeksującego. To było tylko czołganie się. Ale nadal będę próbował znaleźć dokładny obraz. – crazyaboutliv
Jedną z rzeczy, którą zauważyłem jest to, że nowsza wersja Nutch (1.1) generuje 5 folderów po przeszukiwaniu, podczas gdy dane, które mam, mają tylko 4 (z których segmentów jest jeden) foldery. Czy to może być problem? – crazyaboutliv
Tak jak powiedział Yuval, upewnij się, że program Java, którego używasz do odczytu indeksu, używa tej samej wersji Lucene, którą Nutch użył do utworzenia indeksu. –