2012-03-14 11 views
5

Używam Solr danych podobnych do imię: Wiek: Płeć: bilans: nextbalance: odsetkiSolr ładunki całego indeksu do pamięci

mam 30 m zapisy na łączną kwotę do 4G na dysku. Odbieram według wieku: 23, czyli tylko 50 rekordów. Mam indeks = "true" w schemacie xml. Solr wydaje się załadować cały indeks na dysk do pamięci (4G). Czy nie ma w pamięci tylko 40 nieparzystych rekordów?

+0

Używam OutOfMemory gdy próbuje szukać z wiekiem: 23. Ładuje cały indeks do pamięci. – Hari

Odpowiedz

4

Myślę, że to zależy od tego, jak skonfigurować pamięć podręczną (co robi i nie ma w pamięci). Ładowanie całego indeksu do pamięci może przynieść ogromne zwiększenie wydajności pod względem czasu potrzebnego na pobranie wyników, niezależnie od zapytania.

Szczegóły na temat konfiguracji pamięci podręcznej oraz szczegółowe dane na temat wydajności czynników:

3

Może to jest cache dokumentów. Musisz określić jego rozmiar. Czy możesz sprawdzić następujące rzeczy w pliku solrconfig.xml?

<!-- documentCache caches Lucene Document objects (the stored fields for each document). 
    --> 
<documentCache 
    class="solr.LRUCache" 
    size="16384" 
    initialSize="16384"/> 
1

Pola, które są przechowywane, ale nie są indeksowane, są zapisywane na dysku, ale nie w pamięci RAM. Jednak 100% rekordów jest rzeczywiście indeksowanych w pamięci RAM, a te indeksy zawierają wszystkie indeksowane pola. Ale odwrócone indeksy są na to dość wydajne.

Jednak podczas wykonywania zapytań, SOLR odzyskuje cały zestaw zapisanych (ale nie indeksowanych) zawartości pól w pamięci RAM dla pasujących rekordów. Zwykle uważa się, że jest to pożądane zachowanie związane z buforowaniem, ponieważ oznacza to, że wyniki wyszukiwania mogą zostać wcześniej przesłane, co zmniejsza ogólny czas realizacji zapytania. Jak zwykle w przypadku SOLR, można skonfigurować zachowanie buforowania na wiele sposobów, aby dopasować budżet RAM i potrzeby bazy danych. Zobacz możliwości w pliku solrconfig.xml.

Należy zauważyć, że jest to złożony obszar i prawdopodobnie trudno będzie w pełni zrozumieć buforowanie, jeśli Google jest głównym źródłem informacji. Jest to obszar, w którym lepiej się uczyć z jednej z książek o SOLR.

+0

Jaka byłaby dobra książka do nauki na temat dostrajania wydajności SOLR? –

+0

Każda książka jest lepsza niż żadna książka w ogóle. SOLR jest tak łatwy w konfiguracji, że wiele osób nie poświęca czasu na pewne badania i nauczy się, jak używać wszystkich dostępnych przycisków i pokręteł. Jeśli więc przeczytasz jakąś książkę i zastosujesz to, czego się nauczysz, będziesz daleko przed tłumem, który opiera się zbytnio na ustawieniach domyślnych i kilku przepisach z blogosfery. –

+0

Właściwie poszedłem za twoją radą, ZANIM. Właśnie skończyłem książkę kucharską SOLR, ale teraz szukam czegoś bardziej dydaktycznego (uwielbiam książki kucharskie, ale są one dobre na później). Moje doświadczenie pokazuje zalecenia od rówieśników, jest lepsze niż żadne. –

Powiązane problemy