2013-06-11 21 views
31

Walczę ze zrozumieniem różnic między kolekcjami i rdzeniami. Jeśli rozumiem to poprawnie, rdzenie są wieloma indeksami. Zbiór składa się z rdzeni, więc zasadniczo mają one tę samą logikę w oddzieleniu, tj. Oddzielne rdzenie i kolekcje mają oddzielne punkty końcowe.Kolekcja Solr a rdzenie

Mam następujący scenariusz. Tworzę backend dla usługi chmurowej dla kilku sklepów internetowych. Każdy sklep ma zestaw produktów, do których klienci mogą dodawać recenzje. Chcę indeksować dane statyczne (informacje o produkcie) oddzielnie od informacji dynamicznych (opinii), aby poprawić wydajność.

Jak najlepiej rozdzielić w Solr ???

Odpowiedz

41

Z Kolekcji SolrCloud Documentation

: pojedynczy indeks wyszukiwania.

Fragment: Część logiczna pojedynczego zbioru (nazywana również krojem ). Czasami ludzie będą mówić o „Shard” w sensie fizycznym (przejaw logicznego odłamek)

replik: fizyczną manifestacją logicznego Shard, realizowany jako pojedynczy indeks Lucene na SolrCore

Leader : Jedna replika każdego odłamka zostanie oznaczona jako lider dla indeksowania współrzędnych dla tego odłamka

SolrCore: tworzy enkapsulację pojedynczego indeksu fizycznego. Jeden lub więcej składa się z logicznych odłamków (lub plasterków), które składają się na kolekcję.

Węzeł: Pojedyncza instancja Solr. Jedna instancja Solr może mieć wiele SolrCores, które mogą być częścią dowolnej liczby kolekcji.

Klastra: Wszystkie węzły używane do hostowania SolrCores.

Zasadniczo kolekcja (grupa logiczna) ma wiele rdzeni (indeksy fizyczne).

także sprawdzić discussion

+1

Proszę dodać komentarz do głosowania jakiegokolwiek dół, pomaga poprawić odpowiedź !!!! – Jayendra

+0

Co to jest indeks wyszukiwania? – Sun

22

Rdzeń

W Solr, A core składa się z zestawu plików konfiguracyjnych plików indeksu Lucene i zaloguj transakcji SOLR za.

rdzeń Solr to jednoznacznie nazwany, zarządzany i skonfigurowany indeks działający na serwerze Solr; serwer Solr może hostować jeden lub więcej rdzeni. Rdzeń jest zazwyczaj stosowany do oddzielania dokumentów, które mają różnych schematów

zbiór

SOLR używa się pojęcia collection, który ma tylko znaczenie w kontekście klastra SOLR w którym jeden wskaźnik jest rozprowadzana na wielu serwerach.

SolrCloud wprowadza koncepcję collection, która rozszerza pojęcie wyjątkowo nazwie, zarządzany i konfigurowany indeksu na taki, który jest podzielony na kawałki i rozproszonej na wielu serwerach.

9

Jak na moje rozumienie:

w rozproszonych poszukiwaniu,

Collection jest indeks logicznego rozłożone na wielu serwerach. Rdzeń jest tą częścią serwera, na której działa jedna kolekcja.

w niewyspecjalizowanych rozprowadzane poszukiwaniu,

jednym serwerze działa Solr może mieć wiele zbiorów, a każdy z tych kolekcji jest również rdzeń. Więc kolekcja i rdzeń są takie same, jeśli wyszukiwanie nie jest rozprowadzane.

Podsumowanie

  1. Collection na serwer nazywa się rdzeń.
  2. Kolekcja jest taka sama jak indeks.
  3. Jeden serwer Solr może mieć wiele rdzeni.
  4. Kolekcja to indeks logiczny (przykład użycia dla wielu kolekcji: powiedzmy, że dwa zespoły w tej samej grupie nie są wystarczająco duże, aby uzasadnić własny serwer Solr, ale nie chcą też mieszać swoich danych w jednym indeksie. Następnie mogą utworzyć oddzielne kolekcje/indeksy, które będą przechowywać swoje dane osobno).
  5. jej lepiej użyć osobnego Solr Cloud, zamiast tworzyć kolekcje, jeśli dane dla kolekcji jest wystarczająco duży
5

Od Solr Wiki (nie wiem, komentarze proszę?):

kolekcje wykonane są jednego lub więcej odłamków. Odłamki mają jedną lub więcej replik. Każda replika jest rdzeniem. Pojedyncza kolekcja reprezentuje jeden indeks logiczny.

1

Single Instance

Na jednej instancji, Solr ma coś, co nazywa się SolrCore, który jest w zasadzie jeden wskaźnik. Jeśli chcesz mieć wiele indeksów, tworzymy wiele SolrCores.

SOLR Chmura

z SolrCloud pojedynczy indeks może obejmować wiele przypadków Solr. Oznacza to, że pojedynczy indeks może składać się z wielu SolrCore na różnych maszynach. Wszystkie te SolrCore, które tworzą jeden indeks logiczny, nazywamy kolekcją.

Kolekcja to zasadniczo pojedynczy indeks obejmujący wiele SolrCore, zarówno dla skalowania indeksu, jak i redundancji. Jeśli chcesz przenieść 2 ustawienia SolrCore Solr do SolrCloud, masz 2 kolekcje, z których każda składa się z wielu indywidualnych SolrCores.

1

To wyjaśnia użycie rdzeni i kolekcji.

Single Instance

Gdy mamy do czynienia z jednej instancji solr kwerendy do cores.

UI admin jednej instancji Solr ma selektor kolekcji:

Single Solr Instance

Solr Chmura

Gdy mamy do czynienia z Solr Cloud, kwerendy do collections. Kolekcje są zorganizowane w różnych rdzeniach (repliki, odłamki) w różnych instancjach Solr.

Interfejs administracyjny instancji Solr Cloud ma kolekcję i selektor rdzenia. Ale rdzenie są technicznie przypadkach tutaj:

Solr Cloud instance