Określanie pól indeksowanych w ElasticSearch

Mam dokument z wieloma polami, na które nigdy nie wysyłam kwerend, więc chciałbym wyłączyć indeksowanie tych pól, aby oszczędzać zasoby. Uważam, że muszę disable the _all field, ale w jaki sposób określić, które pola są następnie indeksowane?Określanie pól indeksowanych w ElasticSearch

Źródło

2012-11-29 Michael

Domyślnie wszystkie pola są również indeksowane w polu specjalnym _all, co zapewnia dostęp do tzw. Funkcji catchall po wyjęciu z pudełka. Jednakże, można określić dla każdego pola w mapowaniu, czy chcesz, aby dodać go do pola _all lub nie, za pomocą opcji include_in_all:

"person" : { 
    "properties" : { 
     "name" : { 
      "type" : "string", "store" : "yes", "include_in_all" : false 
     } 
    } 
}

Powyższy przykład wyłącza domyślne zachowanie na polu nazwy, która wygrała nie będzie częścią pola _all.

W przeciwnym razie, jeśli nie trzeba boiska _all w ogóle dla określonego typu można ją wyłączyć, tak, znowu w swoim mapowania:

"person" : { 
    "_all" : {"enabled" : false}, 
    "properties" : { 
     "name" : { 
      "type" : "string", "store" : "yes" 
     } 
    } 
}

Kiedy go wyłączyć wasze pola nadal będą indeksowane osobno, ale nie będziesz miał funkcji catchall, którą _all zapewnia. Będziesz wtedy potrzebował zapytać o swoje konkretne pola zamiast polegać na _all specjalnym polu, to wszystko. W rzeczywistości, gdy kwerendy i nie określają pola, elasticsearch kwerendy pola _all pod maską, chyba że przesłonić domyślne pole do kwerendy.

Źródło

2012-11-29 13:47:46 javanna

Dzięki za to! Mogę po prostu wyłączyć '_all', ponieważ nie używam tej funkcji i mam nadzieję, że powinno to zmniejszyć rozmiar indeksu. A jeśli dobrze rozumiem, jedyną opcją zmniejszania rozmiaru indeksu, jaki mam, jest określenie "not_analyzed" na polach, których nie szukam? – Michael

Cóż, to nie jest tylko zmiana rozmiaru indeksu ... zmienia sposób indeksowania danych.Jeśli nie przeanalizujesz pola, będzie ono zawierać pojedynczy token. Nie będą używane żadne tokenizery ani filtry tokenów. Jeśli zawiera zdanie (z białymi znakami itp.), Aby je dopasować, należy zapytać o całe dokładne zdanie. Jeśli nigdy nie wyszukujesz pola, które ustawiłeś, indexed = false. – javanna

Tak to właśnie myślałem. Dziękuję za wyjaśnienie. Mam pewne pola w moich dokumentach, takie jak "opis" lub "linki", których nigdy nie potrzebuję szukać, więc marnowanie zasobów na ich analizę. I testuję obecnie uruchamianie całego indeksu w pamięci ('{" index ": {" store.type ":" memory "}}'), więc rozmiar indeksu stanie się ważnym czynnikiem. – Michael

Każde pole ciągu ma parametr index w konfiguracji odwzorowania, który to jest defaults toanalyzed. Oznacza to, że oprócz pola _all każde pole jest indeksowane wyłącznie.

A dla _all field jest powiedziane, że w odniesieniu:

Domyślnie jest ona włączona i wszystkie pola są zawarte w nim na łatwość obsługi.

Więc do indeksowania całkowicie wyłączyć na polu trzeba podać (jeśli pole _all jest włączona):

"mappings": { 
     "your_mapping": { 
      "properties": { 
       "field_not_to_index": { 
        "type": "string", 
        "include_in_all": false, 
        "index": "no" 
       } 
      } 
     } 
    }

Dla pól, które powinny być sprawdzony, czy włączyć je w polu _all (z "index": "no", aby zapisać zasoby), jeśli wyszukujesz za pomocą pola _all, lub jeśli pytasz na tych polach, używaj wyłącznie parametru o wartości dodatniej (analyzed lub) i wyłącz pole _all, aby zachować zasoby.

Źródło

2014-09-19 14:51:06

obserwuję jest ważnym strona doc zrozumieć ustawienia indeksu w elastycznej poszukiwaniu http://www.elasticsearch.org/guide/en/elasticsearch/guide/current/mapping-intro.html

Twojego problemu, najlepiej należy ustawić flagę „Index”, aby nie we właściwościach terenowych.

Źródło

2015-02-16 18:00:30

W tym łączu przykład pokazuje "index": "not_analyzed". Ale myślałem, że indeksowanie i analiza są różnymi koncepcjami w ES? Czy "nie" jest innym ustawieniem niż "not_analyzed"? Proszę o wyjaśnienie. – szeitlin

'analizowane' Najpierw przeanalizuj ciąg, a następnie zindentuj go. Innymi słowy, indeksuj to pole jako pełny tekst. 'not_analyzed' Indeksuj to pole, aby można je było wyszukać, ale indeksuj wartość dokładnie tak, jak określono. Nie analizuj tego. 'no' Nie indeksuj tego pola w ogóle. Tego pola nie można wyszukać. – Tjorriemorrie

Ustaw indeks dynamiczny i _all na wartość fałsz. Określ wymagane pola w odwzorowaniu. https://www.elastic.co/guide/en/elasticsearch/guide/current/dynamic-mapping.html

{ 
    "mappings":{ 
     "candidates":{ 
     "_all":{ 
      "enabled":false 
     }, 
      "dynamic": "false", 
     "properties":{ 
      "tags":{ 
       "type":"text" 
      }, 
      "derivedAttributes":{ 
       "properties":{ 
       "city":{ 
        "type":"text" 
        }, 
        "zip5":{ 
        "type":"keyword" 
        } 
       } 
      } 
     } 
     } 
    } 
}

Źródło

2017-06-08 09:44:15 subbu

Określanie pól indeksowanych w ElasticSearch

Odpowiedz

Powiązane problemy