Korzystając z klienta javascript Elasticsearch (node.js), jaki jest najlepszy (lub najprostszy) sposób na przechodzenie przez każdy dokument w indeksie (około 100 000 dokumentów)?Zapętlenie wszystkich dokumentów w indeksie elasticsearch
Odpowiedz
Myślę, że dobrym miejscem do rozpoczęcia jest z zapytaniami skanowania za pomocą interfejsu API przewijania:
http://www.elasticsearch.org/guide/en/elasticsearch/guide/current/scan-scroll.html
zasadzie jest podobny do kursora z bazą danych - po otwarciu zapytanie o terminie i zwróci identyfikator przewijania. Następnie użyj tego identyfikatora przewijania, aby pobrać pierwszą partię wyników, a następnie zwróci dokumenty wraz z nowym identyfikatorem przewijania. Poniższe przykłady:
curl -XGET 'localhost:9200/_search?search_type=scan&scroll=10m&size=1000' -d '
{
"query" : {
"match_all" : {}
}
}
'
ta zwróci _scroll_id które następnie użyć, aby odzyskać dokumenty:
curl -XGET 'localhost:9200/_search/scroll?scroll=10m' -d '<_SCROLL_ID_HERE>'
Zauważ, że ten powróci 1000 dokumentów na PRIMARY Shard - więc jeśli masz 4 podstawowych odłamki to będzie zwróć 4000 dokumentów. Każde wywołanie oprócz dokumentów zwróci nowy _croll_id, który następnie użyjesz do następnego połączenia. "Przewijanie = 10 m" ustawia limit czasu wynoszący 10 m, aby utrzymać przewijanie otwarte między połączeniami.
- 1. Lista wszystkich pól w indeksie elasticsearch?
- 2. Powielanie dokumentów w indeksie Elasticsearch z tym samym _uid
- 3. ElasticSearch: filtrowanie dokumentów na podstawie długości pola?
- 4. Odzyskiwanie wszystkich dokumentów ze wszystkich podfolderów w bibliotece dokumentów - CSOM
- 5. Agregacje filtrów Elasticsearch przy minimalnej liczbie dokumentów
- 6. Pobieranie analizowanych tokenów z dokumentów ElasticSearch
- 7. Odnajdywanie wszystkich dokumentów w kolekcji z Mongoidem
- 8. Elasticsearch - poprzednia/następna funkcjonalność
- 9. zapętlenie w dwóch kierunkach
- 10. Dostosowywanie algorytmu wyszukiwania w Elasticsearch
- 11. Wiosenne dane Elasticsearch Rodzicielskie/dziecięce repozytorium dokumentów/Błąd wykonania testu
- 12. Warunkowe sortowanie w ElasticSearch
- 13. Zapętlenie wartości wyliczeniowych w Swift
- 14. Zapętlenie przez NSMutableArray w Swift
- 15. null_value mapowanie w Elasticsearch
- 16. Elasticsearch, uzyskaj średnią długość dokumentu
- 17. zapętlenie wartości wyliczeniowych
- 18. Zapętlenie przez NSMutableDictionary
- 19. ważona losowe próbkowanie w Elasticsearch
- 20. Skalowanie ElasticSearch
- 21. wydajny algorytm zamiast zapętlenie
- 22. Elasticsearch niezwracające pojedynczych/mnogich dopasowań
- 23. ElasticSearch: Równoważny operator w ElasticSearch
- 24. Czy istnieje sposób na odzyskanie wszystkich rekordów w kwerendzie (ElasticSearch)?
- 25. Jak wykonać agregację potoków bez zwracania wszystkich segmentów w Elasticsearch
- 26. Elasticsearch _timestamp
- 27. Elasticsearch szyny/Elasticsearch Modelarski wyszukiwania stowarzyszenie
- 28. Elasticsearch usuń duplikaty
- 29. Zapętlenie przez XML z jQuery
- 30. Domyślny mechanizm oceniania ElasticSearch