używam moje dzienniki API wyodrębnić informacje, takie jak:Hbase vs Cassandra: Co jest lepsze dla przechowywania danych Timeseries?
- W tym okresie czasu, ile są użytkownicy mojego API?
- Czy w tym okresie, jakiego rodzaju usługi są nazywane najbardziej?
Prawie wszystkie informacje, które wyodrębniam, zależą od znacznika czasu. Właściwie używam MongoDB i dodałem znacznik czasu jako indeks (dla 80 GB, indeksy mają rozmiar 12 GB).
Polecono mi migrację do kassandra lub Hbase. I chcę wiedzieć, który jest lepszy dla mojego przypadku użycia:
- Analiza danych czasu.
- Wymagana jest dobra wydajność zapisu i odczytu.
- Możliwość korzystania z hadoop do mojej analizy danych.
Dziękujemy za podzielenie się z Państwem swoim punktem widzenia lub doświadczeniem.
W zależności od rodzaju środowiska, w którym pracujesz, uzyskanie DataStax Enterprise może być bezpłatne. – mildewey
Jest przeznaczony do komercyjnego wdrożenia, więc jest opłacany. Ale czy Datastax jest niezbędny, gdy używam Hadoop z Cassandrą? – Mouna
Używamy Apache Spark z Apache Cassandra (bez DataStax Enterprise). Chociaż musiałem napisać kilka początkowych skryptów do automatyzacji, sprawdzenie, jak działa, było dość proste. DSE zapewnia integrację z Hadoop/Solr/Spark/itd., Podczas gdy musisz sam wykreślić to, czego potrzebujesz dla wersji apache. Jeśli wszystko, czego szukasz, to analizy szeregów czasowych + zapytania, Spark + Cassandra wykona więcej niż zadanie, nie wymagając jednak skonfigurowania Hadoop. – ashic