2011-12-23 13 views
5

Potrzebuję przechowywać około 100 milionów rekordów w bazie danych. Około 60-70% z nich zostanie usuniętych codziennie i ta sama ilość rekordów jest wstawiana codziennie. Czuję, że baza danych dokumentów, jak Hbase, pasowałaby do tego Big Table. Istnieje wiele innych magazynów danych, takich jak Cassandra, MongoDb itp. Który magazyn danych byłby przydatny w tego rodzaju problemach, ponieważ będzie ogromna ilość odczytów/zapisów (rzędu 10 milionów) dziennie.Najlepszy magazyn danych dla ogromnych danych z dużą liczbą odczytów i zapisów

+0

Być może chciałeś porównania wydajności. Każdy z tych sklepów z danymi może zobaczyć występy na swoich stronach internetowych. Używamy Cassandry do podobnej sytuacji, ale nie grałem z innymi datastorami – Nishant

+0

charakter twoich danych prawdopodobnie wpływa na porównywanie bazy danych, jak również – Prescott

+0

wiele magazynów danych może obsłużyć 100 milionów rekordów i tych stóp odczytu/usuwania. Jaka jest wielkość rekordów? jakie są twoje wzorce dostępu do danych, itp. czy wskaźniki odczytu i odczytu? –

Odpowiedz

3

podstawie charakterystyki Wspominałeś (JSON Dokumenty, dostęp przez klucz, 100 milionów płyt, zrównoważony odczyt/zapis) Powiedziałbym CouchDB lub Membase są dobrymi kandydatami (oto quick comparison)

Zarówno HBase i Cassandra prawdopodobnie również może działać, ale w przypadku HBase musisz zainstalować wiele komponentów (Hadoop, ZooKeeper itp.), których naprawdę nie użyjesz d tylko i Cassandra jest lepsza, gdy masz więcej zapisów niż czytasz (przynajmniej ostatni raz go użyłem).

Big Table, jest niestety wewnętrzna dla Google:)

Powiązane problemy