Uwaga, wiem, że to stare pytanie, chcę tylko zrównoważyć niektóre błędne wyobrażenia na temat kosztów, ponieważ robię to teraz jako test.
W przeciwieństwie do tego, co myśli DavidB, nie kosztuje milionów - nawet jeśli miałbyś uruchomić dedykowany sprzęt, łatwo byłoby Ci być kilka tysięcy miesięcznie (BTDT, jeden z moich klientów uruchamia klaster z 8 węzłami dla około 800 USD/miesiąc). Powiedział, że to bóle głowy, których chcesz uniknąć, a Cassandra na EC2 jest znacznie łatwiejsza w obsłudze.
Można łatwo uruchomić znaczną chmurę produkcyjne do EC2 za mniej niż $ 1000/miesiąc i można zrobić R & D chmury za mniej niż 100 $/miesiąc (I wydać około $ 52 w zeszłym miesiącu na klastrze testowym 10 maszyny). Gorąco polecam używanie systemu TurnKey Linux do zarządzania farmą R & D, ponieważ ich narzędzia pozwolą na migrację instancji z komputera do prawie każdej zwirtualizowanej platformy hostingowej w ciągu kilku minut (i na odwrót). Dodatkowo mają naprawdę zgrabną integrację z EC2.
Dla naprawdę poważnych poziomów ruchu Pintrest stwierdził kiedyś spędzają $ 15 do $ 50/godz w zależności od obciążenia serwera, automatyczne skalowanie, aby sprostać wymaganiom ruchu, patrz http://www.theregister.co.uk/2012/04/30/inside_pinterest_virtual_data_center/ szczegóły
Rzeczywisty koszt jest w konfiguracji i zarządzania twojej rozproszonej instancji Cassandry. Na szczęście NetFlix właśnie wypuścił mnóstwo narzędzi do zarządzania właśnie w tym celu. Możesz je znaleźć tutaj: https://github.com/netflix - jest też mnóstwo ciekawych filmów na temat korzystania z AWS przez NetFlix, w szczególności przenoszenia rzeczy od Cassandry do S3 - zobacz ich blog tutaj http://techblog.netflix.com/2012/12/videos-of-netflix-talks-at-aws-reinvent.html
Cassandra będzie działać. Możesz również przyjrzeć się rozwiązaniom do przechowywania plików rozproszonych, takim jak MogileFS, HDFS, itp. – DougW