Używam Cassandra do przechowywania moich danych i ula do przetwarzania moich danych. Mam 5 maszyn, na których ustawiłem kassandra i 2 maszyny używam jako węzeł analityczny (gdzie działa hive). Więc chcę zapytać, czy hive zmniejsza mapę na tylko dwóch komputerach (węzłach analitycznych) i dostarcza tam dane lub przenosi proces/obliczenia do 5 węzłów Kasandra i przetwarza/oblicza dane na tych maszynach (co wiem, że jest w mysiu, proces przenosi dane, a nie dane do przetworzenia).Hadoop na bazie bazy danych Kasandra
Odpowiedz
Jeśli chcesz poślubić Hadoop i Cassandrę - pierwszy link powinien stworzyć firmę DataStax zbudowaną wokół tej koncepcji. http://www.datastax.com/ Zbudowali i wspierali hadoop z HDFS zastąpionym kassandra. W mojej najlepszej zrozumienia - oni mają lokalizację danych: http://blog.octo.com/en/introduction-to-datastax-brisk-an-hadoop-and-cassandra-distribution/
Jest dobra odpowiedź o Hadoop & danych Cassandra miejscowości po uruchomieniu MapReduce przed Cassandrą Cassandra and MapReduce - minimal setup requirements
chodzi o Twoje pytanie - istnieje tradeof : a) Jeśli uruchomisz Hadoop/Hive na oddzielnych węzłach, tracisz lokalność danych, a przepustowość Twoich danych jest ograniczona przez przepustowość twojej sieci.
b) Jeśli uruchomisz hadoop/Hive na tych samych węzłach, na których działają kassandra - możesz uzyskać lokalność danych, ale przetwarzanie MapReduce za zapytaniami o ula może zablokować twoją sieć (i inne zasoby) i wpłynąć na twoją jakość usług od kassandra.
Moja sugestia będzie mieć oddzielne węzły ula, jeśli wydajność kassandra z kassandra jest krytyczna.
Jeśli Twój kassandra jest najczęściej używany jako magazyn danych i nie obsługuje żądań w czasie rzeczywistym, wówczas uruchomienie gałęzi w każdym węźle poprawi wydajność i wykorzystanie sprzętu.
- 1. w czasie rzeczywistym kwerendy/agregowanie milionów rekordów - hadoop? hbase? Kasandra?
- 2. Jak zapisać obraz jako pole bajtów w bazie danych Kasandra za pomocą silnika cql?
- 3. Korzystanie z liquibase na istniejącej bazie danych
- 4. Routing dynamiczny Rails oparty na bazie danych
- 5. Zapisywanie danych do Hadoop
- 6. Jak zainstalować/pobrać konkretną wersję rozproszonej bazy danych firmy Kasandra w systemie Mac OS X?
- 7. Potrzebujesz alternatywę Liquibase dla baz danych mongodb i/lub Kasandra
- 8. textarea bazy danych jQuery/CF Wypełnianie na podstawie dat w bazie danych
- 9. bazie Modelowanie NoSQL (przy konwersji z bazy danych SQL)
- 10. Relacje między Hadoop a bazami danych
- 11. Html w mojej bazie danych!
- 12. Pętla przez bazy danych na serwerze i aktualizacja danych
- 13. Kwerendy hibernacji w bazie danych
- 14. Przywracanie bazy danych Postgresql
- 15. MySQL typ danych w bazie
- 16. Baza danych bazy danych Codeigniter
- 17. Aktualizacja bazy danych na __destruct()?
- 18. Lokalizacja bazy danych na schemacie
- 19. Przechowywanie pozwoleń na aplikacje w bazie danych
- 20. Kolejka priorytetowa oparta na bazie danych
- 21. Hadoop jako baza danych magazynu dokumentów
- 22. Sprawdzanie zmian w bazie danych (kontrola wersji)
- 23. ms-access: robienie czegoś na bazie danych otwartej
- 24. Kiedy używać LDAP w bazie danych?
- 25. Dystrybucja bazy danych
- 26. Techniki dziedziczenia bazy danych?
- 27. Przechowuj zdjęcia profilów użytkowników na dysku lub w bazie danych?
- 28. Jak korzystać z Elastic Search na bazie istniejącej bazy danych SQL?
- 29. Android: wiele wątków piszących na bazie danych SQLite
- 30. EF 4.1 CF: odmówiono uprawnienia do bazy danych w bazie danych 'master'
Dzięki, że było bardzo pomocne –