Czy ktoś próbował przetestować wydajność węzłów danych w wielu centrach danych? Zwłaszcza w przypadku sieci z małymi rurami. Nie mogę znaleźć zbyt wielu informacji na ten temat, a informacje, które znalazłem są stare (około 2010) lub zastrzeżone (wydaje się, że DataStax coś ma). Wiem, że Hadoop wspiera świadomość stojaków, ale tak jak powiedziałem, nie widziałem żadnej dokumentacji umożliwiającej dostrojenie systemu dla wielu centrów danych.Dystrybucja węzłów danych w wielu centrach danych
Odpowiedz
Próbowałem już z 12 x klastra DataNode ułożone w stosunku 2: 1 podzielone między dwa centra danych w odległości około 120 mil od siebie. Opóźnienie między centrami danych wynosi ~ 4 ms dla przewodów 2 x 1 GbE.
2 stojaki zostały skonfigurowane w miejscu A, 1 stojak skonfigurowany w miejscu B. Każdy "stojak" miał 4 maszyny. Zasadniczo testowaliśmy witrynę B jako witrynę "DR". Współczynnik replikacji został ustawiony na 3.
Krótko mówiąc, działa, ale wydajność była naprawdę, bardzo zła. Zdecydowanie musisz użyć kompresji na swoim źródle, mapować i zmniejszać wyjścia, aby zmniejszyć swoje operacje wejścia/wyjścia zapisu, a jeśli łącza do innych stron zostaną użyte do czegokolwiek innego, otrzymasz czas oczekiwania podczas przesyłania danych. Okna TCP skutecznie ograniczyłyby transfer do około 4 Mb/s, zamiast potencjalnego 100 Mb/s na linii 1 GbE.
Zaoszczędź sobie bólu głowy i po prostu używaj zadań distcp do replikowania danych!
- 1. Zookeeper Apache: dystrybucja węzłów w centrach danych
- 2. Postgres dystrybucja danych na wielu dyskach
- 3. Dystrybucja bazy danych
- 4. jquery.ajax pobieranie wielu danych
- 5. Scalanie wielu niepowiązanych ramek danych w jedną pandę danych-ramka
- 6. Jak znaleźć wszystkie ścieżki przez zestaw danych węzłów w DAG?
- 7. Firebase spójność danych na wielu węzłach
- 8. optymalizacja mysql dla wielu danych
- 9. Dystrybucja Scali w klastrze?
- 10. Migracja danych podstawowych w wielu wersjach aktualizacji
- 11. konfigurowanie wielu baz danych w Zf2
- 12. Radzenie wielu list w ramce danych
- 13. Widok Sqlite w wielu bazach danych
- 14. Fragmenty danych HTTP w wielu pakietach?
- 15. Uzyskiwanie wielu danych w jednym kluczowym zapytaniu
- 16. SQLiteOpenHelper wielu baz danych w pamięci
- 17. Aktualizacja procedury przechowywanej w wielu bazach danych
- 18. Zastępowanie wielu wzorców w bloku danych
- 19. Microservices - Obsługa wielu magazynów danych, ładowanie danych początkowych itp.
- 20. Zapisywanie wielu do wielu relacji z bazą danych w Symfony2
- 21. Skew normalna dystrybucja w scipy
- 22. Różnica: Dystrybucja ad hoc i dystrybucja rozwojowa
- 23. Wydajny sposób na znalezienie zestawu węzłów o relacjach do danych węzłów za pomocą neo4j
- 24. Baza danych - wersja danych
- 25. Baza danych dzienników błędów - dla wielu aplikacji
- 26. Konwertowanie wielu wierszy tekstu na ramkę danych
- 27. Korzystanie z wielu baz danych ciągu CodeIgniter
- 28. tworzenie ramki danych pand z wielu plików
- 29. stosowanie lm do wielu zestawów danych
- 30. Scalanie wielu ramek danych z plików CSV