Jeśli ktoś tworzy bazę danych na bazie innej bazy danych, takiej jak twitter, czy ta baza dziedziczy ograniczenia i nieefektywność bazowej bazy danych?Czy wykresy baz danych mogą efektywnie dystrybuować dane między węzłami?
Jestem szczególnie zainteresowany titan db (http://thinkaurelius.com) z powodu ich roszczenia do wsparcia wydajnego dzielenia zbioru danych między węzłami.
Twierdzą, że wspierają dystrybucję danych między węzłami, ze względu na wydajność kasandra. Jednak neo4j twierdzi, że powodem, dla którego nie dystrybuują danych między węzłami, ale raczej duplikowaniem całego zestawu danych w każdym węźle, jest to, że każde przejście przez wykres, które opuszcza jeden węzeł, i dlatego musi się przemieszczać przez sieć Ethernet, jest zbyt wolne być praktycznym.
Ponieważ Kasandra nie ma wiedzy na temat wykresu, nie może zoptymalizować, aby zachować wykresy na jednym węźle. W związku z tym większość przejść między wykresami będzie przebiegała przez granice węzłów.
Czy tytani twierdzą, że efektywnie skalują się w węzłach?
Wygląda na to, że Titan obsługuje dowolny typ wykresu, ponieważ Kasandra (podobno) nic nie wie o wykresie - tylko surowe dane. Niestety, nie mam kilku serwerów do testowania. Nie sądzę, aby benchmark na 5 wirtualnych maszynach działających na tym samym dysku twardym, z wewnętrzną siecią będzie sprawiedliwym sposobem na przetestowanie tego. –