2012-01-08 10 views
9

Mam kilka arkuszy danych o łącznej wielkości 40G i chciałbym reprezentować go na wykresie (może być kilka węzłów na wiersz, a węzły będą zawierać większość danych w wierszu albo w etykietach lub właściwościach).Czy Neo4J będzie w stanie obsłużyć 40 gigabajtów danych?

Czy Neo4J może sobie z tym poradzić? Jaki jest największy dotychczas sprawdzony rozmiar bazy danych (ilość węzłów, rozmiar na dysku itp.)?

Odpowiedz

6

"40G danych" może się bardzo różnić w zależności od sposobu modelowania na wykresie. Czy masz 40G danych źródłowych i chciałbyś umieścić go w neo4j, czy też obliczyłeś, że twoje dane zajmą około 40G miejsca w neo4j?

W zależności od tego, jak modelujesz dane, możesz usunąć niektóre/wiele zduplikowanych danych, tj. Zamiast mieć pewne właściwości we wszystkich elementach, zamiast tego wyprowadzać je z otoczenia poprzez relacje.

5

W Neo4j rozmiar danych jest głównie ograniczony przez przestrzeń adresową kluczy podstawowych dla węzłów, relacji, właściwości i typów relacji. Obecnie przestrzeń adresowa wygląda następująco:

2ˆ35 (~ 34 billion) nodes 
2ˆ35 (~ 34 billion) relationships 
2ˆ36 (~ 68 billion) properties 
2ˆ15 (~ 32 000) relationship types 
+0

Od wersji neo4j nie jest to już prawdą. Więcej informacji można znaleźć na stronie http://neo4j.com/blog/neo4j-3-0-massive-scale-developer-productivity. – Hassan

Powiązane problemy