2013-07-04 10 views
12

Apache Giraph vs Neo4j: są algorytmy traversal węzłach całkowicie różnią się tez dwa układy przetwarzania wykres? Gdybyśmy mieli przejść, powiedzmy, że wykres społeczny korzystający z Giraph i Neo4j na danych przechowywanych w pojedynczej maszynie (nie rozproszonych), który byłby lepszy i dlaczego?Neo4j vs Apache Giraph na wykresie przechodzenia

Odpowiedz

22

Schludny Neo4j. Obliczenia graficzne Giraph działają jako zadania Hadoop, ponieważ są one przeznaczone do pracy z dużymi rozproszonymi wykresami. Obciążenie związane z zarządzaniem tymi zadaniami jest zbyt duże, aby mogło być wydajne na wykresie w małej skali, działającym na pseudo-rozproszonym pojedynczym klastrze maszyn.

To nie wszystko, ale specjalnością Neo4j są ruchy poprzeczne. Wielkim tego powodem jest fakt, że Neo4j faktycznie przechowuje sąsiadujące relacje na podwójnie połączonych listach w systemie plików. Sprawdź ten wpis blogu:

http://digitalstain.blogspot.nl/2010/10/neo4j-internals-file-storage.html

Wyjaśnia sposób Neo4j zoptymalizowany sposób ich przechowywania wykresu dla operacji szybko wykresu takich jak przechodzenia przez.

+3

Zgadzam się z tą odpowiedzią. Neo4j był przeznaczony do analizy danych w czasie rzeczywistym, na małym/średnim zestawie danych (miliony węzłów/relacji), podczas gdy giraph/pregel był przeznaczony do rozproszonej pracy na dużą skalę, na przepływie wielkości Internetu. – Nicholas