Właśnie rozpocząłem moją wycieczkę do metod i narzędzi do przetwarzania wykresów. Co właściwie robimy - policzmy standardowe wskaźniki, takie jak PageRank, współczynnik skupień, liczba trójkątów, średnica, łączność itd. W przeszłości był zadowolony z Octave, ale kiedy zaczęliśmy pracować z wykresami mając na przykład 10^9 węzłów/krawędzi utknęliśmy .Neo4j lub GraphX / Giraph co wybrać?
więc możliwe rozwiązania mogą być rozpowszechniane chmura wykonana z Hadoop/Giraph, Spark/GraphX, Neo4j na nich itp
Ale ponieważ jestem początkującym, może ktoś doradzić co właściwie wybrać? Nie miałem różnicy kiedy używać Spark/GraphX i kiedy Neo4j? W tej chwili uważam Spark/GraphX, ponieważ ma on więcej składni podobnych do Pythona, podczas gdy neo4j ma własny Cypher. Wizualizacja w neo4j jest fajna, ale nieprzydatna na tak dużą skalę. Nie rozumiem, czy istnieje powód, aby używać dodatkowego poziomu oprogramowania (neo4j) lub po prostu używać Spark/GraphX? Ponieważ zrozumiałem, że neo4j nie oszczędza tak dużo czasu, jak gdybyśmy pracowali z czystym hadoopem w porównaniu z Giraph lub GraphX lub Hive.
Dziękuję.
co masz na myśli, używając "Neo4j z GraphX"? Czy chcesz używać ich jednocześnie? Jak i dlaczego? –
Może być wykonalne za pomocą łącznika iskrowego neo4j, który dostarczyłem linku jako odpowiedź. –