Mam plik tekstowy z około 8,5 miliona punktów danych w formie:Używanie Pythona, aby wygenerować wykres połączenia/sieci
Company 87178481
Company 893489
Company 2345788
[...]
chcę używać Pythona, aby utworzyć wykres połączenia, aby zobaczyć, co sieć między firmy wyglądają. Z powyższej próby dwie firmy podzieliłyby brzeg, gdyby wartość w drugiej kolumnie była taka sama (wyjaśnienie z/dla Hooked).
Używałem pakietu NetworkX i udało mi się wygenerować sieć na kilka tysięcy punktów, ale nie udało się jej przetworzyć całego pliku tekstowego o długości 8,5 mln węzłów. Uruchomiłem go i zostawiłem na około 15 godzin, a kiedy wróciłem, kursor w powłoce nadal migał, ale nie było wykresu wyjściowego.
Czy można bezpiecznie założyć, że nadal działa? Czy istnieje lepsze/szybsze/łatwiejsze podejście do wykreślania miliona punktów?
W jaki sposób firmy są połączone? To znaczy. jest krawędź dzielona między firmami A i B, jeśli druga kolumna jest taka sama? – Hooked
Tak, to prawda. – Jon
Nie mogę powiedzieć, że miałem problemy z 8.5mln w networkx. Ile masz różnych wierzchołków? Czy używasz skierowanych/niekierowanych? Ponadto, kiedy mówisz "brak wykresu wyjściowego" - co dokładnie masz na myśli? [np. nie próbowałeś go wydrukować czy coś takiego] –