W moim środowisku Pythona pakiety Rpy i Scipy są już zainstalowane.Python: obsługa dużego zbioru danych. Scipy czy Rpy? I jak?
Problem Chcę rozwiązania jest taki:
1) ogromny zbiór danych finansowych są przechowywane w pliku tekstowym. Ładowanie do Excela nie jest możliwe
2) Potrzebuję zsumować określone pola i uzyskać sumy.
3) Muszę pokazać 10 najlepszych wierszy na podstawie sum.
Który pakiet (Scipy lub Rpy) najlepiej nadaje się do tego zadania?
Jeśli tak, czy możesz podać mi jakieś wskazówki (np. Dokumentację lub przykład online), które mogą mi pomóc w wdrożeniu rozwiązania?
Prędkość jest problemem. Idealnie scipy i Rpy mogą obsługiwać duże pliki, nawet gdy pliki są tak duże, że nie można ich umieścić w pamięci.
Możesz znaleźć przydatne informacje na stronie http://www.dabeaz.com/generators-uk/ – lazy1
Co oznacza "ogromny zestaw" w twoim przypadku? – radek