Podana jest lista ramek danych o wielkości 1,5 Gb., który jest szybszy do załadowania: pikle lub hdf5 w pythonie
Zastanawiam się, które jest lepsze podejście do obsługi ładowania tych danych: marynacie (przez cPickle), hdf5 lub coś innego w python?
Po pierwsze, "wyrzucenie" danych jest OK, aby wziąć długo, robię to tylko raz.
Jestem również nie związany z rozmiarem pliku na dysku.
Pytanie: Co jestem zaniepokojony jest szybkość ładowaniadane do pamięci, tak szybko jak to możliwe.
Czy próbowałeś zmierzyć to w swoich określonych warunkach? – pvg
Zgaduję, że pikle będą jednym z najgorszych sposobów na zrzucenie tych danych :-). Oczywiście, to tylko domysły. Nie mam żadnych twardych danych, aby go poprzeć. Mówiąc o twardych danych, dlaczego nie zrobić eksperymentu i dowiedzieć się? – mgilson
Cóż, publikuję pytanie, nie jest to odpowiedź;) Mogę przetestować pickle vs hdf5, ale co, jeśli ekspert na tej stronie może skierować mnie do znacznie lepszej metody, która wchodzi w "czy coś innego"? :) – denvar