To pytanie jest w jakiś sposób powiązane z "Concatenate a large number of HDF5 files".Połącz dwa duże pandy.HDFStore Pliki HDF5
Mam kilka ogromnych plików HDF5 (~ 20GB skompresowanych), które nie pasują do pamięci RAM. Każdy z nich przechowuje kilka identycznych formatów i indeksów, które się nie nakładają.
Chciałbym połączyć je, aby mieć pojedynczy plik HDF5 ze wszystkimi połączonymi DataFrame. Jednym ze sposobów, aby to zrobić, jest odczytanie każdego z nich porcją po kawałku, a następnie zapisanie do pojedynczego pliku, ale rzeczywiście zajęłoby to sporo czasu.
Czy są jakieś specjalne narzędzia lub metody, aby to zrobić bez wykonywania iteracji plików?
Awesome; pierwsza wzmianka o Blaze, którą widziałem na wolności. – Veedrac
Więc Blaze jest niesamowity. Jednak działa to dla mnie dziwnie. Po uruchomieniu odo jak wyżej, w końcu dostaję olbrzymi stos stdout 'zamykającego pliku', myślę, że wszystkie wspominają o docelowym sklepie, a nie źródle. Czy to brzmi jak błąd, czy też brakuje niektórych kroków przed/po? – KobeJohn