Myślę, że to pytanie wymaga wglądu w implementację konkat.czy Pandy dołączają funkcję lokalną?
Powiedzmy, mam 30 plików po 1G i mogę używać tylko do 32 G pamięci. Załadowałem pliki do listy DataFrames, nazwanej "list_of_pieces". Ta lista_próbek powinna mieć rozmiar ~ 30G, prawda?
jeśli zrobię "pd.concat (list_of_pieces)", czy concat przydzieli kolejne 30G (lub może 10G 15G) w stercie i wykonuje niektóre operacje, czy uruchamia konkatencję "w miejscu" bez przydzielania nowej pamięci?
ktoś to wie?
Dzięki!
Nie * myślę, że ... jest na miejscu ... na bok, nie sądzę, że tak naprawdę chcesz przeczytać tyle w pamięci (nie pozostawisz zbyt wiele miejsca na wykonywanie obliczeń)! Myślę, że [sklep HDF5] (http://pandas.pydata.org/pandas-docs/stable/io.html#hdf5-pytables) to dla ciebie znacznie lepszy wybór. –
@AndyHayden, obawiam się, że potrzebuję tego rozmiaru danych w pamięci, potrzebuję więc trochę interaktywnej analizy na nich :-( –