Mam ogromną ilość danych (> 800Mb), które są w wieku, aby załadować do Matlab głównie dlatego, że jest podzielony na małe pliki każdy < 20kB. Wszystkie są w zastrzeżonym formacie, który mogę odczytać i wczytać do Matlaba, a to tylko tyle, że zajmuje to tyle czasu.Jaki jest najszybszy sposób na załadowanie danych w Matlab
Zastanawiam się nad odczytaniem danych i zapisaniem ich do jakiegoś pliku binarnego, który powinien uczynić go szybszym do późniejszych odczytów (z których może być ich wiele, dlatego potrzebuję przyspieszenia).
Moje pytanie brzmi: jaki byłby najlepszy format zapisu ich na dysk, aby odczytywać je tak szybko, jak to możliwe?
Domyślam się, że mam opcję pisania za pomocą fwrite lub po prostu zapisywanie zmiennych z MATLAB. Myślę, że wolałbym opcję fwrite, więc w razie potrzeby mogłem odczytać je z innego pakietu/języka ...
Dla mnie wygląda na to, że wygrywa format HDF5, wydawał się od 2 do 10 razy szybszy niż save() i podobne wydajność ładowania do plików 50Mb – mor22
Prawdopodobnie porównano nieskompresowany HDF5 z skompresowanym HDF5 gzip, którego używa komenda 'save'. Możesz spróbować ['savefast'] (http://www.mathworks.com/matlabcentral/fileexchange/39721-save-mat-files-more-quickly), który jest po prostu otoką dla funkcji HDF5, która zachowuje się jak' save 'polecenie bez kompresji. – Daniel