Mam duży plik CSV (7,3 GB, 16 300 000 linii), jak mogę podzielić ten plik na dwa pliki?Jak podzielić duże pliki?
6
A
Odpowiedz
16
Czy zapoznałeś się z poleceniem split
? Więcej informacji można znaleźć na stronie thisczłowiek.
To page zawiera przykład użycia tego polecenia.
marginesie:
komenda man -k
jest raczej przydatne do znalezienia komendy/linux unix, jeśli nie jesteś pewien, co jest specyficzne polecenia. Podaj słowo kluczowe za pomocą komendy man -k, a system wyciągnie powiązane polecenia. Np
% man -k split
będzie wydajność:
csplit (1) - split a file into sections determined by context lines
dirsplit (1) - splits directory into multiple with equal size
dpkg-split (1) - Debian package archive split/join tool
gpgsplit (1) - Split an OpenPGP message into packets
pnmsplit (1) - split a multi-image portable anymap into multiple single-image files
ppmtoyuvsplit (1) - convert a portable pixmap into 3 subsampled raw YUV files
split (1) - split a file into pieces
splitdiff (1) - separate out incremental patches
splitfont (1) - extract characters from an ISO-type font.
URI::Split (3pm) - Parse and compose URI strings
wcstok (3) - split wide-character string into tokens
yuvsplittoppm (1) - convert a Y- and a U- and a V-file into a portable pixmap
zipsplit (1) - split a zipfile into smaller zipfiles
1
podzielonego -d N l/N plik.csv tempfile.part.
dzieli plik na pliki N bez dzielenia linii. Jak wspomniano w komentarzach powyżej, nagłówek nie jest powtarzany w każdym pliku.
Powiązane problemy
- 1. Podzielić duże wyliczenie Java
- 2. Neo4j i duże pliki dziennika
- 3. Jak rozpakować duże pliki base64 w PHP
- 4. Jak obsługiwać duże pliki w Ruby?
- 5. Jak usunąć duże pliki z Mercurial repo
- 6. Xampp - PHPMyAdmin przesyła duże pliki?
- 7. Jak podzielić plik mp3 na mniejsze pliki?
- 8. diff dwa duże pliki w Pythonie
- 9. MySQL Binary Storage używając BLOB VS systemu OS Plik: duże pliki, duże ilości, duże problemy
- 10. Reading raczej duże pliki json w Pythonie
- 11. Stream duże pliki binarne z urllib2 złożyć
- 12. Dlaczego FFMPEG zawsze tworzy duże pliki WebM?
- 13. Połącz dwa duże pandy.HDFStore Pliki HDF5
- 14. AFNetworking + duże pliki do pobrania + pliki do pobrania
- 15. Jak mogę załadować duże pliki (~ 150 MB) w MATLAB?
- 16. Jak pobierać duże pliki za pomocą skryptu PHP
- 17. Jak importować duże pliki sql do tabeli mysql
- 18. Jak wysłać duże pliki do ActiveMQ za pomocą wielbłąda
- 19. Jak usunąć duże pliki z historii w mercurial?
- 20. Jak analizować bardzo duże pliki XML w języku C#?
- 21. Jak przekazywać duże pliki za pomocą narzędzia RestTemplate?
- 22. Jak pobierać duże pliki za pomocą modułu http FSharp.Data?
- 23. Jak czytać duże pliki z dysku google do gae blobstore
- 24. Jak analizować duże pliki w Groovy bez przekraczania wielkości sterty?
- 25. Jak przesłać duże pliki za pomocą MVC 4?
- 26. Jak przesłać duże pliki powyżej 500 MB w PHP
- 27. Kiedy podzielić kod na pliki/moduły?
- 28. Jak podzielić dane wyjściowe z mysqldump na mniejsze pliki?
- 29. Jak podzielić pliki Yaml sprawdzania poprawności w Symfony 2.5?
- 30. Jak przechowywać duże liczby?
Witaj, składnia jest poprawna? ** split --lines = 5 1.csv ** – sprabhakaran
@spk: Składnia jest poprawna, ale to podzieliłoby twój plik na 3.260.000 plików. Należy wybrać wyższą wartość, każda kwota wyższa niż 8 150 000 i mniej niż 16,300 000 spowoduje utworzenie dwóch plików. – Zeta
Podobny @spk, o którym mowa, wybierając odpowiednie wartości, zrobi to, co chcesz. Jeśli którekolwiek z pytań zadawanych przez SO stanowiło właściwą odpowiedź na Twoje pytania, możesz je zaakceptować - http://meta.stackexchange.com/questions/5234/how-does-accepting-an-answer-work – Levon