Chciałbym uzyskać poradę/pomoc w zakresie dzielenia dużego pliku (miliony wierszy lub linii).jak dokonać podzbioru pliku - wybierz liczbę wierszy lub kolumn
Na przykład
(1) Mam duży plik (miliony wierszy, tabulatorami). Chcę podzbiór tego pliku z tylko wierszami od 10000 do 100000.
(2) Mam duży plik (miliony kolumn, rozdzielane tabulatorami). Chcę podzbiór tego pliku tylko z kolumnami od 10000 do 100000.
Wiem, że istnieją narzędzia takie jak głowa, ogon, cięcie, dzielenie i awk lub sed. Mogę ich użyć do zrobienia prostego podzbioru. Ale nie wiem, jak wykonać tę pracę.
Czy możesz podać jakąkolwiek radę? Z góry dziękuję.
+1 to najprostsza odpowiedź mogłem kiedykolwiek pomyśleć of.But kota nie jest wymagane here.we można to zrobić bez cat.'awk 'NR> = 10000 && NR <= 100000 {print}' largefile' i 'cut -d '\ t' -f 10000-100000 largefile' – Vijay
@Rahul Dravid: dzięki, dodam to – Drakosha
Możesz skrócić pierwszy:' awk 'NR> = 10000 && NR <= 100000 'largefile', to o jeden proces mniej, a domyślne działanie awk jest drukowane, jeśli zakres jest prawdziwy. Ale to slurps linii afters 100000 na nic, więc lepiej napisać to jak: 'awk 'NR> 100000 {exit} NR> = 10000 && NR <= 100000' largefile' w ten sposób przetwarzanie zatrzyma się na linii 100001. –