Jak używać powłoki UNIX do liczenia liczby wyświetleń litery w pliku tekstowym?

Mam kilka plików tekstowych i chciałbym policzyć ile razy pojawia się w nich każda litera?Jak używać powłoki UNIX do liczenia liczby wyświetleń litery w pliku tekstowym?

W szczególności chciałbym użyć powłoki UNIX, aby to zrobić, w postaci: pliku cat | .... robić rzeczy ...

Czy istnieje sposób, w jaki mogę uzyskać polecenie wc, aby to zrobić?

Źródło

2009-09-02 samoz

plik cat | nie ma wyjścia, nie, nawet o tym nie myśl. Przeważnie jest używany z mniejszą lub grep, gdzie kot nie jest potrzebny. Proszę nie używać kota, jeśli nie chcesz po prostu wypisać plik. –

Kot jest rzeczywiście przydatny do utrzymywania minimum pamięci RAM. Przydaje się podczas pracy z dużymi plikami, ponieważ będzie podawany przez linię po linii. – Goran

grep char -o filename | wc -l

Źródło

2009-09-02 15:59:50 SilentGhost

Uwaga dla osób początkowo zagmatwanych, takich jak ja, zamień "znak" na szukany znak lub ciąg znaków. – rlorenzo

Ponadto, większość implementacji grep ma opcję "-c" do zliczania. –

Powyższe działa również dla łańcuchów, więc 'grep -o | wc -l' to wersja generyczna. Np .: grep, -o myfile.txt | wc -l' zlicza przecinki w myfile.txt i 'grep abcd -o myfile.txt | wc -l' zlicza liczbę 'abcd's w pliku myfile.txt – arun

spróbować z

grep [PATTERN] -o [FILE] | wc -l

i proszę nie używać kota, jeśli nie są potrzebne.

Źródło

2009-09-02 16:02:52

Co jest złego w używaniu kota? – samoz

nie zlicza wielu znaków w linii – SilentGhost

@samoz: cat jest błędny, ponieważ powinien wprowadzić plik do odczytu do innego programu - drugi program może sam odczytać plik, więc użycie kota jest niepotrzebne i komplikuje się kodeline. @SilentGhost: twoje prawo. –

Alternatywa dla grep:

sed 's/[^x]//g' filename | tr -d '\012' | wc -c

gdzie x jest postać chcesz liczyć.

Źródło

2009-09-02 16:12:17 hlovdal

Jest też awk:

$ echo -e "hello world\nbye all" | awk -Fl '{c += NF - 1} END {print c}' 
5

Zmienić -Fl do -F<your character>.

Działa to poprzez ustawienie ogranicznika pola na znak określony przez -F, a następnie zgromadzenie liczby pól w każdym wierszu - 1 (ponieważ jeśli istnieje jeden separator, istnieją dwa pola - ale powinniśmy liczyć tylko 1).

Źródło

2009-09-02 16:21:30

Inną alternatywą:

tr -d -C X <infile | wc -c

gdzie X to znak lub ciąg znaków chcesz liczyć i plik_we jest plik wejściowy.

Źródło

2009-09-02 17:04:17

To jest czystsza niż zaakceptowana odpowiedź (która polega na tym, że wynik polecenia 'grep -o' jest rozdzielany przez znaki nowej linii). Działa to również z DOWOLNYM znakiem (w tym '\ n') – Camusensei

Oto kolejny sposób

cat input_file | \ 
awk 'BEGIN {FS="x"; var=0 } \ 
{if (NF>0){ var=var + (NF-1) } } \ 
END{print var}'

gdzie X to znak lub ciąg znaków chcesz liczyć i plik_we jest plik wejściowy

Źródło

2012-07-12 06:33:49 user1011046

Ładne' UUOC' tam – Camusensei

awk '{ printf "%s\n", gsub("ur_char", "oth_char", $0) }' <your_file_name> output.txt

można dodać liczbę bieżącym numerem linii do pobierz numery linii również w awk.

Źródło

2012-08-29 15:50:30 dantesan

echo "a/b/c/d/e/f/g" | awk -F "/" '{print NF}'

to daje liczbę wystąpienia znaku "/"

Źródło

2013-07-10 13:38:05 aravinda

To nie działa z wejściem wieloliniowym – Camusensei

W tym przypadku, I'am licząc znaku "|":

expr `wc -c < filename` \- `tr -d \| < filename | wc -c`

Źródło

2015-02-26 16:29:34 Vinicius

Możesz łatwo wypróbować: grep -c 'YOUR LETTER' YOUR FILE

Źródło

2017-08-21 13:58:27

numer pojawi się na powłoce, w znaku nowej linii –

Jak używać powłoki UNIX do liczenia liczby wyświetleń litery w pliku tekstowym?

Odpowiedz

Powiązane problemy