2010-09-27 10 views
6

Zrobiłem mały skrypt bash, aby uzyskać częstotliwość elementów w pewnej kolumnie pliku.bash: pobieranie procentu z tabeli częstotliwości

Wyjście byłoby czegoś jak ten

A  30 
B  25 
C  20 
D  15 
E  10 

polecenie użyłem wewnątrz skryptu jest podobny do tego

cut -f $1 $2| sort | uniq -c | 
sort -r -k1,1 -n | awk '{printf "%-20s %-15d\n", $2,$1}' 

jak mogę go zmodyfikować, aby pokazać względne procentowe dla każdego przypadku, a także . więc byłoby jak

A  30  30% 
B  25  25% 
C  20  20% 
D  15  15% 
E  10  10% 
+1

Myślę, że przykładem wyraźniej, jeśli liczby się nie sumują, do 100. –

Odpowiedz

2

Spróbuj tego (z typem przesunięty na koniec:

cut -f $1 $2| sort | uniq -c | awk '{array[$2]=$1; sum+=$1} END { for (i in array) printf "%-20s %-15d %6.2f%%\n", i, array[i], array[i]/sum*100}' | sort -r -k2,2 -n 
2

Zmiana komendy awk żeby coś takiego:

awk '{ a[++n,1] = $2; a[n,2] = $1; t += $1 } 
    END { 
     for (i = 1; i <= n; i++) 
      printf "%-20s %-15d%d%%\n", a[i,1], a[i,2], 100 * a[i,2]/t 
    }' 
Powiązane problemy