Drukuje tylko pierwsze słowo każdego akapitu za pomocą sed

Zastanawiam się, jak mogę wydrukować tylko pierwsze słowo każdego akapitu z sed jednym liniowcem. W tym przypadku akapit jest definiowany przez tekst następujący po 2 liniowych podziałach.Drukuje tylko pierwsze słowo każdego akapitu za pomocą sed

np.

This is a paragraph with some text. Some random text that is not really important. 

This is another paragraph with some text. 
However this sentence is still in the same paragraph.

ta powinna zostać przekształcona do

This 

This

Źródło

2013-05-05 user2352099

Możliwym rozwiązaniem byłoby GNU sed:

sed -rn ':a;/^ *$/{n;ba};s/(|$).*//p;:b;n;/^ *$/ba;bb'

wyjściowa:

This 
This

Traktuje linie typu "spacje" jako puste i rozumie dowolną liczbę pustych linii między akapitami. Przetwarza również poprawnie akapity w jednym słowie.

Źródło

2013-05-05 16:39:15

Pomyśl paragraph mode

 
By a special dispensation, an empty string as the value of RS indicates that 
records are separated by one or more blank lines.

awk lub perl mieć poparcie dla 'trybie ust' i albo by dokonać lepszego wyboru niż sed:

awk '{ print $1 }' RS= ORS="\n\n" file

lub

perl -00 -lane 'print $F[0]' file

Wyniki:

This 

This

Źródło

2013-05-05 15:04:16 Steve

Wystarczy marginesie, jeśli chciał separator rekordu należy _exactly_ dwa końce linii, użyj 'RS = "\ n \ n"' dla 'awk'. Nie pamiętam, jak to zrobić w 'perl' na linii cmd. Może ktoś inny tutaj by wiedział? – Steve

takie proste, tak jasne ... +1 oczywiście. –

To może pracować dla Ciebie (GNU sed):

sed ':a;$!{N;/\n\s*$/!ba};s/\s.*/\n/' file

Źródło

2013-05-05 23:12:41 potong

Drukuje tylko pierwsze słowo każdego akapitu za pomocą sed

Odpowiedz

Powiązane problemy