Chip, Dirkland, DrobæSphere Inc, cdirkland @ hotmail.com, usaSkip/usuń znak spoza ASCII z sed
Próbowałem użyć sed zmodyfikować adresy e-mail w formacie .csv ale linia powyżej trzyma potknięcia mnie, za pomocą poleceń takich jak:
sed -i 's/[\d128-\d255]//' FILENAME
from this stackoverflow question
nie wydają się działać jak pojawia się błąd „nieprawidłowy znak zestawień”.
Idealnie nie chcę w ogóle zmieniać tej połączonej postaci AE, wolałbym ją raczej pominąć, ponieważ nie próbuję manipulować tym tekstem, ale raczej adresami e-mail. Dopóki ta AE jest w tym samym miejscu, ale powoduje, że moja substytucja sed ulegnie awarii po jednej linii, usuń znak i przetwarza cały plik w porządku.
Wszelkie pomysły?
+1 dla "l0". Istnieje również inny skrypt 'sedsed.py', dostępny [tutaj] (http://aurelio.net/sedsed/). Przydatne do sprawdzenia przestrzeni 'pattern' i' hold'. W tym przypadku może to nie pomóc, ale przydatne narzędzie do debugowania. :) –
Polecenie sed -n 'l0' jest interesujące, to, co drukuje dla firmy to: Drob \ 357 \ 277 \ 275Sphere Inc – xref
i nadal nie mogę uzyskać powyższych przykładów do pracy z nim, być może postać (który pokazuje się jako AE w Windows LibreOffice, ale nigdzie indziej) jest w rzeczywistości specjalnym znakiem mówiącym, że nie może być reprezentowany w Unicode? http://www.fileformat.info/info/unicode/char/fffd/index.htm – xref