Mam plik zawierający wiele samogłosek z znakami diakrytycznymi. Muszę wykonać te zamienniki:Jak usunąć wszystkie znaki diakrytyczne z pliku?
- Zamień ā, á, ǎ i a na a.
- Wymień ē, é, ě i è za pomocą e.
- Wymień ī, í, ǐ i ì za pomocą i.
- Zamień ō, ó, ǒ i ò na o.
- Zamień ū, ú, ǔ i ù na u.
- Wymień ǖ, ǘ, ǚ i ǜ na ü.
- zastąpić, A Ǎ oraz z A.
- wymienić E, E, E, E z E.
- wymienić I, I, Ǐ, i w I.
- Wymiana o , Ó, Ǒ i Ò z O.
- Wymień Ū, Ú, Ǔ i Ù na U.
- Wymień Ǖ, Ǘ, Ǚ i Ǜ na Ü.
wiem, że mogę zastąpić je jeden na raz z tym:
sed -i 's/ā/a/g' ./file.txt
Czy jest bardziej efektywny sposób wymienić wszystkich z nich?
sed prawdopodobnie nie jest najlepszym narzędziem do tej pracy; iconv jest prawdopodobnie lepszy. zobacz: http://stackoverflow.com/questions/8562354/remove-unicode-characters-from-textfiles-sed-other-bash-shell-methods – geoffspear