To jest bardziej komentarzu do odpowiedzi Tim Pietzcker, ale prezentuje kod w komentarzach jest niewygodne ... Oto prosty przykład przy użyciu pakietu XRexExp:
<p id=orig>Bundespräsident/ß+ð/ə¿α!</p>
<p id=new></p>
<script src="http://cdnjs.cloudflare.com/ajax/libs/xregexp/2.0.0/xregexp-min.js">
</script>
<script src="http://xregexp.com/addons/unicode/unicode-base.js">
</script>
<script>
var regex = new XRegExp("\\P{L}+", "g");
var string = document.getElementById('orig').innerHTML;
string = XRegExp.replace(string, regex, "");
document.getElementById('new').innerHTML = string;
</script>
do użytku produkcyjnego, prawdopodobnie chcą ściągnąć jakieś wersje pakietu podstawowego i Unicode plug-in i używać ich na serwerze.
Uwaga: Kod sprawdza znaki, które nie są sklasyfikowane jako litery (alfabetycznie) w kodzie Unicode. Przypuszczam, że odpowiada to temu, co masz na myśli przez "wyraz", chociaż słowa w języku naturalnym mogą zawierać łączniki, apostrofy i inne nie-litery.
Należy pamiętać, że znaki są dodawane do kodu Unicode, a kategoria postaci może (rzadko) się zmieniać. Pakiet został dobrze utrzymany; odpowiada on Unicode 6.1 (wersja 6.2 jest wyłączona, ale nie ma nowych liter).
Ø to litera w różnych językach (na przykład duński) :) –
podobne: [this] (http://stackoverflow.com/questions/2392194/how-to-match-the-international-alphabet-english -az-non-english-with-a-regu) pytanie. javascript regex nie ma natywnych odpowiedników unicode –