Chcę podzielić łańcuch wielojęzykowy na tokeny uni-językowe przy użyciu Regex.Podział wielojęzykowego ciągu znaków przy użyciu Regexa na tokeny jednojęzyczne
na przykład do tej angielsko-arabski wyrażenie:
"nazywał się محمد, a imię jego matka była آمنه.
Wynik musi być jak poniżej:
- 'nazywał się'
- 'محمد'
- 'a imię jego matka była'
- 'آمنه.
Co próbowaliście? Gdzie utknąłeś? Czy zawsze jest to angielski-arabski, czy przynajmniej wiesz, które skrypty pojawią się w twoich strunach? –
@TimPietzcker Tak, zawsze jest to angielski-arabski. – ARZ